Busca avançada
Ano de início
Entree

ALIS: aprendizado autônomo em sistemas inteligentes

Processo: 16/21047-3
Linha de fomento:Auxílio à Pesquisa - Regular
Vigência: 01 de fevereiro de 2017 - 31 de janeiro de 2019
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Anna Helena Reali Costa
Beneficiário:Anna Helena Reali Costa
Instituição-sede: Escola Politécnica (EP). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Pesq. associados:Reinaldo Augusto da Costa Bianchi
Assunto(s):Inteligência artificial  Transferência de conhecimento  Aproximação de funções 

Resumo

Sistemas inteligentes são máquinas que possuem seus próprios objetivos, percebem, respondem e aprendem com base em suas experiências. O Aprendizado por Reforço (RL - Reinforcement Learning) é uma ferramenta poderosa para este fim, pois o sistema aprende autonomamente uma política de atuação por meio de tentativa e erro em repetidas interações com o ambiente. Com este projeto busca-se aumentar a difusão do uso da tecnologia de RL e avançar na fronteira do conhecimento da área de aprendizado autônomo. Entretanto, muitos desafios ainda devem ser vencidos para que se tenha um amplo uso do RL em sistemas inteligentes. Os desafios incluem lidar com incertezas dos sensores e atuadores, um mundo dinâmico que exige decisões rápidas, grandezas contínuas e o alto custo computacional do RL. Assim, este projeto de pesquisa científica tem por objetivo investigar, propor, desenvolver e avaliar modelos e métodos capazes de tornar o RL eficiente e eficaz em sistemas inteligentes que resolvem problemas complexos. Em especial, explora: (i) modelagens relacionais e orientadas a objetos e respectivos algoritmos, permitindo oportunidades de generalização na descrição e resolução dos problemas; (ii) distribuição e divisão do trabalho entre vários agentes aprendizes; (iii) funções de aproximações adequadas para representar tanto as situações observadas pelo agente quanto o conhecimento adquirido; (iv) transferência de conhecimento para que o conhecimento adquirido por outro agente ou do aprendizado de uma tarefa prévia seja reaproveitado para acelerar o aprendizado de uma nova tarefa similar. Sob o ponto de vista de aplicações, este projeto visa aplicar e avaliar os modelos e algoritmos propostos em domínios como: jogos, robótica, biologia computacional, entre outros. (AU)

Publicações científicas (7)
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
DA SILVA, FELIPE LENO; GLATT, RUBEN; REALI COSTA, ANNA HELENA. MOO-MDP: An Object-Oriented Representation for Cooperative Multiagent Reinforcement Learning. IEEE TRANSACTIONS ON CYBERNETICS, v. 49, n. 2, p. 567-579, FEB 2019. Citações Web of Science: 2.
DA SILVA, FELIPE LENO; REALI COSTA, ANNA HELENA. A Survey on Transfer Learning for Multiagent Reinforcement Learning Systems. JOURNAL OF ARTIFICIAL INTELLIGENCE RESEARCH, v. 64, p. 645-703, 2019. Citações Web of Science: 2.
BIANCHI, REINALDO A. C.; SANTOS, PAULO E.; DA SILVA, ISAAC J.; CELIBERTO, JR., LUIZ A.; DE MANTARAS, RAMON LOPEZ. Heuristically Accelerated Reinforcement Learning by Means of Case-Based Reasoning and Transfer Learning. JOURNAL OF INTELLIGENT & ROBOTIC SYSTEMS, v. 91, n. 2, SI, p. 301-312, AUG 2018. Citações Web of Science: 1.
PERICO, DANILO H.; HOMEM, THIAGO P. D.; ALMEIDA, AISLAN C.; SILVA, ISAAC J.; VILAO, JR., CLAUDIO O.; FERREIRA, VINICIUS N.; BIANCHI, REINALDO A. C. Humanoid Robot Framework for Research on Cognitive Robotics. JOURNAL OF CONTROL AUTOMATION AND ELECTRICAL SYSTEMS, v. 29, n. 4, p. 470-479, AUG 2018. Citações Web of Science: 0.
PERAFAN VILLOTA, JUAN CARLOS; DA SILVA, FELIPE LENO; JACOMINI, RICARDO DE SOUZA; REALI COSTA, ANNA HELENA. Pairwise registration in indoor environments using adaptive combination of 2D and 3D cues. Image and Vision Computing, v. 69, p. 113-124, JAN 2018. Citações Web of Science: 0.
FERREIRA, LEONARDO A.; BIANCHI, REINALDO A. C.; SANTOS, PAULO E.; LOPEZ DE MANTARAS, RAMON. Answer set programming for non-stationary Markov decision processes. APPLIED INTELLIGENCE, v. 47, n. 4, p. 993-1007, DEC 2017. Citações Web of Science: 1.
JACOMINI, RICARDO DE SOUZA; MARTINS, JR., DAVID CORREA; DA SILVA, FELIPE LENO; REALI COSTA, ANNA HELENA. GeNICE: A Novel Framework for Gene Network Inference by Clustering, Exhaustive Search, and Multivariate Analysis. JOURNAL OF COMPUTATIONAL BIOLOGY, v. 24, n. 8, p. 809-830, AUG 2017. Citações Web of Science: 0.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.