Busca avançada
Ano de início
Entree

Transferência de conhecimento no aprendizado por reforço em sistemas multiagentes

Processo: 15/16310-4
Linha de fomento:Bolsas no Brasil - Doutorado
Vigência (Início): 01 de dezembro de 2015
Vigência (Término): 30 de setembro de 2019
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Anna Helena Reali Costa
Beneficiário:Felipe Leno da Silva
Instituição-sede: Escola Politécnica (EP). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Bolsa(s) vinculada(s):18/00344-5 - Reusando soluções de tarefas prévias em aprendizado por reforço Multiagente, BE.EP.DR
Assunto(s):Inteligência artificial   Transferência de conhecimento   Sistemas multiagentes

Resumo

O Aprendizado por Reforço é uma poderosa ferramenta para treinar agentes inteligentes, uma vez que o aprendizado se dá de forma totalmente autônoma. Este aprendizado é realizado por meio de repetidas interações entre agentes e o ambiente, pelo método de tentativa e erro, até o momento em que os agentes têm informação suficiente para atuar de maneira apropriada para resolver uma determinada tarefa. Entretanto, o agente pode levar muito tempo para determinar quais ações são mais indicadas para cada situação. Para contornar este problema, soluções de Transferência de Conhecimento começaram a ser utilizadas, onde o conhecimento adquirido após o treinamento de uma tarefa é reaproveitado para acelerar o aprendizado de uma nova tarefa similar. Ao adicionar múltiplos agentes atuando ao mesmo tempo no ambiente, obtém-se um sistema robusto a falhas, escalável e paralelizável. Entretanto, novos problemas devem ser enfrentados, como a explosão dimensional e a dificuldade de prever as consequências das ações conjuntas dos agentes. Pesquisas investigaram soluções parciais para estes problemas, onde a Transferência de Conhecimento se provou benéfica também para domínios Multiagentes. Porém, ainda é necessário um amadurecimento dos métodos existentes de Transferência de Conhecimento para viabilizar a aplicação destas técnicas em domínios complexos. Esta pesquisa visa propor métodos que abordem algumas perguntas que foram respondidas apenas superficialmente pelos métodos do estado da arte, entre elas, como abstrair apropriadamente o conhecimento adquirido no treinamento?, como representar esse conhecimento?, como realizar as comunicações entre agentes para transmitir o conhecimento de tarefas aprendidas? e como lidar com a observalidade parcial do mundo?

Publicações científicas (4)
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
DA SILVA, FELIPE LENO; GLATT, RUBEN; REALI COSTA, ANNA HELENA. MOO-MDP: An Object-Oriented Representation for Cooperative Multiagent Reinforcement Learning. IEEE TRANSACTIONS ON CYBERNETICS, v. 49, n. 2, p. 567-579, FEB 2019. Citações Web of Science: 2.
DA SILVA, FELIPE LENO; REALI COSTA, ANNA HELENA. A Survey on Transfer Learning for Multiagent Reinforcement Learning Systems. JOURNAL OF ARTIFICIAL INTELLIGENCE RESEARCH, v. 64, p. 645-703, 2019. Citações Web of Science: 1.
PERAFAN VILLOTA, JUAN CARLOS; DA SILVA, FELIPE LENO; JACOMINI, RICARDO DE SOUZA; REALI COSTA, ANNA HELENA. Pairwise registration in indoor environments using adaptive combination of 2D and 3D cues. Image and Vision Computing, v. 69, p. 113-124, JAN 2018. Citações Web of Science: 0.
JACOMINI, RICARDO DE SOUZA; MARTINS, JR., DAVID CORREA; DA SILVA, FELIPE LENO; REALI COSTA, ANNA HELENA. GeNICE: A Novel Framework for Gene Network Inference by Clustering, Exhaustive Search, and Multivariate Analysis. JOURNAL OF COMPUTATIONAL BIOLOGY, v. 24, n. 8, p. 809-830, AUG 2017. Citações Web of Science: 0.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.