Busca avançada
Ano de início
Entree

Transferência de Conhecimento entre Tarefas no Aprendizado por Reforço

Processo: 12/02190-9
Modalidade de apoio:Bolsas no Brasil - Mestrado
Data de Início da vigência: 01 de julho de 2012
Data de Término da vigência: 31 de maio de 2013
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Anna Helena Reali Costa
Beneficiário:Marcelo Li Koga
Instituição Sede: Escola Politécnica (EP). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Assunto(s):Inteligência artificial   Transferência de conhecimento   Aprendizado por reforço
Palavra(s)-Chave do Pesquisador:Abstração de Políticas | Aprendizado por Reforço | Navegação Autônoma de Robôs | Processos Relacionais de Decisão de Markov | Transferência de Conhecimento | Inteligência Artificial

Resumo

A transferência do conhecimento adquirido por um robô em experiências anteriores para seu uso e posterior refinamento em novas tarefas é um dos desafios da inteligência artificial. O objetivo deste projeto de pesquisa científica consiste em propor, desenvolver e avaliar métodos de abstração aplicados à transferência de políticas aprendidas em problemas similares para novos problemas não antes deparados pelo agente aprendiz, usando o arcabouço do Aprendizado por Reforço. Na tarefa de abstração, será explorada em particular a lógica de primeira ordem como linguagem de representação, buscando políticas de ação abstratas de modo que possam ser generalizadas para diversos problemas similares. Essa generalização será explorada em diversos domínios, em especial o domínio de navegação de robôs em espaços tais como edifícios e hospitais.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
KOGA, MARCELO L.; FREIRE, VALDINEI; COSTA, ANNA H. R.. Stochastic Abstract Policies: Generalizing Knowledge to Improve Reinforcement Learning. IEEE TRANSACTIONS ON CYBERNETICS, v. 45, n. 1, p. 77-88, . (12/02190-9, 11/19280-8)
SILVA, L. O. L. A.; KOGA, M. L.; CUGNASCA, C. E.; COSTA, A. H. R.. Comparative assessment of feature selection and classification techniques for visual inspection of pot plant seedlings. COMPUTERS AND ELECTRONICS IN AGRICULTURE, v. 97, p. 47-55, . (12/02190-9, 11/19280-8)
DA SILVA, VALDINEI FREIRE; KOGA, MARCELO LI; COZMAN, FABIO GAGLIARDI; REALI COSTA, ANNA HELENA; BEHNKE, S; VELOSO, M; VISSER, A; XIONG, R. Reusing Risk-Aware Stochastic Abstract Policies in Robotic Navigation Learning. ROBOCUP 2013: ROBOT WORLD CUP XVII, v. 8371, p. 12-pg., . (11/19280-8, 12/02190-9)
Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
KOGA, Marcelo Li. Transferência relacional entre tarefas de aprendizado por reforço via políticas abstratas.. 2013. Dissertação de Mestrado - Universidade de São Paulo (USP). Escola Politécnica (EP/BC) São Paulo.