Busca avançada
Ano de início
Entree

RRL-REACT: Aprendizado por Reforço Relacional em uma Arquitetura Híbrida para a Navegação Robótica

Processo: 10/02379-9
Linha de fomento:Bolsas no Brasil - Iniciação Científica
Vigência (Início): 01 de abril de 2010
Vigência (Término): 31 de março de 2011
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Anna Helena Reali Costa
Beneficiário:Yannick Plaino Bergamo
Instituição-sede: Escola Politécnica (EP). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Assunto(s):Aprendizado computacional   Aprendizado por reforço   Navegação de robôs   Inteligência artificial

Resumo

Aplicações de robôs móveis no mundo real tipicamente exigem que tarefas similares sejam executadas em ambientes similares ou mesmo desconhecidos. Assim, é bastante adequado o uso de uma arquitetura que permita reuso e adaptação do conhecimento adquirido conforme evolui sua experiência. O objetivo deste trabalho consiste em expandir a arquitetura AAREACT, uma arquitetura híbrida adaptativa para robôs móveis que possui a habilidade de aprender a coordenação de comportamentos primitivos codificados em campos potenciais, para a arquitetura RRL-REACT com capacidade para abstração relacional de forma a permitir a generalização de planejamentos de navegação já realizados, assim como a transferência de políticas de atuação para outras tarefas similares. Para isso será integrado à arquitetura RRL-REACT o algoritmo TG, um algoritmo de aprendizado incremental de árvores de decisão de primeira ordem acoplado a um algoritmo padrão de aprendizado por reforço.A arquitetura proposta será avaliada em termos de sua curva de desempenho quando o robô é movido de um cenário a outro, considerando sua capacidade de empregar representações estruturais, abstrair a partir de objetivos específicos e explorar os resultados de fases anteriores de aprendizagem ao abordar novas situações. Experimentos serão conduzidos no robô Pioneer, da ActivMedia Robotics.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Matéria(s) publicada(s) em Outras Mídias (0 total):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)