Busca avançada
Ano de início
Entree

RRL-REACT: Aprendizado por Reforço Relacional em uma Arquitetura Híbrida para a Navegação Robótica

Processo: 10/02379-9
Modalidade de apoio:Bolsas no Brasil - Iniciação Científica
Data de Início da vigência: 01 de abril de 2010
Data de Término da vigência: 31 de março de 2011
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Anna Helena Reali Costa
Beneficiário:Yannick Plaino Bergamo
Instituição Sede: Escola Politécnica (EP). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Assunto(s):Aprendizado computacional   Aprendizado por reforço   Navegação de robôs   Inteligência artificial
Palavra(s)-Chave do Pesquisador:Aprendizado de Máquina | Aprendizado por Reforço | Aprendizado Relacional | Navegação Robótica | Inteligência Artificial

Resumo

Aplicações de robôs móveis no mundo real tipicamente exigem que tarefas similares sejam executadas em ambientes similares ou mesmo desconhecidos. Assim, é bastante adequado o uso de uma arquitetura que permita reuso e adaptação do conhecimento adquirido conforme evolui sua experiência. O objetivo deste trabalho consiste em expandir a arquitetura AAREACT, uma arquitetura híbrida adaptativa para robôs móveis que possui a habilidade de aprender a coordenação de comportamentos primitivos codificados em campos potenciais, para a arquitetura RRL-REACT com capacidade para abstração relacional de forma a permitir a generalização de planejamentos de navegação já realizados, assim como a transferência de políticas de atuação para outras tarefas similares. Para isso será integrado à arquitetura RRL-REACT o algoritmo TG, um algoritmo de aprendizado incremental de árvores de decisão de primeira ordem acoplado a um algoritmo padrão de aprendizado por reforço.A arquitetura proposta será avaliada em termos de sua curva de desempenho quando o robô é movido de um cenário a outro, considerando sua capacidade de empregar representações estruturais, abstrair a partir de objetivos específicos e explorar os resultados de fases anteriores de aprendizagem ao abordar novas situações. Experimentos serão conduzidos no robô Pioneer, da ActivMedia Robotics.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)