Bolsa 10/02379-9 - Aprendizado computacional, Aprendizado por reforço

Processo:	10/02379-9
Modalidade de apoio:	Bolsas no Brasil - Iniciação Científica
Data de Início da vigência:	01 de abril de 2010
Data de Término da vigência:	31 de março de 2011
Área de conhecimento:	Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação

Pesquisador responsável:	Anna Helena Reali Costa
Beneficiário:	Yannick Plaino Bergamo

Instituição Sede:	Escola Politécnica (EP). Universidade de São Paulo (USP). São Paulo , SP, Brasil

Assunto(s):	Aprendizado computacional Aprendizado por reforço Navegação de robôs Inteligência artificial
Palavra(s)-Chave do Pesquisador:	Aprendizado de Máquina \| Aprendizado por Reforço \| Aprendizado Relacional \| Navegação Robótica \| Inteligência Artificial
Resumo Aplicações de robôs móveis no mundo real tipicamente exigem que tarefas similares sejam executadas em ambientes similares ou mesmo desconhecidos. Assim, é bastante adequado o uso de uma arquitetura que permita reuso e adaptação do conhecimento adquirido conforme evolui sua experiência. O objetivo deste trabalho consiste em expandir a arquitetura AAREACT, uma arquitetura híbrida adaptativa para robôs móveis que possui a habilidade de aprender a coordenação de comportamentos primitivos codificados em campos potenciais, para a arquitetura RRL-REACT com capacidade para abstração relacional de forma a permitir a generalização de planejamentos de navegação já realizados, assim como a transferência de políticas de atuação para outras tarefas similares. Para isso será integrado à arquitetura RRL-REACT o algoritmo TG, um algoritmo de aprendizado incremental de árvores de decisão de primeira ordem acoplado a um algoritmo padrão de aprendizado por reforço.A arquitetura proposta será avaliada em termos de sua curva de desempenho quando o robô é movido de um cenário a outro, considerando sua capacidade de empregar representações estruturais, abstrair a partir de objetivos específicos e explorar os resultados de fases anteriores de aprendizagem ao abordar novas situações. Experimentos serão conduzidos no robô Pioneer, da ActivMedia Robotics.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itens Menos itens
TITULO

Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itens Menos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

URL curto