Busca avançada
Ano de início
Entree

SARL: abstração estrutural aplicada ao aprendizado por reforço

Processo: 02/13678-0
Modalidade de apoio:Bolsas no Brasil - Doutorado Direto
Data de Início da vigência: 01 de outubro de 2003
Data de Término da vigência: 31 de julho de 2008
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Anna Helena Reali Costa
Beneficiário:Valdinei Freire da Silva
Instituição Sede: Escola Politécnica (EP). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Assunto(s):Robôs móveis   Robôs autônomos   Aprendizado computacional   Algoritmos
Palavra(s)-Chave do Pesquisador:Abstracao Estrutural | Aprendizagem Por Reforco | Generalizacao Da Experiencia | Robos Moveis Inteligentes

Resumo

Algoritmos de aprendizado por reforço (AR) compõem uma família muito popular de algoritmos que atualizam incrementalmente a função valor após cada transição observada. Apesar de populares, estes algoritmos apresentam um tempo muito longo de convergência. Este projeto tem por objetivo desenvolver um algoritmo para acelerar o aprendizado autônomo de agentes, por meio de abstração estrutural, para solução de tarefas complexas de controle do mundo real. Serão consideradas decomposições estruturais como forma de especificar representações multi-resoluções de espaço, para uso em AR. Isso deve-se ao fato de que acredita-se que funções valor (especialmente considerando diferentes metas) contêm informações substanciais sobre a textura funcional embutida no MDP, consistindo, desta forma, uma base importante para a decomposição estrutural apropriada de um problema. Testes serão realizados no domínio da robótica móvel. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
DA SILVA, VALDINEI FREIRE; LIMA, PEDRO; REALI COSTA, ANNA HELENA; IEEE. Eliciting preferences over observed behaviours based on relative evaluations. 2007 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS, VOLS 1-9, v. N/A, p. 2-pg., . (02/13678-0)
DA SILVA, VALDINEI FREIRE; REALI COSTA, ANNA HELENA; LIMA, PEDRO; IEEE. Inverse reinforcement learning with evaluation. 2006 IEEE INTERNATIONAL CONFERENCE ON ROBOTICS AND AUTOMATION (ICRA), VOLS 1-10, v. N/A, p. 2-pg., . (02/13678-0)
Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
SILVA, Valdinei Freire da. Extração de preferências por meio de avaliações de comportamentos observados.. 2009. Tese de Doutorado - Universidade de São Paulo (USP). Escola Politécnica (EP/BC) São Paulo.