Bolsa 02/13678-0 - Robôs móveis, Robôs autônomos

Processo:	02/13678-0
Modalidade de apoio:	Bolsas no Brasil - Doutorado Direto
Data de Início da vigência:	01 de outubro de 2003
Data de Término da vigência:	31 de julho de 2008
Área de conhecimento:	Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação

Pesquisador responsável:	Anna Helena Reali Costa
Beneficiário:	Valdinei Freire da Silva

Instituição Sede:	Escola Politécnica (EP). Universidade de São Paulo (USP). São Paulo , SP, Brasil

Assunto(s):	Robôs móveis Robôs autônomos Aprendizado computacional Algoritmos
Palavra(s)-Chave do Pesquisador:	Abstracao Estrutural \| Aprendizagem Por Reforco \| Generalizacao Da Experiencia \| Robos Moveis Inteligentes
Resumo Algoritmos de aprendizado por reforço (AR) compõem uma família muito popular de algoritmos que atualizam incrementalmente a função valor após cada transição observada. Apesar de populares, estes algoritmos apresentam um tempo muito longo de convergência. Este projeto tem por objetivo desenvolver um algoritmo para acelerar o aprendizado autônomo de agentes, por meio de abstração estrutural, para solução de tarefas complexas de controle do mundo real. Serão consideradas decomposições estruturais como forma de especificar representações multi-resoluções de espaço, para uso em AR. Isso deve-se ao fato de que acredita-se que funções valor (especialmente considerando diferentes metas) contêm informações substanciais sobre a textura funcional embutida no MDP, consistindo, desta forma, uma base importante para a decomposição estrutural apropriada de um problema. Testes serão realizados no domínio da robótica móvel. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itens Menos itens
TITULO

Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itens Menos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas

(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)

DA SILVA, VALDINEI FREIRE; LIMA, PEDRO; REALI COSTA, ANNA HELENA; IEEE. Eliciting preferences over observed behaviours based on relative evaluations. 2007 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS, VOLS 1-9, v. N/A, p. 2-pg., 2007-01-01. (02/13678-0)

DA SILVA, VALDINEI FREIRE; REALI COSTA, ANNA HELENA; LIMA, PEDRO; IEEE. Inverse reinforcement learning with evaluation. 2006 IEEE INTERNATIONAL CONFERENCE ON ROBOTICS AND AUTOMATION (ICRA), VOLS 1-10, v. N/A, p. 2-pg., 2006-01-01. (02/13678-0)

Publicações acadêmicas

(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)

SILVA, Valdinei Freire da. Extração de preferências por meio de avaliações de comportamentos observados.. 2009. Tese de Doutorado - Universidade de São Paulo (USP). Escola Politécnica (EP/BC) São Paulo.

URL curto