Busca avançada
Ano de início
Entree

Aceleração do aprendizado por reforço em sistemas com múltiplos objetivos

Processo: 07/02279-1
Modalidade de apoio:Bolsas no Brasil - Mestrado
Data de Início da vigência: 01 de novembro de 2007
Data de Término da vigência: 31 de agosto de 2009
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Carlos Henrique Costa Ribeiro
Beneficiário:Helen Cristina de Mattos Senefonte
Instituição Sede: Instituto Tecnológico de Aeronáutica (ITA). Ministério da Defesa (Brasil). São José dos Campos , SP, Brasil
Assunto(s):Aprendizado computacional   Heurística
Palavra(s)-Chave do Pesquisador:Aprendizado por Reforço | heuristicas | Resolução Distribuída de Problemas | Aprendizado de Máquina

Resumo

O objetivo deste projeto é a implementação e análise de técnicas para aceleração do aprendizado por reforço em sistemas com múltiplos objetivos. Problemas com múltiplos objetivos, por sua vez, podem ser descritos de várias formas diferentes. O foco aqui é naqueles casos em que um único agente deve aprender simultaneamente e de modo online várias sub-tarefas independentes resultantes de uma decomposição a priori do problema em questão. Tem-se portanto uma instância da Resolução Distribuída de Problemas em que não ocorre planejamento prévio, sendo o agente responsável pelo aprendizado autônomo de um processo de seleção de ações em que pode ocorrer competição entre as várias sub-tarefas. O projeto envolverá uma análise formal e empírica baseada em resultados prévios da literatura, e em seguida serão propostas técnicas de aceleração do aprendizado baseadas em heurísticas testadas e estudadas no contexto de problemas de objetivos simples.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)