Busca avançada
Ano de início
Entree

Aprendizagem por reforço no planejamento de ações em ambientes dinâmicos, não estruturados e sujeitos a restrições de tempo

Processo: 98/12700-5
Modalidade de apoio:Bolsas no Brasil - Doutorado
Data de Início da vigência: 01 de março de 1999
Data de Término da vigência: 28 de fevereiro de 2003
Área de conhecimento:Engenharias - Engenharia Elétrica - Eletrônica Industrial, Sistemas e Controles Eletrônicos
Pesquisador responsável:Aluizio Fausto Ribeiro Araújo
Beneficiário:Arthur Plinio de Souza Braga
Instituição Sede: Escola de Engenharia de São Carlos (EESC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Inteligência artificial   Redes neurais (computação)
Palavra(s)-Chave do Pesquisador:Agente Autonomo | Aprendizagem Por Reforco | Comportamento Reativo | Inteligencia Artificial | Planejamento | Redes Neurais

Resumo

O presente projeto de doutorado propõe o estudo de técnicas que aumentem a velocidade de convergência da aprendizagem de agentes autônomos baseados em aprendizagem por reforço (AR) buscando adicionar aos mesmos propriedades que os tomem capazes de trabalhar sob restrições temporais viabilizando a aplicação de AR no controle de sistemas reais. O planejamento de ações empregando aprendizagem por reforço (AR) pode fornecer aos agentes características como a capacidade de aprendizagem incremental da tarefa a ser realizada, a independência de um modelo prévio do ambiente de trabalho, a geração de comportamentos reativos e deliberativos e a capacidade de melhoria progressiva de soluções anteriormente consideradas. A originalidade da pesquisa está em desenvolver meios de ampliar o campo de atuação dos algoritmos ÀR de sistemas simples para aplicações reais. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
BRAGA‚ A.P.S.; ARAÚJO‚ A.F.R.. A topological reinforcement learning agent for navigation. NEURAL COMPUTING & APPLICATIONS, v. 12, n. 3, p. 220-236, . (98/12700-5)
BRAGA‚ A.P.S.; ARAÚJO‚ A.F.R.. Influence zones: A strategy to enhance reinforcement learning. Neurocomputing, v. 70, n. 1, p. 21-34, . (98/12700-5)
Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
BRAGA, Arthur Plínio de Souza. Agente topológico de aprendizado por reforço. 2004. Tese de Doutorado - Universidade de São Paulo (USP). Escola de Engenharia de São Carlos (EESC/SBD) São Carlos.