Busca avançada
Ano de início
Entree

Aprendizado por reforço baseado em modelos

Processo: 20/16746-5
Linha de fomento:Bolsas no Brasil - Doutorado
Vigência (Início): 01 de março de 2021
Vigência (Término): 29 de fevereiro de 2024
Área do conhecimento:Engenharias - Engenharia Elétrica
Convênio/Acordo: IBM Brasil
Pesquisador responsável:Eduardo Aoun Tannuri
Beneficiário:Felipe Marino Moreno
Instituição-sede: Escola Politécnica (EP). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Vinculado ao auxílio:19/07665-4 - Centro de Inteligência Artificial, AP.PCPE
Assunto(s):Aprendizado computacional   Aprendizagem profunda   Algoritmos

Resumo

O Aprendizado por Reforço (AR) é utilizado para solucionar problemas de decisões sequenciais, onde um agente interage com o ambiente e recebe um sinal de recompensa, tendo por objetivo aprender quais ações maximizarão a recompensa acumulada. O Aprendizado Profundo por Reforço (APR) associa métodos consolidados de aprendizado por reforço com a capacidade de inferência e representação de modelos do aprendizado profundo, permitindo sua aplicação em problemas contínuos de alta dimensionalidade, como por exemplo para jogar jogos (Ex. ATARI, StarCraft, GO), controle de sistemas simples (Ex. CartPole e MountainCar) e simulações robóticas (Ex. MUJOCO). Porém, o APR é limitado a sistemas que possuem transições determinísticas entre estados completamente observáveis, e possuí resultados ruins em aplicações com transições estocásticas entre estados e com limitada possibilidade de interação do agente com o ambiente. Uma possível alternativa é se associar ao AR modelos ao aprendizado, de forma que o agente tenha acesso a um modelo aproximado do ambiente e que possa usá-lo para tomar decisões. Entretanto algorítimos de aprendizado por reforço baseado em modelos ainda não alcançaram o mesmo nível de qualidade do que algorítimos de APR. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Matéria(s) publicada(s) em Outras Mídias (0 total):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)