Busca avançada
Ano de início
Entree

Programação dinâmica em tempo real e Simulação de Monte Carlo para planejamento probabilístico

Processo: 11/16962-0
Linha de fomento:Bolsas no Brasil - Mestrado
Vigência (Início): 01 de março de 2012
Vigência (Término): 30 de setembro de 2014
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Teoria da Computação
Pesquisador responsável:Leliane Nunes de Barros
Beneficiário:Luis Gustavo Rocha Vianna
Instituição-sede: Instituto de Matemática e Estatística (IME). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Vinculado ao auxílio:08/03995-5 - LOGPROB: lógica probabilística - fundamentos e aplicações computacionais, AP.TEM
Bolsa(s) vinculada(s):12/10861-0 - Programação dinâmica assíncrona para processos de decisão markovianos com variáveis discretas e contínuas, BE.EP.MS

Resumo

Problemas de planejamento probabilístico podem ser modelados como MDPs(Processos de Decisão Markovianos). A resolução de um problema é encontrar uma política ótima, isto é, uma função que mapeia estados em ações e que maximiza a recompensa esperada do agente que a seguir. Uma classe de algoritmos bem estudados para o caso de estado inicial e meta conhecido é baseada em RTDP(programação Dinâmica em tempo Real), enquanto isso outra proposta de solução é MCTS( Busca em árvore de monte Carlo) assim neste trabalho pretendemos comparar e avaliar estas duas classes de algoritmos.