Busca avançada
Ano de início
Entree

Programação Dinâmica em Tempo Real e Simulação de Monte Carlo para Planejamento Probabilístico

Processo: 11/16962-0
Modalidade de apoio:Bolsas no Brasil - Mestrado
Data de Início da vigência: 01 de março de 2012
Data de Término da vigência: 30 de setembro de 2014
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Teoria da Computação
Pesquisador responsável:Leliane Nunes de Barros
Beneficiário:Luis Gustavo Rocha Vianna
Instituição Sede: Instituto de Matemática e Estatística (IME). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Vinculado ao auxílio:08/03995-5 - LOGPROB: lógica probabilística - fundamentos e aplicações computacionais, AP.TEM
Bolsa(s) vinculada(s):12/10861-0 - Programação dinâmica assíncrona para processos de decisão markovianos com variáveis discretas e contínuas, BE.EP.MS
Palavra(s)-Chave do Pesquisador:Automated Planning | Markov Decision Processes | Monte Carlo Planning | Real TIme Dynamic Programming | Planejamento em Inteligência Artificial

Resumo

Problemas de planejamento probabilístico podem ser modelados como MDPs(Processos de Decisão Markovianos). A resolução de um problema é encontrar uma política ótima, isto é, uma função que mapeia estados em ações e que maximiza a recompensa esperada do agente que a seguir. Uma classe de algoritmos bem estudados para o caso de estado inicial e meta conhecido é baseada em RTDP(programação Dinâmica em tempo Real), enquanto isso outra proposta de solução é MCTS( Busca em árvore de monte Carlo) assim neste trabalho pretendemos comparar e avaliar estas duas classes de algoritmos.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
VIANNA, LUIS G. R.; DE BARROS, LELIANE N.; SANNER, SCOTT; AAAI. Real-Time Symbolic Dynamic Programming for Hybrid MDPs. PROCEEDINGS OF THE TWENTY-NINTH AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE, v. N/A, p. 7-pg., . (11/16962-0)
Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
VIANNA, Luis Gustavo Rocha. Programação dinâmica simbólica aproximada e assíncrona para processos de decisão markovianos com variáveis contínuas. 2015. Dissertação de Mestrado - Universidade de São Paulo (USP). Instituto de Matemática e Estatística (IME/SBI) São Paulo.