Reusando soluções de tarefas prévias em aprendizado por reforço multiagente
Sistemas de recomendação top-N conscientes de tempo baseados em aprendizado por re...
Aceleração do aprendizado por reforço em sistemas com múltiplos objetivos
Controle Incremental Não Linear e Aprendizagem por Reforço para a Operação Segura ...