Resumo
O projeto visa desenvolver diferentes técnicas de Aprendizado por Reforço (Proximal Policy Optimization, Recurrent Reinforcement Learning e Deep-Q-Learning) de forma comparativa para a aplicação no problema de investimento automatizado no mercado brasileiro de ações - especificamente para operações diárias (swing trade). Para isso, se propõe: o desenvolvimento de um banco de dados históri…