| Processo: | 16/21047-3 |
| Modalidade de apoio: | Auxílio à Pesquisa - Regular |
| Data de Início da vigência: | 01 de fevereiro de 2017 |
| Data de Término da vigência: | 31 de janeiro de 2019 |
| Área do conhecimento: | Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação |
| Pesquisador responsável: | Anna Helena Reali Costa |
| Beneficiário: | Anna Helena Reali Costa |
| Instituição Sede: | Escola Politécnica (EP). Universidade de São Paulo (USP). São Paulo , SP, Brasil |
| Município da Instituição Sede: | São Paulo |
| Pesquisadores associados: | Reinaldo Augusto da Costa Bianchi |
| Assunto(s): | Inteligência artificial Transferência de conhecimento Aprendizado por reforço Aproximação de funções |
| Palavra(s)-Chave do Pesquisador: | Aprendizado Autônomo | Aprendizado Multiagente | Aprendizado por Reforço | Aproximação de funções | Processos de Decisão Markovianos | Transferência de Conhecimento | Inteligência Artificial |
Resumo
Sistemas inteligentes são máquinas que possuem seus próprios objetivos, percebem, respondem e aprendem com base em suas experiências. O Aprendizado por Reforço (RL - Reinforcement Learning) é uma ferramenta poderosa para este fim, pois o sistema aprende autonomamente uma política de atuação por meio de tentativa e erro em repetidas interações com o ambiente. Com este projeto busca-se aumentar a difusão do uso da tecnologia de RL e avançar na fronteira do conhecimento da área de aprendizado autônomo. Entretanto, muitos desafios ainda devem ser vencidos para que se tenha um amplo uso do RL em sistemas inteligentes. Os desafios incluem lidar com incertezas dos sensores e atuadores, um mundo dinâmico que exige decisões rápidas, grandezas contínuas e o alto custo computacional do RL. Assim, este projeto de pesquisa científica tem por objetivo investigar, propor, desenvolver e avaliar modelos e métodos capazes de tornar o RL eficiente e eficaz em sistemas inteligentes que resolvem problemas complexos. Em especial, explora: (i) modelagens relacionais e orientadas a objetos e respectivos algoritmos, permitindo oportunidades de generalização na descrição e resolução dos problemas; (ii) distribuição e divisão do trabalho entre vários agentes aprendizes; (iii) funções de aproximações adequadas para representar tanto as situações observadas pelo agente quanto o conhecimento adquirido; (iv) transferência de conhecimento para que o conhecimento adquirido por outro agente ou do aprendizado de uma tarefa prévia seja reaproveitado para acelerar o aprendizado de uma nova tarefa similar. Sob o ponto de vista de aplicações, este projeto visa aplicar e avaliar os modelos e algoritmos propostos em domínios como: jogos, robótica, biologia computacional, entre outros. (AU)
| Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio: |
| Mais itensMenos itens |
| TITULO |
| Matéria(s) publicada(s) em Outras Mídias ( ): |
| Mais itensMenos itens |
| VEICULO: TITULO (DATA) |
| VEICULO: TITULO (DATA) |