Busca avançada
Ano de início
Entree

Desvendando os blocos fundamentais da aprendizagem profunda

Processo: 19/26617-0
Linha de fomento:Bolsas no Exterior - Estágio de Pesquisa - Pós-Doutorado
Vigência (Início): 11 de janeiro de 2021
Vigência (Término): 29 de setembro de 2021
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:André Carlos Ponce de Leon Ferreira de Carvalho
Beneficiário:Tiago Botari
Supervisor no Exterior: Klaus-Robert Muller
Instituição-sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Local de pesquisa: Technical University of Berlin (TU), Alemanha  
Vinculado à bolsa:17/06161-7 - Interpretabilidade de redes profundas, BP.PD
Assunto(s):Aprendizado computacional   Aprendizagem profunda   Redes neurais (computação)   Precisão

Resumo

O Deep Learning (DL), uma classe de algoritmos de aprendizado de máquina, demonstrou uma alta capacidade de induzir modelos em diferentes domínios do conhecimento. Atualmente, os modelos DL são considerados estado da arte em muitas aplicações, como reconhecimento de imagem e voz, simulação de jogadores, entre outras. Embora os modelos de DL tenham alta precisão preditiva em muitas tarefas do mundo real, pouco se sabe sobre o mecanismo interno de funcionamento e o processo de tomada de decisão dos modelos. A transparência dos modelos se tornou um grande problema nos modelos de DL, pois a precisão não é o único alvo que os humanos desejam para a solução de problemas. Para esse fim, hoje é essencial avançar na compreensão dos modelos de DL. O objetivo deste projeto é investigar, criar e validar interpretações para modelos de DL. Para isso, identificaremos as estruturas internas nos modelos de DL responsáveis por representar abstrações de dados específicas e usaremos esse conhecimento para aumentar a transparência dos modelos. Usando dados gerados a partir de modelos controlados, induziremos modelos de DL com diferentes níveis de complexidade para investigar um recurso específico. Esses modelos controlados serão advindos da física estatística, transformações de grupos de simetria, entre outros. Os modelos de DL induzidos serão analisados utilizando metodologias derivadas da teoria dos grafos, teoria da informação, física estatística, entre outras. Também aproveitaremos das novas metodologias da comunidade de pesquisa de DL. Os resultados produzidos durante este projeto podem levar a avanços no entendimento, processo de aprendizagem, aumento da transparência e interpretabilidade dos modelos de DL. Além disso, o desenvolvimento de novas estratégias para transferência de aprendizado e definição da arquitetura de redes neurais. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Matéria(s) publicada(s) em Outras Mídias (0 total):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)