Busca avançada
Ano de início
Entree

Predição de propriedades moleculares com alta acurácia: uma abordagem via aprendizado semi-supervisionado

Processo: 21/08852-2
Modalidade de apoio:Bolsas no Brasil - Doutorado
Data de Início da vigência: 01 de dezembro de 2021
Data de Término da vigência: 28 de fevereiro de 2025
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Marcos Gonçalves Quiles
Beneficiário:Gabriel Augusto Lins Leal Pinheiro
Instituição Sede: Instituto de Ciência e Tecnologia (ICT). Universidade Federal de São Paulo (UNIFESP). Campus São José dos Campos. São José dos Campos , SP, Brasil
Empresa:Universidade de São Paulo (USP). Instituto de Química de São Carlos (IQSC)
Vinculado ao auxílio:17/11631-2 - CINE: desenvolvimento computacional de materiais utilizando simulações atomísticas, meso-escala, multi-física e inteligência artificial para aplicações energéticas, AP.PCPE
Bolsa(s) vinculada(s):22/13536-5 - Estratégias para extração de atributos de polímeros para tarefas de aprendizado de máquina com bases de dados restritas, BE.EP.DR
Assunto(s):Aprendizado computacional   Aprendizado semissupervisionado   Redes neurais (computação)   Materiais   Propriedades moleculares
Palavra(s)-Chave do Pesquisador:Aprendizado contrastivo | Aprendizado de Máquina | Propriedade molecular | Redes Neurais Artificiais | Semi-supervisionado | Aprendizado de Máquina

Resumo

A descoberta de materiais envolve a investigação de sistemas com propriedades físico-químicas de interesse. Tal estudo é desenvolvido no campo de Ciência dos Materiais, que através de simulações computacionais e experimentos laboratoriais descrevem como esses sistemas se comportam e reagem uns com os outros em diferentes ambientes. Contudo, simulações computacionais empregadas no estudo das propriedades possuem alto custo computacional, e experimentos laboratoriais demandam laboratórios com o ambiente adequado para a operação de tais experimentos. Por outro lado, a grande quantidade de simulações e experimentos realizadas na última década motivou a aplicação de algoritmos de Aprendizado de Máquina (AM) como uma abordagem alternativa a tais métodos tradicionais, visto o tempo requerido pelo AM na predição de uma nova instância. No contexto supervisionado, modelos de AM treinados sobre dados da teoria do funcional de densidade (DFT) demonstraram erros menores quando comparados aos erros da DFT em relação a experimentos laboratoriais, além de atingirem predições com desempenho superiores ao limite estabelecido como acurácia química. Entretanto, nas aplicações de AM, dados não rotulados são pouco explorados, mesmo tendo conjuntos de dados bem maiores que os dados aplicados para o contexto supervisionado. Recentemente, modelos contrastivos ganharam destaque na literatura devido aos resultados estado da arte obtidos em aplicações semi-supervisionadas e a capacidade em aprender representações. Neste sentido, este trabalho tem por objetivo propor um modelo contrastivo para a aplicação em Ciência dos Materiais. Para tanto, pretende-se fazer um estudo de diversas redes codificadoras, técnicas de aumento de dados, bem como propor uma função de custo que considere tanto o erro da predição da propriedade quanto o erro de reconstrução da entrada no contexto auto-supervisionado. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
PINHEIRO, GABRIEL A.; CALDERAN, FELIPE V.; DA SILVA, JUAREZ L. F.; QUILES, MARCOS G.; WANI, MA; KANTARDZIC, M; PALADE, V; NEAGU, D; YANG, L; CHAN, KY. The impact of low-cost molecular geometry optimization in property prediction via graph neural network. 2022 21ST IEEE INTERNATIONAL CONFERENCE ON MACHINE LEARNING AND APPLICATIONS, ICMLA, v. N/A, p. 6-pg., . (21/08852-2, 17/11631-2, 18/21401-7)
PINHEIRO, GABRIEL A.; SILVA, JUAREZ L. F.; QUILES, MARCOS G.. SMICLR: Contrastive Learning on Multiple Molecular Representations for Semisupervised and Unsupervised Representation Learning. JOURNAL OF CHEMICAL INFORMATION AND MODELING, v. 62, n. 17, p. 13-pg., . (18/21401-7, 17/11631-2, 21/08852-2)