Busca avançada
Ano de início
Entree

Exploração do espaço químico via aprendizado semissupervisionado para geração de novos materiais

Processo: 22/09285-7
Modalidade de apoio:Auxílio à Pesquisa - Regular
Data de Início da vigência: 01 de março de 2023
Data de Término da vigência: 28 de fevereiro de 2025
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Marcos Gonçalves Quiles
Beneficiário:Marcos Gonçalves Quiles
Instituição Sede: Instituto de Ciência e Tecnologia (ICT). Universidade Federal de São Paulo (UNIFESP). Campus São José dos Campos. São José dos Campos , SP, Brasil
Pesquisadores associados:Juarez Lopes Ferreira da Silva ; Ronaldo Cristiano Prati
Assunto(s):Aprendizado computacional  Aprendizado semissupervisionado  Redes neurais (computação)  Desenvolvimento de novos materiais 
Palavra(s)-Chave do Pesquisador:Aprendizado Semissupervisionado | autoencoders | design de materiais | Predicao de Propriedades | Redes neurais | Aprendizado de Máquina

Resumo

A descoberta de novos materiais está diretamente ligada a evolução da sociedade. Estes materiais podem permitir desde a geração novos fármacos até o desenvolvimento de componentes eletrônicos para geração de energias limpas. Destaca-se que além dos diversos materiais já disponíveis na natureza, há uma infinidade de compostos que podem ser, teoricamente, gerados a partir da combinação de elementos químicos básicos. Contudo, esse espaço de possibilidade, denominado espaço químico, é praticamente infinito, inviabilizando um escrutínio completo de todas as possibilidades. Com o objetivo de facilitar a busca por novos materiais, especialistas têm feito uso de diversas técnicas de aprendizado de máquina (AM). No processo direto, técnicas de AM podem ser treinadas e usadas para predizer propriedades específicas de novos materiais. Por outro lado, técnicas de AM também podem ser usadas no denominado design inverso, no qual o modelo é treinado para gerar novos compostos a partir de propriedades desejadas. Dentre as diversas técnicas de AM disponíveis na literatura, o treinamento de modelos generativos baseados em autoencoders tem mostrado resultados promissores. Recentemente, propusemos um modelo generativo, denominado Autoencoder Variacional Gramatical Supervisionado (SGVAE). Este modelo é capaz de realizar as duas tarefas descritas acima: predição de propriedades e design de novas moléculas. Entretanto, este modelo, assim como outros da literatura, possuem limitações e restrições de uso, como por exemplo: a) a maioria dos modelos são intrinsicamente supervisionados; b) carecem de um estudo amplo sobre representações moleculares; c) geração de espaços latentes com baixa navegabilidade (amostragem) e interpretação; d) falta de uma metodologia para adaptação contínua do modelo em cenários nos quais novos dados são constantemente adicionados a base de dados; e e) validação dos modelos em cenários reais. Neste sentido, com o objetivo de responder algumas das perguntas expostas, serão estudados e desenvolvidos novos modelos baseados em Autoencoders Variacionais (VAE) para geração de materiais considerando múltiplas representações. O treinamento dos modelos seguirá o paradigma semissupervisionado, no qual os dados são parcialmente rotulados. Além disso, técnicas de aprendizado ativo também serão consideradas para melhorar a eficiência no uso dos dados rotulados e exploração contínua do espaço químico. Com o objetivo de melhorar a interpretação química/física da representação latente aprendida, será realizada uma análise qualitativa e quantitativa dos VAEs. Os modelos serão avaliados utilizando conjuntos de dados públicos e dados gerados no contexto do CINE (Center for Innovation on New Energies). Por fim, destaca-se que este projeto está vinculado a divisão computacional do CINE (4), no qual o proponente é um dos pesquisadores principais (Proc. 2017/11631-2). (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
PELIN CARDOSO, LUIS EDUARDO; DE CARVALHO, ANDRE C. P. DE LEON F.; QUILES, MARCOS G.. Applying LSTM Recurrent Neural Networks to Predict Revenue. COMPUTATIONAL SCIENCE AND ITS APPLICATIONS-ICCSA 2024, PT II, v. 14814, p. 15-pg., . (20/09835-1, 22/09285-7)
CALDERAN, FELIPE, V; DE MENDONCA, JOAO PAULO A.; DA SILVA, JUAREZ L. F.; QUILES, MARCOS G.. Guided Clustering for Selecting Representatives Samples in Chemical Databases. COMPUTATIONAL SCIENCE AND ITS APPLICATIONS-ICCSA 2023 WORKSHOPS, PART VIII, v. 14111, p. 17-pg., . (18/21401-7, 22/09285-7, 17/11631-2)
BARROS DA SILVA, ARNALDO, V; SALDIVIA-SIRACUSA, CRISTINA; CARLOS DE SOUZA, EDUARDO SANTOS; DAMACENO ARAUJO, ANNA LUIZA; LOPES, MARCIO AJUDARTE; VARGAS, PABLO AGUSTIN; KOWALSKI, LUIZ PAULO; SANTOS-SILVA, ALAN ROGER; DE CARVALHO, ANDRE C. P. L. F.; QUILES, MARCOS G.. Enhancing Explainability in Oral Cancer Detection with Grad-CAM Visualizations. COMPUTATIONAL SCIENCE AND ITS APPLICATIONS-ICCSA 2024, PT I, v. 14813, p. 14-pg., . (20/09835-1, 22/09285-7)