Auxílio à pesquisa 22/09285-7 - Aprendizado computacional, Aprendizado semissupervisionado

Processo:	22/09285-7
Modalidade de apoio:	Auxílio à Pesquisa - Regular
Data de Início da vigência:	01 de março de 2023
Data de Término da vigência:	28 de fevereiro de 2025
Área do conhecimento:	Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação

Pesquisador responsável:	Marcos Gonçalves Quiles
Beneficiário:	Marcos Gonçalves Quiles

Instituição Sede:	Instituto de Ciência e Tecnologia (ICT). Universidade Federal de São Paulo (UNIFESP). Campus São José dos Campos. São José dos Campos , SP, Brasil

Pesquisadores associados:	Juarez Lopes Ferreira da Silva ; Ronaldo Cristiano Prati

Assunto(s):	Aprendizado computacional Aprendizado semissupervisionado Redes neurais (computação) Desenvolvimento de novos materiais
Palavra(s)-Chave do Pesquisador:	Aprendizado Semissupervisionado \| autoencoders \| design de materiais \| Predicao de Propriedades \| Redes neurais \| Aprendizado de Máquina

Resumo

A descoberta de novos materiais está diretamente ligada a evolução da sociedade. Estes materiais podem permitir desde a geração novos fármacos até o desenvolvimento de componentes eletrônicos para geração de energias limpas. Destaca-se que além dos diversos materiais já disponíveis na natureza, há uma infinidade de compostos que podem ser, teoricamente, gerados a partir da combinação de elementos químicos básicos. Contudo, esse espaço de possibilidade, denominado espaço químico, é praticamente infinito, inviabilizando um escrutínio completo de todas as possibilidades. Com o objetivo de facilitar a busca por novos materiais, especialistas têm feito uso de diversas técnicas de aprendizado de máquina (AM). No processo direto, técnicas de AM podem ser treinadas e usadas para predizer propriedades específicas de novos materiais. Por outro lado, técnicas de AM também podem ser usadas no denominado design inverso, no qual o modelo é treinado para gerar novos compostos a partir de propriedades desejadas. Dentre as diversas técnicas de AM disponíveis na literatura, o treinamento de modelos generativos baseados em autoencoders tem mostrado resultados promissores. Recentemente, propusemos um modelo generativo, denominado Autoencoder Variacional Gramatical Supervisionado (SGVAE). Este modelo é capaz de realizar as duas tarefas descritas acima: predição de propriedades e design de novas moléculas. Entretanto, este modelo, assim como outros da literatura, possuem limitações e restrições de uso, como por exemplo: a) a maioria dos modelos são intrinsicamente supervisionados; b) carecem de um estudo amplo sobre representações moleculares; c) geração de espaços latentes com baixa navegabilidade (amostragem) e interpretação; d) falta de uma metodologia para adaptação contínua do modelo em cenários nos quais novos dados são constantemente adicionados a base de dados; e e) validação dos modelos em cenários reais. Neste sentido, com o objetivo de responder algumas das perguntas expostas, serão estudados e desenvolvidos novos modelos baseados em Autoencoders Variacionais (VAE) para geração de materiais considerando múltiplas representações. O treinamento dos modelos seguirá o paradigma semissupervisionado, no qual os dados são parcialmente rotulados. Além disso, técnicas de aprendizado ativo também serão consideradas para melhorar a eficiência no uso dos dados rotulados e exploração contínua do espaço químico. Com o objetivo de melhorar a interpretação química/física da representação latente aprendida, será realizada uma análise qualitativa e quantitativa dos VAEs. Os modelos serão avaliados utilizando conjuntos de dados públicos e dados gerados no contexto do CINE (Center for Innovation on New Energies). Por fim, destaca-se que este projeto está vinculado a divisão computacional do CINE (4), no qual o proponente é um dos pesquisadores principais (Proc. 2017/11631-2). (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:

Mais itens Menos itens

TITULO

Matéria(s) publicada(s) em Outras Mídias ( ):

Mais itens Menos itens

VEICULO: TITULO (DATA)

Publicações científicas

(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)

PELIN CARDOSO, LUIS EDUARDO; DE CARVALHO, ANDRE C. P. DE LEON F.; QUILES, MARCOS G.. Applying LSTM Recurrent Neural Networks to Predict Revenue. COMPUTATIONAL SCIENCE AND ITS APPLICATIONS-ICCSA 2024, PT II, v. 14814, p. 15-pg., 2024-01-01. (20/09835-1, 22/09285-7)

CALDERAN, FELIPE, V; DE MENDONCA, JOAO PAULO A.; DA SILVA, JUAREZ L. F.; QUILES, MARCOS G.. Guided Clustering for Selecting Representatives Samples in Chemical Databases. COMPUTATIONAL SCIENCE AND ITS APPLICATIONS-ICCSA 2023 WORKSHOPS, PART VIII, v. 14111, p. 17-pg., 2023-01-01. (18/21401-7, 22/09285-7, 17/11631-2)

BARROS DA SILVA, ARNALDO, V; SALDIVIA-SIRACUSA, CRISTINA; CARLOS DE SOUZA, EDUARDO SANTOS; DAMACENO ARAUJO, ANNA LUIZA; LOPES, MARCIO AJUDARTE; VARGAS, PABLO AGUSTIN; KOWALSKI, LUIZ PAULO; SANTOS-SILVA, ALAN ROGER; DE CARVALHO, ANDRE C. P. L. F.; QUILES, MARCOS G.. Enhancing Explainability in Oral Cancer Detection with Grad-CAM Visualizations. COMPUTATIONAL SCIENCE AND ITS APPLICATIONS-ICCSA 2024, PT I, v. 14813, p. 14-pg., 2024-01-01. (20/09835-1, 22/09285-7)

URL curto