Busca avançada
Ano de início
Entree

Predição de propriedades moleculares representadas por SMILES via aprendizado semissupervisionado

Processo: 23/06444-0
Modalidade de apoio:Bolsas no Brasil - Iniciação Científica
Data de Início da vigência: 01 de agosto de 2023
Data de Término da vigência: 31 de dezembro de 2023
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Marcos Gonçalves Quiles
Beneficiário:Piero Andreeto Liduvino Ribeiro
Instituição Sede: Instituto de Ciência e Tecnologia (ICT). Universidade Federal de São Paulo (UNIFESP). Campus São José dos Campos. São José dos Campos , SP, Brasil
Assunto(s):Aprendizado semissupervisionado   Redes neurais   Aprendizado computacional
Palavra(s)-Chave do Pesquisador:Aprendizado Semissupervisionado | autoencoders | Predição de propriedades moleculares | Redes neurais | Aprendizado de máquina

Resumo

Conhecer as propriedades de um material é fundamental para avaliar sua aplicação. O estudo das propriedades pode ser realizado de diversas formas, desde a investigação teórica até a avaliação experimental do material em análise. No entanto, o tempo e o custo para avaliar um determinado material podem ser elevados, restringindo o processo de descoberta de novos materiais a uma pequena parcela do universo químico. Nos últimos anos, modelos de aprendizado de máquina têm sido amplamente utilizados para auxiliar nessa tarefa. Especificamente, a partir de dados previamente conhecidos, os modelos de aprendizado de máquina são treinados e posteriormente utilizados para avaliar novos materiais. Nesse cenário, propusemos em (1) um modelo de aprendizado de máquina baseado em redes Multilayer Perceptrons (MLP) para predição de diversas propriedades de moléculas contidas no repositório público QM9. Os resultados obtidos demonstraram que a abordagem é promissora e pode fornecer resultados precisos de predição, mesmo na ausência de informações geométricas das moléculas. Entretanto, o estudo considerou apenas um conjunto de dados e utilizou apenas técnicas supervisionadas, o que limita a aplicação do modelo a cenários em que o conjunto de treinamento é 100% rotulado. Visando avaliar a generalidade do modelo proposto em (1) e ampliar sua utilização para cenários em que o conjunto de treinamento pode conter exemplos não rotulados, iremos incorporar rotinas semissupervisionadas ao modelo e avaliar sua capacidade de predição com outros conjuntos de dados disponíveis na literatura.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)