Busca avançada
Ano de início
Entree

Democratização do aprendizado de máquina em ciências da vida e anotação de famílias de proteínas

Processo: 24/03304-5
Modalidade de apoio:Bolsas no Brasil - Programa Capacitação - Treinamento Técnico
Data de Início da vigência: 01 de abril de 2024
Data de Término da vigência: 31 de outubro de 2024
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Kalinka Regina Lucas Jaquie Castelo Branco
Beneficiário:Breno Livio Silva de Almeida
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Vinculado ao auxílio:13/07375-0 - CeMEAI - Centro de Ciências Matemáticas Aplicadas à Indústria, AP.CEPID
Assunto(s):Anotação   Aprendizado computacional   Biologia computacional   Democratização   Proteínas
Palavra(s)-Chave do Pesquisador:anotação | Aprendizado de Máquina | bioinformática | democratização | proteína | bioinformática

Resumo

A democratização do uso da Inteligência Artificial (IA) tem surgido como uma prioridade em diversos campos, incluindo as ciências da vida. Este projeto propõe um avanço significativo nesse contexto ao focar na democratização do aprendizado de máquina e na anotação de famílias de proteínas, em parceria científica realizada com o Helmholtz Centre for Environmental Research - UFZ. O objetivo é tornar as ferramentas e técnicas de IA acessíveis a uma ampla gama de usuários, independentemente de sua experiência técnica ou dos recursos disponíveis. Especificamente nas ciências da vida, a democratização da IA pode acelerar a descoberta e a inovação, permitindo que pesquisadores e profissionais utilizem técnicas robustas de IA, mesmo sem um conhecimento avançado em programação ou análise de dados. O projeto propõe a criação de aplicações web de bioinformática como principal meio para alcançar esse objetivo. A aplicação web BioMetaExplorer irá se concentrar na classificação de RNA não-codificante e na disponibilização de sequências já anotadas. Esta abordagem permitirá que os pesquisadores identifiquem e classifiquem eficientemente os diferentes tipos de RNA não-codificante, contribuindo para uma compreensão mais abrangente do seu papel nos processos biológicos. Outra aplicação, desenvolvida para a ferramenta já existente BioAutoML, utilizará técnicas de Aprendizado de Máquina automatizado (AutoML) para recomendar o melhor modelo e características para a classificação. Além disso, o projeto se estenderá ao uso de Modelos de Linguagem Grandes (LLMs) para a anotação de famílias de proteínas. Esses modelos avançados de IA serão empregados para identificar e classificar famílias de proteínas com base em sequências de aminoácidos, oferecendo perspectivas valiosas para os pesquisadores na compreensão da estrutura e função das proteínas. Em suma, este projeto visa democratizar o acesso e o uso de técnicas avançadas de IA nas ciências da vida, promovendo a inovação e acelerando a descoberta científica. Ao disponibilizar ferramentas de análise acessíveis e eficientes, pretende-se capacitar uma ampla gama de usuários a explorar e compreender os complexos dados biológicos de maneira mais eficaz e abrangente.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)