Busca avançada
Ano de início
Entree

Decodificando a linguagem da vida: Rumo à classificação e ao design de proteínas por meio de grandes modelos de linguagem

Processo: 24/10958-1
Modalidade de apoio:Bolsas no Brasil - Doutorado Direto
Data de Início da vigência: 01 de novembro de 2024
Situação:Interrompido
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:André Carlos Ponce de Leon Ferreira de Carvalho
Beneficiário:Breno Livio Silva de Almeida
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Empresa:Universidade de São Paulo (USP). Instituto de Ciências Matemáticas e de Computação (ICMC)
Vinculado ao auxílio:20/09835-1 - IARA - Inteligência Artificial Recriando Ambientes, AP.PCPE
Assunto(s):Anotação   Aprendizado computacional   Aprendizagem profunda   Biologia computacional
Palavra(s)-Chave do Pesquisador:anotação | Aprendizado de Máquina | Aprendizado profundo | bioinformática | bioinformática

Resumo

A compreensão da linguagem da vida, composta pelo DNA e sua tradução em aminoácidos, representa um desafio formidável para as metodologias tradicionais devido à sua complexidade inerente. Consequentemente, houve uma mudança notável no sentido de aproveitar os recursos das técnicas livres de alinhamento, especialmente as abordagens de aprendizado de máquina (AM). Entre elas, o aprendizado profundo, especificamente os grandes modelos de linguagem (LLMs), surgiu como uma ferramenta fundamental para decifrar a linguagem da genômica e da proteômica. Esses modelos são excelentes na classificação de sequências e na geração de novas sequências sem engenharia de características complexa e oferecem versatilidade e eficácia em tarefas como classificação de sequências de DNA e predição de estrutura de proteínas. Com sua arquitetura sofisticada e exposição a grandes quantidades de dados, LLMs podem apresentar habilidades emergentes, como o design de proteínas, ampliando sua utilidade além das tarefas linguísticas convencionais para revolucionar campos como biotecnologia e desenvolvimento de medicamentos. Além disso, a integração do aprendizado de máquina automatizado (AutoML), conhecido por simplificar as tarefas de AM, com os LLMs pode democratizar o acesso ao AM e aprimorar seus recursos. Ao utilizar do AutoML com LLMs, podemos reduzir as barreiras técnicas e aproveitar seu potencial combinado para recomendações, promovendo assim um ecossistema de AM mais inclusivo e eficiente. Nossa pesquisa defende a integração do AutoML com os LLMs e, ao mesmo tempo, investiga as condições favoráveis a uma propriedade emergente como o design de proteínas. Essas percepções prometem acelerar o desenvolvimento de modelos sofisticados de inteligência artificial adaptados explicitamente para a engenharia de proteínas, ampliando assim os limites da inovação biológica.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)