| Processo: | 24/10958-1 |
| Modalidade de apoio: | Bolsas no Brasil - Doutorado Direto |
| Data de Início da vigência: | 01 de novembro de 2024 |
| Situação: | Interrompido |
| Área de conhecimento: | Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação |
| Pesquisador responsável: | André Carlos Ponce de Leon Ferreira de Carvalho |
| Beneficiário: | Breno Livio Silva de Almeida |
| Instituição Sede: | Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil |
| Empresa: | Universidade de São Paulo (USP). Instituto de Ciências Matemáticas e de Computação (ICMC) |
| Vinculado ao auxílio: | 20/09835-1 - IARA - Inteligência Artificial Recriando Ambientes, AP.PCPE |
| Assunto(s): | Anotação Aprendizado computacional Aprendizagem profunda Biologia computacional |
| Palavra(s)-Chave do Pesquisador: | anotação | Aprendizado de Máquina | Aprendizado profundo | bioinformática | bioinformática |
Resumo A compreensão da linguagem da vida, composta pelo DNA e sua tradução em aminoácidos, representa um desafio formidável para as metodologias tradicionais devido à sua complexidade inerente. Consequentemente, houve uma mudança notável no sentido de aproveitar os recursos das técnicas livres de alinhamento, especialmente as abordagens de aprendizado de máquina (AM). Entre elas, o aprendizado profundo, especificamente os grandes modelos de linguagem (LLMs), surgiu como uma ferramenta fundamental para decifrar a linguagem da genômica e da proteômica. Esses modelos são excelentes na classificação de sequências e na geração de novas sequências sem engenharia de características complexa e oferecem versatilidade e eficácia em tarefas como classificação de sequências de DNA e predição de estrutura de proteínas. Com sua arquitetura sofisticada e exposição a grandes quantidades de dados, LLMs podem apresentar habilidades emergentes, como o design de proteínas, ampliando sua utilidade além das tarefas linguísticas convencionais para revolucionar campos como biotecnologia e desenvolvimento de medicamentos. Além disso, a integração do aprendizado de máquina automatizado (AutoML), conhecido por simplificar as tarefas de AM, com os LLMs pode democratizar o acesso ao AM e aprimorar seus recursos. Ao utilizar do AutoML com LLMs, podemos reduzir as barreiras técnicas e aproveitar seu potencial combinado para recomendações, promovendo assim um ecossistema de AM mais inclusivo e eficiente. Nossa pesquisa defende a integração do AutoML com os LLMs e, ao mesmo tempo, investiga as condições favoráveis a uma propriedade emergente como o design de proteínas. Essas percepções prometem acelerar o desenvolvimento de modelos sofisticados de inteligência artificial adaptados explicitamente para a engenharia de proteínas, ampliando assim os limites da inovação biológica. | |
| Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa: | |
| Mais itensMenos itens | |
| TITULO | |
| Matéria(s) publicada(s) em Outras Mídias ( ): | |
| Mais itensMenos itens | |
| VEICULO: TITULO (DATA) | |
| VEICULO: TITULO (DATA) | |