Busca avançada
Ano de início
Entree

Modelos de CNN informados por física para pontuar interações proteína-ligante

Processo: 23/13721-0
Modalidade de apoio:Bolsas no Exterior - Pesquisa
Data de Início da vigência: 12 de agosto de 2024
Data de Término da vigência: 31 de julho de 2025
Área de conhecimento:Ciências Biológicas - Biofísica - Biofísica Molecular
Pesquisador responsável:Alessandro Silva Nascimento
Beneficiário:Alessandro Silva Nascimento
Pesquisador Anfitrião: Alan Aspuru-Guzik
Instituição Sede: Instituto de Física de São Carlos (IFSC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Instituição Anfitriã: University of Toronto (U of T), Canadá  
Palavra(s)-Chave do Pesquisador:Machine-Learning | Protein-ligand interactions | scoring ligand interactions | Structural Biology | Structural biology

Resumo

O impacto recente da biologia estrutural dos métodos de aprendizado de máquina tornou-se evidente nos últimos anos, quando AlphaFold2 e RosettaFold alcançaram precisão experimental para a modelagem de estruturas de proteínas. Além disso, a equipe do AlphaFold2 não apenas divulgou o programa para a comunidade, mas também fez as previsões para quase todo o banco de dados UNIPROT de sequências de proteínas. Neste ponto, uma pergunta interessante que se pode fazer é: como essa enorme quantidade de dados pode ser usada para maiores avanços científicos e tecnológicos? Modelos estruturais há muito são usados para a descoberta/modelagem de compostos capazes de modular a função de macromoléculas. Neste projeto de pesquisa BPE, propomos a aplicação de um modelo de aprendizado profundo que pode aprender com as propriedades físicas calculadas a partir das coordenadas 3D de uma estrutura macromolecular experimental ou de um modelo preciso. O modelo proposto recebe características estruturais computadas no espaço 3D, como o potencial eletrostático e o potencial de Lennard-Jones, por exemplo, calculado para uma estrutura de proteína em grades 3D discretas. A hipótese fundamental é que modelos precisos de aprendizado profundo podem distinguir poses incorretas de ligantes em uma grade discreta da mesma forma que podem distinguir objetos em fotos, por exemplo. Para isso, grades 3D serão geradas com o programa LiBELa, desenvolvido em nosso grupo, para calcular grades de complexos proteína-ligante do conjunto de dados PDBBind, bem como do conjunto de dados CrossDocked2020 de Koes. Como saídas para o modelo, prevemos a possibilidade de pontuar e ranquear complexos proteína-ligante e, no limite, usar essa pontuação para realmente docar ligantes com maior precisão e execução mais eficiente do que o tradicional docking de ligantes. O projeto será desenvolvido no grupo Aspuru-Guzik. Seu grupo é um grupo líder na área de aprendizado de máquina e computação quântica e um dos principais objetivos do projeto envolve o treinamento deste proponente nas técnicas de aprendizado de máquina no grupo de Aspuru-Guzik.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)