Busca avançada
Ano de início
Entree

Uma abordagem em 5D para o cálculo de estrutura de proteínas

Processo: 17/22465-6
Linha de fomento:Auxílio à Pesquisa - Regular
Vigência: 01 de maio de 2018 - 30 de abril de 2020
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Matemática da Computação
Pesquisador responsável:Carlile Campos Lavor
Beneficiário:Carlile Campos Lavor
Instituição-sede: Instituto de Matemática, Estatística e Computação Científica (IMECC). Universidade Estadual de Campinas (UNICAMP). Campinas , SP, Brasil
Assunto(s):Elementos estruturais de proteínas 

Resumo

O cálculo da estrutura 3D de uma molécula de proteína, utilizando distâncias entre átomos próximos provenientes de experimentos de Ressonância Magnética Nuclear (RMN), é um problema fundamental relacionado ao complexo e custoso processo de desenvolvimento de novas drogas pela indústria farmacêutica. O problema é NP-difícil, conhecido na literatura por Molecular Distance Geometry Problem (MDGP). Diferentemente dos métodos tradicionais (baseados em otimização contínua), estamos trabalhando em um modelo combinatório, baseado em propriedades de rigidez do grafo associado ao problema (cada vértice está relacionado a um átomo da proteína e quando a distância é conhecida entre dois átomos, definimos uma aresta entre os respectivos vértices, com peso dado pelo valor da distância). Resolver o MDGP é obter uma imersão do grafo no espaço 3D, de tal maneira que as distâncias euclidianas calculadas entre pares de átomos sejam iguais aos pesos das arestas correspondentes. Considerando que as distâncias dos experimentos de RMN são valores precisos, a abordagem combinatória permite que o espaço de busca do problema seja representado por uma árvore binária, onde um método exato, tipo Branch & Prune (BP), é definido para explorar a árvore em busca de soluções, conectadas por simetrias que caracterizam cada instância do MDGP. A primeira tentativa de generalizar esses resultados, incluindo as incertezas dos dados experimentais (com as distâncias sendo representadas por valores "intervalares"), foi considerar amostras nos intervalos associados. Essa ideia tornou o algoritmo BP uma heurística, já que não se pode mais garantir que uma solução será encontrada. Amostras refinadas aumentam exponencialmente o espaço de busca (a árvore associada deixa de ser binária) e, mesmo assim, a solução pode ser "perdida" caso a distância correta esteja entre os valores selecionados pelo processo de amostragem. Para manter as propriedades da abordagem combinatória e, ao mesmo tempo, considerar as distâncias intervalares dos dados experimentais, estamos propondo representar a molécula de proteína em um espaço de 5 dimensões (o Espaço Conforme), utilizando uma linguagem mais poderosa do que a Álgebra Linear: a Álgebra Geométrica (também chamada de Álgebra de Clifford). O Modelo Conforme pode ser visto como uma extensão do Modelo Projetivo, que utiliza coordenadas homogêneas (4 dimensões), muito utilizado em problemas de geometria computacional. Pelo caráter interdisciplinar dessa proposta, além de uma colaboração já iniciada com pesquisadores de instituições francesas (École Polytechnique, Institut Pasteur e Université de Rennes 1), contaremos também com a participação de pesquisadores da University of Colorado, University of Cambridge e Universitat Politècnica de Catalunya. (AU)