Busca avançada
Ano de início
Entree

Análise multiparamétrica do problema das fases em cristalografia de proteínas por aprendizagem profunda

Processo: 18/23675-7
Linha de fomento:Bolsas no Brasil - Iniciação Científica
Vigência (Início): 01 de fevereiro de 2019
Vigência (Término): 31 de janeiro de 2020
Área do conhecimento:Ciências Biológicas - Bioquímica
Pesquisador responsável:Andre Luis Berteli Ambrosio
Beneficiário:Mateus Piovezan Otto
Instituição-sede: Instituto de Física de São Carlos (IFSC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Vinculado ao auxílio:13/07600-3 - CIBFar - Centro de Inovação em Biodiversidade e Fármacos, AP.CEPID
Assunto(s):Biologia estrutural   Aprendizado computacional   Cristalografia de proteínas

Resumo

O problema das fases é notório na cristalografia de proteínas por difração de raios X. Fundamentalmente, limitações tecnológicas inerentes aos sistemas de detecção dessa radiação resultam na perda de informações sobre as fases das ondas espalhadas construtivamente pelos componentes do cristal. Como consequência, o cálculo direto da função de distribuição de densidade eletrônica na cela unitária é impossibilitado. Atualmente, dois métodos experimentais podem ser aplicados para se contornar esse problema: (I) substituição parcial do solvente aquoso ordenado por íons elétron-densos (metálicos ou halogênicos) ou (II) quantificação seletiva do componente dispersivo (lambda-dependente) do fator de espalhamento atômico. Alternativamente, informações prévias, na forma de estruturas cristalinas conhecidas que são funcionalmente relacionadas ou homólogas a componentes no cristal, podem servir como fonte de um conjunto inicial de fases. Apesar de desafiadoras, quando viáveis, as aplicações desses diferentes métodos já possibilitaram a determinação de mais de uma centena de milhares de modelos atômicos, para as mais diversas proteínas (e seus complexos). Neste projeto, com base nesta coleção de informações estruturais já disponibilizadas no banco de dados \href{www.rcsb.org}{\textit{Protein Data Bank}}, propomos uma análise multiparamétrica do problema das fases, com base em aprendizagem de máquina profunda (ou aprendizado baseado em ensembles, como, por exemplo, florestas aleatórias). Nossa hipótese é a de que o mapeamento estatístico extensivo de observações sobre distribuições de fases conhecidas, como um modelo preditivo, pode permitir conclusões sobre o valor alvo de fases em conjuntos de dados ainda não resolvidos, eliminando assim a necessidade de experimentos adicionais ou de estruturas previamente conhecidas. Avanços recentes na área de aprendizado de máquinas, listados nesta proposta, têm permitido soluções de problemas antes considerados intransponíveis e, portanto, substanciam nossa proposta.

Mapa da distribuição dos acessos desta página
Para ver o sumário de acessos desta página, clique aqui.