Busca avançada
Ano de início
Entree

Análise multiparamétrica do problema das fases em cristalografia de proteínas por aprendizagem profunda

Processo: 18/23675-7
Modalidade de apoio:Bolsas no Brasil - Iniciação Científica
Data de Início da vigência: 01 de fevereiro de 2019
Data de Término da vigência: 31 de janeiro de 2020
Área de conhecimento:Ciências Biológicas - Bioquímica
Pesquisador responsável:Andre Luis Berteli Ambrosio
Beneficiário:Mateus Piovezan Otto
Instituição Sede: Instituto de Física de São Carlos (IFSC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Vinculado ao auxílio:13/07600-3 - CIBFar - Centro de Inovação em Biodiversidade e Fármacos, AP.CEPID
Assunto(s):Biologia estrutural   Aprendizado computacional   Cristalografia de proteínas
Palavra(s)-Chave do Pesquisador:Aprendizagem de Maquina | Cristalografia de Proteínas | Problema das fases | Biologia estrutural

Resumo

O problema das fases é notório na cristalografia de proteínas por difração de raios X. Fundamentalmente, limitações tecnológicas inerentes aos sistemas de detecção dessa radiação resultam na perda de informações sobre as fases das ondas espalhadas construtivamente pelos componentes do cristal. Como consequência, o cálculo direto da função de distribuição de densidade eletrônica na cela unitária é impossibilitado. Atualmente, dois métodos experimentais podem ser aplicados para se contornar esse problema: (I) substituição parcial do solvente aquoso ordenado por íons elétron-densos (metálicos ou halogênicos) ou (II) quantificação seletiva do componente dispersivo (lambda-dependente) do fator de espalhamento atômico. Alternativamente, informações prévias, na forma de estruturas cristalinas conhecidas que são funcionalmente relacionadas ou homólogas a componentes no cristal, podem servir como fonte de um conjunto inicial de fases. Apesar de desafiadoras, quando viáveis, as aplicações desses diferentes métodos já possibilitaram a determinação de mais de uma centena de milhares de modelos atômicos, para as mais diversas proteínas (e seus complexos). Neste projeto, com base nesta coleção de informações estruturais já disponibilizadas no banco de dados \href{www.rcsb.org}{\textit{Protein Data Bank}}, propomos uma análise multiparamétrica do problema das fases, com base em aprendizagem de máquina profunda (ou aprendizado baseado em ensembles, como, por exemplo, florestas aleatórias). Nossa hipótese é a de que o mapeamento estatístico extensivo de observações sobre distribuições de fases conhecidas, como um modelo preditivo, pode permitir conclusões sobre o valor alvo de fases em conjuntos de dados ainda não resolvidos, eliminando assim a necessidade de experimentos adicionais ou de estruturas previamente conhecidas. Avanços recentes na área de aprendizado de máquinas, listados nesta proposta, têm permitido soluções de problemas antes considerados intransponíveis e, portanto, substanciam nossa proposta.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)