Busca avançada
Ano de início
Entree

Criação e validação de um sistema integrado de análise de dados obtidos por sequenciamento de nova geração (NGS), utilizando a fibrose cística como modelo de estudo

Processo: 16/01022-6
Linha de fomento:Auxílio à Pesquisa - Pesquisa Inovativa em Pequenas Empresas - PIPE
Vigência: 01 de setembro de 2016 - 31 de maio de 2017
Área do conhecimento:Ciências Biológicas - Genética - Genética Humana e Médica
Pesquisador responsável:Patricia de Campos Pieri
Beneficiário:Patricia de Campos Pieri
Empresa:Pensabio Instrumentos de Biotecnologia Ltda
Município: São Paulo
Pesquisadores principais:Raul Torrieri
Pesq. associados: Antonio Marcondes Lerario ; Danuza Rossi
Assunto(s):Sequenciamento de nova geração  Análise genética  Fibrose cística  Análise de dados  Desenvolvimento de software  Sistemas integrados em larga escala 

Resumo

O sequenciamento de nova geração (NGS) vem revolucionando a análise genética e auxiliando na caracterização molecular de diversas doenças. No entanto, a análise da quantidade massiva de informação gerada em um único experimento tem sido uma limitação para a implementação de rotina laboratorial, ainda mais se em larga escala. As análises de NGS são geralmente realizadas em computadores de grande capacidade utilizando o sistema operacional Linux e softwares acadêmicos em prompts de comando. Apesar de extremamente flexíveis, as linhas de comando em Linux não são intuitivas, requerem conhecimento prévio e dão margem para erros. Essa realidade impõe enormes desafios à reprodutibilidade e rastreabilidade das análises realizadas. O objetivo deste projeto é criar e validar uma ferramenta computacional que integre cada uma das etapas e softwares necessários para análise completa de dados de NGS, utilizando o gene CFTR (associado à Fibrose Cística) como modelo. A ferramenta deverá permitir a sistematização das análises envolvendo múltiplas amostras, a rastreabilidade de todas as etapas, e a otimização dos recursos computacionais disponíveis. A escolha da Fibrose Cística (FC) como modelo nos motivou por ser uma doença grave e incurável, de alto custo terapêutico justificando políticas de rastreamento neonatal, com prognóstico tanto melhor quanto mais precoce seu diagnóstico. O diagnóstico da FC é clínico, mas exige confirmação pela identificação de mutações nos dois alelos ou pelo "teste do suor", que identifica apenas os casos típicos. Hoje o diagnóstico molecular disponível é baseado na investigação de um número limitado de mutações, cuja seleção impacta o poder de detecção em população etnicamente heterogênea como a brasileira, além de omitir variantes de relevância clínica reconhecida, como a VNTR intrônica TG(n)T(n), de difícil análise. O sequenciamento do gene CFTR inteiro pelo método tradicional de Sanger, padrão para identificação e confirmação de mutações, possui algumas limitações, como a necessidade de um grande número de reações de PCR para estudo integral do gene (~40-60 reações/amostra), análise trabalhosa e totalmente dependente de um técnico e custo elevado. A tecnologia de NGS supera essas dificuldades, permitindo sequenciar o gene todo de várias amostras em uma única corrida. Entretanto, esta tecnologia ainda impõe desafios quanto a análise dos dados, demonstrando a necessidade de um pipeline de bioinformática e uma ferramenta integrada, especialmente para análise das regiões VNTRs em múltiplas amostras. Assim, o desenvolvimento de um teste baseado em NGS que supere os desafios técnicos e clínicos impostos pelos ferramentas e recursos disponíveis hoje, e que seja passível de comercialização, é fundamental para a implementação das políticas de diagnóstico e rastreamento neonatal. Para tanto, é proposto neste projeto o desenvolvimento de um painel genético com alvo nos 27 exons do gene CFTR e sua região promotora, IVS22 e região TG(n)T(n). Os resultados do sequenciamento deste gene de 192 pacientes, obtidos no MiSeq (Illumina), serão usados para criação e validação de uma ferramenta de bioinformática integrada capaz de processar simultaneamente todos os dados gerando ao final um relatório de fácil interpretação. Sendo assim, este projeto de pesquisa pretende desenvolver, otimizar e validar um pipeline de análise capaz de fornecer "resultado em 1-click" não apenas para CFTR, mas que seja uma ferramenta diagnóstica para a sistematização de qualquer análise de dados de NGS. (AU)