Busca avançada
Ano de início
Entree


Análise de dados por imputação de sequenciamento de baixa cobertura: Seleção de marcadores e genética populacional.

Texto completo
Autor(es):
Marcus Vinicius Niz Alvarez
Número total de Autores: 1
Tipo de documento: Dissertação de Mestrado
Imprenta: Botucatu. 2020-05-19.
Instituição: Universidade Estadual Paulista (Unesp). Instituto de Biociências. Botucatu
Data de defesa:
Orientador: Paulo Eduardo Martins Ribolla
Resumo

Introdução: O desenvolvimento de estratégias para redução no custo do sequenciamento de genoma completo (WGS) é importante para projetos que demandam por grandes quantidades de amostras. Uma estratégia de baixo custo é o sequenciamento de baixa cobertura aliado a técnicas de imputação para genotipagem eficiente e de confiabilidade adequada. A malária é uma das principais doenças transmitidas por artrópodes no mundo e o Brasil é considerado um país com alta incidência de malária, principalmente na região Amazônica, sendo principal vetor o mosquito Anopheles darlingi. Objetivo: O objetivo do presente estudo foi desenvolver estratégia para analisar dados de WGS de baixa cobertura de mosquitos Anopheles darlingi coletados no município de Mâncio Lima no Acre e verificar associação entre dados genéticos e dados de importância epidemiológica, tais como comportamento de picada, horário de atividade e distanciamento em escala microgeográfica. Materiais e métodos: Amostras de mosquitos Anopheles darlingi foram coletadas no município de Mâncio Lima - AC, entre 2016 e 2017. As bibliotecas foram preparadas com Nextera™ XT e sequenciadas no NextSeq500 da Illumina. Foi realizado genotipagem por sequenciamento e aplicado imputação. Estudos de associação ampla do genoma foram realizados com comportamento de picada e horário de atividade. Sinais de estratificação na população foram investigados por FST amplo no genoma e teste de permutação para significância. Resultados: Sinais fracos porém significativos para estratificação foram encontrados considerando distâncias de 2 a 3 km entre os grupos. Associações significativas foram observadas entre comportamento de picada e polimorfismos de nucleotídeo único (SNP), principalmente SNPs adjacentes ao gene Cyp450. Associações significativas foram observadas entre horário de atividade e SNPs adjacente aos genes timeless-2 e rdgC. Conclusões: A utilização de dados de WGS de baixa cobertura aliado à imputação de dados é uma estratégia viável para redução do custo em projetos de sequenciamento genômico com grandes quantidades de amostras. Os resultados das análises de estratificação sustentam a hipótese de que a população de Anopheles darlingi está em processo de estratificação genética em escala microgeográfica no município de Mâncio Lima. Os resultados dos estudos de associação ampla genômica sugerem que SNPs significativos para comportamento de picada podem estar associados a genes de resistência de inseticidas e SNPs significativos para horário de atividade sugerem associação com genes relacionados a regulação do ciclo circadiano. (AU)