Busca avançada
Ano de início
Entree

Desenvolvimento de Métodos Avançados de Inferência de Ancestralidade Genética Local com Foco em Alelos Raros nas Populações Brasileiras

Processo: 24/15110-0
Modalidade de apoio:Bolsas no Brasil - Doutorado
Data de Início da vigência: 01 de março de 2025
Data de Término da vigência: 31 de agosto de 2027
Área de conhecimento:Ciências Biológicas - Genética - Genética Humana e Médica
Pesquisador responsável:Tábita Hünemeier
Beneficiário:Jose Franklin Calderon Tantalean
Instituição Sede: Instituto de Biociências (IB). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Assunto(s):Aprendizagem profunda   Genética populacional   Transferência de aprendizado de máquina   Genômica populacional
Palavra(s)-Chave do Pesquisador:Admixed populations | autoencoders | deep neural networks | Local ancestry inference (LAI) | population genetics | Transfer Learning | Genômica Populacional

Resumo

A inferência de ancestralidade local (LAI) é essencial para compreender a diversidade genética e as dinâmicas populacionais em populações miscigenadas. Eventos históricos como migração, colonização e escravidão criaram um mosaico de linhagens ancestrais, complicando o estudo de associações genéticas com doenças. Métodos como análise de componentes principais (PCA) e admixture mapping são necessários para inferir essas relações genéticas com maior precisão. Ferramentas de LAI, incluindo modelos baseados em Hidden Markov Models (HMM) e técnicas de aprendizado de máquina, evoluíram significativamente, com exemplos notáveis como SABER, HAPMIX, MOSAIC, LAMP e WINPOP. Inovações recentes, como RFMix, LAI-Net e SALAI-Net, melhoraram a precisão do LAI. Redes neurais convolucionais (CNNs) e aprendizado por transferência fornecem soluções robustas para dados genéticos diversos, enquanto autoencoders ajudam na redução de dimensionalidade e na captura de informações genéticas complexas. No entanto, desafios permanecem na inferência de ancestralidade em eventos de miscigenação antigos ou em populações estreitamente relacionadas. Para abordar esses desafios, vão se explorar as Redes Neurais Profundas Aumentadas por Autoencoder (AADNNs) e outros métodos avançados para melhorar a precisão da LAI em regiões com alelos raros. O autoencoder será treinado em dados genômicos brasileiros, particularmente do projeto "DNA do Brasil" (DNABR), que abrange 2.723 indivíduos das cinco regiões geográficas do Brasil, sequenciados para Whole Genome Sequence (WGS). Esses dados, sequenciados com a tecnologia Illumina NovaSeq 6000 a uma cobertura de 35X, serão compactados para alimentar uma rede neural profunda com camadas convolucionais para extração de características, camadas recorrentes (LSTM ou GRU) para aprendizado de sequências e camadas densas para a classificação de ancestralidade. Os resultados contribuirão significativamente para o cenário genômico brasileiro, avançando a genética médica e a saúde pública ao facilitar a identificação precisa de fatores de risco genético e apoiar o desenvolvimento de abordagens de medicina personalizada. Além disso, proporcionarão uma compreensão mais profunda dos padrões de miscigenação e fluxos migratórios históricos, melhorando a eficácia de estratégias preventivas e terapêuticas adaptadas às características genéticas da população brasileira.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)