Advanced search
Start date
Betweenand

Detection of natural selection patterns in Native American populations using machine learning approach

Grant number: 21/12238-8
Support Opportunities:Scholarships in Brazil - Technical Training Program - Technical Training
Start date: December 01, 2021
End date: May 31, 2022
Field of knowledge:Biological Sciences - Genetics - Human and Medical Genetics
Principal Investigator:Tábita Hünemeier
Grantee:Marcos Araújo Castro e Silva
Host Institution: Instituto de Biociências (IB). Universidade de São Paulo (USP). São Paulo , SP, Brazil
Associated research grant:15/26875-9 - Native American genome diversity, AP.JP

Abstract

Genes ou regiões genômicas que foram alvo de seleção natural, em geral, tem associações fenotípicas relevantes, visto que, em algum momento da evolução, conferiram vantagem evolutiva a uma população. Exemplos importantes são os genes que conferem adaptação à altitude (Jacovas et al., 2018), e o gene associado à produção permanente de lactase (Itan et al., 2009). Acredita-se também que muitas doenças complexas, como diabetes e hipertensão, estejam associadas a genes que no passado conferiram vantagem evolutiva, mas que, com mudanças nas pressões seletivas (melhores condições de saúde, vida mais sedentária, com maior ingestão de calorias e açúcares), conferem maior susceptibilidade a essas doenças (Di Rienzo 2006). A detecção de uma assinatura de seleção natural no genoma pode ser feita através de métodos estatísticos que buscam por desvios entre padrões observados e esperados de variabilidade no DNA em torno dos loci selecionados. Além disso, uma estratégia alternativa que vem sendo aplicada de forma eficiente (Flagel et al., 2018) é procurar por padrões indicativos de seleção natural em sequências genômicas utilizando aprendizado de máquina. Aqui, um algoritmo recebe exemplos de regiões genômicas sob seleção e sob neutralidade, e aprende as regras que distinguem essas duas classes de sequências. O conjunto de regras que o algoritmo aprende é chamado de modelo. Tendo-se esse modelo, é possível então testar se uma nova região genômica de interesse será classificada como pertencendo a uma ou outra classe. Acredita-se que a estratégia de aprendizado de máquina seja mais eficiente na identificação de regiões sob seleção natural uma vez que não tem o viés de estatísticas pré-definidas e, por isso, consegue detectar padrões inerentes da sequência bruta. Dessa forma, o objetivo principal deste projeto é desenvolver modelos de aprendizado de máquina capazes de detectar assinaturas de seleção natural no genoma de populações nativas americanas sequenciadas pelo presente projeto. (AU)

News published in Agência FAPESP Newsletter about the scholarship:
More itemsLess items
Articles published in other media outlets ( ):
More itemsLess items
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)