Busca avançada
Ano de início
Entree

Strategies for genotype imputation in composite beef cattle

Processo: 15/14455-5
Modalidade de apoio:Auxílio à Pesquisa - Publicações científicas - Artigo
Data de Início da vigência: 01 de setembro de 2015
Data de Término da vigência: 29 de fevereiro de 2016
Área do conhecimento:Ciências Agrárias - Zootecnia - Genética e Melhoramento dos Animais Domésticos
Pesquisador responsável:Danísio Prado Munari
Beneficiário:Danísio Prado Munari
Instituição Sede: Faculdade de Ciências Agrárias e Veterinárias (FCAV). Universidade Estadual Paulista (UNESP). Campus de Jaboticabal. Jaboticabal , SP, Brasil
Assunto(s):Polimorfismo de um único nucleotídeo 
Palavra(s)-Chave do Pesquisador:Canchim breed | crossbred cattle | genomic data | low-density panels | single nucleotide polymorphism | Melhoramento Genético de bovinos de corte

Resumo

A imputação é um método em que marcadores de uma população genotipada com painéis de baixa densidade (LD) são inferidos utilizando informações provenientes de uma população referência genotipada com painéis HD. O objetivo deste trabalho foi comparar em diferentes cenários metodologias de imputação de marcadores moleculares de polimorfismos de nucleotídeos únicos (SNP) em bovinos de corte da raça Canchim. Foram utilizadas informações de 285 animais da raça Canchim, 114 do grupo genético "MA" e 1 touro da raça Charolês genotipados com painel Illumina BovineHD BeadChip (786.799 SNP), nascidos entre 1999 e 2005 e provenientes da base de dados genômicos da Embrapa Pecuária Sudeste, São Carlos, SP. A edição dos dados foi realizada no software R e em linguagem C++. Para a frequência mínima de alelos (MAF) foram aplicados 3 diferentes critérios: sem remover MAF (QC1); SNP com MAF menor que 0,0025 (QC2) e menor que 0,10 (QC3) foram excluídos. O painel HD original foi reduzido para painéis de baixa densidade (LD) 3K, 6K, 9K, 50K, 20K, 80K e 90K, selecionando os marcadores em comum entre o painel HD original e os painéis comerciais Illumina Bovine3K (3K), BovineLD (6K), GeneSeek Genomic Profiler (GGP) Beef LD (9K), BovineSNP50 (50K), GGP Indicus LD (20K) ,GGP Beef HD (80K) e GGP Indicus HD (90K). Os animais foram divididos em diferentes cenários, denominados de população referência e imputação, sendo o cenário 1 (C1): População referência formada por animais nascidos de 1999 até 2004 e população de imputação composta por animais nascidos em 2005; Cenário 2; C2A : População referência formada pelos animais do grupo genético Canchim e população de imputação pelos animais do grupo genético MA; C2B: População referência composta pelos animais do grupo genético MA e a população de imputação por animais Canchim; C2C: População referência composta por animais Canchim e do grupo genético MA (nascidos até 2004) e população de imputação formada por animais nascidos em 2005 do grupo genético MA.; C2D: População referência constituída por animais MA e Canchim (nascidos até 2004) e a população de imputação composta por animais Canchim nascidos em 2005; Cenário 3; C3A: População referência composta pelos machos e a de imputação pelas 204 fêmeas (155 Canchim e 49 MA); C3B: População referência formada pelos machos e fêmeas nascidas até 2004 e a de imputação constituída somente pelas fêmeas nascidas em 2005. A imputação dos genótipos foi realizada pelo método baseado na população utilizando desequilíbrio de ligação entre marcadores pelo programa FImpute v2.2 e pelo programa BEAGLE v3.3.2. A acurácia de imputação foi estimada por meio da taxa de concordância e pelo quadrado da correlação alélica (R2 alélico). A aplicação dos critérios para MAF (QC1, QC2 e QC3) no controle de qualidade do SNP não apresentou ganhos em acurácia de imputação. A acurácia de imputação de LD para HD pela taxa de concordância variou de 56 a 98% e o R2 alélico de 0,25 a 0,96 utilizando o FImpute. Pelo software BEAGLE a variação foi de 50 a 96% pela taxa de concordância e de 0,17 a 0,94 pelo R2 alélico. Para os cenários propostos, o mais eficiente em termos de acurácia foi o C3B. Considerando possível aplicação deste estudo na seleção genômica para esta população, o painéis LD mais adequados para a genotipagem seriam o de 80K e 90K. O tempo de execução para realização da imputação pelo software FImpute foi de 20 a 100 vezes menor em relação ao software BEAGLE. A aplicação de restrição de MAF no controle de qualidade dos dados avaliados não é necessária para análises de imputação. Os painéis 80K e 90K podem ser acuradamente imputados para o painel HD na raça Canchim. Para obtenção de melhores acurácias de imputação animais Canchim e do grupo genético MA devem ser considerados juntos na população referência. O algoritmo do software FImpute demonstrou maior eficiência na imputação dos marcadores. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)