| Processo: | 17/25674-5 |
| Modalidade de apoio: | Bolsas no Exterior - Estágio de Pesquisa - Doutorado |
| Data de Início da vigência: | 31 de março de 2018 |
| Data de Término da vigência: | 27 de março de 2019 |
| Área de conhecimento: | Ciências Agrárias - Agronomia |
| Pesquisador responsável: | Antonio Augusto Franco Garcia |
| Beneficiário: | Jhonathan Pedroso Rigal dos Santos |
| Supervisor: | Michael Allen Gore |
| Instituição Sede: | Escola Superior de Agricultura Luiz de Queiroz (ESALQ). Universidade de São Paulo (USP). Piracicaba , SP, Brasil |
| Instituição Anfitriã: | Cornell University, Estados Unidos |
| Vinculado à bolsa: | 17/03625-2 - Desenvolvimento de modelos genético-estatísticos temporais de seleção genômica via redes bayesianas: uma aplicação em sorgo, BP.DR |
| Assunto(s): | Melhoramento genético vegetal Sorghum |
| Palavra(s)-Chave do Pesquisador: | Dynamic Bayesian Networks | Genomic selection | high-throughput phenotyping | Plant breeding | Prediction | Sorghum | Melhoramento genético vegetal |
Resumo O sorgo é uma cultura bioenergética que contém várias características úteis para o aumento da eficiência de produção de bioenergia em sistemas agrícolas. Em Seleção Genômica (SG), a fenotipagem em larga escala ao longo da safra apresenta uma estrutura de correlação temporal ainda não explorada por modelos genéticos. Redes Bayesianas Dinâmicas (RBD) é uma abordagem estatística idealizada para aprender padrões ao longo do tempo. RBD conectam o relacionamento entre pontos no tempo utilizando variáveis representadas por nós, e flechas para relacioná-los. Neste projeto objetiva-se propor uma RBD para explorar padrões de correlação genética temporal desencadeados por genes com expressão contínua ao longo do tempo, especialmente para predição de conteúdo de biomassa antes do fim da safra. Dados fenotípicos de várias características serão coletadas por sensores visuais, térmicos, de reflectância multi-espectral, e outros integrados com uma plataforma em desenvolvimento chamada TERRA-MEP. O caráter principal fenotipado será biomassa, e suas medidas serão refinadas utilizando outros caracteres correlacionados obtidos pelos sensores. Espera-se a coleta de ~180 milhões de dados fenotípicos antes da colheita. Dados genômicos serão obtidos via Genotipagem-por-sequenciamento (GBS) em um painel composto por 2500 acessos de sorgo, delineados para representar o pool gênico global da espécie. Imputação de dados genotípicos perdidos serão realizados utilizando dados de sequenciamento de um núcleo representativo de todo painel. Single Nucleotide Polymorphisms (SNPs) funcionais serão selecionados utilizando os resultados obtidos pela técnica Differential Nuclease Sensitivity Chromatin Profiling. Após imputação e filtragem, espera-se a coleta de ~300.000 SNPs funcionais. Essa etapas serão realizados pelo colaborador Dr. Michael Gore da Cornell University. O laboratório de Genética Estatística irá desenvolver uma abordagem de Seleção Genômica em dois estágios para predizer biomassa de linhagens de sorgo antes do fim da safra. Utilizando modelos Multivariados Mistos Lineares para a análise de primeiro estágio, médias ajustadas livres de efeitos experimentais serão obtidas pela modelagem da variabilidade ambiental observada no campo dentro e entre parcelas por meio de correções contra variáveis espaciais e variações climáticas. O banco de dados será reduzido para 2500 médias ajustadas dentro de cada ponto no tempo. Os marcadores funcionais serão compactados utilizando a abordagem de bins artificiais. A matriz de bins será derivada utilizando a codificação do modelo de Cockerham. As RBDs foram delineadas para mapear o efeito dos genéticos dos bins com relação condicional ao efeito exibido anteriormente no tempo. Para fins comparativos, o modelo tradicional de seleção genômica de Regressão Linear Bayesiana (RLB) foi ajustado no conjunto de dados públicos, e seus resultados serviram como de referência para cenários em que não há aprendizado ao longo do tempo. Com dados públicos, alguns resultados mostram que a RBD pode aumentar em até 4X a acurácia preditiva quando comparado aos obtidos com o modelo de RLB. Acredita-se que a metodologia descrita neste relatório apresenta um forte potencial para se tornar uma abordagem padrão de SG para conjuntos Big Data coletados ao longo do tempo. | |
| Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa: | |
| Mais itensMenos itens | |
| TITULO | |
| Matéria(s) publicada(s) em Outras Mídias ( ): | |
| Mais itensMenos itens | |
| VEICULO: TITULO (DATA) | |
| VEICULO: TITULO (DATA) | |