Busca avançada
Ano de início
Entree

Aumentando a Reprodutibilidade dos Resultados de Análises de Avaliação Genética pelo Desenvolvimento de Funções de Formatação dos Dados no Software R

Processo: 24/10028-4
Modalidade de apoio:Auxílio à Pesquisa - Regular
Data de Início da vigência: 01 de novembro de 2024
Data de Término da vigência: 31 de outubro de 2026
Área do conhecimento:Ciências Agrárias - Zootecnia - Genética e Melhoramento dos Animais Domésticos
Pesquisador responsável:Ricardo da Fonseca
Beneficiário:Ricardo da Fonseca
Instituição Sede: Faculdade de Ciências Agrárias e Tecnológicas. Universidade Estadual Paulista (UNESP). Campus de Dracena. Dracena , SP, Brasil
Bolsa(s) vinculada(s):24/19452-3 - Desenvolvimento de Funções para Formatação de Arquivos de Fenótipos e Pedigrees para Análises Genéticas no Software Wombat, BP.IC
Assunto(s):Avaliação genética  Programação  Avaliação genética animal 
Palavra(s)-Chave do Pesquisador:avaliação genética | estimação de parâmetros genéticos | programação | Software R | Avaliação Genética Animal

Resumo

Recentemente, o conceito de reprodutibilidade dos resultados científicos têm ganhado importância e práticas para garanti-la vem sendo implementadas nas mais importantes revistas científicas, as quais passaram a exigir o depósito, junto com o artigo, dos dados utilizados e, em alguns poucos casos, dos scripts e rotinas utilizados nos procedimentos de análise. Especificamente na etapa de formatação dos dados para os softwares de avaliação genética, a automação é possível e contribuirá com a minimização de erros na preparação e a garantia de padronização dessa etapa, aumentando as chances da reprodutibilidade dos resultados finais por outros grupos de pesquisa. A formatação dos dados de acordo com o padrão exigido pelo software pode, para alguns casos, possuir muitas regras e demandar bastante tempo e atenção para ser realizada. Erros nessa etapa podem ter como consequência, a existência de vários arquivos para um mesmo conjunto de dados sendo trabalhado por diferentes equipes. Nesse cenário, a reprodutibilidade dos resultados está comprometida, uma vez que os resultados deverão ser diferentes para os mesmos dados e análises, não permitindo a comprovação dos resultados. Para que os pesquisadores possam investir a maior parte do seu tempo na interpretação dos resultados, para que os inconvenientes da formatação dos arquivos sejam minimizados e os resultados saiam de forma consistente e com qualidade, o desenvolvimento de funções de conversão dos arquivos de dados do formato bruto para o formato demandado pelo software de análise será de grande ajuda. Além disso, a padronização dos procedimentos de formatação, realizado por essas funções, aumentarão as possibilidades de reprodutibilidade dos resultados, e, ao mesmo tempo, tornarão o uso do software mais simples e eficiente. O objetivo do trabalho será desenvolver funções para conversão de arquivos em formato bruto para os formatos dos três softwares mais populares atualmente entre a comunidade científica: BLUPF90, ASREML e Wombat. O pacote a ser desenvolvido se constituirá em uma biblioteca de funções de conversão de arquivos (dados fenotípicos e pedigree) a partir de um formato básico para o formato exigido por softwares específicos para estudos genéticos e genômicos. As funções serão desenvolvidas utilizando somente os recursos disponíveis no próprio R e seus pacotes. Inicialmente, nenhuma função será construída em C++ (ou outra linguagem) e envelopada dentro de uma função do R. Posteriormente, as funções desenvolvidas serão transformadas em um pacote do R. Para os softwares escolhidos serão desenvolvidas funções para formatar os arquivos de fenótipos e de pedigree para análises uni e multi-características. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)