Busca avançada
Ano de início
Entree

Análise de dados gerados pela Rede de Diversidade Genética Viral (VGDN)

Processo: 05/04054-1
Modalidade de apoio:Bolsas no Brasil - Programa Capacitação - Treinamento Técnico
Data de Início da vigência: 01 de dezembro de 2005
Data de Término da vigência: 31 de março de 2007
Área de conhecimento:Ciências Biológicas - Microbiologia
Pesquisador responsável:Paolo Marinho de Andrade Zanotto
Beneficiário:Marco Aurélio Corsini Baccaro
Instituição Sede: Instituto de Ciências Biomédicas (ICB). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Vinculado ao auxílio:00/04205-6 - Projeto VIRGEN - Viral Genetic Diversity Network (VGDN), AP.R
Assunto(s):Biologia computacional   Banco de dados   Análise de dados   Diversidade genética   Vírus
Palavra(s)-Chave do Pesquisador:bioinformática | blast | cluster | paralelização | Bioinformática

Resumo

A rede VGDN vem gerando muitas sequências de HIV e HCV. Estas sequências estão sendo submetidas via internet por um sistema validador desenvolvido e mantido no LEMB (Laboratório de Evolução Molecular e Bioinformática). Estas são analisadas fazendo uso de scripts baseados em funções do programa Phredphrap, uma vez analisadas e avaliadas quanto as suas qualidades, são aceitas e então armazenadas em um banco de dados próprio, para cada vírus. Serão geradas também outras novas sequências de vírus respiratórios e Hantavírus que passarão pelo mesmo processo de validação e armazenamento. Devido ao número elevado de sequências existentes, se faz necessária a implementação de ferramentas computacionais, tanto hardwares quanto softwares, para otimizar e agilizar o processo de análise dos dados, tornando-se possível analisar uma quantidade elevada de sequencias em um curto período de tempo. O projeto em questão visa a elaboração, montagem, implantação e implementação de um cluster de computadores, que consiste em vários computadores configurados para executar várias partes de um código em computadores diferentes (este processo é chamado de paralelização), como também será implantado um sistema do tipo cluster e códigos que utilizarão toda a capacidade computacional deste sistema, com a finalidade de analisar vários aspectos e padrões das sequencias acima mencionadas. A primeira etapa do projeto consiste na montagem e implantação do sistema de computação que é formado por 17 computadores com processadores Opteron de núcleo duplo (dual core) que tem o desempenho aproximado de dois processadores em apenas um, totalizando 36 núcleos. A segunda etapa do projeto será a implementação dos códigos já existentes, que serão otimizados, quando isso for possível, e estarão disponíveis para a rede VGDN realizar análises nos dados gerados em suas tarefas. A terceira etapa será o desenvolvimento de ferramentas para análise dos dados da VGDN que não existem ou que não estejam otimizadas para analisar dados em grande quantidade. Estas ferramentas irão ser criadas a partir da necessidade da rede. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)