Busca avançada
Ano de início
Entree

Desenvolvimento e otimização de protocolos e ferramentas em bioinformática através de técnicas de computação de alto desempenho para uso no processamento de dados biológicos de larga escala

Processo: 16/04204-8
Linha de fomento:Bolsas no Brasil - Doutorado
Vigência (Início): 01 de novembro de 2016
Vigência (Término): 31 de agosto de 2020
Área do conhecimento:Ciências da Saúde - Medicina - Clínica Médica
Pesquisador responsável:Iscia Teresinha Lopes Cendes
Beneficiário:Wélliton de Souza
Instituição-sede: Faculdade de Ciências Médicas (FCM). Universidade Estadual de Campinas (UNICAMP). Campinas , SP, Brasil
Vinculado ao auxílio:13/07559-3 - Instituto Brasileiro de Neurociência e Neurotecnologia - BRAINN, AP.CEPID
Assunto(s):Sequenciamento de nova geração   Biologia computacional   Computação de alto desempenho

Resumo

O sequenciamento de alto rendimento tornou-se a principal ferramenta para estudos genéticos nos últimos 5 anos. Com o barateamento da tecnologia de sequenciamento, novos investimentos estão sendo realizados em projetos de grandes proporções. O aumento exponencial do volume de dados de sequenciamento gerou novos desafios para a computação. A área da computação de alto desempenho propõe soluções capazes de processar grandes volumes de dados em tempos reduzidos. Com a evolução dessa área, novas arquiteturas, como a computação em nuvem e a computação heterogênea, surgiram. A computação em nuvem busca tirar vantagens da conectividade com a internet para fornecer serviços de baixo custo. A computação heterogênea, por sua vez, combina computadores de alto desempenho com dispositivos especializados em processar rapidamente grandes volumes de dados. Para obter os benefícios dessas novas soluções na área de bioinformática, é necessário desenvolver ferramentas e protocolos otimizados para novas arquiteturas computacionais. Além da capacidade de analisar conjuntos de dados genéticos cada vez maiores, é necessário desenvolver novos métodos para integração de resultados de diferentes estudos. Assim, este projeto pretende desenvolver ferramentas e protocolos automatizados (pipelines) para processamento de dados de sequenciamento de nova geração, contemplando estudos de epigenética, transcriptômica e genômica. Os resultados dos estudos serão integrados em conjunto com bancos públicos de informação genômica. Acreditamos que a área de computação de alto desempenho será o padrão nos estudos de -ômicas em poucos anos. Deste modo, desejamos nos antecipar contribuindo de maneira positiva nesta área de conhecimento e gerando ferramentas que poderão ser utilizadas rotineiramente nas análises supracitadas. Este trabalho também auxiliará no desenvolvimento da própria área de computação de alto desempenho, uma vez que terá impacto na popularização do uso dessa tecnologia.