Busca avançada
Ano de início
Entree

Aplicando a Técnica Perseus para Indexar Grandes Seqüências de Nucleotídeos

Processo: 09/15485-4
Linha de fomento:Bolsas no Brasil - Iniciação Científica
Vigência (Início): 01 de janeiro de 2010
Vigência (Término): 31 de dezembro de 2011
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Cristina Dutra de Aguiar Ciferri
Beneficiário:Felipe Alves da Louza
Instituição-sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Banco de dados

Resumo

Está sendo desenvolvido pelo grupo de pesquisa liderado pela orientadora deste projeto de iniciação científica o Perseus, uma nova técnica baseada em árvores de sufixo voltada à indexação de seqüencias de nucleotídeos. Perseus introduz os seguintes diferenciais: (i) estratégia de três passos: uma abordagem que garante a construção de árvores de sufixo persistentes cujos tamanhos podem exceder a capacidade da memória principal; (ii) construção guiada pelo usuário: um algoritmo que constrói árvores de sufixo por meio do particionamento destas árvores quando necessário. Além disto, esta construção também permite que o usuário escolha quais subseqüências de uma seqüência de nucleotídeos devem ser indexadas, de acordo com os requisitos particulares de suas aplicações; e (iii) casamento exato estendido: um algoritmo de casamento exato que permite a busca por uma seqüência de consulta em árvores de sufixo que podem estar particionadas.Este projeto de iniciação científica tem por objetivo propor e implementar extensões ao Perseus visando a aplicação desta técnica para indexar grandes seqüências de nucleotídeos. Mais detalhadamente, o projeto visa o desenvolvimento de uma estratégia para utilizar o Perseus quando o espaço em memória requerido para armazenar a seqüência sendo indexada é maior do que a capacidade da memória principal. O projeto também visa investigar a realização de consultas aproximadas sobre a extensão proposta, além de executar testes de desempenho que possibilitem a comparação do trabalho desenvolvido com trabalhos relacionados.