Busca avançada
Ano de início
Entree

Aplicando a Técnica Perseus para Indexar Grandes Seqüências de Nucleotídeos

Processo: 09/15485-4
Modalidade de apoio:Bolsas no Brasil - Iniciação Científica
Data de Início da vigência: 01 de janeiro de 2010
Data de Término da vigência: 31 de dezembro de 2011
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Cristina Dutra de Aguiar
Beneficiário:Felipe Alves da Louza
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Banco de dados
Palavra(s)-Chave do Pesquisador:Árvores de Sufixo | bancos de dados biológicos | Sequencias de Nucleotídeos | Banco de Dados

Resumo

Está sendo desenvolvido pelo grupo de pesquisa liderado pela orientadora deste projeto de iniciação científica o Perseus, uma nova técnica baseada em árvores de sufixo voltada à indexação de seqüencias de nucleotídeos. Perseus introduz os seguintes diferenciais: (i) estratégia de três passos: uma abordagem que garante a construção de árvores de sufixo persistentes cujos tamanhos podem exceder a capacidade da memória principal; (ii) construção guiada pelo usuário: um algoritmo que constrói árvores de sufixo por meio do particionamento destas árvores quando necessário. Além disto, esta construção também permite que o usuário escolha quais subseqüências de uma seqüência de nucleotídeos devem ser indexadas, de acordo com os requisitos particulares de suas aplicações; e (iii) casamento exato estendido: um algoritmo de casamento exato que permite a busca por uma seqüência de consulta em árvores de sufixo que podem estar particionadas.Este projeto de iniciação científica tem por objetivo propor e implementar extensões ao Perseus visando a aplicação desta técnica para indexar grandes seqüências de nucleotídeos. Mais detalhadamente, o projeto visa o desenvolvimento de uma estratégia para utilizar o Perseus quando o espaço em memória requerido para armazenar a seqüência sendo indexada é maior do que a capacidade da memória principal. O projeto também visa investigar a realização de consultas aproximadas sobre a extensão proposta, além de executar testes de desempenho que possibilitem a comparação do trabalho desenvolvido com trabalhos relacionados.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)