Busca avançada
Ano de início
Entree

Proposta de um índice biológico persistente baseado em vetores de sufixo generalizados

Processo: 11/15423-9
Modalidade de apoio:Bolsas no Brasil - Mestrado
Data de Início da vigência: 01 de março de 2012
Data de Término da vigência: 31 de dezembro de 2013
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Cristina Dutra de Aguiar
Beneficiário:Felipe Alves da Louza
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Bolsa(s) vinculada(s):13/01752-6 - Vetores de sufixo e montagem de genomas, BE.EP.MS
Assunto(s):Banco de dados   Recuperação da informação   Biologia computacional
Palavra(s)-Chave do Pesquisador:bancos de dados biológicos | índices | vetores de sufixo generalizados | vetores de sufixo para disco | Banco de Dados

Resumo

Com o avanço tecnológico, a quantidade de dados biológicos (ou seja, sequências de DNA e de proteínas) coletados, armazenados em bancos de dados biológicos (BDBs) e disponíveis para análise tem aumentado exponencialmente. Desde que diversos avanços na medicina têm sido obtidos por meio de pesquisa por similaridade em sequências biológicas, surge o desafio de pesquisar eficientemente esses BDBs muito volumosos. Para auxiliar essas pesquisas, existem os índices e, dentro do contexto de bioinformática, o vetor de sufixo é uma estrutura de dados muito utilizada na proposta de índices para aplicações que envolvem pesquisa por similaridade em sequências biológicas. Desafios relacionados ao uso de vetores de sufixo referem-se à construção do vetor de sufixo para grandes sequências de entrada, o armazenamento e a manipulação eficiente de sua estrutura de dados em memória secundária (ou seja, disco), e a indexação de conjuntos de sequências biológicas por meio de vetores de sufixo generalizados. Na literatura, trabalhos correlatos que usam vetores de sufixo para a indexação de sequências biológicas apresentam limitações que motivam o desenvolvimento de novas pesquisas. Por um lado, trabalhos que usam vetores de sufixo generalizados são direcionados apenas à memória primária e, portanto, não vislumbram o armazenamento persistente do vetor de sufixo em disco. Por outro lado, trabalhos voltados à manipulação de vetores de sufixo em disco vislumbram uma melhor organização do índice para diminuir números de acesso a disco, porém eles não enfocam vetores de sufixo generalizados. Essas limitações motivam o desenvolvimento deste projeto de mestrado, o qual tem por objetivo propor um novo índice biológico persistente baseado em vetores de sufixo generalizados. O índice a ser desenvolvido, portanto, avança no estado da arte da pesquisa em indexação em BDBs de forma a preencher essa lacuna existente na literatura. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
LOUZA, FELIPE A.; TELLES, GUILHERME P.; HOFFMANN, STEVE; CIFERRI, CRISTINA D. A.. Generalized enhanced suffix array construction in external memory. Algorithms for Molecular Biology, v. 12, . (11/23904-7, 17/09105-0, 11/15423-9)