Busca avançada
Ano de início
Entree

Proposta de um índice biológico persistente baseado em vetores de sufixo generalizados

Processo: 11/15423-9
Linha de fomento:Bolsas no Brasil - Mestrado
Vigência (Início): 01 de março de 2012
Vigência (Término): 31 de dezembro de 2013
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Cristina Dutra de Aguiar Ciferri
Beneficiário:Felipe Alves da Louza
Instituição-sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Bolsa(s) vinculada(s):13/01752-6 - Vetores de sufixo e montagem de genomas, BE.EP.MS
Assunto(s):Banco de dados   Recuperação da informação   Biologia computacional

Resumo

Com o avanço tecnológico, a quantidade de dados biológicos (ou seja, sequências de DNA e de proteínas) coletados, armazenados em bancos de dados biológicos (BDBs) e disponíveis para análise tem aumentado exponencialmente. Desde que diversos avanços na medicina têm sido obtidos por meio de pesquisa por similaridade em sequências biológicas, surge o desafio de pesquisar eficientemente esses BDBs muito volumosos. Para auxiliar essas pesquisas, existem os índices e, dentro do contexto de bioinformática, o vetor de sufixo é uma estrutura de dados muito utilizada na proposta de índices para aplicações que envolvem pesquisa por similaridade em sequências biológicas. Desafios relacionados ao uso de vetores de sufixo referem-se à construção do vetor de sufixo para grandes sequências de entrada, o armazenamento e a manipulação eficiente de sua estrutura de dados em memória secundária (ou seja, disco), e a indexação de conjuntos de sequências biológicas por meio de vetores de sufixo generalizados. Na literatura, trabalhos correlatos que usam vetores de sufixo para a indexação de sequências biológicas apresentam limitações que motivam o desenvolvimento de novas pesquisas. Por um lado, trabalhos que usam vetores de sufixo generalizados são direcionados apenas à memória primária e, portanto, não vislumbram o armazenamento persistente do vetor de sufixo em disco. Por outro lado, trabalhos voltados à manipulação de vetores de sufixo em disco vislumbram uma melhor organização do índice para diminuir números de acesso a disco, porém eles não enfocam vetores de sufixo generalizados. Essas limitações motivam o desenvolvimento deste projeto de mestrado, o qual tem por objetivo propor um novo índice biológico persistente baseado em vetores de sufixo generalizados. O índice a ser desenvolvido, portanto, avança no estado da arte da pesquisa em indexação em BDBs de forma a preencher essa lacuna existente na literatura. (AU)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
LOUZA, FELIPE A.; TELLES, GUILHERME P.; HOFFMANN, STEVE; CIFERRI, CRISTINA D. A. Generalized enhanced suffix array construction in external memory. Algorithms for Molecular Biology, v. 12, DEC 7 2017. Citações Web of Science: 3.
Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
LOUZA, Felipe Alves da. Um algoritmo para a construção de vetores de sufixo generalizados em memória externa. 2013. Dissertação de Mestrado - Universidade de São Paulo (USP). Instituto de Ciências Matemáticas e de Computação São Carlos.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.