Busca avançada
Ano de início
Entree

Desenvolvimento de técnicas eficientes para busca por similaridade atendendo ao interesse do usuário em SGBDRs

Processo: 12/08128-3
Linha de fomento:Bolsas no Brasil - Pós-Doutorado
Vigência (Início): 01 de novembro de 2012
Vigência (Término): 30 de junho de 2015
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Caetano Traina Junior
Beneficiário:Mônica Ribeiro Porto Ferreira
Instituição-sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Banco de dados

Resumo

Os Sistemas de Gerenciamento de Bases de Dados Relacionais (SGBDR) foram criados para o armazenamento de grandes volumes de dados, visando garantir que os dados possam ser recuperados de maneira eficiente. Três técnicas são empregadas pelos SGBDR atuais para executar os comandos de consulta com elevada eficiência: reescrita de consultas, estruturas de indexação e reestruturação dos dados. No entanto, essas técnicas têm sido desenvolvidas apenas para os domínios de dados escalares. Dados mais complexos, tais como imagens, textos longos ou sequências temporais têm ainda pouco respaldo por parte dos SGBDR disponíveis. De fato, as técnicas desenvolvidas durante mais de 40 anos para os dados escalares, na maioria, não podem ser estendidas para tratar dados complexos e, assim, um grande esforço está sendo empreendido por muitos pesquisadores em todo o mundo visando desenvolver as técnicas necessárias. O GBdI tem participado ativamente desses esforços, e a própria candidata, em seu programa de doutorado, vem atuando nesse sentido. Este projeto visa avançar essas pesquisas abordando um tópico que tem grande influência para obter ganhos de desempenho significativos, mas que até agora tem sido pouco abordado na literatura: o desenvolvimento de técnicas de busca que combinam predicados sobre atributos complexos em operadores de busca por similaridade e atributos escalares em operadores de busca por igualdade ou operadores relacionais. Para isso, serão estudadas e desenvolvidas novas estruturas que permitam indexar atributos complexos sujeitos a buscas por similaridade e atributos escalares na mesma estrutura, os chamados "Índices Híbridos". Essas estruturas serão usadas em conjunto com estruturas de acesso puramente métrico já existentes (e em parte desenvolvidas no GBdI) e, com o auxílio de propriedades algébricas e modelos de estimativa de seletividade e custo desenvolvidas pela candidata em seu programa de doutorado, deverão contribuir para tornar mais eficiente a recuperação de buscas por similaridade em dados complexos, fechando um protótipo para incluir consultas por similaridade em um SGBDR que pela primeira vez explora todas as frentes de técnicas para executar com eficiência tais consultas.