Busca avançada
Ano de início
Entree

Processamento de consultas analíticas em ambientes computacionais paralelos e distribuídos

Processo: 18/10607-3
Linha de fomento:Bolsas no Brasil - Mestrado
Vigência (Início): 01 de abril de 2019
Vigência (Término): 30 de junho de 2020
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Cristina Dutra de Aguiar Ciferri
Beneficiário:Guilherme Muzzi da Rocha
Instituição-sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Banco de dados   Data warehouse

Resumo

O processamento de consultas analíticas, ou consultas OLAP (on-line analytical processing), é considerado significantemente custoso, devido ao grande volume de dados armazenados no data warehouse e ao fato dessas consultas realizarem a junção-estrela. Esse processamento pode ser beneficiado pelo uso de ambientes computacionais com grande capacidade de armazenamento e de processamento, tais como clusters de computadores e ambientes de computação em nuvem. Nesses ambientes, existe o emprego de paradigmas de programação paralela e distribuída, como o framework Spark. Na literatura, existem diversos trabalhos que investigam o processamento da junção em ambientes paralelos e distribuídos, incluindo a junção-estrela. Entretanto, no melhor de nosso conhecimento, nenhum desses trabalhos investiga especificamente a melhoria de desempenho no processamento da junção-estrela considerando consultas OLAP drill-down, roll-up e drill-across. Essas consultas são de grande importância porque elas são comumente requisitadas na obtenção de informações estratégicas. Adicionalmente, elas possuem características específicas, necessitando, portanto, de otimizações específicas. Este projeto de mestrado tem como objetivo suprir essa lacuna existente na literatura, por meio da proposta de soluções voltadas ao processamento eficiente de consultas OLAP drill-down, roll-up e drill-across, considerando o framework Spark.