Busca avançada
Ano de início
Entree

Avaliação de técnicas de junção por similaridade em fluxos de dados: estudo de caso na análise financeira

Processo: 17/21512-0
Linha de fomento:Bolsas no Brasil - Iniciação Científica
Vigência (Início): 01 de fevereiro de 2018
Vigência (Término): 30 de novembro de 2018
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Robson Leonardo Ferreira Cordeiro
Beneficiário:Matheus Araujo Jorge
Instituição-sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Vinculado ao auxílio:16/17078-0 - Mineração, indexação e visualização de Big Data no contexto de sistemas de apoio à decisão clínica (MIVisBD), AP.TEM
Assunto(s):Banco de dados   Análise de dados   Fluxo de dados   Finanças

Resumo

Dados os preços de ações de diversas empresas em bolsas de valores ao longo do tempo, como identificar empresas emergentes (start-ups) com comportamento similar ao estágio inicial de desenvolvimento de empresas já consolidadas, com foco no auxílio à previsão de comportamento futuro? É possível usar junções por similaridade para ajudar a solucionar o problema? A junção por similaridade é uma das principais ferramentas de suporte à análise, compreensão e extração de conhecimento a partir dos grandes volumes de dados complexos gerados por diversas aplicações reais, como, por exemplo, coleções de imagens de exames na medicina ou de impressões digitais em sistemas de segurança, grafos em escala Web, entre muitos outros. Devido à sua importância, a literatura atual inclui inúmeros trabalhos sobre a junção por similaridade, entretanto, infelizmente, quase todos são voltados à análise de conjuntos de dados estáticos. Por outro lado, assim como no exemplo em bolsas de valores, muitas aplicações reais coletam/geram dados em um processo contínuo e potencialmente infinito, no qual são registrados repetitivamente valores de atributos de interesse seguindo intervalos de tempo determinados ou indeterminados por dependerem de atos de usuários. Os dados resultantes são conhecidos como fluxos de dados multidimensionais. A junção por similaridade em tais dados é hoje restrita se comparada ao estado-da-arte para dados estáticos, visto que são raras as soluções existentes, e diversos problemas ainda estão em aberto, por exemplo, limitações de eficiência e a inexistência de estudos comparativos de tipo survey entre os poucos algoritmos encontrados na literatura. O presente projeto de Iniciação Científica foca-se em diminuir este problema por meio do estudo e da comparação de algoritmos de junção por similaridade em fluxos de dados multidimensionais, com ênfase na análise de dados em finanças. (AU)

Mapa da distribuição dos acessos desta página
Para ver o sumário de acessos desta página, clique aqui.