Busca avançada
Ano de início
Entree

Agrupamento baseado em Wavelets para fluxos contínuos de dados.

Processo: 10/05062-6
Modalidade de apoio:Bolsas no Brasil - Doutorado
Vigência (Início): 01 de abril de 2011
Vigência (Término): 31 de outubro de 2013
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Rodrigo Fernandes de Mello
Beneficiário:Cássio Martini Martins Pereira
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Análise de ondaletas   Aprendizado computacional
Palavra(s)-Chave do Pesquisador:Agrupamento | conceitos emergentes | fluxos contínuos de dados | Wavelets | Aprendizado de Máquina

Resumo

Recentemente, os avanços tecnológicos aumentaram a capacidade de geração e captura de dados nos mais diversos setores da sociedade. Esses dados passaram a constituir fluxos contínuos, os quais precisam ser processados para que seja extraído conhecimento útil. Essa necessidade motivou a criação da área de mineração em fluxos contínuos de dados, que se diferencia por impor restrições à quantidade de memória e tempo disponíveis aos algoritmos, devido ao enorme volume de dados gerados de forma contínua. Em 2006, a Sociedade Brasileira de Computação (SBC) definiu cinco grandes desafios para a pesquisa em computação no Brasil até 2016. O primeiro desafio trata a gestão da informação em grandes volumes de dados, apontando que pesquisas nessa área podem auxiliar cenários de e-learning, e-gov, e-science e, também, no processamento de informações da TV digital, objeto de fortes investimentos do governo brasileiro. Algoritmos de agrupamento têm se mostrado uma abordagem atraente para análise de fluxos contínuos de dados, devido à sua capacidade de geração de modelos sem a necessidade de supervisão humana. Entretanto, os algoritmos existentes para agrupamento em fluxos contínuos consideram somente a similaridade entre padrões por meio de uma função de distância, definida no espaço métrico em que os dados se encontram. Este trabalho assume a hipótese de que analisando as frequências que compõem os padrões observados, por meio da transformada Wavelet, é possível melhor modelá-los. Nesse sentido, este projeto visa propor um novo agrupador para fluxos contínuos de dados, que considera não somente a distância entre padrões, mas também as frequências que os compõem. Espera-se obter, de maneira eficiente, uma melhor qualidade no agrupamento dos dados.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Matéria(s) publicada(s) em Outras Mídias (0 total):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
PEREIRA, CASSIO M. M.; DE MELLO, RODRIGO F.. TS-stream: clustering time series on data streams. JOURNAL OF INTELLIGENT INFORMATION SYSTEMS, v. 42, n. 3, p. 531-566, . (10/05062-6)
Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
PEREIRA, Cássio Martini Martins. Agrupamento de séries temporais em fluxos contínuos de dados. 2013. Tese de Doutorado - Universidade de São Paulo (USP). Instituto de Ciências Matemáticas e de Computação (ICMC/SB) São Carlos.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.