Busca avançada
Ano de início
Entree

Abordagem baseada na estabilidade de algoritmos de agrupamento de dados para garantir a detecção de mudanças de conceito em fluxos de dados

Processo: 14/13323-5
Modalidade de apoio:Auxílio à Pesquisa - Regular
Vigência: 01 de outubro de 2014 - 30 de setembro de 2016
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Sistemas de Computação
Pesquisador responsável:Rodrigo Fernandes de Mello
Beneficiário:Rodrigo Fernandes de Mello
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Pesquisadores associados:Ricardo Araújo Rios
Assunto(s):Aprendizado computacional  Algoritmos  Agrupamento de dados  Fluxo de dados 
Palavra(s)-Chave do Pesquisador:Estabilidade de algoritmos de agrupamento de dados | fluxos de dados | Aprendizado de Máquina

Resumo

Diversos processos industriais, científicos e comerciais produzem dados continuamente, em grande volume e em alta velocidade, denominados fluxos de dados. Na área de Aprendizado de Máquina são realizadas pesquisas para modelar e analisar o comportamento desses fluxos, a fim de compreender o fenômeno que os produziu. Em diversos cenários, esses fluxos de dados alteram seus comportamentos ao longo do tempo, o que são tidos na literatura como mudanças de conceito. É de grande importância detectar essas mudanças, pois elas permitem compreender melhor o fenômeno em estudo. Muitos trabalhos realizam essa tarefa supondo que (i) os dados são rotulados e/ou (ii) desconsiderando as relações temporais na produção dos dados - suposições difíceis de serem afirmadas sobre fluxos de dados. Este plano de pesquisa propõe um método para detectar mudanças de conceito em fluxos de dados não rotulados, considerando a dependência temporal intrínseca às observações que compõem tais conjuntos. Inicialmente os dados do fluxo serão organizados em janelas ou trechos consecutivos ao longo do tempo. Cada janela será decomposta em seus componentes estocástico e determinístico por meio dos métodos Empirical Mode Decomposition e Recurrence Quantification Analysis, sendo então modelados com o propósito de remover dependências temporais entre os dados. Em seguida, por meio de um algoritmo de agrupamento de dados estável, cada janela será agrupada, produzindo dendrogramas. Por fim, esses dendrogramas serão comparados por meio da distância de Gromov-Hausdorff com o intuito de identificar as divergências entre essas janelas consecutivas de dados, evidenciando mudanças de conceito. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Matéria(s) publicada(s) em Outras Mídias (0 total):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas (10)
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
FERREIRA, MARTHA DAIS; CORREA, DEBORA CRISTINA; GRIVET, MARCOS ANTONIO; DOS SANTOS, GEOVAN TAVARES; DE MELLO, RODRIGO FERNANDES; NONATO, LUIS GUSTAVO. On Accuracy and Time Processing Evaluation of Cover Song Identification Systems. JOURNAL OF NEW MUSIC RESEARCH, v. 45, n. 4, p. 333-342, . (11/22749-8, 14/13323-5, 12/17961-0)
VALLIM, ROSANE M. M.; DE MELLO, RODRIGO F.. Unsupervised change detection in data streams: an application in music analysis. PROGRESS IN ARTIFICIAL INTELLIGENCE, v. 4, n. 1-2, p. 1-10, . (14/13323-5, 13/16480-1)
FERREIRA, MARTHA DAIS; CORREA, DEBORA CRISTINA; NONATO, LUIS GUSTAVO; DE MELLO, RODRIGO FERNANDES. Designing architectures of convolutional neural networks to solve practical problems. EXPERT SYSTEMS WITH APPLICATIONS, v. 94, p. 205-217, . (11/22749-8, 14/13323-5, 12/17961-0)
DA COSTA, FAUSTO G.; DUARTE, FELIPE S. L. G.; VALLIM, ROSANE M. M.; DE MELLO, RODRIGO F.. Multidimensional surrogate stability to detect data stream concept drift. EXPERT SYSTEMS WITH APPLICATIONS, v. 87, p. 15-29, . (14/21636-3, 14/13323-5)
RIOS, RICARDO ARAUJO; DE MELLO, RODRIGO FERNANDES. Applying Empirical Mode Decomposition and mutual information to separate stochastic and deterministic influences embedded in signals. Signal Processing, v. 118, p. 159-176, . (14/13323-5, 09/18293-9)
DA COSTA, F. G.; RIOS, R. A.; DE MELLO, R. F.. Using dynamical systems tools to detect concept drift in data streams. EXPERT SYSTEMS WITH APPLICATIONS, v. 60, p. 39-50, . (14/13323-5)
PEREIRA, CASSIO M. M.; DE MELLO, RODRIGO F.. Persistent homology for time series and spatial data clustering. EXPERT SYSTEMS WITH APPLICATIONS, v. 42, n. 15-16, p. 6026-6038, . (14/13323-5, 13/04453-0)
PEREIRA, CASSIO M. M.; DE MELLO, RODRIGO F.. PTS: Projected Topological Stream clustering algorithm. Neurocomputing, v. 180, n. SI, p. 16-26, . (14/13323-5, 13/04453-0)
PAGLIOSA, LUCAS DE CARVALHO; DE MELLO, RODRIGO FERNANDES. Semi-supervised time series classification on positive and unlabeled problems using cross-recurrence quantification analysis. PATTERN RECOGNITION, v. 80, p. 53-63, . (15/22406-4, 14/13323-5)
PAGLIOSA, LUCAS DE CARVALHO; DE MELLO, RODRIGO FERNANDES. Applying a kernel function on time-dependent data to provide supervised-learning guarantees. EXPERT SYSTEMS WITH APPLICATIONS, v. 71, p. 216-229, . (15/22406-4, 14/13323-5)

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.