Busca avançada
Ano de início
Entree

Invariância à complexidade em classificação, agrupamento e descoberta de motifs em séries temporais

Processo: 12/07295-3
Linha de fomento:Auxílio à Pesquisa - Regular
Vigência: 01 de julho de 2012 - 30 de junho de 2014
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Gustavo Enrique de Almeida Prado Alves Batista
Beneficiário:Gustavo Enrique de Almeida Prado Alves Batista
Instituição-sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Pesq. associados:Eamonn John Keogh ; Ronaldo Cristiano Prati ; Solange Oliveira Rezende
Auxílios(s) vinculado(s):13/50379-6 - Research on geo-spatial marine biology data mining using time series, text mining and visualization, AP.R
Assunto(s):Inteligência artificial  Aprendizado computacional  Algoritmos  Invariantes  Análise de séries temporais 

Resumo

Há recentemente um crescente interesse no processamento de séries temporais devido a grande quantidade de domínios de aplicação que geram dados com essa característica. Esse interesse pode ser medido pela vasta quantidade de métodos recentemente propostos na literatura para tarefas como classificação, agrupamento, sumarização, detecção de anomalias e descoberta de motifs. Estudos recentes têm mostrado que para muitos problemas, os métodos baseados em similaridade apresentam uma eficácia difícil de ser superada, mesmo por métodos mais sofisticados. Isso se deve em grande parte pelo fato de que a comunidade tem estudado e proposto diversas invariâncias para medidas de distância entre séries temporais. As invariâncias fazem com que as medidas de distância ignorem determinadas características indesejadas dos dados. O exemplo mais conhecido é a invariância às diferenças locais na escala de tempo, obtida pela técnica de warping. Outras invariâncias incluem a invariância às diferenças de amplitude e offset, fase e oclusão. Recentemente foi demonstrado à comunidade científica que métodos de classificação de séries temporais por similaridade podem ser muito beneficiados por uma nova invariância: invariância à complexidade. O principal objetivo deste projeto de pesquisa é investigar novas medidas de distância invariantes à complexidade e avaliar o quanto essas medidas podem melhorar a eficácia, sobretudo de algoritmos de agrupamento e descoberta de motifs. (AU)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
PRATI, RONALDO C.; BATISTA, GUSTAVO E. A. P. A.; SILVA, DIEGO F. Class imbalance revisited: a new experimental setup to assess the performance of treatment methods. KNOWLEDGE AND INFORMATION SYSTEMS, v. 45, n. 1, p. 247-270, OCT 2015. Citações Web of Science: 48.
BATISTA, GUSTAVO E. A. P. A.; KEOGH, EAMONN J.; TATAW, OBEN MOSES; DE SOUZA, VINICIUS M. A. CID: an efficient complexity-invariant distance for time series. DATA MINING AND KNOWLEDGE DISCOVERY, v. 28, n. 3, p. 634-669, MAY 2014. Citações Web of Science: 76.
SILVA, DIEGO FURTADO; ALVES DE SOUZA, VINICIUS MOURAO; PRADO ALVES BATISTA, GUSTAVO ENRIQUE DE ALMEIDA. A comparative study between MFCC and LSF coefficients in automatic recognition of isolated digits pronounced in Portuguese and English. ACTA SCIENTIARUM-TECHNOLOGY, v. 35, n. 4, p. 621-628, 2013. Citações Web of Science: 2.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.