Busca avançada
Ano de início
Entree

Agrupamento de dados em Fluxos Contínuos com Estimativa Automática do Número de Grupos

Processo: 10/15049-7
Modalidade de apoio:Bolsas no Brasil - Doutorado
Data de Início da vigência: 01 de janeiro de 2011
Data de Término da vigência: 31 de janeiro de 2014
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Eduardo Raul Hruschka
Beneficiário:Jonathan de Andrade Silva
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Bolsa(s) vinculada(s):12/10396-6 - Algoritmos evolutivos para agrupamento de dados em fluxos contínuos, BE.EP.DR
Assunto(s):Algoritmos evolutivos   Agrupamento de dados   Mineração de dados
Palavra(s)-Chave do Pesquisador:Agrupamento de Dados | Algoritmos Evolutivos | Data Stream | Mineração de Dados

Resumo

Técnicas de agrupamento de dados são comumente utilizadas para encontrar grupos, a princípio desconhecidos, em um conjunto de dados. Tais técnicas assumem que o conjunto de dados é de tamanho fixo e pode ser alocado na memória. Porém, um atual e importante desafio consiste em aplicar técnicas de agrupamento em bases de dados gerados continuamente e em ambientes dinâmicos. Dados gerados nessas condições originam o que se convencionou chamar de fluxo contínuo de dados (data stream em inglês). Em aplicações de fluxos contínuos de dados, operações de acesso aos dados são restritas a apenas uma ou poucas leituras, com limitações de memória e de tempo de processamento. Nesse sentido, algumas técnicas de agrupamento em fluxo contínuo de dados foram propostas na literatura. Muitas dessas técnicas são baseadas no algoritmo das K-médias. Porém, uma das limitações do algoritmo das K-médias consiste na definição prévia do número de grupos. Além disso, vários algoritmos de agrupamento propostos na literatura são avaliados por meio de critérios que são adequados apenas quando o número de grupos é fixo. Neste contexto, os principais objetivos desse projeto de doutorado consiste em: i) desenvolver e avaliar algoritmos para o agrupamento de dados gerados em fluxo contínuo que estimam automaticamente o número de grupos; ii) estudar critérios de validade para o desenvolvimento de uma metodologia para avaliação de algoritmos de agrupamento em fluxo contínuo de dados.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
SILVA, JONATHAN DE ANDRADE; HRUSCHKA, EDUARDO RAUL. A Support System for Clustering Data Streams with a Variable Number of Clusters. ACM TRANSACTIONS ON AUTONOMOUS AND ADAPTIVE SYSTEMS, v. 11, n. 2, . (10/15049-7)
SILVA, JONATHAN DE ANDRADE; HRUSCHKA, EDUARDO RAUL; GAMA, JOAO. An evolutionary algorithm for clustering data streams with a variable number of clusters. EXPERT SYSTEMS WITH APPLICATIONS, v. 67, p. 228-238, . (10/15049-7)
Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
SILVA, Jonathan de Andrade. Agrupamento de dados em fluxos contínuos com estimativa automática do número de grupos. 2015. Tese de Doutorado - Universidade de São Paulo (USP). Instituto de Ciências Matemáticas e de Computação (ICMC/SB) São Carlos.