| Processo: | 10/15049-7 |
| Modalidade de apoio: | Bolsas no Brasil - Doutorado |
| Data de Início da vigência: | 01 de janeiro de 2011 |
| Data de Término da vigência: | 31 de janeiro de 2014 |
| Área de conhecimento: | Ciências Exatas e da Terra - Ciência da Computação |
| Pesquisador responsável: | Eduardo Raul Hruschka |
| Beneficiário: | Jonathan de Andrade Silva |
| Instituição Sede: | Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil |
| Bolsa(s) vinculada(s): | 12/10396-6 - Algoritmos evolutivos para agrupamento de dados em fluxos contínuos, BE.EP.DR |
| Assunto(s): | Algoritmos evolutivos Agrupamento de dados Mineração de dados |
| Palavra(s)-Chave do Pesquisador: | Agrupamento de Dados | Algoritmos Evolutivos | Data Stream | Mineração de Dados |
Resumo Técnicas de agrupamento de dados são comumente utilizadas para encontrar grupos, a princípio desconhecidos, em um conjunto de dados. Tais técnicas assumem que o conjunto de dados é de tamanho fixo e pode ser alocado na memória. Porém, um atual e importante desafio consiste em aplicar técnicas de agrupamento em bases de dados gerados continuamente e em ambientes dinâmicos. Dados gerados nessas condições originam o que se convencionou chamar de fluxo contínuo de dados (data stream em inglês). Em aplicações de fluxos contínuos de dados, operações de acesso aos dados são restritas a apenas uma ou poucas leituras, com limitações de memória e de tempo de processamento. Nesse sentido, algumas técnicas de agrupamento em fluxo contínuo de dados foram propostas na literatura. Muitas dessas técnicas são baseadas no algoritmo das K-médias. Porém, uma das limitações do algoritmo das K-médias consiste na definição prévia do número de grupos. Além disso, vários algoritmos de agrupamento propostos na literatura são avaliados por meio de critérios que são adequados apenas quando o número de grupos é fixo. Neste contexto, os principais objetivos desse projeto de doutorado consiste em: i) desenvolver e avaliar algoritmos para o agrupamento de dados gerados em fluxo contínuo que estimam automaticamente o número de grupos; ii) estudar critérios de validade para o desenvolvimento de uma metodologia para avaliação de algoritmos de agrupamento em fluxo contínuo de dados. | |
| Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa: | |
| Mais itensMenos itens | |
| TITULO | |
| Matéria(s) publicada(s) em Outras Mídias ( ): | |
| Mais itensMenos itens | |
| VEICULO: TITULO (DATA) | |
| VEICULO: TITULO (DATA) | |