Busca avançada
Ano de início
Entree

Clustering automático baseado em metaheurísticas inspiradas na natureza

Processo: 17/06142-2
Modalidade de apoio:Bolsas no Brasil - Iniciação Científica
Data de Início da vigência: 01 de junho de 2017
Data de Término da vigência: 31 de maio de 2018
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Adriane Beatriz de Souza Serapião
Beneficiário:Maynara Natalia Scoparo
Instituição Sede: Instituto de Geociências e Ciências Exatas (IGCE). Universidade Estadual Paulista (UNESP). Campus de Rio Claro. Rio Claro , SP, Brasil
Assunto(s):Inteligência computacional   Inteligência coletiva   Computação em cluster   Sistemas de gerenciamento de base de dados   Agrupamento de dados   Meta-heurística   Metodologia e técnicas de computação
Palavra(s)-Chave do Pesquisador:Clustering Automático | Inteligência Coletiva | Métodos de otimização bioinspirados | Inteligência Computacional

Resumo

O agrupamento de dados (data clustering) é uma das mais importantes técnicasnão supervisionadas de gerenciamento de dados, usada em muitas aplicações científicase de engenharia, tais como aprendizagem de máquina, mineração de dados,reconhecimento de padrões e processamento de imagem. Consiste em dividir umconjunto de dados em subconjunto menores, chamados de clusters. A partição doconjunto é obtida através do estabelecimento de uma função que atribua os objetos doconjunto de dados em cada subconjunto, de modo que os objetos semelhantes entre sifiquem no mesmo cluster. Um problema fundamental na análise de clustering édeterminar a melhor estimativa do número de clusters, que é conhecido como problemade clustering automático. A dificuldade na escolha do número de clusters adequadodeve-se à falta de conhecimento prévia do domínio da aplicação, especialmente quandoos dados têm muitas dimensões, quando os clusters diferem amplamente em forma,tamanho e densidade e quando existe sobreposição entre os grupos. Neste projeto, trêsalgoritmos de Inteligência Coletiva serão utilizados para o problema de clusteringautomático em conjuntos de dados numéricos. Tais algoritmos serão desenvolvidos paraotimizar critérios de divisão, usando medidas de clusterização, a fim de encontrar onúmero ótimo de clusters e as coordenadas de seus centroides. Os métodos deotimização bioinspirados Whale Optimization Algorithm, Cuckoo Search e Cat SwarmOptimization serão adaptados para efetuar o agrupamento utilizando a abordagem departicionamento. Para a avaliação dos resultados destes algoritmos para o clusteringautomático serão usados índices de validação internos e externos.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)