Busca avançada
Ano de início
Entree

Clustering automático bioinspirado em enxames

Processo: 17/14930-0
Linha de fomento:Auxílio à Pesquisa - Regular
Vigência: 01 de dezembro de 2017 - 30 de novembro de 2018
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Adriane Beatriz de Souza Serapião
Beneficiário:Adriane Beatriz de Souza Serapião
Instituição-sede: Instituto de Geociências e Ciências Exatas (IGCE). Universidade Estadual Paulista (UNESP). Campus de Rio Claro. Rio Claro, SP, Brasil
Assunto(s):Inteligência computacional  Inteligência coletiva  Agrupamento de dados  Mineração de dados 

Resumo

Os algoritmos de agrupamento de dados (data clustering) dividem dados em grupos (clusters) significativos, de modo que os padrões no mesmo grupo são semelhantes de algum modo e os padrões em diferentes grupos são distintos do mesmo modo. A procura de clusters envolve a aprendizagem não supervisionada, na qual não se conhece previamente a que grupo os dados pertencem. O agrupamento particional tenta decompor os dados em um conjunto de grupos disjuntos através de uma função critério que envolve minimizar alguma medida de não similaridade dos objetos dentro de cada cluster enquanto maximiza a não similaridade dos diferentes grupos. O problema de clustering pode ser visto como um problema de otimização que localiza os centróides ótimos dos clusters ao invés de encontrar a partição ótima. A maior parte dos algoritmos particionais de clustering necessita que o número de clusters seja fornecido como parâmetro para a solução. Entretanto, em problemas do mundo real este valor não é conhecido previamente. No clustering automático, a identificação da quantidade ideal de clusters faz parte do problema. A descoberta de conhecimento, incluindo a tarefa de clustering, é um dos grandes desafios da Analítica da Internet das Coisas. Neste projeto, seis algoritmos de Inteligência Coletiva são utilizados para o clustering automático e aplicados a conjuntos de dados numéricos. Tais algoritmos serão desenvolvidos para encontrar o número ideal de clusters e a sua solução correspondente (coordenadas dos centróides), através da otimização de critérios de divisão baseados em medidas da qualidade dos clusters. Os algoritmos bioinspirados Particle Swarm Optimization, Gray Wolf Optimization, Enhanced Fish School Search, Whale Optimization Algorithm, Cuckoo Search e Cat Swarm Optimization serão adaptados para efetuar o agrupamento particional. Os resultados destes algoritmos com clustering automático serão avaliados através de índices de validação internos e externos. (AU)