Busca avançada
Ano de início
Entree
(Referência obtida automaticamente do Web of Science, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores.)

Revisiting agglomerative clustering

Texto completo
Autor(es):
Tokuda, Eric K. [1] ; Comin, Cesar H. [2] ; Costa, Luciano da F. [1]
Número total de Autores: 3
Afiliação do(s) autor(es):
[1] Univ Sao Paulo, Inst Phys, Av Trabalhador Sao Carlense 400, Sao Paulo, SP - Brazil
[2] Univ Fed Sao Carlos, Comp Sci Dept, Rod Washington Luis, Km 235, Sao Carlos, SP - Brazil
Número total de Afiliações: 2
Tipo de documento: Artigo Científico
Fonte: PHYSICA A-STATISTICAL MECHANICS AND ITS APPLICATIONS; v. 585, JAN 1 2022.
Citações Web of Science: 0
Resumo

Hierarchical agglomerative methods stand out as particularly effective and popular approaches for clustering data. Yet, these methods have not been systematically compared regarding the important issue of false positives while searching for clusters. A model of clusters involving a higher density nucleus surrounded by a transition, followed by outliers is adopted as a means to quantify the relevance of the obtained clusters and address the problem of false positives. Six traditional methodologies, namely the single, average, median, complete, centroid and Ward's linkage criteria are compared with respect to the adopted model. Unimodal and bimodal datasets obeying uniform, gaussian, exponential and power-law distributions are considered for this comparison. The obtained results include the verification that many methods detect two clusters in unimodal data. The single-linkage method was found to be more resilient to false positives. Also, several methods detected clusters not corresponding directly to the nucleus. (C) 2021 Elsevier B.V. All rights reserved. (AU)

Processo FAPESP: 19/01077-3 - Integrando imagens e redes complexas na análise de cidades
Beneficiário:Eric Keiji Tokuda
Modalidade de apoio: Bolsas no Brasil - Pós-Doutorado
Processo FAPESP: 15/22308-2 - Representações intermediárias em Ciência Computacional para descoberta de conhecimento
Beneficiário:Roberto Marcondes Cesar Junior
Modalidade de apoio: Auxílio à Pesquisa - Temático
Processo FAPESP: 18/09125-4 - Representação, caracterização e modelagem de imagens biológicas utilizando redes complexas
Beneficiário:Cesar Henrique Comin
Modalidade de apoio: Auxílio à Pesquisa - Regular