Busca avançada
Ano de início
Entree

Abordagens de agrupamento de dados baseadas em subespaços e Semi-Supervisão

Processo: 09/17469-6
Linha de fomento:Bolsas no Brasil - Doutorado
Vigência (Início): 01 de agosto de 2010
Vigência (Término): 30 de setembro de 2013
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Ricardo José Gabrielli Barreto Campello
Beneficiário:Danilo Horta
Instituição-sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Vinculado ao auxílio:06/50231-5 - Inteligência computacional em mineração de dados e suas aplicações, AP.JP
Assunto(s):Agrupamento de dados   Mineração de dados

Resumo

Agrupamento de dados não-supervisionado é um dos problemas centrais na área de mineração de dados, o qual consiste em particionar os dados em grupos de objetos mais similares entre si do que com relação aos objetos dos demais grupos, segundo alguma medida de similaridade ou dissimilaridade comumente gerada a partir do espaço de atributos no qual os objetos são representados. Entretanto, frequentemente os grupos da base de dados estão escondidos em subespaços do espaço original, como costuma acontecer com bases de dados de documentos textuais ou de expressão gênica. Por esta razão, abordagens de agrupamento de dados baseadas em subespaços vêm ganhando crescente importância e interesse pela comunidade de mineração de dados. Outra abordagem que vem ganhando atenção dos pesquisadores é a do uso de informações parciais a priori sobre como o agrupamento dos dados deve ser realizado. Essas informações podem ser fornecidas, por exemplo, por meio de pares de objetos que devem e que não devem estar no mesmo grupo na partição final, o que pode ocorrer, por exemplo, em aplicações envolvendo bases de dados de documentos web/multimídia.Os principais objetivos deste projeto de doutorado consistem em: (i) pesquisar e desenvolver técnicas de agrupamento de dados em subespaços que não exijam do usuário o conhecimento do número de grupos e sejam aplicáveis em grandes bases de dados, possivelmente relacionais; e (ii) investigar a possibilidade de inserir semi-supervisão em algoritmos de agrupamento de dados em subespaços.

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
HORTA, DANILO; CAMPELLO, RICARDO J. G. B. Comparing Hard and Overlapping Clusterings. JOURNAL OF MACHINE LEARNING RESEARCH, v. 16, p. 2949-2997, DEC 2015. Citações Web of Science: 3.
Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
HORTA, Danilo. Algoritmos e técnicas de validação em agrupamento de dados multi-representados, agrupamento possibilístico e bi-agrupamento. 2013. Tese de Doutorado - Universidade de São Paulo (USP). Instituto de Ciências Matemáticas e de Computação São Carlos.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.
Mapa da distribuição dos acessos desta página
Para ver o sumário de acessos desta página, clique aqui.