Busca avançada
Ano de início
Entree

Abordagens de Agrupamento de Dados Baseadas em Subespaços e Semi-Supervisão

Processo: 09/17469-6
Modalidade de apoio:Bolsas no Brasil - Doutorado
Data de Início da vigência: 01 de agosto de 2010
Data de Término da vigência: 30 de setembro de 2013
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Ricardo José Gabrielli Barreto Campello
Beneficiário:Danilo Horta
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Vinculado ao auxílio:06/50231-5 - Inteligência computacional em mineração de dados e suas aplicações, AP.JP
Assunto(s):Agrupamento de dados   Mineração de dados
Palavra(s)-Chave do Pesquisador:Agrupamento de Dados | Agrupamento em Subespaços | Agrupamento Evolutivo | Agrupamento Relacional | Agrupamento Semi-Supervisionado | Mineração de Dados | Mineração de Dados (Data Mining)

Resumo

Agrupamento de dados não-supervisionado é um dos problemas centrais na área de mineração de dados, o qual consiste em particionar os dados em grupos de objetos mais similares entre si do que com relação aos objetos dos demais grupos, segundo alguma medida de similaridade ou dissimilaridade comumente gerada a partir do espaço de atributos no qual os objetos são representados. Entretanto, frequentemente os grupos da base de dados estão escondidos em subespaços do espaço original, como costuma acontecer com bases de dados de documentos textuais ou de expressão gênica. Por esta razão, abordagens de agrupamento de dados baseadas em subespaços vêm ganhando crescente importância e interesse pela comunidade de mineração de dados. Outra abordagem que vem ganhando atenção dos pesquisadores é a do uso de informações parciais a priori sobre como o agrupamento dos dados deve ser realizado. Essas informações podem ser fornecidas, por exemplo, por meio de pares de objetos que devem e que não devem estar no mesmo grupo na partição final, o que pode ocorrer, por exemplo, em aplicações envolvendo bases de dados de documentos web/multimídia.Os principais objetivos deste projeto de doutorado consistem em: (i) pesquisar e desenvolver técnicas de agrupamento de dados em subespaços que não exijam do usuário o conhecimento do número de grupos e sejam aplicáveis em grandes bases de dados, possivelmente relacionais; e (ii) investigar a possibilidade de inserir semi-supervisão em algoritmos de agrupamento de dados em subespaços.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
HORTA, DANILO; CAMPELLO, RICARDO J. G. B.. Comparing Hard and Overlapping Clusterings. JOURNAL OF MACHINE LEARNING RESEARCH, v. 16, p. 2949-2997, . (09/17469-6, 13/18698-4)
Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
HORTA, Danilo. Algoritmos e técnicas de validação em agrupamento de dados multi-representados, agrupamento possibilístico e bi-agrupamento. 2013. Tese de Doutorado - Universidade de São Paulo (USP). Instituto de Ciências Matemáticas e de Computação (ICMC/SB) São Carlos.