Busca avançada
Ano de início
Entree

Métodos e algoritmos em aprendizado de máquina não supervisionado e semi-supervisionado

Processo: 13/18698-4
Modalidade de apoio:Auxílio à Pesquisa - Regular
Data de Início da vigência: 01 de fevereiro de 2014
Data de Término da vigência: 31 de janeiro de 2016
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Ricardo José Gabrielli Barreto Campello
Beneficiário:Ricardo José Gabrielli Barreto Campello
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Aprendizado computacional  Mineração de dados 
Palavra(s)-Chave do Pesquisador:Agrupamento de Dados | Aprendizado de Máquina Não Supervisionado | Aprendizado de Máquina Semi-Supervisionado | Detecção de Outliers | Mineração de Dados | Aprendizado de Máquina e Mineração de Dados

Resumo

Este documento apresenta um projeto de pesquisa dentro da linha de auxílios regulares da Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp). O objetivo fundamental é apoiar de maneira integrada as pesquisas realizadas pelo grupo de pesquisa do proponente, pelo período de 2 anos. O grupo é essencialmente constituído pelo pesquisador responsável e seus alunos no ICMC/USP, mas o projeto envolverá também colaborações internacionais com a Universidade de Alberta no Canadá e com a Ludwig-Maximilians-Universität na Alemanha.No tocante aos temas de pesquisa, trata-se de um projeto do tipo "guarda-chuva", que compreende subprojetos a serem desenvolvidos principalmente como parte de orientações de mestrado e doutorado, diretamente sob supervisão do pesquisador no Brasil ou através das colaborações no exterior. Em linhas gerais, a proposta visa investigar métodos de aprendizado de máquina voltados a problemas de mineração de dados. As vertentes de investigação se concentram majoritariamente nos paradigmas de aprendizado não supervisionado e semi-supervisionado, com particular enfoque para as áreas de análise de agrupamento de dados e detecção de anomalias (ou outliers). No contexto de agrupamento de dados, tópicos de pesquisa de interesse incluem, dentre outros, agrupamentos dos tipos hierárquico, semi-supervisionado, paralelo e distribuído, com sobreposição, baseado em densidade, em subespaços de atributos, bi-agrupamentos e validação de agrupamento. No contexto de detecção de outliers, os tópicos de interesse incluem combinações de detectores (ensembles), validação de resultados de detecção não supervisionada e métodos computacionalmente escaláveis, dentre outros. No que se refere a domínios de aplicação, o projeto possui enfoque em ferramentas matemáticas e computacionais de propósito geral, mas parte das pesquisas poderão envolver domínios específicos, como, por exemplo, análise de dados de expressão gênica em bioinformática. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas (6)
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
PADILHA, VICTOR A.; CAMPELLO, RICARDO J. G. B.. A systematic comparative evaluation of biclustering techniques. BMC Bioinformatics, v. 18, . (14/08840-0, 13/18698-4)
CAMPELLO, RICARDO J. G. B.; MOULAVI, DAVOUD; ZIMEK, ARTHUR; SANDER, JOERG. Hierarchical Density Estimates for Data Clustering, Visualization, and Outlier Detection. ACM TRANSACTIONS ON KNOWLEDGE DISCOVERY FROM DATA, v. 10, n. 1, . (10/20032-6, 13/18698-4)
NALDI, M. C.; CAMPELLO, R. J. G. B.. Comparison of distributed evolutionary k-means clustering algorithms. Neurocomputing, v. 163, n. SI, p. 78-93, . (13/18698-4)
CAMPOS, GUILHERME O.; ZIMEK, ARTHUR; SANDER, JORG; CAMPELLO, RICARDO J. G. B.; MICENKOVA, BARBORA; SCHUBERT, ERICH; ASSENT, IRA; HOULE, MICHAEL E.. On the evaluation of unsupervised outlier detection: measures, datasets, and an empirical study. DATA MINING AND KNOWLEDGE DISCOVERY, v. 30, n. 4, p. 891-927, . (13/18698-4)
HORTA, DANILO; CAMPELLO, RICARDO J. G. B.. Comparing Hard and Overlapping Clusterings. JOURNAL OF MACHINE LEARNING RESEARCH, v. 16, p. 2949-2997, . (09/17469-6, 13/18698-4)
NALDI, M. C.; CAMPELLO, R. J. G. B.. Comparison of distributed evolutionary k-means clustering algorithms. Neurocomputing, v. 163, p. 16-pg., . (13/18698-4)