Busca avançada
Ano de início
Entree

Avaliação sistemática de técnicas de Bi-Agrupamento de dados

Processo: 14/08840-0
Linha de fomento:Bolsas no Brasil - Mestrado
Vigência (Início): 01 de agosto de 2014
Vigência (Término): 30 de abril de 2016
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Ricardo José Gabrielli Barreto Campello
Beneficiário:Victor Alexandre Padilha
Instituição-sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Aprendizado de máquina não supervisionado   Mineração de dados

Resumo

Análise de agrupamento é um problema fundamental de aprendizado de máquina não supervisionado em que se objetiva determinar categorias que descrevam um conjunto de objetos de acordo com suas similaridades ou inter-relacionamentos. Na formulação tradicional do problema, busca-se por partições ou hierarquias de partições contendo grupos cujos objetos são de alguma forma similares entre si e dissimilares aos objetos dos demais grupos segundo alguma medida direta ou indireta de (dis)similaridade que leva em conta o conjunto completo de atributos que descrevem os objetos na base de dados sob análise. Dessa forma, supõe-se que todos os grupos se caracterizam como tais no mesmo espaço, ou seja, segundo os mesmos atributos. Entretanto, apesar de décadas de aplicações bem sucedidas, existem situações em que a natureza dos agrupamentos contidos nos dados não pode ser representada segundo este tipo de formulação. Em particular, existem situações em que grupos de objetos se caracterizam como tais apenas segundo um subconjunto dos atributos que os descrevem, sendo que tal subconjunto pode ser distinto para cada grupo. Ao contrário de algoritmos de agrupamento tradicionais, algoritmos de bi-agrupamento são capazes de agrupar simultaneamente linhas e colunas de uma matriz de dados n x d, que pode representar um conjunto de n objetos descritos como vetores de atributos d-dimensionais. Tais algoritmos produzem bi-grupos formados por subconjuntos de objetos e subconjuntos de atributos de alguma forma fortemente co-relacionados. Esses algoritmos passaram a atrair a atenção da comunidade científica quando se evidenciou a relevância da tarefa de bi-agrupamento em problemas como análise de dados de expressão gênica em bioinformática e análise de transações em sistemas de recomendação, dentre outros. Neste trabalho pretende-se realizar um estudo comparativo abrangente envolvendo uma ampla gama de diferentes algoritmos de bi-agrupamento e uma coleção representativa de cenários de aplicação tanto de natureza real como simulada, com particular ênfase em problemas de análise de dados de expressão gênica.

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
PADILHA, VICTOR A.; CAMPELLO, RICARDO J. G. B. A systematic comparative evaluation of biclustering techniques. BMC Bioinformatics, v. 18, JAN 23 2017. Citações Web of Science: 23.
Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
PADILHA, Victor Alexandre. Avaliação sistemática de técnicas de bi-agrupamento de dados. 2016. Dissertação de Mestrado - Universidade de São Paulo (USP). Instituto de Ciências Matemáticas e de Computação São Carlos.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.