Busca avançada
Ano de início
Entree

Ensembles de resultados de bi-agrupamento

Processo: 17/02975-0
Modalidade de apoio:Bolsas no Brasil - Doutorado
Data de Início da vigência: 01 de maio de 2017
Data de Término da vigência: 31 de outubro de 2018
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:André Carlos Ponce de Leon Ferreira de Carvalho
Beneficiário:Victor Alexandre Padilha
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Vinculado ao auxílio:13/07375-0 - CeMEAI - Centro de Ciências Matemáticas Aplicadas à Indústria, AP.CEPID
Assunto(s):Aprendizado computacional   Agrupamento de dados
Palavra(s)-Chave do Pesquisador:Aprendizado de Máquina | biclustering | Clustering | Ensemble | Aprendizado de máquina

Resumo

Um dos principais assuntos na área de aprendizado de máquina é a análise de agrupamento de dados, em que busca-se encontrar grupos que descrevam um conjunto de objetos de tal modo que as similaridades intra-grupo e a dissimilaridades inter-grupos sejam maximizadas. Em geral, tais técnicas são baseadas em medidas que levam em conta todos os atributos de uma base de dados. Entretanto, em várias situações do mundo real os grupos contidos nos dados são definidos apenas por um subconjunto de todos os atributos. Por essa razão, o paradigma de bi-agrupamento de dados busca fornecer algoritmos capazes de agrupar linhas e colunas de uma matriz de dados de maneira simultânea, com a finalidade de encontrar submatrizes homogêneas. Tal paradigma tornou-se amplamente utilizado após a sua importância no campo de análise de dados de expressão gênica ser evidenciada. Todavia, um dos principais problemas da área de bi-agrupamento advém do fato de não existir uma definição universal de quais padrões definem um bi-grupo. Devido a isso, cada algoritmo baseia-se em diferentes heurísticas, formulações matemáticas e suposições, o que implica em diferentes resultados para os mesmos dados de entrada. Portanto, o desenvolvimento de técnicas que sejam capazes de combinar as soluções de diferentes algoritmos que buscam por padrões similares e/ou do mesmo algoritmo sujeito a diferentes parâmetros experimentais pode ser um passo importante para se obter resultados mais significativos e robustos, os quais podem não ser identificados pela aplicação individual de um único algoritmo.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
PADILHA, VICTOR ALEXANDRE; DE LEON FERREIRA DE CARVALHO, ANDRE CARLOS PONCE. Experimental correlation analysis of bicluster coherence measures and gene ontology information. APPLIED SOFT COMPUTING, v. 85, . (16/18615-0, 13/07375-0, 17/02975-0)
PADILHA, VICTOR A.; DE CARVALHO, ANDRE C. P. L. F.; IEEE. A Comparison of Hierarchical Biclustering Ensemble Methods. 2017 6TH BRAZILIAN CONFERENCE ON INTELLIGENT SYSTEMS (BRACIS), v. N/A, p. 6-pg., . (13/07375-0, 17/02975-0, 16/18615-0)
PADILHA, VICTOR A.; DE CARVALHO, ANDRE C. P. L. F.; IEEE. A Study of Biclustering Coherence Measures for Gene Expression Data. 2018 7TH BRAZILIAN CONFERENCE ON INTELLIGENT SYSTEMS (BRACIS), v. N/A, p. 6-pg., . (16/18615-0, 17/02975-0, 13/07375-0)