Busca avançada
Ano de início
Entree

Ensembles de resultados de bi-agrupamento

Processo: 17/02975-0
Linha de fomento:Bolsas no Brasil - Doutorado
Vigência (Início): 01 de maio de 2017
Vigência (Término): 31 de outubro de 2018
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:André Carlos Ponce de Leon Ferreira de Carvalho
Beneficiário:Victor Alexandre Padilha
Instituição-sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Vinculado ao auxílio:13/07375-0 - CeMEAI - Centro de Ciências Matemáticas Aplicadas à Indústria, AP.CEPID
Assunto(s):Aprendizado computacional   Agrupamento de dados

Resumo

Um dos principais assuntos na área de aprendizado de máquina é a análise de agrupamento de dados, em que busca-se encontrar grupos que descrevam um conjunto de objetos de tal modo que as similaridades intra-grupo e a dissimilaridades inter-grupos sejam maximizadas. Em geral, tais técnicas são baseadas em medidas que levam em conta todos os atributos de uma base de dados. Entretanto, em várias situações do mundo real os grupos contidos nos dados são definidos apenas por um subconjunto de todos os atributos. Por essa razão, o paradigma de bi-agrupamento de dados busca fornecer algoritmos capazes de agrupar linhas e colunas de uma matriz de dados de maneira simultânea, com a finalidade de encontrar submatrizes homogêneas. Tal paradigma tornou-se amplamente utilizado após a sua importância no campo de análise de dados de expressão gênica ser evidenciada. Todavia, um dos principais problemas da área de bi-agrupamento advém do fato de não existir uma definição universal de quais padrões definem um bi-grupo. Devido a isso, cada algoritmo baseia-se em diferentes heurísticas, formulações matemáticas e suposições, o que implica em diferentes resultados para os mesmos dados de entrada. Portanto, o desenvolvimento de técnicas que sejam capazes de combinar as soluções de diferentes algoritmos que buscam por padrões similares e/ou do mesmo algoritmo sujeito a diferentes parâmetros experimentais pode ser um passo importante para se obter resultados mais significativos e robustos, os quais podem não ser identificados pela aplicação individual de um único algoritmo.

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
PADILHA, VICTOR ALEXANDRE; DE LEON FERREIRA DE CARVALHO, ANDRE CARLOS PONCE. Experimental correlation analysis of bicluster coherence measures and gene ontology information. APPLIED SOFT COMPUTING, v. 85, DEC 2019. Citações Web of Science: 0.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.