Busca avançada
Ano de início
Entree

Desenvolvimento de uma nova técnica de partição de redes para agrupamento de dados

Processo: 09/03588-3
Linha de fomento:Bolsas no Brasil - Mestrado
Vigência (Início): 01 de agosto de 2009
Vigência (Término): 31 de março de 2011
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Zhao Liang
Beneficiário:Jean Pierre Huertas Lopez
Instituição-sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Agrupamento de dados   Inteligência artificial   Expressão gênica

Resumo

A clusterização de dados pode oferecer diversas maneiras de entender e extrair informações relevantes de grandes conjuntos de dados. Através da detecção de grupos é possível organizar padrões com características semelhantes e estabelecer hierarquias, permitindo uma análise mais detalhada desses dados. As técnicas desse processo são utilizadas cada vez mais em diversas áreas, tais como: reconhecimento de padrões, mineração de dados, bioinformática, tomada de decisão, aprendizado de máquina, segmentação de imagens, etc.A presente proposta visa o desenvolvimento de nova técnica de clusterização de dados baseadas em redes complexas. O processo de clusterização consistirá em duas etapas: formação da rede a partir de um conjunto de dados de entrada, e partição da rede produzindo clusters. Inicialmente, a técnica de formação da rede será baseada na extensão de um método desenvolvido recentemente pelo presente grupo. Na segunda etapa, será desenvolvida uma nova técnica de detecção de sub-redes, onde os elementos que representam os vértices da rede se movimentam em um campo de força via cooperação e competição entre eles. No final, cada grupo de elementos que representa uma sub-rede será convergido a um ponto ou alinhado. A representação de dados em rede pode revelar estruturas topológicas dos dados de entrada, portanto, espera-se que a técnica desenvolvida seja capaz de detectar clusters de formas, densidades e tamanhos variados. Além disso, espera-se que esta técnica também viabilize uma representação hierárquica de clusters, permitindo a escolha da melhor partição dentre várias possibilidades. A técnica de partição de rede que será desenvolvida neste projeto não possui como objetivo encontrar soluções ótimas via busca exaustiva, mas sim soluções aproximadamente ótimas com grande eficiência e robustez que são características desejáveis para processamento de grande quantidade de dados. O modelo será testado com dados artificiais, imagens, e aplicado à análise de expressão de genes.

Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
LOPEZ, Jean Pierre Huertas. Análise de dados utilizando a medida de tempo de consenso em redes complexas. 2011. Dissertação de Mestrado - Universidade de São Paulo (USP). Instituto de Ciências Matemáticas e de Computação São Carlos.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.