Busca avançada
Ano de início
Entree

Análise de propagação de erros em aprendizado semi-supervisionado baseado em redes complexas

Processo: 09/12329-1
Linha de fomento:Bolsas no Brasil - Doutorado Direto
Vigência (Início): 01 de março de 2010
Vigência (Término): 30 de novembro de 2011
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Zhao Liang
Beneficiário:Thiago Christiano Silva
Instituição-sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Inteligência artificial   Aprendizado computacional   Redes complexas   Análise de erros

Resumo

Aprendizado de máquina é uma área de pesquisa que visa a desenvolver métodos computacionais capazes de "aprender" com a experiência. As técnicas tradicionais de aprendizado de máquina, na construção de classificadores, necessitam de uma grande quantidade de dados rotulados. Estes dados são geralmente difíceis de serem obtidos, principalmente quando envolvem a rotulação manual por parte de um especialista. Recentemente, uma nova vertente da área de aprendizado de máquina, denominada aprendizado semi-supervisionado, tem atraído a atenção de muitos pesquisadores. Esta forma de aprendizado possui como objetivo a propagação de rótulos para todos os dados não-rotulados preservando a distribuição original. Diversos métodos de aprendizado semi-supervisionado têm sido propostos na literatura. Entretanto, nos últimos anos, existe um crescente interesse nas técnicas que utilizam redes para representar os dados. Este fato deve-se ao surgimento das redes complexas como um tópico unificador de sistemas complexos e como uma poderosa ferramenta de representação e abstração de dados, sendo capazes de capturar suas relações espaciais, topológicas e funcionais. Este projeto tem como objetivo desenvolver técnicas de aprendizado de máquina para análise de dados utilizando redes complexas. Especificamente, serão desenvolvidas técnicas de aprendizado semi-supervisionado baseadas em competição de partículas em redes complexas. Neste caso, alguns vértices da rede são rotulados, ou seja, suas classes são previamente definidas e os modelos a serem desenvolvidos deverão ser capazes de propagar os rótulos para os outros vértices da rede. Outro objetivo deste projeto é tratamento de assunto de segurança no aprendizado semi-supervisionado. Especificamente, serão desenvolvidas três técnicas para analisar e impedir propagação de erros: 1) a técnica de aprendizado semi-supervisionado a ser desenvolvida será capaz de oferecer nível de pertinência de cada item de dado a cada classe (soft-label em inglês), ao invés de só oferecer rótulo de classe (hard-label); 2) a técnica a ser desenvolvida será capaz de detectar outliers e, consequentemente, impedirá sua propagação; 3) serão conduzidos estudos e análises de propagação de erros (dados erroneamente rotulados) em conjunto com a propagação de rótulos em redes, ou seja, já como estado inicial da rede, haverá uma certa porcentagem de erro introduzida antes do processo de propagação de rótulos. Pretende-se, com isso, identificar o ponto crítico da percentagem de erros introduzida, o que leva a uma precisão de classificação drasticamente decaída. Esse tipo de estudo é muito importante não só para obter uma classificação segura, mas também para um melhor entendimento do conjunto de dados em processamento. Por fim, com o objetivo de validar as técnicas desenvolvidas em problemas reais, estas serão aplicadas para análise de dados na base UCI. Redes complexas são ferramentas poderosas de representação de dados e ainda existe um grande espaço para exploração. Portanto, acredita-se que este estudo possa gerar contribuições para área de aprendizado de máquinas. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Estudo cria modelo animal de autismo  

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
SILVA, THIAGO C.; AMANCIO, DIEGO R. Discriminating word senses with tourist walks in complex networks. European Physical Journal B, v. 86, n. 7 JUL 2013. Citações Web of Science: 2.
SILVA, THIAGO CHRISTIANO; AMANCIO, DIEGO RAPHAEL. Network-based stochastic competitive learning approach to disambiguation in collaborative networks. Chaos, v. 23, n. 1 MAR 2013. Citações Web of Science: 2.
SILVA, THIAGO C.; AMANCIO, DIEGO R. Word sense disambiguation via high order of learning in complex networks. EPL, v. 98, n. 5 JUN 2012. Citações Web of Science: 21.
Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
SILVA, Thiago Christiano. Machine learning in complex networks: modeling, analysis, and applications. 2012. Tese de Doutorado - Universidade de São Paulo (USP). Instituto de Ciências Matemáticas e de Computação São Carlos.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.