Busca avançada
Ano de início
Entree


Classificação de fluxos de dados com mudança de conceito e latência de verificação

Texto completo
Autor(es):
Denis Moreira dos Reis
Número total de Autores: 1
Tipo de documento: Dissertação de Mestrado
Imprenta: São Carlos.
Instituição: Universidade de São Paulo (USP). Instituto de Ciências Matemáticas e de Computação (ICMC/SB)
Data de defesa:
Membros da banca:
Gustavo Enrique de Almeida Prado Alves Batista; Robson Leonardo Ferreira Cordeiro; Ricardo Bastos Cavalcante Prudêncio; Marcela Xavier Ribeiro
Orientador: Gustavo Enrique de Almeida Prado Alves Batista
Resumo

Apesar do grau relativamente alto de maturidade existente na área de pesquisa de aprendizado supervisionado em lote, na qual são utilizados dados originários de problemas estacionários, muitas aplicações reais lidam com fluxos de dados cujas distribuições de probabilidade se alteram com o tempo, ocasionando mudanças de conceito. Diversas pesquisas vêm sendo realizadas nos últimos anos com o objetivo de criar modelos precisos mesmo na presença de mudanças de conceito. A maioria delas, no entanto, assume que tão logo um evento seja classificado pelo algoritmo de aprendizado, seu rótulo verdadeiro se torna conhecido. Este trabalho explora as situações complementares, com revisão dos trabalhos mais importantes publicados e análise do impacto de atraso na disponibilidade dos rótulos verdadeiros ou sua não disponibilização. Ainda, propõe um novo algoritmo que reduz drasticamente a complexidade de aplicação do teste de hipótese não-paramétrico Kolmogorov-Smirnov, tornado eficiente seu uso em algoritmos que analisem fluxos de dados. A exemplo, mostramos sua potencial aplicação em um método de detecção de mudança de conceito não-supervisionado que, em conjunto com técnicas de Aprendizado Ativo e Aprendizado por Transferência, reduz a necessidade de rótulos verdadeiros para manter boa performance de um classificador ao longo do tempo, mesmo com a ocorrência de mudanças de conceito. (AU)

Processo FAPESP: 14/12333-7 - Classificação em fluxo de dados com mudança de conceito e latência de verificação extrema
Beneficiário:Denis Moreira dos Reis
Modalidade de apoio: Bolsas no Brasil - Mestrado