Busca avançada
Ano de início
Entree

Avaliação de algoritmos de detecção de novidade para classificação multirrótulo em fluxos contínuos de dados

Processo: 18/11321-6
Linha de fomento:Bolsas no Exterior - Estágio de Pesquisa - Mestrado
Vigência (Início): 01 de agosto de 2018
Vigência (Término): 31 de janeiro de 2019
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Ricardo Cerri
Beneficiário:Joel David Costa Júnior
Supervisor no Exterior: João Manuel Portela da Gama
Instituição-sede: Centro de Ciências Exatas e de Tecnologia (CCET). Universidade Federal de São Carlos (UFSCAR). São Carlos , SP, Brasil
Local de pesquisa : Universidade do Porto (UP), Portugal  
Vinculado à bolsa:17/11513-0 - Classificação multirrótulo em fluxo contínuo de dados, BP.MS
Assunto(s):Aprendizado computacional   Fluxo de dados   Classificação hierárquica multirrótulo

Resumo

Fluxos Contínuos de Dados (FCDs), são sequências de dados potencialmente ilimitadas, geradas de forma contínua, não-estacionária e, em muitos casos, em alta velocidade. Muitos trabalhos de mineração em FCDs foram abordados na literatura, dentre eles destacam-se os que utilizam técnicas de Detecção de Novidades (DN). Isso porque com o uso de DN na classificação em FCDs é possível reconhecer o aparecimento de um novo conceito, uma mudança nos conceitos conhecidos ou a presença de ruídos. Estudos recentes tratam DN para classificação em FCDs como uma tarefa multi-classe, entretanto para problemas de Classificação MultiRrótulo (CMR), o uso de técnicas de DN ainda não foi explorado. Ainda, há uma quantidade limitada de trabalhos envolvendo CMR em FCDs e, desses trabalhos, nenhum lida com escassez de dados rotulados e evolução de conceito, restrições importantes na classificação em FCDs. Outro desafio encontrado no uso de DN para CMR é em como avaliar o desempenho dos algoritmos, principalmente por conta dos exemplos desconhecidos e da fase online não-supervisionada, onde Padrões Novidades (PNs) são criados sem associação direta as classes reais do problema. Desse modo, o objetivo desse projeto é desenvolver uma metodologia de avaliação baseada na proposta em de Faria et al. (2015) que seja capaz de avaliar adequadamente os métodos de DN para CMR em FCDs. (AU)