Busca avançada
Ano de início
Entree

Avaliação de algoritmos de detecção de novidade para classificação multirrótulo em fluxos contínuos de dados

Processo: 18/11321-6
Modalidade de apoio:Bolsas no Exterior - Estágio de Pesquisa - Mestrado
Data de Início da vigência: 01 de agosto de 2018
Data de Término da vigência: 31 de janeiro de 2019
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Ricardo Cerri
Beneficiário:Joel David Costa Júnior
Supervisor: João Manuel Portela da Gama
Instituição Sede: Centro de Ciências Exatas e de Tecnologia (CCET). Universidade Federal de São Carlos (UFSCAR). São Carlos , SP, Brasil
Instituição Anfitriã: Universidade do Porto (UP), Portugal  
Vinculado à bolsa:17/11513-0 - Classificação multirrótulo em fluxo contínuo de dados, BP.MS
Assunto(s):Aprendizado computacional   Fluxo de dados   Classificação hierárquica multirrótulo
Palavra(s)-Chave do Pesquisador:Classificacao Multirrotulo | Detecção de novidades | fluxos contínuos de dados | Metodologia de Avaliação | Aprendizado de Máquina e Mineração de Dados

Resumo

Fluxos Contínuos de Dados (FCDs), são sequências de dados potencialmente ilimitadas, geradas de forma contínua, não-estacionária e, em muitos casos, em alta velocidade. Muitos trabalhos de mineração em FCDs foram abordados na literatura, dentre eles destacam-se os que utilizam técnicas de Detecção de Novidades (DN). Isso porque com o uso de DN na classificação em FCDs é possível reconhecer o aparecimento de um novo conceito, uma mudança nos conceitos conhecidos ou a presença de ruídos. Estudos recentes tratam DN para classificação em FCDs como uma tarefa multi-classe, entretanto para problemas de Classificação MultiRrótulo (CMR), o uso de técnicas de DN ainda não foi explorado. Ainda, há uma quantidade limitada de trabalhos envolvendo CMR em FCDs e, desses trabalhos, nenhum lida com escassez de dados rotulados e evolução de conceito, restrições importantes na classificação em FCDs. Outro desafio encontrado no uso de DN para CMR é em como avaliar o desempenho dos algoritmos, principalmente por conta dos exemplos desconhecidos e da fase online não-supervisionada, onde Padrões Novidades (PNs) são criados sem associação direta as classes reais do problema. Desse modo, o objetivo desse projeto é desenvolver uma metodologia de avaliação baseada na proposta em de Faria et al. (2015) que seja capaz de avaliar adequadamente os métodos de DN para CMR em FCDs. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
COSTA JUNIOR, JOEL D.; FARIA, ELAINE R.; SILVA, JONATHAN A.; GAMA, JOAO; CERRI, RICARDO; IEEE. Pruned Sets for Multi-Label Stream Classification without True Labels. 2019 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS (IJCNN), v. N/A, p. 8-pg., . (17/11513-0, 18/11321-6)