Busca avançada
Ano de início
Entree

Comitês de classificadores para detecção de novidade em fluxos contínuos de dados multirrótulo

Processo: 23/08406-8
Modalidade de apoio:Bolsas no Brasil - Doutorado Direto
Data de Início da vigência: 01 de agosto de 2023
Data de Término da vigência: 31 de janeiro de 2028
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Ricardo Cerri
Beneficiário:Hiago Freire Oliveira
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Vinculado ao auxílio:22/02981-8 - Detecção de novidade em fluxos contínuos de dados multirrótulo, AP.PNGP.PI
Assunto(s):Aprendizado computacional   Classificação multirrótulo   Fluxo de dados
Palavra(s)-Chave do Pesquisador:Aprendizado de Máquina | Classificacao Multirrotulo | Comites de classificadores | Detecção de Novidade | Fluxo de Dados | Aprendizado de máquina

Resumo

Em cenários de fluxos contínuos de dados, a classificação enfrenta desafios que o aprendizado em lote não possui, como evoluções de conceito e mudanças de conceito, de forma que a detecção de novidade é uma tarefa necessária. A classificação multirrótulo em fluxos contínuos de dados, ainda pouco investigada, traz ainda mais desafios, sobretudo em contextos com latência infinita de rótulos. Entretanto, comitês de classificadores, por meio da combinação de métodos individuais, visam melhorar o desempenho da predição final. Nesse sentido, comitês de classificadores em conjunto com técnicas de detecção de novidade não-supervisionadas para classificação multirrótulo em fluxos de dados com latência infinita de rótulos podem trazer inovações e vantagens ao lidar com problemas mais complexos. Portanto, esse projeto tem como objetivo desenvolver um método de detecção de novidade multirrótulo capaz de identificar, distinguir e se adaptar às mudanças e evoluções de conceito em cenários com latência infinita de rótulos. Para tal, deverão ser gerados dados sintéticos com diferentes características multirrótulo, bem como a utilização de conjuntos de dados multirrótulo reais com adaptações para processamento em fluxo de dados. Para a validação serão considerados a qualidade da classificação, qualidade na detecção de mudanças de conceito, qualidade na detecção de evoluções de conceito, qualidade na detecção de ruídos, complexidade computacional, e tempo e memória gastos. Diversos métodos existentes, que cumprem parcialmente o objetivo, devem ser adaptados e comparados para o cumprimento total do objetivo final. Para avaliação, é preciso que a metodologia i) penalize o classificador quando muitos padrões novidade forem identificadas para representar uma classe, ii) penalize padrões novidade que são criados antes das ocorrências de evoluções de conceito, e iii) associe os padrões novidade a várias classes do problema. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)