Busca avançada
Ano de início
Entree

Detecção de novidade em fluxos contínuos de dados multirrótulo

Processo:22/02981-8
Modalidade de apoio:Auxílio à Pesquisa - Projeto Inicial
Data de Início da vigência: 01 de fevereiro de 2023
Data de Término da vigência: 31 de janeiro de 2028
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Ricardo Cerri
Beneficiário:Ricardo Cerri
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Município da Instituição Sede:São Carlos
Pesquisadores associados:Diego Furtado Silva ; Elaine Ribeiro de Faria Paiva ; João Manuel Portela da Gama ; Márcio Porto Basgalupp
Auxílio(s) vinculado(s):25/16355-0 - Detecção de novidades para classificação de fluxos de dados multirrótulo, AP.R
24/19234-6 - Aprendizado de Máquina Automático para Classificação Multirrótulo, AP.R SPRINT
Bolsa(s) vinculada(s):25/10035-3 - Análise de dificuldade à nível de instância para problemas multirrótulo, BP.MS
24/15875-7 - Investigação de Metodologias de Avaliação para Problemas de Classificação Multirrótulo em Fluxos Contínuos de Dados, BP.MS
23/08406-8 - Comitês de classificadores para detecção de novidade em fluxos contínuos de dados multirrótulo, BP.DD
Assunto(s):Aprendizado computacional  Classificação multirrótulo  Análise em fluxo contínuo  Análise de dados 
Palavra(s)-Chave do Pesquisador:Aprendizado de Máquina | Classificacao Multirrotulo | Detecção de Novidade | fluxos contínuos de dados | Aprendizado de Máquina

Resumo

Fluxos contínuos de dados (FCDs) são sequências de dados de tamanho ilimitado, geradas de forma contínua, não-estacionária, e em muitos casos, em alta velocidade. Por esse fluxo ser potencialmente infinito, os dados não podem ser armazenados em memória, obrigando um exemplo a ser processado uma única vez e descartado. Várias aplicações do mundo real geram grandes quantidades de dados em um fluxo contínuo, e a tendência é que com a evolução da Tecnologia da Informação, mais dados sejam gerados e coletados constantemente. Exemplos dessas aplicações são coleta de dados a partir de sensores, geração de medições durante monitoramentos de redes e análise de postagens em redes sociais. Isso evidencia a relevância e a necessidade do desenvolvimento de algoritmos capazes de extrair conhecimento relevante desses dados. Dentre as tarefas envolvendo FCDs, a classificação é uma das mais importantes, objetivando rotular exemplos ainda não vistos, e que chegam constantemente junto ao fluxo. Dentro desse cenário, um grande desafio é a detecção de novidade, representada por mudanças de conceito e evoluções de conceito. Na mudança de conceito, a distribuição que gera os dados muda ao longo do tempo, o que significa que as distribuições que representam as classes mudam. Na evolução de conceito, novas distribuições surgem ao longo do tempo, o que significa o surgimento de novas classes no fluxo de dados. Apesar de existirem diversos métodos para a classificação de FCDs, a maioria deles não considera o fato dos exemplos do fluxo poderem ser rotulados em mais de uma classe simultaneamente, e também consideram que as classes dos exemplos são sempre disponibilizadas junto com os exemplos no fluxo, um cenário muitas vezes irreal. Dessa forma, a investigação de métodos de classificação que sejam capazes de lidar com tais cenários multirrótulo desafiadores é essencial. Nesse contexto, este projeto de pesquisa tem como objetivo principal propor novas estratégias de classificação multirrótulo em FCD. Além da detecção de evoluções de conceito e mudanças de conceito, há outras restrições e características que devem ser consideradas para o desenvolvimento de novas estratégias, e que tornam a tarefa difícil e desafiadora. Entre elas estão a necessidade de se considerar respostas em tempo real, memória limitada, passagem única pelos dados, detecção de conceitos recorrentes, detecção de ruídos e outliers, latência infinita de rótulos, e detecção de várias mudanças e evoluções de conceito simultâneas. Os métodos propostos serão executados em conjuntos de dados sintéticos e reais, e comparados com outros métodos da literatura. Os resultados serão divulgados em periódicos e eventos, e os códigos e dados gerados disponibilizados publicamente. Espera-se que os resultados da pesquisa tragam impactos e avanços significantes para as áreas de classificação de fluxos contínuo de dados e aprendizado multirrótulo. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas (9)
(As publicações científicas contidas nesta página são originárias da Web of Science ou da SciELO, cujos autores mencionaram números dos processos FAPESP concedidos a Pesquisadores Responsáveis e Beneficiários, sejam ou não autores das publicações. Sua coleta é automática e realizada diretamente naquelas bases bibliométricas)
ILIDIO, PEDRO; ALVES, ANDRE; CERRI, RICARDO. . 39TH ANNUAL ACM SYMPOSIUM ON APPLIED COMPUTING, SAC 2024, v. N/A, p. 8-pg., . (22/02981-8)
CASAROTTO, PEDRO HENRIQUE; CERRI, RICARDO. . INTELLIGENT SYSTEMS, BRACIS 2024, PT II, v. 15413, p. 16-pg., . (22/02981-8)
ALCANTARA, LEONARDO U.; TRIGUERO, ISAAC; CERRI, RICARDO. . INTELLIGENT SYSTEMS, BRACIS 2024, PT II, v. 15413, p. 16-pg., . (16/25220-1, 22/02981-8, 17/24807-1)
CARDOSO, SILVANA C. S.; DOMINGUES, DOUGLAS S.; PASCHOAL, ALEXANDRE R.; FISCHER, CARLOS N.; CERRI, RICARDO. . 2024 IEEE CONFERENCE ON COMPUTATIONAL INTELLIGENCE IN BIOINFORMATICS AND COMPUTATIONAL BIOLOGY, CIBCB 2024, v. N/A, p. 8-pg., . (22/02981-8)
FUNICHELI, BRENO O.; BRONDANI, CLAUDIO; VIANELLO, ROSANA P.; CERRI, RICARDO. . 2024 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS, IJCNN 2024, v. N/A, p. 8-pg., . (20/11611-4, 22/02981-8)
DEL VALLE, ALINE MARQUES; MANTOVANI, RAFAEL GOMES; CERRI, RICARDO. . ARTIFICIAL INTELLIGENCE REVIEW, v. N/A, p. 40-pg., . (22/02981-8)
ALVES, JULIANA; COSTA, EDUARDO; XAVIER, ALENCAR; BRITO, LUIZ; CERRI, RICARDO. . INTELLIGENT SYSTEMS, BRACIS 2024, PT III, v. 15414, p. 15-pg., . (22/02981-8, 21/12618-5, 20/08634-2)
ILIDIO, PEDRO; CERRI, RICARDO; VENS, CELINE; NAKANO, FELIPE KENJI. . 2024 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS, IJCNN 2024, v. N/A, p. 8-pg., . (22/02981-8)
CAVALCANTI, DOUGLAS MONTEIRO; CERRI, RICARDO; FARIA, ELAINE RIBEIRO. . DATA MINING AND KNOWLEDGE DISCOVERY, v. 39, n. 5, p. 35-pg., . (22/02981-8)