Busca avançada
Ano de início
Entree

Classificação de fluxos de dados não-estacionários com mudança de conceito e latência extrema de rótulos

Processo: 19/23232-0
Linha de fomento:Bolsas no Exterior - Pesquisa
Vigência (Início): 01 de outubro de 2020
Vigência (Término): 30 de setembro de 2021
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Adriane Beatriz de Souza Serapião
Beneficiário:Adriane Beatriz de Souza Serapião
Anfitrião: Gustavo Enrique de Almeida Prado Alves Batista
Instituição-sede: Instituto de Geociências e Ciências Exatas (IGCE). Universidade Estadual Paulista (UNESP). Campus de Rio Claro. Rio Claro , SP, Brasil
Local de pesquisa : University of New South Wales (UNSW), Austrália  
Assunto(s):Aprendizado computacional   Classificação   Fluxo de dados   Mineração de dados

Resumo

Fluxos de dados são caracterizados por gerar dados continuamente, em grandes quantidades e com intervalo de tempo entre cada dado gerado altamente variado. São uma sequência ordenada de instâncias e podem ser potencialmente de tamanho ilimitado. Eles vêm ganhando bastante atenção nos últimos anos devido às inúmeras aplicações reais em ambientes dinâmicos que produzem dados não-estacionários e cujos métodos tradicionais de Mineração de Dados e Aprendizado de Máquina não são bem-sucedidos. Fluxos de dados podem apresentar mudanças nos padrões dos dados, de modo que uma possível alteração pode fazer com que os modelos preditivos fiquem desatualizados e, consequentemente, imprecisos. Neste cenário, a classificação de fluxo de dados é uma tarefa importante que tem se destacado, visto que requer atualizações constantes e adaptativas em seu modelo para que a taxa de acerto se mantenha estável, em virtude de alterações nas distribuições das classes e dos atributos ao longo do tempo. Além disso, em aplicações reais, raramente os rótulos das classes estão prontamente disponíveis para o treinamento de um modelo de predição. A presente pesquisa desenvolverá um método de classificação de fluxo de dados, explorando situações de mudança de conceitos e limitações como latência extrema e desbalanceamento de classes. Uma aplicação a ser investigada é a classificação de insetos vetores de importantes doenças infectocontagiosas, como as febres dengue e Zika.