Bolsa 21/12278-0 - Aprendizado computacional, Classificação - BV FAPESP
Busca avançada
Ano de início
Entree

Classificação e quantificação em fluxos de dados não-estacionários com mudança de conceito

Processo: 21/12278-0
Modalidade de apoio:Bolsas no Exterior - Pesquisa
Data de Início da vigência: 01 de maio de 2022
Data de Término da vigência: 30 de abril de 2023
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Adriane Beatriz de Souza Serapião
Beneficiário:Adriane Beatriz de Souza Serapião
Pesquisador Anfitrião: Gustavo Enrique de Almeida Prado Alves Batista
Instituição Sede: Instituto de Geociências e Ciências Exatas (IGCE). Universidade Estadual Paulista (UNESP). Campus de Rio Claro. Rio Claro , SP, Brasil
Instituição Anfitriã: University of New South Wales (UNSW), Austrália  
Assunto(s):Aprendizado computacional   Classificação   Fluxo de dados   Mineração de dados   Quantificação
Palavra(s)-Chave do Pesquisador:Aprendizado de Máquina | Classificação | Fluxo de Dados | Mineração de Dados | quantificação | Aprendizado de Máquina

Resumo

Fluxos de dados são caracterizados por gerar dados continuamente, em grandes quantidades e com intervalo de tempo entre cada observação altamente variado. São uma sequência ordenada de instâncias e podem ser potencialmente de tamanho ilimitado. Eles vêm ganhando bastante atenção nos últimos anos devido às inúmeras aplicações reais em ambientes dinâmicos que produzem dados não-estacionários e cujos métodos tradicionais de Mineração de Dados e Aprendizado de Máquina não são bem-sucedidos. Fluxos de dados podem apresentar mudanças nos padrões dos dados, de modo que uma possível alteração pode fazer com que os modelos preditivos fiquem desatualizados e, consequentemente, imprecisos. Neste cenário, a classificação e a quantificação em fluxos de dados são tarefas importantes que têm se destacado, visto que requerem atualizações constantes e adaptativas em seu modelo para que a taxa de acerto se mantenha estável, em virtude de alterações nas distribuições das classes e dos atributos ao longo do tempo. Em aplicações reais, raramente os rótulos das classes estão prontamente disponíveis para o treinamento de um modelo de predição. A presente pesquisa pretende desenvolver um método de classificação em fluxo de dados, explorando situações de mudança de conceitos. Vários problemas do mundo real demandam métodos efetivos que não requerem previsões para observações individuais, concentrando-se na obtenção de estimativas precisas em um nível agregado, como a distribuição de classes em um problema de classificação. A quantificação é uma tarefa que consiste em estimar a frequência relativa (prevalência) das classes de interesse em um conjunto não rotulado, dado um conjunto de treinamento de itens rotulados de acordo com as mesmas classes. Possui aplicação natural em contextos em que os dados de treinamento podem não exibir o mesmo padrão de prevalência de classe que os dados de teste. Assim, modelos de quantificação serão também propostos nesta pesquisa para lidar com mudanças na distribuição de classes. Uma aplicação a ser investigada é a classificação e a quantificação de insetos vetores de importantes doenças infectocontagiosas, como as febres dengue e Zika. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)