| Processo: | 21/12278-0 |
| Modalidade de apoio: | Bolsas no Exterior - Pesquisa |
| Data de Início da vigência: | 01 de maio de 2022 |
| Data de Término da vigência: | 30 de abril de 2023 |
| Área de conhecimento: | Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação |
| Pesquisador responsável: | Adriane Beatriz de Souza Serapião |
| Beneficiário: | Adriane Beatriz de Souza Serapião |
| Pesquisador Anfitrião: | Gustavo Enrique de Almeida Prado Alves Batista |
| Instituição Sede: | Instituto de Geociências e Ciências Exatas (IGCE). Universidade Estadual Paulista (UNESP). Campus de Rio Claro. Rio Claro , SP, Brasil |
| Instituição Anfitriã: | University of New South Wales (UNSW), Austrália |
| Assunto(s): | Aprendizado computacional Classificação Fluxo de dados Mineração de dados Quantificação |
| Palavra(s)-Chave do Pesquisador: | Aprendizado de Máquina | Classificação | Fluxo de Dados | Mineração de Dados | quantificação | Aprendizado de Máquina |
Resumo Fluxos de dados são caracterizados por gerar dados continuamente, em grandes quantidades e com intervalo de tempo entre cada observação altamente variado. São uma sequência ordenada de instâncias e podem ser potencialmente de tamanho ilimitado. Eles vêm ganhando bastante atenção nos últimos anos devido às inúmeras aplicações reais em ambientes dinâmicos que produzem dados não-estacionários e cujos métodos tradicionais de Mineração de Dados e Aprendizado de Máquina não são bem-sucedidos. Fluxos de dados podem apresentar mudanças nos padrões dos dados, de modo que uma possível alteração pode fazer com que os modelos preditivos fiquem desatualizados e, consequentemente, imprecisos. Neste cenário, a classificação e a quantificação em fluxos de dados são tarefas importantes que têm se destacado, visto que requerem atualizações constantes e adaptativas em seu modelo para que a taxa de acerto se mantenha estável, em virtude de alterações nas distribuições das classes e dos atributos ao longo do tempo. Em aplicações reais, raramente os rótulos das classes estão prontamente disponíveis para o treinamento de um modelo de predição. A presente pesquisa pretende desenvolver um método de classificação em fluxo de dados, explorando situações de mudança de conceitos. Vários problemas do mundo real demandam métodos efetivos que não requerem previsões para observações individuais, concentrando-se na obtenção de estimativas precisas em um nível agregado, como a distribuição de classes em um problema de classificação. A quantificação é uma tarefa que consiste em estimar a frequência relativa (prevalência) das classes de interesse em um conjunto não rotulado, dado um conjunto de treinamento de itens rotulados de acordo com as mesmas classes. Possui aplicação natural em contextos em que os dados de treinamento podem não exibir o mesmo padrão de prevalência de classe que os dados de teste. Assim, modelos de quantificação serão também propostos nesta pesquisa para lidar com mudanças na distribuição de classes. Uma aplicação a ser investigada é a classificação e a quantificação de insetos vetores de importantes doenças infectocontagiosas, como as febres dengue e Zika. (AU) | |
| Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa: | |
| Mais itensMenos itens | |
| TITULO | |
| Matéria(s) publicada(s) em Outras Mídias ( ): | |
| Mais itensMenos itens | |
| VEICULO: TITULO (DATA) | |
| VEICULO: TITULO (DATA) | |