Busca avançada
Ano de início
Entree

Método para extração de conhecimento de fluxos de dados - algoritmo k- vizinhos mais próximos anytime incremental

Processo: 14/14174-3
Linha de fomento:Bolsas no Exterior - Estágio de Pesquisa - Mestrado
Vigência (Início): 06 de outubro de 2014
Vigência (Término): 05 de abril de 2015
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Matemática da Computação
Pesquisador responsável:Gustavo Enrique de Almeida Prado Alves Batista
Beneficiário:Cristiano Inácio Lemes
Supervisor no Exterior: Pedro Pereira Rodrigues
Instituição-sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Local de pesquisa : Universidade do Porto (UP), Portugal  
Vinculado à bolsa:13/16081-0 - Algoritmos Anytime para classificação de fluxos de dados com aplicação em classificação de insetos, BP.MS
Assunto(s):Aprendizado computacional

Resumo

Aprendizado em fluxo de dados é uma área de pesquisa importante e que vem crescendo nos últimos tempos. Vários algoritmos de aprendizado aplicados a fluxo de dados tem sido desenvolvidos. Para que um sistema de aprendizado obtenha sucesso na aquisição de conhecimento é preciso que ele apresente algumas características: (i) atualize o modelo de decisão ao longo do tempo; (ii) realize o aprendizado online, processando o exemplo assim que ele estiver disponível; (iii) realize o processamento de cada exemplo o mais rápido possível utilizando uma quantidade de memória fixa, considerando que em problemas reais exista restrições de recursos computacionais; (iv) gere o modelo de decisão realizando a leitura dos dados de treinamento uma única vez; e (v) trate a mudança de conceitos dos dados, uma vez que não pode-se assumir que os dados são gerados por uma distribuição de probabilidade estacionária. O algoritmo k-vizinhos mais próximos apresenta bons resultados quando aplicados a problemas estacionários, porém seu desempenho é inferior no cenário de fluxo de dados. A versão anytime deste algoritmo apresenta uma boa solução para o cenário de fluxo de dados onde o intervalo de tempo que ocorre os eventos é variado, porém não trata a mudança de conceito que ocorre eventualmente nos dados. Já a versão incremental dele resolve o problema da mudança de conceito, porém não é capaz de prover uma resposta rápida necessária em problemas de fluxo de dados de eventos constantes que ocorrem em tempo altamente variado. Neste projeto pretende-se pesquisar métodos para adaptar o algoritmo k-vizinhos mais próximos que possua as características dos algoritmos anytime e seja capaz de tratar a mudança de conceito dos dados, buscando assim por um algoritmo k-vizinhos mais próximos anytime incremental. (AU)