Busca avançada
Ano de início
Entree

Algoritmos de agrupamento fuzzy para fluxo de dados

Processo: 17/10616-0
Linha de fomento:Bolsas no Brasil - Iniciação Científica
Vigência (Início): 01 de agosto de 2017
Vigência (Término): 31 de dezembro de 2018
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Heloisa de Arruda Camargo
Beneficiário:Rodolfo Krambeck Asbahr
Instituição-sede: Centro de Ciências Exatas e de Tecnologia (CCET). Universidade Federal de São Carlos (UFSCAR). São Carlos , SP, Brasil
Assunto(s):Inteligência artificial   Aprendizado computacional   Fluxo de dados   Fuzzy (inteligência artificial)   Agrupamento de dados   Algoritmos e estruturas de dados   Análise qualitativa comparativa (QCA)   Metodologia e técnicas de computação

Resumo

Fluxos de Dados são fontes de dados que têm tamanho indefinido, potencialmente infinito, e podem gerar exemplos com distribuição estatística mutável de acordo com o tempo. Essas características impõem desafios adicionais para a criação e uso de algoritmos de extração de conhecimento, o que impede a utilização direta de algoritmos tradicionais de aprendizado de máquina. Para fazer a extração de conhecimento útil em ambientes dinâmicos, métodos de aprendizado de máquina devem ser adaptados para considerar novos dados de forma contínua. Desde a última década, surgem cada vez mais métodos diferentes que aplicam processo de aprendizado em fluxo de dados. Devido ao grande número de fluxos que não possuem a informação de rótulo, os algoritmos de agrupamento são de grande interesse nesse contexto. Entre esses, é possível identificar duas abordagens: baseadas em framework on-line/off-line e baseadas em blocos de dados (chunks). Trabalhos recentes do grupo de pesquisa mostram que a flexibilidade do agrupamento fuzzy pode trazer benefícios na extração de conhecimento em fluxo de dados, embora tenha sido pouco explorada na literatura. Seguindo a linha das pesquisas do grupo, este trabalho aborda a extração de conhecimento de fluxo de dados por meio de algoritmos de agrupamento fuzzy baseados em blocos de dados. O objetivo geral é estudar, implementar e avaliar algoritmos selecionados para gerar análises de comportamento, visando subsidiar comparações entre algoritmos desenvolvidos por outros membros do grupo de pesquisa em que este trabalho está inserido. O candidato a esta bolsa já está desenvolvendo trabalho de iniciação científica, em que está sendo feita a implementação de algoritmos básicos da abordagem adotada. O trabalho proposto aqui dá continuidade ao que o aluno já vem desenvolvendo, com foco em métodos que tratam especificamente as questões de resposta a mudanças na distribuição dos dados que podem ocorrer ao longo do fluxo e de definição dinâmica do número de grupos para o agrupamento. A estratégia mais utilizada para atacar o problema de mudança na distribuição dos dados é diminuir a influência dos dados mais antigos no agrupamento mais atual, o que possibilita que o agrupamento se adapte às mudanças mais recentes. Por esse motivo, foram selecionados para estudo nesse trabalho dois algoritmos que possuem um fator de decaimento, o qual define a taxa de esquecimento dos dados antigos. Outra questão a ser considerada é o número de grupos definido para o agrupamento, uma vez que os algoritmos estendidos são particionais e exigem que esse número seja definido previamente. O terceiro algoritmo selecionado para este trabalho apresenta uma proposta simples de definição dinâmica de número de grupos. As implementações serão feitas em linguagem R, e os experimentos utilizarão conjuntos de dados de repositórios públicos e do repositório do grupo de pesquisa, incluindo conjuntos rotulados e não rotulados, estacionários e não estacionários. As análises comparativas vão envolver os algoritmos estudados e implementados neste trabalho, os algoritmos da mesma abordagem implementados na etapa anterior e os algoritmos desenvolvidos por outros membros do grupo. Espera-se obter, como resultado, além da implementação dos algoritmos e de um conjunto de execuções de experimentos, análises quantitativas e qualitativas significativas e úteis para este e para outros trabalhos do grupo. A execução deste trabalho vai possibilitar a formação do aluno em um campo de pesquisa atual e relevante como o aprendizado de máquina em FD, ampliando suas oportunidades de atuação e de evolução profissional.