Bolsa 17/10616-0 - Inteligência artificial, Aprendizado computacional

Processo:	17/10616-0
Modalidade de apoio:	Bolsas no Brasil - Iniciação Científica
Data de Início da vigência:	01 de agosto de 2017
Data de Término da vigência:	31 de dezembro de 2018
Área de conhecimento:	Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação

Pesquisador responsável:	Heloisa de Arruda Camargo
Beneficiário:	Rodolfo Krambeck Asbahr

Instituição Sede:	Centro de Ciências Exatas e de Tecnologia (CCET). Universidade Federal de São Carlos (UFSCAR). São Carlos , SP, Brasil

Assunto(s):	Inteligência artificial Aprendizado computacional Fluxo de dados Fuzzy (inteligência artificial) Agrupamento de dados Algoritmos e estruturas de dados Análise qualitativa comparativa (QCA) Metodologia e técnicas de computação
Palavra(s)-Chave do Pesquisador:	Agrupamento fuzzy \| Aprendizado de Máquina \| Desvio de Conceito \| Fluxo de Dados \| Inteligência Artificial
Resumo Fluxos de Dados são fontes de dados que têm tamanho indefinido, potencialmente infinito, e podem gerar exemplos com distribuição estatística mutável de acordo com o tempo. Essas características impõem desafios adicionais para a criação e uso de algoritmos de extração de conhecimento, o que impede a utilização direta de algoritmos tradicionais de aprendizado de máquina. Para fazer a extração de conhecimento útil em ambientes dinâmicos, métodos de aprendizado de máquina devem ser adaptados para considerar novos dados de forma contínua. Desde a última década, surgem cada vez mais métodos diferentes que aplicam processo de aprendizado em fluxo de dados. Devido ao grande número de fluxos que não possuem a informação de rótulo, os algoritmos de agrupamento são de grande interesse nesse contexto. Entre esses, é possível identificar duas abordagens: baseadas em framework on-line/off-line e baseadas em blocos de dados (chunks). Trabalhos recentes do grupo de pesquisa mostram que a flexibilidade do agrupamento fuzzy pode trazer benefícios na extração de conhecimento em fluxo de dados, embora tenha sido pouco explorada na literatura. Seguindo a linha das pesquisas do grupo, este trabalho aborda a extração de conhecimento de fluxo de dados por meio de algoritmos de agrupamento fuzzy baseados em blocos de dados. O objetivo geral é estudar, implementar e avaliar algoritmos selecionados para gerar análises de comportamento, visando subsidiar comparações entre algoritmos desenvolvidos por outros membros do grupo de pesquisa em que este trabalho está inserido. O candidato a esta bolsa já está desenvolvendo trabalho de iniciação científica, em que está sendo feita a implementação de algoritmos básicos da abordagem adotada. O trabalho proposto aqui dá continuidade ao que o aluno já vem desenvolvendo, com foco em métodos que tratam especificamente as questões de resposta a mudanças na distribuição dos dados que podem ocorrer ao longo do fluxo e de definição dinâmica do número de grupos para o agrupamento. A estratégia mais utilizada para atacar o problema de mudança na distribuição dos dados é diminuir a influência dos dados mais antigos no agrupamento mais atual, o que possibilita que o agrupamento se adapte às mudanças mais recentes. Por esse motivo, foram selecionados para estudo nesse trabalho dois algoritmos que possuem um fator de decaimento, o qual define a taxa de esquecimento dos dados antigos. Outra questão a ser considerada é o número de grupos definido para o agrupamento, uma vez que os algoritmos estendidos são particionais e exigem que esse número seja definido previamente. O terceiro algoritmo selecionado para este trabalho apresenta uma proposta simples de definição dinâmica de número de grupos. As implementações serão feitas em linguagem R, e os experimentos utilizarão conjuntos de dados de repositórios públicos e do repositório do grupo de pesquisa, incluindo conjuntos rotulados e não rotulados, estacionários e não estacionários. As análises comparativas vão envolver os algoritmos estudados e implementados neste trabalho, os algoritmos da mesma abordagem implementados na etapa anterior e os algoritmos desenvolvidos por outros membros do grupo. Espera-se obter, como resultado, além da implementação dos algoritmos e de um conjunto de execuções de experimentos, análises quantitativas e qualitativas significativas e úteis para este e para outros trabalhos do grupo. A execução deste trabalho vai possibilitar a formação do aluno em um campo de pesquisa atual e relevante como o aprendizado de máquina em FD, ampliando suas oportunidades de atuação e de evolução profissional.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itens Menos itens
TITULO

Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itens Menos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

URL curto