Bolsa 23/14070-2 - Aprendizado computacional, Algoritmos - BV FAPESP
Busca avançada
Ano de início
Entree

Algoritmos de agrupamento fuzzy c-means baseados no Kernel Gaussiano com aprendizado automático de parâmetros de largura

Processo: 23/14070-2
Modalidade de apoio:Bolsas no Brasil - Programa Estímulo a Vocações Científicas
Data de Início da vigência: 05 de janeiro de 2024
Data de Término da vigência: 24 de fevereiro de 2024
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Francisco de Assis Tenorio de Carvalho
Beneficiário:Débora van Putten Chaves
Instituição Sede: Centro de Informática (CIn). Universidade Federal de Pernambuco (UFPE). Ministério da Educação (Brasil). Recife , SP, Brasil
Assunto(s):Aprendizado computacional   Algoritmos   Sistemas fuzzy
Palavra(s)-Chave do Pesquisador:Bandwidth parameter | Fuzzy Clustering | Fuzzy c-means | Gaussian kernel functions | Aprendizagem de Máquina

Resumo

Os algoritmos de agrupamento fuzzy c-means baseados no kernel gaussiano convencional requerem a seleção do hiperparâmetro de largura. Este hiperparâmetro é ajustado de uma vez por todas e é o mesmo para todas as variáveis. Assim, implicitamente, esses algoritmos de agrupamento assumem que as variáveis têm a mesma importância para a tarefa de agrupamento. Além disso, o desempenho desses algoritmos depende da seleção do hiperparâmetro de largura, que precisa ser otimizada. Tradicionalmente, são usadas abordagens empíricas e de validação cruzada para essa otimização. Além disso, poucas abordagens foram propostas para aprender automaticamente o parâmetro de largura. Nesta pesquisa pretendemos estudar e comparar duas abordagens anteriores com aprendizado automatizado do(s) parâmetro(s) de largura. A primeira é um algoritmo de agrupamento fuzzy c-means baseado em funções de kernel com um parâmetro de largura otimizado que é atualizado de acordo com o método de gradiente de maneira iterativa. Nessa primeira abordagem, o parâmetro de largura é atualizado em cada iteração do algoritmo, mas é único para todas as variáveis. A segunda é um algoritmo de agrupamento fuzzy c-means que aprende os parâmetros de largura usando um kernel gaussiano adaptativo. Nessa segunda abordagem, cada variável tem o seu próprio parâmetro de largura que também é atualizado em cada iteração do algoritmo. As atividades a serem desenvolvidas pela bolsista contribuirão para a avaliação das duas abordagens através de estatísticas (média, desvio-padrão) e testes de hipóteses, baseadas em índices que medem a qualidade da partição fuzzy produzida por esses algoritmos. Isso ajudará a produzir evidências sobre se a diferença observada entre as duas variantes, em termos da qualidade da partição produzida, é devido ao acaso ou se, em média, uma delas é superior a outra. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)