| Processo: | 15/08059-0 |
| Modalidade de apoio: | Bolsas no Brasil - Iniciação Científica |
| Data de Início da vigência: | 01 de julho de 2015 |
| Data de Término da vigência: | 30 de junho de 2016 |
| Área de conhecimento: | Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação |
| Pesquisador responsável: | Veronica Oliveira de Carvalho |
| Beneficiário: | Davi Duarte de Paula |
| Instituição Sede: | Instituto de Geociências e Ciências Exatas (IGCE). Universidade Estadual Paulista (UNESP). Campus de Rio Claro. Rio Claro , SP, Brasil |
| Assunto(s): | Mineração de dados Agrupamento de dados Estrutura de grupo Nanoclusters Metodologia e técnicas de computação |
| Palavra(s)-Chave do Pesquisador: | Agrupamento | Medidas de Avaliação Objetivas | Pós-processamento | Regras de Associação | Mineração de Dados |
Resumo Muitas medidas de avaliação objetivas (MOs) foram propostas nos últimos anos como meio de pós-processar regras de associação. Desse modo, o primeiro desafio durante um processo de exploração é decidir qual MO utilizar. Para tanto, pode-se: (a) reduzir o número de MOs a serem selecionadas; (b) agregar valores de MOs em um único valor de importância como meio de não ter que selecionar uma MO adequada. O problema relacionado a (a) é que muitas MOs podem ainda remanescer. Em relação a (b), uma equação ótima, que deriva um valor único, é geralmente obtida, a qual pode não ser muita bem compreendida pelo usuário. Nesse contexto, [Carvalho et al., 2015] propõem um processo para agrupar regras de associação, tendo como base a similaridade existente entre os rankings obtidos por um conjunto de MOs, de modo a direcionar o usuário aos padrões interessantes do domínio. A ideia é resolver o problema relacionado a identificação de um conjunto adequado de MOs, combinando implicitamente MOs, sem usar nenhum método de otimização. Desse modo, com esse processo (i) não é necessário selecionar um conjunto adequado de MOs, nem agregar explicitamente muitas MOs, a fim de ranquear as regras para encontrar aquelas consideradas interessantes; (ii) o espaço de exploração pode ser reduzido uma vez que considera-se que existe um subconjunto de grupos que contém todas as regras interessantes, de tal modo que um pequeno número de grupos tenha que ser explorado. Entretanto, o processo apresenta algumas lacunas a serem exploradas.Diante do exposto, este projeto de Iniciação Científica tem como objetivo aprimorar o processo proposto por [Carvalho et al., 2015] a fim de: (a) explorar meios de ranquear os clusters de modo que o usuário explore apenas os n primeiros grupos (aqueles que irão conter os padrões interessantes); (b) explorar outros meios de ranquear as regras dentro dos clusters para tentar obter melhores resultados; (c) explorar os resultados do processo quando as MOs utilizadas no agrupamento são redundantes (i.e., levam ao mesmo ranqueamento). | |
| Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa: | |
| Mais itensMenos itens | |
| TITULO | |
| Matéria(s) publicada(s) em Outras Mídias ( ): | |
| Mais itensMenos itens | |
| VEICULO: TITULO (DATA) | |
| VEICULO: TITULO (DATA) | |