Busca avançada
Ano de início
Entree
(Referência obtida automaticamente do Web of Science, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores.)

Feature Selection via Pareto Multi-objective Genetic Algorithms

Texto completo
Autor(es):
Spolaor, Newton [1, 2] ; Lorena, Ana Carolina [3] ; Lee, Huei Diana [2]
Número total de Autores: 3
Afiliação do(s) autor(es):
[1] Univ Sao Paulo, Lab Computat Intelligence LABIC, Sao Carlos, SP - Brazil
[2] Western Parana State Univ UNIOESTE, Lab Bioinformat LABI, Foz Do Iguacu - Brazil
[3] Fed Univ Sao Paulo UNIFESP, STI, Sao Jose Dos Campos - Brazil
Número total de Afiliações: 3
Tipo de documento: Artigo Científico
Fonte: APPLIED ARTIFICIAL INTELLIGENCE; v. 31, n. 9-10, p. 764-791, 2017.
Citações Web of Science: 0
Resumo

Feature selection, an important combinatorial optimization problem in data mining, aims to find a reduced subset of features of high quality in a dataset. Different categories of importance measures can be used to estimate the quality of a feature subset. Since each measure provides a distinct perspective of data and of which are their important features, in this article we investigate the simultaneous optimization of importance measures from different categories using multi-objective genetic algorithms grounded in the Pareto theory. An extensive experimental evaluation of the proposed method is presented, including an analysis of the performance of predictive models built using the selected subsets of features. The results show the competitiveness of the method in comparison with six feature selection algorithms. As an additional contribution, we conducted a pioneer, rigorous, and replicable systematic review on related work. As a result, a summary of 93 related papers strengthens features of our method. (AU)

Processo FAPESP: 09/12963-2 - Aplicação de Algoritmos Genéticos Multiobjetivo ao Problema de Seleção de Atributos
Beneficiário:Newton Spolaôr
Modalidade de apoio: Bolsas no Brasil - Mestrado
Processo FAPESP: 12/22608-8 - Uso de medidas de complexidade de dados no suporte ao aprendizado de máquina supervisionado
Beneficiário:Ana Carolina Lorena
Modalidade de apoio: Auxílio à Pesquisa - Jovens Pesquisadores