A systematic comparison of supervised classifiers

Processo:	14/04930-5
Modalidade de apoio:	Auxílio à Pesquisa - Publicações científicas - Artigo
Data de Início da vigência:	01 de abril de 2014
Data de Término da vigência:	30 de setembro de 2014
Área do conhecimento:	Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação

Pesquisador responsável:	Odemir Martinez Bruno
Beneficiário:	Odemir Martinez Bruno

Instituição Sede:	Instituto de Física de São Carlos (IFSC). Universidade de São Paulo (USP). São Carlos , SP, Brasil

Assunto(s):	Análise de algoritmos Análise multivariada Reconhecimento de padrões Publicações de divulgação científica Artigo científico
Palavra(s)-Chave do Pesquisador:	análise multivariada \| classificadores supervisionados \| comparação de algoritmos \| Reconhecimento de Padrões \| Reconhecimento de padrões

Resumo

Técnicas de reconhecimento de padrões têm sido amplamente empregadas em aplicações industriais, médicas, comerciais e acadêmicas. Para lidar com esta grande diversidade de dados, muitas técnicas têm sido desenvolvidas. Infelizmente, apesar da longa tradição histórica da área de reconhecimento de padrões, não existe ainda uma técnica única capaz de gerar a melhor classificação em todos os cenários. Portanto, a utilização de várias técnicas se apresenta como uma prática fundamental em aplicações onde a máxima qualidade de classificação é desejada. Os trabalhos típicos na literatura comparando classificadores ou enfatizam o desempenho de um dado método em testes de validação ou comparam sistematicamente vários algoritmos, assumindo que o uso prático de métodos é feito por especialistas. Em várias ocasiões, no entanto, pesquisadores não especialistas são enfrentam problemas de classificação práticos sem se preocupar com questões mais complexas a respeito dos mecanismos de funcionamento de parâmetros de tais métodos. Na verdade, a escolha adequada de classificadores e parâmetros em tais contextos práticos ainda hoje representa uma das dificuldades enfrentadas na aplicação de métodos de reconhecimento de autoria. Neste estudo, analisamos o desempenho de nove classificadores famosos, os quais são implementados pelo framework Weka. Em especial, estudamos também a influência da escolha dos parâmetros no desempenho dos classificadores. A análise de desempenho com parâmetros padrões avaliadas em um banco de dados artificial com distribuição gaussiana mostrou que o algoritmo k-nearest-neighbors (kNN) apresenta um desempenho superior aos outros classificadores quando dimensões maiores são analisadas. Quando outras configurações de parâmetros são permitidas, descobrimos ser possível melhorar a qualidade de support vector machines (SVM) em mais de 20% mesmo se os parâmetros são estabelecidos aleatoriamente. As investigações conduzidas neste estudo sugerem que, exceto para o algoritmo SVM, os parâmetros padrões do Weka fornecem um desempenho próximo àquele obtido com a configuração ótima. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:

Mais itens Menos itens

TITULO

Matéria(s) publicada(s) em Outras Mídias ( ):

Mais itens Menos itens

VEICULO: TITULO (DATA)

Publicações científicas

(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)

AMANCIO, DIEGO RAPHAEL; COMIN, CESAR HENRIQUE; CASANOVA, DALCIMAR; TRAVIESO, GONZALO; BRUNO, ODEMIR MARTINEZ; RODRIGUES, FRANCISCO APARECIDO; COSTA, LUCIANO DA FONTOURA. A Systematic Comparison of Supervised Classifiers. PLoS One, v. 9, n. 4, APR 24 2014. (13/06717-4, 10/00927-9, 11/22639-8, 13/14984-2, 10/19440-2, 14/04930-5, 11/50761-2)

URL curto