Busca avançada
Ano de início
Entree

Redução do Tamanho do Conjunto de Treinamento por Floresta de Caminhos Ótimos e sua Aplicação em Máquinas de Vetores de Suporte

Processo: 10/11676-7
Modalidade de apoio:Bolsas no Brasil - Iniciação Científica
Data de Início da vigência: 01 de outubro de 2010
Data de Término da vigência: 30 de setembro de 2011
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:João Paulo Papa
Beneficiário:Rodrigo Yuji Mizobe Nakamura
Instituição Sede: Faculdade de Ciências (FC). Universidade Estadual Paulista (UNESP). Campus de Bauru. Bauru , SP, Brasil
Vinculado ao auxílio:09/16206-1 - Novas tendências em reconhecimento de padrões baseado em floresta de caminhos ótimos, AP.JP
Assunto(s):Aprendizado computacional   Inteligência artificial   Reconhecimento de padrões   Processamento de imagens
Palavra(s)-Chave do Pesquisador:Aprendizado de Máquina | Processamento de imagens | Reconhecimento de Padrões | Inteligência Artificial

Resumo

Classificadores supervisionados de padrões tradicionais, tais como Máquinas de Vetores de Suporte e Redes Neurais Artificiais, possuem um bom desempenho em determinadas aplicações. Entretanto, para atingir taxas de acerto aceitáveis no conjunto de dados de teste, tais abordagens pagam o preço de uma fase de treinamento extremamente custosa. Máquinas de Vetores de Suporte, por exemplo, assumem uma separabilidade linear do espaço de características, mapeando as amostras para um espaço de maior dimensão utilizando funções de núcleo. Usualmente, tais funções possuem parâmetros que necessitam ser escolhidos com muito cuidado, pois influenciam diretamente na taxa de acerto no conjunto de treinamento e, consequentemente, no conjunto de dados de teste. Assim, esses tipos de classificadores são inviáveis em situações nas quais um treinamento dos dados é requerido em tempo real como, por exemplo, aplicativos para classificação interativa de regiões do cérebro utilizando imagens de ressonância magnética, as quais são constituídas por milhões de voxels. Imagine um sistema no qual um médico marca algumas amostras da região a ser classificada. O algoritmo é então treinado com essas amostras e validado com o restante da imagem. O resultado é então mostradoao usuário, o qual pode interagir com o sistema marcando novas amostras com o intuito de refinar o processo de classificação. Assim, um novo treinamento do classificador é requerido. Esse processo repete-se até que o usuário fique satisfeito. Esse contexto torna inviável a utilização das Redes Neurais e Máquinas de Vetores de Suporte, pois é razoável que o usuário espere apenas alguns segundos para visualizaro resultado do processo classificatório e não minutos e, talvez, horas. Recentemente,um novo classificador de padrões baseado em grafos foi proposto na literatura com onome de Floresta de Caminhos Ótimos. A idéia consiste, basicamente, em modelaro problema de classificação de padrões como um problema de particionamento de um grafo em árvores de caminhos ótimos a partir de amostras protótipos. Tal classificador possui, dentre outras vantagens, ser livre de parâmetros, não assumir forma e/ou separabilidade das amostras e ser extremamente rápido (500 vezes mais rápido que Máquinas de Vetores de Suporte, por exemplo), tanto na fase de treinamentoquanto na de teste. Há pouco tempo atrás, foi também proposta na literatura uma abordagem para redução do tamanho do conjunto de treinamento para o classificador Floresta de Caminhos Ótimos a qual consiste, basicamente, em um algoritmo deaprendizagem que consegue identificar as amostras mais relevantes do conjunto de treinamento, descartando as demais. Tal metodologia conseguiu, em algumas bases de dados, aproximadamente 40% de redução no tamanho do conjunto de treinamento com uma sensível intervenção na taxa de acerto no conjunto de teste. Como o classificador Máquinas de Vetores de suporte é bastante conhecido na literatura pelas suas altas taxas de acerto de classificação, o presente projeto de pesquisapropõe a redução do tamanho do conjunto de treinamento pela abordagem Floresta de Caminhos Ótimos e sua posterior utilização para treinamento das Máquinas de Vetores de Suporte. O objetivo seria, então, avaliar o impacto de tal redução do conjunto de treinamento em termos de eficiência e eficácia computacional do classificador Máquinas de Vetores de Suporte, e sua comparação com os resultados obtidos pelopróprio classificador Floresta de Caminhos Ótimos. Assim, o projeto de pesquisa caracteriza-se pelo seu caráter inovador neste sentido, visto que nenhuma pesquisa a respeito foi proposta na literatura.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas (7)
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
PEREIRA, CLAYTON R.; NAKAMURA, RODRIGO Y. M.; COSTA, KELTON A. P.; PAPA, JOAO P.. An Optimum-Path Forest framework for intrusion detection in computer networks. ENGINEERING APPLICATIONS OF ARTIFICIAL INTELLIGENCE, v. 25, n. 6, p. 1226-1234, . (10/11676-7, 10/02045-3)
PISANI, RODRIGO JOSE; MIZOBE NAKAMURA, RODRIGO YUJI; RIEDEL, PAULINA SETTI; LOPES ZIMBACK, CELIA REGINA; FALCAO, ALEXANDRE XAVIER; PAPA, JOAO PAULO. Toward Satellite-Based Land Cover Classification Through Optimum-Path Forest. IEEE TRANSACTIONS ON GEOSCIENCE AND REMOTE SENSING, v. 52, n. 10, p. 6075-6085, . (10/11676-7, 09/16206-1)
PEREIRA, LUIS A. M.; NAKAMURA, RODRIGO Y. M.; DE SOUZA, GUILHERME F. S.; MARTINS, DAGOBERTO; PAPA, JOAO P.. Aquatic weed automatic classification using machine learning techniques. COMPUTERS AND ELECTRONICS IN AGRICULTURE, v. 87, p. 56-63, . (10/11676-7, 11/14094-1, 10/12222-0, 11/14058-5)
PISANI, R.; RIEDEL, P.; GOMES, A.; MIZOBE, R.; PAPA, J.; IEEE. IS IT POSSIBLE TO MAKE PIXEL-BASED RADAR IMAGE CLASSIFICATION USER-FRIENDLY?. 2011 IEEE INTERNATIONAL GEOSCIENCE AND REMOTE SENSING SYMPOSIUM (IGARSS), v. N/A, p. 4-pg., . (10/11676-7, 09/16206-1)
PISANI, R.; RIEDEL, P.; FERREIRA, M.; MARQUES, M.; MIZOBE, R.; PAPA, J.; IEEE. LAND USE IMAGE CLASSIFICATION THROUGH OPTIMUM-PATH FOREST CLUSTERING. 2011 IEEE INTERNATIONAL GEOSCIENCE AND REMOTE SENSING SYMPOSIUM (IGARSS), v. N/A, p. 4-pg., . (10/11676-7, 09/16206-1)
PAPA, JOAO P.; GUTIERREZ, MARIO E. M.; NAKAMURA, RODRIGO Y. M.; PAPA, LUCIENE P.; VICENTINI, IRENE B. F.; VICENTINI, CARLOS A.; IEEE. Automatic Classification of Fish Germ Cells Through Optimum-Path Forest. 2011 ANNUAL INTERNATIONAL CONFERENCE OF THE IEEE ENGINEERING IN MEDICINE AND BIOLOGY SOCIETY (EMBC), v. N/A, p. 4-pg., . (10/11676-7, 09/16206-1)
PEREIRA, CLAYTON; NAKAMURA, RODRIGO; PAPA, JOAO PAULO; COSTA, KELTON; PFEIFER, T; JAYASUMANA, A; ASCHENBRUCK, N. Intrusion Detection System Using Optimum-Path Forest. 2011 IEEE 36TH CONFERENCE ON LOCAL COMPUTER NETWORKS (LCN), v. N/A, p. 4-pg., . (10/11676-7, 09/16206-1, 10/02045-3)