Busca avançada
Ano de início
Entree

Meta-aprendizado aplicado a dados desbalanceados usando medidas de complexidade de dados

Processo: 19/13015-2
Linha de fomento:Bolsas no Exterior - Estágio de Pesquisa - Doutorado
Vigência (Início): 01 de setembro de 2019
Vigência (Término): 31 de maio de 2020
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:André Carlos Ponce de Leon Ferreira de Carvalho
Beneficiário:Victor Hugo Barella
Supervisor no Exterior: Nathalie Japkowicz
Instituição-sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Local de pesquisa : American University (AU), Estados Unidos  
Vinculado à bolsa:15/01382-0 - Influência do tratamento de dados em algoritmos de classificação, BP.DR
Assunto(s):Aprendizado computacional

Resumo

A influência de dados desbalanceados no desempenho preditivo de modelos é amplamente estudada. Tarefas de classificação com dados desbalanceados não são desafiadoras por si só. Quando as classes são linearmente separáveis, um algoritmo de classificação tradicional normalmente induz modelos preditivos capazes de distinguir as classes apropriadamente. O desbalanceamento impõe dificuldade quando os conjuntos de treinamento possuem classes com sobreposição ou bordas de decisão complexas. Medir tais características é fundamental para entender a dificuldade da tarefa de classificação e escolher técnicas de pré-processamento adequadas para dados desbalanceados. Foram propostas medidas capazes de identificar a complexidade de uma tarefa de classificação para um dado conjunto de dados, chamadas de medidas de complexidade de dados. Tais medidas usam diferentes critérios para determinar a dificuldade que um conjunto de dados impõe a qualquer algoritmo de classificação para induzir um modelo. Este projeto propõe usar as medidas de complexidade de dados em uma abordagem de meta-aprendizado para avaliar as características relativas à natureza do problema de desbalancemento de classes em tarefas de classificação.