Busca avançada
Ano de início
Entree

Meta-Aprendizado Aplicado a Dados Desbalanceados Usando Medidas de Complexidade de Dados

Processo: 19/13015-2
Modalidade de apoio:Bolsas no Exterior - Estágio de Pesquisa - Doutorado
Data de Início da vigência: 01 de setembro de 2019
Data de Término da vigência: 31 de maio de 2020
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:André Carlos Ponce de Leon Ferreira de Carvalho
Beneficiário:Victor Hugo Barella
Supervisor: Nathalie Japkowicz
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Instituição Anfitriã: American University (AU), Estados Unidos  
Vinculado à bolsa:15/01382-0 - Influência do tratamento de dados em algoritmos de classificação, BP.DR
Assunto(s):Aprendizado computacional   Meta-aprendizado computacional
Palavra(s)-Chave do Pesquisador:Dados Desbalanceados | Medidas de Complexidade de Dados | Meta-Aprendizado | Aprendizado de Máquina

Resumo

A influência de dados desbalanceados no desempenho preditivo de modelos é amplamente estudada. Tarefas de classificação com dados desbalanceados não são desafiadoras por si só. Quando as classes são linearmente separáveis, um algoritmo de classificação tradicional normalmente induz modelos preditivos capazes de distinguir as classes apropriadamente. O desbalanceamento impõe dificuldade quando os conjuntos de treinamento possuem classes com sobreposição ou bordas de decisão complexas. Medir tais características é fundamental para entender a dificuldade da tarefa de classificação e escolher técnicas de pré-processamento adequadas para dados desbalanceados. Foram propostas medidas capazes de identificar a complexidade de uma tarefa de classificação para um dado conjunto de dados, chamadas de medidas de complexidade de dados. Tais medidas usam diferentes critérios para determinar a dificuldade que um conjunto de dados impõe a qualquer algoritmo de classificação para induzir um modelo. Este projeto propõe usar as medidas de complexidade de dados em uma abordagem de meta-aprendizado para avaliar as características relativas à natureza do problema de desbalancemento de classes em tarefas de classificação.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)