Busca avançada
Ano de início
Entree

Técnicas para dados desbalanceados em classificação hierárquica

Processo: 13/15856-8
Modalidade de apoio:Bolsas no Brasil - Mestrado
Data de Início da vigência: 01 de maio de 2014
Data de Término da vigência: 28 de fevereiro de 2015
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:André Carlos Ponce de Leon Ferreira de Carvalho
Beneficiário:Victor Hugo Barella
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Classificação hierárquica   Aprendizado computacional   Aprendizado de máquina supervisionado   Algoritmos   Banco de dados
Palavra(s)-Chave do Pesquisador:Aprendizado Supervisionado | Classificação Hierárquica | Dados Desbalanceados | Desbalanceamento de Dados | Aprendizado de Máquina

Resumo

Muitos dos principais algoritmos de Aprendizado de Máquina não conseguem bom desempenho de classificação em cenários nos quais há desproporção entre as quantidades de exemplos de classes diferentes. Tal problema é conhecido como desbalanceamento de dados (ou classes desbalanceadas), o qual é o objeto de estudo deste projeto. Entre os desafios de trabalhar com bases de dados dessa natureza é lidar com distribuições de exemplos bem distintas entre os grupos e conjuntos de dados em que as classes estão mal representadas, como os que possuem um número pequeno de exemplos e com regiões de sobreposição. Várias aplicações apresentam problemas desbalanceados, porém este trabalho objetiva estudar distribuições dessa natureza em problemas de classificação hierárquica. Como a maioria das técnicas para dados desbalanceados são binárias, propõe-se decompor o problema hierárquico em subproblemas binários. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
BARELLA, Victor Hugo. Técnicas para o problema de dados desbalanceados em classificação hierárquica. 2015. Dissertação de Mestrado - Universidade de São Paulo (USP). Instituto de Ciências Matemáticas e de Computação (ICMC/SB) São Carlos.