Busca avançada
Ano de início
Entree

...And Justice for All Tags: lidando com desbalanceamento de classes em rotulação automática de músicas utilizando embeddings

Processo: 22/10969-8
Modalidade de apoio:Bolsas no Exterior - Estágio de Pesquisa - Iniciação Científica
Data de Início da vigência: 05 de novembro de 2022
Data de Término da vigência: 04 de fevereiro de 2023
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Diego Furtado Silva
Beneficiário:Vitor Diniz de Oliveira Cunha
Supervisor: Xavier Serra
Instituição Sede: Centro de Ciências Exatas e de Tecnologia (CCET). Universidade Federal de São Carlos (UFSCAR). São Carlos , SP, Brasil
Instituição Anfitriã: Universitat Pompeu Fabra (UPF), Espanha  
Vinculado à bolsa:21/15221-9 - Estudo de técnicas de auto-tagging para dados musicais específicos de domínio e considerando o problema de cauda longa, BP.IC
Assunto(s):Aprendizado computacional   Aprendizagem profunda   Gravação de som   Música   Recuperação da informação
Palavra(s)-Chave do Pesquisador:Imbalanced Data | machine learning | Multilabel Classification | Machine Learning

Resumo

A rotulação automática de músicas é uma forma significativa de caracterizar as gravações, com implicações na organização e recuperação de informações musicais. Os modelos de auto-tagging mais populares são baseados em deep learning. Entretanto, estas técnicas precisam de um grande volume de dados para induzir um bom modelo. Além disso, estes modelos podem ter um desempenho inferior em tags menos representadas. Embora existam técnicas para reduzir este problema durante a fase de treinamento, elas podem aumentar o volume de dados e tornar a fase de treinamento ainda mais dispendiosa. Por outro lado, a literatura é abundante em algoritmos para lidar com o desequilíbrio de classe no domínio dos dados tabulares. Neste trabalho, propomos aplicar estas técnicas aos dados musicais transformados por modelos de rotulação automática pré-treinados e avaliar como eles impactam o desempenho da previsão das tags menos representadas. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)