Busca avançada
Ano de início
Entree

Data mining em letras de músicas e modelos de predição de sucesso comercial

Processo: 12/12130-3
Modalidade de apoio:Bolsas no Brasil - Iniciação Científica
Data de Início da vigência: 01 de setembro de 2012
Data de Término da vigência: 31 de dezembro de 2012
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Reinaldo Alvarenga Bergamaschi
Beneficiário:Gabriel Massaki Wakano Bezerra
Instituição Sede: Instituto de Computação (IC). Universidade Estadual de Campinas (UNICAMP). Campinas , SP, Brasil
Assunto(s):Computação em cluster   Mineração de dados   Processamento de texto   Métodos de extração   Modelos preditivos
Palavra(s)-Chave do Pesquisador:Geração de modelos matemáticos | Letras de Músicas | Mineração de Dados | Processamento de texto | Mineração de dados, Processamento de texto, geração de modelos matematicos

Resumo

Este projeto visa desenvolver e implementar algoritmos para data mining em letras de músicas e geração de modelos de correlação entre métricas extraídas das letras e seu sucesso comercial. Estes algoritmos irão analisar letras de músicas a fim de extrair as frequências de palavras, detecção de palavras semelhantes ou derivadas, detecção de padrões, ou sequencias de palavras em versos, extração de clusters de palavras e extração de co-locations. A partir dessa análise, serão definidas e geradas métricas para caracterização de letras musicais. Informalmente, a idéia é gerar métricas de comparação entre músicas e artistas diferentes e correlacionar estas métricas com o sucesso comercial da música. Por exemplo, será que do ponto de vista de frequências de palavras e tipos das mesmas, uma letra de música da Lady Gaga é muito diferente de uma música de Bob Dylan? Após a geração das métricas, o objetivo será gerar um modelo preditivo que correlacione as métricas extraídas das letras com o sucesso da música (baseado nas posições das músicas nas paradas musicais mundiais). Por razão da maior quantidade e maior difusão, serão usadas músicas em inglês. O aluno aprenderá e implementará algoritmos complexos de extração de informações e técnicas de regressão e geração de modelos baseados em técnicas numéricas e aprendizado de máquina. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)