Busca avançada
Ano de início
Entree

Identificação automática de locutor utilizando métodos de aprendizado não-supervisionado

Processo: 15/07934-4
Linha de fomento:Bolsas no Brasil - Mestrado
Vigência (Início): 01 de junho de 2015
Vigência (Término): 31 de maio de 2017
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Daniel Carlos Guimarães Pedronette
Beneficiário:Victor de Abreu Campos
Instituição-sede: Instituto de Geociências e Ciências Exatas (IGCE). Universidade Estadual Paulista (UNESP). Campus de Rio Claro. Rio Claro , SP, Brasil
Vinculado ao auxílio:13/08645-0 - Reclassificação e agregação de listas para tarefas de recuperação de imagens, AP.JP

Resumo

Há na fala humana um vasto conjunto de informações que pode ser analisado permitindo o reconhecimento e identificação automática do locutor. Os cenários que permitem aplicações para tais sistemas são inúmeras: em aplicações forenses, é possível realizar busca de um suspeito por meio de sua voz em uma base de dados criminal. Em gravações com vários locutores, como entrevistas ou reuniões, é possível identificar a participação de cada um dos envolvidos. Em sistemas inteligentes, é possível identificar o usuário e adaptar interfaces de acordo com suas preferências. Contudo, como ocorre com diversos conteúdos multimídia, o áudio é comumente representado como vetores de alta dimensionalidade e modelos ou métricas de distância são utilizadas para comparar diferentes objetos. Esse projeto de pesquisa tem como principal objetivo a utilização de métodos de aprendizado não-supervisionado para aumentar a eficácia de métricas de comparação de objetos de áudio, de maneira a melhorar a precisão em tarefas de idenficação automática do locutor.

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
CAMPOS, VICTOR DE ABREU; GUIMARAES PEDRONETTE, DANIEL CARLOS. A framework for speaker retrieval and identification through unsupervised learning. COMPUTER SPEECH AND LANGUAGE, v. 58, p. 153-174, NOV 2019. Citações Web of Science: 0.
Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
CAMPOS, Victor de Abreu. Arcabouço para reconhecimento de locutor baseado em aprendizado não supervisionado. 2017. 85 f. Dissertação de Mestrado - Universidade Estadual Paulista "Júlio de Mesquita Filho" Instituto de Biociências, Letras e Ciências Exatas..

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.