Busca avançada
Ano de início
Entree

Identificação automática de locutor utilizando métodos de aprendizado não-supervisionado

Processo: 15/07934-4
Modalidade de apoio:Bolsas no Brasil - Mestrado
Data de Início da vigência: 01 de junho de 2015
Data de Término da vigência: 31 de maio de 2017
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Daniel Carlos Guimarães Pedronette
Beneficiário:Victor de Abreu Campos
Instituição Sede: Instituto de Geociências e Ciências Exatas (IGCE). Universidade Estadual Paulista (UNESP). Campus de Rio Claro. Rio Claro , SP, Brasil
Vinculado ao auxílio:13/08645-0 - Reclassificação e agregação de listas para tarefas de recuperação de imagens, AP.JP
Assunto(s):Aprendizado de máquina não supervisionado   Recuperação da informação   Reconhecimento de voz   Identificação automática e captura de dados   Ciências forenses
Palavra(s)-Chave do Pesquisador:aprendizado não-supervisionado | identificação de locutor | Recuperação de Informações

Resumo

Há na fala humana um vasto conjunto de informações que pode ser analisado permitindo o reconhecimento e identificação automática do locutor. Os cenários que permitem aplicações para tais sistemas são inúmeras: em aplicações forenses, é possível realizar busca de um suspeito por meio de sua voz em uma base de dados criminal. Em gravações com vários locutores, como entrevistas ou reuniões, é possível identificar a participação de cada um dos envolvidos. Em sistemas inteligentes, é possível identificar o usuário e adaptar interfaces de acordo com suas preferências. Contudo, como ocorre com diversos conteúdos multimídia, o áudio é comumente representado como vetores de alta dimensionalidade e modelos ou métricas de distância são utilizadas para comparar diferentes objetos. Esse projeto de pesquisa tem como principal objetivo a utilização de métodos de aprendizado não-supervisionado para aumentar a eficácia de métricas de comparação de objetos de áudio, de maneira a melhorar a precisão em tarefas de identificação automática do locutor. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
CAMPOS, VICTOR DE ABREU; GUIMARAES PEDRONETTE, DANIEL CARLOS. A framework for speaker retrieval and identification through unsupervised learning. COMPUTER SPEECH AND LANGUAGE, v. 58, p. 153-174, . (17/25908-6, 15/07934-4, 18/15597-6)
Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
CAMPOS, Victor de Abreu. Arcabouço para reconhecimento de locutor baseado em aprendizado não supervisionado. 2017. Dissertação de Mestrado - Universidade Estadual Paulista (Unesp). Instituto de Biociências Letras e Ciências Exatas. São José do Rio Preto São José do Rio Preto.