Bolsa 15/07934-4 - Aprendizado de máquina não supervisionado, Recuperação da informação

Processo:	15/07934-4
Modalidade de apoio:	Bolsas no Brasil - Mestrado
Data de Início da vigência:	01 de junho de 2015
Data de Término da vigência:	31 de maio de 2017
Área de conhecimento:	Ciências Exatas e da Terra - Ciência da Computação

Pesquisador responsável:	Daniel Carlos Guimarães Pedronette
Beneficiário:	Victor de Abreu Campos

Instituição Sede:	Instituto de Geociências e Ciências Exatas (IGCE). Universidade Estadual Paulista (UNESP). Campus de Rio Claro. Rio Claro , SP, Brasil

Vinculado ao auxílio:	13/08645-0 - Reclassificação e agregação de listas para tarefas de recuperação de imagens, AP.JP


Assunto(s):	Aprendizado de máquina não supervisionado Recuperação da informação Reconhecimento de voz Identificação automática e captura de dados Ciências forenses
Palavra(s)-Chave do Pesquisador:	aprendizado não-supervisionado \| identificação de locutor \| Recuperação de Informações
Resumo Há na fala humana um vasto conjunto de informações que pode ser analisado permitindo o reconhecimento e identificação automática do locutor. Os cenários que permitem aplicações para tais sistemas são inúmeras: em aplicações forenses, é possível realizar busca de um suspeito por meio de sua voz em uma base de dados criminal. Em gravações com vários locutores, como entrevistas ou reuniões, é possível identificar a participação de cada um dos envolvidos. Em sistemas inteligentes, é possível identificar o usuário e adaptar interfaces de acordo com suas preferências. Contudo, como ocorre com diversos conteúdos multimídia, o áudio é comumente representado como vetores de alta dimensionalidade e modelos ou métricas de distância são utilizadas para comparar diferentes objetos. Esse projeto de pesquisa tem como principal objetivo a utilização de métodos de aprendizado não-supervisionado para aumentar a eficácia de métricas de comparação de objetos de áudio, de maneira a melhorar a precisão em tarefas de identificação automática do locutor. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itens Menos itens
TITULO

Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itens Menos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas

(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)

CAMPOS, VICTOR DE ABREU; GUIMARAES PEDRONETTE, DANIEL CARLOS. A framework for speaker retrieval and identification through unsupervised learning. COMPUTER SPEECH AND LANGUAGE, v. 58, p. 153-174, NOV 2019. (17/25908-6, 15/07934-4, 18/15597-6)

Publicações acadêmicas

(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)

CAMPOS, Victor de Abreu. Arcabouço para reconhecimento de locutor baseado em aprendizado não supervisionado. 2017. Dissertação de Mestrado - Universidade Estadual Paulista (Unesp). Instituto de Biociências Letras e Ciências Exatas. São José do Rio Preto São José do Rio Preto.

URL curto