Análise de sinais de áudio e voz para reconstrução e reconhecimento

Processo:	12/24789-0
Modalidade de apoio:	Auxílio à Pesquisa - Regular
Data de Início da vigência:	01 de julho de 2013
Data de Término da vigência:	31 de dezembro de 2015
Área do conhecimento:	Engenharias - Engenharia Elétrica - Telecomunicações

Pesquisador responsável:	Miguel Arjona Ramírez
Beneficiário:	Miguel Arjona Ramírez

Instituição Sede:	Escola Politécnica (EP). Universidade de São Paulo (USP). São Paulo , SP, Brasil

Pesquisadores associados:	Mario Minami

Assunto(s):	Processamento de sinais Codificação Áudio (multimídia) Voz Reconhecimento da fala
Palavra(s)-Chave do Pesquisador:	audio coding \| Quality Assessment of Signal Reconstruction \| Signal Coding \| speaker identification \| Speech Coding \| Speech Recognition \| Processamento de Sinais

Resumo

Este plano de pesquisa compõe-se de temas relacionados com análise de voz, codificação de voz e de áudio, reconhecimento da fala e de outras características de sinais de voz e de áudio e identificação de locutor. A análise de voz, além de seu interesse específico, propicia as representações do sinal e dos parâmetros necessárias aos outros temas. Novas formas de análise autorregressiva serão exploradas para a codificação da envoltória espectral de curto prazo de sinais de voz, principalmente, como auxílio de técnicas de quantização vetorial, de transformadas e de modelos de misturas de gaussianas. Serão exploradas representações paramétricas para a identificação do locutor ou de fontes sonoras, contemplando aspectos dinâmicos devido à natureza intrínseca destas tarefas, e usando ferramentas de modelagem de longo prazo. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:

Mais itens Menos itens

TITULO

Matéria(s) publicada(s) em Outras Mídias ( ):

Mais itens Menos itens

VEICULO: TITULO (DATA)

Publicações científicas

(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)

RAMIREZ, MIGUEL ARJONA. Intra-Predictive Switched Split Vector Quantization of Speech Spectra. IEEE SIGNAL PROCESSING LETTERS, v. 20, n. 8, p. 791-794, AUG 2013. (12/24789-0)

AFFONSO, EMMANUEL T.; RODRIGUEZ, DEMOSTENES Z.; ROSA, RENATA L.; ANDRADE, THIAGO; BRESSAN, GRACA; IEEE. Voice Quality Assessment in Mobile Devices Considering Different Fading Models. 2016 IEEE INTERNATIONAL SYMPOSIUM ON CONSUMER ELECTRONICS - 20TH IEEE ISCE, v. N/A, p. 2-pg., 2016-01-01. (12/24789-0)

RAMIREZ, MIGUEL ARJONA. Non-Negative Temporal Decomposition Regularization With an Augmented Lagrangian. IEEE SIGNAL PROCESSING LETTERS, v. 23, n. 5, p. 663-667, MAY 2016. (12/24789-0, 15/25512-0)

URL curto

Compartilhe esta página