Busca avançada
Ano de início
Entree

Análise Condicional para Codificação e Reconhecimento de Sinais de Áudio e Voz

Processo: 15/25512-0
Linha de fomento:Auxílio à Pesquisa - Regular
Vigência: 01 de julho de 2016 - 31 de dezembro de 2018
Área do conhecimento:Engenharias - Engenharia Elétrica - Telecomunicações
Pesquisador responsável:Miguel Arjona Ramírez
Beneficiário:Miguel Arjona Ramírez
Instituição-sede: Escola Politécnica (EP). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Pesq. associados:Demostenes Zegarra Rodriguez ; Emilio Del Moral Hernandez ; Mario Minami
Assunto(s):Processamento de sinais 

Resumo

Este plano de pesquisa compõe-se de temas recorrentes em várias áreas de processamento de sinais como análise de voz, codificação de voz e de áudio, reconhecimento da fala e de outras características de sinais de voz e de áudio e separação de sinais com regularizações para permitir ajustes mais adequados à finalidade desejada. A análise de voz, além de seu interesse específico, propicia as representações do sinal e os parâmetros dos modelos necessários às outras áreas. Novas formas de decomposição e modificação tempo-frequencial e de análise autorregressiva serão exploradas para a codificação do espectro de curto prazo, principalmente com o auxílio de técnicas de quantização vetorial, de transformadas, de modelos de misturas de densidades e de otimização. Os parâmetros e representações do sinal de voz também serão utilizados para o estabelecimento de modelos para a elaboração de métricas não-intrusivas da qualidade do sinal de voz.Serão exploradas representações paramétricas para a identificação de fontes sonoras, eventualmente incluindo a identidade do locutor ou do instrumento, condicionada a outras fontes de conhecimento ou restrições. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:

Publicações científicas (5)
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
RODRIGUEZ, DEMOSTENES Z.; ROSA, RENATA L.; ALMEIDA JR, FRANCISCONE L.; MITTAG, GABRIEL; MOELLER, SEBASTIAN. Speech Quality Assessment in Wireless Communications With MIMO Systems Using a Parametric Model. IEEE ACCESS, v. 7, p. 35719-35730, 2019. Citações Web of Science: 0.
AFFONSO, EMMANUEL T.; ROSA, RENATA L.; RODRIGUEZ, DEMOSTENES Z. Speech Quality Assessment Over Lossy Transmission Channels Using Deep Belief Networks. IEEE SIGNAL PROCESSING LETTERS, v. 25, n. 1, p. 70-74, JAN 2018. Citações Web of Science: 10.
AFFONSO, EMMANUEL T.; NUNES, RODRIGO D.; ROSA, RENATA L.; PIVARO, GABRIEL F.; RODRIGUEZ, DEMOSTENES Z. Speech Quality Assessment in Wireless VoIP Communication Using Deep Belief Network. IEEE ACCESS, v. 6, p. 77022-77032, 2018. Citações Web of Science: 0.
RAMIREZ, MIGUEL ARJONA. Hybrid Autoregressive Resonance Estimation and Density Mixture Formant Tracking Model. IEEE ACCESS, v. 6, p. 30217-30224, 2018. Citações Web of Science: 0.
RAMIREZ, MIGUEL ARJONA. Non-Negative Temporal Decomposition Regularization With an Augmented Lagrangian. IEEE SIGNAL PROCESSING LETTERS, v. 23, n. 5, p. 663-667, MAY 2016. Citações Web of Science: 0.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.