Busca avançada
Ano de início
Entree

Análise Condicional para Codificação e Reconhecimento de Sinais de Áudio e Voz

Processo: 15/25512-0
Modalidade de apoio:Auxílio à Pesquisa - Regular
Data de Início da vigência: 01 de julho de 2016
Data de Término da vigência: 31 de dezembro de 2018
Área do conhecimento:Engenharias - Engenharia Elétrica - Telecomunicações
Pesquisador responsável:Miguel Arjona Ramírez
Beneficiário:Miguel Arjona Ramírez
Instituição Sede: Escola Politécnica (EP). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Pesquisadores associados:Demostenes Zegarra Rodriguez ; Emilio Del Moral Hernandez ; Mario Minami
Assunto(s):Processamento de sinais 
Palavra(s)-Chave do Pesquisador:audio coding | Optimization Algorithms | Signal Coding | speaker identification | Speech Coding | Speech Recognition | Processamento de Sinais

Resumo

Este plano de pesquisa compõe-se de temas recorrentes em várias áreas de processamento de sinais como análise de voz, codificação de voz e de áudio, reconhecimento da fala e de outras características de sinais de voz e de áudio e separação de sinais com regularizações para permitir ajustes mais adequados à finalidade desejada. A análise de voz, além de seu interesse específico, propicia as representações do sinal e os parâmetros dos modelos necessários às outras áreas. Novas formas de decomposição e modificação tempo-frequencial e de análise autorregressiva serão exploradas para a codificação do espectro de curto prazo, principalmente com o auxílio de técnicas de quantização vetorial, de transformadas, de modelos de misturas de densidades e de otimização. Os parâmetros e representações do sinal de voz também serão utilizados para o estabelecimento de modelos para a elaboração de métricas não-intrusivas da qualidade do sinal de voz.Serão exploradas representações paramétricas para a identificação de fontes sonoras, eventualmente incluindo a identidade do locutor ou do instrumento, condicionada a outras fontes de conhecimento ou restrições. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas (10)
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
RAMIREZ, MIGUEL ARJONA. Hybrid Autoregressive Resonance Estimation and Density Mixture Formant Tracking Model. IEEE ACCESS, v. 6, p. 30217-30224, . (15/25512-0)
RODRIGUEZ, DEMOSTENES ZEGARRA; MOELLER, SEBASTIAN; IEEE. Speech Quality Parametric Model that Considers Wireless Network Characteristics. 2019 ELEVENTH INTERNATIONAL CONFERENCE ON QUALITY OF MULTIMEDIA EXPERIENCE (QOMEX), v. N/A, p. 6-pg., . (15/24496-0, 15/25512-0)
AFFONSO, EMMANUEL T.; ROSA, RENATA L.; RODRIGUEZ, DEMOSTENES Z.. Speech Quality Assessment Over Lossy Transmission Channels Using Deep Belief Networks. IEEE SIGNAL PROCESSING LETTERS, v. 25, n. 1, p. 70-74, . (15/25512-0, 15/24496-0)
RODRIGUEZ, DEMOSTENES Z.; PIVARO, GABRIEL F.; ROSA, RENATA L.; MITTAG, GABRIEL; MOELLER, SEBASTIAN; IEEE. Quantifying the Quality Improvement of MIMO Transmission Systems in VoIP Communication. 2022 25TH INTERNATIONAL CONFERENCE ON INFORMATION FUSION (FUSION 2022), v. N/A, p. 5-pg., . (15/24496-0, 15/25512-0)
RODRIGUEZ, DEMOSTENES Z.; PIVARO, GABRIEL F.; ROSA, RENATA L.; MITTAG, GABRIEL; MOELLER, SEBASTIAN; IEEE. Improving a Parametric Model for Speech Quality Assessment in Wireless Communication Systems. 2022 25TH INTERNATIONAL CONFERENCE ON INFORMATION FUSION (FUSION 2022), v. N/A, p. 5-pg., . (15/24496-0, 15/25512-0)
RODRIGUEZ, DEMOSTENES Z.; ROSA, RENATA L.; ALMEIDA JR, FRANCISCONE L.; MITTAG, GABRIEL; MOELLER, SEBASTIAN. Speech Quality Assessment in Wireless Communications With MIMO Systems Using a Parametric Model. IEEE ACCESS, v. 7, p. 35719-35730, . (15/24496-0, 15/25512-0)
RAMIREZ, MIGUEL ARJONA. Non-Negative Temporal Decomposition Regularization With an Augmented Lagrangian. IEEE SIGNAL PROCESSING LETTERS, v. 23, n. 5, p. 663-667, . (12/24789-0, 15/25512-0)
AFFONSO, EMMANUEL T.; NUNES, RODRIGO D.; ROSA, RENATA L.; PIVARO, GABRIEL F.; RODRIGUEZ, DEMOSTENES Z.. Speech Quality Assessment in Wireless VoIP Communication Using Deep Belief Network. IEEE ACCESS, v. 6, p. 77022-77032, . (15/24496-0, 15/25512-0)
RODRIGUEZ, DEMOSTENES ZEGARRA; RAMIREZ, MIGUEL ARJONA; BERNARDES, LEONARDO FERNANDES; MITTAG, GABRIEL; MOELLER, SEBASTIAN; IEEE. Impact of FEC codes on speech communication quality using WB E-model algorithm. 2019 WIRELESS DAYS (WD), v. N/A, p. 4-pg., . (15/24496-0, 15/25512-0)
BEGAZO, DANTE COAQUIRA; RODRIGUEZ, DEMOSTENES ZEGARRA; RAMIREZ, MIGUEL ARJONA; IEEE. No-reference Video Quality Metric based on the Packet Delay Variation Parameter. 2016 IEEE INTERNATIONAL SYMPOSIUM ON CONSUMER ELECTRONICS - 20TH IEEE ISCE, v. N/A, p. 2-pg., . (15/25512-0)