Busca avançada
Ano de início
Entree

Análise de sinais de áudio e voz para reconstrução e reconhecimento

Processo: 12/24789-0
Modalidade de apoio:Auxílio à Pesquisa - Regular
Data de Início da vigência: 01 de julho de 2013
Data de Término da vigência: 31 de dezembro de 2015
Área do conhecimento:Engenharias - Engenharia Elétrica - Telecomunicações
Pesquisador responsável:Miguel Arjona Ramírez
Beneficiário:Miguel Arjona Ramírez
Instituição Sede: Escola Politécnica (EP). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Pesquisadores associados: Mario Minami
Assunto(s):Processamento de sinais  Codificação  Áudio (multimídia)  Voz  Reconhecimento da fala 
Palavra(s)-Chave do Pesquisador:audio coding | Quality Assessment of Signal Reconstruction | Signal Coding | speaker identification | Speech Coding | Speech Recognition | Processamento de Sinais

Resumo

Este plano de pesquisa compõe-se de temas relacionados com análise de voz, codificação de voz e de áudio, reconhecimento da fala e de outras características de sinais de voz e de áudio e identificação de locutor. A análise de voz, além de seu interesse específico, propicia as representações do sinal e dos parâmetros necessárias aos outros temas. Novas formas de análise autorregressiva serão exploradas para a codificação da envoltória espectral de curto prazo de sinais de voz, principalmente, como auxílio de técnicas de quantização vetorial, de transformadas e de modelos de misturas de gaussianas. Serão exploradas representações paramétricas para a identificação do locutor ou de fontes sonoras, contemplando aspectos dinâmicos devido à natureza intrínseca destas tarefas, e usando ferramentas de modelagem de longo prazo. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
RAMIREZ, MIGUEL ARJONA. Intra-Predictive Switched Split Vector Quantization of Speech Spectra. IEEE SIGNAL PROCESSING LETTERS, v. 20, n. 8, p. 791-794, . (12/24789-0)
AFFONSO, EMMANUEL T.; RODRIGUEZ, DEMOSTENES Z.; ROSA, RENATA L.; ANDRADE, THIAGO; BRESSAN, GRACA; IEEE. Voice Quality Assessment in Mobile Devices Considering Different Fading Models. 2016 IEEE INTERNATIONAL SYMPOSIUM ON CONSUMER ELECTRONICS - 20TH IEEE ISCE, v. N/A, p. 2-pg., . (12/24789-0)
RAMIREZ, MIGUEL ARJONA. Non-Negative Temporal Decomposition Regularization With an Augmented Lagrangian. IEEE SIGNAL PROCESSING LETTERS, v. 23, n. 5, p. 663-667, . (12/24789-0, 15/25512-0)