Busca avançada
Ano de início
Entree

Processamento de voz de faixa larga baseado em efeitos psicoacústicos espectrais e espaciais

Processo: 04/13206-7
Linha de fomento:Auxílio à Pesquisa - Regular
Vigência: 01 de abril de 2005 - 31 de outubro de 2007
Área do conhecimento:Engenharias - Engenharia Elétrica - Telecomunicações
Pesquisador responsável:Miguel Arjona Ramírez
Beneficiário:Miguel Arjona Ramírez
Instituição-sede: Escola Politécnica (EP). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Assunto(s):Processamento de sinais  Reconhecimento de voz  Síntese de voz 

Resumo

Pretende-se aplicar alguns efeitos psicoacústicos espectrais e espaciais em algoritmos para codificação de voz, melhoramento de voz e localização da fonte sonora. A pesquisa em codificação de voz cobre taxas não superiores a 4 kbit/s usando interpolação da forma de onda (WI), que será incrementada com modelos espectrais. A experiência adquirida em predição linear excitada por códigos (CELP) pelo Laboratório de Processamento de Sinais (LPS) auxiliará no condicionamento perceptualmente transparente. Na linha de pesquisa em melhoramento de voz, com a experiência obtida no LPS em reconhecimento de voz, empregando modelagem estatística com modelos ocultos de Markov (HMM) em ambientes adversos como a linha telefônica comutada comercial, pretende-se empregar essas técnicas em aplicações monocanal, estendidas para sinais da faixa de áudio, em conjunto com filtragem espectral para o melhora-mento objetivo da voz, e síntese concatenativa para o melhoramento subjetivo, incluindo a redução do ruído musical. Ainda, deve-se maximizar a informação mútua para uma configuração de feixes de sinais ("beamforming") para arranjos de microfones em aplicações multicanal. Finalmente, na linha de localização da fonte sonora busca-se a recriação para o ouvinte dessa percepção com estímulos biauriculares. Para tal finalidade, serão empregados modelos antropométricos das funções de transferência relativas à cabeça (HRTFs - "Head Related Transfer Functions"). (AU)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
RAMIREZ, MIGUEL ARJONA. A Levinson algorithm based on an isometric transformation of Durbin's. IEEE SIGNAL PROCESSING LETTERS, v. 15, p. 99-102, 2008. Citações Web of Science: 1.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.