Busca avançada
Ano de início
Entree

Processamento de voz de faixa larga baseado em efeitos psicoacusticos espectrais e espaciais.

Processo: 04/13206-7
Modalidade de apoio:Auxílio à Pesquisa - Regular
Data de Início da vigência: 01 de abril de 2005
Data de Término da vigência: 31 de outubro de 2007
Área do conhecimento:Engenharias - Engenharia Elétrica - Telecomunicações
Pesquisador responsável:Miguel Arjona Ramírez
Beneficiário:Miguel Arjona Ramírez
Instituição Sede: Escola Politécnica (EP). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Assunto(s):Processamento de sinais  Reconhecimento de voz  Síntese de voz 
Palavra(s)-Chave do Pesquisador:Codificacao De Voz | Localizacao Da Fonte Sonora | Melhoramento De Voz | Processamento De Sinais | Reconhecimento De Voz | Sintese De Voz

Resumo

Pretende-se aplicar alguns efeitos psicoacústicos espectrais e espaciais em algoritmos para codificação de voz, melhoramento de voz e localização da fonte sonora. A pesquisa em codificação de voz cobre taxas não superiores a 4 kbit/s usando interpolação da forma de onda (WI), que será incrementada com modelos espectrais. A experiência adquirida em predição linear excitada por códigos (CELP) pelo Laboratório de Processamento de Sinais (LPS) auxiliará no condicionamento perceptualmente transparente. Na linha de pesquisa em melhoramento de voz, com a experiência obtida no LPS em reconhecimento de voz, empregando modelagem estatística com modelos ocultos de Markov (HMM) em ambientes adversos como a linha telefônica comutada comercial, pretende-se empregar essas técnicas em aplicações monocanal, estendidas para sinais da faixa de áudio, em conjunto com filtragem espectral para o melhora-mento objetivo da voz, e síntese concatenativa para o melhoramento subjetivo, incluindo a redução do ruído musical. Ainda, deve-se maximizar a informação mútua para uma configuração de feixes de sinais ("beamforming") para arranjos de microfones em aplicações multicanal. Finalmente, na linha de localização da fonte sonora busca-se a recriação para o ouvinte dessa percepção com estímulos biauriculares. Para tal finalidade, serão empregados modelos antropométricos das funções de transferência relativas à cabeça (HRTFs - "Head Related Transfer Functions"). (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
RAMIREZ, MIGUEL ARJONA. A Levinson algorithm based on an isometric transformation of Durbin's. IEEE SIGNAL PROCESSING LETTERS, v. 15, p. 99-102, . (04/13206-7)