Texto completo
| |
| Autor(es): |
Felipe Leonel Grijalva Arévalo
Número total de Autores: 1
|
| Tipo de documento: | Dissertação de Mestrado |
| Imprenta: | Campinas, SP. |
| Instituição: | Universidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de Computação |
| Data de defesa: | 2014-07-29 |
| Membros da banca: |
Luiz César Martini;
José Antonio dos Santos Borges;
Yuzo Iano
|
| Orientador: | Luiz César Martini; Siome Klein Goldenstein |
| Resumo | |
Conforme as aplicações de realidade aumentada tornam-se mais relevantes, há um crescente esforço na pesquisa do áudio espacial. O termo áudio espacial refere-se ao conjunto de técnicas onde a anatomia de uma pessoa (i.e. o pavilhão da orelha, a cabeça e o torso) é modelada por meio de filtros digitais. Ao filtrar uma fonte de áudio através desses filtros, o ouvinte é capaz de perceber um som como se ele fosse reproduzido em um local específico no espaço. No domínio da frequência, esses filtros são conhecidos como Funções de Transferência Relativas à Cabeça (Head-Related Transfer Functions, HRTF). Nesta dissertação, estabelecem-se os princípios básicos do áudio espacial, fornecendo uma analise das características espectrais das HRTFs. Além disso, como essas características espectrais diferem de uma pessoa para outra, propõe-se um novo método baseado em antropometria para personalizar HRTFs no plano horizontal. O método usa o Isomap, redes neurais artificias e um procedimento de reconstrução baseado na vizinhança. Assim, modificou-se a construção do grafo do Isomap para ressaltar a individualidade das HRTFs e efetuar uma redução de dimensionalidade não linear das HRTFs. Em seguida, utilizou-se uma rede neural artificial para modelar as relações não lineares entre as características antropométricas e as HRTFs de baixa dimensionalidade. E finalmente, usou-se uma abordagem de reconstrução com base na vizinhança para reconstruir a HRTF a partir do seu equivalente de baixa dimensionalidade. As simulações mostram que a abordagem proposta tem um desempenho melhor do que o PCA (Principal Component Analysis, Analise de Componentes Principais) e confirmam que o Isomap é capaz de descobrir as relações não lineares subjacentes da percepção auditiva (AU) | |
| Processo FAPESP: | 13/21349-1 - Visão para o Cego: Traduzindo Conceitos Visuais 3D em Informações de 3D de Audio. |
| Beneficiário: | Felipe Leonel Grijalva Arévalo |
| Modalidade de apoio: | Bolsas no Brasil - Mestrado |