Busca avançada
Ano de início
Entree


Redução de dimensionalidade usando Isomap aplicada ao áudio espacial

Texto completo
Autor(es):
Felipe Leonel Grijalva Arévalo
Número total de Autores: 1
Tipo de documento: Dissertação de Mestrado
Imprenta: Campinas, SP.
Instituição: Universidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de Computação
Data de defesa:
Membros da banca:
Luiz César Martini; José Antonio dos Santos Borges; Yuzo Iano
Orientador: Siome Klein Goldenstein; Luiz César Martini
Resumo

Conforme as aplicações de realidade aumentada tornam-se mais relevantes, há um crescente esforço na pesquisa do áudio espacial. O termo áudio espacial refere-se ao conjunto de técnicas onde a anatomia de uma pessoa (i.e. o pavilhão da orelha, a cabeça e o torso) é modelada por meio de filtros digitais. Ao filtrar uma fonte de áudio através desses filtros, o ouvinte é capaz de perceber um som como se ele fosse reproduzido em um local específico no espaço. No domínio da frequência, esses filtros são conhecidos como Funções de Transferência Relativas à Cabeça (Head-Related Transfer Functions, HRTF). Nesta dissertação, estabelecem-se os princípios básicos do áudio espacial, fornecendo uma analise das características espectrais das HRTFs. Além disso, como essas características espectrais diferem de uma pessoa para outra, propõe-se um novo método baseado em antropometria para personalizar HRTFs no plano horizontal. O método usa o Isomap, redes neurais artificias e um procedimento de reconstrução baseado na vizinhança. Assim, modificou-se a construção do grafo do Isomap para ressaltar a individualidade das HRTFs e efetuar uma redução de dimensionalidade não linear das HRTFs. Em seguida, utilizou-se uma rede neural artificial para modelar as relações não lineares entre as características antropométricas e as HRTFs de baixa dimensionalidade. E finalmente, usou-se uma abordagem de reconstrução com base na vizinhança para reconstruir a HRTF a partir do seu equivalente de baixa dimensionalidade. As simulações mostram que a abordagem proposta tem um desempenho melhor do que o PCA (Principal Component Analysis, Analise de Componentes Principais) e confirmam que o Isomap é capaz de descobrir as relações não lineares subjacentes da percepção auditiva (AU)

Processo FAPESP: 13/21349-1 - Visão para o cego: traduzindo conceitos visuais 3D em informações de 3D de áudio
Beneficiário:Felipe Leonel Grijalva Arévalo
Modalidade de apoio: Bolsas no Brasil - Mestrado