Busca avançada
Ano de início
Entree


Comparação entre algoritmos de reconhecimento de face no contexto de acessibilidade

Texto completo
Autor(es):
Douglas Eduardo Parra
Número total de Autores: 1
Tipo de documento: Dissertação de Mestrado
Imprenta: Campinas, SP.
Instituição: Universidade Estadual de Campinas (UNICAMP). Instituto de Computação
Data de defesa:
Membros da banca:
Siome Klein Goldenstein; Jacques Wainer; Eduardo Valle
Orientador: Siome Klein Goldenstein
Resumo

Nesta dissertação de mestrado, é mostrada uma comparação entre três algoritmos de reconhecimento de face no contexto de acessibilidade para o projeto Microsoft com parceria com a FAPESP, para o módulo de reconhecimento de pessoas utilizando o Microsoft Kinect e substituição sensorial. O algoritmo k-Nearest Neighbours, junto do descritor Histograma de Gradientes Orientados, foi utilizado como base por ser uma abordagem simples e de baixo custo computacional. Os algoritmos Eigenfaces e Local Binary Pattern Histogram foram comparados com o anterior em quatro experimentos. Inicialmente, é descrito o Projeto Vision for the Blind e seus diversos módulos. Este projeto foi desenvolvido por uma equipe aqui no Brasil, que obteve bons resultados para os módulos de navegação e reconhecimento de face, sempre com a ideia de usar o áudio 3D para passar a informação desejada ao usuário. Em seguida, é apresentada uma revisão do estado da arte com projetos no contexto de acessibilidade e substituição sensorial, apontando suas limitações. Logo após é feita uma revisão sobre os três algoritmos de reconhecimento facial utilizados e, então, como foi construída o banco de imagens deste projeto. Foram obtidos bons resultados com os três algoritmos, apesar de haver diferenças significativas entre eles. O Eigenfaces e o Local Binary Pattern Histogram, por serem técnicas mais complexas que o k-Nearest Neighbours, atingiram taxas de reconhecimento com metade dos recursos que este último utiliza para chegar próximo dos valores, sendo o Eigenfaces mais rápido, porém demorado na parte de aprendizagem. Ainda assim, por ser uma técnica simples, vale notar o quão bem o k-NN executa a mesma tarefa e pode ser utilizado para o módulo do projeto (AU)

Processo FAPESP: 12/22653-3 - Visão para o cego: traduzindo conceitos visuais 3D em informações de 3D de áudio
Beneficiário:Douglas Eduardo Parra
Modalidade de apoio: Bolsas no Brasil - Mestrado