| Processo: | 13/21349-1 |
| Modalidade de apoio: | Bolsas no Brasil - Mestrado |
| Data de Início da vigência: | 01 de novembro de 2013 |
| Data de Término da vigência: | 31 de julho de 2014 |
| Área de conhecimento: | Ciências Exatas e da Terra - Ciência da Computação - Sistemas de Computação |
| Acordo de Cooperação: | Microsoft Research |
| Pesquisador responsável: | Luiz César Martini |
| Beneficiário: | Felipe Leonel Grijalva Arévalo |
| Instituição Sede: | Instituto de Computação (IC). Universidade Estadual de Campinas (UNICAMP). Campinas , SP, Brasil |
| Empresa: | Universidade Estadual de Campinas (UNICAMP). Instituto de Computação (IC) |
| Vinculado ao auxílio: | 12/50468-6 - Visao para o cego:traduzindo conceitos visuais 3d em informacoes de 3d de audio.(fapesp-microsoft), AP.PITE |
| Assunto(s): | Metodologia e técnicas de computação Pessoas com deficiência visual Realidade aumentada Visão computacional Som surround |
| Palavra(s)-Chave do Pesquisador: | Acessibilidade | Audio 3D | Deficientes visuais | Realidade Aumentada | Visão Computacional | Metodologia e técnicas de Computação |
Resumo O objetivo deste projeto é a construção e avaliação de um sistema completo, prova de conceito, para auxílio do cego. O sistema é baseado na tradução de informações visuais em informações sonoras. A chave do problema da tradução da informação visual é a quantidade de informação - vídeo tem ordens de magnitude mais informação do que áudio. Neste projeto utilizaremos visão computacional para extrair informações de alto nível, e utilizaremos áudio 3D para representar esta informação com noção espacial.O Hardware deste sistema utilizará o Microsoft Kinect para coletar dados com cor e profundidade, uma Euclidean board, que tem giroscópio, acelerômetro e bússola, um headfone de alta qualidade e um microcomputador portátil, porém com alto poder de processamento (para processar os algoritmos em tempo real). O software será extensível e modular. O sistema terá vários modos de operação, para providenciar funções especializadas como navegação, localização de pessoas, tradução de informação a partir de texto (e.g identificação de notas bancárias, identificação de símbolos). Cada um de estes modos tem diferentes requerimentos no âmbito da visão computacional para extrair a informação de alto nível do ambiente e no âmbito do áudio 3D para comunicar de maneira adequada a informação desejada.Um sistema funcional apresenta uma série de desafios técnicos e científicos, que incluem desenvolvimento e integração de algoritmos de visão computacional, e o projeto e avaliação de interfaces auditivas. | |
| Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa: | |
| Mais itensMenos itens | |
| TITULO | |
| Matéria(s) publicada(s) em Outras Mídias ( ): | |
| Mais itensMenos itens | |
| VEICULO: TITULO (DATA) | |
| VEICULO: TITULO (DATA) | |