Segmentação Semântica Usando um Modelo de Aprendizagem Hourglass
Análise de mídias sensíveis usando arquiteturas de aprendizado profundo
Abordagens conduzidas por dados para análise de partidas de futebol: uma perspecti...
Processo: | 13/27101-1 |
Modalidade de apoio: | Bolsas no Brasil - Doutorado |
Data de Início da vigência: | 01 de setembro de 2014 |
Data de Término da vigência: | 30 de abril de 2018 |
Área de conhecimento: | Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação |
Acordo de Cooperação: | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) |
Pesquisador responsável: | Agma Juci Machado Traina |
Beneficiário: | Letrícia Pereira Soares Avalhais |
Instituição Sede: | Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil |
Bolsa(s) vinculada(s): | 16/10703-7 - Reconhecimento de eventos em vídeos utilizando deep learning, BE.EP.DR |
Assunto(s): | Análise de séries temporais Recuperação da informação |
Palavra(s)-Chave do Pesquisador: | machine learning | Recuperação de Vídeos Baseado em Conteúdo | Segmentação de Vídeos | Séries Temporais | Multimídia, Análise de Conteúdo de Vídeo, Processamento de Imagens, Machine Learning |
Resumo Em um cenário de intensa geração e disseminação de dados multimídia, é observada uma crescente demanda de tecnologia para processamento, compressão e recuperação destes dados, especialmente, vídeos digitais. Precisão e eficiência são fatores essenciais para viabilizar métodos e aplicações de armazenamento e gerenciamento de grandes volumes de dados de vídeos. Vários sistemas de Content-based Video Retrieval - (CBVR) foram propostos, entretanto, o suporte a acesso a vídeos no nível semântico persiste como um grande desafio devido ao problema do gap semântico. Tais sistemas geralmente utilizam como base a segmentação dos vídeos como unidade para indexação e recuperação, portanto a qualidade da segmentação é diretamente refletida na performance destes sistemas. O uso de características multimodais, de natureza visual, de movimento e de áudio, por exemplo, quando analisadas em conjunto por métodos de busca de padrões em séries temporais podem proporcionar ganhos significativos sobre a representatividade destas características que são altamente dependentes do conteúdo semântico dos dados. Este projeto tem como principal objetivo desenvolver algoritmos e métodos para sumarização e segmentação de vídeos, de modo a remover segmentos ruidosos e irrelevantes e obter uma representação com conteúdo mais representativo do contexto semântico do vídeo, por meio da exploração temporal de associação entre características de diferentes modalidades, aprimorando sua recuperação por conteúdo. As contribuições do projeto serão avaliadas no domínio de filmes e séries de televisão no contexto de sistemas de recuperação de vídeos baseada em conteúdo, além de dados obtidos via Crowdsourcing pelo projeto RESCUER, para detecção de incidentes em situações de emergências. (AU) | |
Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa: | |
Mais itensMenos itens | |
TITULO | |
Matéria(s) publicada(s) em Outras Mídias ( ): | |
Mais itensMenos itens | |
VEICULO: TITULO (DATA) | |
VEICULO: TITULO (DATA) | |