Busca avançada
Ano de início
Entree

Uma abordagem para segmentação semântica explorando a multimodalidade e temporalidade de características de vídeos digitais

Processo: 13/27101-1
Modalidade de apoio:Bolsas no Brasil - Doutorado
Data de Início da vigência: 01 de setembro de 2014
Data de Término da vigência: 30 de abril de 2018
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Acordo de Cooperação: Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Pesquisador responsável:Agma Juci Machado Traina
Beneficiário:Letrícia Pereira Soares Avalhais
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Bolsa(s) vinculada(s):16/10703-7 - Reconhecimento de eventos em vídeos utilizando deep learning, BE.EP.DR
Assunto(s):Análise de séries temporais   Recuperação da informação
Palavra(s)-Chave do Pesquisador:machine learning | Recuperação de Vídeos Baseado em Conteúdo | Segmentação de Vídeos | Séries Temporais | Multimídia, Análise de Conteúdo de Vídeo, Processamento de Imagens, Machine Learning

Resumo

Em um cenário de intensa geração e disseminação de dados multimídia, é observada uma crescente demanda de tecnologia para processamento, compressão e recuperação destes dados, especialmente, vídeos digitais. Precisão e eficiência são fatores essenciais para viabilizar métodos e aplicações de armazenamento e gerenciamento de grandes volumes de dados de vídeos. Vários sistemas de Content-based Video Retrieval - (CBVR) foram propostos, entretanto, o suporte a acesso a vídeos no nível semântico persiste como um grande desafio devido ao problema do gap semântico. Tais sistemas geralmente utilizam como base a segmentação dos vídeos como unidade para indexação e recuperação, portanto a qualidade da segmentação é diretamente refletida na performance destes sistemas. O uso de características multimodais, de natureza visual, de movimento e de áudio, por exemplo, quando analisadas em conjunto por métodos de busca de padrões em séries temporais podem proporcionar ganhos significativos sobre a representatividade destas características que são altamente dependentes do conteúdo semântico dos dados. Este projeto tem como principal objetivo desenvolver algoritmos e métodos para sumarização e segmentação de vídeos, de modo a remover segmentos ruidosos e irrelevantes e obter uma representação com conteúdo mais representativo do contexto semântico do vídeo, por meio da exploração temporal de associação entre características de diferentes modalidades, aprimorando sua recuperação por conteúdo. As contribuições do projeto serão avaliadas no domínio de filmes e séries de televisão no contexto de sistemas de recuperação de vídeos baseada em conteúdo, além de dados obtidos via Crowdsourcing pelo projeto RESCUER, para detecção de incidentes em situações de emergências. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
TRAINA, AGMA J. M.; BRINIS, SAFIA; PEDROSA, V, GLAUCO; AVAIHAIS, LETRICIA P. S.; TRAINA JR, CAETANO. Querying on large and complex databases by content: Challenges on variety and veracity regarding real applications. INFORMATION SYSTEMS, v. 86, p. 10-27, . (16/17078-0, 13/27101-1)