Busca avançada
Ano de início
Entree

Entendimento da Atividade Humana com Modelos Discriminativos através da Aprendizagem Profunda em Vídeos Comprimidos

Processo: 18/21837-0
Modalidade de apoio:Bolsas no Exterior - Pesquisa
Data de Início da vigência: 16 de fevereiro de 2019
Data de Término da vigência: 15 de fevereiro de 2020
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Jurandy Gomes de Almeida Junior
Beneficiário:Jurandy Gomes de Almeida Junior
Pesquisador Anfitrião: Niculae Sebe
Instituição Sede: Instituto de Ciência e Tecnologia (ICT). Universidade Federal de São Paulo (UNIFESP). Campus São José dos Campos. São José dos Campos , SP, Brasil
Instituição Anfitriã: Universitá degli Studi di Trento, Itália  
Assunto(s):Aprendizagem profunda
Palavra(s)-Chave do Pesquisador:aprendizagem profunda | computação visual | Inteligência de Máquina | Recuperação de Informação Multimídia | Videos Digitais | Processamento Gráfico (Graphics)

Resumo

Vídeos digitais tornaram-se o meio de escolha para um número cada vez maior de pessoas se comunicando via Internet e seus dispositivos móveis. Ao longo da última década, o mundo testemunhou um crescimento explosivo na quantidade de dados de vídeo fomentado por desenvolvimentos tecnológicos surpreendentes. Nesse cenário, há uma demanda crescente por sistemas eficientes para reduzir o trabalho e a sobrecarga de informações para as pessoas. Fazer uso eficiente do conteúdo de vídeo requer o desenvolvimento de ferramentas inteligentes capazes de entender vídeos de maneira similar aos humanos. Esse tem sido o objetivo de uma área de pesquisa em rápida evolução, conhecida como entendimento de vídeo. Um passo crucial para o entendimento de vídeo é entender as ações e atividades humanas. Uma das principais questões relativas ao problema de entendimento da atividade humana é a extração de informações úteis do conteúdo de vídeo. Recentemente, a aprendizagem profunda tem sido usada com sucesso para treinar modelos discriminativos capazes de aprender recursos poderosos e interpretáveis para o entendimento do conteúdo visual. No entanto, devido à dimensão temporal, o treinamento de modelos de aprendizagem profunda em dados de vídeo enfrenta uma série de dificuldades práticas, como amostras limitadas de treinamento e alto custo computacional. O objetivo desta proposta de pesquisa é abordar a sobrecarga computacional do treinamento de um modelo de aprendizagem profunda, a fim de melhorar sua capacidade de lidar com dados de vídeo e avançar no estado da arte no entendimento da atividade humana. Para isso, planejamos explorar informações relevantes relativas ao conteúdo visual disponível na representação compactada usada para armazenamento e transmissão de vídeo. Isso permite economizar alta carga computacional na decodificação completa do fluxo de vídeo e, portanto, acelerar bastante o tempo de treinamento, que se tornou um grande obstáculo à aprendizagem profunda.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
DOS SANTOS, SAMUEL FELIPE; SEBE, NICU; ALMEIDA, JURANDY; IEEE. CV-C3D: Action Recognition on Compressed Videos with Convolutional 3D Networks. 2019 32ND SIBGRAPI CONFERENCE ON GRAPHICS, PATTERNS AND IMAGES (SIBGRAPI), v. N/A, p. 7-pg., . (17/25908-6, 18/21837-0)
DOS SANTOS, SAMUEL FELIPE; SEBE, NICU; ALMEIDA, JURANDY; IEEE. THE GOOD, THE BAD, AND THE UGLY: NEURAL NETWORKS STRAIGHT FROM JPEG. 2020 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP), v. N/A, p. 5-pg., . (18/21837-0, 17/25908-6)