Busca avançada
Ano de início
Entree

Máquinas de Boltzmann em profundidade para reconhecimento de eventos em vídeos

Processo: 19/07825-1
Linha de fomento:Bolsas no Brasil - Mestrado
Vigência (Início): 01 de maio de 2019
Vigência (Término): 30 de abril de 2021
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Convênio/Acordo: Microsoft Research
Pesquisador responsável:João Paulo Papa
Beneficiário:Mateus Roder
Instituição-sede: Faculdade de Ciências (FC). Universidade Estadual Paulista (UNESP). Campus de Bauru. Bauru , SP, Brasil
Empresa:Universidade Estadual Paulista (UNESP). Campus de Rio Claro. Instituto de Geociências e Ciências Exatas (IGCE)
Vinculado ao auxílio:17/25908-6 - Aprendizado fracamente supervisionado para análise de vídeos no domínio comprimido em tarefas de recuperação e classificação para alertas visuais, AP.PITE
Assunto(s):Aprendizado computacional

Resumo

O presente projeto de pesquisa leva em consideração o problema de reconhecimento de eventos em vídeos. Este, abrange vários domínios, como vigilância e segurança, medicina, indústria de alta performance e casas inteligentes. Usualmente, alguns desses domínios são tratados com técnicas de aprendizado de máquina, com destaque para a utilização do aprendizado profundo, capaz de gerar respostas suficientemente acertivas a partir de um grande conjunto de dados rotulados, ou seja, utilizam o paradigma de aprendizado supervisionado. Isto posto, a comunidade científica tem uma parte de seus esforços voltados para técnicas que empregam o paradigma de aprendizado não supervisionado, ou seja, dados sem rótulos utilizados para extração de padrões e características profundas, nos variados problemas. Porém, em alguns destes, geralmente tem-se ao menos uma pequena quantia de dados rotulados, sendo a utilização destes uma "ferramenta" que impulsiona positivamente todo o processo de aprendizado. Neste projeto, pretendemos investigar a análise, recuperação e classificação de vídeos no domínio comprimido utilizando pequenos conjuntos de dados para treinamento. O objetivo principal do projeto consiste em investigar Máquinas de Boltzmann Profundas (DBM, do inglês Deep Boltzmann Machines), capazes de analisar sequências de vídeo comprimido e extrair características para suprir classificadores supervisionados. O desafio da pesquisa consiste em fazer uso de DBMs para analisar, representar e classificar vídeos usando dados rotulados restritos. A abordagem proposta visa explorar o máximo de informação disponível, de forma a tornar a abordagem adequada para operar com pequenos conjuntos de dados de treinamento. Pretendemos explorar: (I) Representações de aprendizado profundo; (II) Medidas contextuais não supervisionadas e; (III) Técnicas de fusão, para ampliar os conjuntos rotulados iniciais. O primeiro desafio diz respeito à analise e representação de vídeos no domínio comprimido, usando técnicas de aprendizado profundo. Com base nessas representações, pretendemos investigar estratégias para expandir os conjuntos de treinamento usando medidas contextuais não supervisionadas. Dados os conjuntos rotulados obtidos, as estratégias de fusão serão usadas para combinar diversos métodos de classificação. Embora os métodos que serão investigados possam ser utilizados em vários domínios, pretendemos selecionar domínios para validar as abordagens propostas, considerando a existência de conjuntos de dados disponíveis para realizar avaliações experimentais.