Resumo
Vídeos digitais tornaram-se o meio de escolha para um número cada vez maior de pessoas se comunicando via Internet e seus dispositivos móveis. Durante a última década, o mundo testemunhou um crescimento explosivo na quantidade de dados de vídeo devido aos desenvolvimentos tecnológicos surpreendentes. Nesse cenário, há uma demanda crescente por sistemas eficientes para reduzir o trabalho e a sobrecarga de informações para as pessoas. Fazer uso eficiente do conteúdo de vídeo requer o desenvolvimento de ferramentas inteligentes capazes de entender os vídeos de maneira similar aos humanos. Esse tem sido o objetivo de uma área de pesquisa em rápida evolução conhecida como compreensão de vídeo. Nos últimos anos, graças à sua grande capacidade de aprendizado pela exposição aos dados, a aprendizagem profunda levou a um progresso notável na compreensão de vídeo. Em grande parte, isso se deve à disponibilidade de uma enorme quantidade de dados rotulados que contribuíram para o desenvolvimento de modelos com extraordinárias capacidades de inferência. Entretanto, produzir uma quantidade desejável de dados para saciar esses modelos pode ser uma tarefa inviável para muitos domínios de aplicação, pois a anotação de dados é um processo caro e, às vezes, exige um conhecimento específico. Essa dependência de rotulagem exaustiva é uma limitação chave para implantar sistemas de compreensão de vídeo no mundo real. Embora modelos de aprendizado profundo sejam excelentes em muitas tarefas de reconhecimento visual, ocasionalmente superando os humanos, sua capacidade de generalização é ruim, realizando apenas tarefas para as quais são treinados. A habilidade de se adaptar a novos cenários é a marca registrada da inteligência humana. Motivado por esses aspectos, o presente projeto de pesquisa propõe investigar métodos para melhorar a capacidade de generalização da aprendizagem profunda, permitindo executar compreensão de vídeo com mínima supervisão humana. A principal contribuição científica será um pipeline novo e mais sustentável para aplicações de aprendizagem profunda, exigindo conhecimento humano para desambiguar apenas decisões críticas. Para tanto, tenciona-se avançar o estado da arte em generalização de modelos, visando aprender com dados mais informativos e colocar o ser humano no circuito de maneira mais eficaz. Por fim, espera-se que os resultados desta proposta possam permitir que as empresas coloquem a IA em seus produtos ou sistemas de produção, reduzindo a necessidade de conhecimento de operador experiente em anotação de dados. (AU)
| Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio: |
| Mais itensMenos itens |
| TITULO |
| Matéria(s) publicada(s) em Outras Mídias ( ): |
| Mais itensMenos itens |
| VEICULO: TITULO (DATA) |
| VEICULO: TITULO (DATA) |