Busca avançada
Ano de início
Entree

Compreensão de vídeo por meio de aprendizagem profunda com mínima supervisão humana

Processo: 23/17577-0
Modalidade de apoio:Auxílio à Pesquisa - Regular
Data de Início da vigência: 01 de setembro de 2024
Data de Término da vigência: 31 de agosto de 2026
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Jurandy Gomes de Almeida Junior
Beneficiário:Jurandy Gomes de Almeida Junior
Instituição Sede: Centro de Ciências em Gestão e Tecnologia (CCGT). Universidade Federal de São Carlos (UFSCAR). Campus de Sorocaba. Sorocaba , SP, Brasil
Pesquisadores associados:Daniel Carlos Guimarães Pedronette ; João Paulo Papa ; Niculae Sebe ; Roberto Silva Netto ; Tiago Agostinho de Almeida
Assunto(s):Aprendizagem profunda  Generalização  Unidade de processamento gráfico  Atributos visuais (computação gráfica)  Vídeo digital  Inteligência artificial 
Palavra(s)-Chave do Pesquisador:aprendizagem profunda | Compreensão de Vídeo | computação visual | generalização | Inteligência de Máquina | Processamento Gráfico (Graphics)

Resumo

Vídeos digitais tornaram-se o meio de escolha para um número cada vez maior de pessoas se comunicando via Internet e seus dispositivos móveis. Durante a última década, o mundo testemunhou um crescimento explosivo na quantidade de dados de vídeo devido aos desenvolvimentos tecnológicos surpreendentes. Nesse cenário, há uma demanda crescente por sistemas eficientes para reduzir o trabalho e a sobrecarga de informações para as pessoas. Fazer uso eficiente do conteúdo de vídeo requer o desenvolvimento de ferramentas inteligentes capazes de entender os vídeos de maneira similar aos humanos. Esse tem sido o objetivo de uma área de pesquisa em rápida evolução conhecida como compreensão de vídeo. Nos últimos anos, graças à sua grande capacidade de aprendizado pela exposição aos dados, a aprendizagem profunda levou a um progresso notável na compreensão de vídeo. Em grande parte, isso se deve à disponibilidade de uma enorme quantidade de dados rotulados que contribuíram para o desenvolvimento de modelos com extraordinárias capacidades de inferência. Entretanto, produzir uma quantidade desejável de dados para saciar esses modelos pode ser uma tarefa inviável para muitos domínios de aplicação, pois a anotação de dados é um processo caro e, às vezes, exige um conhecimento específico. Essa dependência de rotulagem exaustiva é uma limitação chave para implantar sistemas de compreensão de vídeo no mundo real. Embora modelos de aprendizado profundo sejam excelentes em muitas tarefas de reconhecimento visual, ocasionalmente superando os humanos, sua capacidade de generalização é ruim, realizando apenas tarefas para as quais são treinados. A habilidade de se adaptar a novos cenários é a marca registrada da inteligência humana. Motivado por esses aspectos, o presente projeto de pesquisa propõe investigar métodos para melhorar a capacidade de generalização da aprendizagem profunda, permitindo executar compreensão de vídeo com mínima supervisão humana. A principal contribuição científica será um pipeline novo e mais sustentável para aplicações de aprendizagem profunda, exigindo conhecimento humano para desambiguar apenas decisões críticas. Para tanto, tenciona-se avançar o estado da arte em generalização de modelos, visando aprender com dados mais informativos e colocar o ser humano no circuito de maneira mais eficaz. Por fim, espera-se que os resultados desta proposta possam permitir que as empresas coloquem a IA em seus produtos ou sistemas de produção, reduzindo a necessidade de conhecimento de operador experiente em anotação de dados. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
DA SILVA, PUBLIO ELON CORREA; ALMEIDA, JURANDY. An Edge Computing-Based Solution for Real-Time Leaf Disease Classification Using Thermal Imaging. IEEE Geoscience and Remote Sensing Letters, v. 22, p. 5-pg., . (23/17577-0)