Busca avançada
Ano de início
Entree

Aprendizado profundo para visão computacional: melhorando a generalização com poucos dados

Processo: 24/04500-2
Modalidade de apoio:Bolsas no Brasil - Pós-Doutorado
Data de Início da vigência: 01 de setembro de 2024
Data de Término da vigência: 31 de agosto de 2026
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Jurandy Gomes de Almeida Junior
Beneficiário:Samuel Felipe dos Santos
Instituição Sede: Centro de Ciências em Gestão e Tecnologia (CCGT). Universidade Federal de São Carlos (UFSCAR). Campus de Sorocaba. Sorocaba , SP, Brasil
Assunto(s):Unidade de processamento gráfico   Aprendizagem profunda   Generalização   Visão computacional
Palavra(s)-Chave do Pesquisador:Adaptação de Domínio | Aprendizado em Múltiplos Domínios | Aprendizado profundo | generalização | Rotulação de Baixo Custo | Visão Computacional | Processamento Gráfico (Graphics)

Resumo

Com a popularização de plataformas de redes sociais com foco em conteúdo gerado por seus próprios usuários, um enorme volume de imagens e vídeos passaram a serem geradas diariamente. A catalogação e busca desses conteúdos se faz necessária, no entanto, a análise dessa imensa quantidade de conteúdo de maneira manual é praticamente impossível, tornando essencial a utilização de sistemas capazes de captar o significado desse conteúdo de maneira automática. A área de visão computacional lida com esses conceitos, abrangendo aspectos de processamento, interpretação e compreensão automática de cenas. Métodos de aprendizado profundo são capazes de atingir o estado da arte em tarefas de visão computacional, mas apesar disso, seu desempenho ainda está muito aquém da percepção humana, sendo grande parte do sucesso obtido devido ao enorme volume de dados rotulados disponíveis em conjunto de dados como a ImageNet. No entanto, em cenários do mundo real, muitos domínios de aplicações não possuem quantidade suficiente de dados rotulados, já que a rotulação muitas vezes é realizada manualmente, tendo um custo humano muito alto. A inteligência humana é conhecida por sua capacidade de se adaptar a novos cenários, realizando a generalização de experiências passadas, habilidade que modelos profundos, apesar de seus excelentes resultados, têm dificuldade em replicar por geralmente serem especializados apenas na tarefa em que foram treinados. Motivado por esses aspectos, este projeto de pesquisa tem como objetivo propor métodos para melhorar a capacidade de generalização de métodos de aprendizado profundo para tarefas de visão computacional, reduzindo sua dependência de supervisão humana. As principais contribuições serão o desenvolvimento de novas estratégias para treinar modelos profundos com poucos dados rotulados, reduzir o esforço humano necessário para anotar dados e reduzir a quantidade de parâmetros necessários para lidar com múltiplas tarefas. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
ALVARENGA E SILVA, LUCAS FERNANDO; DOS SANTOS, SAMUEL FELIPE; SEBE, NICU; ALMEIDA, JURANDY. Beyond the known: Enhancing Open Set Domain Adaptation with unknown exploration. PATTERN RECOGNITION LETTERS, v. 189, p. 8-pg., . (21/13348-1, 13/08293-7, 20/08770-3, 24/04500-2, 23/17577-0, 19/17874-0, 23/03328-9, 17/25908-6)