Bolsa 19/17312-1 - Aprendizagem profunda, Aprendizado computacional - BV FAPESP
Busca avançada
Ano de início
Entree

Aprendizado adversarial de políticas de aumentação de imagens para detecção de objetos

Processo: 19/17312-1
Modalidade de apoio:Bolsas no Exterior - Estágio de Pesquisa - Mestrado
Data de Início da vigência: 01 de outubro de 2019
Data de Término da vigência: 31 de março de 2020
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Nina Sumiko Tomita Hirata
Beneficiário:Leonardo Blanger
Supervisor: Xiaoyi Jiang
Instituição Sede: Instituto de Matemática e Estatística (IME). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Instituição Anfitriã: University of Munster, Alemanha  
Vinculado à bolsa:18/00390-7 - Detecção de códigos QR usando modelos de aprendizado profundo, BP.MS
Assunto(s):Aprendizagem profunda   Aprendizado computacional   Visão computacional   Reconhecimento de objetos   Imagem
Palavra(s)-Chave do Pesquisador:Deep Learning | Generative Adversarial Networks | image augmentation | Object detection | Visão Computacional, Aprendizado de Máquina

Resumo

Avanços recentes em arquiteturas neurais profundas atingiram resultados impressionantes na tarefa de Detecção de Objetos. Entretanto, estas técnicas são conhecidas por precisarem de grandes quantidades de dados rotulados para poder generalizar corretamente, dados que são mais difíceis de obter do que no caso tradicional de classificação de imagens. Para amenizar este problema, a aplicação de técnicas de aumentação de imagens se tornou padrão na literatura. Estas formas tradicionais de aumentação consistem sobretudo de sequências fixas de operações projetadas manualmente e aplicadas sobre as imagens com parâmetros aleatórios, o que já ameniza a falta de dados rotulados no problema de detecção genérica de objetos, porém não sendo o suficiente em cenários mais específicos onde existem poucos dados. Nesta perspectiva, alguns trabalhos já utilizam técnicas de geração de imagens para criar novos exemplos de treinamento artificialmente, mas no melhor do nosso conhecimento, nenhum deles aborda detecção de objetos. De forma paralela, modelos geradores propostos recentemente, baseados no framework GAN, atingiram resultados impressionantes em termos de realismo visual para algumas classes de objetos, e certos trabalhos em aumentação de imagens já utilizam estes modelos para tarefas de classificação. O objetivo deste estágio é investigar a aplicação de arquiteturas adversariais propostas recentemente, para geração automática de exemplos rotulados, de modo a aprimorar a qualidade de modelos de detecção de objetos baseados em aprendizado profundo. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
BLANGER, LEONARDO; HIRATA, NINA S. T.; JIANG, XIAOYI; IEEE COMP SOC. Reducing the need for bounding box annotations in Object Detection using Image Classification data. 2021 34TH SIBGRAPI CONFERENCE ON GRAPHICS, PATTERNS AND IMAGES (SIBGRAPI 2021), v. N/A, p. 8-pg., . (18/00390-7, 15/22308-2, 17/25835-9, 19/17312-1)