Busca avançada
Ano de início
Entree


Análise comparativa de abordagens para aprendizado de transformações imagem-a-imagem

Texto completo
Autor(es):
Augusto Cesar Monteiro Silva
Número total de Autores: 1
Tipo de documento: Dissertação de Mestrado
Imprenta: São Paulo.
Instituição: Universidade de São Paulo (USP). Instituto de Matemática e Estatística (IME/SBI)
Data de defesa:
Membros da banca:
Nina Sumiko Tomita Hirata; Hae Yong Kim; Letícia Rittner
Orientador: Nina Sumiko Tomita Hirata
Resumo

Criar manualmente um operador de imagem para performar uma transformação imagem-a-imagem específica é uma tarefa árdua e dificil. O problema do aprendizado automático de operadores de imagens tem sido estudado através dos anos. Métodos que atacam ese problema podem ser divididos em três tipos: as abordagens tradicionais pixel-a-pixel ou janelas deslizantes, abordagens patch-a-patch que foram possibilitadas por modelos de aprendizado profundo, e abordagens orientadas a estrutura que são baseadas em técnicas gerativas. Cada abordagem possui suas vantagens e desvantagens próprias. O objetivo dessa dissertação é estudar as similaridades e diferenças dessas abordagens, tanto conceptualmente quanto experimentalmente. Particularmente, estamos interessados em entender o quanto de informação estrutural da imagem, como conectividade de linhas, é preservado. A primeira contribuição desse trabalho é um método que une as vantagens das abordagens pixel-a-pixel e patch-a-patch, que chamamos de SConvNet. A segunda contribuição é um estudo que mostra que a métrica baseada em similaridades de esqueletos é válida para avaliar binarização de documentos manuscritos de forma complementar a métricas pixel-a-pixel tradicionais. Por fim, apresentamos uma comparação experimental entre métodos representativos de cada uma das três abordagens, calculando métricas pixel-a-pixel e as métricas de similaridade de esqueletos em dois problemas de processamento de imagens (segmentação de vasos sanguineos de retina e binarização de documentos manuscritos). As melhores métricas pixel-a-pixel foram obtidas por métodos patch-a-patch, enquanto os métodos estruturais obtiveram vantagens nas métricas de similaridade de esqueletos, de forma consistente com uma inspeção visual, que mostra que as abordagens estruturais melhor preservam a estrutura geral enquanto os métodos patch-a-patch geram contornos mais precisos. (AU)

Processo FAPESP: 18/00477-5 - Aprendizado de transformações imagem-a-imagem
Beneficiário:Augusto César Monteiro Silva
Modalidade de apoio: Bolsas no Brasil - Mestrado