Busca avançada
Ano de início
Entree


Interactive segmentation of objects in images and videos using graphs and fuzzy models of content knowledge

Texto completo
Autor(es):
Thiago Vallin Spina
Número total de Autores: 1
Tipo de documento: Tese de Doutorado
Imprenta: Campinas, SP.
Instituição: Universidade Estadual de Campinas (UNICAMP). Instituto de Computação
Data de defesa:
Membros da banca:
Alexandre Xavier Falcão; Hélio Pedrini; Neucimar Jerônimo Leite; Silvio Jamil Ferzoli Guimarães; Luís Gustavo Nonato
Orientador: Alexandre Xavier Falcão
Resumo

Com o avanço da mídia social, usuários típicos passaram de consumidores passivos a produtores ativos de conteúdo multimídia que é compartilhado na Internet. Nesse cenário, várias aplicações foram desenvolvidas para edição de fotos e vídeos. A segmentação interativa de objetos em imagens e vídeos é frequentemente necessária para essas aplicações, que demandam por métodos eficazes e eficientes capazes de auxiliar o usuário a extrair os objetos de interesse do fundo acuradamente, requerendo pouco esforço e tempo para tanto. A segmentação pode ser dividida em reconhecimento e delineamento de objeto. O reconhecimento envolve localizar aproximadamente o objeto e verificar o resultado da segmentação, sendo uma tarefa fácil para humanos. O delineamento visa definir a extensão espacial do objeto em imagens e quadros de vídeo, e pode ser feito pelo computador com maior precisão. Métodos interativos buscam a sinergia entre o humano e a máquina através da propagação de rótulos advindos das anotações do usuário (i.e., pixels semente, regiões de interesse e quadros segmentados em vídeo) para os dados não rotulados. Em segmentação de imagens, um modo natural de explorar a conexão entre a informação anotada de objeto (sementes) e os pixels restantes é considerando a imagem explicita ou implicitamente como um grafo ponderado. Vários arcabouços baseados em grafo podem ser utilizados para delineamento, mas um desafio é como estimar bons pesos para os arcos do grafo que tornem a segmentação trivial. A primeira contribuição deste trabalho é uma metodologia para estimar os pesos dos arcos que realça as diferenças entre objeto e fundo via aprendizado supervisionado, feito transparentemente a partir da interação do usuário. Nossa segunda contribuição visa tornar a interação do usuário mais eficaz quando a estimativa de pesos é imperfeita. Ela envolve o desenvolvimento de técnicas híbridas de segmentação que combinam métodos baseados em região com abordagens por perseguição de borda, para aproveitar as vantagens de ambos. Apesar das ferramentas interativas de imagem supracitadas poderem ser utilizadas para segmentar vídeos quadro a quadro, é mais eficaz desenvolver abordagens que propaguem automaticamente a máscara de segmentação do quadro inicial para o restante do vídeo. Nossa terceira contribuição encapsula o conhecimento do usuário sobre o objeto em um modelo nebuloso de forma para reconhecimento. Esse modelo visa minimizar a necessidade de intervenção humana, corrigindo automaticamente a segmentação propagada para novos quadros. O usuário pode ainda refinar o resultado com nossos métodos interativos de segmentação de imagens (AU)

Processo FAPESP: 11/01434-9 - Segmentação interativa de objetos em vídeo digital usando grafos e modelos nebulosos de conhecimento de conteúdo
Beneficiário:Thiago Vallin Spina
Modalidade de apoio: Bolsas no Brasil - Doutorado Direto