Busca avançada
Ano de início
Entree

Explorando representações de alto nível em aprendizado automático de operadores

Processo: 14/21692-0
Linha de fomento:Bolsas no Exterior - Estágio de Pesquisa - Doutorado Direto
Vigência (Início): 20 de janeiro de 2015
Vigência (Término): 19 de janeiro de 2016
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Roberto Hirata Junior
Beneficiário:Igor dos Santos Montagner
Supervisor no Exterior: Stéphane Canu
Instituição-sede: Instituto de Matemática e Estatística (IME). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Local de pesquisa: Institut National des Sciences Appliquées Rouen (INSA Rouen), França  
Vinculado à bolsa:11/23310-0 - Projeto automático de operadores de imagens: extensão e contextualização para reticulados não necessariamente booleanos, BP.DD
Assunto(s):Aprendizado computacional   Operadores   Processamento de imagens

Resumo

O projeto de operadores entre imagens é uma tarefa trabalhosa e normalmente executada por especialistas em Processamento de Imagens. Porém, esta tarefa também pode ser interpretada como um problema de Aprendizagem Computacional. Um operador pode ser representado como uma função local $\psi$ que devolve para cada pixel $p$ da imagem sua intensidade na imagem de saída. Esta função recebe como entrada o valor dos pixels em uma vizinhança (janela) ao redor de $p$. A função $\psi$ é estimada a partir de um conjunto de pares de imagens contendo uma imagem de entrada e sua versão processada. A maioria dos trabalhos recentes são relacionados a métodos de seleção de janelas, cujo objetivo é encontrar uma janela ótima contida em uma janela domínio grande, e a operadores dois níveis, que combinam a saída de vários operadores com o objetivo de aumentar a robustez do operador. Apesar de resultados significativos terem sido obtidos por operadores treinados entre imagens binárias, processar imagens em níveis de cinza ainda é um desafio devido à grande variabilidade dos padrões. Neste contexto, mesmo janelas pequenas podem resultar em operadores com overfitting e as técnicas existentes não devem funcionar. Neste projeto propomos resolver este desafio mudando a representação dos padrões observados. Ao invés de utilizar os valores dos pixels diretamente, estudaremos como calcular um novo vetor de características a partir do padrão observado por uma janela com o objetivo de melhorar a performance dos operadores de imagens. Serão estudadas duas classes de métodos que mudam a representação dos dados: Kernel methods e Representation Learning. Ambas as classes têm obtido desempenho próximo ao estado-da-arte em diferentes aplicações, mas calculam a nova representação de maneiras diferentes. A relação teórica entre estas técnicas e os métodos existentes será explorada e formalizada e seu desempenho será comparado com métodos do estado-da-arte em datasets públicos. (AU)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
MONTAGNER, IGOR S.; HIRATA, NINA S. T.; HIRATA, JR., ROBERTO. Staff removal using image operator learning. PATTERN RECOGNITION, v. 63, p. 310-320, MAR 2017. Citações Web of Science: 4.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.