| Processo: | 14/21692-0 |
| Modalidade de apoio: | Bolsas no Exterior - Estágio de Pesquisa - Doutorado Direto |
| Data de Início da vigência: | 20 de janeiro de 2015 |
| Data de Término da vigência: | 19 de janeiro de 2016 |
| Área de conhecimento: | Ciências Exatas e da Terra - Ciência da Computação |
| Pesquisador responsável: | Roberto Hirata Junior |
| Beneficiário: | Igor dos Santos Montagner |
| Supervisor: | Stéphane Canu |
| Instituição Sede: | Instituto de Matemática e Estatística (IME). Universidade de São Paulo (USP). São Paulo , SP, Brasil |
| Instituição Anfitriã: | Institut National des Sciences Appliquées Rouen (INSA Rouen), França |
| Vinculado à bolsa: | 11/23310-0 - Projeto automático de operadores de imagens: extensão e contextualização para reticulados não necessariamente booleanos, BP.DD |
| Assunto(s): | Aprendizado computacional Operadores Processamento de imagens |
| Palavra(s)-Chave do Pesquisador: | Image Operator Learning | Kernel methods | machine learning | Representation Learning | Aprendizagem Computacional |
Resumo O projeto de operadores entre imagens é uma tarefa trabalhosa e normalmente executada por especialistas em Processamento de Imagens. Porém, esta tarefa também pode ser interpretada como um problema de Aprendizagem Computacional. Um operador pode ser representado como uma função local $\psi$ que devolve para cada pixel $p$ da imagem sua intensidade na imagem de saída. Esta função recebe como entrada o valor dos pixels em uma vizinhança (janela) ao redor de $p$. A função $\psi$ é estimada a partir de um conjunto de pares de imagens contendo uma imagem de entrada e sua versão processada. A maioria dos trabalhos recentes são relacionados a métodos de seleção de janelas, cujo objetivo é encontrar uma janela ótima contida em uma janela domínio grande, e a operadores dois níveis, que combinam a saída de vários operadores com o objetivo de aumentar a robustez do operador. Apesar de resultados significativos terem sido obtidos por operadores treinados entre imagens binárias, processar imagens em níveis de cinza ainda é um desafio devido à grande variabilidade dos padrões. Neste contexto, mesmo janelas pequenas podem resultar em operadores com overfitting e as técnicas existentes não devem funcionar. Neste projeto propomos resolver este desafio mudando a representação dos padrões observados. Ao invés de utilizar os valores dos pixels diretamente, estudaremos como calcular um novo vetor de características a partir do padrão observado por uma janela com o objetivo de melhorar a performance dos operadores de imagens. Serão estudadas duas classes de métodos que mudam a representação dos dados: Kernel methods e Representation Learning. Ambas as classes têm obtido desempenho próximo ao estado-da-arte em diferentes aplicações, mas calculam a nova representação de maneiras diferentes. A relação teórica entre estas técnicas e os métodos existentes será explorada e formalizada e seu desempenho será comparado com métodos do estado-da-arte em datasets públicos. (AU) | |
| Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa: | |
| Mais itensMenos itens | |
| TITULO | |
| Matéria(s) publicada(s) em Outras Mídias ( ): | |
| Mais itensMenos itens | |
| VEICULO: TITULO (DATA) | |
| VEICULO: TITULO (DATA) | |