Bolsa 20/04814-6 - Inteligência artificial, Aprendizagem profunda - BV FAPESP
Busca avançada
Ano de início
Entree

Geração e Sintetização de Documentos Cadastrais usando Generative Adversarial Networks

Processo: 20/04814-6
Modalidade de apoio:Bolsas no Brasil - Programa Capacitação - Treinamento Técnico
Data de Início da vigência: 01 de maio de 2020
Data de Término da vigência: 28 de fevereiro de 2022
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Sistemas de Computação
Pesquisador responsável:Roberto de Alencar Lotufo
Beneficiário:Rafael Derradi de Souza
CNAE: Desenvolvimento e licenciamento de programas de computador customizáveis
Vinculado ao auxílio:19/06667-3 - Leitura robusta de documentos cadastrais usando Deep Learning, AP.PIPE
Assunto(s):Inteligência artificial   Aprendizagem profunda
Palavra(s)-Chave do Pesquisador:Deep Learning | Inteligência Artificial

Resumo

A estruturação de informações de documentos digitalizados a partir da leitura automática de texto é uma área que tem despertado bastante interesse comercial devido ao seu potencial de agilizar e facilitar diversos tipos de processos. Este projeto visa o desenvolvimento de arquiteturas end-to-end usando técnicas avançadas de Deep Learning para leitura robusta e restauração inteligente de documentos cadastrais com alta assertividade, robustez, eficiência e escalabilidade. Um dos desafios do projeto é a obtenção de um grande número de amostras anotadas para utilização durante o treinamento dos modelos. A estratégia a ser adotada envolve a utilização de redes adversariais geradoras (ou GANs, do inglês Generative Adversarial Networks). A arquitetura básica de tais redes consiste em uma componente geradora de novos exemplos e outra discriminadora que avalia se o dado gerado é real ou falso. As GANs têm sido bastante empregadas na geração de dados sintéticos em diversas áreas, como moda, video games, etc., e são comumente usadas na geração de dados apropriados para treinamento de modelos para leitura robusta. Neste projeto, serão avaliadas as principais arquiteturas de GANs atualmente existentes para aplicação em problemas de restauração e sintetização de imagens, bem como o desenvolvimento de uma arquitetura eficiente para a realização de tais tarefas, buscando superar dificuldades como correção de perspectiva de captura, remoção de fundo, marcas d'água, carimbos e/ou assinaturas, comumente presentes em documentos cadastrais.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)