Busca avançada
Ano de início
Entree

Proposta de Arquitetura End-to-End para Leitura Robusta de Documentos Cadastrais

Processo: 20/04829-3
Modalidade de apoio:Bolsas no Brasil - Programa Capacitação - Treinamento Técnico
Data de Início da vigência: 01 de maio de 2020
Data de Término da vigência: 30 de novembro de 2021
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Sistemas de Computação
Pesquisador responsável:Roberto de Alencar Lotufo
Beneficiário:José Ramon Trindade Pires
CNAE: Desenvolvimento e licenciamento de programas de computador customizáveis
Vinculado ao auxílio:19/06667-3 - Leitura robusta de documentos cadastrais usando Deep Learning, AP.PIPE
Assunto(s):Visão computacional   Aprendizado computacional   Redes neurais convolucionais   Inteligência artificial
Palavra(s)-Chave do Pesquisador:Aprendizado de Máquina | Documentos Cadastrais | Leitura Robusta | Localização e Reconhecimento de Caracteres | Redes Neurais convolucionais | Visão Computacional | Inteligência Artificial

Resumo

A leitura automática de texto em imagens desperta interesse crescente por viabilizar um grande número de aplicações comerciais tais como: automatização de cadastros e matrículas baseados em informações relevantes de documentos cadastrais, consultas instantâneas a serviços de fiscalização; checagem e estruturação semi-supervisionada em prestação de contas, auxílio na vigilância com reconhecimento de placas de veículos e de sinalização, reconhecimento de números de série de contêineres, embalagens, etc.; entre outros.Leitura Robusta (Robust Reading) representa a área de pesquisa relacionada à interpretação de comunicação escrita em ambientes sem restrições. Localização e classificação de caracteres, bem como reconhecimento de palavras em imagens, são temas cuja relevância tem sido evidenciada pela comunidade científica desde a década de 80. Embora seja um problema investigado há muito tempo, há grande necessidade de mercado para aplicações que consigam taxas de erro inferiores às humanas, o que é atestado pelo aumento recente das competições dedicadas a desenvolver soluções tecnológicas mais eficazes e eficientes para esse fim e pelo envolvimento de empresas de alta tecnologia na pesquisa e no desenvolvimento de soluções na área. Considerando esta oportunidade de mercado para tecnologias que alcancem significativa diminuição das taxas de erro em Leitura Robusta, este projeto visa conceber novas arquiteturas end-to-end competitivas com o atual estado da arte em leitura robusta de documentos. Almejamos desenvolver um novo algoritmo de OCR da NeuralMind, um modelo que seja eficaz e confiável, reconhecendo dados cadastrais com o mínimo de erro possível; eficiente, exigindo o mínimo de parâmetros e viabilizando sua utilização em dispositivos móveis; robusto, isto é, operando em diferentes condições de iluminação e conservação do documento; e por fim escalável, de modo a atender vários documentos sem necessidade de re-configurações.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)