Advanced search
Start date
Betweenand

Designing End-to-End Architectures for Robust Reading of Registration Documents

Grant number: 20/04829-3
Support Opportunities:Scholarships in Brazil - Technical Training Program - Technical Training
Start date: May 01, 2020
End date: November 30, 2021
Field of knowledge:Physical Sciences and Mathematics - Computer Science - Computer Systems
Principal Investigator:Roberto de Alencar Lotufo
Grantee:José Ramon Trindade Pires
CNAE: Desenvolvimento e licenciamento de programas de computador customizáveis
Associated research grant:19/06667-3 - Robust reading of documents using deep learning, AP.PIPE

Abstract

A leitura automática de texto em imagens desperta interesse crescente por viabilizar um grande número de aplicações comerciais tais como: automatização de cadastros e matrículas baseados em informações relevantes de documentos cadastrais, consultas instantâneas a serviços de fiscalização; checagem e estruturação semi-supervisionada em prestação de contas, auxílio na vigilância com reconhecimento de placas de veículos e de sinalização, reconhecimento de números de série de contêineres, embalagens, etc.; entre outros.Leitura Robusta (Robust Reading) representa a área de pesquisa relacionada à interpretação de comunicação escrita em ambientes sem restrições. Localização e classificação de caracteres, bem como reconhecimento de palavras em imagens, são temas cuja relevância tem sido evidenciada pela comunidade científica desde a década de 80. Embora seja um problema investigado há muito tempo, há grande necessidade de mercado para aplicações que consigam taxas de erro inferiores às humanas, o que é atestado pelo aumento recente das competições dedicadas a desenvolver soluções tecnológicas mais eficazes e eficientes para esse fim e pelo envolvimento de empresas de alta tecnologia na pesquisa e no desenvolvimento de soluções na área. Considerando esta oportunidade de mercado para tecnologias que alcancem significativa diminuição das taxas de erro em Leitura Robusta, este projeto visa conceber novas arquiteturas end-to-end competitivas com o atual estado da arte em leitura robusta de documentos. Almejamos desenvolver um novo algoritmo de OCR da NeuralMind, um modelo que seja eficaz e confiável, reconhecendo dados cadastrais com o mínimo de erro possível; eficiente, exigindo o mínimo de parâmetros e viabilizando sua utilização em dispositivos móveis; robusto, isto é, operando em diferentes condições de iluminação e conservação do documento; e por fim escalável, de modo a atender vários documentos sem necessidade de re-configurações.

News published in Agência FAPESP Newsletter about the scholarship:
More itemsLess items
Articles published in other media outlets ( ):
More itemsLess items
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)