Advanced search
Start date
Betweenand

Collection and storage of official journals

Grant number: 23/06198-9
Support Opportunities:Scholarships in Brazil - Technical Training Program - Technical Training
Start date: June 01, 2023
End date: November 30, 2023
Field of knowledge:Physical Sciences and Mathematics - Computer Science - Computer Systems
Principal Investigator:Danilo Amaral de Oliveira
Grantee:Rodolfo Murilo Barbosa Moura
CNAE: Tratamento de dados, provedores de serviços de aplicação e serviços de hospedagem na internet
Outras atividades de prestação de serviços de informação não especificadas anteriormente
Associated research grant:22/10596-7 - Regulatory document extraction engine (MEDoRe), AP.PIPE

Abstract

Os diários oficiais são as principais fontes de informação para a sociedade e empresas sobre as decisões e atuações nos órgãos governamentais. Os diários oficiais divulga um grande volume de documentos regulatórios das esferas federal, estadual e municipal diariamente. Com exceção do diário oficial federal, os demais diários oficiais são divulgados em formato não interpretável por software (em formato PDF). Para superar o obstáculo de processar de maneira confiável e automatizada o grande volume de documentos regulatórios publicados diariamente é proposto o Mecanismo de Extração de Documentos Regulatórios (MEDoRe).Para o MEDoRe ser desenvolvido é necessário ter disponíveis os diários oficiais para processamento. Define-se como "disponíveis" os arquivos dos diários oficiais coletados dos portais de divulgação e armazenados em estrutura interna da Sigalei (empresa sede). Estes arquivos serão usados para construir datasets contendo amostras visuais do que são documentos regulatórios, para que métodos baseados em Redes Neurais Convolucional (do inglês, Convolutional Neural Network - CNN) possam ser treinados e gerar modelos para identificação visual de documentos regulatórios. É importante ressaltar que não existe um padrão de layout para os diários oficiais, assim é necessário ter a maior diversificação possível dos diários oficiais.

News published in Agência FAPESP Newsletter about the scholarship:
More itemsLess items
Articles published in other media outlets ( ):
More itemsLess items
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)