Advanced search
Start date
Betweenand

Transforming unstructured documents into actionable data (MEDoRe - Extraction)

Grant number: 24/09212-5
Support Opportunities:Scholarships in Brazil - Technical Training Program - Technical Training
Start date: August 01, 2024
End date: June 30, 2026
Field of knowledge:Physical Sciences and Mathematics - Computer Science - Computer Systems
Principal Investigator:Danilo Amaral de Oliveira
Grantee:Ivan Ramos Pagnossin
CNAE: Tratamento de dados, provedores de serviços de aplicação e serviços de hospedagem na internet
Outras atividades de prestação de serviços de informação não especificadas anteriormente
Associated research grant:23/16491-5 - Sigalei Analytics: Turning Regulatory Documents into Strategic Decisions, AP.PIPE

Abstract

As atividades do bolsista estão ligadas principalmente ao módulo MEDoRe - Extração referente a extração e estruturação de conteúdo dos documentos regulatórios e dos complementares. Para isso, o bolsista trabalhará na geração dos conjuntos de treinamento dos modelos de visão computacional e classificação de textos, na etapa de treinamento e validação dos respectivos modelos e no aperfeiçoamento das definições de regras de decisão e expressões regulares para estruturação do texto. Além disso, o bolsista será responsável pela construção da heurística que direciona a extração e estruturação do conteúdo, a qual pode ser realizada usando o MEDoRe em paralelo com outras abordagens quando o documento não requerer processamento complexo. Ao final, o bolsista também será responsável por disponibilizar o módulo por meio de serviço para permitir a sua integração à Sigalei Analytics.

News published in Agência FAPESP Newsletter about the scholarship:
More itemsLess items
Articles published in other media outlets ( ):
More itemsLess items
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)