Busca avançada
Ano de início
Entree

Coleta de documentos regulatórios

Processo: 24/09245-0
Modalidade de apoio:Bolsas no Brasil - Programa Capacitação - Treinamento Técnico
Data de Início da vigência: 01 de setembro de 2024
Data de Término da vigência: 30 de junho de 2026
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Sistemas de Computação
Pesquisador responsável:Danilo Amaral de Oliveira
Beneficiário:André Almeida Rocha
CNAE: Tratamento de dados, provedores de serviços de aplicação e serviços de hospedagem na internet
Outras atividades de prestação de serviços de informação não especificadas anteriormente
Vinculado ao auxílio:23/16491-5 - Sigalei Analytics: Transformando Documentos Regulatórios em Decisões Estratégicas, AP.PIPE
Assunto(s):Tolerância a falhas
Palavra(s)-Chave do Pesquisador:Tolerância a Falhas | web crawling | Engenharia de dados

Resumo

O bolsista atuará no desenvolvimento de robôs automatizados para a coleta de documentos regulatórios nas suas respectivas fontes publicadoras. É importante ressaltar que documentos regulatórios envolvem os seguintes tipos de documentos: Diários Oficiais, Portarias, normas infralegais, leis ordinárias, Projetos de Lei e Propostas de Emenda à Constituição. Nesse projeto, a prioridade será a extração de leis publicadas à nível federal, estadual e das capitais e se estenderá aos outros tipos normativos citados. A alta variabilidade dos tipos de documentos e o grande volume das fontes de publicação, nos diferentes níveis federativos, apresentam um grande desafio para esta atividade. Outro obstáculo comumente encontrado e que requer elevada capacidade de propor soluções é a presença de tecnologias de bloqueio de coleta automatizada, o que contradiz a orientação federal, a qual orienta a publicação seja com arquivos em formato aberto e "amigável" à coleta por software.Por fim, o bolsista também será responsável por realizar correções nos robôs desenvolvidos para que o fluxo de transformação de documentos não estruturados em dados acionáveis seja executado (e permaneça) sem erros.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)