Advanced search
Start date
Betweenand

Corpus M.A.P.: Development of the M.A.P Catalog 2.0 and the metadata for the Corpus M.A.P. Beta

Grant number: 22/16216-1
Support Opportunities:Scholarships in Brazil - Technical Training Program - Technical Training
Start date: February 01, 2023
End date: January 31, 2025
Field of knowledge:Linguistics, Literature and Arts - Literature - Portuguese Language
Principal Investigator:Maria Clara Paixão de Sousa
Grantee:Igor Leal Souza
Host Institution: Faculdade de Filosofia, Letras e Ciências Humanas (FFLCH). Universidade de São Paulo (USP). São Paulo , SP, Brazil
Associated research grant:21/15133-2 - The M.A.P. Corpus: developing a digital edition system for documents about Women in Portuguese America, AP.R

Abstract

Conforme indicamos no Projeto de Pesquisa 'O Corpus M.A.P.: Desenvolvimento de um sistema de edições filológicas digitais para a documentação sobre as Mulheres na América Portuguesa' (FAPESP 2021/15133-2), a primeira e mais importante tarefa na construção de um Corpus eletrônico é a formulação de um sistema de metadados robusto, flexível e padronizado. A experiência de construção do Corpus Carolina (http://sites.usp.br/corpuscarolina) mostrou essa importância com muita clareza para a equipe: a etapa de discussão, formulação e implementação dos metadados (na forma de um cabeçalho padronizado de acordo com as normas TEI., cf TEI Consortium, 2021) ocupou parte importante do trabalho em 2020 e 2021. Nesse processo, desenvolvemos ideias e aprendemos técnicas fundamentais que desejamos transferir para a formação do Corpus M.A.P. A estrutura atual do Catálogo M.A.P. já representa efetivamente os metadados de um futuro Corpus. Esse sempre foi o espírito por trás da formação de um catálogo com o grau de detalhamento do M.A.P. - presentemente, cada uma das 150 entradas apresenta 39 categorias descritivas, pertinentes a informações arquivísticas, filológicas, temáticas e textuais de cada documento. Como o Catálogo M.A.P. foi construído em XML, a ideia inicial era a de que cada entrada fosse aproveitada como o cabeçalho do documento do Corpus, que contivesse cada manuscrito editado. Entretanto, nossa experiência com o Carolina mostra que será desejável que, nesse aproveitamento, as categorias M.A.P. sejam adaptadas para o vocabulário geral do padrão TEI. Essa adaptação formará o modelo para os cabeçalhos do Corpus - e, dialeticamente, nos obrigará a reescrever o próprio Catálogo. Essa contingência é bem-vinda, já que, desde os primeiros meses de 2021, a Frente Computacional do Projeto M.A.P. vem desenvolvendo as sementes de um novo formato para a codificação do Catálogo, com novas formas de inserção de dados e categorias descritivas aprofundadas, de um ponto de vista temático, e mais robustas, de um ponto de vista computacional. A essa nova versão, já preliminarmente desenhada, mas ainda não implementada, denominamos o 'Catálogo M.A.P. 2.0'.Prevemos, assim, iniciar a construção do Corpus pelo desenvolvimento desse sistema de metadados avançado. Como a equipe prevista para a tarefa é composta (entre outras) pelas quatro pesquisadoras que desenvolveram o cabeçalho Carolina, acreditamos que esse trabalho será muito produtivo. A meta, nesse caso, é que o 'Catálogo M.A.P. 2.0' (ou seja, o novo formato do Catálogo e, consequentemente, o modelo de cabeçalhos do Corpus) esteja pronto dentro do primeiro semestre da vigência da presente proposta. A partir de então, este modelo será usado nos textos que virão a compor o Corpus. O trabalho de Igor Leal, pesquisador indicado para esta bolsa, será central para a capacitação das estudantes e para o aumento na sofisticação da codificação do Catálogo. Ele realizou a capacitação inicial das pesquisadoras no Framework Django e atuou como parte fundamental no desenho preliminar do Catálogo M.A.P. 2.0.

News published in Agência FAPESP Newsletter about the scholarship:
More itemsLess items
Articles published in other media outlets ( ):
More itemsLess items
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)