Busca avançada
Ano de início
Entree

O Corpus M.A.P.: Edição e coordenação da revisão da edição filológica digital dos documentos provenientes do Arquivo Público do Estado de São Paulo (APESP)

Processo: 22/16215-5
Modalidade de apoio:Bolsas no Brasil - Programa Capacitação - Treinamento Técnico
Data de Início da vigência: 01 de março de 2023
Data de Término da vigência: 31 de janeiro de 2025
Área de conhecimento:Linguística, Letras e Artes - Letras - Língua Portuguesa
Pesquisador responsável:Maria Clara Paixão de Sousa
Beneficiário:Elisa Hardt Leitão Motta
Instituição Sede: Faculdade de Filosofia, Letras e Ciências Humanas (FFLCH). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Vinculado ao auxílio:21/15133-2 - O Corpus M.A.P.: desenvolvimento de um sistema de edições filológicas digitais para a documentação sobre Mulheres na América Portuguesa, AP.R
Assunto(s):História das mulheres   Humanidades digitais
Palavra(s)-Chave do Pesquisador:corpus eletrônico | Edição filológica digital | história das mulheres | Humanidades Digitais | Filologia, Humanidades Digitais

Resumo

Conforme indicado no Projeto de Pesquisa 'O Corpus M.A.P.: Desenvolvimento de um sistema de edições filológicas digitais para a documentação sobre as Mulheres na América Portuguesa' (FAPESP 2021/15133-2), o tratamento dos textos no Corpus M.A.P. será desenvolvido como recursos digitais que buscam unir tecnologias atuais aos mais rigorosos princípios da prática filológica, nos moldes de Paixão de Sousa (2013) e Monte e Paixão de Sousa (2017). As pesquisadoras doutoras e as doutorandas envolvidas na presente proposta tem ampla experiência no campo da construção de tecnologias de corpus. Entre as ferramentas e metodologias já desenvolvidas pelas pesquisadoras estão o eDictor (http://edictor.net), software para edição filológica e anotação linguística automática desenvolvido pela pesquisadora responsável por esta Proposta em conjunto com pesquisadores da área da computação (Paixão de Sousa, Kepler e Faria, 2010), e o WebSync, sistema web para corpora anotados em XML desenvolvido por Aline Silva Costa sob a orientação de Cristiane Namiuti. Além disso, e também conforme o Projeto, uma importe vertente do trabalho de construção do Corpus M.A.P. será o desenvolvimento de modelos para leitura automática dos manuscritos, por meio do treinamento de softwares com a tecnologia Handwritten Text Recognition (HTR). Tendo em vista nossas investigações preliminares, o plano da equipe é treinar o Transkribus (software desenvolvido pelo consórcio ReadCoop, sediado na Universidade de Insbruck, Áustria - https://readcoop.eu/transkribus) para o conjunto documental A-TSO e o LaPeLinC Transcriptor (LaPeLinC Transcriptor, software para a transcrição paleográfica de documentos históricos desenvolvido por Bruno Silvério Costa, cf. Costa, Costa, Santos e Namiuti, 2021) para o conjunto documental B-SGCSP. O conjunto C-IEB será transcrito sem auxílio de ferramentas de HTR. Teremos, dessa forma, três grupos trabalhados com métodos diferentes, e resultados que podem ser comparados para pesquisas futuras. A estudante indicada para esta bolsa ficará responsável pela edição filológica digital dos documentos provenientes do Arquivo Público do Estado de São Paulo (APESP), bem como por sua revisão, incluindo sua anotação diplomática. A aluna também se ocupará da elaboração das normas para a edição modernizada dos documentos, bem como o treinamento dos softwares de reconhecimento automático de manuscritos (HTR).(Para as referências bibliográficas citadas, cf. Projeto de pesquisa, p. 19-20).

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)