Busca avançada
Ano de início
Entree

O Corpus M.A.P.: Edição fac-similar dos documentos provenientes do Arquivo Público do Estado de São Paulo (APESP) e edição filológica digital dos manuscritos do Instituto de Estudos Brasileiros da USP (IEB)

Processo: 23/06772-7
Modalidade de apoio:Bolsas no Brasil - Programa Capacitação - Treinamento Técnico
Vigência (Início): 01 de junho de 2023
Vigência (Término): 31 de julho de 2024
Área do conhecimento:Linguística, Letras e Artes - Letras - Língua Portuguesa
Pesquisador responsável:Maria Clara Paixão de Sousa
Beneficiário:Nicólli de Lima Garcia
Instituição Sede: Faculdade de Filosofia, Letras e Ciências Humanas (FFLCH). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Vinculado ao auxílio:21/15133-2 - O Corpus M.A.P.: desenvolvimento de um sistema de edições filológicas digitais para a documentação sobre Mulheres na América Portuguesa, AP.R
Assunto(s):História das mulheres   Humanidades digitais
Palavra(s)-Chave do Pesquisador:corpus eletrônico | Edição filológica digital | história das mulheres | Humanidades Digitais | Filologia, Humanidades Digitais

Resumo

Conforme indicado no Projeto de Pesquisa 'O Corpus M.A.P.: Desenvolvimento de um sistema de edições filológicas digitais para a documentação sobre as Mulheres na América Portuguesa' (FAPESP 2021/15133-2), o tratamento dos textos no Corpus M.A.P. será desenvolvido como recursos digitais que buscam unir tecnologias atuais aos mais rigorosos princípios da prática filológica, nos moldes de Paixão de Sousa (2013) e Monte e Paixão de Sousa (2017). As pesquisadoras doutoras e as doutorandas envolvidas na presente proposta têm ampla experiência no campo da construção de tecnologias de corpus. Entre as ferramentas e metodologias já desenvolvidas pelas pesquisadoras estão o eDictor (http://edictor.net), software para edição filológica e anotação linguística automática desenvolvido pela pesquisadora responsável por esta Proposta em conjunto com pesquisadores da área da computação (Paixão de Sousa, Kepler e Faria, 2010), e o WebSync, sistema web para corpora anotados em XML desenvolvido por Aline Silva Costa sob a orientação de Cristiane Namiuti. Além disso, e também conforme o Projeto, uma importe vertente do trabalho de construção do Corpus M.A.P. será o desenvolvimento de modelos para leitura automática dos manuscritos, por meio do treinamento de softwares com a tecnologia Handwritten Text Recognition (HTR). Tendo em vista nossas investigações preliminares, o plano da equipe é treinar o Transkribus (software desenvolvido pelo consórcio ReadCoop, sediado na Universidade de Insbruck, Áustria - https://readcoop.eu/transkribus) para o conjunto documental A-TSO e o LaPeLinC Transcriptor (LaPeLinC Transcriptor, software para a transcrição paleográfica de documentos históricos desenvolvido por Bruno Silvério Costa, cf. Costa, Costa, Santos e Namiuti, 2021) para o conjunto documental B-SGCSP. O conjunto C-IEB será transcrito sem auxílio de ferramentas de HTR. Teremos, dessa forma, três grupos trabalhados com métodos diferentes, e resultados que podem ser comparados para pesquisas futuras. A estudante indicada para esta bolsa ficará responsável pela edição fac-similar dos documentos do Arquivo Público do Estado de São Paulo (APESP) e pela edição filológica digital de parte dos documentos provenientes do Arquivo do Instituto de Estudos Brasileiros (IEB) da USP, incluindo sua anotação diplomática. Além disso, realizará transcrições no software Transkribus.(Para as referências bibliográficas citadas, cf. Projeto de Pesquisa, p. 19-20).

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Matéria(s) publicada(s) em Outras Mídias (0 total):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)