Busca avançada
Ano de início
Entree

Elaboracao do conjunto de textos sintaticamente anotados do corpus tycho brahe da lingua nheengatu

Processo: 23/16110-1
Modalidade de apoio:Bolsas no Brasil - Programa Capacitação - Treinamento Técnico
Data de Início da vigência: 01 de janeiro de 2024
Data de Término da vigência: 31 de dezembro de 2025
Área de conhecimento:Interdisciplinar
Pesquisador responsável:Maria Filomena Spatti Sandalo
Beneficiário:Juliana Lopes Gurgel
Instituição Sede: Instituto de Estudos da Linguagem (IEL). Universidade Estadual de Campinas (UNICAMP). Campinas , SP, Brasil
Vinculado ao auxílio:22/09158-5 - Corpora anotados digitais de línguas indígenas brasileiras com traduções automáticas (DACILAT), AP.ESCIENCE.TEM
Assunto(s):Anotação de corpus   Corpus   Línguas indígenas   Tradução automática   Linguística computacional
Palavra(s)-Chave do Pesquisador:anotação de córpus | corpus | Línguas indígenas | Tradução automática | Linguística Computacional

Resumo

Pretendemos elaborar corpora digitais sintaticamente e morfologicamente anotados. Pretende-se expandir o atual corpus existente do Nheengatu, que no momento se limita a textos de uma única fonte e só conta com anotação morfológica automática sem revisão, provendo-o de anotação revisada em diferentes níveis e incorporando-o à plataforma Tycho Brahe.Pretendemos também traduzir sentenças do português para o Nheengatu. Esta tarefa já foi iniciada nesta língua e os primeiros resultados em tradução automática já existem. E construir testes negativos com sentenças agramaticais.Todos os dados serão glosados pelo sistema do Tycho e pelas Leipzig Glossing Rules. O bolsista será crucial na colaboração desta tarefa.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)