Busca avançada
Ano de início
Entree

Regras linguisticas para tratamento computacional da variacao de grafia e abreviaturas do "corpus tycho brahe".

Processo: 01/06529-6
Modalidade de apoio:Bolsas no Brasil - Iniciação Científica
Data de Início da vigência: 01 de setembro de 2001
Data de Término da vigência: 31 de agosto de 2002
Área de conhecimento:Linguística, Letras e Artes - Linguística - Linguística Histórica
Pesquisador responsável:Helena de Souza Britto
Beneficiário:Taís Amstalden Menegatti
Instituição Sede: Instituto de Estudos da Linguagem (IEL). Universidade Estadual de Campinas (UNICAMP). Campinas , SP, Brasil
Assunto(s):Abreviaturas
Palavra(s)-Chave do Pesquisador:Abreviaturas | Historia Do Portugues | Linguistica Historica | Variacao De Grafia

Resumo

Este projeto pretende abordar questões problemáticas encontradas em textos do Corpus Tycho Brahe, vinculado ao projeto temático FAPESP "padrões rítmicos, fixação de parâmetro e mudança lingüística". Foram encontradas variações de grafia que comprometem o trabalho do etiquetador morfológico automático, sendo necessário, então, desenvolver e implementar regras lingüísticas para o tratamento adequado computacional dessas variações. As abreviaturas encontradas nesses textos também tornaram-se um problema para a etiquetagem, já que muitas são desconhecidas. É necessário organizar essas abreviaturas separando-as por séculos e tornando-as disponíveis. O trabalho de editoração eletrônica do corpus, iniciado no treinamento técnico, terá continuidade, especialmente na parte de inserção dos textos do corpus na internet e submissão desses textos a ferramentas computacionais necessárias ao correto funcionamento do etiquetador. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)