Bolsa 97/12986-3 - Linguística computacional

Processo:	97/12986-3
Modalidade de apoio:	Bolsas no Brasil - Mestrado
Data de Início da vigência:	01 de abril de 1998
Data de Término da vigência:	31 de maio de 1999
Área de conhecimento:	Ciências Exatas e da Terra - Ciência da Computação - Sistemas de Computação

Pesquisador responsável:	Marcelo Finger
Beneficiário:	Carlos Daniel Chacur Alves

Instituição Sede:	Instituto de Matemática e Estatística (IME). Universidade de São Paulo (USP). São Paulo , SP, Brasil

Assunto(s):	Linguística computacional
Palavra(s)-Chave do Pesquisador:	Aprendizado De Regras \| Etiquetagem Gramatical \| Linguistica Computacional
Resumo O projeto tem como principal objetivo estudar a aplicabilidade do método proposto por Eric Brill para etiquetagem de palavras de textos em português. O método consiste basicamente no aprendizado de regras a partir da analise de textos manualmente anotados. Vamos verificar se o método realmente se aplica ao português e/ou propor modificações e adaptações para melhoria dos resultados. Tais resultados serão utilizados como base para estudos da evolução histórica do português nos séculos XVII, XVIII e XIV. Além disso, Faz parte do projeto a construção do corpus anotado "Tycho Brahe", contendo textos do português europeu dos sécs. XVII, XVIII e XIV. Este projeto consiste na primeira fase necessária para construção de um analisador sintático para o português. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itens Menos itens
TITULO

Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itens Menos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações acadêmicas

(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)

ALVES, Carlos Daniel Chacur. Etiquetagem do português clássico baseada em Corpus. 1999. Dissertação de Mestrado - Universidade de São Paulo (USP). Instituto de Matemática e Estatística (IME/SBI) São Paulo.