Busca avançada
Ano de início
Entree

Etiquetagem de palavras do português baseada em corpus

Processo: 97/12986-3
Modalidade de apoio:Bolsas no Brasil - Mestrado
Data de Início da vigência: 01 de abril de 1998
Data de Término da vigência: 31 de maio de 1999
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Sistemas de Computação
Pesquisador responsável:Marcelo Finger
Beneficiário:Carlos Daniel Chacur Alves
Instituição Sede: Instituto de Matemática e Estatística (IME). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Assunto(s):Linguística computacional
Palavra(s)-Chave do Pesquisador:Aprendizado De Regras | Etiquetagem Gramatical | Linguistica Computacional

Resumo

O projeto tem como principal objetivo estudar a aplicabilidade do método proposto por Eric Brill para etiquetagem de palavras de textos em português. O método consiste basicamente no aprendizado de regras a partir da analise de textos manualmente anotados. Vamos verificar se o método realmente se aplica ao português e/ou propor modificações e adaptações para melhoria dos resultados. Tais resultados serão utilizados como base para estudos da evolução histórica do português nos séculos XVII, XVIII e XIV. Além disso, Faz parte do projeto a construção do corpus anotado "Tycho Brahe", contendo textos do português europeu dos sécs. XVII, XVIII e XIV. Este projeto consiste na primeira fase necessária para construção de um analisador sintático para o português. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
ALVES, Carlos Daniel Chacur. Etiquetagem do português clássico baseada em Corpus. 1999. Dissertação de Mestrado - Universidade de São Paulo (USP). Instituto de Matemática e Estatística (IME/SBI) São Paulo.