Busca avançada
Ano de início
Entree

Implementação de interface para um etiquetador morfo-sintatico do português baseado em aprendizado computacional

Processo: 00/02143-3
Linha de fomento:Bolsas no Brasil - Iniciação Científica
Vigência (Início): 01 de maio de 2000
Vigência (Término): 30 de abril de 2001
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Sistemas de Computação
Pesquisador responsável:Marcelo Finger
Beneficiário:Fernando Correa Lima
Instituição-sede: Instituto de Matemática e Estatística (IME). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Assunto(s):Aprendizado computacional   Linguística computacional

Resumo

Como parte do projeto temático Fapesp 98/3382-0 (Padrões Rítmicos, Fixação de Parâmetros e Mudança da Língua) foi desenvolvido um etiquetador morfo-sintático do português por aprendizado automático (tese de mestrado de Carlos Daniel Chacur Alves, bolsa Fapesp 97/12986-3). Tal etiquetador associa uma classe gramatical a cada palavra de um texto dentro do contexto em que está ocorre. Esta associação é feita "treinando-se" o etiquetador com dados de um corpus existente (Corpus Tycho Brahe). O número de parâmetros a ser fornecido, tanto no treinamento quanto na aplicação do etiquetador, é consideravelmente alto. O objetivo deste projeto é desenvolver uma interface pública (que possa ser usada tanto no computador quanto na internet) para o etiquetador. São duas as metas desta interface: 1) Permitir o facilmente retreinamento do etiquetador com novos dados e a sua aplicação a diversos textos. 2) Permitir que textos sejam etiquetados diretamente via internet, colocando os nossos resultados de pesquisa à disposição da comunidade. Tencionamos desenvolver esta interface na linguagem Java, a qual permite facilmente tanto o uso local, como via uma applet pela internet. (AU)