Busca avançada
Ano de início
Entree

Instanciação e aplicação de uma metodologia para o desenvolvimento de "wordnets terminológicas" em Português do Brasil

Processo: 09/06262-1
Linha de fomento:Auxílio à Pesquisa - Regular
Vigência: 01 de setembro de 2009 - 31 de agosto de 2011
Área do conhecimento:Linguística, Letras e Artes - Linguística - Teoria e Análise Lingüística
Pesquisador responsável:Ariani Di Felippo
Beneficiário:Ariani Di Felippo
Instituição-sede: Centro de Educação e Ciências Humanas (CECH). Universidade Federal de São Carlos (UFSCAR). São Carlos , SP, Brasil
Bolsa(s) vinculada(s):10/00983-6 - Extração (semi)automática de termos e de relações semântico-conceituais para o desenvolvimento de wordnets terminológicas em Português do Brasil, BP.TT
Assunto(s):Terminologia  Redes semânticas 

Resumo

Neste documento, propõe-se uma pesquisa no âmbito do Processamento Automático das Línguas Naturais (PLN), área interdisciplinar que busca desenvolver sistemas computacionais que processam as línguas naturais (p.ex.: sistemas de sumarização, sistemas de tradução, sistemas de correção gramatical, etc.). O desenvolvimento de tais sistemas, quando baseado em conhecimento lingüístico, necessita dos chamados recursos lingüístico-computacionais, que se caracterizam como componentes centrais desses sistemas. Dentre eles, citam-se as "bases de conhecimento lexical (gerais ou terminológicas)", os "corpora", as "gramáticas" e outros. Dadas as aplicações reais para as quais os sistemas de PLN têm sido projetados, bases de conhecimento lexical especializado passaram a ser desenvolvidas para várias línguas. Algumas dessas bases foram desenvolvidas no formato wordnet, reconhecidamente eficaz na representação do conhecimento léxico-conceitual e na aplicação computacional. Para o português do Brasil (PB), em especial, não há bases de conhecimento especializado nesse formato. Embora exista um número razoável de wordnets terminológicas em diversas línguas, observa-se a carência de uma metodologia suficientemente clara que facilite e, sobretudo, estimule a criação de bases terminológicas nesse formato. Assim, propõe-se (i) a instanciação de uma metodologia para o desenvolvimento de wordnets terminológicas, denominadas aqui de terminets, e (ii) a sua aplicação na construção de uma base desse tipo em PB. Tal metodologia, proposta genericamente para a realização de pesquisas no PLN, destaca-se por conciliar a face lingüística e a computacional dessas pesquisas. Com isso, acredita-se que o projeto tem potencial para beneficiar não só o PLN, mas também a Terminologia/ Terminografia em PB, pois o formato wordnet é um modelo elegante e eficaz para a representação de parte do conhecimento léxico-conceitual, fundamental também para o desenvolvimento de produtos terminográficos tradicionais. (AU)