Um ambiente para a analise superficial de linguas baseado em automatos finitos

Mario José Cáccamo

Texto completo
Autor(es):	Mario José Cáccamo Número total de Autores: 1
Tipo de documento:	Dissertação de Mestrado
Imprenta:	Campinas, SP.
Instituição:	Universidade Estadual de Campinas (UNICAMP). Instituto de Computação
Data de defesa:	1998-03-30
Membros da banca:	Tomasz Kowaltowski; Maria das Graças Volpe Nunes; Cláudio Leonardo Lucchesi; Jorge Stolfi
Orientador:	Tomasz Kowaltowski
Resumo
A análise sintática é uma componente fundamental da maioria dos sistemas de processamento automático de línguas. Tradicionalmente, esta tarefa foi implementada com técnicas derivadas do formalismo das Gramáticas Livres de Contexto. A demanda por sistemas eficientes motivou a pesquisa em busca de outras alternativas para a análise sintática. Alguns sistemas de processamento de línguas naturais não precisam de uma análise completa da estrutura profunda das sentenças (árvores de derivação), senão apenas dispor das relações superficiais entre às palavras de um texto. O objetivo de um analisador-superficial é determinar quais são as sentenças de uma língua, fornecendo apenas a informação sobre alguma característica em particular, evitando entrar em detalhes correspondentes à estrutura profunda. Este tipo de sistemas é mais eficientes e pode substituir uma análise sintática completa em várias aplicações. Nesta dissertação propõe-se um ambiente para implementar a análise superficial de línguas. A proposta consiste em representar as sentenças de uma língua usando seqüências de marcas chamadas de padrões sintáticos. Cada marca é uma categoria de palavras (adjetivos, substantivos, advérbios, etc). A hipótese é que o núcleo das sentenças usadas nos textos de uma língua pode ser capturado com um número computacionalmente tratável de padrões sintáticos. Estruturas de dados baseadas em autômatos finitos foram utilizadas para representar de forma compacta grandes vocabulários de palavras. Os padrões sintáticos são cadeias de símbolos comparáveis, em certo sentido, às palavras de um vocabulário e autômatos mostraram-se adequadas para armazená-los. Além disso, os autômatos permitem a implementação eficiente do algoritmo de reconhecimento proposto, e outros mais complexos, como o conselheiro gramatical apresentado nesta dissertação. Um dos problemas de muitas das propostas para a análise sintática de línguas é a falta de um método ou fonte de informação para construir um sistema que possa modelar um exemplo real. Como uma alternativa, propõe-se aqui a coleta de padrões sintáticos a partir de corpos de texto marcados. (AU)

Processo FAPESP:	96/09986-9 - Explorando o uso de padrões para a análise de concordância
Beneficiário:	Mario Jose Caccamo
Modalidade de apoio:	Bolsas no Brasil - Mestrado

URL curto