Busca avançada
Ano de início
Entree


Analise automatica de sumarios em lingua portuguesa: uma aproximação ao tratamento da estrutura de um texto

Texto completo
Autor(es):
Horacio Saggion
Número total de Autores: 1
Tipo de documento: Dissertação de Mestrado
Imprenta: Campinas, SP.
Instituição: Universidade Estadual de Campinas (UNICAMP). Instituto de Matemática, Estatística e Ciência da Computação
Data de defesa:
Membros da banca:
Ariadne Maria Brito Rizzoni Carvalho; Vera Lúcia Strube de Lima; Jacques Wainer
Orientador: Ariadne Maria Brito Rizzoni Carvalho
Resumo

Lingüística Computacional é a ciência que estuda as teorias que possibilitam a construção de sistemas capazes de entender e gerar linguagem natural. Muitos sistemas de entendimento e, em particular, muitos sistemas de tradução automática concentram seus esforços no tratamento da sentença como unidade lingüística fundamental. Um texto é concebido como uma justaposição de sentenças e, de acordo com essa concepção, a tradução é feita sentença por sentença, muitas vezes desconsiderando fenômenos que caracterizam um texto como tal. Nesta dissertação estamos concentrados na análise de um texto em língua portuguesa via computador, visando o tratamento de fenômenos de interesse para a tradução automática. Devido a complexidade do tratamento de textos irrestritos, decidimos trabalhar com sumários de artigos técnicos pois, embora curtos, são considerados textos e, como tal, apresentam os fenômenos de interesse para o nosso trabalho. A nossa principal preocupação é o entendimento da estrutura de um sumário e o processo de geração dessa estrutura. Acreditamos que a representação da estrutura de um sumário possa auxiliar na produção de uma tradução de alta qualidade. No processamento de um texto e no cálculo de sua estrutura dois estudos devem ser considerados: a coesão e a coerência textual. Esses estudos tentam responder ao problema da conexidade das sentenças na seqüência lingüística. Nesta dissertação abordamos o problema da coesão textual como mecanismo de vinculação de sentenças no texto. O principal fenômeno abordado é a coesão referencial através do estudo e tratamento de anáfora definida. Apresentamos um formalismo para representar um subconjunto de sumários em língua portuguesa e um processo computacional que, a partir da análise do sumário gera a representação proposta nesta dissertação. O formalismo reflete o conteúdo proposicional do sumário e as relações entre proposições. O sistema analisa as sentenças e as vincula na representação proposta. Acreditamos que tanto a representação proposta como os processos de análise textuais possam ser estendidos para outros domínios textuais (AU)

Processo FAPESP: 94/01756-9 - Analise de sumarios visando a geracao de uma representacao semantica a ser utilizada em sistemas de traducao.
Beneficiário:Horacio Saggion
Modalidade de apoio: Bolsas no Brasil - Mestrado