Busca avançada
Ano de início
Entree


Métodos para análise discursiva automática

Texto completo
Autor(es):
Thiago Alexandre Salgueiro Pardo
Número total de Autores: 1
Tipo de documento: Tese de Doutorado
Imprenta: São Carlos. , ilustrações, tabelas.
Instituição: Universidade de São Paulo (USP). Instituto de Ciências Matemáticas e de Computação (ICMC/SB)
Data de defesa:
Membros da banca:
Maria das Graças Volpe Nunes; Sandra Maria Aluisio; Ariadne Maria Brito Rizzoni Carvalho; Rita Maria da Silva Julia; Celso Antônio Alves Kaestner
Orientador: Maria das Graças Volpe Nunes
Área do conhecimento: Ciências Exatas e da Terra - Ciência da Computação
Indexada em: Banco de Dados Bibliográficos da USP-DEDALUS; Biblioteca Digital de Teses e Dissertações - USP
Localização: Universidade de São Paulo. Instituto de Ciências Matemáticas e de Computação. Biblioteca Prof. Achille Bassi; ICMSC/T; P226ma
Resumo

Pesquisas em Lingüística e Lingüística Computacional têm comprovado há tempos que um texto é mais do que uma simples seqüência de sentenças justapostas. Um texto possui uma estrutura subjacente altamente elaborada que relaciona todo o seu conteúdo, atribuindo-lhe coerência. A essa estrutura dá-se o nome de estrutura discursiva, sendo ela objeto de estudo da área de pesquisa conhecida como Análise de Discurso. Diante da grande utilidade desse conhecimento para diversas aplicações de Processamento de Línguas Naturais, por exemplo, sumarização automática de textos e resolução de anáforas, a análise discursiva automática tem recebido muita atenção. Para o português do Brasil, em particular, há poucos recursos e pesquisas nessa área de pesquisa. Neste cenário, esta tese de doutorado visa a investigar, desenvolver e implementar métodos para análise discursiva automática, adotando como principal teoria discursiva a Rhetorical Structure Theory, uma das teorias mais difundidas atualmente. A partir da anotação retórica e da análise de um corpus de textos científicos da Computação, produziu-se o primeiro analisador retórico automático para a língua portuguesa do Brasil, chamado DiZer (DIscourse analyZER), além de uma grande quantidade de conhecimento discursivo. Apresentam-se modelos estatísticos inéditos para o reconhecimento de relações discursivas baseados em unidades de conteúdo de crescente complexidade, abordando palavras, conceitos e estruturas argumentais. Em relação a este último item, é apresentado um modelo para o aprendizado não supervisionado das estruturas argumentais dos verbos, o qual foi aplicado para os 1.500 verbos mais freqüentes do inglês, resultando em um repositório chamado ArgBank. O DiZer e os modelos propostos são avaliados, produzindo resultados satisfatórios. (AU)

Processo FAPESP: 01/13150-3 - Análise discursivo automático do português do Brasil
Beneficiário:Thiago Alexandre Salgueiro Pardo
Modalidade de apoio: Bolsas no Brasil - Doutorado