Advanced search
Start date
Betweenand

Methods for Redundancy Detection in Multidocument Summarization

Grant number: 11/07637-9
Support Opportunities:Scholarships in Brazil - Scientific Initiation
Start date: August 01, 2011
End date: July 31, 2012
Field of knowledge:Linguistics, Literature and Arts - Linguistics - Linguistic Theory and Analysis
Principal Investigator:Ariani Di Felippo
Grantee:Jackson Wilke da Cruz Souza
Host Institution: Centro de Educação e Ciências Humanas (CECH). Universidade Federal de São Carlos (UFSCAR). São Carlos , SP, Brazil

Abstract

Dada a grande quantidade de informação disponível em várias línguas, sobretudo na web, pesquisas que visam à automatização da tarefa de sumarização multidocumento (SAM) fazem-se relevantes na medida em que podem facilitar e agilizar o acesso a informação. Tais pesquisas são realizadas na subárea do Processamento Automático das Línguas Naturais denominada Sumarização Automática. Na tarefa de SAM, o tratamento da redundância é um dos principais tópicos de pesquisa, pois um sumário multidocumento deve conter o conjunto de sentenças que melhor representa o tópico ou assunto da coleção sem que haja informação repetida entre elas. Tendo em vista a escassez de trabalhos sobre SAM que envolvem o português do Brasil (PB), o objetivo deste trabalho é investigar algumas medidas/formas de se calcular a redundância entre sentenças de textos jornalísticos em PB. Além disso, pretende-se considerar a correspondência dessas medias/formas com as relações semânticas de redundância do modelo CST (do inglês, Cross-document Structure Theory) (RADEV, 2000).

News published in Agência FAPESP Newsletter about the scholarship:
More itemsLess items
Articles published in other media outlets ( ):
More itemsLess items
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)