| Grant number: | 11/07637-9 |
| Support Opportunities: | Scholarships in Brazil - Scientific Initiation |
| Start date: | August 01, 2011 |
| End date: | July 31, 2012 |
| Field of knowledge: | Linguistics, Literature and Arts - Linguistics - Linguistic Theory and Analysis |
| Principal Investigator: | Ariani Di Felippo |
| Grantee: | Jackson Wilke da Cruz Souza |
| Host Institution: | Centro de Educação e Ciências Humanas (CECH). Universidade Federal de São Carlos (UFSCAR). São Carlos , SP, Brazil |
Abstract Dada a grande quantidade de informação disponível em várias línguas, sobretudo na web, pesquisas que visam à automatização da tarefa de sumarização multidocumento (SAM) fazem-se relevantes na medida em que podem facilitar e agilizar o acesso a informação. Tais pesquisas são realizadas na subárea do Processamento Automático das Línguas Naturais denominada Sumarização Automática. Na tarefa de SAM, o tratamento da redundância é um dos principais tópicos de pesquisa, pois um sumário multidocumento deve conter o conjunto de sentenças que melhor representa o tópico ou assunto da coleção sem que haja informação repetida entre elas. Tendo em vista a escassez de trabalhos sobre SAM que envolvem o português do Brasil (PB), o objetivo deste trabalho é investigar algumas medidas/formas de se calcular a redundância entre sentenças de textos jornalísticos em PB. Além disso, pretende-se considerar a correspondência dessas medias/formas com as relações semânticas de redundância do modelo CST (do inglês, Cross-document Structure Theory) (RADEV, 2000). | |
| News published in Agência FAPESP Newsletter about the scholarship: | |
| More itemsLess items | |
| TITULO | |
| Articles published in other media outlets ( ): | |
| More itemsLess items | |
| VEICULO: TITULO (DATA) | |
| VEICULO: TITULO (DATA) | |