Busca avançada
Ano de início
Entree

Descrição linguística da complementaridade para a Sumarização Automática Multidocumento

Processo: 13/21135-1
Modalidade de apoio:Bolsas no Brasil - Mestrado
Data de Início da vigência: 01 de março de 2014
Data de Término da vigência: 28 de fevereiro de 2015
Área de conhecimento:Linguística, Letras e Artes - Linguística - Teoria e Análise Lingüística
Pesquisador responsável:Ariani Di Felippo
Beneficiário:Jackson Wilke da Cruz Souza
Instituição Sede: Centro de Educação e Ciências Humanas (CECH). Universidade Federal de São Carlos (UFSCAR). São Carlos , SP, Brasil
Assunto(s):Linguística textual   Sumarização automática   Complementaridade
Palavra(s)-Chave do Pesquisador:complementaridade | fenômeno linguístico multidocumento | Linguística Textual | seleção de conteúdo | sumário multidocumento | Sumarização Automática | Processamento Automático de Língua Natural

Resumo

O desenvolvimento de aplicações computacionais capazes de tratar a incrível quantidade de informação disponível, principalmente on-line, tem sido foco de inúmeras pesquisas. Sendo relativamente recente (com origem em meados de 1990), a Sumarização Automática Multidocumento (SAM) é uma dessas aplicações. Nela, busca-se gerar automaticamente um único sumário coerente e coeso a partir de uma coleção de textos que tratam de um mesmo assunto. Para tanto, a SAM precisa selecionar a informação mais importante da coleção para compor o sumário que pode ser genérica ou focada no interesse do usuário. A seleção da informação principal requer a identificação da redundância, complementaridade e contradição entre os textos-fonte. Tendo em vista a complementaridade ainda não foi sistematicamente estudada, objetiva-se caracterizar esse fenômeno com base em descrição de corpus e identificar métodos que possam subsidiar a detecção automática da complementaridade em métodos de SAM de textos jornalísticos em português.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)