Busca avançada
Ano de início
Entree

Pós-processamento de Sumários Multidocumento: Ordenação de Sentenças com base na CST (Cross-document Structure Theory)

Processo: 10/11190-7
Modalidade de apoio:Bolsas no Brasil - Iniciação Científica
Data de Início da vigência: 01 de setembro de 2010
Data de Término da vigência: 31 de agosto de 2011
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Thiago Alexandre Salgueiro Pardo
Beneficiário:Jader Bruno Pereira Lima
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Inteligência artificial   Processamento de linguagem natural   Linguística computacional
Palavra(s)-Chave do Pesquisador:Inteligência Artificial | Linguística Computacional | Processamento de Línguas Naturais | Sumarização multidocumento | Processamento de Línguas Naturais

Resumo

Aplicações computacionais capazes de tratar adequadamente a incrível quantidade de informação disponível atualmente, principalmente na web, têm se tornado cada vez mais necessárias. A sumarização automática multidocumento é uma destas aplicações, na qual, a partir de um conjunto de documentos que versam sobre um mesmo assunto, produz-se um único sumário, ou resumo, como mais comumente conhecido. Tendo como propósito a coesão e a coerência do sumário produzido, são diversos os desafios deste tipo de aplicação, pois há que se lidar com questões como o nível de informatividade do sumário, o tratamento de informações redundantes, complementares e contraditórias provenientes de diferentes fontes, o reconhecimento e a adequação de expressões co-referenciais e a ordenação das sentenças no sumário. Neste plano de pesquisa, propõe-se a investigação de métodos automáticos para a ordenação de sentenças em sumários, como uma etapa de pós-processamento à sumarização automática multidocumento, visando à melhoria dos sumários em termos de coesão e coerência. Particularmente, serão explorados métodos já tradicionais da literatura e métodos que se baseiem na teoria discursiva multidocumento CST (Cross-document Structure Theory), que é um modelo lingüístico-computacional de representação do relacionamento multidocumento e que subjaz os trabalhos em sumarização automática multidocumento sendo desenvolvidos atualmente no Brasil.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)