Busca avançada
Ano de início
Entree

Aplicando Grafos e CST (Cross-document Structure Theory) na Sumarização Automática Multidocumento

Processo: 10/11299-9
Modalidade de apoio:Bolsas no Brasil - Iniciação Científica
Data de Início da vigência: 01 de setembro de 2010
Data de Término da vigência: 31 de agosto de 2011
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Thiago Alexandre Salgueiro Pardo
Beneficiário:Rafael Ribaldo
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Inteligência artificial   Processamento de linguagem natural   Grafos   Linguística computacional
Palavra(s)-Chave do Pesquisador:Cross-document Structure Theory | grafos | Inteligência Artificial | Linguística Computacional | Processamento de Línguas Naturais | Sumarização multidocumento | Processamento de Línguas Naturais

Resumo

A tarefa de sumarização automática multidocumento consiste em produzir automaticamente um único sumário (ou resumo, como é mais comumente conhecido) a partir de um grupo de textos sobre um mesmo assunto. Diante da incrível quantidade de informação disponível atualmente, principalmente on-line, tal tarefa é de grande importância. Há tradicionalmente duas abordagens para o problema, uma dita superficial (pois faz pouco uso de conhecimento lingüístico, utilizando critérios empíricos e distribucionais dos textos para selecionar o conteúdo para o sumário) e uma dita profunda (que, por sua vez, faz uso intensivo de conhecimento lingüístico e de mundo). Nessa proposta de pesquisa de iniciação científica, propõe-se explorar a tarefa de forma híbrida, utilizando, da abordagem superficial, grafos e suas medidas muito bem estudadas da literatura e amplamente aplicadas no contexto de sumarização, e, pela abordagem profunda, o modelo de relacionamento multidocumento CST (Cross-document Structure Theory), que permite especificar como as partes dos textos sendo processados se relacionam.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)