Busca avançada
Ano de início
Entree

Visualização e exploração de sumários multidocumento

Processo: 11/23200-0
Linha de fomento:Bolsas no Brasil - Iniciação Científica
Vigência (Início): 01 de março de 2012
Vigência (Término): 31 de dezembro de 2013
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Thiago Alexandre Salgueiro Pardo
Beneficiário:Jader Bruno Pereira Lima
Instituição-sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Bolsa(s) vinculada(s):12/16220-7 - Visualização e exploração de sumários multidocumento, BE.EP.IC
Assunto(s):Processamento de linguagem natural   Inteligência artificial   Linguística computacional

Resumo

Aplicações computacionais capazes de tratar adequadamente a incrível quantidade de informação disponível atualmente, principalmente na web, têm se tornado cada vez mais necessárias. A sumarização automática multidocumento é uma destas aplicações, na qual, a partir de um conjunto de documentos que versam sobre um mesmo assunto, produz-se um único sumário, ou resumo, como mais comumente conhecido. Há vários desafios para a construção de um sistema computacional deste tipo, como o tratamento adequado de informações redundantes, complementares e contraditórias, a uniformização de estilos de escrita e de expressões referenciais, a ordenação de eventos/fatos no tempo e a manutenção de focos e perspectivas diferentes sobre um mesmo evento/fato, além da própria preservação da coerência e da coesão do sumário produzido. Tão importante quanto o processo de produção de um sumário é a forma de exposição deste resultado e as possibilidades de se explorá-lo disponíveis para o usuário de um sistema de sumarização multidocumento. Normalmente, um usuário que tem em mãos um sumário produzido automaticamente a partir de uma grande quantidade de textos (por exemplo, provenientes de resultados de busca em um buscador como o Google ou em um buscador especializado em notícias como o Google Notícias) deseja ser capaz de visualizar adequadamente este sumário e explorar funcionalidades tanto simples quanto avançadas, como alternar visualmente entre o sumário e os textos de origem correspondentes a uma determinada porção textual do sumário delimitada pelo usuário, procurar nos textos por informações complementares a alguma informação presente no sumário, comprimir ainda mais ou expandir a quantidade de informação do sumário de acordo com o tempo disponível e o interesse do usuário no tópico abordado, filtrar o conteúdo do sumário em função de alguma palavra-chave ou termo de interesse, colorir e comentar determinadas passagens do sumário, traduzir automaticamente o sumário para uma outra língua de interesse, e disponibilizar um link a outros usuários para acesso a esse sumário produzido, dentre várias outras. Neste plano de pesquisa, propõe-se a investigação de algumas destas funcionalidades e, com base nisso, a proposta de uma interface visual de interação com o usuário, seu desenvolvimento e avaliação. Tal proposta dá continuidade às pesquisas em andamento e já realizadas na área de sumarização multidocumento, enriquecendo o produto destas pesquisas e, ao mesmo tempo, solidificando no aluno o método de pesquisa científica.