Busca avançada
Ano de início
Entree

Informatividade e topicalidade na sumarização multidocumento: novos desafios e métodos

Processo: 12/03071-3
Modalidade de apoio:Auxílio à Pesquisa - Regular
Data de Início da vigência: 01 de maio de 2012
Data de Término da vigência: 30 de abril de 2014
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Thiago Alexandre Salgueiro Pardo
Beneficiário:Thiago Alexandre Salgueiro Pardo
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Inteligência artificial  Linguística computacional 
Palavra(s)-Chave do Pesquisador:Inteligência Artificial | Linguística Computacional | Modelos discursivos | Segmentação e detecção topical | Sumarização multidocumento | Processamento de Linguagem Natural

Resumo

Diante da grande e crescente quantidade de informação disponível, principalmente on-line, e da escassez de tempo e das dificuldades para se lidar com todo esse conteúdo, aplicações de processamento textual têm se tornado cada vez mais relevantes. De origem relativamente recente (meados da década de 90), a sumarização automática multidocumento é uma destas aplicações. Seu objetivo é produzir automaticamente um único sumário (ou resumo, como mais comumente chamado) a partir de um grupo de textos sobre um mesmo tópico. No Brasil e para a língua portuguesa, somente nos últimos anos é que pesquisas nessa área começaram. A partir da criação de recursos e ferramental inéditos e do desenvolvimento de métodos e sistemas simples e ingênuos a abordagens mais sofisticadas, produziram-se resultados do estado da arte e, em alguns casos, melhores do que os obtidos em pesquisas internacionais e para outras línguas. Nesta proposta de pesquisa, com base na pesquisa recente na área, objetiva-se dar um passo além e investigar 3 principais questões correlacionadas que podem avançar o estado da arte, a saber: (i) como tratar conjunta e adequadamente a topicalidade nos textos e a informatividade dos sumários, (ii) como modelar e qual o impacto da combinação de métodos superficiais/estatísticos e profundos/linguísticos para a produção de sumários mais informativos e representativos da distribuição topical nos textos, e (iii) quais são as características do processo humano de sumarização que podem ser sistematizadas e formalizadas para que subsidiem as questões anteriores. Enquanto as duas primeiras questões lidam com a produção de sumários melhores, a última pode subsidiar novos métodos e dar direcionamentos diferentes para abordagens atuais. Acredita-se que, além da formação de recursos humanos e da criação de uma massa crítica de pesquisadores na área, tão pequena no Brasil, esse projeto tem potencial de trazer contribuições significativas para a área como um todo pela proposta de metodologias inovadoras. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)