Bolsa 10/11190-7 - Inteligência artificial, Processamento de linguagem natural

Processo:	10/11190-7
Modalidade de apoio:	Bolsas no Brasil - Iniciação Científica
Data de Início da vigência:	01 de setembro de 2010
Data de Término da vigência:	31 de agosto de 2011
Área de conhecimento:	Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação

Pesquisador responsável:	Thiago Alexandre Salgueiro Pardo
Beneficiário:	Jader Bruno Pereira Lima

Instituição Sede:	Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil

Assunto(s):	Inteligência artificial Processamento de linguagem natural Linguística computacional
Palavra(s)-Chave do Pesquisador:	Inteligência Artificial \| Linguística Computacional \| Processamento de Línguas Naturais \| Sumarização multidocumento \| Processamento de Línguas Naturais
Resumo Aplicações computacionais capazes de tratar adequadamente a incrível quantidade de informação disponível atualmente, principalmente na web, têm se tornado cada vez mais necessárias. A sumarização automática multidocumento é uma destas aplicações, na qual, a partir de um conjunto de documentos que versam sobre um mesmo assunto, produz-se um único sumário, ou resumo, como mais comumente conhecido. Tendo como propósito a coesão e a coerência do sumário produzido, são diversos os desafios deste tipo de aplicação, pois há que se lidar com questões como o nível de informatividade do sumário, o tratamento de informações redundantes, complementares e contraditórias provenientes de diferentes fontes, o reconhecimento e a adequação de expressões co-referenciais e a ordenação das sentenças no sumário. Neste plano de pesquisa, propõe-se a investigação de métodos automáticos para a ordenação de sentenças em sumários, como uma etapa de pós-processamento à sumarização automática multidocumento, visando à melhoria dos sumários em termos de coesão e coerência. Particularmente, serão explorados métodos já tradicionais da literatura e métodos que se baseiem na teoria discursiva multidocumento CST (Cross-document Structure Theory), que é um modelo lingüístico-computacional de representação do relacionamento multidocumento e que subjaz os trabalhos em sumarização automática multidocumento sendo desenvolvidos atualmente no Brasil.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itens Menos itens
TITULO

Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itens Menos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

URL curto