Busca avançada
Ano de início
Entree

O uso de informacoes semanticas do palavras: em busca do aprimoramento da selecao de unidades textuais correferentes na sumarizacao automatica.

Processo: 07/52624-7
Modalidade de apoio:Bolsas no Brasil - Mestrado
Data de Início da vigência: 01 de março de 2008
Data de Término da vigência: 28 de fevereiro de 2010
Área de conhecimento:Linguística, Letras e Artes - Linguística - Linguística Aplicada
Pesquisador responsável:Lucia Helena Machado Rino
Beneficiário:Elen Catia Tomazela
Instituição Sede: Centro de Educação e Ciências Humanas (CECH). Universidade Federal de São Carlos (UFSCAR). São Carlos , SP, Brasil
Assunto(s):Linguística computacional   Sumarização automática
Palavra(s)-Chave do Pesquisador:Cadeias Co-Referencia | Linguistica Computacional | Modelagem De Discurso | Sumarizacao Automatica

Resumo

Com o aumento dos meios de distribuição de informação, torna-se cada vez mais difícil processar o volume de conhecimento disponível. As ferramentas de Sumarização Automática surgem como um bom recurso para otimizar o tempo dos usuários, pois visam a identificar o que é relevante em um texto-fonte e a traçar sua versão reduzida. É possível encontrar sistemas cujo desempenho seja satisfatório quando se trata da fidelidade de conteúdo. Já quando se trata da textualidade, o desempenho deixa a desejar devido à complexidade do processamento automático. Em geral, esse problema leva às dificuldades de compreensão dos sumários. A fim de assegurar sumários automáticos mais inteligíveis, este projeto centra-se na tarefa de analisar os problemas de sumarizadores automáticos de abordagem lingüística e buscar subsídios para torná-los mais robustos visando à coesão dos textos produzidos. Um fenômeno particularmente problemático é a co-referenciação, foco de estudo desta proposta. Para solucioná-lo, buscam-se diversos recursos lingüísticos para enriquecer as estruturas representativas dos textos-fonte, tais como informações morfossintáticas e modelos lingüísticos de estruturação textual e averiguação do encadeamento de suas unidades de informação. A robustez das propostas atuais, no entanto, não é comprovada. Assim, este projeto propõe o aprofundamento das questões lingüísticas, visando contemplar, sobretudo, informações de natureza semântica, ainda não consideradas nas pesquisas atuais. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)