Busca avançada
Ano de início
Entree

Investigação de Métodos Clássicos de Sumarização no Cenário Multidocumento Multilíngue

Processo: 11/07617-8
Modalidade de apoio:Bolsas no Brasil - Iniciação Científica
Data de Início da vigência: 01 de outubro de 2011
Data de Término da vigência: 29 de fevereiro de 2012
Área de conhecimento:Linguística, Letras e Artes - Linguística - Teoria e Análise Lingüística
Pesquisador responsável:Ariani Di Felippo
Beneficiário:Fabricio Elder da Silva Tosta
Instituição Sede: Centro de Educação e Ciências Humanas (CECH). Universidade Federal de São Carlos (UFSCAR). São Carlos , SP, Brasil
Assunto(s):Tradução automática   Sumarização automática   Linguística textual
Palavra(s)-Chave do Pesquisador:Linguística Textual | seleção de conteúdo | sumário multidocumento | sumário multilíngue | Sumarização Automática | Tradução automática | Processamento Automático de Línguas Naturais

Resumo

Dada a grande quantidade de informação disponível em várias línguas, sobretudo na web, pesquisas que visam à automatização da tarefa de sumarização multidocumento multilíngue (SAMM) fazem-se relevantes na medida em que podem facilitar e agilizar o acesso a informação. Tais pesquisas são realizadas na subárea do Processamento Automático das Línguas Naturais denominada Sumarização Automática (SA). Na tarefa de SAMM, em especial, processam-se coleções de textos-fonte que versam sobre um mesmo assunto em duas ou mais línguas e, a partir deles, produzem-se sumários em uma das línguas dos textos-fonte. Não se tem conhecimento sobre pesquisas em sumarização multidocumento multilíngue que envolvem o português do Brasil. Diante desse cenário, investigar-se-ão métodos clássicos de SA, propostos segundo a abordagem superficial, no cenário da SAMM. Tais métodos caracterizam-se pela modelagem e tratamento mais simples dos fenômenos linguísticos e pelo baixo custo na produção dos sumários.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)