Busca avançada
Ano de início
Entree

Sumarização Automática Multidocumento para o Português: Novas Fronteiras

Processo: 15/17841-3
Modalidade de apoio:Auxílio à Pesquisa - Regular
Data de Início da vigência: 01 de novembro de 2015
Data de Término da vigência: 31 de outubro de 2017
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Thiago Alexandre Salgueiro Pardo
Beneficiário:Thiago Alexandre Salgueiro Pardo
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Processamento de linguagem natural  Análise de sentimentos  Sumarização automática 
Palavra(s)-Chave do Pesquisador:Análise de Sentimentos | Mineração de Opiniões | Sumarização Automática | Processamento de Linguagem Natural

Resumo

A Sumarização Automática Multidocumento (SAM) visa à criação de um único sumário (ou resumo, como mais comumente chamado) a partir de um conjunto de textos-fonte sobre um mesmo assunto. Com a enorme quantidade de informação disponível atualmente, principalmente on-line, a utilidade desse tipo de recurso é evidente. A SAM começou a ser investigada em meados dos anos 90 para a língua inglesa, e somente mais recentemente, a partir de meados da década passada, ela passou a ser alvo de investigações sistemáticas para a língua portuguesa. Com isso, atualmente há para o português corpora de referência para a SAM, ferramentas básicas de processamento e análise textual, e métodos de sumarização do estado da arte, que resultaram em recursos, ferramentas e aplicações amplamente disponíveis para a comunidade de pesquisa. Nesta proposta, objetiva-se dar continuidade a essa linha de pesquisa. Por um lado, visa-se dar continuidade ao desenvolvimento e aprimoramento de recursos linguístico-computacionais e ferramentas de análise textual, que são essenciais para o avanço na área de SAM; por outro, visa-se investigar as novas fronteiras da sumarização, já investigadas para outras línguas e ainda inéditas para o português, em particular, a sumarização de atualização e de opiniões. Na sumarização de atualização, busca-se criar sumários que narrem somente as informações desconhecidas/novas para o leitor, levando-se em conta, portanto, o conhecimento prévio deste; na sumarização de opinião, busca-se sintetizar diversos textos opinativos sobre determinados objetos, como produtos eletrônicos, de forma a apoiar possíveis decisões e avaliações de usuários. Se, na primeira frente, a sumarização de atualização consiste em um desafio metodológico que dá continuidade ao que se tem feito na SAM para o português, na outra frente, tem-se em vista tanto a pesquisa como a aplicação para o usuário final. Acredita-se que, além da formação de recursos humanos e da criação de uma massa crítica de pesquisadores na área, tão pequena no Brasil, esse projeto tem potencial de trazer contribuições significativas para a área como um todo pela proposta de metodologias inovadoras. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
NOBREGA, FERNANDO A. A.; JORGE, ALIPIO M.; BRAZDIL, PAVEL; PARDO, THIAGO A. S.; QUARESMA, P; VIEIRA, R; ALUISIO, S; MONIZ, H; BATISTA, F; GONCALVES, T. Sentence Compression for Portuguese. COMPUTATIONAL PROCESSING OF THE PORTUGUESE LANGUAGE, PROPOR 2020, v. 12037, p. 11-pg., . (15/17841-3)