Busca avançada
Ano de início
Entree

Elaboração Textual via Definição de Entidades Mencionadas e de Perguntas Relacionadas aos Verbos em Textos Simplificados do Português

Processo: 08/08020-2
Modalidade de apoio:Bolsas no Brasil - Mestrado
Data de Início da vigência: 01 de março de 2009
Data de Término da vigência: 28 de fevereiro de 2011
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Sandra Maria Aluísio
Beneficiário:Marcelo Adriano Amancio
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Semântica   Linguística computacional   Retórica
Palavra(s)-Chave do Pesquisador:Entidades Nomeadas | Estrutura Argumental de Verbos | Estrutura Esquemática | Mencionadas | Retórica | semântica | Lingüística Computacional

Resumo

Este projeto se insere no escopo do projeto PorSimples (Simplificação Textual do Português para Inclusão e Acessibilidade Digital), aprovado no âmbito do Edital Microsoft-Fapesp (proc. nro. 2007/54565-8). O objetivo deste projeto de mestrado é o estudo de algumas características lingüísticas que podem ser automaticamente processadas para aumentar a inteligibilidade de textos do português. A inteligibilidade está relacionada ao uso de palavras freqüentes (mais comuns) e estruturas sintáticas menos complexas para facilitar a compreensão de um texto por um leitor comum. Atualmente, há uma preocupação com a avaliação da macroestrutura do texto além da microestrutura, em que outros fatores são visto como facilitadores da compreensão, por exemplo, a organização do texto, a coesão, a coerência, e o conceito do texto sensível ao leitor. As três formas a serem estudadas neste mestrado para avaliar a contribuição destas no aumento da inteligibilidade de textos em Português são citadas abaixo. A primeira é a explicitação das relações retóricas de um texto (por exemplo, as relações de contraste, adição de idéias, causa-efeito, exemplificação, reformulações). Para tanto, pretende-se utilizar a Análise Discursiva Automática (ADA), pois esta análise explicita partes dos textos como as orações e suas relações e pode ajudar as pessoas a entenderem relações e toda a gama variada de marcadores do discurso que são usados para explicitá-las. Além de explicitar as relações retóricas, este projeto de pesquisa pretende também explicitar as ações e as entidades mencionadas em um texto em Português. A identificação das ações corresponde à identificação de verbos nos textos e também qual a sua função no contexto e a identificação e explicitação de entidades mencionadas corresponde à identificação de substantivos próprios, com a indicação de sua classe, por exemplo, pessoa, organização, lugar, etc., além de pesos, medidas e quantidades no texto. A avaliação da contribuição dessas três formas para o aumento da inteligibilidade dos textos será feita com usuários reais na leitura de textos da Web, por exemplo, uma notícia de jornal. Entre os selecionados estão crianças e adultos em fase de alfabetização, que foram os escolhidos como usuários reais para a validação dos sistemas a serem criados no projeto maior, o PorSimples.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
AMANCIO, Marcelo Adriano. Elaboração textual via definição de entidades mencionadas e de perguntas relacionadas aos verbos em textos simplificados do português. 2011. Dissertação de Mestrado - Universidade de São Paulo (USP). Instituto de Ciências Matemáticas e de Computação (ICMC/SB) São Carlos.