Busca avançada
Ano de início
Entree

PropBank.Br: regras sintático-semânticas para mapeamento de perguntas-respostas de verbos do português e anotação de papéis semânticos em um corpus do português do Brasil

Processo: 09/07394-9
Modalidade de apoio:Bolsas no Brasil - Pós-Doutorado
Vigência (Início): 01 de agosto de 2009
Vigência (Término): 31 de julho de 2011
Área do conhecimento:Linguística, Letras e Artes - Linguística - Teoria e Análise Lingüística
Pesquisador responsável:Sandra Maria Aluísio
Beneficiário:Magali Sanches Duran
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Palavra(s)-Chave do Pesquisador:Anotação de Papéis Semânticos | Linguística de Corpus | Processamento de Línguas Naturais | Sistemas de Pergunta-e-Resposta | Léxico

Resumo

O projeto PorSimples (Simplificação Textual do Português para Inclusão e Acessibilidade Digital) tem por objetivo facilitar o acesso à informação disponível em português na Web, quer apoiando a produção de textos mais simples, quer transformando textos complexos em textos mais simples. O projeto é financiado pela Microsoft Research-Fapesp (processo: 2007/54565-8) e tem como principal público-alvo os analfabetos funcionais. Um de seus módulos possui três formas de explicitar as relações entre trechos do texto, para auxiliar o usuário a interpretar o texto. Uma das formas de explicitação é a inserção de perguntas que liguem logicamente o verbo a seus argumentos, ou seja, perguntas para as quais os argumentos constituam respostas. Constatou-se, em uma pré-análise do problema, que a escolha da pergunta adequada sofre restrições tanto por parte do verbo quanto por parte do argumento. Descrever esse comportamento e subsidiar a automatização da atribuição de perguntas aos verbos é o objetivo deste projeto. O problema insere-se no contexto de mapeamento pergunta-resposta, um tipo de aplicação de Processamento de Língua Natural utilizado em sistemas que interagem com seres humanos, ou perguntando ou respondendo questões. As regras para o mapeamento utilizarão etiquetas do Parser Palavras (Bick, 2000) e do módulo de reconhecimento de entidades mencionadas (REM) do próprio Palavras, recursos que já se tem à disposição no Núcleo Interinstitucional de Linguística Computacional (NILC) do ICMC-USP, um laboratório da USP de São Carlos que sediará esta pesquisa de pós-doutoramento. Além dessas etiquetas, a tarefa requer também algumas etiquetas típicas da anotação de papéis semânticos. Como ainda não há um anotador de papéis semânticos disponível para o português, decidiu-se suprir essa lacuna com a aplicação da metodologia de criação de frames files utilizada pelo projeto Propbank, desenvolvido na University of Pennsylvania, para estruturar um repositório de verbos com os conjuntos de papéis semânticos de cada sentido dos verbos, suas possíveis realizações sintáticas e mapeamento para perguntas. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)