Busca avançada
Ano de início
Entree

Avaliação da inteligibilidade de textos em português: uma aplicação na área de simplificação de textos para o publico infantil

Processo: 08/54282-9
Modalidade de apoio:Bolsas no Brasil - Iniciação Científica
Data de Início da vigência: 01 de setembro de 2008
Data de Término da vigência: 30 de junho de 2010
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Sandra Maria Aluísio
Beneficiário:Carolina Evaristo Scarton
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Linguística de corpus   Linguística computacional   Processamento de linguagem natural   Metodologia e técnicas de computação
Palavra(s)-Chave do Pesquisador:Acessibilidade Digital | Analfabetos Funcionais | Coh-Metrix | Inteligibilidade De Textos | Linguistica Computacional | Linguistica De Corpus

Resumo

Este projeto de Iniciação Científica (IC) se ingere no escopo do projeto PorSimples (Simplificação Textual do Português para Inclusão e Acessibilidade Digital), aprovado no âmbito do Edital Microsoft-Fapesp. Questionamos aqui a utilização de métricas superficiais de avaliação da inteligibilidade de textos, muitas vezes disponíveis em processadores de textos, que se baseiam simplesmente na contagem de características como tamanho das orações de um texto e de suas palavras. Embora estas medidas sejam práticas, elas não conseguem propor melhorias para que um dado texto seja mais inteligível a um ou outro público alvo, desde que a resposta é sempre a mesma: diminua o tamanho das sentenças e das palavras. Para a língua inglesa, um projeto de pesquisa da Universidade de Memphis disponibilizou um conjunto amplo de medidas de inteligibilidade de textos que conseguem avaliar a coesão e coerência dos textos e assim dar um feedback melhor para os problemas encontrados - são mais de 200 medidas disponíveis; muitas delas usam ferramentas e recursos da área de Processamento de Língua Natural (PLN). O objetivo do projeto de IC é adaptar algumas métricas desta ferramenta chamada Coh-Metrix para o português. Essas métricas serão validadas utilizando-se dois córpus de textos adaptados para crianças, escritos por profissionais, comparados com seus correspondentes para adultos. Este projeto é de grande importância para a área de PLN como um todo e para o PorSimples em particular, pois toma possível a avaliação da inteligibilidade de textos em Português utilizando-se métricas robustas e o feedback de problemas, possibilitando a escrita de textos mais adequados a um público alvo. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)