Busca avançada
Ano de início
Entree
(Referência obtida automaticamente do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores.)

RECONHECIMENTO DO VOCABULÁRIO DE JORNAIS POPULARES BRASILEIROS POR UM DICIONÁRIO COMPUTACIONAL DE ACESSO LIVRE

Texto completo
Autor(es):
Maria José Bocorny FINATTO [1] ; Oto Araújo VALE [2] ; Éric LAPORTE [3]
Número total de Autores: 3
Afiliação do(s) autor(es):
[1] Universidade Federal do Rio Grande do Sul. Programa de Pós-Graduação em Letras - Brasil
[2] Universidade Federal de São Carlos. Centro de Educação e Ciências Humanas - Brasil
[3] Université Paris-Est. Institut d’électronique et d’informatique Gaspard-Monge - França
Número total de Afiliações: 3
Tipo de documento: Artigo Científico
Fonte: Alfa, rev. linguíst. (São José Rio Preto); v. 63, n. 1, p. 63-80, 2019-05-30.
Resumo

RESUMO Relata-se um experimento de verificação da identificação de um universo de palavras do português popular escrito por duas versões de um dicionário computacional do português brasileiro (PB), DELAF PB 2004 e DELAF PB 2015. Esse dicionário computacional é gratuitamente acessível para ser utilizado em análises linguísticas do Português do Brasil e em outras pesquisas, o que justifica um estudo crítico. O universo vocabular provém do corpus PorPopular, composto por jornais populares, o Diário Gaúcho (DG) e o jornal baiano Massa ! (MA). Do DG, partiu-se de um conjunto de textos com 984.465 palavras ( tokens) , publicados em 2008, com ortografia desatualizada frente ao Acordo Ortográfico da Língua Portuguesa adotado em 2009. Do MA, examinou-se um universo com 215.776 palavras ( tokens) , em publicações de 2012, 2014 e 2015, com todo o material na nova ortografia. A verificação envolveu: a) gerar listas de palavras diferentes empregadas em DG e MA; b) comparar essas listas com as listas de entradas das duas versões do DELAF PB; c) avaliar a cobertura desse vocabulário; d) propor modos de inclusão de itens não cobertos. Os resultados do trabalho mostraram, no DG, uma média de 19% de palavras diferentes ( types) desconhecidas pelos DELAF PB 2004 e 2015. No MA, essa média ficou em 13%. A versão do dicionário repercutiu ligeiramente sobre o desempenho do reconhecimento de itens. (AU)

Processo FAPESP: 16/24670-3 - Um ou dois retratos da predicação no português
Beneficiário:Oto Araújo Vale
Modalidade de apoio: Auxílio à Pesquisa - Regular