Busca avançada
Ano de início
Entree

Compilação de um corpus anotado de aquisição do português brasileiro

Processo: 20/00401-9
Linha de fomento:Bolsas no Brasil - Programa Capacitação - Treinamento Técnico
Vigência (Início): 01 de fevereiro de 2020
Vigência (Término): 31 de janeiro de 2021
Área do conhecimento:Linguística, Letras e Artes - Linguística
Pesquisador responsável:Pablo Picasso Feliciano de Faria
Beneficiário:Rayssa Honczaryk Cesarini
Instituição-sede: Instituto de Estudos da Linguagem (IEL). Universidade Estadual de Campinas (UNICAMP). Campinas , SP, Brasil
Vinculado ao auxílio:18/18655-7 - O papel da aprendizagem transituacional e o da informação distribucional na aquisição da linguagem, AP.R
Assunto(s):Aquisição da linguagem   Linguística de corpus   Linguística computacional

Resumo

A proposta à qual este pedido se vincula tem como um dos objetivos especificos "Compilar uma base de dados do PB extensionalmente equivalente à de Redington et al. (1998), com tres niveis de informação: a forma ortografica normalizada, o lema e a categoria morfossintatica". Alem disso, preve que essa base de dados construida sirva ainda para modelar mais adequadamente o corpus artificial (usado no estudo de aprendizagem transsituacional), quanto à distribuição dos enunciados por tamanho, quantidade de palavras lexicais e funcionais, etc. Assim, e nosso objetivo que, ao final, tenhamos todo o conjunto de dados consistente e em um formato digital que permita sua continua revisao e expansão das informações anotadas.