Busca avançada
Ano de início
Entree

O papel da aprendizagem transituacional e o da informação distribucional na aquisição da linguagem

Processo: 18/18655-7
Linha de fomento:Auxílio à Pesquisa - Regular
Vigência: 01 de agosto de 2019 - 31 de julho de 2021
Área do conhecimento:Interdisciplinar
Pesquisador responsável:Pablo Picasso Feliciano de Faria
Beneficiário:Pablo Picasso Feliciano de Faria
Instituição-sede: Instituto de Estudos da Linguagem (IEL). Universidade Estadual de Campinas (UNICAMP). Campinas , SP, Brasil
Bolsa(s) vinculada(s):20/00401-9 - Compilação de um corpus anotado de aquisição do português brasileiro, BP.TT
Assunto(s):Modelagem computacional  Aquisição da linguagem  Linguística computacional 

Resumo

Duas tarefas essenciais à aquisição lexical são objeto desta proposta de pesquisa: mapear palavras a sentidos e categorizar as palavras. Quanto à primeira, um dos principais obstáculos (para a criança) é o "problema gavagai" que diz respeito à indeterminação referencial dos enunciados, isto é, à dificuldade de vinculá-los a sentidos de modo consistente. Entre outras estratégias, a aprendizagem trans-situacional parece ter aí um papel importante. Ademais, é preciso aprender as categorias das palavras, pois sabe-se através de pesquisa experimental que as categorias sintáticas emergem e tem papel na aquisição da linguagem, inclusive para alavancar a aquisição de palavras, o que torna importante compreender como este conhecimento se estabelece na criança. A presente proposta de pesquisa tem assim, como objetivo geral, investigar teórica e computacionalmente estas duas tarefas envolvidas na aquisição lexical do português brasileiro. Complementar aos métodos mais tradicionais (estudos de corpora e experimentais), a abordagem computacional almeja produzir modelos que incorporem o que já se sabe sobre a aquisição, sobre a linguagem e sobre a cognição humana, se configurando assim como simulações psicologicamente plausíveis que podem iluminar aspectos de difícil observação empírica em estágios muito precoces da criança. Além de reproduzir estudos proeminentes encontrados na literatura, esta pesquisa tem como um dos objetivos específicos compilar (a partir de corpora já existentes) e disponibilizar uma grande base de dados de aquisição do português brasileiro, com algo entre um milhão e 2,5 milhões de palavras, e anotá-la com informações de lematização e categorias morfossintáticas. Tal base de dados ainda não existe e abriria muitas oportunidades de investigação futura. Para isso, a pesquisa prevê um grande esforço formador, especialmente na graduação, através da participação de bolsistas técnicos e de iniciação científica, além dos estudantes de pós-graduação. Em função dos temas de investigação, esta pesquisa visa ainda estabelecer relações inter-institucionais nacionais e internacionais e contribuir para a internacionalização da instituição. (AU)