Busca avançada
Ano de início
Entree

Curadoria, manutenção e aquisição de dados, e gerenciamento de banco de dados de línguas indígenas no Brasil

Processo: 24/09131-5
Modalidade de apoio:Bolsas no Brasil - Programa Capacitação - Treinamento Técnico
Data de Início da vigência: 01 de agosto de 2024
Data de Término da vigência: 31 de julho de 2025
Área de conhecimento:Interdisciplinar
Acordo de Cooperação: IBM Brasil
Pesquisador responsável:Claudio Santos Pinhanez
Beneficiário:João Paulo Fernandes Bento da Silva
Instituição Sede: Centro de Inovação da USP (INOVA). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Empresa:Universidade de São Paulo (USP). Centro de Inovação da USP (INOVA)
Vinculado ao auxílio:19/07665-4 - Centro de Inteligência Artificial, AP.eScience.CPE
Assunto(s):Inteligência artificial   Línguas indígenas
Palavra(s)-Chave do Pesquisador:Inteligência Artificial | Línguas indígenas | Inteligência Artificial e Línguas Indígenas

Resumo

Esse trabalho está vinculado ao projeto de Inteligência Artificial e Línguas Indígenas desenvolvido no Centro de Inteligência Artificial USP/FAPESP/IBM. O bolsista executará a curadoria e o gerenciamento do banco de dados de línguas indígenas do projeto, bem como a aquisição de novos dados do mesmo. A atividade consiste na especificação dos dados de línguas indígenas do projeto, bem como a aquisição de novos dados do mesmo. A atividade consiste na especificação dos dados do mesmo. A atividade consiste na especificação dos dados por vários olhares teóricos dentro da linguística, tais como a morfologia dos dados, a fonologia, da ortografia das línguas, e catalogação por variedades linguísticas dentro das línguas do projeto. As línguas trabalhadas pelo projeto são Nheengatú, e os Guarani Nhandeva, mas há ainda um repositório da língua Guarani Mbyá resultante de colaborações prévias neste projeto que não deve ser descartado, mas sim melhor detalhado em suas especificidades. Além destes elementos, também estão previstas estratégias de construção de interfaces utilizando SQL para criação de tabelas de amostragem e interfaces com a máquina, para melhor averiguação de resultados e simplificação de consultas. Estas tabelas de amostragem relacionariam diretamente dois elementos linguísticos distintos do banco de dados, tais como fonologia e ortografia, ou ortografia e variedade, afim de facilitar a consulta dos dados a serem disponibilizados pela máquina. Estes dois elementos, a manutenção do banco de dados e a criação de uma interface reguladora, são os próximos passos para o desenvolvimento do projeto de Processamento Computacional de Linguagens Indígenas Brasileiras em desenvolvimento no C4AI, Centro de Inteligência Artificial da Universidade de São Paulo

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)