EMU Infraestrutura de Acervos e Coleções: aquisição de infraestrutura computacional para Portal de Acesso a Recursos Linguísticos e de Dados Referentes a Pesquisas em Inteligência Artificial

Processo:	22/11254-2
Modalidade de apoio:	Auxílio à Pesquisa - Programa Infraestrutura - Acervos e Coleções
Data de Início da vigência:	01 de junho de 2023
Data de Término da vigência:	31 de maio de 2026
Área do conhecimento:	Ciências Exatas e da Terra - Ciência da Computação

Pesquisador responsável:	Marcelo Finger
Beneficiário:	Marcelo Finger

Instituição Sede:	Centro de Inovação da USP (INOVA). Universidade de São Paulo (USP). São Paulo , SP, Brasil

Pesquisadores associados:	Fabio Gagliardi Cozman

Assunto(s):	Banco de dados Aprendizagem profunda Inteligência artificial Linguística computacional Linguística de corpus
Palavra(s)-Chave do Pesquisador:	Aprendizado Automático \| Bancos de Dados \| Deep Learning \| Inteligência Artificial \| Linguística Computacional \| Linguística de Corpus \| Inteligência Artificial

Resumo

Esta proposta se insere no âmbito da chamada para Equipamentos Multiusuários para Centros Depositários de Informações, Acervos Documentais e/ou Coleções Historiográficas e Biológicas - 2022, dentro da categoria Apoio à Infraestrutura de Pesquisa de Arquivos e Acervos Documentais. Em particular, a chamada visa obter a infraestrutura para a construção de um portal de disponibilização pública de diversos recursos utilizados e gerados pela pesquisa na área de inteligência artificial produzida pelos projetos associados mencionados acima, bem como por seus parceiros. Em particular, os projetos tem como objetivo a produção de dados linguísticos do português brasileiro em formato digital, compostos tanto por córpus (coleções) de textos puros e anotados com anotações morfossintática, sintática e semântica; e por gravações digitais de áudio de falantes do português brasileiro. Também são gerados nestes projetos bancos de dados sobre áreas de interesse específico, como informações sobre a costa brasileira (Amazônia Azul) e redes de produção de alimentos, assim como diversos programas de computador utilizando técnicas de processamento de Big Data e Deep Learning. Três grandes categorias de dados produzidas pelo centro deverão ser contempladas: Córpus textuais, ou seja, grandes coleções de textos, da ordem de bilhões de palavras, com ou sem anotações morfossintáticas, sintáticas e semânticas. Córpus de áudio, com transcrição de gravações do português brasileiro coletadas nos últimos 50 anos. Bancos de dados estruturados e semiestruturados contendo Big Data a respeito das áreas de estudo do C4AI: bancos de dados georreferenciados e informação oceânica (Amazônia Azul); bancos de dados de redes de produção de alimentos e agricultura; bancos de dados de informações médicas visando o diagnóstico e Recuperação de AVCs; bancos de dados para embasar políticas públicas sobre inteligência artificial e o futuro do trabalho. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:

Mais itens Menos itens

TITULO

Matéria(s) publicada(s) em Outras Mídias ( ):

Mais itens Menos itens

VEICULO: TITULO (DATA)

URL curto

Compartilhe esta página