Busca avançada
Ano de início
Entree

EMU Infraestrutura de Acervos e Coleções: aquisição de infraestrutura computacional para Portal de Acesso a Recursos Linguísticos e de Dados Referentes a Pesquisas em Inteligência Artificial

Processo: 22/11254-2
Modalidade de apoio:Auxílio à Pesquisa - Programa Infraestrutura - Acervos e Coleções
Data de Início da vigência: 01 de junho de 2023
Data de Término da vigência: 31 de maio de 2026
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Marcelo Finger
Beneficiário:Marcelo Finger
Instituição Sede: Centro de Inovação da USP (INOVA). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Pesquisadores associados:Fabio Gagliardi Cozman
Assunto(s):Banco de dados  Aprendizagem profunda  Inteligência artificial  Linguística computacional  Linguística de corpus 
Palavra(s)-Chave do Pesquisador:Aprendizado Automático | Bancos de Dados | Deep Learning | Inteligência Artificial | Linguística Computacional | Linguística de Corpus | Inteligência Artificial

Resumo

Esta proposta se insere no âmbito da chamada para Equipamentos Multiusuários para Centros Depositários de Informações, Acervos Documentais e/ou Coleções Historiográficas e Biológicas - 2022, dentro da categoria Apoio à Infraestrutura de Pesquisa de Arquivos e Acervos Documentais. Em particular, a chamada visa obter a infraestrutura para a construção de um portal de disponibilização pública de diversos recursos utilizados e gerados pela pesquisa na área de inteligência artificial produzida pelos projetos associados mencionados acima, bem como por seus parceiros. Em particular, os projetos tem como objetivo a produção de dados linguísticos do português brasileiro em formato digital, compostos tanto por córpus (coleções) de textos puros e anotados com anotações morfossintática, sintática e semântica; e por gravações digitais de áudio de falantes do português brasileiro. Também são gerados nestes projetos bancos de dados sobre áreas de interesse específico, como informações sobre a costa brasileira (Amazônia Azul) e redes de produção de alimentos, assim como diversos programas de computador utilizando técnicas de processamento de Big Data e Deep Learning. Três grandes categorias de dados produzidas pelo centro deverão ser contempladas: Córpus textuais, ou seja, grandes coleções de textos, da ordem de bilhões de palavras, com ou sem anotações morfossintáticas, sintáticas e semânticas. Córpus de áudio, com transcrição de gravações do português brasileiro coletadas nos últimos 50 anos. Bancos de dados estruturados e semiestruturados contendo Big Data a respeito das áreas de estudo do C4AI: bancos de dados georreferenciados e informação oceânica (Amazônia Azul); bancos de dados de redes de produção de alimentos e agricultura; bancos de dados de informações médicas visando o diagnóstico e Recuperação de AVCs; bancos de dados para embasar políticas públicas sobre inteligência artificial e o futuro do trabalho. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)