Busca avançada
Ano de início
Entree

Segmentação e alinhamento de datasets para o processamento de linguagem natural

Processo: 20/16661-0
Modalidade de apoio:Bolsas no Brasil - Programa Capacitação - Treinamento Técnico
Data de Início da vigência: 01 de março de 2021
Data de Término da vigência: 31 de janeiro de 2022
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Acordo de Cooperação: IBM Brasil
Pesquisador responsável:Marcelo Finger
Beneficiário:Vinícius Gonçalves dos Santos
Instituição Sede: Instituto de Matemática e Estatística (IME). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Empresa:Universidade de São Paulo (USP). Centro de Inovação da USP (INOVA)
Vinculado ao auxílio:19/07665-4 - Centro de Inteligência Artificial, AP.eScience.CPE
Assunto(s):Inteligência artificial   Linguística computacional   Processamento de linguagem natural   Reconhecimento da fala   Estado da arte
Palavra(s)-Chave do Pesquisador:Inteligência Artificial | Linguística Computacional | Processamento de Linguagem Natural | Inteligência Artificial

Resumo

Entre os Grandes Desafios em torno dos quais as pesquisas do Centro de Inteligência Artificial (C4AI - http://c4ai.inova.usp.br) se organizam, propõe-se a produção de recursos para levar o Processamento de Linguagem Natural do português ao estado da arte. Quanto à modalidade falada da língua, pretende-se construir datasets multitarefa para reconhecimento de fala, síntese multilocutor, identificação de locutor, clonagem de voz e classificação de fala como biomarcador, produzindo uma base de português brasileiro falado gravado e transcrito. No escopo dessas tarefas, este Plano de Atividades visa a disponibilizar datasets de fala natural, compostos de arquivos de áudio segmentados em unidades entoacionais e alinhados ao texto correspondente, a partir da aplicação do protocolo NURC Digital, para serem utilizados em treinamentos de modelos de reconhecimento de fala. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)