Advanced search
Start date
Betweenand

Segmentation and alignment of datasets for natural language processing

Grant number: 20/16661-0
Support Opportunities:Scholarships in Brazil - Technical Training Program - Technical Training
Start date: March 01, 2021
End date: January 31, 2022
Field of knowledge:Physical Sciences and Mathematics - Computer Science
Agreement: IBM Brasil
Principal Investigator:Marcelo Finger
Grantee:Vinícius Gonçalves dos Santos
Host Institution: Instituto de Matemática e Estatística (IME). Universidade de São Paulo (USP). São Paulo , SP, Brazil
Company:Universidade de São Paulo (USP). Centro de Inovação da USP (INOVA)
Associated research grant:19/07665-4 - Center for Artificial Intelligence, AP.eScience.CPE

Abstract

Entre os Grandes Desafios em torno dos quais as pesquisas do Centro de Inteligência Artificial (C4AI - http://c4ai.inova.usp.br) se organizam, propõe-se a produção de recursos para levar o Processamento de Linguagem Natural do português ao estado da arte. Quanto à modalidade falada da língua, pretende-se construir datasets multitarefa para reconhecimento de fala, síntese multilocutor, identificação de locutor, clonagem de voz e classificação de fala como biomarcador, produzindo uma base de português brasileiro falado gravado e transcrito. No escopo dessas tarefas, este Plano de Atividades visa a disponibilizar datasets de fala natural, compostos de arquivos de áudio segmentados em unidades entoacionais e alinhados ao texto correspondente, a partir da aplicação do protocolo NURC Digital, para serem utilizados em treinamentos de modelos de reconhecimento de fala. (AU)

News published in Agência FAPESP Newsletter about the scholarship:
More itemsLess items
Articles published in other media outlets ( ):
More itemsLess items
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)