Busca avançada
Ano de início
Entree

Aprimoramento de modelos de reconhecimento automático de fala em relação ao reconhecimento de nomes próprios por meio da criação via síntese de fala de um dataset de entidades nomeadas

Processo: 25/06244-6
Modalidade de apoio:Bolsas no Brasil - Iniciação Científica
Data de Início da vigência: 01 de agosto de 2025
Data de Término da vigência: 31 de julho de 2026
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Sandra Maria Aluísio
Beneficiário:Rodrigo de Freitas Lima
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Empresa:Universidade de São Paulo (USP). Centro de Inovação da USP (INOVA)
Vinculado ao auxílio:19/07665-4 - Centro de Inteligência Artificial, AP.eScience.CPE
Assunto(s):Aprendizado computacional   Inteligência artificial   Processamento de linguagem natural   Reconhecimento automático de fala   Síntese de voz
Palavra(s)-Chave do Pesquisador:Aprendizado de Máquina | Inteligência Artificial | Processamento de Linguagem Natural | Reconhecimento Automático de Fala | Reconhecimento de Entidades Nomeadas | síntese de voz | Processamento de Linguagem Natural

Resumo

Nos últimos anos, a abordagem de redes neurais profundas se consagrou como a melhor forma de implementar um programa de reconhecimento automático de fala, e todos os modelos de ponta utilizam essa estratégia. Entretanto, aplicações construídas a partir de redes neurais artificiais (RNA) apresentam dificuldade no reconhecimento de entidades nomeadas, com o problema se agravando em linguagens menos representadas, como o português brasileiro. O presente projeto de iniciação científica tem como objetivo aprimorar o reconhecimento de nomes próprios pelos sistemas de reconhecimento automático de fala em português brasileiro. Para tal, propõe-se a utilização de aplicações de síntese de fala para gerar automaticamente datasets de áudio que têm como conteúdo entidades nomeadas, assim aumentando a quantidade de dados desse tipo disponíveis para o treinamento de modelos de transcrição automática, a fim de familiarizar a rede neural a nomes próprios.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)