Busca avançada
Ano de início
Entree

Avaliação de qualidade de voz utilizando aprendizado de máquina e considerando redes wireless

Processo: 19/10329-6
Linha de fomento:Bolsas no Brasil - Programa Capacitação - Treinamento Técnico
Vigência (Início): 01 de junho de 2019
Vigência (Término): 31 de agosto de 2019
Área do conhecimento:Engenharias - Engenharia Elétrica - Telecomunicações
Pesquisador responsável:Miguel Arjona Ramírez
Beneficiário:Marielle Jordane da Silva
Instituição-sede: Escola Politécnica (EP). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Vinculado ao auxílio:18/26455-8 - Processamento audiovisual de voz por Aprendizagem de Maquina, AP.R
Assunto(s):Redes neurais (computação)   Processamento de sinais   Aprendizado computacional   Síntese de voz   Qualidade da voz

Resumo

Existem diferentes metodologias para avaliar a qualidade de voz, as quais se podem de forma geral se podem dividir em métodos subjetivos e objetivos. Estes últimos podem ser divididos em métodos baseados no sinal de fala, métodos paramétricos e híbridos, sendo que os métodos que utilizam o sinal de voz se classificam em intrusivos e não-intrusivos. O presente plano de pesquisa focará nos métodos objetivos não-intrusivos e paramétricos. Para os métodos não intrusivos se aplicará técnicas de aprendizado de máquina para analisar o sinal de voz e sus principais características, incluindo informações do espectrograma desse sinal. Deve-se destacar que a atual métrica não intrusiva padronizada (ITU-T Rec. P.563) não tem um bom desempenho. No respeito do método paramétrico, se propõe implementar diferente cenários de redes em simulador, como por exemplo, redes IEEE 802.11ac, LTE, para poder obter arquivos degradados que considerem degradações características dessas redes e com diferentes tipos de degradações no canal de radiofrequência. Assim, será possível relacionar parâmetros de redes wireless com a qualidade de voz, em base por exemplo, a ITU-T Rec. G.107. Destacando-se também que nos cenários de simulações se utilizara codificadores de voz padronizados como o AMR, AMR-WB e EVS.