Busca avançada
Ano de início
Entree

Avaliação de qualidade de voz utilizando aprendizado de máquina e considerando redes wireless

Processo: 20/13459-5
Modalidade de apoio:Bolsas no Brasil - Programa Capacitação - Treinamento Técnico
Data de Início da vigência: 01 de novembro de 2020
Data de Término da vigência: 30 de setembro de 2022
Área de conhecimento:Engenharias - Engenharia Elétrica - Telecomunicações
Pesquisador responsável:Miguel Arjona Ramírez
Beneficiário:Douglas Henrique Silva
Instituição Sede: Escola Politécnica (EP). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Vinculado ao auxílio:18/26455-8 - Processamento Audiovisual de Voz por Aprendizagem de Máquina, AP.R
Assunto(s):Aprendizado computacional   Processamento de sinais   Processamento de voz   Síntese de voz   Reconhecimento de voz   Wireless
Palavra(s)-Chave do Pesquisador:Aprendizagem de Maquina | Medidas de qualidade de voz | Processamento audiovisual de voz | Realce e reconhecimento de voz | Redes neurais | síntese de voz | Processamento de sinais

Resumo

Existem diferentes metodologias para avaliar a qualidade de voz, as quais se podem de forma geral se podem dividir em métodos subjetivos e objetivos. Estes últimos podem ser divididos em métodos baseados no sinal de fala, métodos paramétricos e híbridos, sendo que os métodos que utilizam o sinal de voz se classificam em intrusivos e não-intrusivos. O presente plano de pesquisa focará nos métodos objetivos não-intrusivos e paramétricos. Para os métodos não intrusivos se aplicará técnicas de aprendizado de máquina para analisar o sinal de voz e suas principais características, incluindo informações do espectrograma desse sinal. Deve-se destacar que a atual métrica não intrusiva padronizada (ITU-T Rec. P.563) não tem um bom desempenho. No respeito do método paramétrico, se propõe implementar diferente cenários de redes em simulador, como por exemplo, redes IEEE 802.11ac, LTE, para poder obter arquivos degradados que considerem degradações características dessas redes e com diferentes tipos de degradações no canal de radiofrequência. Assim, será possível relacionar parâmetros de redes wireless com a qualidade de voz, em base por exemplo, a ITU-T Rec. G.107. Destacando-se também que nos cenários de simulações se utilizará de codificadores de voz padronizados como o AMR, AMR-WB e EVS.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)