Análise de sistemas de reconhecimento de voz contínua para multi-locutores
Análise de sinais de áudio e voz para reconstrução e reconhecimento
Processo: | 02/05206-1 |
Modalidade de apoio: | Bolsas no Brasil - Mestrado |
Data de Início da vigência: | 01 de setembro de 2002 |
Data de Término da vigência: | 31 de agosto de 2004 |
Área de conhecimento: | Engenharias - Engenharia Elétrica - Telecomunicações |
Pesquisador responsável: | Fábio Violaro |
Beneficiário: | Lívio Carvalho Sousa |
Instituição Sede: | Faculdade de Engenharia Elétrica e de Computação (FEEC). Universidade Estadual de Campinas (UNICAMP). Campinas , SP, Brasil |
Assunto(s): | Reconhecimento da fala |
Palavra(s)-Chave do Pesquisador: | Adaptacao De Locutor | Modelos Ocultos De Markov |
Resumo O projeto se concentra em sistemas de reconhecimento de fala contínua, com independência de locutor, empregando modelos ocultos de Markov (HMM). A tarefa específica da pesquisa focará o problema de adaptação de um novo locutor ao sistema de modo a diminuir a taxa de erros de reconhecimento. Os métodos tradicionais de adaptação exigem que o novo usuário do sistema leia um texto relativamente extenso. O sistema alinha os parâmetros da locução de entrada com o modelo HMM da mesma (formado pela concatenação dos modelos das unidades fonéticas correspondentes) e, a partir dos parâmetros específicos do novo locutor, altera as médias e variâncias das gaussianas multidimensionais empregadas para modelar as densidades de emissão de parâmetros dos HMMs em cada estado. Este procedimento é bastante demorado, impedindo que a adaptação seja feita em tempo real. Em função disto uma série de novas técnicas "(eigenvoices) vem sendo propostas recentemente para viabilizar a adaptação de locutor com um mínimo de material de fala, permitindo que a mesma se processe quase que em tempo real. O objetivo do trabalho consiste em desenvolver uma capacitação e domínio da tecnologia na área e complementar uma outra pesquisa correlata já concluída no LPDF (Lab. de Processamento Digital de Fala) que tratava da normalização de locutor como meio de obter uma redução da taxa de erros de reconhecimento. (AU) | |
Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa: | |
Mais itensMenos itens | |
TITULO | |
Matéria(s) publicada(s) em Outras Mídias ( ): | |
Mais itensMenos itens | |
VEICULO: TITULO (DATA) | |
VEICULO: TITULO (DATA) | |