Resumo
Mediante qualquer alteração involuntária e acusticamente perceptível na fala, faz-se presente no indivíduo uma disfonia de origem orgânica, funcional ou orgânico-funcional. Em consequência, a sua identificação acústica, não somente pelos seres humanos, mas principalmente pelas máquinas, pode ser prejudicada. Desse modo, por ser este um tema ainda pouco explorado, a intenção deste projeto de pesquisa é a de averiguar as implicações das disfonias na autenticação biométrica de locutores (ABLs), criando algoritmos robustos para esta finalidade frente à existência daqueles problemas. Atenção particular será dedicada ao caso dos portadores de anomalias vocálicas temporárias, tais como rouquidões e resfriados, as quais dificultam a fonação e, consequentemente, a análise acústica. Após uma detalhada revisão sistemática envolvendo os conceitos pertinentes, dar-se-á início ao procedimento investigativo. Na etapa de extração de características, a intenção é a de comparar o potencial das estratégias de feature learning baseadas em autoencoders frente à análise provida por abordagens clássicas, tal como a Transformada Wavelet-Packet de Tempo Discreto (DTWPT), à luz da Engenharia Paraconsistente de Características (EPC). Em seguida, objetivando autenticar corretamente os locutores matriculados no sistema experimental que será desenvolvido, a acurácia e o desempenho de estratégias recentes, tais como as Residual Neural Networks (RNNs) e as Deep Spiking Neural Networks (DSNNs), serão avaliados e comparados em duas modalidades: text-dependent e text-independent. Finalmente, pretende-se documentar e publicar os resultados obtidos em renomados veículos literários. (AU)
| Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio: |
| Mais itensMenos itens |
| TITULO |
| Matéria(s) publicada(s) em Outras Mídias ( ): |
| Mais itensMenos itens |
| VEICULO: TITULO (DATA) |
| VEICULO: TITULO (DATA) |