Auxílio à pesquisa 21/12407-4 - Redes neurais (computação), Redes neurais residuais - BV FAPESP
Busca avançada
Ano de início
Entree

Aprimorando os sistemas de autenticação biométrica por voz: robustez mediante disfonias de curta duração

Processo: 21/12407-4
Modalidade de apoio:Auxílio à Pesquisa - Regular
Data de Início da vigência: 01 de março de 2022
Data de Término da vigência: 29 de fevereiro de 2024
Área do conhecimento:Engenharias - Engenharia Elétrica
Pesquisador responsável:Rodrigo Capobianco Guido
Beneficiário:Rodrigo Capobianco Guido
Instituição Sede: Instituto de Biociências, Letras e Ciências Exatas (IBILCE). Universidade Estadual Paulista (UNESP). Campus de São José do Rio Preto. São José do Rio Preto , SP, Brasil
Pesquisadores associados:Fernando Fernandes Paiva ; Ivan Nunes da Silva
Bolsa(s) vinculada(s):22/05186-4 - Aprimorando os Sistemas de Autenticação Biométrica por Voz: Robustez Mediante Disfonias de Curta Duração, BP.TT
Assunto(s):Redes neurais (computação)  Redes neurais residuais  Redes neurais pulsantes  Aprendizagem profunda  Processamento digital de sinais  Processamento digital de voz  Identificação biométrica  Reconhecimento de voz  Disfonia 
Palavra(s)-Chave do Pesquisador:disfonias de curta duração | processamento digital de sinais de voz | verificação de locutores | Processamento de Sinais

Resumo

Mediante qualquer alteração involuntária e acusticamente perceptível na fala, faz-se presente no indivíduo uma disfonia de origem orgânica, funcional ou orgânico-funcional. Em consequência, a sua identificação acústica, não somente pelos seres humanos, mas principalmente pelas máquinas, pode ser prejudicada. Desse modo, por ser este um tema ainda pouco explorado, a intenção deste projeto de pesquisa é a de averiguar as implicações das disfonias na autenticação biométrica de locutores (ABLs), criando algoritmos robustos para esta finalidade frente à existência daqueles problemas. Atenção particular será dedicada ao caso dos portadores de anomalias vocálicas temporárias, tais como rouquidões e resfriados, as quais dificultam a fonação e, consequentemente, a análise acústica. Após uma detalhada revisão sistemática envolvendo os conceitos pertinentes, dar-se-á início ao procedimento investigativo. Na etapa de extração de características, a intenção é a de comparar o potencial das estratégias de feature learning baseadas em autoencoders frente à análise provida por abordagens clássicas, tal como a Transformada Wavelet-Packet de Tempo Discreto (DTWPT), à luz da Engenharia Paraconsistente de Características (EPC). Em seguida, objetivando autenticar corretamente os locutores matriculados no sistema experimental que será desenvolvido, a acurácia e o desempenho de estratégias recentes, tais como as Residual Neural Networks (RNNs) e as Deep Spiking Neural Networks (DSNNs), serão avaliados e comparados em duas modalidades: text-dependent e text-independent. Finalmente, pretende-se documentar e publicar os resultados obtidos em renomados veículos literários. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas (4)
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
HO, TIN KAM; LUO, YEN-FU; GUIDO, RODRIGO CAPOBIANCO. Explainability of Methods for Critical Information Extraction From Clinical Documents A survey of representative works. IEEE SIGNAL PROCESSING MAGAZINE, v. 39, n. 4, p. 11-pg., . (21/12407-4)
CONTRERAS, RODRIGO COLNAGO; VIANA, MONIQUE SIMPLICIO; FONSECA, EVERTHON SILVA; DOS SANTOS, FRANCISCO LLEDO; ZANIN, RODRIGO BRUNO; GUIDO, RODRIGO CAPOBIANCO. An Experimental Analysis on Multicepstral Projection Representation Strategies for Dysphonia Detection. SENSORS, v. 23, n. 11, p. 36-pg., . (21/12407-4, 22/05186-4)
GUIDO, RODRIGO CAPOBIANCO. Wavelets behind the scenes: Practical aspects, insights, and perspectives. PHYSICS REPORTS-REVIEW SECTION OF PHYSICS LETTERS, v. 985, p. 23-pg., . (21/12407-4)
BARBON JUNIOR, SYLVIO; GUIDO, RODRIGO CAPOBIANCO; AGUIAR, GABRIEL JONAS; SANTANA, EVERTON JOSE; PROENCA JUNIOR, MARIO LEMES; PATIL, HEMANT A.. Multiple voice disorders in the same individual: Investigating handcrafted features, multi-label classification algorithms, and base-learners. SPEECH COMMUNICATION, v. 152, p. 14-pg., . (21/12407-4)

Por favor, reporte erros na lista de publicações científicas utilizando este formulário.
X

Reporte um problema na página


Detalhes do problema: