Busca avançada
Ano de início
Entree

Aprimorando os sistemas de autenticação biométrica por voz: robustez mediante disfonias de curta duração

Processo:21/12407-4
Modalidade de apoio:Auxílio à Pesquisa - Regular
Data de Início da vigência: 01 de março de 2022
Data de Término da vigência: 29 de fevereiro de 2024
Área do conhecimento:Engenharias - Engenharia Elétrica
Pesquisador responsável:Rodrigo Capobianco Guido
Beneficiário:Rodrigo Capobianco Guido
Instituição Sede: Instituto de Biociências, Letras e Ciências Exatas (IBILCE). Universidade Estadual Paulista (UNESP). Campus de São José do Rio Preto. São José do Rio Preto , SP, Brasil
Município da Instituição Sede:São José do Rio Preto
Pesquisadores associados:Fernando Fernandes Paiva ; Ivan Nunes da Silva
Bolsa(s) vinculada(s):22/05186-4 - Aprimorando os Sistemas de Autenticação Biométrica por Voz: Robustez Mediante Disfonias de Curta Duração, BP.TT
Assunto(s):Redes neurais (computação)  Redes neurais residuais  Redes neurais pulsantes  Aprendizagem profunda  Processamento digital de sinais  Processamento digital de voz  Identificação biométrica  Reconhecimento de voz  Disfonia 
Palavra(s)-Chave do Pesquisador:disfonias de curta duração | processamento digital de sinais de voz | verificação de locutores | Processamento de Sinais

Resumo

Mediante qualquer alteração involuntária e acusticamente perceptível na fala, faz-se presente no indivíduo uma disfonia de origem orgânica, funcional ou orgânico-funcional. Em consequência, a sua identificação acústica, não somente pelos seres humanos, mas principalmente pelas máquinas, pode ser prejudicada. Desse modo, por ser este um tema ainda pouco explorado, a intenção deste projeto de pesquisa é a de averiguar as implicações das disfonias na autenticação biométrica de locutores (ABLs), criando algoritmos robustos para esta finalidade frente à existência daqueles problemas. Atenção particular será dedicada ao caso dos portadores de anomalias vocálicas temporárias, tais como rouquidões e resfriados, as quais dificultam a fonação e, consequentemente, a análise acústica. Após uma detalhada revisão sistemática envolvendo os conceitos pertinentes, dar-se-á início ao procedimento investigativo. Na etapa de extração de características, a intenção é a de comparar o potencial das estratégias de feature learning baseadas em autoencoders frente à análise provida por abordagens clássicas, tal como a Transformada Wavelet-Packet de Tempo Discreto (DTWPT), à luz da Engenharia Paraconsistente de Características (EPC). Em seguida, objetivando autenticar corretamente os locutores matriculados no sistema experimental que será desenvolvido, a acurácia e o desempenho de estratégias recentes, tais como as Residual Neural Networks (RNNs) e as Deep Spiking Neural Networks (DSNNs), serão avaliados e comparados em duas modalidades: text-dependent e text-independent. Finalmente, pretende-se documentar e publicar os resultados obtidos em renomados veículos literários. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas (13)
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
HO, TIN KAM; LUO, YEN-FU; GUIDO, RODRIGO CAPOBIANCO. Explainability of Methods for Critical Information Extraction From Clinical Documents A survey of representative works. IEEE SIGNAL PROCESSING MAGAZINE, v. 39, n. 4, p. 11-pg., . (21/12407-4)
CONTRERAS, RODRIGO COLNAGO; VIANA, MONIQUE SIMPLICIO; FONSECA, EVERTHON SILVA; DOS SANTOS, FRANCISCO LLEDO; ZANIN, RODRIGO BRUNO; GUIDO, RODRIGO CAPOBIANCO. An Experimental Analysis on Multicepstral Projection Representation Strategies for Dysphonia Detection. SENSORS, v. 23, n. 11, p. 36-pg., . (21/12407-4, 22/05186-4)
GUIDO, RODRIGO CAPOBIANCO. Wavelets behind the scenes: Practical aspects, insights, and perspectives. PHYSICS REPORTS-REVIEW SECTION OF PHYSICS LETTERS, v. 985, p. 23-pg., . (21/12407-4)
CONTRERAS, RODRIGO COLNAGO; DA SILVA, VITOR TREVELIN XAVIER; DA SILVA, IGOR TREVELIN XAVIER; VIANA, MONIQUE SIMPLICIO; DOS SANTOS, FRANCISCO LLEDO; ZANIN, RODRIGO BRUNO; MARTINS, ERICO FERNANDES OLIVEIRA; GUIDO, RODRIGO CAPOBIANCO. Genetic Algorithm for Feature Selection Applied to Financial Time Series Monotonicity Prediction: Experimental Cases in Cryptocurrencies and Brazilian Assets. Entropy, v. 26, n. 3, p. 22-pg., . (19/21464-1, 21/12407-4, 22/05186-4, 13/07375-0, 23/06611-3)
VIANA, MONIQUE SIMPLICIO; CONTRERAS, RODRIGO COLNAGO; PESSOA, PAULO CAVALCANTI; DOS SANTOS BONGARTI, MARCELO ADRIANO; ZAMANI, HODA; GUIDO, RODRIGO CAPOBIANCO; MORANDIN JUNIOR, ORIDES. Massive Conscious Neighborhood-Based Crow Search Algorithm for the Pseudo-Coloring Problem. ADVANCES IN SWARM INTELLIGENCE, PT I, ICSI 2024, v. 14788, p. 15-pg., . (22/05186-4, 19/21464-1, 21/12407-4, 23/06611-3)
SUDA NETO, JOGI; ARDILA, LLUIS QUILES; NOGUEIRA, THIAGO NASCIMENTO; ALBUQUERQUE, FELIPE; PAPA, JOAO PAULO; GUIDO, RODRIGO CAPOBIANCO; FANCHINI, FELIPE FERNANDES. Quantum neural networks successfully calibrate language models. QUANTUM MACHINE INTELLIGENCE, v. 6, n. 1, p. 9-pg., . (21/12407-4, 19/18287-0, 14/12236-1, 21/04655-8, 19/07665-4, 23/04987-6, 13/07375-0)
CONTRERAS, RODRIGO COLNAGO; VIANA, MONIQUE SIMPLICIO; BERNARDINO, VICTOR JOSE SOUZA; DOS SANTOS, FRANCISCO LLEDO; TOYGAR, ONSEN; GUIDO, RODRIGO CAPOBIANCO. A multi-filter deep transfer learning framework for image-based autism spectrum disorder detection. SCIENTIFIC REPORTS, v. 15, n. 1, p. 31-pg., . (19/21464-1, 21/12407-4, 23/06611-3, 22/05186-4)
CONTRERAS, RODRIGO COLNAGO; CAMPANHARO, AMANDA FONSECA; VIANA, MONIQUE SIMPLICIO; DOS SANTOS BONGARTI, MARCELO ADRIANO; GUIDO, RODRIGO CAPOBIANCO. Dimensionality Reduction in Multicepstral Features for Voice Spoofing Detection: Case Studies with Singular Value Decomposition, Genetic Algorithm, and Auto-Encoder. ARTIFICIAL INTELLIGENCE AND SOFT COMPUTING, ICAISC 2024, PT II, v. 15165, p. 18-pg., . (23/06611-3, 13/07375-0, 19/21464-1, 21/12407-4, 22/05186-4)
CONTRERAS, RODRIGO COLNAGO; HECK, GUSTAVO LUIZ; VIANA, MONIQUE SIMPLICIO; DOS SANTOS BONGARTI, MARCELO ADRIANO; ZAMANI, HODA; GUIDO, RODRIGO CAPOBIANCO. Metaheuristic Algorithms for Enhancing Multicepstral Representation in Voice Spoofing Detection: An Experimental Approach. ADVANCES IN SWARM INTELLIGENCE, PT I, ICSI 2024, v. 14788, p. 16-pg., . (22/05186-4, 19/21464-1, 21/12407-4, 23/06611-3)
BARBON JUNIOR, SYLVIO; GUIDO, RODRIGO CAPOBIANCO; AGUIAR, GABRIEL JONAS; SANTANA, EVERTON JOSE; PROENCA JUNIOR, MARIO LEMES; PATIL, HEMANT A.. Multiple voice disorders in the same individual: Investigating handcrafted features, multi-label classification algorithms, and base-learners. SPEECH COMMUNICATION, v. 152, p. 14-pg., . (21/12407-4)
CONTRERAS, RODRIGO COLNAGO; SILVA CARMASSI, CAIO ULISSES; VIANA, MONIQUE SIMPLICIO; TOYGAR, ONSEN; GUIDO, RODRIGO CAPOBIANCO. A New Image Enhancement-Based Framework for Spoofing Detection in Ear-Based Biometric Authentication Systems. ARTIFICIAL INTELLIGENCE AND SOFT COMPUTING, ICAISC 2024, PT III, v. 15166, p. 17-pg., . (23/06611-3, 19/21464-1, 13/07375-0, 21/12407-4, 22/05186-4)
DE SOUZA, LEONARDO MENDES; GUIDO, RODRIGO CAPOBIANCO; CONTRERAS, RODRIGO COLNAGO; VIANA, MONIQUE SIMPLICIO; BONGARTI, MARCELO ADRIANO DOS SANTOS. Improving Voice Spoofing Detection Through Extensive Analysis of Multicepstral Feature Reduction. SENSORS, v. 25, n. 15, p. 26-pg., . (19/21464-1, 21/12407-4, 22/05186-4, 23/06611-3)
CONTRERAS, RODRIGO COLNAGO; VIANA, MONIQUE SIMPLICIO; GUIDO, RODRIGO CAPOBIANCO. An Experimental Analysis on Mapping Strategies for Cepstral Coefficients Multi-projection in Voice Spoofing Detection Problem. ARTIFICIAL INTELLIGENCE AND SOFT COMPUTING, ICAISC 2023, PT II, v. 14126, p. 16-pg., . (21/12407-4, 22/05186-4)