Busca avançada
Ano de início
Entree

Aprimorando os Sistemas de Autenticação Biométrica por Voz: Robustez Mediante Disfonias de Curta Duração

Processo: 22/05186-4
Modalidade de apoio:Bolsas no Brasil - Programa Capacitação - Treinamento Técnico
Data de Início da vigência: 01 de julho de 2022
Data de Término da vigência: 30 de junho de 2023
Área de conhecimento:Engenharias - Engenharia Elétrica
Pesquisador responsável:Rodrigo Capobianco Guido
Beneficiário:Rodrigo Colnago Contreras
Instituição Sede: Instituto de Biociências, Letras e Ciências Exatas (IBILCE). Universidade Estadual Paulista (UNESP). Campus de São José do Rio Preto. São José do Rio Preto , SP, Brasil
Vinculado ao auxílio:21/12407-4 - Aprimorando os sistemas de autenticação biométrica por voz: robustez mediante disfonias de curta duração, AP.R
Palavra(s)-Chave do Pesquisador:disfonias de curta duração | processamento digital de sinais de voz | verificação de locutores | Processamento Digital de Sinais de Voz

Resumo

Mediante qualquer alteração involuntária e acusticamente perceptível na fala, faz-se presente no indivíduo uma disfonia de origem orgânica, funcional ou orgânico-funcional. Em consequência, a sua identificação acústica, não somente pelos seres humanos mas principalmente pelas máquinas, pode ser prejudicada. Desse modo, por ser este um tema ainda pouco explorado, a intenção deste projeto de pesquisa é a de averiguar as implicações das disfonias na autenticação biométrica de locutores (ABLs), criando algoritmos robustos para esta finalidade frente à existência daqueles problemas. Atenção particular será dedicada ao caso dos portadores de anomalias vocálicas temporárias, tais como rouquidões e resfriados, as quais dificultam a fonação e, consequentemente, a análise acústica. Após uma detalhada revisão sistemática envolvendo os conceitos pertinentes, dar-se-á início ao procedimento investigativo. Na etapa de extração de características, a intenção é a de comparar o potencial das estratégias de feature learning baseadas em autoencoders frente à análise provida por abordagens clássicas, tal como a Transformada Wavelet-Packet de Tempo Discreto (DTWPT), à luz da Engenharia Paraconsistente de Características (EPC). Em seguida, objetivando autenticar corretamente os locutores matriculados no sistema experimental que será desenvolvido, a acurácia e o desempenho de estratégias recentes, tais como as Residual Neural Networks (RNNs) e as Deep Spiking Neural Networks (DSNNs), serão avaliados e comparados em duas modalidades: text-dependent e text-independent. Finalmente, pretende-se documentar e publicar os resultados obtidos em renomados veículos literários.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas (4)
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
VIANA, MONIQUE SIMPLICIO; CONTRERAS, RODRIGO COLNAGO; MORANDIN JUNIOR, ORIDES. A New Frequency Analysis Operator for Population Improvement in Genetic Algorithms to Solve the Job Shop Scheduling Problem. SENSORS, v. 22, n. 12, p. 26-pg., . (22/05186-4)
CONTRERAS, RODRIGO COLNAGO; NONATO, LUIS GUSTAVO; BOAVENTURA, MAURILIO; BOAVENTURA, INES APARECIDA GASPAROTTO; DOS SANTOS, FRANCISCO LLEDO; ZANIN, RODRIGO BRUNO; VIANA, MONIQUE SIMPLICIO. A New Multi-Filter Framework for Texture Image Representation Improvement Using Set of Pattern Descriptors to Fingerprint Liveness Detection. IEEE ACCESS, v. 10, p. 26-pg., . (15/14358-0, 22/05186-4, 21/15165-1, 13/07375-0)
CONTRERAS, RODRIGO COLNAGO; VIANA, MONIQUE SIMPLICIO; FONSECA, EVERTHON SILVA; DOS SANTOS, FRANCISCO LLEDO; ZANIN, RODRIGO BRUNO; GUIDO, RODRIGO CAPOBIANCO. An Experimental Analysis on Multicepstral Projection Representation Strategies for Dysphonia Detection. SENSORS, v. 23, n. 11, p. 36-pg., . (21/12407-4, 22/05186-4)
TAMOTO, HUGO; CONTRERAS, RODRIGO COLNAGO; DOS SANTOS, FRANCISO LLEDO; VIANA, MONIQUE SIMPLICIO; GIORIA, RAFAEL DOS SANTOS; CARNEIRO, CLEYTON DE CARVALHO; RUTKOWSKI, L; SCHERER, R; KORYTKOWSKI, M; PEDRYCZ, W; et al. Synthetic Slowness Shear Well-Log Prediction Using Supervised Machine Learning Models. ARTIFICIAL INTELLIGENCE AND SOFT COMPUTING, ICAISC 2022, PT I, v. 13588, p. 16-pg., . (22/05186-4)