Busca avançada
Ano de início
Entree

Aprendizagem diferenciável e processamento de representações temporais, espaciais, espectrais e espectro-temporais de sinais

Processo: 22/10909-5
Modalidade de apoio:Auxílio à Pesquisa - Regular
Data de Início da vigência: 01 de março de 2023
Data de Término da vigência: 31 de agosto de 2025
Área do conhecimento:Engenharias - Engenharia Elétrica - Telecomunicações
Pesquisador responsável:Miguel Arjona Ramírez
Beneficiário:Miguel Arjona Ramírez
Instituição Sede: Escola Politécnica (EP). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Pesquisadores associados:Celso Setsuo Kurashima ; Demostenes Zegarra Rodriguez ; Mario Minami ; Renata Lopes Rosa ; Wesley Beccaro
Bolsa(s) vinculada(s):23/11258-0 - Avaliação de qualidade de voz em redes de novas gerações que considerem fenômenos atmosféricos utilizando aprendizado de máquina, BP.TT
Assunto(s):Processamento de sinais  Aprendizado computacional  Processamento de imagens  Otimização  Representação espacial 
Palavra(s)-Chave do Pesquisador:Audio Processing | Differentiable Signal Processing | Image processing | machine learning | Optimization | speech analysis | Processamento de Sinais e Aprendizagem de Máquina

Resumo

Este plano de pesquisa aborda sinais temporais e espaciais tais como voz, áudio e imagens no seu processamento para a obtenção e aplicação de características para aprendizagem baseadas em funções-objetivo diferenciáveis. Ao longo do processo, é importante a conversão dos sinais a partir de seus domínios de origem para outros mais adequados e significativos, resultando em representações espectrais ou espectro-temporais com o objetivo de evidenciar características mais apropriadas paratarefas específicas. Elas podem ser alcançadas através de transformadas diretas como a transformada de Fourier de curto prazo (STFT) ou pela aplicação de filtros em associação com métodos correlacionais, preditivos ou cepstrais diretamente ou através de mecanismos adaptativos como as redes neurais convolucionais (CNNs), redes neurais recorrentes (RNNs) e camadas "transformer" providas de mecanismos de atenção. Para estas últimas, as representações dão-se através de variáveis latentes, podendo acarretar a necessidade de interpretações ou de métodos de regularização associados dependendo da tarefa objetivada. Com uma base comum de técnicas de aprendizagem de máquina, tem-se em vista uma gama de tarefas tais como análise e síntese de voz, realce e separação de sinais de voz e de áudio espaciais, métodos objetivos de avaliação de qualidade de voz baseados em medidas perceptivas bem como a identificação de regiões de interesse em imagens. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas (6)
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
PEREIRA, PEDRO HENRIQUE; BECCARO, WESLEY; RAMIREZ, MIGUEL ARJONA. Advantages and Pitfalls of Dataset Condensation: An Approach to Keyword Spotting with Time-Frequency Representations. ELECTRONICS, v. 13, n. 11, p. 13-pg., . (22/10909-5)
COSTA, VICTOR; BECCARO, WESLEY. Benefits of Intelligent Fuzzy Controllers in Comparison to Classical Methods for Adaptive Optics. PHOTONICS, v. 10, n. 9, p. 18-pg., . (22/10909-5)
BECCARO, WESLEY; RAMIREZ, MIGUEL ARJONA; LIAW, WILLIAM; GUIMARAES, HEITOR RODRIGUES. Analysis of Oral Exams With Speaker Diarization and Speech Emotion Recognition: A Case Study. IEEE TRANSACTIONS ON EDUCATION, v. 67, n. 1, p. 13-pg., . (22/10909-5)
BATISTA, ANDREZA P.; AYUB, MUHAMMAD S.; ADASME, PABLO; BEGAZO, DANTE C.; SHAD, MUHAMMAD R.; SAADI, MUHAMMAD; ROSA, RENATA L.; RODRIGUEZ, DEMOSTENES Z.. A methodology for estimating radiofrequency signal attenuation from rainfall and atmospheric gases in 5G-and-beyond networks. IET NETWORKS, v. 14, n. 1, p. 16-pg., . (22/10909-5)
ARAUJO, ARNALDO RAFAEL CAMARA; OKEY, OGOBUCHI DANIEL; SAADI, MUHAMMAD; ADASME, PABLO; ROSA, RENATA LOPES; RODRIGUEZ, DEMOSTENES ZEGARRA. Quantum-assisted federated intelligent diagnosis algorithm with variational training supported by 5G networks. SCIENTIFIC REPORTS, v. 14, n. 1, p. 12-pg., . (22/10909-5)
PRETO, MURILO DE SOUZA; FERREIRA, FERNANDO TEUBL; KURASHIMA, CELSO SETSUO. A Virtual Class Tool for Facial Expressions Telemonitoring through Embedded Systems. 25TH SYMPOSIUM ON VIRTUAL AND AUGMENTED REALITY, SVR 2023, v. N/A, p. 5-pg., . (22/10909-5)