Bolsa 24/06797-2 - Fonética acústica, Fonética experimental - BV FAPESP
Busca avançada
Ano de início
Entree

Explorando o potencial do reconhecimento automático de falantes usando inteligência artificial e dados de gêmeos: implicações para as ciências forenses e da fala

Processo: 24/06797-2
Modalidade de apoio:Bolsas no Exterior - Estágio de Pesquisa - Pós-Doutorado
Data de Início da vigência: 06 de janeiro de 2025
Data de Término da vigência: 05 de janeiro de 2026
Área de conhecimento:Linguística, Letras e Artes - Linguística
Pesquisador responsável:Sandra Madureira
Beneficiário:Julio Cesar Cavalcanti de Oliveira
Supervisor: Gabriel Skantze
Instituição Sede: Faculdade de Filosofia, Comunicação, Letras e Artes. Pontifícia Universidade Católica de São Paulo (PUC-SP). São Paulo , SP, Brasil
Instituição Anfitriã: KTH Royal Institute of Technology, Suécia  
Vinculado à bolsa:23/11070-1 - Análise fonético-acústica multidimensional em gêmeos idênticos e sujeitos não geneticamente relacionados: implicações para a comparação forense de locutor em diferentes dialetos e estilos de elocução, BP.PD
Assunto(s):Fonética acústica   Fonética experimental   Inteligência artificial
Palavra(s)-Chave do Pesquisador:Fonética Acústica | fonética experimental | Fonética forense | Inteligência Artificial | Reconhecimento automático de falantes | Fonética acústica experimental

Resumo

Este projeto de pesquisa busca avaliar o desempenho de um sistema de reconhecimento automático de falantes por meio de Inteligência Artificial (IA) utilizando dados de sujeitos com diferentes graus de similaridade. O modelo de acesso aberto SpeechBrain será utilizado para as análises. O grupo de participantes será composto por 80 sujeitos, incluindo 10 pares de gêmeos idênticos do sexo masculino, 10 pares de gêmeos idênticos do sexo feminino, 10 pares de gêmeos não-idênticos do sexo masculino e 10 pares de gêmeos não-idênticos do sexo feminino. Todos os participantes recrutados são falantes do Português Brasileiro provenientes das cidades de São Paulo (capital) e Campinas. Dois diferentes estilos de fala serão considerados nas análises: diálogo espontâneo e fala dirigida (entrevista). O desempenho do sistema será avaliado a partir da comparação de gêmeos idênticos, gêmeos não idênticos e entre todos os falantes não gêmeos (por meio de comparações cruzadas entre pares). Tal análise nos permitirá entender em que medida os vetores extraídos pelo modelo de análise automática são baseados em características cepstrais da voz e quão sensíveis esses são a fatores genéticos e ambientais. Ademais, o impacto do sexo dos falantes no desempenho do sistema também será avaliado por meio da comparação de vozes masculinas e femininas. Os efeitos da duração da amostra também serão considerados. Duas métricas de desempenho amplamente aplicadas em pesquisas forenses serão utilizadas para analisar o desempenho do sistema: Equal Error Rate (EER) e Log Cost-likelihood Ratio (Cllr). Os resultados deste estudo lançarão luz sobre as potenciais aplicações e limitações do uso de um modelo baseado em IA em cenários desafiadores, com implicações para a aplicação desses conhecimentos na esfera legal e de segurança. Em última instância, esta pesquisa contribuirá para estratégias de aprimoramento de tecnologias voltadas para a comparação automática de falantes, com um especial foco para o Português Brasileiro.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)