Busca avançada
Ano de início
Entree


Texto completo
Autor(es):
Vanzin, Vinicius Joao de Barros ; Moreira, Dilvan de Abreu ; Marcacini, Ricardo Marcondes
Número total de Autores: 3
Tipo de documento: Artigo Científico
Fonte: ARTIFICIAL INTELLIGENCE IN MEDICINE; v. 168, p. 11-pg., 2025-07-23.
Resumo

In the context of global healthcare systems, integrating diverse medical terminologies and classification systems has become a priority due to the adoption of Electronic Health Record (EHR) systems and the imperative for information exchange between healthcare systems. This study addresses the necessity for mapping between the SIGTAP vocabulary used in Brazilian healthcare systems and the broader medical terms of the OMOP CDM terminologies. Two distinct pipelines are evaluated for the vocabulary mapping process, focusing on two subsets of the SIGTAP vocabulary: medicines and medical procedures. The first pipeline utilizes textual embeddings for semantic similarity evaluation, followed by Large Language Models (LLMs) for correspondences selection through a retrieval-augmented generation (RAG) approach. In the second pipeline, LLM agents employ predefined protocols for vocabulary mapping and query refinement. Our results show comparable performance between pipelines in both the Procedures subset (F1 of 0.684 versus 0.678), and the Medicines subset (F1 of 0.846 versus 0.839), indicating the viability of the multi-stage filtering approach. The second pipeline demonstrates an advantage over the first in terms of recall, highlighting the efficacy of dynamic query refinement by the agent. These findings provide evidence that LLM-based methods significantly reduce manual effort required by experts, enabling domain specialists to focus on more challenging cases. (AU)

Processo FAPESP: 23/00488-5 - SPIRA-BM: biomarcadores para condições respiratórias em dispositivos móveis por análise de áudio com inteligência artificial
Beneficiário:Marcelo Finger
Modalidade de apoio: Auxílio à Pesquisa - Temático
Processo FAPESP: 19/07665-4 - Centro de Inteligência Artificial
Beneficiário:Fabio Gagliardi Cozman
Modalidade de apoio: Auxílio à Pesquisa - Programa eScience e Data Science - Centros de Pesquisa Aplicada
Processo FAPESP: 13/07375-0 - CeMEAI - Centro de Ciências Matemáticas Aplicadas à Indústria
Beneficiário:Francisco Louzada Neto
Modalidade de apoio: Auxílio à Pesquisa - Centros de Pesquisa, Inovação e Difusão - CEPIDs
Processo FAPESP: 23/10100-4 - Desenvolvimento de Grandes Modelos de Língua para Aplicações no Domínio Jurídico
Beneficiário:Ricardo Marcondes Marcacini
Modalidade de apoio: Auxílio à Pesquisa - Pesquisa em Políticas Públicas
Processo FAPESP: 22/03176-1 - Aprendizado de máquina para séries temporais em aplicações de mHealth
Beneficiário:Diego Furtado Silva
Modalidade de apoio: Auxílio à Pesquisa - Projeto Inicial
Processo FAPESP: 24/08485-8 - Centro para inteligência artificial em gestão de saúde
Beneficiário:Alexandre Cláudio Botazzo Delbem
Modalidade de apoio: Auxílio à Pesquisa - Programa Centros de Pesquisa Aplicada