| Texto completo | |
| Autor(es): |
Vanzin, Vinicius Joao de Barros
;
Moreira, Dilvan de Abreu
;
Marcacini, Ricardo Marcondes
Número total de Autores: 3
|
| Tipo de documento: | Artigo Científico |
| Fonte: | ARTIFICIAL INTELLIGENCE IN MEDICINE; v. 168, p. 11-pg., 2025-07-23. |
| Resumo | |
In the context of global healthcare systems, integrating diverse medical terminologies and classification systems has become a priority due to the adoption of Electronic Health Record (EHR) systems and the imperative for information exchange between healthcare systems. This study addresses the necessity for mapping between the SIGTAP vocabulary used in Brazilian healthcare systems and the broader medical terms of the OMOP CDM terminologies. Two distinct pipelines are evaluated for the vocabulary mapping process, focusing on two subsets of the SIGTAP vocabulary: medicines and medical procedures. The first pipeline utilizes textual embeddings for semantic similarity evaluation, followed by Large Language Models (LLMs) for correspondences selection through a retrieval-augmented generation (RAG) approach. In the second pipeline, LLM agents employ predefined protocols for vocabulary mapping and query refinement. Our results show comparable performance between pipelines in both the Procedures subset (F1 of 0.684 versus 0.678), and the Medicines subset (F1 of 0.846 versus 0.839), indicating the viability of the multi-stage filtering approach. The second pipeline demonstrates an advantage over the first in terms of recall, highlighting the efficacy of dynamic query refinement by the agent. These findings provide evidence that LLM-based methods significantly reduce manual effort required by experts, enabling domain specialists to focus on more challenging cases. (AU) | |
| Processo FAPESP: | 23/00488-5 - SPIRA-BM: biomarcadores para condições respiratórias em dispositivos móveis por análise de áudio com inteligência artificial |
| Beneficiário: | Marcelo Finger |
| Modalidade de apoio: | Auxílio à Pesquisa - Temático |
| Processo FAPESP: | 19/07665-4 - Centro de Inteligência Artificial |
| Beneficiário: | Fabio Gagliardi Cozman |
| Modalidade de apoio: | Auxílio à Pesquisa - Programa eScience e Data Science - Centros de Pesquisa Aplicada |
| Processo FAPESP: | 13/07375-0 - CeMEAI - Centro de Ciências Matemáticas Aplicadas à Indústria |
| Beneficiário: | Francisco Louzada Neto |
| Modalidade de apoio: | Auxílio à Pesquisa - Centros de Pesquisa, Inovação e Difusão - CEPIDs |
| Processo FAPESP: | 23/10100-4 - Desenvolvimento de Grandes Modelos de Língua para Aplicações no Domínio Jurídico |
| Beneficiário: | Ricardo Marcondes Marcacini |
| Modalidade de apoio: | Auxílio à Pesquisa - Pesquisa em Políticas Públicas |
| Processo FAPESP: | 22/03176-1 - Aprendizado de máquina para séries temporais em aplicações de mHealth |
| Beneficiário: | Diego Furtado Silva |
| Modalidade de apoio: | Auxílio à Pesquisa - Projeto Inicial |
| Processo FAPESP: | 24/08485-8 - Centro para inteligência artificial em gestão de saúde |
| Beneficiário: | Alexandre Cláudio Botazzo Delbem |
| Modalidade de apoio: | Auxílio à Pesquisa - Programa Centros de Pesquisa Aplicada |