Busca avançada
Ano de início
Entree

Desenvolvimento de modelos especializados de linguagem para extração em tempo real e análise de dados de saúde pública.

Processo: 25/03214-9
Modalidade de apoio:Bolsas no Brasil - Mestrado
Data de Início da vigência: 01 de maio de 2025
Data de Término da vigência: 30 de abril de 2027
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Elbert Einstein Nehrer Macau
Beneficiário:Pedro Henrique de Moraes
Instituição Sede: Instituto de Ciência e Tecnologia (ICT). Universidade Federal de São Paulo (UNIFESP). Campus São José dos Campos. São José dos Campos , SP, Brasil
Vinculado ao auxílio:21/10599-3 - Instituto Paulista de Resistência aos Antimicrobianos (Projeto ARIES), AP.CEPID
Assunto(s):Aprendizado computacional   Dinâmica simbólica   Sistemas complexos   Processamento de linguagem natural
Palavra(s)-Chave do Pesquisador:Aprendizado de Máquina | Dinâmica simbólica | Processamento de Linguagens | Sistemas Complexos | Processamento de Linguagem Natural

Resumo

O rápido avanço dos Large Language Models (LLMs) transformou o processamento de linguagem natural, permitindo que máquinas entendam e gerem linguagem humana comprecisão sem precedentes. Modelos como GPT-3 e GPT-4 demonstraramcapacidades excepcionais em tarefas como geração de texto, tradução e resposta a perguntas. No entanto,aplicar diretamente esses modelos de uso geral a domínios especializados como saúde públicaapresenta desafios devido à terminologia e complexidades específicas do domínio. Este projeto visaavaliar LLMs capazes de extrair dados de textos de saúde pública, incluindo literatura acadêmicae conteúdo de mídia social, para alimentar um sistema em tempo real para extração automática de dados.O foco será no ajuste fino dos modelos para Named Entity Recognition (NER), permitindoque eles identifiquem e classifiquem entidades relevantes, como doenças, medicamentos,prestadores de serviços de saúde e tendências de saúde pública. Ao alavancar um conjunto de dados com curadoria de documentos de saúde públicae dados de mídia social, o projeto busca aprimorar a capacidade dos modelos de capturaras nuances da linguagem médica e melhorar a precisão da extração de informações. Oobjetivo final é desenvolver uma ferramenta robusta que apoie pesquisadores, profissionais de saúdee formuladores de políticas, fornecendo análises oportunas e precisas de dados de saúde pública. Isso irácontribuir para uma compreensão mais profunda das tendências de saúde, informar o desenvolvimento de intervençõeseficazes e melhorar a saúde geral das populações.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)