Busca avançada
Ano de início
Entree

Modelos de Ranqueamento Contextuais para Inferência em Linguagem Natural Aumentada por Recuperação

Processo: 25/01118-2
Modalidade de apoio:Bolsas no Brasil - Pós-Doutorado
Data de Início da vigência: 01 de abril de 2025
Data de Término da vigência: 31 de março de 2027
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Daniel Carlos Guimarães Pedronette
Beneficiário:Francielle Alves Vargas
Instituição Sede: Instituto de Geociências e Ciências Exatas (IGCE). Universidade Estadual Paulista (UNESP). Campus de Rio Claro. Rio Claro , SP, Brasil
Vinculado ao auxílio:24/04890-5 - Recuperação Aumentada e Robusta para Tarefas de Inferência em Linguagem Natural utilizando Modelos baseados em Transformers, AP.R
Assunto(s):Recuperação da informação   Processamento de linguagem natural
Palavra(s)-Chave do Pesquisador:Information Retrieval | natural language processing | Recuperação da Informação

Resumo

Considerando os enormes desafios impostos pela complexidade dos aspectos linguísticos ao desenvolvimento de algoritmos baseados em inteligência artificial capazes de compreender e interpretar uma linguagem, o surgimento dos Modelos de Linguagem de Grande Escala (LLMs) representa um avanço significativo. No entanto, apesar dos avanços substanciais e do amplo espectro de aplicações, os LLMs ainda enfrentam desafios, com limitações importantes associadas. Em especial, na manipulação de consultas altamente especializadas ou voltadas para domínios específicos, esses modelos podem gerar informações incorretas, conhecidas como alucinações. Nesse contexto, a Geração Aumentada por Recuperação (RAG) tem se consolidado como uma alternativa relevante, fornecendo aos LLMs um contexto factual associado a tarefas específicas. Em termos gerais, todo o sistema RAG é composto por dois componentes principais: o recuperador e o gerador. Embora a evolução da RAG seja promissora, ela também apresenta desafios. Nesse sentido, abordagens de pré e pós-processamento capazes de aprimorar a eficácia da recuperação de informações são de fundamental importância e constituem o foco principal deste projeto. O objetivo central consiste em investigar os seguintes passos de pós-recuperação: (i) o uso de abordagens de re-ranqueamento de dados textuais na etapa de pós-processamento da recuperação de evidências; (ii) o emprego de técnicas de agregação de rankings com o intuito de combinar distintos resultados de recuperação obtidos por meio de técnicas de expansão de consultas.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)