Busca avançada
Ano de início
Entree

Abordagens centradas em dados para aproveitar grandes modelos de linguagem para imputação de dados ausentes

Processo: 24/23791-8
Modalidade de apoio:Bolsas no Brasil - Doutorado
Data de Início da vigência: 01 de julho de 2025
Data de Término da vigência: 28 de fevereiro de 2029
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Ana Carolina Lorena
Beneficiário:Arthur Dantas Mangussi
Instituição Sede: Divisão de Ciência da Computação (IEC). Instituto Tecnológico de Aeronáutica (ITA). Ministério da Defesa (Brasil). São José dos Campos , SP, Brasil
Vinculado ao auxílio:21/06870-3 - Além da seleção de algoritmos: meta-aprendizado para análise e entendimento de dados e algoritmos, AP.JP2
Assunto(s):Aprendizado computacional   Inteligência artificial
Palavra(s)-Chave do Pesquisador:Aprendizado de Máquina | Data-centric AI | Largue Language Models | Inteligência Artificial

Resumo

Dados do mundo real frequentemente apresentam problemas como desbalanceamento, ruído e valores ausentes. Recentemente, a literatura em aprendizado de máquina tem demonstrado que, para melhorar a performance dos modelos, é igualmente importante aprimorar a qualidade dos dados usados em seu treinamento, o que deu origem a um novo campo de pesquisa chamado Data-Centric AI. Valores ausentes, definidos como a ausência de informações em uma ou mais colunas de um conjunto de dados, representam um desafio comum nesse contexto. A literatura propõe diversas estratégias para imputar esses valores, utilizando desde métodos mais simples até modelos avançados baseados em aprendizado profundo. Com o recente avanço da inteligência artificial generativa e dos modelos de linguagem de grande escala (LLMs), novas investigações começaram a explorar o uso de LLMs para a imputação de dados ausentes. Assim, esta proposta de doutorado tem como objetivo investigar metodologias baseadas em LLMs para realizar a imputação de valores ausentes de forma eficiente e robusta do ponto de vista de Data-Centric AI. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)