Busca avançada
Ano de início
Entree

Quantificação de Incertezas para Regressão Simbólica: Em Direção a Modelos Robustos

Processo: 25/19085-3
Modalidade de apoio:Bolsas no Brasil - Pós-Doutorado
Data de Início da vigência: 01 de janeiro de 2026
Data de Término da vigência: 30 de junho de 2026
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Fabricio Olivetti de França
Beneficiário:Julia Lena Reuter
Instituição Sede: Centro de Matemática, Computação e Cognição (CMCC). Universidade Federal do ABC (UFABC). Santo André , SP, Brasil
Assunto(s):Aprendizado computacional   Computação evolutiva   Robustez
Palavra(s)-Chave do Pesquisador:Aprendizado de Máquina | computação evolutiva | Regressão Simbólica | Robustez | regressão simbólica

Resumo

A análise de regressão é uma ferramenta estatística cujo objetivo é explicar a relação entre variáveis mensuráveis. Tal ferramenta é frequentemente utilizada em aplicações de ajuste de curvas, nas quais a interpolação e a compreensão das tendências dos dados são importantes. Outro uso importante da análise de regressão é nas ciências naturais, onde o cientista propõe uma função paramétrica que se ajusta à expectativa quando os modelos de primeiro princípio são inadequados. A Regressão Simbólica (RS) é uma opção para automatizar a descoberta de tais modelos, capaz de buscar um modelo que não apenas possua um bom ajuste, mas também adere a certas propriedades. Um tópico frequentemente ignorado na pesquisa em RS é a quantificação da incerteza (QI), que estima as incertezas das observações coletadas, do modelo proposto e de seus parâmetros.Isso é necessário para compreender as limitações do modelo, orientar a busca por modelos melhores e fisicamente plausíveis e estimular a coleta de dados adicionais em torno de regiões de incerteza. As fontes de incertezas podem ser aleatórias e epistêmicas. A incerteza aleatória está relacionada à coleta de dados e pode surgir de diversos fontes, como medições imprecisas, ruído externo ou mesmo variáveis não mensuráveis. Essa incerteza é irredutível, a menos que a fonte da aleatoriedade seja atacada (por exemplo, utilizando um equipamento de medição mais preciso). Saber quanto do ruído é irredutível ajuda a detectar sobreajuste, por exemplo.A incerteza epistêmica está relacionada à estrutura do modelo, mais frequentemente aos parâmetros numéricos. Isso ocorre quando o modelo é simplificado demais (por exemplo, usando um modelo linear) ou não há dados suficientes para calibrar os parâmetros. Como na RS, não apenas os parâmetros são ajustados aos dados, mas a estrutura da função é selecionada a partir do vasto espaço de busca de hipóteses, essa incerteza também afeta a seleção da estrutura do modelo.Dessa forma, quantificar as incertezas e mitigar seus efeitos é importante em algoritmos de RS para garantir um modelo confiável (ou pelo menos saber o quanto podemos confiar neles) e orientar a busca para fornecer o modelo mais plausível entre os candidatos, dada a QI.Este projeto iniciará o vasto estudo da QI no contexto da RS, realizando, primeiramente, um estudo aprofundado sobre a QI em regressão não linear, as aplicações atuais da QI em RS, estudando e propondo as melhores abordagens para mitigar o efeito das incertezas na busca por um modelo.Além disso, forneceremos uma implementação de referência de um algoritmo de RS confiável e estável, capaz de lidar com as incertezas e permitir ao usuário explorar os modelos plausíveis para seus próprios dados observacionais.Além do candidato e do orientador, este projeto contará com a colaboração de pesquisadores de diferentes áreas que compartilharão dados do mundo real, suas perspectivas com a QI em RS e seus próprios desideratos. Esperamos que, ao final deste projeto, tenhamos submetido três artigos para periódicos e conferências de alto impacto em ciência da computação, bem como dar continuidade à colaboração com outros grupos de pesquisa. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)