Busca avançada
Ano de início
Entree

Uma abordagem unificada para lidar com dados ausentes e de ruído

Processo: 22/10553-6
Modalidade de apoio:Bolsas no Brasil - Mestrado
Data de Início da vigência: 01 de outubro de 2022
Data de Término da vigência: 28 de fevereiro de 2025
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Ana Carolina Lorena
Beneficiário:Arthur Dantas Mangussi
Instituição Sede: Divisão de Ciência da Computação (IEC). Instituto Tecnológico de Aeronáutica (ITA). Ministério da Defesa (Brasil). São José dos Campos , SP, Brasil
Vinculado ao auxílio:21/06870-3 - Além da seleção de algoritmos: meta-aprendizado para análise e entendimento de dados e algoritmos, AP.JP2
Bolsa(s) vinculada(s):23/13688-2 - An Autoencoder model for dealing with missing and noise data, BE.EP.MS
Assunto(s):Aprendizado computacional   Pré-processamento de dados   Inteligência artificial
Palavra(s)-Chave do Pesquisador:Aprendizado de Máquina | pre-processamento de dados | Inteligência Artificial

Resumo

Vários problemas podem deteriorar a qualidade dos dados usados em Aprendizado de Máquina. Dentre eles, pode-se citar a qualidade dos atributos, que podem ser prejudicados pela presença de ruídos e dados ausentes. O ruído pode ser inserido nos dados em várias etapas durante a coleta, armazenamento e transmissão de dados. Em problemas supervisionados, eles podem estar presentes tanto nos rótulos quanto nos atributos preditivos de entrada. Os valores ausentes também são uma preocupação, pois outras informações sobre a observação podem ser importantes e devem ser consideradas. Este projeto investigará esses dois problemas e estratégias para lidar com eles, adotando possíveis abordagens corretivas.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
MANGUSSI, ARTHUR DANTAS; SANTOS, MIRIAM SEOANE; LOPES, FILIPE LOYOLA; PEREIRA, RICARDO CARDOSO; LORENA, ANA CAROLINA; ABREU, PEDRO HENRIQUES. mdatagen: A python library for the artificial generation of missing data. Neurocomputing, v. 625, p. 10-pg., . (23/13688-2, 21/06870-3, 22/10553-6)