Busca avançada
Ano de início
Entree

Rótulos imprecisos em Aprendizado de Máquina: Medidas de avaliação e algoritmos de aprendizado de máquina

Processo: 15/20606-6
Modalidade de apoio:Bolsas no Exterior - Pesquisa
Data de Início da vigência: 01 de abril de 2016
Data de Término da vigência: 31 de março de 2017
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Ronaldo Cristiano Prati
Beneficiário:Ronaldo Cristiano Prati
Pesquisador Anfitrião: Francisco Herrera
Instituição Sede: Centro de Matemática, Computação e Cognição (CMCC). Universidade Federal do ABC (UFABC). Ministério da Educação (Brasil). Santo André , SP, Brasil
Instituição Anfitriã: Universidad de Granada (UGR), Espanha  
Assunto(s):Aprendizado computacional   Ruído   Inteligência artificial   Mineração de dados
Palavra(s)-Chave do Pesquisador:Aprendizado de Máquina | avaliação de modelos | Mineração de Dados | Ruído | Inteligência Artificial

Resumo

Aprendizado de Máquina supervisionado tem como objetivo construir automaticamente um modelo de classificação a partir de um conjunto de exemplos rotulados. No entanto, nem sempre existem conjuntos de dados rotulados com boa qualidade, um problema conhecido como ruído de rótulo. Esse ruído pode causar diversos problemas para algoritmos de Aprendizado de Máquina (AM). Apesar de existirem trabalhos que estudam a influência do ruído na geração de modelos, existem poucos estudos referentes à avaliação de modelos na presença de rótulos ruidosos. Esse é um problema importante a ser estudado, uma vez que AM requer validação empírica, o que pode levar a conclusões errôneas na comparação de algoritmos nesse cenário. Este projeto de pesquisa pretende investigar essa lacuna, desenvolvendo um estudo sistemático sobre a influência de certos padrões de vício em conjuntos de teste na avaliação de algoritmos de aprendizado.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas (4)
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
LUENGO, JULIAN; SANCHEZ-TARRAGO, DANEL; PRATI, RONALDO C.; HERRERA, FRANCISCO. Multiple instance classification: Bag noise filtering for negative instance noise cleaning. INFORMATION SCIENCES, v. 579, p. 388-400, . (15/20606-6)
PRATI, RONALDO C.; CHARTE, FRANCISCO; HERRERA, FRANCISCO; IEEE. A first approach towards a fuzzy decision tree for multilabel classification. 2017 IEEE INTERNATIONAL CONFERENCE ON FUZZY SYSTEMS (FUZZ-IEEE), v. N/A, p. 6-pg., . (15/20606-6)
PRATI, RONALDO C.; LUENGO, JULIAN; HERRERA, FRANCISCO. Emerging topics and challenges of learning from noisy data in nonstandard classification: a survey beyond binary class noise. KNOWLEDGE AND INFORMATION SYSTEMS, v. 60, n. 1, p. 63-97, . (15/20606-6)
FARIAS, DELIA IRAZU HERNANDEZ; PRALI, RONALDO; HERRERA, FRANCISCO; ROSSO, PAOLO. Irony detection in Twitter with imbalanced class distributions. JOURNAL OF INTELLIGENT & FUZZY SYSTEMS, v. 39, n. 2, p. 2147-2163, . (15/20606-6)