Busca avançada
Ano de início
Entree

Uso de medidas de complexidade de dados no suporte ao aprendizado de máquina supervisionado

Processo: 12/22608-8
Modalidade de apoio:Auxílio à Pesquisa - Jovens Pesquisadores
Data de Início da vigência: 01 de agosto de 2013
Data de Término da vigência: 31 de julho de 2018
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Ana Carolina Lorena
Beneficiário:Ana Carolina Lorena
Instituição Sede: Divisão de Ciência da Computação (IEC). Instituto Tecnológico de Aeronáutica (ITA). Ministério da Defesa (Brasil). São José dos Campos , SP, Brasil
Auxílio(s) vinculado(s):21/06870-3 - Além da seleção de algoritmos: meta-aprendizado para análise e entendimento de dados e algoritmos, AP.JP2
Bolsa(s) vinculada(s):15/17291-3 - Determinando a estrutura de grafos direcionados acíclicos em classificação multiclasse por medidas de complexidade de problemas supervisionados, BP.MS
Assunto(s):Aprendizado computacional  Processamento de dados 
Palavra(s)-Chave do Pesquisador:Aprendizado de Máquina | Complexidade de dados | Decomposição de problemas multiclasse | Identificação de ruídos | pre-processamento de dados | Seleção de Atributos | Inteligência Computacional

Resumo

As técnicas de Aprendizado de Máquina (AM) foram empregadas com sucesso na solução de diversos problemas de classificação de dados. Recentemente alguns trabalhos têm se voltado a entender como características quantitativas a respeito da complexidade dos conjuntos de dados para classificação, tais como, a sobreposição geométrica entre classes afetam o desempenho das técnicas de AM. Entre as contribuições desta abordagem está um melhor entendimento do domínio de competência e das limitações dessas técnicas. Neste projeto inicialmente serão estudadas diferentes medidas para caracterizar a complexidade de problemas de classificação. Embora exista uma variedade de medidas na literatura, não são frequentes estudos a respeito de quais tipos de aplicação e análise, podem ser mais beneficiadas por seu uso. Pretende-se então usar estas medidas no suporte à redução da complexidade envolvida na solução de problemas de classificação. A primeira vertente neste sentido consiste em realizar pré-processamentos nos dados, de maneira a reduzir a complexidade dos novos conjuntos gerados. Duas tarefas de pré-processamento de dados serão investigadas: a identificação de ruídos e a seleção de subconjuntos de atributos relevantes. Em uma segunda vertente, a redução da complexidade na solução de um problema de classificação será abordada pelo emprego de uma estratégia de dividir-para-conquistar. Neste caso, o objetivo é encontrar subproblemas de complexidade menor, cujas soluções possam ser combinadas para a resolução do problema de classificação original. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas (24)
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
LORENA, ANA C.; MACIEL, ARON I.; DE MIRANDA, PERICLES B. C.; COSTA, IVAN G.; PRUDENCIO, RICARDO B. C.. Data complexity meta-features for regression problems. MACHINE LEARNING, v. 107, n. 1, SI, p. 209-246, . (12/22608-8)
PISANI, PAULO HENRIQUE; POH, NORMAN; DE CARVALHO, ANDRE C. P. L. F.; LORENA, ANA CAROLINA. Score normalization applied to adaptive biometric systems. COMPUTERS & SECURITY, v. 70, p. 565-580, . (12/22608-8, 13/07375-0, 12/25032-0)
GARCIA, LUIS P. F.; LEHMANN, JENS; DE CARVALHO, ANDRE C. P. L. F.; LORENA, ANA C.. New label noise injection methods for the evaluation of noise filters. KNOWLEDGE-BASED SYSTEMS, v. 163, p. 693-704, . (16/18615-0, 13/07375-0, 12/22608-8)
PISANI, PAULO HENRIQUE; LORENA, ANA CAROLINA; DE CARVALHO, ANDRE C. P. L. F.. Adaptive algorithms applied to accelerometer biometrics in a data stream context. Intelligent Data Analysis, v. 21, n. 2, p. 353-370, . (12/25032-0, 13/07375-0, 12/22608-8)
BARELLA, VICTOR H.; GARCIA, LUIS P. F.; DE SOUTO, MARCILIO C. P.; LORENA, ANA C.; DE CARVALHO, ANDRE C. P. L. F.. Assessing the data complexity of imbalanced datasets. INFORMATION SCIENCES, v. 553, p. 83-109, . (13/07375-0, 15/01382-0, 12/22608-8)
OKIMOTO, LUCAS CHESINI; SAVII, RICARDO MANHAES; LORENA, ANA CAROLINA; IEEE. Complexity Measures Effectiveness in Feature Selection. 2017 6TH BRAZILIAN CONFERENCE ON INTELLIGENT SYSTEMS (BRACIS), v. N/A, p. 6-pg., . (12/22608-8)
TRAMBAIOLLI, L. R.; SPOLAOR, N.; LORENA, A. C.; ANGHINAH, R.; SATO, J. R.. Feature selection before EEG classification supports the diagnosis of Alzheimer's disease. CLINICAL NEUROPHYSIOLOGY, v. 128, n. 10, p. 2058-2067, . (12/22608-8, 13/00506-1, 13/10952-9, 13/10498-6)
MORALES, PABLO; LUENGO, JULIAN; GARCIA, LUIS P. F.; LORENA, ANA C.; DE CARVALHO, ANDRE C. P. L. F.; HERRERA, FRANCISCO. The NoiseFiltersR Package: Label Noise Preprocessing in R. R JOURNAL, v. 9, n. 1, p. 219-228, . (12/22608-8, 13/07375-0, 11/14602-7)
MUNOZ, MARIO ANDRES; YAN, TAO; LEAL, MATHEUS R.; SMITH-MILES, KATE; LORENA, ANA CAROLINA; PAPPA, GISELE L.; RODRIGUES, ROMULO MADUREIRA. An Instance Space Analysis of Regression Problems. ACM TRANSACTIONS ON KNOWLEDGE DISCOVERY FROM DATA, v. 15, n. 2, . (12/22608-8)
QUITERIO, THAISE M.; LORENA, ANA C.; IEEE. Determining the Structure of Decision Directed Acyclic Graphs for Multiclass Classification Problems. PROCEEDINGS OF 2016 5TH BRAZILIAN CONFERENCE ON INTELLIGENT SYSTEMS (BRACIS 2016), v. N/A, p. 6-pg., . (12/22608-8, 15/17291-3)
PIMENTEL, BRUNO ALMEIDA; DE CARVALHO, ANDRE C. P. L. E.; IEEE. Statistical versus Distance-Based Meta-Features for Clustering Algorithm recommendation Using Meta-Learning. 2018 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS (IJCNN), v. N/A, p. 8-pg., . (12/22608-8, 17/20265-0, 16/18615-0)
PIMENTEL, BRUNO ALMEIDA; DE CARVALHO, ANDRE C. P. L. E.; IEEE. Unsupervised Meta-Learning for Clustering Algorithm Recommendation. 2019 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS (IJCNN), v. N/A, p. 8-pg., . (12/22608-8, 17/20265-0, 16/18615-0)
LORENA, ANA C.; MACIEL, ARON I.; DE MIRANDA, PERICLES B. C.; COSTA, IVAN G.; PRUDENCIO, RICARDO B. C.. Data complexity meta-features for regression problems. MACHINE LEARNING, v. 107, n. 1, p. 38-pg., . (12/22608-8)
OKIMOTO, LUCAS C.; LORENA, ANA C.; IEEE. Data complexity measures in feature selection. 2019 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS (IJCNN), v. N/A, p. 8-pg., . (12/22608-8)
SOUSA, ARUA DE M.; LORENA, ANA C.; BASGALUPP, MARCIO P.; IEEE. GEEK: Grammatical Evolution for automatically Evolving Kernel functions. 2017 16TH IEEE INTERNATIONAL CONFERENCE ON TRUST, SECURITY AND PRIVACY IN COMPUTING AND COMMUNICATIONS / 11TH IEEE INTERNATIONAL CONFERENCE ON BIG DATA SCIENCE AND ENGINEERING / 14TH IEEE INTERNATIONAL CONFERENCE ON EMBEDDED SOFTWARE AND SYSTEMS, v. N/A, p. 8-pg., . (12/22608-8, 16/02870-0)
SPOLAOR, NEWTON; LORENA, ANA CAROLINA; LEE, HUEI DIANA. Feature Selection via Pareto Multi-objective Genetic Algorithms. APPLIED ARTIFICIAL INTELLIGENCE, v. 31, n. 9-10, p. 764-791, . (09/12963-2, 12/22608-8)
NAGAI, JAMES S.; SOUSA, HERIO; AONO, ALEXANDRE H.; LORENA, ANA C.; KUROSHU, REGINALDO M.; IEEE. Gene Essentiality Prediction Using Topological Features From Metabolic Networks. 2018 7TH BRAZILIAN CONFERENCE ON INTELLIGENT SYSTEMS (BRACIS), v. N/A, p. 6-pg., . (12/22608-8)
RIVOLLI, ADRIANO; READ, JESSE; SOARES, CARLOS; PFAHRINGER, BERNHARD; DE CARVALHO, ANDRE C. P. L. F.. An empirical analysis of binary transformation strategies and base algorithms for multi-label learning. MACHINE LEARNING, v. 109, n. 8, . (16/18615-0, 13/07375-0, 12/22608-8)
DE MELO, VINICIUS V.; LORENA, ANA C.; IEEE. Using Complexity Measures to Evolve Synthetic Classification Datasets. 2018 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS (IJCNN), v. N/A, p. 8-pg., . (17/20844-0, 12/22608-8)
GARCIA, LUIS P. F.; LORENA, ANA C.; DE SOUTO, MARCILIO C. P.; HO, TIN KAM; IEEE. Classifier Recommendation Using Data Complexity Measures. 2018 24TH INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION (ICPR), v. N/A, p. 6-pg., . (12/22608-8)
PIMENTEL, BRUNO ALMEIDA; DE CARVALHO, ANDRE C. P. L. F.. A Meta-learning approach for recommending the number of clusters for clustering algorithms. KNOWLEDGE-BASED SYSTEMS, v. 195, . (16/18615-0, 17/20265-0, 12/22608-8)
PISANI, PAULO HENRIQUE; LORENA, ANA CAROLINA; DE CARVALHO, ANDRE C. P. L. F.. Adaptive Biometric Systems Using Ensembles. IEEE INTELLIGENT SYSTEMS, v. 33, n. 2, p. 19-28, . (12/22608-8, 13/07375-0, 12/25032-0)
QUITERIO, THAISE M.; LORENA, ANA C.. Using complexity measures to determine the structure of directed acyclic graphs in multiclass classification. APPLIED SOFT COMPUTING, v. 65, p. 428-442, . (12/22608-8, 15/17291-3)
GARCIA, LUIS P. F.; RIVOLLI, ADRIANO; ALCOBACA, EDESIO; LORENA, ANA C.; DE CARVALHO, ANDRE C. P. L. F.. Boosting meta-learning with simulated data complexity measures. Intelligent Data Analysis, v. 24, n. 5, p. 1011-1028, . (12/22608-8, 13/07375-0, 18/14819-5, 16/18615-0)