Busca avançada
Ano de início
Entree

Uso de medidas de complexidade de dados no suporte ao aprendizado de máquina supervisionado

Processo: 12/22608-8
Linha de fomento:Auxílio à Pesquisa - Apoio a Jovens Pesquisadores
Vigência: 01 de agosto de 2013 - 31 de julho de 2018
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Ana Carolina Lorena
Beneficiário:Ana Carolina Lorena
Instituição-sede: Divisão de Ciência da Computação (IEC). Instituto Tecnológico de Aeronáutica (ITA). Ministério da Defesa (Brasil). São José dos Campos , SP, Brasil
Bolsa(s) vinculada(s):15/17291-3 - Determinando a estrutura de grafos direcionados acíclicos em classificação Multiclasse por medidas de complexidade de problemas supervisionados, BP.MS
Assunto(s):Aprendizado computacional  Processamento de dados 

Resumo

As técnicas de Aprendizado de Máquina (AM) foram empregadas com sucesso na solução de diversos problemas de classificação de dados. Recentemente alguns trabalhos têm se voltado a entender como características quantitativas a respeito da complexidade dos conjuntos de dados para classificação, tais como, a sobreposição geométrica entre classes afetam o desempenho das técnicas de AM. Entre as contribuições desta abordagem está um melhor entendimento do domínio de competência e das limitações dessas técnicas. Neste projeto inicialmente serão estudadas diferentes medidas para caracterizar a complexidade de problemas de classificação. Embora exista uma variedade de medidas na literatura, não são frequentes estudos a respeito de quais tipos de aplicação e análise, podem ser mais beneficiadas por seu uso. Pretende-se então usar estas medidas no suporte à redução da complexidade envolvida na solução de problemas de classificação. A primeira vertente neste sentido consiste em realizar pré-processamentos nos dados, de maneira a reduzir a complexidade dos novos conjuntos gerados. Duas tarefas de pré-processamento de dados serão investigadas: a identificação de ruídos e a seleção de subconjuntos de atributos relevantes. Em uma segunda vertente, a redução da complexidade na solução de um problema de classificação será abordada pelo emprego de uma estratégia de dividir-para-conquistar. Neste caso, o objetivo é encontrar subproblemas de complexidade menor, cujas soluções possam ser combinadas para a resolução do problema de classificação original. (AU)

Publicações científicas (9)
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
GARCIA, LUIS P. F.; LEHMANN, JENS; DE CARVALHO, ANDRE C. P. L. F.; LORENA, ANA C. New label noise injection methods for the evaluation of noise filters. KNOWLEDGE-BASED SYSTEMS, v. 163, p. 693-704, JAN 1 2019. Citações Web of Science: 0.
QUITERIO, THAISE M.; LORENA, ANA C. Using complexity measures to determine the structure of directed acyclic graphs in multiclass classification. APPLIED SOFT COMPUTING, v. 65, p. 428-442, APR 2018. Citações Web of Science: 0.
PISANI, PAULO HENRIQUE; LORENA, ANA CAROLINA; DE CARVALHO, ANDRE C. P. L. F. Adaptive Biometric Systems Using Ensembles. IEEE INTELLIGENT SYSTEMS, v. 33, n. 2, p. 19-28, MAR-APR 2018. Citações Web of Science: 0.
LORENA, ANA C.; MACIEL, ARON I.; DE MIRANDA, PERICLES B. C.; COSTA, IVAN G.; PRUDENCIO, RICARDO B. C. Data complexity meta-features for regression problems. MACHINE LEARNING, v. 107, n. 1, SI, p. 209-246, JAN 2018. Citações Web of Science: 3.
TRAMBAIOLLI, L. R.; SPOLAOR, N.; LORENA, A. C.; ANGHINAH, R.; SATO, J. R. Feature selection before EEG classification supports the diagnosis of Alzheimer's disease. CLINICAL NEUROPHYSIOLOGY, v. 128, n. 10, p. 2058-2067, OCT 2017. Citações Web of Science: 9.
PISANI, PAULO HENRIQUE; POH, NORMAN; DE CARVALHO, ANDRE C. P. L. F.; LORENA, ANA CAROLINA. Score normalization applied to adaptive biometric systems. COMPUTERS & SECURITY, v. 70, p. 565-580, SEP 2017. Citações Web of Science: 0.
MORALES, PABLO; LUENGO, JULIAN; GARCIA, LUIS P. F.; LORENA, ANA C.; DE CARVALHO, ANDRE C. P. L. F.; HERRERA, FRANCISCO. The NoiseFiltersR Package: Label Noise Preprocessing in R. R JOURNAL, v. 9, n. 1, p. 219-228, JUN 2017. Citações Web of Science: 2.
PISANI, PAULO HENRIQUE; LORENA, ANA CAROLINA; DE CARVALHO, ANDRE C. P. L. F. Adaptive algorithms applied to accelerometer biometrics in a data stream context. Intelligent Data Analysis, v. 21, n. 2, p. 353-370, 2017. Citações Web of Science: 2.
SPOLAOR, NEWTON; LORENA, ANA CAROLINA; LEE, HUEI DIANA. Feature Selection via Pareto Multi-objective Genetic Algorithms. APPLIED ARTIFICIAL INTELLIGENCE, v. 31, n. 9-10, p. 764-791, 2017. Citações Web of Science: 0.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.
Mapa da distribuição dos acessos desta página
Para ver o sumário de acessos desta página, clique aqui.