Explorando a dependência de rótulos no aprendizado multirrótulo
Aprendizado com Múltiplas Saídas para Classificação de Fluxos Contínuos de Dados
Métodos de Embedding para Predição de Interações Multirrótulo entre piRNAs e Eleme...
![]() | |
Autor(es): |
Everton Alvares Cherman
Número total de Autores: 1
|
Tipo de documento: | Tese de Doutorado |
Imprenta: | São Carlos. |
Instituição: | Universidade de São Paulo (USP). Instituto de Ciências Matemáticas e de Computação (ICMC/SB) |
Data de defesa: | 2014-01-10 |
Membros da banca: |
Maria Carolina Monard;
José Augusto Baranauskas;
Gustavo Enrique de Almeida Prado Alves Batista;
Alexandre Plastino de Carvalho;
Altigran Soares da Silva
|
Orientador: | Maria Carolina Monard |
Resumo | |
Métodos tradicionais de aprendizado supervisionado, chamados de aprendizado monorrótulo, consideram que cada exemplo do conjunto de dados rotulados está associado a um único rótulo. No entanto, existe uma crescente quantidade de aplicações que lidam com exemplos que estão associados a múltiplos rótulos. Essas aplicações requerem métodos de aprendizado multirrótulo. Esse cenário de aprendizado introduz novos desafios que demandam abordagens diferentes daquelas tradicionalmente utilizadas no aprendizado monorrótulo. O custo associado ao processo de rotulação de exemplos, um problema presente em aprendizado monorrótulo, é ainda mais acentuado no contexto multirrótulo. O desenvolvimento de métodos para reduzir esse custo representa um desafio de pesquisa nessa área. Além disso, novos métodos de aprendizado também devem ser desenvolvidos para, entre outros objetivos, considerar a dependência de rótulos: uma nova característica presente no aprendizado multirrótulo. Há um consenso na comunidade de que métodos de aprendizado multirrótulo têm a capacidade de usufruir de melhor eficácia preditiva quando considerada a dependência de rótulos. Os principais objetivos deste trabalho estão relacionados a esses desafios: reduzir o custo do processo de rotulação de exemplos; e desenvolver métodos de aprendizado que explorem a dependência de rótulos. No primeiro caso, entre outras contribuições, um novo método de aprendizado ativo, chamado score dev, é proposto para reduzir os custos associados ao processo de rotulação multirrótulo. Resultados experimentais indicam que o método score dev é superior a outros métodos em vários domínios. No segundo caso, um método para identificar dependência de rótulos, chamado UBC, é proposto, bem como o BR+, um método para explorar essa característica. O método BR+ apresenta resultados superiores a métodos considerados estado da arte (AU) | |
Processo FAPESP: | 10/15992-0 - Explorando a dependência de rótulos no aprendizado multirrótulo |
Beneficiário: | Everton Alvares Cherman |
Modalidade de apoio: | Bolsas no Brasil - Doutorado Direto |