Busca avançada
Ano de início
Entree


Anotação de dados guiada por projeção de características

Texto completo
Autor(es):
Bárbara Caroline Benato
Número total de Autores: 1
Tipo de documento: Dissertação de Mestrado
Imprenta: Campinas, SP.
Instituição: Universidade Estadual de Campinas (UNICAMP). Instituto de Computação
Data de defesa:
Membros da banca:
Alexandre Xavier Falcão; Pedro Jussieu de Rezende; Moacir Antonelli Ponti
Orientador: Alexandre Xavier Falcão
Resumo

Anotação de dados baseada na inspeção visual do usuário (supervisão) de cada amostra de treinamento pode ser um processo trabalhoso, especialmente quando o número de amostras é alto --- um conhecido problema no aprendizado de parâmetros de redes neurais com muitas camadas escondidas em Aprendizado de Máquina. A anotação de dados pelo usuário pode ser ainda mais trabalhosa, particularmente, em áreas que requerem um profissional com conhecimento especializado, como Medicina e Biologia. Tradicionalmente, estudos têm apresentado soluções que empregam o aprendizado semi-supervisionado para lidar com tal questão, a fim de propagar rótulos a partir de poucas amostras supervisionados para amostras não-supervisionadas, explorando a distribuição dessas amostras no espaço de características. Contudo, tais trabalhos não consideram a habilidade cognitiva do usuário para entender projeções do espaço de características com o propósito de aumentar a quantidade de amostras rotuladas para o aprendizado de máquina. Neste trabalho, explorou-se a habilidade cognitiva do usuário assistido por uma ferramenta de analítica visual na tarefa de propagar rótulos para uma grande quantidade de amostras não-supervisionadas. O usuário é guiado pelo conhecimento de rótulo de poucas amostras, bem como pela informação visual da distribuição das amostras na projeção do espaço de características. Além disso, investigou-se uma abordagem de anotação de dados semi-automática, ou seja, que combina as estratégias de propagação de rótulos manual e automática, utilizando uma projeção apropriada do espaço de características e estimação de rótulo semi-supervisionada com medida de certeza para reduzir o esforço do usuário. O método é validado em dois contextos: em uma base conhecida de imagens, MNIST, e em bases de imagens de parasitos intestinais de humanos com e sem impurezas fecais (uma classe adversa que torna o problema mais desafiador). O estudo avaliou duas abordagens automáticas para aprendizado semi-supervisionado nos espaços latente e projetado. Além disso, avaliou dois classificadores supervisionados treinados com os conjuntos rotulados. Por fim, os experimentos visaram escolher a solução que melhor reduz o esforço do usuário para a anotação de dados e, ao mesmo tempo, aumenta os resultados de acurácia na classificação do conjunto de teste. Os resultados sugerem que ferramentas de analítica visual, quando utilizadas para combinar as habilidades complementares de humanos e máquinas, possibilitam um aprendizado de máquina mais eficaz (AU)

Processo FAPESP: 16/25776-0 - Otimização de redes neurais Autocodificadoras guiada por análise visual de dados
Beneficiário:Bárbara Caroline Benato
Modalidade de apoio: Bolsas no Brasil - Mestrado