Busca avançada
Ano de início
Entree

Síntese automática de redes neurais artificiais com conexões arbitrárias

Processo: 12/06646-7
Linha de fomento:Bolsas no Brasil - Pós-Doutorado
Vigência (Início): 01 de julho de 2012
Vigência (Término): 30 de junho de 2015
Área do conhecimento:Engenharias - Engenharia Elétrica - Eletrônica Industrial, Sistemas e Controles Eletrônicos
Pesquisador responsável:Fernando José von Zuben
Beneficiário:Wilfredo Jaime Puma Villanueva
Instituição-sede: Faculdade de Engenharia Elétrica e de Computação (FEEC). Universidade Estadual de Campinas (UNICAMP). Campinas , SP, Brasil
Assunto(s):Redes neurais (computação)   Computação paralela   Computação evolutiva

Resumo

Este projeto busca estudar o processo de síntese automática de redes neurais artificiais com conexões arbitrárias (ACNNs, do inglês arbitrarily connected neural networks), em contextos de aprendizado supervisionado a partir de dados. Na área de aprendizado de máquina, há uma demanda crescente por metodologias com maior grau de autonomia de projeto e capazes de conduzir a soluções eficazes para uma classe cada vez mais ampla de objetivos e de restrições de projeto. Entende-se por síntese a obtenção conjunta e automática da arquitetura da rede e de seus pesos sinápticos, visando maximizar desempenho, e entende-se por conexões arbitrárias o fato delas serem estabelecidas sem obedecer algum padrão ou regra pré-estabelecida. Sendo assim, admitem-se conexões recorrentes ou não-recorrentes entre qualquer par de neurônios, incluindo auto-conexões. O principal benefício pretendido é a capacidade de adaptação destas redes às demandas dos problemas, sejam eles de natureza linear, não-linear ou híbrida. Logo, as redes obtidas poderão convergir para arquiteturas puramente lineares, não-lineares ou híbridas, recorrentes ou não-recorrentes, em resposta às demandas da aplicação. O maior desafio é justamente o processo de síntese, à medida que se anulam restrições presentes em modelos tradicionais, como perceptron de múltiplas camadas, cascade correlation e redes recorrentes já propostas na literatura, a complexidade para a definição da arquitetura e para a realização do treinamento aumentam de forma significativa. Os principais pontos a serem estudados neste projeto são: (i) implementação de algoritmos baseados em computação evolutiva e de algoritmos construtivos para a síntese de ACNNs; (ii) estudo e elaboração de uma forma inédita para o cálculo analítico do vetor gradiente dos pesos sinápticos das ACNNs e seu uso junto a algoritmos globais e locais de treinamento de segunda ordem; (iii) uso da GPUs (do inglês Graphic Processing Units) para a execução em paralelo dos algoritmos propostos; (iv) avaliação dos algoritmos propostos junto a problemas de interesse prático nas áreas de regressão, classificação e compressão de dados, incluindo comparações com o estado-da-arte.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Matéria(s) publicada(s) em Outras Mídias (0 total):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)