Redes perceptron feed-forward de m´ ultiplas camadas

Aprendizagem não supervisionada na qual a sa´ıda é resultado dos nós treinados para responder a um padrão de clusters existente dentro das entradas. Nesse paradigma, o sistema pode descobrir estatisticamente caracter´ısticas na popula¸cão de entradas. Diferente do aprendizado supervisionado, não existe um conjunto de categorias nos quais os padrões podem ser classificados; o sistema precisa desenvolver sua própria representa¸cão dos est´ımulos de entrada.

3.3.7 Modificando parˆametros de conectividade

Ambos os paradigmas discutidos acima resultam em um ajuste de pesos das conexões entre os nós, de acordo com alguma regra de modifica¸cão. Virtualmente todas as regras para modelos desse tipo podem ser considerados uma varia¸cão da regra de aprendizagem sugerida por Hebb em 1949. A ideia básica é que se dois nós j e k estão ativos ao mesmo tempo, suas interconexões precisam ser fortalecidas. Na versão mais simples da regra de Hebb, se j recebe uma entrada de k, a modifica¸cão do peso wjk será dada por:

∆wjk = γyjyk, (3.7)

onde γ é uma constante positiva de proporcionalidade representando a taxa de aprendizagem. Em uma outra regra comumente utilizada, o ajuste de pesos não é feito usando a ativa¸cão atual do nó k, mas a diferen¸ca entre a ativa¸cão atual e a ativa¸cão desejada, como mostrado a seguir: ∆wjk = γyj(dk− yk), (3.8) onde dk é n´ıvel de ativa¸cão desejado fornecido por uma fonte externa. Essa forma é usualmente chamada de regra de Widrow-Huff ou regra Delta [7].

3.4 Redes perceptron feed-forward de m´ultiplas camadas

Neste trabalho são utilizadas redes neurais para resolver o problema da cinemática inversa. Esse é um clássico problema não-linear. Portanto, não seria poss´ıvel resolvê-lo utilizando redes perceptron de uma única camada porque esse tipo de rede só é capaz de resolver problemas lineares. As não-linearidades são incorporadas a redes neurais através de fun¸cões de ativa¸cão não-lineares [7, 38, 42].

Para redes de uma única camada, o aprendizado supervisionado é realizado através da aplica¸cão do ajuste ao vetor de pesos. O erro é obtido diretamente através da diferen¸ca entre a sa´ıda desejada e a sa´ıda corrente da rede. No entanto, para redes de múltiplas camadas, esse procedimento pode ser aplicado somente para a camada de sa´ıda, já que não existem sa´ıdas desejadas definidas para as camadas intermediárias. Assim, o problema passa a ser então como calcular ou estimar o erro das camadas intermediárias [38, 42].

A aprendizagem por retro-propaga¸cão consiste de dois passos: um passo para frente, a propaga¸cão, e um passo para trás, a retro-propaga¸cão. No passo para frente, um padrão de atividade é aplicado aos nós sensoriais da rede e seu efeito se propaga através da rede, camada por camada. Finalmente, um conjunto de sa´ıdas é produzido como a resposta real da rede.

Figura 3.4: Exemplo de uma rede perceptron com m´ultiplas camadas, adaptado de [38].

Durante o passo de propaga¸cão, os pesos sinápticos da rede são todos fixos. Durante o passo para trás, por outro lado, os pesos sinápticos são ajustados de acordo com uma regra de corre¸cão de erro. Especificamente, a resposta real da rede é subtra´ıda de uma resposta desejada para produzir um sinal de erro. Este sinal de erro é propagado para trás através da rede, contra a dire¸cão das conexões sinápticas. Os pesos são ajustados para fazer que a resposta real da rede se mova para mais perto da resposta desejada [38].

Na Figura 3.4 é mostrado um exemplo de uma rede perceptron com duas camadas escondidas e uma camada de sa´ıda. Considera-se que a rede é totalmente conectada, ou seja, um neurônio em qualquer camada está conectado a todos os neurônios da camada anterior. O fluxo de sinais progride para frente, da esquerda para a direita e de camada em camada [38].

Na Figura 3.5 é mostrado a dire¸cão dos sinais em uma rede perceptron com múltiplas camadas. Percebe-se que existem dois tipos de sinais nessa rede [38]:

Sinais funcionais: é um sinal de entrada que incide no terminal de entrada da rede, propaga- se para frente (nó por nó) através da rede e emerge no terminal de sa´ıda da rede como um sinal de sa´ıda. Presume-se que este sinal realize uma fun¸cão na sa´ıda da rede. Em cada neurônio que ele passa, o sinal é calculado como uma fun¸cão de suas entradas e pesos associados, aplicados àquele nó.

Sinais de erro: este sinal se origina em um nó de sa´ıda da rede e se propaga para trás, camada por camada, através da rede. Ele é chamado de sinal de erro porque sua computa¸cão para cada neurônio da rede envolve uma fun¸cão dependente do erro, de uma forma ou de outra.

As camadas ocultas da rede não fazem parte nem da entrada nem da sa´ıda da rede. Portanto, cada neurônio nas camadas ocultas é projetado para realizar os seguintes cálculos [38]:

Cálculo do sinal funcional que aparece na sua sa´ıda, que é expresso como uma fun¸cão não-linear do sinal de entrada e dos pesos sinápticos associados a ele;

No documento Estudo e implementação de redes neurais e algoritmos genéticos para resolução de cinemática inversa de um manipulador robótico com 5 graus de liberdade (páginas 45-47)