• Nenhum resultado encontrado

CAPÍTULO 3 REDES NEURAIS ARTIFICIAIS

3.5 Construtos de uma Rede Neural Artificial

3.5.5 Arquitetura vrs Topologia

A arquitetura de uma rede neural artificial representa a maneira como os neurônios estão organizados, e está fortemente relacionada com o algoritmo utilizado para treinar e testar a rede.

De acordo com o problema que se pretende determinar uma solução, as arquiteturas de modelos neurais podem ser compostas por algumas estruturas genéricas ou ainda compostas por estruturas particulares, voltadas para funções específicas.

Segundo Haykin (2001), as estruturas genéricas são as conexões entre as unidades de processamento e o arranjo entre as camadas de neurônios da rede – topologia. Braga et al. (2000) afirmam que os atributos básicos de um processamento neural são o padrão de propagação do sinal, o padrão de manutenção da sua topologia e a conectividade da rede.

Para efeito deste trabalho, a arquitetura representa relação direta com o algoritmo utilizado para treinar a rede, enquanto que a topologia está relacionada à quantidade de neurônios, camadas, entre outros parâmetros.

Os neurônios que compõem uma determinada arquitetura apresentam conexões que fazem com que o sinal de processamento se propague ao longo da rede. Os neurônios podem estar conectados por ligações ascendentes ou descendentes. As conexões ascendentes ligam o neurônio em operação à unidade de processamento posterior. Já as conexões descendentes fazem a ligação do neurônio em operação com os neurônios da etapa anterior de propagação, que podem ser exemplificadas pela retroação do erro obtido ao se comparar o valor da saída desejada com o valor da saída obtido. O exemplo descrito representa uma das fases integradas ao algoritmo Backpropagation, desenvolvido e publicado por Rumelhart, Hinton e Williams em seu famoso trabalho publicado em 1986, denominado Learning representations by

backpropagation errors.

Existem diversas arquiteturas de redes neurais. De maneira freqüente, surgem novas arquiteturas e arquiteturas já difundidas são reinventadas sob uma diferente perspectiva. O trabalho utilizará uma arquitetura específica de rede neural – os mapas auto-organizáveis de Kohonen – como será explora mais adiante.

3.5.6 Formas de aprendizagem

O aprendizado de uma rede neural artificial consiste em um complexo processo no qual os parâmetros livres da rede se ajustam de acordo com as condições do ambiente e dos dados de variáveis que alimentam o modelo. O tipo de aprendizagem varia de acordo com a maneira pela qual os parâmetros são alterados.

Existem dois tipos básicos de treinamento para redes neurais artificiais. Um deles é representado pelo aprendizado supervisionado, no qual existe uma relação conhecida entre pares de estímulos. O outro método denominado não-supervisionado tem como característica a aprendizagem autônoma. O treinamento não-supervisionado é obtido por meio do ajuste da rede até uma resposta estável, para um determinado padrão de entrada. Além dos métodos já citados, existe o aprendizado por reforço, o qual pode ser classificado com uma variação do método supervisionado.

Os mecanismos de aprendizagem se baseiam em algoritmos. Estes algoritmos são desenvolvidos com a inspiração no funcionamento de sistemas vivos ou sistemas físicos em geral, como já citado quando foi feita a analogia entre o neurônio biológico e o computacional.

3.5.6.1 Aprendizagem supervisionada

Na aprendizagem supervisionada, a rede funciona como um sistema de entrada e saída (input-output). Ao receber uma entrada com vetor x a rede emite um vetor y . A

simbologia µ, em x, representa o número do padrão de entrada. Já em y, µ consiste no número do padrão de saída associada ao padrão de entrada x.

A aprendizagem de tal sistema funciona mediante a alimentação da rede neural com uma seqüência suficientemente representativa de exemplos x como entradas, e saídas

desejadas y . Para cada entrada, existe uma saída desejada y . O sistema compara a saída

real, obtida mediante o processamento do dado de entrada, com a saída desejada, obtendo assim o parâmetro de ajuste dos pesos sinápticos.

Para uma melhor distinção, utiliza-se a notação (y )’ para a saída obtida e y para a

saída desejada. Assim, (y)’' pode ser tida como uma estimativa de y. Em alguns casos, os dados (x,y) usados no treinamento de uma rede podem ser representados por uma função

ni x f

y  ( ) , sendo ni um vetor ruído aleatório, agente compensador de distorções nos resultados.

3.5.6.2 Aprendizagem auto-organizável (não-supervisionada)

Na aprendizagem não-supervisionada, a rede se modifica de acordo com as resposta referentes às entradas x, sem considerar nenhum valor de saída y . Embora pareça

arbitrária e sem objetivo, esta categoria de treinamento é deveras importante e bastante utilizada. Aplicações relevantes podem ser observadas em aplicações para agrupamentos de padrões, ou ainda em restauração de imagens baseadas em padrões de referência previamente treinados.

Neste tipo de treinamento, não se dispõe de uma saída desejada para ser associada a cada estímulo de entrada. Segundo Haykin (2001), redes auto-organizáveis, utilizadas neste estudo, utilizam este tipo de aprendizado.

Durante o aprendizado não-supervisionado, diversos estímulos de entrada são apresentados à rede, que os organiza por associação. Ao ser apresentado à rede, o padrão de entrada recebe a orientação de qual classe este pertence, com base em suas características dispostas. Caso a rede não seja capaz de associar o padrão de entrada a nenhuma classe existente, uma nove será gerada para então ocorrer a sua classificação, o que torna este tipo de aprendizado aplicável em sistemas classificadores (DE AZEVEDO et al., 2000).

Como este trabalho utiliza uma rede neural concebida a partir mapas auto- organizáveis, serão enfatizadas, no tópico seguinte, será explorado o conceito de auto- organização.

3.5.6.3 Regras de Aprendizagem

As regras de aprendizagem difundidas na literatura são de caráter generalizado e algumas das mais conhecidas são provenientes da famosa regra de Hebb (1949). Muitos pesquisadores focam a modelagem de aprendizado biológico como seu objetivo principal, enquanto outros experimentam maneiras particulares de simular a maneira pela qual natureza processa o aprendizado.

Grande parte das redes neurais artificiais propostas utilizam as seguintes regras: Regra de Hebb (1949), Regra Delta (WIDROW, 1960), Regra ou Modelo de aprendizagem de Kohonen (1982), Regra Retro Propagação do Erro (RUMELHART et al., 1986), Regra de Aprendizagem por Reforço (KLOPF, 1988), Regra de Aprendizagem por Cooperação- Competição (GROSSBERG, 1976; KOHONEN, 1982).

Documentos relacionados