• Nenhum resultado encontrado

Objetos em Imagens

5.1.1 Mapas Auto-Organizáveis

O SOM foi criado originalmente como uma ferramenta matemática para visualização de dados de alta-dimensionalidade. Ele mapeia uma distribuição de alta dimensão em uma grade regular

de menor dimensão, sendo capaz de compactar informações preservando os relacionamentos topológicos e as métricas mais importantes dos dados originais. Com base nestes pontos, duas características são evidenciadas: a capacidade de criar abstração e a exibição simplificada das informações. Estes dois pontos podem ser utilizados de diversas maneiras em uma variedade de aplicações, tais como em reconhecimento de voz, análise de imagem, processos industriais de controle, organização automática de documentos numa biblioteca, visualização de regis- tros financeiros. Estas características fizeram com que os mapas auto-organizáveis fossem frequentemente utilizados para estabelecer agrupamentos de forma não-supervisionada (Haykin,

1998).

Outra característica interessante do modelo é a sua inspiração neurofisiológica, que vem das observações de que, (i) em tecidos neurais, um neurônio ativado, ao disparar um pulso causa a excitação de outros neurônios que distam dele entre 50 e 100 µm, e (ii) a propagação da excitação para áreas não relacionadas com o processo excitatório é impedida por inibição da região em torno da excitada. Assim, o cérebro se organiza de forma que entradas sensoriais diferentes são representadas por mapas computacionais ordenados topologicamente (Haykin,

1998;Miikkulainen et al.,2005). Em particular, entradas sensoriais como a tátil (Kaas et al.,

1983), a visual (Hubel e Wiesel,1962,1977) e a acústica (Suga,1985) são mapeadas para áreas diferentes do córtex cerebral de uma maneira topologicamente ordenada.

Estrutura Básica do SOM

Figura 5.2 Estrutura básica de um SOM. As unidades xisão as unidades de entrada. Cada peso, wi j,

representa uma conexão entre o i-ésimo nodo da camada de entrada e o j-ésimo nodo da camada de saída. Cada nodo na camada de saída está conectado com quatro vizinhos (grade retangular).

A estrutura básica de um SOM (Figura 5.2) consiste em uma camada de entrada e uma camada de saída. A camada de entrada recebe os estímulos do ambiente e os propaga para todos

os nodos da camada de saída. O número de nodos da camada de entrada é igual ao número de atributos presentes no vetor de entrada x = [x1x2x3... xm]|. A camada de saída codifica o mapa

resultante da aprendizagem e sua topologia é geralmente uma grade bidimensional de nodos, na qual cada nodo de saída é conectado com seus vizinhos imediatos.

As conexões entre o i-ésimo nodo da camada de entrada com o j-ésimo nodo da grade formam um vetor pesos sinápticos, wj= [wji=1 wj2wj3... wjm]|, com j = 1, 2, ..., l, onde m é a

quantidade de nodos da camada de entrada e l é quantidade de nodos no gradil.

Auto-Organização no SOM

A aprendizagem ou auto-organização em um SOM é composta por três etapas: competição, adaptação e cooperação. Quando um estímulo x é apresentado para os nodos da camada de entrada do SOM, ele é propagado para todos os nodos da grade. A partir de então se inicia a etapa de competição entre os nodos da grade, para escolher aquele que reconhecerá o estímulo. No mapa auto-organizável deKohonen(1982), o nodo vencedor, i(x), é aquele cujo vetor de pesos sinápticos wjapresenta a menor distância Euclidiana para o estímulo, x (Eq.5.1).

i(x) = arg min

j [D(x, wj) 2]  5.1

onde D(x, wj) é a distância Euclidiana entre x e wj, explicitada na Eq.5.2.

[D(x, wj)]2=

m

i=1

(xi− wji)2 5.2

onde m é definido como o número de dimensões.

A etapa de adaptação da rede ocorre através da alteração dos pesos sinápticos das unidades de processamento wjda grade. A modificação destes pesos ocorre em reflexo aos estímulos

recebidos do espaço externo (Kohonen,1982,1985).

Um requisito para a auto-organização é que os pesos sinápticos de um nodo sejam modifica- dos apenas na vizinhança local do nodo vencedor e todos os pesos modificados assemelhem-se ao estímulo atual com mais precisão do que no passado. Diferentes sinais de entrada em diferen- tes tempos afetam regiões diferentes na grade de nodos. Deste modo, depois de muitos passos de aprendizagem, os pesos sinápticos começam a adquirir valores que se relacionam suavemente dentro desta grade de maneira equivalente aos estímulos do espaço de entrada (Kohonen,1982,

1985). A Eq.5.3descreve como é realizada a adaptação dos pesos.

wj(n + 1) = wj(n) + η(n)hji(x)(n)(x − wj(n))  5.3 onde η(n), é a função de decaimento da taxa de aprendizagem e hji(x) é a função de decaimento

da vizinhança, ambas decaem a medida que se passam as iterações de treinamento.

A função da taxa de aprendizagem é dada pela Eq. 5.4que faz com que a taxa se inicie com o valor definido em η0e decaia monotonicamente com o progresso das iterações.

η (n) = η0exp  −n τ2  , n = 0, 1, 2, ..., 5.4

onde τ2é uma constante de tempo que ajusta a velocidade do decaimento.

A etapa de cooperação entre os nodos ocorre através do ajuste que é feito também aos nodos vizinhos ao vencedor em direção do estímulo de entrada. O nível de adaptação aplicado a cada nodo da vizinhança do vencedor pode ser descrito pala função hji(x)(n) exibida na Eq.5.5. Esta função atinge seu máximo para o vencedor, isto é j = i e decai através de uma gaussiana com a distância lateral entre os nodos vizinhos distribuídos sobre a grade.

hji(x)(n) = exp  −||rj− ri|| 2 2σ2(n)  , n = 0, 1, 2, ..., 5.5

onde, ri∈ R2 e rs ∈ R2 (no caso de uma grade bidimensional) são as posições vetoriais do

vencedor i e de seu vizinho j na grade, e σ (n) corresponde a largura ou raio da função de vizinhança. O valor de σ (n) se inicia em σ0e decresce monotonicamente com o decorrer das

iterações, conforme a Eq.5.6(Haykin,1998;Kohonen,1982,1985).

σ (n) = σ0exp  −n τ1  , n = 0, 1, 2, ..., 5.6

onde τ1é uma constante de tempo que ajusta a velocidade do decaimento.

Com isso, está definida a estrutura básica de um SOM. Conforme mencionado na seção ante- rior, o SOM e suas derivações serão utilizados para as etapas de agrupamento da representação das percepções. Ou seja, os padrões de entrada que tiverem um mesmo nodo como vencedor estarão em um mesmo grupo e serão representados pelo conjunto de pesos armazenados neste nodo vencedor. Este conjunto de pesos é então considerado como o protótipo deste grupo, uma vez que sumariza as características das percepções por ele agrupadas.

As seções seguintes apresentam uma visão completa dos procedimentos para gerar as representações as percepções visuais, Seção 5.2, e as percepções auditivas, Seção 5.3, que compõe as saídas do Módulo II. A representação das propriocepções poderia ser feita de forma similar, porém será coberta em trabalhos futuros.