• Nenhum resultado encontrado

M´etodo baseado em Matriz Pseudo-Inversa

Esse m´etodo foi proposto em [Grassi, 2001]. Inicialmente, para simplificar o problema, suponha que a rede ´e totalmente conectada, isto ´e, n˜ao existe nenhuma restric¸˜ao sobre a matriz de conex˜oesT . A condic¸˜ao de existˆencia de pontos de equil´ıbrio na dinˆamica da RNC ´e, de acordo com (6.2):

xp = T yp+ I, p = 1, ..., m

yp = sat(xp) (6.3)

ondeyp ∈ Bns˜ao vetores bin´arios que correspondem aos padr˜oes a serem armazenados. Como yp = [sat(xp

1), ..., sat(xpn)]T, parap = 1, ..., m, sabe-se que se os vetores xp em (6.3) tiverem componentes de mesmo sinal queype magnitude maior que 1, os vetoresypser˜ao armazenados como mem´orias de (6.1) (pelo Corol´ario B.3.3). Esta condic¸˜ao ´e equivalentemente representada por

xp = αyp, p = 1, ..., m para algumα > 1.

A equac¸˜ao (6.3) pode ser colocada na forma matricial:

X = T Y + ¯I, (6.4)

ondeY = [y1, ..., ym] ∈ Rn×m,X = αY ∈ Rn×m,α > 1 e ¯I = [I, ..., I] ∈ Rn×m. Seja

R = [YT

, J] ∈ Rm×(n+1), W = [T, I] ∈ Rn×(n+1), J = [1, 1, ..., 1]T ∈ Rm. A equac¸˜ao (6.4) pode ent˜ao ser reescrita como

XT = RWT. (6.5)

SejamXi ∈ R1×meWi ∈ R1×n+1asi-´esimas linhas de X e W , respectivamente. Assim, a equac¸˜ao anterior pode ser reescrita como

XT

i = RWiT, i = 1, ..., n (6.6) Sabe-se que (6.6) s´o possui soluc¸˜ao se o vetorXT

i for uma combinac¸˜ao linear das colunas deR (com escalares dados pelos componentes de WT

encontrar uma soluc¸˜ao seR for invert´ıvel (para maiores detalhes, ver [Lay, 1996]). Entretanto, ´e necess´ario determinarWT

i , na equac¸˜ao (6.6), mesmo queR n˜ao seja invert´ıvel. O que se faz, nesse caso, ´e encontrar uma soluc¸˜ao quesempre exista e que seja ´otima, no sentido de minimizar

||XiT − RW T

i ||, i = 1, ..., n.

onde|| · || denota a norma Euclidiana. Tal soluc¸˜ao, portanto, ´e dita minimizar o erro quadr´atico da express˜ao acima, sendo calculada por

ˆ

WiT = R+X T

i , i = 1, ..., n (6.7)

ondeR+denota a matriz pseudo-inversa deR, que ´e definida como

R+ = (RTR)−1RT,

caso(RTR) seja invert´ıvel. Caso contr´ario, R+pode ser obtida por meio da fatorac¸˜ao SVD (ver Apˆendice C), por exemplo. SeR ´e invert´ıvel, ent˜ao R+ = R−1e a soluc¸˜ao (6.7) ´e, de fato

WiT = R−1X T

i , i = 1, ..., n. Em termos geom´etricos, a soluc¸˜ao dada por ˆWT

i em (6.7), projeta o vetorXiT no subespac¸o gerado pelas colunas deR (denotado por Col R), como ilustra a Figura 6.1.

6.2.1

Matriz de ´ındice e restric¸˜ao de conectividade de RNCs

Como uma RNC ´e uma rede localmente acoplada, apenas alguns elementos deT podem ser utilizados para a conex˜ao entre as c´elulas da rede, sendo que os outros elementos devem ser fixados em zero. No entanto, tal restric¸˜ao n˜ao foi utilizada para obter a soluc¸˜ao dada por (6.7). Esta restric¸˜ao pode ser agora introduzida na formulac¸˜ao do problema, por meio das definic¸˜oes que seguem.

R

Col

T i X T T ˆ ˆ i i RW X = Figura 6.1: Projec¸˜ao deXT i no subespac¸oCol R.

6.2 M ´ETODO BASEADO EMMATRIZPSEUDO-INVERSA 67

Definic¸˜ao 6.2.1 Uma matrizS = [Sij] ∈ Rn×n ´e dita uma matriz de ´ındice se Sij = 0 ou 1, para i, j = 1, ..., n.

Observac¸˜ao 6.2.2 Uma matriz de ´ındiceS = [Sij] codifica a arquitetura da rede, indicando a

existˆencia (Sij = 1) ou n˜ao (Sij = 0) de uma interconex˜ao entre a c´elula de ´ındice i e a c´elula

de ´ındicej da rede.

A seguir, define-se como uma matrizS pode ser utilizada para restringir as conex˜oes de uma RNC.

Definic¸˜ao 6.2.3 SejaS como na Definic¸˜ao 6.2.1, e seja W = [Wij] ∈ Rn×n. A restric¸˜ao de

uma matriz de ´ındiceS sobre W ´e denotada por

W |S = [hij], onde hij = ( Wij , se Sij = 1 0 , se Sij = 0.

A partir dessas definic¸˜oes, o problema de construc¸˜ao da mem´oria associativa ´e reformulado e resolvido na sec¸˜ao seguinte, considerando-se a restric¸˜ao de conectividade local da rede.

6.2.2

Estrat´egia de resoluc¸˜ao revista

A equac¸˜ao (6.4), com a restric¸˜ao de uma matriz de ´ındiceS sob a matriz de conex˜oes T (isto ´e,T |S), pode ser reformulada como

X = ¯T Y + ¯I, (6.8)

onde ¯T = T |S. Esta equac¸˜ao, por sua vez, ´e equivalente a

Xi = ¯TiY + ¯Ii, i = 1, ..., n (6.9) ondeXi ∈ R1×m, ¯Ti ∈ R1×n e ¯Ii ∈ R1×m denotam asi-´esimas linha de X, ¯T e ¯I, respectiva- mente.

Devido `a restric¸˜aoT |S, a matriz ¯T ´e possivelmente esparsa, isto ´e, cont´em v´arios elementos iguais a zero e, conseq¨uentemente, os elementos deY que s˜ao multiplicados por essas posic¸˜oes nulas, podem tamb´em ser descartados da equac¸˜ao. Considere a i-´esima linha de ¯T , denotada por ¯Ti. Eliminando-se as linhas deY que s˜ao multiplicadas por zeros em ¯Ti, isto ´e, asj-´esimas linhas deY para as quais Sij = 0, para um i fixo, obt´em-se a matriz ˜Yi ∈ Rvi×m, ondevi indica a quantidade de elementos n˜ao-nulos em ¯Ti (a quantidade de vizinhos da c´elulai), dada por

vi = n X

j=1

Sij. (6.10)

Eliminando-se, tamb´em, os componentes do vetor ¯Ti iguais a zero, isto ´e, osj-´esimos com- ponentes para os quaisSij = 0, para um i fixo, obt´em-se o vetor ˜Ti ∈ R1×vi. Assim, (6.9) pode ser reescrita como

Xi = ˜TiY˜i+ ¯Ii, i = 1, ..., n (6.11) Defina agora ˜ Ri = [ ˜YiT, J] ∈ Rm×(vi+1), J = [1, ..., 1]T ∈ Rm, ˜ Wi = [ ˜Ti, Ii] ∈ R1×(vi+1). Assim, de (6.11), resulta XiT = ˜RiW˜iT, i = 1, ..., n cuja soluc¸˜ao, utilizando matrizes pseudo-inversas, ´e

ˆ

WiT = ˜R+i X T

i , i = 1, ..., n (6.12)

Dessa forma, foi obtida uma soluc¸˜ao para o problema com restric¸˜oes sobre a estrutura deT (equac¸˜ao (6.8)) da mesma forma como foi obtida uma soluc¸˜ao para (6.3), grac¸as `a eliminac¸˜ao das posic¸˜oes n˜ao permitidas emT e, conseq¨uentemente, em Y , de acordo com a restric¸˜ao de conectividade local de RNCs.

Observac¸˜ao 6.2.4 Para se “reconstruir” a matrizT em (6.4), a partir da soluc¸˜ao ˆWiem (6.12),

aplica-se o seguinte procedimento: o primeiro componente do vetor ˆWi, denotado por ˆWi(1),

´e atribu´ıdo ao primeiro componente de Ti, tal queSij = 1. O segundo componente ˆWi(2), ´e

atribu´ıdo ao segundo componente de Ti, tal que Sij = 1, e assim sucessivamente, para os vi

componentes de ˆWi. A ´ultima posic¸˜ao do vetor ˆWi, denotada por ˆWi(vi+ 1), corresponde ao

6.2 M ´ETODO BASEADO EMMATRIZPSEUDO-INVERSA 69

T e para cada componente Ii deI, para i = 1, ...n. Os elementos de Ti que n˜ao tiveram um

valor atribu´ıdo, correspondem `aqueles que n˜ao pertencem `a vizinhanc¸a dai-´esima c´elula da

rede e s˜ao, portanto, igualados a zero.

O m´etodo para determinac¸˜ao dos parˆametros da RNC descrito, ´e sintetizado pelo Algoritmo 6.2.1.

Algoritmo 6.2.1 Algoritmo de treinamento baseado em matrizes pseudo-inversas Entrada: m padr˜oes de treinamento yp,p = 1, ..., m

Sa´ıda: parˆametrosT, I da RNC

Construa as matrizesY = [y1, y2, ..., ym] e X = αY Construa a matriz de ´ındicesS

parai = 1, ..., n fac¸a

Construa ˜Ti e ˜Yi a partir deT e Y . {ver instruc¸˜oes na Sec¸˜ao 6.2.2} Construa ˜ Ri = [ ˜YiT, J] J = [1, ..., 1]T ˜ Wi = [ ˜Ti, Ii] ˆ WT i = ˜R+i XiT

ConstruaT = [Tij] e I a partir de ˆWi {ver instruc¸˜oes na Observac¸˜ao 6.2.4}

Documentos relacionados