• Nenhum resultado encontrado

4 Métodos alternativos de aprendizagem

4.3.1 Algoritmos genéticos

Primeiramente, definiremos que as variáveis que compõem um indivíduo serão representados por valores reais. As variáveis individuais acima mencionadas conside- ram os valores de γ e as componentes w(i, j) da matriz de pesos intergrupo Wcor(a,b). Essa representação atua como um genótipo (valores dos cromossomos) e é mapeada unicamente no domínio (fenótipo) da variável de decisão.

A etapa seguinte consiste em criar uma população inicial de 50 indivíduos cuja primeira variável, de cada indivíduo, é constituída do valor deγ. As variáveis restantes de cada um dos indivíduos representam cada um dos elementos w(i, j) da matriz de pesos intergrupo Wcor(a,b). γ é um número real uniformemente distribuído na faixa de

1 a 2 e wi j é um número real aleatório uniformemente distribuído dentro da faixa de -0.5 a 0.5 (Fig. 4.7). Além disso, um indivíduo da população inicial foi semeado com a matriz de pesos intergrupo desenvolvida em (GOMES; BRAGA; BORGES, 2005b). Essa técnica permite garantir que a solução produzida pelo AG não será menos eficaz do que aquela gerada pela análise de Hebb. Vale a pena mencionar que a faixa de variação de γ e de Wcor(a,b) foi escolhida considerando, como referência, os valores obtidos na análise Hebbiana desenvolvida em (GOMES; BRAGA; BORGES, 2005b).

... ... (1,1) W W(1,2) W(1,3) W(1,Nb) W(2,1) W(N Na, b) g Matriz Intergrupo Valor de gama

Figura 4.7: Indivíduos - valores do cromossomo

A função-objetivo usada para medir como os indivíduos têm executado uma con- vergência a um padrão global foi estabelecida como {−10,−5,−20 }, sendo −10 o valor considerado para uma recuperação completa (Nr −→número de redes),(−5) e (−2)para uma recuperação parcial (Nr− 1 −→número de redes menos 1 eNr− 2 −→ número de redes menos 2, respectivamente) e0para nenhuma recuperação.

A função de aptidão usada para transformar o valor da função-objetivo em uma medida da aptidão relativa foi desenvolvida através de método do ranking linear. A pressão seletiva foi definida como 2 e um valor de adaptabilidade foi atribuído aos indivíduos de acordo com a sua posição na população e não de acordo com a seu desempenho real. Essa função de aptidão sugere que, limitando a escala reprodutiva, nenhum indivíduo possa gerar uma prole demasiadamente grande, de modo a prevenir

uma convergência prematura (BAKER, 1985).

Na fase seguinte, chamada seleção, um número de indivíduos são escolhidos para a reprodução. Tais indivíduos determinarão o tamanho da prole que uma população produzirá. O método da seleção usado nesse caso foi o stochastic universal sampling (SUS) com um gap entre gerações de 0.7 (70%).

Uma vez escolhidos os indivíduos a serem reproduzidos, uma operação de recom- binação é executada. O tipo de crossover desenvolvido nesta tese foi a recombinação intermediária, considerando que a estrutura do cromossomo possui uma codificação de valor real. Recombinação intermediária é um método de produzir novos fenótipos em torno e entre os valores dos fenótipos dos pais (MÜHLENBEIN; SCHLIERKAMP- VOOSEN, 1993). Nessa operação, a prole é produzida de acordo com a regra

O1= P1+α(P2− P1), (4.66)

onde α é um fator de escalonamento escolhido uniformemente de forma aleatória, sobre algum intervalo, tipicamente [- 0.25, 1.25] e P1 e P2 são os cromossomos pais (MÜHLENBEIN; SCHLIERKAMP-VOOSEN, 1993). Cada variável na prole é o resul- tado da combinação das variáveis dos genes dos pais de acordo com a expressão acima, com a inclusão de um novoα escolhido para cada par de genes do pai.

Como na evolução natural, é necessário estabelecer um processo de mutação (GOLDBERG, 1989). Para populações de valor real, os processos de mutação são obtidos através da alteração do valor do gene ou fazendo uma seleção aleatória de novos valores dentro da faixa permitida (WRIGHT, 1991), (JANIKOW; MICHALEWICZ, 1991). Uma mutação de valor real foi realizada em uma taxa de mutação de1/Nvar, ondeNvar é o número de variáveis em cada um dos indivíduos.

Devido ao fato de que no processo de recombinação a nova população se tornou menor que 30% da população original, um gap entre as gerações de 70% foi produ- zido. Assim, a reinserção de alguns novos indivíduos na população antiga torna-se ne- cessária para manter o tamanho da população estável. Conseqüentemente, somente 90% dos novos indivíduos foram reinseridos na população antiga, a fim de substituir seus membros menos aptos.

O sistema foi inicializado aleatoriamente no tempok= 0 em uma das redes e em uma de suas memórias de primeiro nível que compõem uma memória de segundo nível. As outras redes, por sua vez, foram inicializadas em uma das 4096 combina-

ções possíveis dos padrões, também de forma aleatória. Então, mediu-se o número de vezes que um sistema, consistindo de três redes acopladas, convergiu para uma configuração de tripletos. O AG foi executado em 5 tentativas (trials) sendo que o algoritmo foi finalizado após um número de 100 gerações. Ao final, a qualidade dos melhores membros da população foi testada, considerando a definição do problema.

No primeiro experimento, um valor típico deβ foi escolhido (β= 0.1) e o número de vezes que um sistema, consistindo de três redes acopladas, convergiu para uma confi- guração de tripletos foi medido. A taxa de recuperação de memória nos experimentos foi calculada sobre a média de 5 tentativas (trials) de 1000 iterações do algoritmo pro- posto no capítulo 3 para cada população. O valor de β foi escolhido levando-se em consideração o valor usado na análise Hebbiana desenvolvida em (GOMES; BRAGA; BORGES, 2005b).

A capacidade de convergência do sistema global pode ser vista nas Fig. 4.8 e 4.9. Elas mostram que nosso modelo apresenta uma taxa média de recuperação de memória em torno de 90% para vetores LI e próxima a 100% para vetores ortogonais (tabela 4.1 - 3 redes acopladas). O limite superior e inferior, que representa a curva média das convergências máximas e mínimas em todas as experimentações, ficou próxima da contagem média do sistema. A contagem mais elevada obtida foi de 97.3% e 92.2%, para vetores ortogonais e LI, respectivamente (tabela 4.1).

Tabela 4.1: Máxima taxa de recuperação de memória e valores de gama para vetores ortogonais e LI, considerando 3, 4 e 5 redes acopladas

3 4 5

ORT LI ORT LI ORT LI

Documentos relacionados