Redes Neuronais e Algoritmos Genéticos - Fernando Manuel Rosmaninho Morgado Ferrão Dias

Como já foi assinalado RNs e AGs têm algumas coisas em comum e é de certa forma natural o aparecimento de várias formas distintas de combinação de ambas as técnicas. A produção tem sido tão profícua que actualmente até a produção de artigos cientíﬁcos com surveys e reviews sobre a intersecção destas áreas é já bastante vasta como são exemplos [81], [82], [83] e [75].

Habitualmente os AGs, enquanto técnica de optimização, são utilizados como au- xiliar da RN uma vez que nesta existem muitos parâmetros cujos valores devem ser estabelecidos de forma a obter o comportamento pretendido. Estes parâmetros tanto podem ser os próprios pesos da RN como outros parâmetros que deﬁnem a arquitectura, nomeadamente o número de entradas, o número de neurónios da camada escondida, o número de iterações de treino, entre outras possibilidades.

Tal como é apontado em [75], são três as principais formas de combinação de AGs e RNs:

• Utilização de AGs para obter os pesos de RNs de arquitectura ﬁxa. • Utilização dos AGs para escolha da arquitectura da RN.

• Utilização dos AGs para escolha dos dados de treino e para interpretação da saída das RNs.

As duas primeiras possibilidades são as que se revestem de interesse para o presente trabalho, pelo que apenas estas serão analisadas.

A utilização de AGs com RNs de arquitectura ﬁxa, apesar de apenas em casos muito simples permitir a obtenção directa dos valores dos pesos, reveste-se de muitas variantes. Assim, como é reportado em [75], já foram desenvolvidas aplicações para determinar a taxa de aprendizagem do treino e a taxa associada à técnica de mo- mento e também aplicações para usar os AGs apenas como iteração inicial de treino, substituindo os pesos aleatórios por pesos iniciais optimizados com os AGs.

Em [75] é também explicado parte do motivo que leva à complexidade de obter os pesos para uma RN. O motivo apontado é designado por Problema das Permutações (do inglês Permutations Problem) e resulta de uma grande parte das RNs serem cons- tituídas por neurónios cuja posição é facilmente permutável. Ou seja se numa RN

4.3. Redes Neuronais e Algoritmos Genéticos 67 trocarmos a ordem dos neurónios ela continua a desempenhar a mesma função, mas a sua descrição em termos de strings binárias não será a mesma. Na verdade para uma RN com h neurónios existem até h! soluções idênticas.

A utilização dos AGs para escolha da arquitectura da RN é a forma de combinação de AGs e RNs com maior sucesso tendo conduzido às mais diversas estratégias.

As aplicações mais comuns consistem na codiﬁcação da estrutura da RN na forma binária e no treino da rede com base num dos algoritmos discutidos no capítulo 2, sendo usado como função de aptidão o erro obtido pela RN após o treino. Na grande maioria das aplicações o algoritmo usado foi o steepest descent, resultando daí um tempo de processamento praticamente proibitivo mesmo para aplicações de pequena dimensão.

A grande maioria das variantes surgem ao nível da codiﬁcação que será abordada na secção seguinte, da aplicação de funções a minimizar mais complexas e até do desenvolvimento de aplicações que não só optimizam a estrutura como os pesos.

4.3.1 Estratégias de codiﬁcação

O artigo [84] apresenta uma síntese das estratégias de codificação utilizadas neste domí- nio, divididas pela codificação de pesos e pela codificação das estruturas das RNs. Codificação dos pesos

A codiﬁcação de pesos mais simples diz respeito à utilização de strings binárias justa- postas para formar uma string que representa o conjunto dos pesos da RN. No entanto existem soluções mais elaboradas que são mais próximas da realidade do cérebro hu- mano, como por exemplo a existência de um bit que assinala a efectividade da ligação, ou de dois bits para assinalar que a ligação está desligada, é inibidora ou excitatória [84].

Nas muitas aplicações já feitas nesta área é possível encontrar os pesos codificados como strings de bits, números reais e strings de bits em codificação de Grey. Existem também aplicações em que o número de bits utilizados na codificação é aumentado durante a evolução por forma a permitir um ajuste fino numa fase mais avançada [84]. Codificação da arquitectura da RN

A tarefa de codificar uma arquitectura de RN para utilização com AGs é considera- velmente mais complexa do que a codificação dos pesos uma vez que permite muitas soluções diferentes e com maior ou menor eficácia. Como será possível concluir da classificação apresentada em [84] existe informação que está representada de forma explícita na codificação e outra que apenas está de forma implícita.

• Codificação baseada nas ligações: neste tipo de codificação (que constitui a maioria das aplicações iniciais) a informação presente no genoma de cada indivíduo é relativa apenas às ligações. Neste tipo de codificação existe normalmente uma arquitectura máxima, que é disposta em camadas ou com todas as ligações presentes.

• Codiﬁcação baseada em nós: neste tipo de codiﬁcação a base é o nó, podendo existir informação sobre a posição relativa, ligação a nós anteriores, pesos e função de activação. Neste caso as operações de cruzamento e mutação têm que ser efectuadas com cuidados adicionais.

• Codiﬁcação baseada em camadas: a codiﬁcação é neste caso baseada nas camadas através da descrição das ligações entre elas e resulta numa complexidade acrescida que exige operadores especiais.

• Codiﬁcação baseada em caminhos: este tipo de codiﬁcação é utilizada para RNs com realimentação e as redes são vistas como um conjunto de caminhos do nó de entrada para o nó de saída. Também neste caso são necessários operadores especiais.

• Codificação indirecta: o princípio base desta codificação é utilizar uma gramática própria para codificar as RNs em vez de codificar directamente as propriedades da RN.

4.4 Conclusão

Este capítulo faz uma curta introdução à técnica computacional designada por Al- goritmos Genéticos. Esta técnica resultante de inspiração biológica correspondente à sobrevivência do mais forte (ou do mais apto), tem como grande vantagem ser uma técnica de optimização global (permite, teoricamente, a obtenção de qualquer solução existente no espaço de procura). São explicados os princípios base que a constituem e é exempliﬁcada uma estrutura de algoritmo que usa os operadores mais comuns.

Neste capítulo é também abordada a combinação de AGs e RNs e as formas mais comuns que têm constituído essas combinações. Este é um capítulo necessariamente curto uma vez que os AGs não são um objecto central de estudo desta tese, sendo utilizados essencialmente como instrumento de optimização em diversas situações como será documentado no capítulo 6.

Capítulo 5

Estruturas de controlo

“Most people say that it is the intellect, which makes a great scientist.

They are wrong: it is character.” - Albert Einstein, cientista. (1879 -

1955)

5.1 Introdução

Após terem sido analisados os algoritmos e as técnicas usadas para obter modelos de boa qualidade, directos e inversos, podem agora procurar-se as malhas de controlo que fazem uso desses modelos.

As malhas de controlo presentes na literatura ([7], [1], [52], [15], [53], [6], [85] e [86]) que fazem uso de RNs são diversas sendo algumas especíﬁcas para as RNs e outras adaptadas do controlo clássico.

Este capítulo pretende apenas referir os controladores baseados em modelos usados directamente no presente trabalho e alguns outros com aﬁnidades directas com os que foram utilizados.

Neste capítulo surge também a segunda contribuição desta tese que diz respeito à malha do Controlador Aditivo Baseado em Modelo Interno (do inglês Additive Internal Model Control - AIMC) que, como será demonstrado ao longo deste documento, tem interesse não só do ponto de vista do controlo, mas também na sua utilização em estruturas de treino on-line.

No documento Fernando Manuel Rosmaninho Morgado Ferrão Dias (páginas 84-87)