PARADIGMAS DE APRENDIZADO E TREINAMENTO DE REDES

2 REVISÃO DA LITERATURA

2.3 PARADIGMAS DE APRENDIZADO E TREINAMENTO DE REDES

Todo o trabalho executado por uma RNA é o resultado de sua mais importante propriedade, o aprendizado. Como todo o conceito relacionado a RNAs baseia-se no funcio- namento do cérebro humano, a forma de aprendizado segue naturalmente esse paralelo. A construção mental do conhecimento está baseada em dois paradigmas principais: o simbo-

lismo e o conexionismo. No paradigma simbólico o conhecimento é representado por regras

lógicas e símbolos, e o comportamento inteligente resulta da aplicação/execução dessas regras e manipulação desses símbolos. No conexionismo, o conhecimento está relacionado ao processamento das informações, que se dá em redes neuronais, através de estimulações de grupos de neurônios de forma paralela (diferentes redes de neurônios em diferentes partes do cérebro processam a mesma informação). É daí que o homem desenvolve a capacidade de produzir generalizações a partir de experiências específicas (MOTA e ZIMMER, 2005).

Historicamente, a IA clássica originou-se no paradigma da computação simbólica. Postulava-se que qualquer pensamento inteligente pode ter sua raiz nas computações de sis- temas simbólico-físicos. De acordo com o paradigma simbólico o cérebro constrói seus mode- los de estruturas cognitivas de armazenamento e organização de conhecimento semelhante

aos arquivos de um computador, como os esquemas e os frames (MINSKY, 1981; HAY-

KIN, 2001; MOTA; ZIMMER, 2005).

Teoricamente no processamento da informação a cognição é uma operação coor- denada de vários processos mentais realizados em um sistema de memória multicomponen-

cial: memória sensorial, memória de trabalho, memória de curto prazo e memória de longo

prazo. O processamento de informação consiste essencialmente na transformação de símbolos de acordo com regras, que na IA estariam estabelecidas num programa computacional. No simbolismo a ênfase é dada aos processos mentais – softwares – sem preocupação alguma com a relação desses com a estrutura onde ocorrem: o cérebro – ou hardware – distinguindo a realidade mental da realidade física. Dessa forma, os modelos simbólicos refletem os princí- pios baseados na serialidade dos processos cognitivos (HAYKIN, 2001; HORGAN, 1997; MOTA e ZIMMER, 2005).

Nas RNAs o processo de aprendizado é prioritariamente conexionista. No cone- xionismo os processos cognitivos levam em conta a base física e o meio ambiente onde se situa o sistema em que eles ocorrem. Enquanto a modelagem simbólica, realizada em computadores digitais, objetiva modelar a mente como um processador de símbolos serial e tem como objetivo principal criar uma única arquitetura cognitiva que possa desempenhar qualquer tarefa, o conexionismo procura projetar computadores inspirados no cérebro, que é um pro-

cessador de distribuição em paralelo (PDP). A abordagem PDP tenta elucidar os princípios

gerais que governam todos os aspectos da cognição, e busca, portanto, através de modelos e simulações extremamente simples, capturar o conjunto de princípios gerais sobre a natureza da aprendizagem e do processamento no sistema cognitivo humano, emulando esses princí- pios numa máquina computacional. Desse modo a semântica do domínio não precisa ser in- troduzida explicitamente no sistema: o sistema pode induzir este conhecimento através de um processo de aprendizagem (POERSH, 2004; MOTA e ZIMMER, 2005).

A propriedade mais importante das redes neurais, portanto, é a habilidade de a-

prender de seu ambiente e com isso melhorar seu desempenho. Isso é feito através de um processo iterativo de ajustes aplicado a seus pesos, denominado treinamento. O aprendiza- do ocorre quando a rede neural atinge uma solução generalizada para uma classe de proble-

mas, ou seja, um conjunto de padrões de entrada (amostras) que expressam o comportamento do sistema é apresentado repetidas vezes à RNA (processo iterativo) e depois de aprender as relações entre as entradas e as saídas, as redes são capazes de fazer generalizações sobre esse sistema (HAYKIN, 2001; DA SILVA et al., 2010).

Há diferentes processos de aprendizado, cada qual adequado aos diferentes tipos de RNAs, mas de modo geral os processos de aprendizado podem ser classificado em dois grupos: os processos associativos e os processos não-associativo. O aprendizado associativo, que é o modelo para as RNAs supervisionadas, implica em aprender sobre o relacionamento que há entre pares de estímulos. Já o aprendizado não-associativo, que é o modelo para as

RNAs não-supervisionadas, não há estímulos secundários para associar com os estímulos

primários. Neste tipo de aprendizado, a repetição de um estímulo fornece a oportunidade para aprender sobre suas propriedades (KRÖSE e VAN DER SMAGT, 1996; DA SILVA et al., 2010).

O aprendizado numa rede neural resulta do processo de treinamento. O treina- mento numa RNA consiste na aplicação de passos ordenados necessários à sintonização dos pesos sinápticos e limiares (thresholds, ), onde objetivo final é a criação de generalizações

de soluções em suas saídas. Dá-se o nome de algoritmo de aprendizado ao conjunto desses

passos ordenados, que extrai características discriminantes do sistema a partir de amostras do mesmo. As amostras são divididas em dois subconjuntos, o subconjunto de treinamento, que abarca de 60 a 90% do conjunto total e é usado para o aprendizado da rede; e o subcon-

junto de teste, composto de 10 a 40% das amostras e é usado para verificar se as generaliza-

ções estão em patamares aceitáveis para, por conseguinte, validar a topologia de rede adotada (DA SILVA et al., 2010; HAYKIN, 1999; HAYKIN, 2001; MEHROTRA, et al., 1996).

Dá-se o nome de época de treinamento, ou ciclo, a cada apresentação completa dos n-pares (entrada e saída) do subconjunto de treinamento à rede. A correção dos pesos em cada época de treinamento pode ser feita pelo modo padrão, que se dá a cada apresentação do subconjunto de treinamento à rede e cada correção de peso baseia-se no erro individual do exemplo apresentado naquela iteração, portanto ocorrem n-correções em cada ciclo; e pelo

modo batch, onde é feita apenas uma correção por ciclo, no qual todos os exemplos do sub-

conjunto de treinamento são apresentados à rede, que calcula o erro médio e desse resultado corrige os pesos. Então, independentemente do modo pelo qual foi efetuada a correção, o a- juste dos pesos e limiares se dá pelo erro observado na comparação entre o dado de saída de- sejada e aquele previsto pela rede (defasagem). Quando esse erro estiver dentro de limites

aceitáveis a rede neural está treinada (DA SILVA et al., 2010; HAYKIN, 1998; KRÖSE;

VAN DER SMAGT, 1996;MEHROTRA, et al., 1996).

Há três principais estratégias de treinamento: o treinamento (ou aprendizado)

supervisionado, o treinamento por reforço e o treinamento não supervisionado. No a- prendizado supervisionado, a RNA é treinada com auxílio de um “supervisor” ou professor.

A rede deverá possuir pares de entrada e saída (conjunto de entradas e conjunto de saídas de- sejadas para cada entrada), disponibilizados numa tabela de dados entrada/saída, também co- nhecida como tabela atributos/valores), de modo que toda vez que for apresentada à rede uma entrada, deverá ser verificado se a saída obtida, gerada a partir dos cálculos efetuados a

partir dos pesos que a rede possui, confere com a saída desejada para àquela entrada; se for

diferente, a rede deverá ajustar os pesos de forma que armazene o conhecimento desejado. Esta interatividade do treino deverá ser repetida com todo conjunto de treinamento (entradas e saídas), até que a taxa de acerto esteja dentro de uma faixa considerada satisfatória. O “pro-

fessor” na verdade é a própria tabela que ensina à rede qual a resposta correta para cada entrada apresentada – um conhecimento indutivo apriorístico (KRÖSE e VAN DER SMAGT, 1996;MEHROTRA, et al., 1996; HAYKIN, 1998; HAYKIN, 2001; DA SILVA et al.,, 2010).

O aprendizado por reforço é considerado uma variação do treinamento supervi- sionado. Não há a presença do professor, mas de um “crítico externo” ou rede crítica, que avalia a resposta fornecida pela rede através da criação de uma função custo, J – que tem a finalidade de prever o reforço – e aplicar um procedimento de aprendizado que adapta os pesos dos neurônios de modo a estabelecer um mapeamento que minimiza o valor de J. Noutras palavras, o algoritmo de treino, geralmente baseado em métodos estocásticos, ajusta os parâ- metros internos dos neurônios baseado em quaisquer informações qualitativas ou quantitativas inferidas do sistema mapeado (ambiente) que são usadas para medir e corrigir o desempenho do aprendizado. O treinamento é, portanto, por tentativa e erro: se a resposta for satisfatória o neurônio é “recompensado” pelo incremento de seu peso e limiar; se for insatisfatória, o neurônio é “punido” (KRÖSE e VAN DER SMAGT, 1996; SUTTON e BARTO, 1998; DA SILVA et al., 2010).

No aprendizado não supervisionado não existe um conjunto de saídas deseja- das, portanto não há professores, uma vez que não existem agentes externos que indiquem uma resposta desejada para um dado padrão de entrada. Esse treinamento também é conheci- do como auto supervisionado ou auto organizado, uma vez que a própria rede se auto orga- niza em relação às particularidades encontradas entre os elementos do subconjunto amostra, identificando subconjunto que contêm similaridades (clusters). O aprendizado, então, ocorre pela descoberta de padrões ou relevâncias dentro da massa de dados pela rede ao longo do treinamento, de forma que os dados são agrupados (clusterizados) conforme esses padrões. Dependendo do conhecimento do problema por parte do projetista da rede e também do tipo de algoritmo não supervisionado escolhido, o número máximo de clusters pode ser previa- mente determinado (KRÖSE e VAN DER SMAGT, 1996; HAYKIN, 1998; HAYKIN, 2001; DA SILVA et al., 2010).

No documento Emprego de redes neurais artificiais supervisionadas e não supervisionadas no estudo de parâmetros reológicos de excipientes farmacêuticos sólidos (páginas 36-40)