MÓDULO MLP DE CLASSIFICAÇÃO: CLASSIFICANDO BLOCOS

5 UMA PROPOSTA PARA AGRUPAMENTO E CLASSIFICAÇÃO DE

Figura 5.5 - Desenvolvimento de um modelo baseado em RNA Fonte: Medeiros, 1999, p. 74.

MÓDULO MLP DE CLASSIFICAÇÃO: CLASSIFICANDO BLOCOS

5 UMA PROPOSTA PARA AGRUPAMENTO E CLASSIFICAÇÃO DE

5.4 MÓDULO MLP DE CLASSIFICAÇÃO: CLASSIFICANDO BLOCOS

Num segundo momento as classes obtidas para cada elemento do histórico através do

reconhecimento de padrões do SOM são utilizadas como metas para treinamento de uma rede

supervisionada MLP-Backpropagation (Tabela 5.1).

Para o desenvolvimento de um modelo ou projeto baseado em redes neurais artificiais

são necessárias diversas etapas (Fig. 5.5), descritas conforme adaptação de Caudill (1991, p.

108): ―definição do problema, coleta dos dados de treinamento e de teste; pré e

pós-processamento dos dados; projeto da estrutura da rede; treinamento, teste e validação‖.

Uma vez treinada a MLP poderá ser utilizada para classificar novos produtos em uma

das famílias (classes) existentes.

Topologia da Rede: A camada de entrada é utilizada para receber os dados de

entrada, não efetuando qualquer tipo de processamento servindo apenas para receber e

armazenar o vetor de entrada. Neste trabalho, os dados de entrada são de dimensão n,

representando as n características de cada produto a ser classificado.

A camada de saída armazena as respostas obtidas pela rede, esta camada pode

proporcionar não-linearidade. O número de neurônios nesta camada corresponde aos vetores

de saída. Neste trabalho, a rede apresentará ‗n‘ saídas, onde ‗n‘ é o numero de grupos

fornecidos pelo módulo SOM, os quais serão equivalentes as famílias existentes.

Entre a camada de entrada e de saída, pode-se ter uma ou mais camadas ocultas,

conforme citado no capitulo 4 deste estudo. As camadas ocultas proporcionam complexidade

e não – linearidade para a rede, não existindo um método que determine um n° ideal de

neurônios desta camada (Haykin, 1998).

Os parâmetros da rede neural testados podem ser utilizados para aplicação de novos

agrupamentos a outros conjuntos de blocos de dados. Neste tipo de rede para a classificação

de padrões deve-se atribuir para cada exemplo que lhe é fornecido uma classe ao qual este

exemplo pertence. Portanto, a saída da rede é a classe associada ao exemplo e por

conseqüência, as classes são valores discretos e não contínuos. A classificação é um caso

particular da aproximação de funções onde o valor de saída da rede é discretizado e pertence a

um conjunto finito de classes. No caso do aprendizado supervisionado, o conjunto de classes é

bem definido e conhecido antes de ser iniciado o processo de aprendizado. Uma rede utilizada

para fins de classificação deve possuir saídas discretas, ou então, deve implementar métodos

de discretização de suas saídas(e.g. aplicação de um limiar de discriminação – activation

threshold). As entradas da rede podem ser tanto contínuas, como também podem ser discretas,

o que não deve interferir no fato desta rede ser usada para uma aplicação classificação

discreta.

Consideramos aqui o caso de uma única camada escondida. A generalização para mais

de uma camada escondida é direta e a teoria aplica-se sem alteração. Um neurônio recebe

várias entradas da camada anterior e calcula uma combinação não-linear dessas variáveis. O

resultado da combinação não-linear passa pela função de ativação, neste caso uma função

tangente hiperbólica sigmóide‗tansig‘ e algoritmo de treinamento com gradiente descendente.

O modelo de rede neural utilizado foi configurado com ‗D‘ neurônios na camada de entrada,

de acordo com os vetores características do banco de dados. A rede é testada com uma

camada oculta com ‗m‘ neurônios, sendo esta camada definida conforme a avaliação dos

resultados obtidos no estudo de caso para a melhor topologia para o treinamento, testes e

validação da rede. E uma camada de saída com ‗n‘ neurônios de acordo com a definição do

numero ideal de classes obtidas pelo modelo de RN SOM-Kohonen.

Método de Aprendizado - Algoritmo do Gradiente Descendente com Momentum:

Esse algoritmo busca minimizar o erro quadrático, que é expresso em função dos pesos, de

modo a se obter um conjunto de pesos otimizado que encerrará o processo de treinamento,

tornando a rede apta a produzir padrões de saída aceitáveis. A rede é treinada de forma a

minimizar o erro quadrático associado aos padrões do histórico e sua classificação pela SOM,

ver detalhes na seção 4.4.1.

Efetuado o processo de ajuste, o valor atualizado do peso é descrito em (5.2):

É de particular interesse a determinação do parâmetro η, que é diretamente

responsável pela rapidez do processo de aprendizado. O algoritmo backpropagation provê

uma aproximação da trajetória de movimento sobre a superfície de erro, a qual, a cada ponto

da superfície, segue a direção do ponto mais íngreme em busca do ponto de mínimo global.

Quanto menor for à taxa de aprendizado, menores vão ser as correções a serem aplicadas aos

pesos entre cada iteração, ocasionando um processo de convergência lento. Caso contrário, se

o valor desse parâmetro for alto, pode-se obter uma aceleração no processo de convergência,

mas pode-se tornar o algoritmo instável pela oscilação em torno de um ponto de mínimo

local.

Uma forma simples de garantir a estabilidade e acelerar a convergência é a utilização

da regra delta acrescida do fator de momento. Essa é representada em 5.3:

onde β é denominado constante de momento e possui a variação 0 < β < 1.

O efeito dessa constante é aumentar a velocidade na direção do ponto de mínimo. O

que se deseja com a inserção do termo de momento é a redução no tempo de treinamento, a

melhora na estabilidade do processo e, com isso, aumentar a possibilidade de encontrar o

mínimo global.

Padrões a serem aprendidos: A rede MLP-Backpropagation receberá como entrada

um vetor de dimensão D igual ao número de características dimensionais e produtivas que

representam o bloco. Como saída desejada a rede deverá classificar o bloco em cada um dos n

grupos fornecidos pela rede SOM. Desta forma utiliza-se para treinamento e classificação

uma rede backpropagation com D entradas e n saídas. A tabela 5.1 apresenta a arquitetura

deste sistema de reconhecimento para a classificação de L padrões em n grupos distintos.

Tabela 5.1 - Arquitetura do Sistema de Reconhecimento de Padrões

CONJUNTO L DE BLOCOS

=Comprimento de Solda Plana