5 UMA PROPOSTA PARA AGRUPAMENTO E CLASSIFICAÇÃO DE
5.4 MÓDULO MLP DE CLASSIFICAÇÃO: CLASSIFICANDO BLOCOS
Num segundo momento as classes obtidas para cada elemento do histórico através do
reconhecimento de padrões do SOM são utilizadas como metas para treinamento de uma rede
supervisionada MLP-Backpropagation (Tabela 5.1).
Para o desenvolvimento de um modelo ou projeto baseado em redes neurais artificiais
são necessárias diversas etapas (Fig. 5.5), descritas conforme adaptação de Caudill (1991, p.
108): ―definição do problema, coleta dos dados de treinamento e de teste; pré e
pós-processamento dos dados; projeto da estrutura da rede; treinamento, teste e validação‖.
Figura 5.5 - Desenvolvimento de um modelo baseado em RNA
Fonte: Medeiros, 1999, p. 74.
Uma vez treinada a MLP poderá ser utilizada para classificar novos produtos em uma
das famílias (classes) existentes.
Topologia da Rede: A camada de entrada é utilizada para receber os dados de
entrada, não efetuando qualquer tipo de processamento servindo apenas para receber e
armazenar o vetor de entrada. Neste trabalho, os dados de entrada são de dimensão n,
representando as n características de cada produto a ser classificado.
A camada de saída armazena as respostas obtidas pela rede, esta camada pode
proporcionar não-linearidade. O número de neurônios nesta camada corresponde aos vetores
de saída. Neste trabalho, a rede apresentará ‗n‘ saídas, onde ‗n‘ é o numero de grupos
fornecidos pelo módulo SOM, os quais serão equivalentes as famílias existentes.
Entre a camada de entrada e de saída, pode-se ter uma ou mais camadas ocultas,
conforme citado no capitulo 4 deste estudo. As camadas ocultas proporcionam complexidade
e não – linearidade para a rede, não existindo um método que determine um n° ideal de
neurônios desta camada (Haykin, 1998).
Os parâmetros da rede neural testados podem ser utilizados para aplicação de novos
agrupamentos a outros conjuntos de blocos de dados. Neste tipo de rede para a classificação
de padrões deve-se atribuir para cada exemplo que lhe é fornecido uma classe ao qual este
exemplo pertence. Portanto, a saída da rede é a classe associada ao exemplo e por
conseqüência, as classes são valores discretos e não contínuos. A classificação é um caso
particular da aproximação de funções onde o valor de saída da rede é discretizado e pertence a
um conjunto finito de classes. No caso do aprendizado supervisionado, o conjunto de classes é
bem definido e conhecido antes de ser iniciado o processo de aprendizado. Uma rede utilizada
para fins de classificação deve possuir saídas discretas, ou então, deve implementar métodos
de discretização de suas saídas(e.g. aplicação de um limiar de discriminação – activation
threshold). As entradas da rede podem ser tanto contínuas, como também podem ser discretas,
o que não deve interferir no fato desta rede ser usada para uma aplicação classificação
discreta.
Consideramos aqui o caso de uma única camada escondida. A generalização para mais
de uma camada escondida é direta e a teoria aplica-se sem alteração. Um neurônio recebe
várias entradas da camada anterior e calcula uma combinação não-linear dessas variáveis. O
resultado da combinação não-linear passa pela função de ativação, neste caso uma função
tangente hiperbólica sigmóide‗tansig‘ e algoritmo de treinamento com gradiente descendente.
O modelo de rede neural utilizado foi configurado com ‗D‘ neurônios na camada de entrada,
de acordo com os vetores características do banco de dados. A rede é testada com uma
camada oculta com ‗m‘ neurônios, sendo esta camada definida conforme a avaliação dos
resultados obtidos no estudo de caso para a melhor topologia para o treinamento, testes e
validação da rede. E uma camada de saída com ‗n‘ neurônios de acordo com a definição do
numero ideal de classes obtidas pelo modelo de RN SOM-Kohonen.
Método de Aprendizado - Algoritmo do Gradiente Descendente com Momentum:
Esse algoritmo busca minimizar o erro quadrático, que é expresso em função dos pesos, de
modo a se obter um conjunto de pesos otimizado que encerrará o processo de treinamento,
tornando a rede apta a produzir padrões de saída aceitáveis. A rede é treinada de forma a
minimizar o erro quadrático associado aos padrões do histórico e sua classificação pela SOM,
ver detalhes na seção 4.4.1.
Efetuado o processo de ajuste, o valor atualizado do peso é descrito em (5.2):
É de particular interesse a determinação do parâmetro η, que é diretamente
responsável pela rapidez do processo de aprendizado. O algoritmo backpropagation provê
uma aproximação da trajetória de movimento sobre a superfície de erro, a qual, a cada ponto
da superfície, segue a direção do ponto mais íngreme em busca do ponto de mínimo global.
Quanto menor for à taxa de aprendizado, menores vão ser as correções a serem aplicadas aos
pesos entre cada iteração, ocasionando um processo de convergência lento. Caso contrário, se
o valor desse parâmetro for alto, pode-se obter uma aceleração no processo de convergência,
mas pode-se tornar o algoritmo instável pela oscilação em torno de um ponto de mínimo
local.
Uma forma simples de garantir a estabilidade e acelerar a convergência é a utilização
da regra delta acrescida do fator de momento. Essa é representada em 5.3:
onde β é denominado constante de momento e possui a variação 0 < β < 1.
O efeito dessa constante é aumentar a velocidade na direção do ponto de mínimo. O
que se deseja com a inserção do termo de momento é a redução no tempo de treinamento, a
melhora na estabilidade do processo e, com isso, aumentar a possibilidade de encontrar o
mínimo global.
Padrões a serem aprendidos: A rede MLP-Backpropagation receberá como entrada
um vetor de dimensão D igual ao número de características dimensionais e produtivas que
representam o bloco. Como saída desejada a rede deverá classificar o bloco em cada um dos n
grupos fornecidos pela rede SOM. Desta forma utiliza-se para treinamento e classificação
uma rede backpropagation com D entradas e n saídas. A tabela 5.1 apresenta a arquitetura
deste sistema de reconhecimento para a classificação de L padrões em n grupos distintos.
Tabela 5.1 - Arquitetura do Sistema de Reconhecimento de Padrões
CONJUNTO L DE BLOCOS
=Comprimento de Solda Plana
=Comprimento de Solda
Vertical
=nº de painéis
=nº de subconjuntos
=Volume ( )
= Característica „D‟ da peça L
REDE MLP - Backpropagation