Redes Neurais Tipo Perceptron Multi-Camadas

6.1 Reconhecimento de Padrões

6.1.3 Redes Neurais Tipo Perceptron Multi-Camadas

Uma rede neural é um processo distribuído e massivamente paralelo que tem uma tendência natural para armazenar conhecimento experimental e fazer uso disto. Isto se assemelha ao cérebro em dois aspectos:

a) O conhecimento é adquirido pela rede através de um processo de aprendizagem; b) Os pesos das conexões inter-neurônios, conhecidas como pesos sinápticos, são

usados para armazenar o conhecimento (HAYKIN, 2001).

As redes neurais são técnicas bastante utilizadas para reconhecimento de padrões de odores, porque são capazes de aprender através de exemplos, geralmente fornecem resultados rápidos e são eficientes com o processamento de informações. No entanto, é difícil escolher os parâmetros ideais da rede e o procedimento de treinamento (HINES; et al, 2003).

As principais vantagens de utilizar uma rede neural no reconhecimento de padrões são:

a) Conhecimento empírico: o aprendizado a partir de exemplos é feito de uma

maneira bastante simples e permite uma aquisição de conhecimentos de forma automática;

b) Adaptabilidade à degradação progressiva: Em geral, as redes obtêm uma boa

generalização dos conhecimentos presentes na base de aprendizado e sendo assim são menos sensíveis a “perturbações e distorções”;

c) Não linearidade e manipulação de dados quantitativos: As redes neurais são

menos vulneráveis aos dados aproximativos e à presença de dados distorcidos ou incorretos que possam estar presentes na base de aprendizado. Esta capacidade de manipular dados aproximados e até mesmo inexatos é mais difícil de ser encontrada em outros métodos de reconhecimento;

d) Paralelismo em larga escala: as redes neurais são compostas de um conjunto de

unidade de processamento de informações que podem trabalhar em paralelo (OSÓRIO, 2000).

As redes neurais apresentam também alguns inconvenientes, do mesmo modo que os outros tipos de métodos de classificação. No caso específico das redes, têm-se limitações tais como: dificuldade na definição da melhor arquitetura, parâmetros e forma de codificação dos dados; problemas de aprendizado ligados a uma inicialização ruim dos pesos; dificuldade em se compreender e visualizar os conhecimentos adquiridos, entre outros (OSÓRIO, 2000). Além disso, para que rede tenha uma boa generalização, é necessário obter um grande número de amostras para a realização do treinamento.

A rede neural tipo MLP, com três camadas e treinada com o algoritmo de retropropagação do erro (back-propagation), é o arranjo de neurônios mais popular na classificação de odores e a primeira rede aplicada em um nariz eletrônico (HINES; et al, 2003).

Este tipo de rede é composto tipicamente de uma camada de entrada (que não possui pesos sinápticos ajustáveis), uma ou mais camada ocultas e uma camada de saída (FERREIRA, 2004). O número de nós de entrada é tipicamente determinado para corresponder ao número de sensores utilizados. O número de neurônios da camada oculta é determinado de forma experimental e o número de características analisadas geralmente determina o número de neurônios de saída. Nesta dissertação, o número de neurônios na entrada foi igual a quatro e o de neurônios ocultos e de saída dependeu do tipo análise feita.

As figuras 22 e 23 ilustram respectivamente um neurônio artificial e um exemplo de arquitetura de rede neural.

Figura 22 - Modelo do neurônio artificial (HAYKIN, 2001).

Figura 23 – Exemplo de arquitetura da rede neural utilizada nas Análises 1 e 2.

O algoritmo back-progagation padrão é um dos algoritmos mais conhecido para treinamento de redes neurais. Desde a sua criação, várias modificações deste algoritmo têm sido propostas com objetivo de reduzir o tempo de treinamento e melhorar o desempenho na classificação de padrões (FERREIRA, 2004). Uma destas modificações é o algoritmo conhecido como Levenberg-Marquardt, utilizado como padrão de treinamento de redes neurais no MatLab.

O algoritmo de Levenberg-Marquardt combina o método do gradiente e com o de Gauss-Newton, herdando a vantagem da velocidade do algoritmo de Gauss-Newton e da estabilidade do método do gradiente. Mais detalhes sobre este algoritmo poderá ser encontrado em (YU, H.; et al, 2011).

Para realizar o treinamento das redes neurais, o conjunto de dados é dividido em dois grupos, sendo que um é utilizado na fase de treinamento da rede, chamado de Conjunto de Treinamento (CTreino), e outro na fase de simulação da rede, definido com Conjunto de teste (CTeste).

A fase de treinamento é a etapa que a rede aprende a reconhecer as características do problema. Após esta etapa, os dados de CTeste são utilizado para simulação da rede. A capacidade desta para responder corretamente aos dados CTeste, sendo que estes valores não apresentados na fase de treinamento, é chamada de generalização da rede (OSÓRIO, 2000 ; FIGUEIREDO, 2007).

A análise das redes foi realizada com auxílio do programa MatLab, utilizando a ferramenta nntool. Esta interface gráfica simplifica a criação de diversos tipos de rede e a

X1 X4 X2 X3 Y1 Y1 tgh tgh tgh

realização dos treinamentos. Além disto, permite analisar o desempenho do treinamento, através da janela Neuro Network Training, e simular o uso da rede para outros dados. A condição de escolha da rede treinada foi baseada no resultado dos gráficos de regressão (plotregression), ao atingir o limite do gradiente. Estes gráficos comparam os resultados da rede para partes dos dados utilizados no treinamento com a saída ótima (desejada).

Depois da criação e do treinamento da rede, os dados de teste (CTeste) foram introduzidos na entrada da rede, na aba Simulate presente na janela principal da rede. Após simulação da rede, é gerado um arquivo na tela inicial da ferramenta nntool, no espaço destinado para dados de saída (Output Data). As configurações e os parâmetros utilizados para a criação, o treinamento e a simulação das redes neurais podem ser encontrados no apêndice C.

7 Metodologia de Criação das Falhas

A inexistência regional de transformadores com diagnóstico positivo para falha motivou o desenvolvimento de uma metodologia para criação de amostras de óleo isolante, que possibilitassem a identificação de falha através dos gases gerados. Esta metodologia se baseou nas condições de confinamento do óleo encontrado no transformador e nas características de cada falha. Para isto, recipientes de vidro foram adaptados com circuitos elétricos e alguns procedimentos de manuseio foram criados para padronizar o processo.

A metodologia para criação das amostras levou em consideração os quatro tipos de falhas encontradas no método do gás chave, as quais são: Descargas Parciais (DP), Arco Elétrico (AE), Sobreaquecimento da Celulose (SC) e Sobreaquecimento do Óleo (SO).

No documento Diagnóstico de falhas em transformadores de potência utilizando sensores de gás semicondutores (páginas 44-48)