Algoritmo de treinamento back-bropagation

2.7 REDES NEURAIS ARTIFICIAIS

2.7.4 Algoritmo de treinamento back-bropagation

Uma rede neural artificial conta com inúmeros algoritmos para reconhecimento de padrões e treinamentos: Kohonen, Perceptron, Adaline (adaptative linear element), Hopfield, Back-propagation entre outros, cada um com suas especificidades. O algoritmo de treinamento mais amplamente utilizado é o back-propagation. A razão para a popularidade é sua facilidade de uso. O algoritmo foi proposto por Rumelhart et al., 1986 e baseia-se no ajuste de pesos através do erro quadrático dos neurônios da camada de saída da rede neural. Este erro é então propagado no sentido inverso, da camada de saída para a camada de entrada, e as variações dos pesos determinadas, por exemplo, através do método do gradiente descendente. Neste algoritmo a saída da rede é comparada com a saída desejada, o que gera um valor de erro. Este valor é utilizado para realimentação da rede e resultará no ajuste dos pesos sinápticos de cada camada num sentido oposto à propagação dos sinais de treinamento. Assim, o erro calculado de uma camada será usado para ajustar os pesos da camada anterior até que a primeira camada seja ajustada. O processo é repetido um determinado número de vezes para cada padrão de dados durante o treinamento até que o erro total da saída tenha convergido para um valor mínimo predefinido.

De acordo com Haykin, 2001, o processo de retropropagação do erro é constituído de duas fases: uma fase de propagação do sinal funcional (feedforward) e uma fase de retropropagação do erro (back-propagation). Na fase positiva, os vetores de dados são aplicados às unidades de entrada, e seu efeito se propaga pela rede, camada a camada. Finalmente, um

conjunto de saídas é produzido como resposta da rede. Durante a fase positiva, os pesos das conexões são mantidos fixos. Na retropropagação do erro, os pesos são ajustados de acordo com uma regra de correção do erro. Especificamente, a resposta da rede em um instante de tempo é subtraída da saída desejada (target) para produzir o sinal de erro.

2.7.5 Funções de ativação

A função de ativação (fornece o valor da saída de um neurônio) representa o efeito que a entrada interna e o estado atual de ativação exercem na definição do próximo estado de ativação da unidade. Geralmente define-se o estado de ativação como uma função algébrica da entrada interna atual, independente de valores passados do estado de ativação ou mesmo da entrada interna. Normalmente, esta função é monotonicamente não-decrescente e apresenta um tipo de não linearidade associada ao efeito da saturação. O modelo de cada unidade da rede pode incluir uma não linearidade na sua saída. Esta não linearidade deve ser suave, ou seja, diferenciável. Diferenciabilidade é a única exigência que a função de ativação deve satisfazer [Haykin, 2001]. As funções de ativação mais utilizadas na prática são a função sigmóide logística, função tangente hiperbólica e função tangente sigmóide, dependendo das características dos dados. A função linear (purelin) é comumente utilizada nas unidades que compõe a camada de saída de redes do tipo MLP. Esta função simplesmente repete o sinal que entra no neurônio na sua saída, podendo amplificá-lo ou atenuá-lo de forma linear. A função logística (logsig) possui intervalo de variação entre 0 e 1. Quando é desejável que a função de ativação varie de -1 a +1, assumindo uma forma anti-simétrica em relação à origem utiliza-se, geralmente, a função tangente sigmóide (tansig).

2.7.6 Rede Neurais artificiais aplicadas na calibração de dispositivos

Yasin e White, 1999, apresentam um procedimento baseado em redes neurais artificiais (RNAs) atuando como um filtro para prever os valores finais de sistemas de pesagem. A metodologia é utilizada em tempo real e os resultados mostram previsões precisas do valor final da mensuração de forças dinâmicas. Céspedes, 2002, Vasquez e Fonseca, 2006, aplicam RNAs para calibrar células de carga instrumentadas com strain gauges. A RNA é utilizada como uma

ferramenta de interpolação, apresentando como entrada a tensão de referência da ponte de Wheatstone e como saída, utiliza-se diretamente o valor da força que gera a deformação na célula de carga. Céspedes, 2002, apresenta resultados satisfatórios utilizando uma rede feedforward com uma arquitetura de 5-3-1 treinada com o algoritmo back-propagation. Realiza-se a separação do conjunto de dados a fim de validar e treinar a RNA. Os resultados indicam um erro médio quadrático em torno de 6 %. Os autores concluem que o uso de RNAs apresentam-se como uma boa metodologia para calibrar um instrumento, equipamento ou um sistema que opera com condições de entrada variável.

Kohle et al., 1997, utilizam plataformas de forças para gravar os dados de força de reação do solo de pedestres. Os autores afirmam que utilizando dados brutos e redes neurais artificiais é possível identificar funcionamento fora de padrões normais da marcha humana. Zijian, 2005, Rocha e Mendez, 2008, sugerem RNAs para compensar os efeitos de linearidade e temperatura em células de carga. É possível melhorar a acurácia do transdutor utilizando esta técnica de calibração. A rede neural artificial era basicamente uma rede plana única em que a necessidade de camada escondida foi removida, utilizando apenas uma camada com uma expansão funcional do padrão de entrada. Rocha e Mendez, 2008, relatam que a precisão da célula de carga atingiu os requisitos para a classe de precisão C10 da OIML R60, 2000. Reis et al., 2005 e Barbosa et al., 2008, utilizam dois procedimentos para relacionar as leituras de células de carga às cargas aerodinâmicas: ajuste de curvas (mínimos quadrados) e RNAs do tipo MLP. O objetivo é diminuir a soma do erro quadrático (SSE) na predição das cargas aerodinâmicas a partir de resultados mensurados com células de carga em um túnel de vento. Observa-se que para um baixo número de neurônios na camada oculta (n < 14), a estimativa das cargas aerodinâmicas por regressão é superior em comparação ao desempenho da RNA. Porém, com o aumento do número de neurônios da camada oculta, ocorre uma melhora significativa dos resultados utilizando RNAs, conduzindo a menores valores de incerteza em comparação com o ajuste polinomial.

A força de reação do solo (FRS) durante a corrida é analisada por Billing et al., 2006. Os autores investigam o potencial de RNAs e modelos de regressão linear múltipla para estimar as três componentes da FRS. Ainda na área da biomecânica, Betker et al., 2003, sugerem uma rede neural feedforward back-propagation para estimar a trajetória do centro de massa (COM) no plano sagital. Os dados de entrada da RNA são obtidos utilizando uma plataforma de forças (modelo AMTI OR-6). A rede neural possui duas camadas: a primeira camada, ou camada oculta

possui função de ativação tangente sigmóide; a segunda camada ou camada de saída possui uma função de ativação linear. A utilização de RNAs indicam resultados promissores para obter estimativas do COM em aplicações clínicas. Recentemente, Choi et al., 2013, avaliaram a marcha humana utilizando plataformas de forças, câmeras e marcadores passivos ópticos para predizer os movimentos das articulações por meio do método da dinâmica inversa. O objetivo é sugerir um método para predizer a FRS que ocorre em planos complexos durante movimentos assimétricos na fase de apoio duplo da caminhada de pedestres. Este estudo utiliza uma RNA feedforward com uma camada de entrada, uma camada oculta e uma camada de saída. A rede neural é treinada com o algoritmo back-propagation e utiliza função de transferência tangente sigmóide entre as camadas. Choi et al., 2013, consideram a componente vertical da FRS como a mais importante neste tipo de análise, esta componente apresentou excelentes resultados em comparação com as medições experimentais indicando coeficientes de correlação de 0,99.

De um modo geral, as aplicações previamente citadas mostram as vantagens em utilizar uma metodologia inteligente para lidar com as incertezas nas medições de parâmetros cinéticos/cinemáticos que podem ser realizadas, por exemplo, por meio de RNAs agindo como um filtro inteligente aplicado aos dados brutos, a fim de representar a incerteza aleatória, atuando como uma ferramenta de regressão não linear geral para considerar os erros sistemáticos. O uso de RNAs nos artigos revisados também revelou um grande potencial para resolver problemas de ajuste de curvas não lineares. Esta tem sido a principal razão para a investigação de seu uso nesta Tese. A metodologia utilizando redes neurais artificiais apresenta-se como um método substituto frente às técnicas tradicionais de calibração, na qual sugere uma redução das incertezas nas medições realizadas.

No documento MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA MECÂNICA (páginas 79-82)