Identificação de um sistema multitanques utilizando redes de funções de base radial

Texto

(1)UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE TECNOLOGIA – CT CENTRO DE CIÊNCIAS EXATAS E DA TERRA – CCET PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA E ENGENHARIA DE PETRÓLEO - PPGCEP. DISSERTAÇÃO DE MESTRADO. IDENTIFICAÇÃO DE UM SISTEMA MULTITANQUES UTILIZANDO REDES DE FUNÇÕES DE BASE RADIAL. Brenna Karolyna dos Santos Silva. Orientador: Prof. Dr. André Laurindo Maitelli. Natal / RN, fevereiro de 2016.

(2) IDENTIFICAÇÃO DE UM SISTEMA MULTITANQUES UTILIZANDO REDES DE FUNÇÕES DE BASE RADIAL. Brenna Karolyna dos Santos Silva. Natal / RN, fevereiro de 2016.

(3) Catalogação da Publicação na Fonte Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Silva, Brenna Karolyna dos Santos. Identificação de um sistema multitanques utilizando redes de funções de base radial / Brenna Karolyna dos Santos Silva. Natal, 2016. vii, 87f: il. Orientador: Prof. Dr. André Laurindo Maitelli. Dissertação (Mestrado) - Universidade Federal do Rio Grande do Norte. Centro de Ciências Exatas e da Terra. Programa de Pós Graduação em Ciência e Engenharia de Petróleo.. 1. Redes neurais artificiais. 2. Funções de base radial. 3. Identificação de sistemas não lineares. 4. Multitanques. I. Maitelli, André Laurindo. II. Título..

(4) Brenna Karolyna dos Santos Silva. Identificação de um Sistema Multitanques Utilizando Redes de Funções de Base Radial. Dissertação de Mestrado apresentada ao Programa de Pós-Graduação em Ciência e Engenharia de Petróleo - PPGCEP, da Universidade Federal do Rio Grande do Norte, como parte dos requisitos para obtenção do título de Mestre em Ciência e Engenharia de Petróleo.. Aprovado em 23 de fevereiro de 2016.. ____________________________________ Prof. Dr. André Laurindo Maitelli Orientador – DCA/UFRN ____________________________________ Prof. Dr. Fábio Meneghetti Ugulino de Araújo Membro Interno – DCA/UFRN. ____________________________________ Prof. Dr. Oscar Gabriel Filho Membro Externo à Instituição – PRH PB-220/PETROBRAS.

(5) SILVA, Brenna Karolyna dos Santos - Identificação de um Sistema Multitanques Utilizando Redes de Funções de Base Radial. Dissertação de Mestrado, UFRN, Programa de PósGraduação em Ciência e Engenharia de Petróleo. Área de Concentração: Pesquisa e Desenvolvimento em Ciência e Engenharia de Petróleo. Linha de Pesquisa: Automação na Indústria de Petróleo e Gás, Natal – RN, Brasil. Orientador: Prof. Dr. André Laurindo Maitelli. RESUMO A identificação de sistemas dinâmicos não lineares tem grande importância em várias áreas da Engenharia. Esta dissertação apresenta uma técnica de identificação de sistemas utilizando Redes Neurais Artificiais do tipo Funções de Base Radial – RBF aplicada a um sistema bastante comum na indústria de química e petroquímica, o sistema de multitanques (tanques acoplados), que apresenta uma dinâmica de natureza não linear. Em tal sistema, o comportamento não linear deste pode dificultar a identificação e apresentar um modelo que não reflete seu comportamento real. Esse fator é fonte de motivação para utilizarmos uma ferramenta matemática tal como a RBF na identificação dos aspectos não lineares do sistema. Essa rede apresenta potencialidades como habilidade de tratar sistemas complexos, aprendizado e generalização. A identificação de sistemas utilizando RBF pode ser tratada como um problema de ajuste de curvas através da combinação das funções de base.. Palavras-Chaves: redes neurais artificiais, funções de base radial, identificação de sistemas não lineares, multitanques..

(6) SILVA, Brenna Karolyna dos Santos - Identification a Multi tanks System Using Radial Basis Function Networks. Master's dissertation, UFRN, Graduate Program in Science and Petroleum Engineering. Concentration Area: Research and Development in Science and Petroleum Engineering. Research Line: Automation in the oil and gas industry, Natal - RN, Brazil. Leader: Prof. Dr. André Laurindo Maitelli. ABSTRACT The identification of nonlinear dynamical systems is of great importance in many areas of engineering. In this dissertation presents a system identification technique using Artificial Neural Networks Radial Basis Function type - RBF applied to a very common system in the chemical and petrochemical industry, multi tanks system (coupled tanks), which features a dynamic nature not linear. In such a system, the nonlinear behavior of this can make it difficult to identify and present a model that does not reflect their actual behavior. This factor is a source of motivation we use a mathematical tool such as RBF in the identification of nonlinear aspects of the system. This network has potential as ability to handle complex systems, learning and generalization. Identification systems using RBF can be treated as a curve fitting problem by combining the basic functions.. Keywords: neural networks, radial basis functions, identification of nonlinear systems, multi tanks..

(7) “... gradualmente, depois rapidamente’. É assim que a depressão atinge. Você acorda numa manhã com medo de viver”. Geração Prozac.

(8) Dedico esta dissertação aos meus pais, Sr. Batú e Nice, à minha Tia Egivânia, minha segunda mãe, minha Alice... Em nome de todo amor e carinho que a mim é dado ao longo de toda minha vida. Com muito amor, para vocês!. i Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(9) AGRADECIMENTOS. A Deus, primeiramente, pela vida a qual tento aproveitar e viver plenamente; por todo amor, proteção e força para continuar minha jornada. Aos meus Pais, Sebastião e Eunice, pela educação, zelo e amor com que me criaram, pelo apoio em todos os momentos, pelos investimentos em meus estudos e por confiarem em mim. À minha Tia, Egivânia, por esse amor puro e imenso que me tornam uma filha muito querida e especial; por tanta dedicação a mim e confiança em minha capacidade de realizar meus sonhos. Ao meu Namorado, que acima de tudo foi meu companheiro, por tanta paciência e estímulo constante, por aguentar meus choros, por colocar um sorriso em mim e jamais ter me deixado sozinha. Ao meu irmão, Iure, e a minha avó Maria de Lourdes, que sempre se fazem presente em minha vida e contribuem com seu incentivo, carinho e motivos que fazem sorrir e me sentir cuidada. Ao meu orientador, Prof. Dr. André Laurindo Maitelli por todo conhecimento que me foi passado, colaboração e orientação para realização deste trabalho; agradeço também pela paciência e confiança em mim, por não ter desistido de meu sonho. Obrigada de todo coração Professor. Ao Programa de Recursos Humanos (PRH – PB 220/UFRN), pelo apoio e suporte financeiro. Ao Laboratório de Automação em Petróleo (LAUT/UFRN) pela estrutura disponibilizada. A todos os professores do Programa de Pós-Graduação em Ciência e Engenharia de Petróleo – PPGCEP. A todos meus colegas do LAUT, pelas trocas de informações e sugestões, também pela amizade que foi construída durante esse tempo, em especial a Ana Carla, sempre presente e prestativa. Ao Dr. Bruno, por cuidar de minha saúde, sempre priorizando meu desempenho acadêmico. A Dra. Tatiana, por estar comigo apoiando e ajudando a vencer e mim mesma. Meu agradecimento se estende a todos aqueles que contribuíram de alguma forma para a realização dessa dissertação de mestrado.. Muito obrigada!. ii Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(10) Sumário LISTA DE FIGURAS .............................................................................................................. IV 1. INTRODUÇÃO .................................................................................................................... 2 1.1 - Objetivo.......................................................................................................................... 3 1.2 - Definição do problema .................................................................................................. 3 1.3 - Apresentação do trabalho............................................................................................... 3 2. ASPECTOS TEÓRICOS ..................................................................................................... 6 2.1 - Identificação de Sistemas............................................................................................... 6 2.1.1 - Sistemas dinâmicos................................................................................................. 6 2.1.2 - Modelagem.............................................................................................................. 8 2.1.3 - Estimação de parâmetros....................................................................................... 11 2.1.4 - Estimador dos mínimosquadrados......................................................................... 11 2.2 - Redes de funções de base radial.................................................................................... 14 2.2.1 - Redes Neurais Artificiais....................................................................................... 14 2.2.2 - Redes de funções de base radial............................................................................ 18 3. ESTADO DA ARTE ........................................................................................................... 24 4. METODOLOGIA............................................................................................................... 28 4.1 - Representações lineares................................................................................................ 28 4.1.1 - Modelo AR............................................................................................................. 29 4.1.2 - Autoregressivo com média móvel.......................................................................... 30 4.1.3 - Autoregressivo com entradas externas................................................................... 30 4.1.4 - Modelo autoregressivo com média móvel e entradas externas.............................. 30 4.2 - Representações não lineares......................................................................................... 32 4.3 - Redes neurais artificiais do tipo RBF em modelagem não linear................................ 33 4.4 - Sistema de tanques acoplados...................................................................................... 37 4.5 - Modelagem matemática............................................................................................... 39 5. RESULTADOS OBTIDOS ................................................................................................ 55 5.1 - Análises dos resultados obtidos da identificação......................................................... 55 6. CONCLUSÕES................................................................................................................... 69 REFERÊNCIAS BIBLIOGRÁFICAS ................................................................................. 72 APÊNDICE ............................................................................................................................. 78. iii Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(11) LISTA DE FIGURAS Figura 2.1. Representação gráfica de um sistema sofrendo estímulos externos............................... Figura 2.2. Tempo continuo............................................................................................................. Figura 2.3. Tempo discreto............................................................................................................... Figura 2.4. Representação gráfica de um problema de identificação de sistemas............................ Figura 2.5. Representação gráfica das etapas envolvidas na identificação de sistemas................... Figura 2.6. Neurônio artificial.......................................................................................................... Figura 2.7. Função limiar................................................................................................................. Figura 2.8. Função linear ................................................................................................................. Figura 2.9. Função sigmoide............................................................................................................ Figura 2.10. Função gaussiana......................................................................................................... Figura 2.11. Arquitetura de uma RBF com uma única camada oculta............................................ Figura 2.12. Função gaussiana......................................................................................................... Figura 2.13. Soma ponderada de funções de base radial do tipo gaussiana..................................... Figura 2.14. Estrutura implementada para identificação utilizando rede RBF................................ Figura 4.1. Diagrama em blocos de um sistema dinâmico não linear.............................................. Figura 4.2. Rede neural NARX para um sistema SISO.................................................................... Figura 4.3. Sistema de tanques acoplados implementado no simulink®.......................................... Figura 4.4. Modelo do sistema de tanques acoplados implementado no simulink®........................ Figura 4.5. Sistema utilizado na simulação para obtenção do conjunto entrada / saída utilizado no processo de identificação............................................................................................................. Figura 4.6. Visualização do primeiro e do segundo tanque com suas respectivas entradas e as saídas acrescidas de ruído............................................................................................................... Figura 4.7. Visualização da soma do valor absoluto de um sinal senoidal...................................... Figura 4.8. Visualização do sinal de entrada no primeiro tanque, o sinal de entrada composto das 10000 primeiras amostras e o nível de saída no primeiro tanque..................................................... Figura 4.9. Visualização do sinal de entrada no segundo tanque, o sinal de entrada composto das 10000 primeiras amostras e o nível de saída no segundo tanque..................................................... Figura 4.10. Visualização do sinal de entrada no terceiro tanque, o sinal de entrada composto das 10000 primeiras amostras e o nível de saída no terceiro tanque................................................ Figura 4.11. Visualização do sinal de entrada no quarto tanque, o sinal de entrada composto das 10000 primeiras amostras e o nível de saída no quarto tanque........................................................ Figura 4.12. Visualização do sinal de entrada no quinto tanque, o sinal de entrada composto das 10000 primeiras amostras e o nível de saída no quinto tanque........................................................ Figura 4.13. Gráfico dos dados de entrada / saída do primeiro tanque utilizados durante a fase de treinamento....................................................................................................................................... Figura 4.14. Gráfico dos dados de entrada / saída do segundo tanque utilizados durante a fase de treinamento....................................................................................................................................... Figura 4.15. Gráfico dos dados de entrada / saída do terceiro tanque utilizados durante a fase de treinamento....................................................................................................................................... Figura 4.16. Gráfico dos dados de entrada / saída do quarto tanque utilizados durante a fase de treinamento....................................................................................................................................... Figura 4.17. Gráfico dos dados de entrada / saída do quinto tanque utilizados durante a fase de treinamento....................................................................................................................................... Figura 5.1a. Gráfico comparativo do nível no primeiro tanque onde temos os dados acrescidos de ruído (em azul, pontilhado), o estimado pela RBF (em vermelho, tracejado) e os dados sem a presença de ruído, tido como o desejado (preto, tracejado).............................................................. Figura 5.1b. As mil primeiras amostras referentes a Figura 5.1a...................................................... 7 8 8 9 10 14 15 15 16 16 19 20 21 22 32 34 38 39 43 44 44 46 47 48 49 50 51 52 52 53 53. 56 57 iv. Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(12) Figura 5.2a. Gráfico comparativo do nível no segundo tanque onde temos os dados acrescidos de ruído (em azul, pontilhado), o estimado pela RBF (em vermelho, tracejado) e os dados sem a presença de ruído, tido como o desejado (preto, tracejado).............................................................. Figura 5.2b. As mil primeiras amostras referentes a Figura 5.2a..................................................... Figura 5.3a. Gráfico comparativo do nível no terceiro tanque onde temos os dados acrescidos de ruído (em azul, pontilhado), o estimado pela RBF (em vermelho, tracejado) e os dados sem a presença de ruído, tido como o desejado (preto, tracejado)............................................................... Figura 5.3b. As mil primeiras amostras referentes a Figura 5.3a..................................................... Figura 5.4a. Gráfico comparativo do nível no quarto tanque onde temos os dados acrescidos de ruído (em azul, pontilhado), o estimado pela RBF (em vermelho, tracejado) e os dados sem a presença de ruído, tido como o desejado (preto, tracejado)............................................................... Figura 5.4b. As mil primeiras amostras referentes a Figura 5.4a..................................................... Figura 5.5a. Gráfico comparativo do nível no quinto tanque onde temos os dados acrescidos de ruído (em azul, pontilhado), o estimado pela RBF (em vermelho, tracejado) e os dados sem a presença de ruído, tido como o desejado (preto, tracejado)............................................................... Figura 5.5b. As mil primeiras amostras referentes a figura 5.5a...................................................... Figura 5.6. Gráfico do resultado obtido na validação do nível no primeiro tanque para o sinal de entrada apresentado.......................................................................................................................... Figura 5.7. Gráfico do resultado obtido na validação do nível no segundo tanque para o sinal de entrada apresentado.......................................................................................................................... Figura 5.8. Gráfico do resultado obtido na validação do nível no terceiro tanque para o sinal de entrada apresentado.......................................................................................................................... Figura 5.9. Gráfico do resultado obtido na validação do nível no quarto tanque para o sinal de entrada apresentado.......................................................................................................................... Figura 5.10. Gráfico do resultado obtido na validação do nível no quinto tanque para o sinal de entrada apresentado........................................................................................................................... 57 58. 58 59. 59 60. 60 61 62 63 64 65 66. v Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(13) LISTA DE TABELAS Tabela 1. Parâmetros escolhidos durante a fase de treinamento.................................. Tabela 2. Erro médio quadrático na etapa de validação................................................ 55 66. vi Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(14) LISTA DE ABREVIAÇÕES E SIGLAS. AR. autoregressive. ARMA. autoregressive moving average model structure. ARX. autoregressive model structure with exogenous inputs. BIBO. bounded input bounded output. BFGS. Broyden-Fletcher-Goldfarb-Shanno. BJ. Box-Jenkins model structure. BP. back propagation. CPNN. constructive probabilistic neural network. FIR. finite impulse response. GN. Gauss-Newton. HMLP. hybrid multilayered perceptron. LM. Levenberg-Marquardt. LMS. least mean square. MIMO. multi inputs multi outputs. MISO. multi inputs and single outputs. MLP. multi layer perceptron. NARX. non-linear autoregressive model structure with exogenous inputs. NARMAX. non-linear autoregressive moving average model structure with exogenous inputs. NNARX. neural network autoregressive. NNARMA. neural network autoregressive moving average output error model. OE. output error model. OLS. orthogonal least square. RNA’S. Redes neurais artificiais. RBF. Radial basis function. RMSE. Roots Mean Squared Error. WNN. Wavelets Neural Networks. vii Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(15) Capítulo 1 Introdução.

(16) Capítulo 1 - Introdução. 1. Introdução A indústria petrolífera visa cada vez mais elevar a qualidade dos produtos e segurança na operação, bem como alcançar níveis elevados de eficiência. Para isso é necessário que os equipamentos envolvidos no processo estejam em boas condições de operação. No entanto, tais equipamentos apresentam um alto grau de não linearidades que influenciam diretamente na dinâmica do sistema. Daí a importância de se obter um modelo matemático que possa ser implementado computacionalmente, sendo possível utilizá-lo na otimização e controle de plantas sem interferir na estabilidade do sistema, por exemplo. A área do conhecimento que desenvolve modelos matemáticos empíricos relacionando diferentes variáveis (entrada / saída) e a determinação dos parâmetros associados ao modelo é chamada de identificação (COELHO, 2004). A identificação de sistemas pode ser tratada como um problema de otimização que envolve algumas medidas para adequação de modelos candidatos a representar um processo real (COELHO, 2004). Para obtenção de modelos, alguns passos são necessários: coleta de dados, detecção de não linearidades, seleção de uma estrutura de modelo, estimação de parâmetros e validação do modelo. Com um modelo matemático que represente o processo real é possível desenvolver diversos estudos como: detecção de falhas, controle de processos, análise de comportamento etc. Uma potencialidade da identificação de sistemas é a capacidade de se prever o comportamento dinâmico de um sistema com certo tempo de antecedência tornando possível a tomada de decisões preventivas quando o sistema estiver sujeito a falhas ou mudanças em sua dinâmica. Isso justifica a fundamental importância em compreender um sistema antes de manipulá-lo. Nesta dissertação a ferramenta computacional utilizada na identificação é uma rede neural do tipo Funções de Base Radial – RBF (“radial basis funtion”). As redes neurais artificiais (RNA) são aplicáveis na área de identificação e controle de sistemas não lineares devido suas características de capacidade de aprendizado através de treinamento e por serem mapeadores universais de funções (LIPPMANN, 1987). A identificação de sistemas dinâmicos utilizando RBF pode ser tratada como um problema de ajuste de curvas (aproximação de funções), nesse contexto, as redes de função de base radial possuem apenas uma camada oculta, cujos neurônios possuem função de ativação não linear, geralmente gaussianas, e a estrutura. 2 Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(17) Capítulo 1 - Introdução. pode ser entendida como um modelo matemático que realiza aproximação de funções (ou interpolação) através da combinação linear de funções de base gaussianas.. 1.1 - Objetivo O objetivo deste trabalho é realizar a identificação de um sistema bastante utilizado na indústria petrolífera, o sistema multitanques, utilizando uma rede de funções de base radial.. 1.2 - Definição do Problema A construção de um modelo neural capaz de descrever o comportamento dinâmico de um sistema não linear com múltiplas entradas e múltiplas saídas.. 1.3 - Apresentação do trabalho A dissertação está organizada da seguinte forma: No Capítulo 2 apresentamos os aspectos teóricos em duas áreas de conhecimento: identificação de sistemas e redes neurais artificiais. Traz conceitos básicos sobre identificação de sistemas, envolvendo conceitos sobre a modelagem matemática, as etapas de um processo de identificação e um algoritmo de estimação baseado no método dos mínimos quadrados. É apresentado as redes neurais de funções de base radial bem como as funções de ativações comumente utilizadas em projetos que envolvem redes neurais artificias, a topologia da rede e seu algoritmo de treinamento.. O Capítulo 3 apresenta o estado da arte com o objetivo de contextualizar a relevância do tema apresentando algumas pesquisas desenvolvidas nesta área de estudo ao longo dos anos.. No Capítulos 4 apresentamos a metodologia utilizada no uso das redes de funções de base radial na identificação de sistemas encontrados na literatura para apresentar a eficácia do algoritmo na identificação de sistemas dinâmicos de natureza não linear, bem como são apresentados resultados para a visualização de tal eficácia e o método utilizado no treinamento da rede neural.. 3 Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(18) Capítulo 1 - Introdução. No Capítulo 5 finalmente apresentamos a identificação proposta para a conclusão do trabalho, expandindo a técnica de identificação para sistemas com múltiplas entradas e múltiplas saídas e uma análise dos resultados obtidos, em seguida é apresentado o Capítulo 6 com as conclusões obtidas e perspectivas de trabalhos futuros.. 4 Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(19) Capítulo 2 Aspectos Teóricos.

(20) Capítulo 2 – Aspectos Teóricos. 2. Aspectos Teóricos Neste capítulo são apresentadas as definições básicas sobre sistemas, os aspectos teóricos de modelagem e identificação de sistemas dinâmicos, e da estimação de parâmetros, e também algumas definições básicas sobre redes neurais artificiais e alguns aspectos teóricos das redes de funções de base radial.. 2.1- Identificação de sistemas Conhecer o comportamento dinâmico do sistema é de vital importância em diversas áreas do conhecimento, dentre elas a petrolífera. Identificação de sistemas é a capacidade de se prever o comportamento dinâmico de um sistema a partir do conjunto entrada – saída. Existem diversas formas e técnicas para se obter modelos matemáticos que representem o comportamento dinâmico do sistema, uma delas é a modelagem caixa branca, em que se tem conhecimento aprofundado do sistema e das leis físicas que regem tal sistema. Em modelos obtidos sem nenhum conhecimento prévio do sistema e nenhuma equação matemática é assumida, a modelagem é caixa preta. Quando o modelo obtido não atender nenhuma técnica dos procedimentos anteriores, a modelagem é caixa cinza. A seleção de tais modelos matemáticos e ajustes de parâmetros são influenciados por diversos fatores: (i) conhecimento a priori do sistema (grau de não linearidade, atraso de transporte etc.); (ii) propriedades do modelo a ser identificado (complexidade); (iii) seleção da medida de erro a ser minimizado; (iv) presença de ruídos.. 2.1.2 - Sistemas dinâmicos Um sistema pode ser definido como, uma combinação de componentes que atuam em conjunto, onde suas variáveis internas interagem realizando um objetivo em que suas propriedades pretendem ser estudadas, produzindo sinas denominados saídas (AGUIRRE, 2007A). Colunas de destilação, vasos separadores, tanques de armazenamento, caldeiras, fornos etc., são alguns exemplos de sistemas. A Figura 2.1 ilustra a representação gráfica de um sistema sofrendo estímulos externos, denominados de entradas, produzindo uma saída em relação à entrada.. 6 Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(21) Capítulo 2 – Aspectos Teóricos. Figura 2.1. Representação gráfica de um sistema sofrendo estímulos externos.. Saída do modelo. Entradas. Planta. O sistema pode ser considerado como estático ou dinâmico. Quando o valor atual da saída do sistema y(t) depender apenas do valor atual da entrada u(t) aplicada é classificado como estático, e como sendo dinâmico quando o valor atual de sua saída y(t) depender do valor atual da entrada u(t) e também dos valores de entrada e saídas passados. O sistema pode ser classificado como linear se sua resposta, quando excitado pela combinação linear de duas entradas, for igual à combinação linear das saídas que resultam da aplicação isolada de cada entrada (AGUIRRE, 2007). Os sistemas lineares são geralmente representados por equações algébricas. Já quando o sistema não apresenta nenhuma das propriedades citadas anteriormente e o seu desempenho operacional é marcado por oscilações em sua dinâmica o sistema é dito não linear. Quando o sistema possui uma única entrada e uma única saída, o sistema é considerado como sendo monovariável. Quando possui mais de uma entrada e/ou mais de uma saída, o sistema é multivariável (AGUIRRE, 2007A). Os sinais de entrada e saída evoluem em relação do tempo, logo o sistema é dito de tempo contínuo quando suas entradas u(t) e saídas y(t) são definidas no tempo contínuo (representadas por equações diferenciais). Quando as entradas u(t) e saídas y(t) só são definidas no tempo discreto (representadas por equações à diferença), o sistema é dito de tempo discreto (AGUIRRE, 2007).. 7 Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(22) Capítulo 2 – Aspectos Teóricos. Figura 2.3. Tempo discreto. Figura 2.2. Tempo continuo 1. 1. 0.8. 0.8. 0.6. 0.6. 0.4. 0.4. 0.2. 0.2. 0. 0. -0.2. -0.2. -0.4. -0.4. -0.6. -0.6. -0.8. -0.8. -1 -0.5. -0.4. -0.3. -0.2. -0.1. 0. 0.1. 0.2. 0.3. 0.4. 0.5. -1 -0.5. -0.4. -0.3. -0.2. -0.1. 0. 0.1. 0.2. 0.3. 0.4. 0.5. Quando as características de um sistema não mudam ao longo do tempo, ou seja, sob as mesmas condições iniciais respondem da mesma maneira a um sinal de entrada, independente de quando o sinal é aplicado, o sistema é dito como invariante no tempo. Já quando suas características sofrem mudanças ao longo do tempo o sistema é variante no tempo. O sistema pode ser determinístico quando para um dado estado inicial e uma dada entrada houver apenas uma saída possível (AGUIRRE, 2007). Ou seja, o conhecimento das condições iniciais e da entrada do sistema, determina unicamente sua saída. Se as entradas e as saídas forem variáveis aleatórias o sistema pode ser considerado como sendo estocástico (AGUIRRE, 2007).. 2.1.3 - Modelagem Um modelo pode ser entendido como um conjunto de regras que descrevem o comportamento do sistema fornecendo informações de uma ou mais variáveis observadas (COELHO, 2004). Modelos podem ser mentais, gráficos, algorítmicos e matemáticos. A identificação de sistemas é a área do conhecimento que desenvolve modelos matemáticos relacionando diferentes variáveis (entrada/saída) e a determinação dos parâmetros associados ao modelo. Em outras palavras, identificar um sistema significa construir um modelo matemático que represente, o mais próximo possível, as características da dinâmica do sistema real. Através do modelo matemático obtido que represente o sistema é possível desenvolver diversos estudos como, por exemplo: análise de comportamento, e inferir propriedades dinâmicas e estatísticas do sistema real (AGUIRRE, 2007). 8 Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(23) Capítulo 2 – Aspectos Teóricos. A Figura 2.4 ilustra um problema de identificação de sistemas que consiste em ao se aplicar um conjunto de dados de entrada à técnica de identificação, as variáveis interagem internamente resultando em um modelo matemático como saída estimada.. Figura 2.4. Representação gráfica de um problema de identificação de sistemas. As etapas envolvidas para a obtenção de um modelo matemático através da identificação de sistemas são:. 1. Testes dinâmicos e coleta de dados: é necessária a obtenção de um conjunto de dados entrada/saída, que representem o comportamento dinâmico do sistema.. 2. Escolha da representação matemática a ser utilizada: se o modelo do sistema é linear ou não linear, contínuo ou discreto, etc.. 3. Determinação da estrutura do modelo: neste caso, será utilizada uma rede de funções de base radial para estrutura do modelo.. 4. Estimação de parâmetros: esta etapa começa com a escolha do algoritmo a ser utilizado.. 9 Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(24) Capítulo 2 – Aspectos Teóricos. 5. Validação do modelo: tendo sido obtido um conjunto de modelos, é necessário verificar se eles incorporam ou não as características de interesse do sistema original.. Figura 2.5. Representação gráfica das etapas envolvidas na identificação de sistemas. O processo de construção do modelo que represente um determinado sistema é definido como modelagem. Na identificação de sistemas, a modelagem consiste em determinar ou construir as equações matemáticas ou regras que melhor regem as características do sistema dinâmico (AGUIRRE, 2007B). Tais modelos obtidos podem ser definidos como sendo modelos paramétricos, quando utilizam estruturas matemáticas parametrizadas para descrever o comportamento dinâmico original no domínio do tempo. Esses parâmetros são ajustados por algoritmos de estimação a partir dos dados medidos. Os modelos não paramétricos geram modelos no domínio do tempo, porém o comportamento dinâmico do sistema é determinado através de relações entre os dados disponíveis (ex. correlação), (COELHO, 2004). Muitas são as técnicas para se obter modelos matemáticos que representem o comportamento dinâmico de um sistema; uma delas é a modelagem caixa branca, em que se tem conhecimento aprofundado do sistema e das leis físicas que regem tal sistema. Em modelos obtidos sem nenhum conhecimento prévio do sistema e onde nenhuma equação matemática é assumida, a modelagem é caixa preta. Quando o processo de modelagem não atender às técnicas anteriormente citadas, a modelagem é dita ser caixa cinza (COELHO, 2004). 10 Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(25) Capítulo 2 – Aspectos Teóricos. O tipo de problema, uso pretendido, disponibilidade e qualidade dos dados utilizados, restrições na manipulação do sistema entre outros, são alguns pré-requisitos para a escolha do modelo. Geralmente são preferíveis os modelos complexos que permitam a ampliação e a redução de forma simples. O conhecimento a priori do sistema também influencia na escolha do modelo (AGUIRRE, 2007B). Através da combinação entre conhecimento a priori, tentativa e erro e avaliação do erro entre a saída real do sistema e a saída estimada é possível selecionar a ordem do modelo. A escolha da estrutura e complexidade do modelo é normalmente feita por tentativa e erro, manualmente.. 2.1.4 - Estimação de parâmetros A estimação de parâmetros é uma das principais etapas envolvidas no processo de identificação de sistemas. Essa etapa ocorre logo após a modelagem, determinando as constantes matemáticas presentes nas equações que descrevem o sistema (AGUIRRE, 2007 B). A evolução da entrada e saída é levada em conta na estimação de parâmetros. Logo, as informações usadas vêm na forma de sinais obtidos do sistema dinâmico. Esses sinais podem passar por um pré-processamento como uma filtragem ou remoção de ruídos, antes de serem utilizados para a determinação dos parâmetros desconhecidos do modelo (AGUIRRE, 2007). Adicionar uma regra que traduz os critérios a serem observados na semelhança entre o modelo e o sistema real, é necessária para encontrar os parâmetros da equação que descreve o modelo. Basicamente consiste na sintetização de um critério de desempenho ou uma função custo, geralmente minimizada. Um critério bastante utilizado nessa etapa é o erro médio quadrático entre as amostras e o valor apresentado pelo modelo, como exemplo podemos citar o método dos mínimos quadrados (AGUIRRE, 2007 B).. 2.1.5 - Estimador dos mínimos quadrados Em geral, no problema de mínimos quadrados a saída do modelo 𝑦 é dada por uma expressão linearmente parametrizada (AGUIRRE, 2007).. 𝑦 = 𝜃1 𝑓1 (𝒖) + 𝜃2 𝑓2 (𝒖) + ⋯ + 𝜃𝑛 𝑓𝑛 (𝒖). (2.1). 11 Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(26) Capítulo 2 – Aspectos Teóricos. em que 𝒖 = [𝑢1 , ⋯ , 𝑢𝒎 ]𝑻 é o vetor de entradas, 𝑓1 , ⋯ , 𝑓𝑛 são funções desconhecidas de 𝒖 , e 𝜃1 , ⋯ , 𝜃𝑛 são os parâmetros desconhecidos a serem estimados (AGUIRRE, 2007). Em estatística, este modelo é conhecido como modelo de regressão linear. Para identificar os parâmetros desconhecidos 𝜃𝑖 , usualmente fazemos experimentos para obtermos o conjunto de dados de treinamento composto pelo par {(𝑢𝑖 ; 𝑦𝑖 ), 𝑖 = 1, ⋯ , 𝑚} que representam o conjunto entrada / saída do sistema a ser identificado. Substituindo cada par de dados na equação (2.2) temos o seguinte sistema de equações lineares: 𝑓1 (𝒖1 )𝜃1 + 𝑓2 (𝒖1 )𝜃2 + ⋯ + 𝑓1 (𝒖1 )𝜃𝑛 = 𝑦1 𝑓1 (𝒖2 )𝜃1 + 𝑓2 (𝒖2 )𝜃2 + ⋯ + 𝑓1 (𝒖2 )𝜃𝑛 = 𝑦2 𝑓1 (𝒖3 )𝜃1 + 𝑓2 (𝒖3 )𝜃2 + ⋯ + 𝑓1 (𝒖3 )𝜃1 = 𝑦3 ⋮ (𝒖 )𝜃 (𝒖 )𝜃 {𝑓1 𝑚 1 + 𝑓2 𝑚 2 + ⋯ + 𝑓1 (𝒖𝑚 )𝜃1 = 𝑦𝑚. (2.2). Utilizando a relação matricial, temos: (2.3). 𝑨𝜽 = 𝒚. em que 𝑨 é uma matriz 𝑚 𝑥 𝑛. 𝑓1 (𝒖1 ) ⋯ ⋱ 𝑨= [ ⋮ 𝑓1 (𝒖𝑚 ) ⋯. 𝑓𝑛 (𝒖1 ) ⋮ ] 𝑓𝑛 (𝒖𝑚 ). 𝜽 é um vetor 𝑛 𝑥 1 de parâmetros desconhecidos: 𝜃1 𝜽= [ ⋮] 𝜃𝑛 e 𝒚 é um vetor 𝑚 𝑥 1,. 12 Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(27) Capítulo 2 – Aspectos Teóricos. 𝑦1 𝒚= [ ⋮ ] 𝑦𝑚 Se 𝑨 for uma matriz quadrada e não singular (invertível), podemos obter 𝜽 através da seguinte expressão: 𝑨𝜽 = 𝒚 𝑨−1 𝑨𝜽 = 𝑨−1 𝒚. (2.4). 𝜽 = 𝑨−1 𝒚 No entanto, como geralmente 𝑨 é uma matriz não quadrada (𝑚 ≠ 𝑛) então encontrar ̂ através da minimização do erro a solução da Equação (2.3), equivalente a aproximar 𝜽 ≅ 𝜽 médio quadrático definido por: 𝑚. 𝐸(𝜽) = ∑(𝑦𝑖 − 𝑎𝑖𝑇 𝜃)2 = 𝒆𝑇 𝒆 = (𝒚 − 𝑨𝜽)𝑇 (𝒚 − 𝑨𝜽). (2.5). 𝑖=1. em que 𝒆 = 𝒚 − 𝑨𝜽 é o vetor erro produzido pela escolha do parâmetro 𝜽. O erro médio ̂ , e o método é chamado de estimador quadrático da equação (2.5) é minimizado quando 𝜽 = 𝜽 de mínimos quadrados – LSE, que satisfaz a equação normal: ̂ = 𝑨𝑇 𝒚 𝑨𝑇 𝑨𝜽. (2.6). ̂ é única, ou seja: Se 𝑨𝑇 𝑨 é não singular, então a solução da equação normal para 𝜽 ̂ = (𝑨𝑇 𝑨)−1 𝑨𝑇 𝒚 𝜽. (2.7). 13 Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(28) Capítulo 2 – Aspectos Teóricos. 2.2 - Redes de funções de base radial Redes de funções de base radial é um tipo de rede neural artificial bastante utilizada na teoria de aproximação de funções. Esse tipo de rede possui apenas uma única camada oculta, diferentemente das redes de múltiplas camadas, onde o processamento dos dados é realizado o seu treinamento é baseado no método dos mínimos quadrados.. 2.2.1 - Redes Neurais Artificiais O cérebro humano é composto por bilhões de neurônios. Os neurônios são células formadas por corpo, dendritos e axônios. Os dendritos são responsáveis por captar os estímulos e os transmitir ao corpo dos neurônios onde são processados. A conexão entre um axônio de um neurônio e um dendrito de outro é denominada sinapse. A sinapse é a unidade funcional básica envolvendo as membranas plasmáticas de dois neurônios, de modo a formar uma junção pontual (o tamanho de uma junção sináptica é menor do que 1 mm) e orientada do neurônio pré-sináptico para o pós-sináptico (KHANNA, 1990). Buscando um modelo computacional que representasse o funcionamento do cérebro, em 1943 McCulloch e Pitts desenvolveram um modelo matemático que resultaria na concepção de neurônio artificial (HAYKIN, 2009). O modelo matemático de um neurônio artificial é ilustrado na Figura 2.6, onde são observados os elementos básicos que compõe um neurônio:. Figura 2.6. Neurônio artificial. . Pesos sinápticos – estrutura que une os neurônios, formando as RNAs e tem capacidade de controlar os impulsos propagados na rede. 14. Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(29) Capítulo 2 – Aspectos Teóricos. . Somador – combinador linear responsável pela adição dos sinais de entrada ponderados pelos pesos sinápticos.. . Função de ativação – define o valor da saída do neurônio.. Existem alguns tipos de funções de ativação bastante utilizadas para definir as saídas da RNA. São elas: 1. Função limiar, que segundo Haykin (2009) descreve a propriedade do modelo neuronal de McCulloch e Pitts.. Figura 2.7. Função limiar. 1. 0.8. 0.6. 0.4. 0.2. 0. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 2. Função linear, onde a saída linear para os dados de entrada é definida por um valor real. Figura 2.8. Função linear. 6. 4. 2. 0. -2. -4. -6 -3. -2. -1. 0. 1. 2. 3. 15 Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(30) Capítulo 2 – Aspectos Teóricos. 3. Função sigmóide, em forma de ‘s’, essa função de ativação é a mais utilizada na teoria de RNAs. Apresenta um balanceamento entre o comportamento linear e não linear (HAYKIN, 2009). Ela é ilustrada na figura como uma tangente sigmóide.. Figura 2.9. Função sigmoide 1. 0.8. 0.6. 0.4. 0.2. 0. -0.2. -0.4. -0.6. -0.8. -1 -3. -2. -1. 0. 1. 2. 3. 4. Função gaussiana usada principalmente em RNAs de base radial. Função de ativação bastante utilizada na aproximação de funções através do mapeamento dos dados para um espaço de alta dimensionalidade.. Figura 2.10. Função gaussiana 1. 0.9. 0.8. 0.7. 0.6. 0.5. 0.4. 0.3. 0.2. 0.1. 0 -3. -2. -1. 0. 1. 2. 3. O neurônio artificial é uma estrutura com capacidade de processar informações, o que é de fundamental importância no funcionamento da rede neural (HAYKIN, 2001). As. 16 Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(31) Capítulo 2 – Aspectos Teóricos. combinações de diversos neurônios artificiais feita pela conexão entre os pesos sinápticos formam uma rede neural artificial. Segundo Haykin (2009), uma Rede Neural Artificial (RNA) é um processador maciçamente paralelamente distribuído constituído de unidades de processamento simples, que têm a propensão natural para armazenar conhecimento experimental e torna-lo disponível para uso. A semelhança da rede neural com o cérebro humano se dá em dois aspectos: o conhecimento é adquirido pela rede a partir de seu ambiente através de um processador de aprendizagem. E, forças de conexão entre neurônios, conhecidas como pesos sinápticos, são utilizadas para armazenar o conhecimento adquirido. As RNAs apresentam potencialidades que podem ser aplicadas à identificação de sistemas, modelagem, reconhecimento de padrões, processamento de sinais, entre outros. Haykin (2001) aborda as características das RNAs como: . Processamento paralelo inspirado no comportamento do cérebro humano, logo as informações não são buscadas sequencialmente.. . Aprendizagem, capacidade que a rede tem de aprender determinado conhecimento através de suas iterações sem necessariamente explicitar o algoritmo para executar determinada tarefa.. . Associação, característica que permite que a rede associe diferentes padrões em seu treinamento.. . Generalização, habilidade da RNA em lidar com dados não lineares e responder satisfatoriamente a um sinal de entrada nunca visto anteriormente, apenas pela similaridade dos dados já apresentados.. . Abstração, capacidade de a rede abstrair informações a partir de um conjunto de entradas.. . Tolerância à falha, o que permite que a rede continue apresentando resultados satisfatórios em caso de falha em algum neurônio.. . Robustez, o que faz com que mesmo perdendo elementos de processamento a rede não funcione inapropriadamente e sim continue seu processamento.. Segundo Sjoberg (1995), as características das RNAs as tornam potencialmente aplicáveis a problemas como: classificação de padrões, identificação, diagnóstico, processamento de sinais e de imagens, otimização e controle.. 17 Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(32) Capítulo 2 – Aspectos Teóricos. A arquitetura de uma RNA é basicamente organizada em camadas, que podem estrar interligadas ou não ás camadas posteriores. Geralmente essas camadas são divididas da seguinte maneira: . Camada de entrada – os padrões são apresentados à rede;. . Camadas ocultas – onde é realizado a maior do processamento de dados através das conexões ponderadas;. . Camada de saída – onde o resultado é concluído e apresentado.. Uma RNA pode ser considerada como perceptron de camada única ou perceptron de múltiplas camadas. Em 1958, Rosemblat desenvolveu seu modelo de perceptron, e definia o perceptron como sendo um único neurônio com sinapses ajustáveis e bias. Segundo Haykin (2001) o perceptron é a forma mais simples de uma rede neural. Basicamente a topologia de um peceptron de única camada é composta por três níveis, porem são definidas como de uma única camada pois o processamento de dados ocorre basicamente em uma única camada, na saída da rede. Já o perceptron de múltiplas camadas é a forma mais complexa das RNAs, uma vez que apresentam duas ou mais camadas que realizam o processamento dos dados, ou seja, o sinal de entrada se propaga para frente camada por camada até que a camada de saída conclua o processamento e mostre o resultado (BRAGA et al., 2000). Uma etapa bastante importante no funcionamento de uma RNA é a fase de aprendizado, onde a rede aprende a partir de iterações e ajusta seus pesos sinápticos para obter o melhor resultado possível. Para que o processo de aprendizagem seja realizado é necessário utilizar uma ferramenta denominada de algoritmo de aprendizagem, que tem a função de modificar os pesos sinápticos da rede para alcançar um determinado objetivo (BRAGA et al., 2000). As RNAs também podem ser classificadas de acordo com o seu aprendizado como redes supervisionadas, quando há participação auxiliar de um supervisor, e redes não supervisionadas quando a rede trabalha sem nenhuma interferência humana apenas com os dados apresentados à rede.. 2.2.2 - Redes de funções de base radial As redes de funções de base radial (RBF) são redes formadas por neurônios seletivos ou neurônios com função de ativação de base radial local. Com um processo de treinamento. 18 Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(33) Capítulo 2 – Aspectos Teóricos. bastante simples e uma boa eficiência computacional essas redes têm ganhado uma significativa posição no campo das redes neurais artificiais (HAYKIN, 2009). As redes RBF são consideradas aproximadores universais de funções. A teoria de aproximação de funções consiste em aproximar (identificar) uma função y(.) por uma função aproximada 𝑓̂ (w,u), dado um número fixo de parâmetros w e de entradas u, em que u e w são vetores. Sendo assim tem-se dois aspectos importantes a serem definidos: a função aproximada 𝑓̂ (.) e o vetor de parâmetros w. Escolhida uma função 𝑓̂ (.) específica, o problema se reduz a determinação do vetor de parâmetros w que oferecem a melhor aproximação da função y(.) para o conjunto de dados de entrada u. Redes RBF realizam o aprendizado supervisionado e são constituídas de várias camadas, que desempenham papeis diferentes. Em sua topologia mais básica a camada de entrada conecta a RBF ao ambiente; sua camada oculta, aplica uma transformação não linear dos dados de entrada mapeando-os para um espaço de alta dimensionalidade; E a sua camada de saída é responsável por aplicar uma transformação linear nos dados, gerando a saída da rede (HAYKIN, 2009). A Figura 2.11 mostra a arquitetura de uma RBF:. Figura 2.11. Arquitetura de uma RBF com uma única camada oculta. As variáveis x1, x2, ..., xn são os dados de entrada, 𝜙1 , 𝜙2 , … , 𝜙𝑖 as funções de base e w1, w2, ..,wi os parâmetros do modelo e na saída da rede uma função estimada 𝑓̂(𝒘, 𝐱). Em rede de funções de base radial, aprender é encontrar uma superfície em um espaço multidimensional, que forneça o melhor ajuste para os dados de treinamento. Correspondentemente, generalizar os dados é fazer uso dessas superfícies multidimensionais. 19 Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(34) Capítulo 2 – Aspectos Teóricos. para interpolar os dados, onde a camada oculta fornece um conjunto de funções que constituem uma base arbitrária para os padrões de entrada. Uma função de base radial bastante utilizada na teoria de aproximação de funções é a função gaussiana (Figura 2.12):. Figura 2.12. Função gaussiana Função de Base Radial 1. 0.9. 0.8. 0.7. Saída a. 0.6. 0.5. 0.4. 0.3. 0.2. 0.1. 0 -3. -2. -1. 0 Entrada p. 1. 2. 3. E expressa pela Equação (2.8):. ∅(𝑟) = 𝑔(𝑟) = exp (−. 𝑟2 ) 2𝜎 2. (2.8). Na função o 𝑟 2 define a norma euclidiana e o parâmetro 𝜎 define a largura da função gaussiana, ou seja, define a distância euclidiana média que mede o espalhamento dos dados de entrada em torno do seu centro c (HAYKIN, 2001). Essas redes realizam um mapeamento não linear dos dados de entrada para um espaço oculto (camada oculta) de alta dimensionalidade, posteriormente um mapeamento linear do espaço oculto para a saída da rede (HAYKIN, 2001). Uma RBF pode aproximar qualquer função através da combinação linear de funções gaussianas com centros em diferentes pontos escolhidos aleatoriamente do espaço de entrada conforme podemos observar na Figura 2.13, no exemplo apresentando três funções de base radial (em azul) que são ponderadas em amplitude pelos pesos sinápticos e em seguidas somadas para produzir na saída uma função aproximada (em vermelho). 20 Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(35) Capítulo 2 – Aspectos Teóricos. Figura 2.13. Soma ponderada de funções de base radial do tipo gaussiana.. As redes de funções de base radial surgiram de um problema de interpolação exata. A partir de um conjunto de dados para treinamento, necessita-se estimar uma função 𝑓̂ o mais próxima possível da função objetivo utilizando uma rede RBF. Considerando um modelo de regressão linear para aproximar uma função f através de: 𝑓(. ) ≅ 𝑓̂(𝐱, 𝐰) = 𝑤0 + 𝑤1 𝑥1 + ⋯ + 𝑤𝑛 𝑥𝑛. (2.9). Em que 𝑓̂ representa a função aproximada, 𝒙 = [𝑥1 , ⋯ , 𝑥𝑛 ]𝑇 o vetor de entrada e 𝒘 = [𝑤1 , ⋯ , 𝑤𝑛 ]𝑇 o vetor de parâmetros do modelo. Podemos observar a partir desse que o fato do mesmo ser linear para as variáveis de entrada impõe certa restrição ao modelo (o sistema de multitanques é não linear). Com a obtenção do vetor de treinamento a rede está apta para realizar testes onde sua saída será comparada com a saída real do sistema para ser analisada o quanto essa saída estimada se aproxima das características do sistema real. A Figura 2.14, ilustra como esse processo de identificação utilizando uma RBF será realizado.. 21 Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(36) Capítulo 2 – Aspectos Teóricos. Figura 2.14. Estrutura implementada para identificação utilizando rede RBF. Na figura acima pode-se observar que a planta ao ser excitada por um sinal u(t) produz uma saída y(t) em função da entrada. Esse mesmo sinal utilizado para excitar a planta será aplicado na técnica de identificação que também irá produzir uma saída yˆ em função do sinal de entrada aplicado. Essa saída estimada pela RBF será comparada com a saída real do sistema. A diferença das saídas gera um erro o qual deve ser o menor possível. O erro obtido é utilizado para reajustar os parâmetros da rede e dessa forma com os parâmetros ajustados, o que significa que, quanto menor o erro da rede RBF, um modelo mais próximo possível do sistema real é obtido.. 22 Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(37) Capítulo 3 Estado da Arte.

(38) Capítulo 3 – Estado da Arte. 3. Estado da Arte Existem diversos estudos relacionados à identificação de sistemas não lineares em engenharia, principalmente na área petrolífera. A literatura aponta várias pesquisas quanto à utilização de redes neurais artificias e outros sistemas inteligentes em aplicações vinculadas a identificação de sistemas. Uma das principais citações sobre a identificação de sistemas não lineares, no caso específico dos modelos de Hammerstein, foi atribuída a Narendra e Gallman em 1966. Uma boa abordagem dos modelos de Volterra, Wiener e Hammerstein aplicados à identificação de sistemas podem ser encontradas em Billings, 1980. Recentemente o uso de modelos de Hammerstein e Wiener têm atraído a atenção de vários pesquisadores (Greblicki, 1992, 1996; Wigren, 1993; Pawlwk, 1994). Em 1993, Wigren desenvolveu um algoritmo para a estimação recursiva de modelos Wiener. Tan et al., (1995) utilizaram uma estrutura de RBF (Radial Basis Function) com algoritmos k-médias e LMS, para identificação de um sistema não linear, multivariável (MIMO (Multi Inputs Multi Outputs) e BIBO (Bounded Input Bounded Output) com um modelo ARMA (Autoregressive Moving Average Model Structure). Yu et al., (2000) realizaram a identificação de um sistema MIMO (Multiple Inputs, Multiple Outputs) e MISO (Multi Inputs and Single Outputs) utilizando a RBF com algoritmos k-médias e OLS (Orthogonal Least Square) com modelos NARX (Non-linear Autoregressive model structure with exogenous inputs), NARMAX (Non-linear Autoregressive Moving Average model structure with exogenous inputs) e ARX (Autoregressive model structure with exogenous inputs). Em 2001, Ljung, propôs estruturas de redes de Walvelets, RBF, B-spline e Fuzzy para a identificação de um modelo MIMO do tipo caixa preta, sendo estes modelos um linear ARMAX (Autoregressive Moving Average model structure with exogenous inputs), e de espaço de estados ARX, OE (Output Error model), e BJ (Box-Jenkins model structure). Uma rede neural RBF, com algoritmo de treinamento o método dos mínimos quadrados ortogonais, foi utilizada na identificação de falhas em uma linha de transmissão elétrica. Nesse estudo Lin et al. (2001) aborda o uso da RBF em simulações que demonstraram resultados satisfatórios com a rede de convergência rápida e capaz de detectar falhas em um curto espaço de tempo podendo ser usada, em alguns casos, em tempo real. 24 Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(39) Capítulo 3 – Estado da Arte. Em 2002, uma comparação do desempenho entre as redes neurais MLP (Multi Layer Perceptron) e RBF foi realizada por Park et al. As redes foram utilizadas na identificação de um sistema dinâmico não linear e os experimentos demonstraram que a RBF converge mais rápido e necessita de menos memória que a MLP. Peng et al. (2003), utilizaram a estrutura da RBF com os algoritmos LM (LevenbergMarquardt), LMS (Least Mean Square), BFGS (Broyden-Fletcher-Goldfarb-Shanno), McLoone e GN (Gauss-Newton) para a identificação de um sistema não linear utilizando modelos AR (Auto Regressive) e ARX para um sistema de decomposição de óxido de nitrogênio de uma planta química. Dudul (2004) utilizou uma estrutura da MLP e RBF na identificação do sistema caótico de Lorenz, com os algoritmos LM, método de quase-Newton, BP (Back Propagation) e Lyapunov, utilizando modelos AR, ARMA, FIR (Finite Impulse Response), ARX, NNARX (Neural Network Autoregressive) e NNARMA (Neural Network Autoregressive moving Average). Também em 2004 Mashor, utilizou estruturas HMLP (Hybrid Multilayered Perceptron), MLP e RBF com os algoritmos BP, k-médias adaptativo para a identificação não linear de um modelo NARMAX na aplicação de dois sistemas não lineares. Em 2007 Linhares et al; apresentaram a aplicação de redes neurais artificiais de múltiplas camadas na indústria de processos químicos. O sistema identificado foi uma coluna debutanizadora de GLP (gás liquefeito), que tem a função de separar o GLP da gasolina natural. A estrutura de identificação utilizada no processo foi uma NNARX. Os resultados obtidos comprovaram a funcionalidade da técnica aplicada. Rêgo (2010) descreveu a utilização de uma ferramenta matemática na solução de problemas decorrentes na teoria de controle, incluindo a identificação, a análise do retrato de fase e a estabilidade, bem como a evolução temporal da planta de corrente do motor de indução. A ferramenta computacional utilizada na identificação e análise do sistema dinâmico não linear, foi uma rede neural artificial do tipo funções de base radial (RBF). Rebouças (2011) utilizou redes neurais artificiais treinadas em modo offline pelo software matemático Matlab®, para detecção e diagnóstico de falhas de um sistema de tanques acoplados em que o conjunto de dados das falhas foi gerado computacionalmente, bem como os resultados coletados a partir de simulações numéricas do modelo do processo, não havendo risco de dano aos equipamentos.. 25 Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(40) Capítulo 3 – Estado da Arte. Diversos tipos de redes neurais artificiais são utilizadas em identificação de sistemas, uma rede que tem se destacado bastante nesse processo é a rede neural Wavelet (Wavelet Neural Network - WNN). Em 2013 Araújo Júnior realizou a identificação de um sistema não linear simulado que representa o mecanismo dinâmico de um joelho humano utilizando redes neurais Wavelet. Tal sistema possui não linearidades bastante acentuadas. Os resultados obtidos com a WNN foram comparados com resultados obtidos através de uma rede neural clássica, redes MLP e tais resultados mostraram que a WNN apresentou um desempenho satisfatório e um erro médio quadrático menor que o obtido pela MLP. Em 2014, Araújo Júnior, utilizou uma rede neural Wavelet modificada para a identificação de dois sistemas simulados encontrados na literatura e um sistema real não linear, que consiste de um tanque de multisseções. É possível encontrar na literatura diversos trabalhos que aplicam as redes RBF na identificação de sistemas, como em Folland (2004), que na identificação de sons da respiração humana realizou uma comparação entre as redes CPNN (Constructive Probabilistic Neural Network) e RBF. Em Yates (2005) que utilizou a RBF na identificação de sistemas de uma colônia de bactérias. Rocha (2006), abordando a identificação de sistemas não lineares usando redes neurais MLP e RBF. Panigrahi (2006) utilizou uma rede RBF integrada com um sistema de ruído para identificação spoiled beef. As pesquisas utilizando RNA’S são de grande interesse e têm sido bastante utilizadas para identificação de sistemas de qualquer complexidade e tipo. Dentre os inúmeros tipos de RNA’s, as redes de funções de base radial têm se destacado na identificação de sistemas. Muitas são as aplicações utilizando as redes neurais bem como inúmeros algoritmos são desenvolvidos ou melhorados de acordo com cada aplicação. Neste trabalho a rede neural do tipo RBF será utilizada na identificação de um sistema dinâmico multivariável, o processo de cinco tanques acoplados, tendo como algoritmo de treinamento o método dos mínimos quadrados.. 26 Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(41) Capítulo 4 Metodologia.

(42) Capítulo 4 – Metodologia. 4. Metodologia Identificando uma relação entre entrada / saída de um sistema ou descobrindo uma lei evolucionária de um sinal baseado em observações, e aplicando-a na construção de modelos matemáticos para predição, controle ou extração de informações constitui um problema que vem chamando a atenção na Engenharia e ganhando importância em diversas áreas, tais como: Economia, Biologia, Medicina e muitas outras áreas do conhecimento. Nos últimos anos, pesquisas relacionadas aparecem com diferentes termos, tal como análise de séries temporais, processamento de sinais e identificação de sistemas. A identificação de sistemas é uma técnica que pode ser utilizada para inferir e construir modelos para um sistema a partir de dados experimentais. Os sistemas podem ser lineares ou não lineares, variantes ou invariantes, contínuos ou discretos no tempo, etc. E podem ser classificados baseados nestas categorias. Dentre tais modelos temos alguns que são utilizados para descrever os sistemas lineares, tais como: AR – Autoregressivo, ARMA – Autoregressivo com Média Móvel, ARX – Autoregressivo com Entradas Externas e, ARMAX – Modelo Autoregressivo com Média Móvel e Entradas Externas, esses modelos são comumente utilizados na identificação de sistemas lineares (Aguirre,2007). Para modelos não lineares adota-se o NARMAX – Modelo Não linear Autoregressivo com Média Móvel e Entradas Externas, onde os modelos NAR e NARX não lineares são um caso particular, tais modelos são os mais populares em identificação de sistemas no domínio de tempo discreto.. 4.1 – Representações lineares Existem inúmeras técnicas de identificação de tais sistemas conforme pode ser visto em Box e Jenkins, 1970; Norton, 1986; Södeströn e Stoica, 1989; Johansson,1993. Seguindo a notação tradicional adotada por (Södeströn e Stoica, 1989), temos o modelo geral para sistemas lineares de ordem finita dado por:. 𝐴(𝑧. −1 )𝑦(𝑘). 𝐵(𝑧 −1 ) 𝐶(𝑧 −1 ) = 𝑢(𝑘) + 𝜀(𝑘) 𝐹(𝑧 −1 ) 𝐷(𝑧 −1 ). (4.1). 28 Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(43) Capítulo 4 – Metodologia. em que. 𝐴(𝑧 −1 ) = 1 + 𝑎1 𝑧 −1 + ⋯ + 𝑎𝑛𝑎 𝑧 −𝑛𝑎 𝐵(𝑧 −1 ) = 𝑏1 𝑧 −1 + ⋯ + 𝑏𝑛𝑏 𝑧 −𝑛𝑏 𝐶(𝑧 −1 ) = 1 + 𝑐1 𝑧 −1 + ⋯ + 𝑐𝑛𝑐 𝑧 −𝑛𝑐. (4.2). 𝐷(𝑧 −1 ) = 1 + 𝑑1 𝑧 −1 + ⋯ + 𝑑𝑛𝑑 𝑧 −𝑛𝑑 𝐹(𝑧 −1 ) = 1 + 𝑓1 𝑧 −1 + ⋯ + 𝑓𝑛𝑓 𝑧 −𝑛𝑓 {𝑦(𝑘)} e {𝑢(𝑘)}, (𝑘 = 1,2, … ) são a saída e entrada, respectivamente; 𝑛𝑎 , 𝑛𝑏 , 𝑛𝑐 , 𝑛𝑑 , 𝑛𝑒 𝑒 𝑛𝑓 indicam a ordem polinomial, geralmente referidas como a ordem do modelo; {𝜀(𝑘)} é o ruído e geralmente assumido como sendo independente com média nula e variância finita. O símbolo 𝑧 −1 denota o operador atraso unitário. Ex: 𝑧 −1 𝑥(𝑘) = 𝑥(𝑘 − 1).. Na Equação (4.1), se. 𝐴(𝑧 −1 ) = 1, 𝐹(𝑧 −1 ) = 1 𝑒 𝐶(𝑧 −1 ) = 0, considerando 𝑛𝑎 = 𝑛𝑦 , 𝑒 𝑛𝑏 = 𝑛𝑢 podemos escrever alguns modelos dinâmicos, entre eles o denominado de modelo FIR – Resposta Finita ao Impulso. Ou seja, 𝑦(𝑘) = 𝑏1 𝑢(𝑘 − 1) + 𝑏2 𝑢(𝑘 − 2) + ⋯ + 𝑏𝑛𝑢 𝑢(𝑘 − 𝑛𝑢 ). (4.3). sendo a saída uma combinação linear das entradas defasadas em 𝑛𝑢 amostras no tempo discreto.. 4.1.1- Modelo AR Se 𝐵(𝑧 −1 ) = 0, 𝐶(𝑧 −1 ) = 𝐷(𝑧 −1 ) = 1, o modelo da Equação (4.1) é denominado de modelo Autoregressivo. 𝑦(𝑘) + 𝑎1 𝑦(𝑘 − 1) + 𝑎2 𝑦(𝑘 − 2) + ⋯ + 𝑎𝑛𝑦 𝑦(𝑘 − 𝑛𝑦 ) = 𝜀(𝑘). (4.4). O modelo autoregressivo especifica que a variável de saída depende linearmente de seus próprios valores anteriores.. 29 Brenna Karolyna dos Santos Silva – Fevereiro 2016.

(44) Capítulo 4 – Metodologia. 4.1.2 - Autoregressivo com média móvel Fazendo 𝐵(𝑧 −1 ) = 0, 𝐷(𝑧 −1 ) = 1, na Equação (4.1) teremos o modelo ARMA,. 𝑦(𝑘) + 𝑎1 𝑦(𝑘 − 1) + ⋯ + 𝑎𝑛𝑦 𝑦(𝑘 − 𝑛𝑦 ). (4.5). = 𝜀(𝑘) + 𝑐1 𝜀(𝑘 − 1) + ⋯ + 𝑐𝑛𝑐 𝜀(𝑘 − 𝑛𝑐 ) O modelo ARMA é formado de duas partes, uma parte autoregressiva (AR) e outra de média móvel (MA).. 4.1.3 – Autoregressivo com Entradas Externas Admitindo 𝐶(𝑧 −1 ) = 𝐷(𝑧 −1 ) = 𝐹(𝑧 −1 ) = 1, na Equação (4.1) teremos o modelo ARX, 𝑦(𝑘) + 𝑎1 𝑦(𝑘 − 1) + ⋯ + 𝑎𝑛𝑦 𝑦(𝑘 − 𝑛𝑦 ) = 𝑏1 𝑢(𝑘 − 1) + ⋯ + 𝑏𝑛𝑢 𝑢(𝑘 − 𝑛𝑢 ) + 𝜀(𝑘). (4.5). Onde 𝑛𝑢 𝑒 𝑛𝑦 são os valores inteiros que descrevem o número de exemplos anteriores dos sinais 𝑢 e 𝑦 que são necessários para predizer a próxima saída.. 4.1.4 – Modelo Autoregressivo com Média Móvel e Entradas Externas Admitindo-se que na Equação (5.1) 𝐷(𝑧 −1 ) = 𝐹(𝑧 −1 ) = 1, temos então o modelo ARMAX, dado por, 𝑦(𝑘) + 𝑎1 𝑦(𝑘 − 1) + ⋯ + 𝑎𝑛𝑦 𝑦(𝑘 − 𝑛𝑦 ) = 𝑏1 𝑢(𝑘 − 1) + ⋯ + 𝑏𝑛𝑢 𝑢(𝑘 − 𝑛𝑢 ). (4.6). +𝜀(𝑘) + 𝑐1 𝜀(𝑘 − 1) + ⋯ + 𝑐𝑛𝑐 𝜀(𝑘 − 𝑛𝑐 ) Geralmente os modelos mais utilizados para estimação de parâmetros em modelos lineares são os modelos ARX e ARMAX, utilizando o método dos mínimos quadrados.. 30 Brenna Karolyna dos Santos Silva – Fevereiro 2016.