Controle preditivo baseado em rede de modelos lineares locais aplicado a um reator de neutralização

(1)

Controle preditivo baseado em rede de modelos lineares

locais aplicado a um reator de neutralização

Dissertação de Mestrado apresentada à Faculdade de Engenharia Química da Universidade Estadual de Campinas, como parte dos requisitos para obtenção do título de Mestre em Engenharia Química.

Área de concentração: Sistemas de Processos Quími-cos e Informática.

Orientador: Prof. Dr. Flávio Vasconcelos da Silva Co-orientador: Profª. Drª. Ana Maria Frattini Fileti

Campinas, SP Agosto de 2010

(2)

Costa, Thiago Vaz da

C823c Controle preditivo baseado em rede de modelos

lineares locais aplicado a um reator de neutralização / Thiago Vaz da Costa. –Campinas, SP: [s.n.], 2010.

Orientadores: Flávio Vasconcelos da Silva, Ana Maria Frattini Fileti.

Dissertação de Mestrado - Universidade Estadual de Campinas, Faculdade de Engenharia Química.

1. Controle preditivo. 2. Identificação de sistemas. 3. Controle de processos químicos. 4. Automação. I. Silva, Flávio Vasconcelos da. II. Fileti, Ana Maria Frattini. III. Universidade Estadual de Campinas. Faculdade de Engenharia Química. IV. Título.

Título em Inglês: Predictive control based on local linear model networks applied to a

neutralization reactor

Palavras-chave em Inglês: Predictive control, System identification, Chemical process

control, Automation

Área de concentração: Sistemas de Processos Químicos e Informática

Titulação: Mestre em Engenharia Química

Banca Examinadora: Luís Cláudio Oliveira Lopes, Antônio José Gonçalves da Cruz

Data da defesa: 26/08/2010

Programa de Pós Graduação: Engenharia Química

(3)

(4)

(5)

Uma malha de controle com baixo desempenho implica em um aumento dos custos de produção, causando descarte de produto fora da especificação e desgaste desnecessário dos elementos finais de controle. A depender do processo controlado, uma malha deficiente pode também acarretar em paradas não previstas na planta e até mesmo em danos ao meio ambiente. Diante do exposto, o controle preditivo baseado em modelos (MPC) é um dos poucos algoritmos comprovadamente capazes de estabilizar processos na presença de não-linearidades e restrições. Para atender aos seus objetivos de controle, o algoritmo clássico MPC utiliza um procedimento de otimização baseado no modelo linear da planta. Contudo, o afastamento da região de projeto do modelo linear resulta na perda de sua efetividade e consequente do controlador que o utiliza. Deste modo, objetivou-se a partir de uma descrição não-linear do sistema a melhoria do desempenho do controlador. Os objetivos específicos dessa dissertação foram o estudo e análise de um controlador GPC (generalized predictive controller) operando em paralelo com uma rede de modelos lineares locais, identificada por meio do algoritmo LOLIMOT (local linear model trees), capaz de adequar o modelo de predição do controlador para a faixa de operação atual do processo. Para a avaliação e análise da qualidade do controlador proposto foi montado um aparato experimental para controle de pH. A estratégia de controle foi implementada em um sistema em código aberto para monitoramento e controle do processo. Portanto, considerando a característica estática não-linear do processo foram realizados estudos comparativos entre o GPC tradicional (baseado em um único modelo linear) e a abordagem proposta. Os resultados mostraram que a rede foi capaz de representar satisfatoriamente a saída do sistema, resultando em uma estrutura simples, com modelos locais na forma de estruturas ARX. Também foi demonstrado que o GPC utilizando a rede de modelos lineares locais desempenhou de forma satisfatória e até mesmo superior ao GPC tradicional.Observou-se que a saída calculada pelo controlador proposto foi consideravelmente menos agressiva que o controlador tradicional, levando a uma considerável diminuição do esforço de controle empregado ao sistema. Os resultados obtidos demonstraram que houve uma economia de até 45% no esforço de controle. Observou-se ainda que o sistema desenvolvido é conveniente para aplicações reais, já que a estratégia de controle preditivo concebida em Scilab obteve sucesso na solução do problema de controle dentro do intervalo de amostragem inclusive quando incorporado o problema QP (programação quadrática) com restrições. Tendo em vista que a estrutura destes sistemas permite que sejam utilizados nas mesmas aplicações destinadas a modelos lineares, comprovou-se também a viabilidade e aplicabilidade do uso das redes de modelos lineares locais diretamente em algoritmos de controle avançado já disponíveis para indústria, como nos controladores GPC.

Palavras-chave: controle preditivo; identificação de sistemas; controle de processos químicos; auto-mação.

(6)

Low performance control loops imply in higher production costs, leading to off-specification production loss and unnecessary wear of the final control elements. Depending on the controlled process, the deficient loop can also lead to non-expected plant stops and even on environment damage. In this sense, model predictive control (MPC) is one of the few algorithms proved capable to stabilize processes in the presence of nonlinearities and constraints. To meet its control objectives, the classic MPC algorithm is based on an optimization problem which relies in the system’s linear model. Although, the removal of the linear model from its designed condition deteriorates the model’s and controller’s effectiveness. Hence, the general objective of the presented work relies in the non-linear description of the system for improving the control performance. The main objectives were the study and analysis of a generalized predictive controller (GPC) operating in parallel with a linear local model network, identified by the LOLIMOT algorithm, able to adequate the controller’s prediction model for the process operation range. For the quality assessment of the proposed controller, tests were evaluated in an experimental apparatus for pH control. The control strategy was implemented in an open source system for monitoring and control. Therefore, considering the static nonlinear characteristics of the process, comparative studies were applied between the traditional GPC (based on an single global model) and the proposed approach. The results showed that the dynamic network was able to effectively represent the system output, resulting in a simple structure, given the fact that the local models are indeed local ARX models. It was also shown that the GPC using the linear local model network performed satisfactorily and even better than the single model GPC. It was observed that the output calculated by the proposed controller has been considerably less aggressive than the traditional controller, leading to a considerable reduction in the system’s control effort. The results showed that there was a saving up to 45% in the control effort. It was also observed that the developed monitoring and control system is suitable for real applications, since the predictive control strategy, implemented in Scilab, succeeded in solving the control problem within the sampling time even with the embedded constrained QP (quadratic programming) problem. Considering that the structure of these systems allows them to be used in similar applications to linear models, it was also proved the viability and applicability of using the linear local models network directly into advanced control algorithms already available to industry as in the GPC controllers.

Keywords: predictive control; system identification; chemical process control; automation.

(7)

Lista de Figuras ix

Lista de Tabelas xiii

1 Introdução 1

2 Revisão bibliográfica 7

2.1 Controle preditivo baseado em modelos . . . 7

2.1.1 O algoritmo básico MPC . . . 8

2.1.2 Controle preditivo baseado em abordagens locais . . . 10

2.1.3 Aplicações . . . 15

2.2 Estudo de caso: reator de neutralização. . . 17

3 Fundamentação teórica 23 3.1 Rede de modelos lineares locais . . . 23

3.1.1 Algoritmo de decomposição incremental . . . 29

3.1.2 Desenvolvimento de uma rede dinâmica de sub-modelos lineares locais . . . 37

3.2 Síntese do controlador preditivo . . . 45

3.2.1 Modelo de predição. . . 45

3.2.2 Objetivos de controle . . . 49

3.2.3 Trajetória de referência . . . 50

3.2.4 Compensação do erro em regime permanente . . . 51

3.2.5 Imposição de restrições. . . 53

3.2.6 Cálculo das ações de controle . . . 57

3.2.7 Atualização do modelo por faixa de operação . . . 59

4 Materiais e métodos 63 4.1 Descrição do aparato experimental . . . 63

4.1.1 Protótipo da planta de neutralização de pH . . . 63

4.1.2 Alimentação e saída do sistema . . . 65

4.1.3 Instrumentação . . . 66

4.1.4 Sistema de comunicação digital . . . 68

4.1.5 Monitoramento e controle . . . 71

4.2 Execução dos procedimentos em malha aberta . . . 72 vii

(8)

4.2.1 Mapeamento estático do sistema . . . 73

4.2.2 Determinação do tempo de amostragem do sistema . . . 73

4.2.3 Projeto de sinais para identificação. . . 73

4.2.4 Identificação e avaliação de desempenho do modelo . . . 75

4.3 Execução dos procedimentos em malha fechada . . . 77

4.3.1 Malha de controle regulatório (controle de nível) . . . 77

4.3.2 Malha de controle servo (controle de pH) . . . 78

5 Resultados e discussões 87 5.1 Monitoramento e controle do processo . . . 87

5.2 Ensaios em malha aberta . . . 90

5.2.1 Comportamento estático . . . 90

5.2.2 Determinação do tempo de amostragem do sistema . . . 90

5.2.3 Perturbação dinâmica do sistema. . . 91

5.2.4 Identificação do sistema . . . 92

5.2.5 Validação dos resultados . . . 96

5.2.6 Análise do resíduo . . . 97

5.3 Ensaios em malha fechada . . . 100

5.3.1 Malha de nível . . . 100

5.3.2 Sintonia do controle de pH . . . 100

5.3.3 Imposição de restrições. . . 104

5.3.4 Avaliação de desempenho . . . 106

6 Conclusões e sugestões para trabalhos futuros 113 6.1 Conclusões . . . 113

6.2 Sugestões para trabalhos futuros . . . 115

Referências bibliográficas 119 A Fotos do experimento, diagrama de instrumentação e curvas de calibração 125 A.1 Fotos do sistema experimental . . . 125

A.2 Diagrama do painel de instrumentação . . . 131

(9)

2.1 Diagrama básico do algoritmo MPC. . . 9

2.2 Estratégia de horizonte móvel com consideração do desvio entre o modelo e a planta. 9 2.3 Estratégia de controle preditivo baseado em abordagens locais . . . 14

2.4 Relação entre o ganho do processo e a faixa de operação do sistema de neutralização. 18 2.5 Curva de titulação (regime permanente) do sistema de neutralização. . . 20

3.1 Rede de modelos lineares locais. . . 24

3.2 Partições locais para vetor de espaços com dimensão p = 2.. . . 25

3.3 Influência do parâmetro σiz em uma função gaussiana unidimensional com xcentroi = 0. 27 3.4 Perfis típicos de funções de base gaussianas e funções de validade (gaussianas norma-lizadas) para uma dimensão. . . 28

3.5 Algoritmo de decomposição incremental (LOLIMOT). . . 30

3.6 Superfície gerada para treinamento da rede. . . 35

3.7 Partição incremental do espaço de entradas. . . 36

3.8 Progressão do algoritmo LOLIMOT para divisão das faixas de operação dos modelos locais . . . 36

3.9 Funções geradas a partir da primeira e segunda iteração do algoritmo LOLIMOT. . . 37

3.10 Diagrama de blocos para processo sujeito a perturbações não mensuráveis. . . 38

3.11 Estrutura dinâmica da rede de modelos lineares locais a partir de medições passadas do processo. . . 44

3.12 Mudança unitária no sinal de referência para um MPC (Hp = 5). . . 51

3.13 Diagrama de blocos para um processo sujeito a perturbação aditiva. . . 52

3.14 Controlador GPC com realimentação dos polinômios ponderados ˜A e ˜B. . . 59

4.1 Protótipo experimental para neutralização de pH. . . 64

4.2 Estrutura do sistema de comunicação digital.. . . 69

4.3 Sequência de sinais binários e aleatórios utilizados para perturbação do sistema com propósito de identificação. . . 74

4.4 Sinais projetados para perturbação do sistema experimental. . . 75

4.5 Malha de controle regulatório para o nível do reator. . . 78

4.6 Malha de controle de nível implementada no SYSCON. . . 79

4.7 Malha de controle servo para pH na linha efluente do reator. . . 80

4.8 Exemplos de restrições aplicadas nos limites e amplitude máxima do atuador . . . . 83 ix

(10)

5.1 Programa desenvolvido em linguagem TCL para o monitoramento e controle do

protótipo experimental de neutralização. . . 88

5.2 Janela de configuração dos parâmetros do controlador GPC. . . 89

5.3 Armazenamento das variáveis em banco de dados a partir de uma conexão ODBC. . 89

5.4 Dados experimentais sobre o regime permanente do sistema. . . 91

5.5 Testes experimentais para aquisição de dados para identificação. . . 92

5.6 Testes experimentais para aquisição de dados para validação. . . 93

5.7 Histograma de observações da variável de saída obtidas nos testes para coleta de dados. 93 5.8 Taxa de decaimento do índice Issede acordo com as iterações do algoritmo de decom-posição. . . 94

5.9 Projeção dos dados de treinamento (pontos) sobre as regiões de operação da rede de modelos lineares locais (retângulos). . . 95

5.10 Funções de gaussianas (não-normalizadas) e de validade (normalizadas) representando as oito faixas de operação da rede de modelos lineares locais. . . 95

5.11 Comparação entre a saída medida planta e a saída predita pela rede de modelos lineares locais. . . 97

5.12 Dispersão das observações da variável medida (pH) e sua saída predita. . . 98

5.13 Histogramas do resíduo gerado entre os dados medidos e estimados. . . 98

5.14 Função de auto-correlação e correlação cruzada. . . 99

5.15 Desempenho da malha de controle regulatório frente a perturbações na carga. . . 101

5.16 Comportamento das variáveis de saída e entrada do reator de neutralização em malha fechada (1º conjunto de parâmetros). . . 103

5.17 Comportamento das variáveis de saída e entrada do reator de neutralização em malha fechada (2º conjunto de parâmetros). . . 104

5.18 Comportamento das variáveis de saída e entrada do reator de neutralização em malha fechada sem restrições. . . 105

5.19 Comportamento das variáveis de saída e entrada do reator de neutralização para malha de controle regulatório. . . 106

5.20 Comportamento das variáveis de saída e entrada do reator de neutralização em malha fechada com restrições. . . 107

5.21 Desempenho do controlador preditivo (MPC linear) frente a alterações na referência. 108 5.22 Desempenho do controlador preditivo (LLMPC) frente a alterações na referência. . . 109

5.23 Desempenho do controlador preditivo (MPC linear) com reajuste dos parâmetros de sintonia. . . 110

5.24 Desempenho do controlador preditivo (LLMPC) com reajuste dos parâmetros de sintonia.111 A.1 Protótipo experimental para controle de pH. . . 125

A.2 Bombas peristálticas de entrada e saída. . . 126

A.3 Sistema de alimentação do reator. . . 126

A.4 Demais equipamentos do sistema de alimentação. . . 127

A.5 Bomba de deslocamento positivo substituída e bomba reserva. . . 127

A.6 Sistema DIF302 . . . 127

A.7 Quadro de instrumentação. . . 128

(11)

A.9 Diagrama do painel de ligações do sistema DFI302. . . 131

A.10 Diagrama do painel de instrumentação para o protótipo de neutralização. . . 132

A.11 Curvas de calibração para os sensores de temperatura. . . 133

(12)

2.1 Aplicações de controle preditivo baseadas em vendas de mercado . . . 8

2.2 Algoritmo básico MPC. . . 10

2.3 Algoritmos clássicos de controle preditivo.. . . 11

2.4 Exemplo ilustrativo para as transições de um controlador com ganho programado. . . 13

3.1 Parametrizações comuns determinadas a partir do modelo geral. . . 42

3.2 Conjunto de restrições aplicáveis ao algoritmo de controle GPC. . . 54

3.3 Parametrização do problema de programação quadrática . . . 58

4.1 Especificação do reator . . . 65

4.2 Valores nominais das variáveis de processo. . . 65

4.3 Localização e capacidade máxima das bombas. . . 67

4.4 Rótulo e localização dos sensores de temperatura . . . 68

4.5 Rótulo, descrição e localização dos sensores de nível, pH e condutividade. . . 68

4.6 Funções de interface disponíveis na biblioteca TCL. . . 72

4.7 Sintonia do controlador pelo método IMC. . . 79

4.8 Algoritmo de controle preditivo com atualização do modelo de predição. . . 81

4.9 Parâmetros e instruções para sintonia do controlador GPC . . . 82

4.10 Parâmetros do controlador preditivo para o caso com restrição. . . 84

5.1 Modelos lineares locais obtidos a partir do processo de decomposição. . . 96

5.2 Parâmetros para o controle de nível do reator. . . 100

5.3 Conjunto de parâmetros de sintonia para controlador GPC. . . 102

5.4 Avaliação dos ensaios em malha fechada para sintonia do controlador. . . 103

5.5 Valores máximos e mínimos do vetor de movimentos de controle e saída do controlador.107 5.6 Parâmetros reajustados para compensação da variabilidade na variável manipulada. . 109

5.7 Estudo comparativo entre o desempenho dos controladores. . . 111

(13)

Introdução

A automação e controle de processos é essencial para a manutenção da uniformidade da produção e das condições de operação, para a segurança do processo e também para a sustentabilidade de processos instáveis (impraticáveis sem a presença de uma malha de controle). Um sistema bem controlado implica na melhoria da eficiência dos equipamentos que o compõe, na diminuição de resíduos do processo e no aumento de sua segurança, seja ela material ou pessoal, diminuindo os custos de operação de equipamentos e sua manutenção mecânica.

A busca por processos mais econômicos e flexíveis, com minimização de efluentes, adequação a órgãos ambientais e legislação específica, no entanto, tem direcionado as indústrias a trabalharem no limite de suas condições operacionais, levando as malhas de controle a operarem próximas da instabilidade, deteriorando seu impacto positivo no processo. Nesse caso, a ineficiência do controlador resulta em um aumento dos custos de produção, elevando o descarte de produto fora de especificação e exigindo uma constante manutenção dos elementos finais de controle.

Poucas ferramentas de controle são comprovadamente capazes de estabilizar com eficiência sistemas na presença de não-linearidades e restrições, sendo uma delas o controle preditivo baseado em modelos (MPC, na sigla em inglês). Para atender aos seus objetivos de controle o MPC utiliza um procedimento de otimização baseado no comportamento futuro da planta, lidando diretamente em sua função objetivo com as restrições operacionais da planta e assegurando o cumprimento das metas de

(14)

um processo.

A maioria das aplicações de MPC, sejam elas comerciais ou acadêmicas, está estabelecida no uso do modelo linear da planta para predição de suas variáveis controladas. O uso do modelo linear da planta mostra-se adequado, já que parte dos sistemas controlados trabalham com o intuito de manter as variáveis de processo ao redor de um determinado ponto de operação ou estado estacionário. Além disso, a grande vantagem no uso de modelos lineares consiste na solução de um problema de programação linear ou quadrática para atingir os objetivos do controlador e, nesse caso, rotinas computacionais eficientes estão disponíveis.

O afastamento das condições operacionais para as quais o modelo linear foi concebido, contudo, resulta em sua perda de efetividade e consequentemente de desempenho do controlador que o utiliza. Processos químicos e bioquímicos interagem de forma complexa e em consequência, uma representação linear pode ser insuficiente para estes sistemas. Nesse caso, uma opção seria o uso de estruturas não-lineares para uma melhor representação das interações complexas do processo. Porém, o uso direto de tais estruturas no algoritmo de controle estabelece uma dependência não-linear entre a variável de decisão presente no problema de otimização e a predição da saída da planta. Portanto, havendo a necessidade do uso de algoritmos de programação não-linear caracterizados, em sua maioria, por elevado esforço computacional e, em geral, inviáveis para sistemas com alta frequência de amostragem (sistemas rápidos) e de grande dimensão.

Além disso, a estrutura e os parâmetros de grande parte dos modelos não-lineares, como as redes neurais, não possuem significado físico direto, sendo inviáveis para a análise do comportamento do sistema de outra maneira senão por simulação numérica (Babuska, 1998). Entende-se que a estrutura do modelo deve ser suficientemente geral para representar com precisão uma grande classe de sistemas, incentivando o desenvolvimento de ferramentas para a análise e síntese da dinâmica do processo. Em geral, a multiplicidade de formas observadas na modelagem não-linear torna difícil o estabelecimento de uma única teoria, tanto comum (aplicável a todas as formas) quanto abrangente (capaz de explorar sistematicamente qualquer modelo não-linear), como apontado em Orjuela (2008).

(15)

sistemas lineares proporcionam ao usuário uma grande quantidade de ferramentas para a avaliação do comportamento dinâmico do processo e para a análise e desenvolvimento de sistemas em malha fechada. Ademais, sistemas lineares são gerais o suficiente para serem aplicados a diversas situações e, ainda, capazes de representar o processo com boa eficiência quando utilizado na descrição em torno das condições de operação para o qual foi concebido.

Nesse contexto, o objetivo deste trabalho foi apresentar a sistemática abarcada na elaboração de uma rede de modelos lineares locais por meio de um algoritmo de decomposição incremental aplicado na partição do vetor de espaços de um processo não-linear, representando com eficiência uma maior trajetória de sua operação por submodelos lineares locais. Os objetivos específicos dessa dissertação foram o estudo e análise de um controlador preditivo generalizado (GPC) operando junto a uma rede de modelos locais, sendo capaz de adequar-se, a partir do modelo de predição, para a faixa de operação atual do processo, contribuindo com a melhoria de desempenho do sistema em malha fechada. A demonstração da técnica, encaminhada de forma a considerar o desempenho do método em sistemas reais, foi estabelecida na identificação e controle empregado a um protótipo experimental de neutralização, envolvendo a automação e instrumentação de uma unidade experimental para controle de pH, caracterizado por uma alta não-linearidade estática e regimes de operação distintos na faixa de atuação do controlador.

O resumo da estrutura desta dissertação é apresentado a seguir:

Capítulo 1 O primeiro capítulo expõe a importância da identificação de modelos para o controle

preditivo (MPC), argumentando sobre sua consideração no desempenho final do controlador. Nesse capítulo também se discute a generalização do modelo relevante para controle e o compromisso que deve ser tomado entre sua eficácia (capacidade de predição) e seu desempenho (minimização do esforço computacional).

Capítulo 2 No segundo capítulo, os aspectos básicos que envolvem o controle preditivo são

aborda-dos. Faz-se aqui a consideração de estratégias para lidar com as não-linearidades dos processos industriais, ressaltando o uso de estratégias locais para consideração dos diferentes

(16)

comporta-mentos do processo. As aplicações de modelos baseados em redes de modelos lineares locais são abordadas tendo em vista a equivalência dos sistemas Takagi-Sugeno e das redes de bases radiais. Para tanto, são listadas as principais contribuições disponíveis na literatura para utilização dos modelos lineares locais utilizados em algoritmos de controle preditivo para compensação das não-linearidades do sistema. Finalmente, conclui-se o capítulo com uma breve descrição sobre os aspectos inerentes ao processo de neutralização e a motivação do uso deste estudo de caso na avaliação e desenvolvimento de controladores avançados.

Capítulo 3 O terceiro capítulo aborda os fundamentos relacionados a identificação do sistema

experimental e a síntese do controlador preditivo. A descrição da técnica utilizada para identifi-cação do sistema é encaminhada por meio do estabelecimento da teoria em torno das redes de modelos lineares locais e do algoritmo utilizado para identificação da rede. Também se discute a formulação do controlador preditivo a partir da descrição de seus principais componentes, estendendo seu uso para a incorporação das redes de modelos lineares locais como modelo de predição.

Capítulo 4 No quarto capítulo, apresenta-se a montagem e descrição dos principais componentes

do protótipo experimental, a definição das malhas de controle, o desenvolvimento da interface gráfica para o monitoramento do processo e a especificação das principais etapas encaminhadas durante o experimento. São demonstrados os procedimentos realizados em malha aberta como a seleção do tempo de amostragem do sistema, o projeto de sinais para identificação e os índices utilizados na avaliação de desempenho do modelo; também são discutidos os procedimentos executados em malha fechada, resumidos na apresentação das variáveis controladas e mani-puladas, nos critérios de sintonia para as malhas de controle regulatório e servo e também na apresentação dos critérios utilizados para a avaliação de desempenho do controle proposto.

Capítulo 5 O quinto capítulo apresenta os resultados obtidos por meio da aplicação do algoritmo

de controle preditivo junto a uma rede de modelos lineares locais. Primeiramente foram realizados testes para a identificação do sistema experimental e a análise de desempenho do

(17)

modelo. Também são apresentados os testes para avaliação dos parâmetros de sintonia do controlador GPC, a imposição de restrições e avaliação do seu desempenho, finalizando com estudo comparativo entre o GPC baseado em um único modelo linear e o GPC proposto, baseado em uma rede de modelos lineares locais.

Capítulo 6 No sexto capítulo as contribuições e as conclusões do presente trabalho são enumeradas.

As discussões levantadas nos resultados são avaliadas e as vantagens e limitações da técnica proposta são consideradas, possibilitando o encaminhamento das sugestões e propostas para trabalhos futuros.

(18)

Revisão bibliográfica

2.1 Controle preditivo baseado em modelos

O MPC é considerado a única técnica de controle avançado com amplo e significante impacto na indústria (Maciejowski, 2001), tendo como vantagens a capacidade para lidar com plantas de grande dimensão, um reduzido número de parâmetros de sintonia e melhor desempenho quando comparado aos controladores convencionais. Em relação ao controle de processos, como demonstrado em estudo

encaminhado por Qin e Badgwell (2003), apresentado na Tabela2.1, o MPC possui um alto potencial

de aplicabilidade.

Pode-se verificar que a ampla maioria das aplicações comerciais de MPC são destinadas a refinarias, petroquímicas, indústria de processos e afins. Ao contrário do que poderia ser esperado, de acordo com a pesquisa, no final da década de 90 menos de 1% das aplicações estavam direcionadas à indústria automotiva, de defesa ou aeroespacial, que são consideradas áreas estratégicas para sistemas de controle avançado. Confirmando, portanto, a capacidade de operação e o interesse da indústria de processos no algoritmo MPC.

(19)

Tabela 2.1: Aplicações de controle preditivo baseadas em

vendas de mercadoa_.

Espécie Quantidade de aplicações

Refinarias 1985 Petroquímicas 550 Ind. Químicas 144 Papel e celulose 68 Ar e gás 10 Utilidades 14 Mineradoras e Metalúrgicas 37 Alimentícias 51 Polímeros 17 Fornos 45 Defesa e Aeroespacial 13 Automotivas 7

a_{Adaptado de Qin e Badgwell (2003) (obs.: não incluem aplicações}

licenciadas).

2.1.1 O algoritmo básico MPC

O algoritmo básico do MPC, representado pelo diagrama de blocos da Figura 2.1, faz uso do

modelo da planta para predição do comportamento futuro da variável controlada sobre um horizonte de

predição (Hp) visando encontrar uma sequência de ações na variável manipulada sobre o horizonte de

controle (Hc) que atendam a certos objetivos de desempenho. Para isto, um algoritmo de otimização

é utilizado com a finalidade de minimizar o desvio do processo em relação a um sinal de referência (setpoint) determinando o menor esforço de controle possível.

Uma vez que o MPC considera as especificações técnicas do processo diretamente em sua lei de controle, vários aspectos relacionados aos sistemas reais podem ser considerados no procedimento de otimização, como a satisfação dos limites físicos dos elementos finais de controle e de outras restrições inerentes às variáveis de operação do processo controlado, eliminando, assim, a necessidade de outras formas de compensação menos eficientes (Bemporad, 2006).

Outra característica importante do MPC, é a estratégia de horizonte móvel ou retrocedente (Figura

2.2). No algoritmo de controle preditivo, a solução do problema de otimização retorna uma trajetória

(20)

Figura 2.1: Diagrama básico do algoritmo MPC.

processo e os cálculos são reiniciados a partir de uma nova medição das variáveis de saída da planta. Esta estratégia confere ao controlador uma característica de realimentação do sinal medido da planta (feedback), propriedade bastante desejável no controle de processos, já que considera os estados da planta de acordo com a amostragem do processo.

Figura 2.2: Estratégia de horizonte móvel com consideração do desvio entre o modelo e a planta.

Dessa forma, diferentemente de outros algoritmos como o controle ótimo, que calcula toda a trajetória de controle em malha aberta, o controle preditivo é capaz de considerar as imperfeições do

modelo em relação ao sistema real (ver indicação de desvio na Figura2.2) cada vez que implementa

(21)

ao processo.

Apresenta-se na Tabela 2.2 o procedimento básico do algoritmo do MPC para o cálculo da

sequência de ações de controle. Seguindo este algoritmo, foram estabelecidos na literatura diferentes técnicas de controle preditivo. Parte destas são apenas variações ou adaptações elaboradas de forma a atender requisitos específicos de um determinado sistema. Destaca-se no entanto, três abordagens

suficientemente gerais para serem mencionadas, com características descritas na Tabela2.3:

1. Controle preditivo baseado em matriz dinâmica (DMC, Dynamic Matrix Control)

2. Controle preditivo generalizado (GPC, Generalized Predictive Control)

3. Controle preditivo linear quadrático (LQMPC, Linear Quadratic Model Predictive Control)

Tabela 2.2: Algoritmo básico MPC.

Etapas Procedimento

Etapa 1 Medida das variáveis de saída do processo controlado no instante: tk= k.

Etapa 2 Cálculo do desvio em relação a trajetória de referência.

Etapa 3 Minimização da função objetivo com respeito à variável controlada sujeita a restrições.

Etapa 4 Implementação do primeiro elemento da sequência de controle calculada à planta.

Etapa 5 Inicio de um novo ciclo (tk = k + 1), retornando à Etapa 1.

2.1.2 Controle preditivo baseado em abordagens locais

Sendo o MPC um controlador baseado em modelo, seu desempenho está diretamente ligado à representação matemática do modelo da planta. Guardadas as considerações em que o modelo seja preciso o suficiente para representar as relações dinâmicas entre as variáveis do processo, o MPC irá proporcionar um desempenho “quase-ótimo” para os objetivos de controle (Bemporad, 2006). Considerando o fato de que, em geral, as aplicações de controle na indústria trabalham com intuito de manter o processo ao redor de um ponto de operação ou estado estacionário, o desempenho do controlador baseado no modelo linear pode ser satisfatório.

(22)

Tabela 2.3: Algoritmos clássicos de controle preditivo.

Algoritmo DMC GPC LQMPC

Origem Industrial Acadêmica Industrial/Acadêmica Pioneiros Cutler e Ramaker (1980) Clarke et al (1987) Muske e Rawlings (1993) Modelo Convolução Funções de transferência Matrizes de espaço de estados

(não paramétrico) (paramétrico) (não paramétrico)

Predição y =ˆ N X n=1 gnu (k − n + j) y =ˆ B(q)

A(q)u(k − 1) x(k + 1) = Ax(k) + Bu(k)

y(k) = Cx(k)

Vantagens - simples e intuitivo; - válido para qualquer -facilmente aplicado em - considera de forma direta processo; sistemas multivariáveis;

os atrasos do processo; - poucos parâmetros. - bem fundamentado;

- bem aceito entre os operadores. - aplicável a sistemas instáveis. Desvantagens - armazenamento ineficiente; - dificuldade relacionadas ao - descrição menos intuitiva;

- válido somente em plantas procedimento de identificação. - necessita do modelo fenom. assintoticamente estáveis. ou modelo de inovações.

a_{Adaptado de Dutra (2003).}

Existem, entretanto, situações que podem acarretar em um MPC com cálculo de ações de controle com fraco desempenho. Em determinados casos, o MPC pode ser incapaz de compensar mudanças no processo se características como transições de regime e alterações não previstas forem desconsideradas no modelo da planta. Exemplos de cenários que, quando desprezados, podem causar a degradação das malhas de controle preditivo são listados a seguir (Seborg et al, 2004):

1. Mudanças nas características do equipamento (ex.: incrustação em tubulações e trocadores de calor, desativação de catalisadores);

2. Estado operacional (início e parada da planta, operações em batelada);

3. Perturbações na carga (composição da alimentação, qualidade do combustível etc.); 4. Mudanças no meio ambiente (ciclos diários, clima);

5. Modificação na especificação da produção (fabricação de polímeros);

(23)

Assim, para o bom desempenho do controle preditivo, algumas considerações devem ser feitas para processos que atuam em diferentes condições operacionais, quando se pretende maximizar a produção e eliminar perdas de desempenho nas malhas de controle referente a mudanças na condições de operação e estados não medidos da planta.

A simples escolha por um modelo que seja capaz de lidar com todas estas circunstâncias pode não ser a melhor opção. Deve-se sempre considerar o compromisso entre a escolha do modelo para controle e a viabilidade da solução do problema de otimização. Ou seja, em aplicações reais, o objetivo de identificação da planta para uso no MPC deve ser a determinação de um modelo de predição que seja adequado numericamente para ser utilizado em tempo real (Abu-Ayyad e Dubay, 2010).

Na utilização de modelos não-lineares, por exemplo, existe uma dependência não-linear entre a variável de decisão, geralmente o movimento de controle ∆u, e a saída do modelo. Este fato implica em um problema de otimização não-linear e geralmente não convexo, o que torna o sistema de controle um problema com solução não-trivial.

Nesse contexto, a releitura de técnicas aplicadas a controladores convencionais pode ser útil. Uma alternativa simples para processos não-lineares operando em uma ampla faixa é encontrada em controladores com ganho programado ou gain scheduling, com origem na década de 60 (Leith e Leithead, 2000). Este tipo de estratégia, comumente aplicada a controladores convencionais (PI,

Proportional and Integralou PID Proportional, Integral and Derivative), usa o monitoramento sobre

a faixa de operação para modificar os parâmetros do controlador em regimes com características dinâmicas distintas, por exemplo, sistema frigoríficos operando durante diferentes ciclos diários e estações (dia/noite; inverno/verão).

Um exemplo de controlador PID com ganho programado é apresentado na Tabela 2.4. Para

consideração de não-linearidades o processo é controlado por três conjuntos de parâmetros de controle distintos, cada qual respectivo a uma condição de operação. O monitoramento de uma variável de processo (PV) indica a faixa de operação atual e o respectivo conjunto de parâmetros que deve ser utilizado. Assim, pode-se observar certas semelhanças na consideração de não-linearidades por parte do controle avançado quando comparado à estratégia de controle com ganho programado.

(24)

Tabela 2.4: Exemplo ilustrativo para as transições de um controlador com ganho programado.

Variável monitorada Parâmetros de sintonia do controlador

kc= 1,5 P V < 30o C τi = 15 τd= 0,7 kc= 1 30o_{≤ P V ≤ 50}o_C _τ i = 20 τd = 0 kc= 0,8 P V > 50o _C _τ i = 8 τd= 0,5

Priorizando o controle preditivo baseado em modelos lineares, o uso de procedimentos de con-trole distribuído, linearização e ponderação de modelos foram dirigidos na tentativa de conferir ao controlador, um melhor desempenho frente a processos que precisassem operar em mais de um estado ou regime de operação. Parte destas abordagens, baseadas em bancos de modelos (Murray-Smith e Johansen, 1997), utilizam mais de uma descrição do processo para compensar as alterações de pontos de operação e outras não-linearidades do sistema, conferindo ao MPC além do ganho de desempenho, a simplicidade em seu desenvolvimento.

As alternativas baseadas em múltiplos modelos possuem características comuns àquelas exploradas por técnicas denotadas como inteligência artificial; como no controle preditivo baseado em redes neurais, modelos fuzzy e redes neuro-fuzzy (Tatjewski, 2007; Jalili e Atashbari, 2007; Babuska e Verbruggen, 2003), todas extensamente utilizadas como alternativa para o controle e identificação de processos, nos quais seria difícil obter modelos lineares que descrevessem realisticamente o comportamento dinâmico da planta. Nesse contexto, Tatjewski e Lawrynczuk (2006) apresentaram uma revisão geral sobre o uso de redes neurais artificiais e modelos fuzzy junto ao controle preditivo baseado em modelo.

Métodos de identificação baseados em sistemas fuzzy Takagi-Sugeno (Takagi e Sugeno, 1985) e redes de modelos lineares locais (MURRAY-SMITH, 1994; Johansen, 1994) utilizam o conceito

(25)

da partição da unidade com a finalidade de decompor um sistema complexo em subsistemas lineares (modelos locais) de menor complexidade. Nesse caso, um controlador com estrutura variável ou uma família de controladores é utilizado para suprir a demanda de controle nos diversos pontos de operação. Para ambos os procedimentos, a diferença é determinada basicamente na forma de se incorporar o

modelo local ao controlador. Deste forma, resume-se na Figura2.3as estratégias de controle baseado

em abordagens locais, considerando neste trabalho a sobreposição das fronteiras entre os modelos locais (interpolação entre os modelos).

(a) (b)

Figura 2.3: Estratégia de controle preditivo baseado em abordagens locais: (a) com linearização

dinâmica do modelo não-linear;(b)com controladores locais baseados na faixa de operação (Nelles,

2001).

Na estratégia apresentada na Figura2.3(a), um controlador global utiliza um modelo ponderado

para predição da trajetória futura da planta. O modelo ponderado é resultado da contribuição de

mmodelos localmente lineares, cada qual representativo para uma faixa específica de operação do

processo. O mapeamento do regime é baseado na realimentação de dados de entrada e saída da planta ou pelo monitoramento de uma variável chave. Desta modo, o algoritmo de controle é capaz de reconhecer a condição atual da planta e se adaptar a condição de operação.

Para o controle distribuído ilustrado na Figura2.3(b), cada modelo local é utilizado para projetar

um controlador também local. Cada controlador é desenvolvido de forma a lidar com as características dinâmicas da sua área de atuação. Entretanto, a interpolação é realizada na saída do controlador e não do modelo. O sinal da variável manipulada será atribuído ao elemento final de controle pela composição de todos os controladores localmente ativos.

(26)

É relevante constatar que, ao se aproximar um sistema complexo não-linear por uma classe de subsistemas lineares, a análise do sistema não-linear é transformada para a análise de diversos subsistemas lineares (Ozkan et al, 2003). Além disso, é possível a partir destas abordagens locais, o desenvolvimento de aplicações baseadas na teoria de sistemas lineares, fazendo uso do princípio da superposição dos modelos lineares locais para a formulação de um problemas de otimização de fácil solução (programação linear ou quadrática), utilizando os algoritmos DMC, GPC e LQMPC.

2.1.3 Aplicações

A equivalência entre as redes de modelos lineares locais e os sistemas fuzzy Takagi-Sugeno, considerando as redes de modelos lineares locais como uma versão estendida das redes de base radial, é apresentada em diversos trabalhos. Cita-se aqui a contribuição de Hunt et al (1996). Aproveitando-se dessa correspondência, diversas aplicações fundamentadas em ambas as descrições de modelos foram desenvolvidas para a compensação de não-linearidades da planta em sistemas controlados.

Esforços iniciais para aplicação de abordagens locais em controladores MPC foram empregados por meio da simulação de modelos Takagi-Sugeno em paralelo ao processo controlado gerando coeficientes para o modelo de convolução do algoritmo DMC. O controlador DMC baseado nesse princípio foi apresentado primeiramente por Skrjanc et al (1996). A metodologia aplicada ao desenvolvimento do controlador consistia em utilizar o modelo fuzzy em uma camada superior, sendo responsável pelo cálculo dos coeficientes de resposta ao degrau requeridos no projeto do controlador.

No modelo preditivo linear, a matriz G é calculada na etapa de desenvolvimento do controlador e, portanto, fixa ao longo de todo o processo. Para o controlador DMC proposto por Skrjanc et al (1996), a matriz de coeficientes de resposta à perturbação degrau (G) é calculada em tempo real a cada iteração por meio da simulação do modelo identificado para a planta. Para esta estratégia a matriz é atualizada sempre que as características do processo são modificadas por distanciamento do ponto de operação. Isto permite que o modelo represente melhor o processo em diferentes regimes de operação durante a atuação do controlador. Métodos similares foram propostos por Fischer et al (1997) e Espinosa e

(27)

Vandewalle (1998). Em Fischer et al (1997) o algoritmo de decomposição incremental LOLIMOT foi utilizado para a identificação do modelo do sistema gerados de coeficientes da matriz de ganhos do (G) controlador DMC.

Em contraste à metodologia de simulação do modelo em tempo real, Marusak (2009) propôs a decomposição do processo não-linear em subsistemas para os quais cada subsistema é um modelo de convolução estimado localmente por perturbação degrau. Como nos trabalhos anteriores, a matriz G é atualizada pela faixa de operação do modelo. Contudo, elimina-se a necessidade do estabelecimento de novos coeficientes degrau em tempo real. O controlador DMC proposto foi comparado a um DMC baseado em um único modelo de convolução. Segundo o autor, a estratégia se mostrou numericamente eficiente e com melhor rendimento quando comparado a sua versão linear (DMC baseado somente um modelo de convolução).

Deve-se ressaltar, entretanto, que controladores preditivos baseados em modelos de convolução, sejam eles clássicos ou aprimorados pela faixa de operação de modelos locais, possuem desvantagens em aplicações práticas, já que a perturbação degrau é inviável em processos instáveis e principalmente pelo fato do armazenamento de coeficientes de resposta ao degrau ser uma forma extremamente ineficiente de representação de modelos.

Em Fink et al (2003), o controle preditivo baseado em arquiteturas locais identificados a partir do algoritmo LOLIMOT também foi investigado. Em seu estudo, o autor realizou uma comparação entre

o controle distribuído e o controle baseado no modelo linearizado (ver Figura2.3). As abordagens

locais foram empregadas em uma malha de controle baseada no algoritmo GPC. A estratégia, baseada na rede de modelos locais em conjunto com o controle preditivo foi utilizada na modelagem e controle de um processo de troca térmica de porte industrial no qual resultados satisfatórios foram obtidos.

Com relação ao método de controle distribuído, estudos similares foram elaborados por Huang

et al(2000), Li et al (2004) e Mazinan e Sadati (2008). Em Li et al (2004), para cada subsistema linear

ou modelo local, projetou-se um controlador GPC dedicado. Como na proposta de controle distribuído de Fink et al (2003), a saída final do controlador foi obtida após a composição ponderada de todas as saídas dos controladores GPC locais.

(28)

No trabalho de Fischer et al (1998) foi discutida a metodologia para linearização da rede de modelos lineares locais identificados pelo algoritmo LOLIMOT. Em seu estudo, a linearização jaco-biana foi comparada à linearização dinâmica, baseada na ponderação dos coeficientes dos modelos locais. Um controlador GPC baseado na linearização dinâmica do modelo identificado pelo algoritmo LOLIMOT foi desenvolvido e comparado à abordagem de extração de coeficientes de resposta ao degrau demonstrada por Skrjanc et al (1996) e a um controlador preditivo baseado em otimização não-linear. Nos experimentos, o controle baseado em otimização não-linear mostrou-se inviável para aplicação experimental, entretanto, os demais controladores obtiveram bom desempenho com atuações próximas entre si. Trabalhos similares foram encaminhados em Zhang e Morris (2001) e Matko e Biasizzo (2000).

Outras abordagens análogas, no contexto de matrizes de espaço de estados (LTV, linear time variant), são encontradas nos trabalhos de Roubos et al (1999), Blazic e Skrjanc (2007), Espinosa e Vandewalle (1999). Em Mollov et al (2004), o estudo detalhado sobre o procedimento de otimização no emprego de arquiteturas locais para aproximação de modelos não-lineares foi conduzido. Em sua contribuição, além do uso de estruturas localmente lineares, considerou-se a modificação dos objetivos de otimização do controlador preditivo para a penalização da variabilidade das saídas preditas da planta e também para o desvio da sequência de ações de controle em relação a uma entrada de referência.

O uso do controlador preditivo baseado na linearização de algoritmos Takagi-Sugeno, relembrando o fato da equivalência destes modelos com as redes de modelos lineares locais foi apresentada em Abonyi et al (2001). Uma discussão detalhada sobre a linearização de modelos Takagi-Sugeno pode ser encontrada em Johansen e Murray-Smith (2000).

2.2 Estudo de caso: reator de neutralização

Processos controlados para neutralização de pH são sistemas comumente encontrados na indústria de processos químicos e bioquímicos. Sua característica altamente não-linear aliada a uma estrutura matemática de fácil entendimento, o torna ideal para exemplificação de métodos de controladores

(29)

avançados (Gustafsson e Waller, 1992). O controle de pH tem sido um estudo de caso bastante comum no desenvolvimento de novas estratégias de controle devido a sua importância na área industrial e por apresentar um desafio ao projeto de malhas de controle.

A principal característica do processo de neutralização é sua alta não-linearidade estática, que confere ao sistema um comportamento complexo do ponto de vista de controle. Esse fato fica evidente se levada em consideração a curva de ganho do sistema em relação a sua faixa de operação (Figura

2.4). 2 3 4 5 6 7 8 9 10 11 0 5 10 15 20 25 30 pH Kp (1/l/h) tampão=0,002 tampão=0,07 tampão=0,55

Figura 2.4: Relação entre o ganho do processo e a faixa de operação do sistema de neutralização (vazão de solução tampão em ml/s).

Na faixa intermediária, em torno de pH 7, o ganho relativo do processo referente à variável controlada pode chegar a um valor 25 vezes maior que nas demais faixas do sistema, o que implica na escolha correta da estratégia de controle ser fundamental para um controle consistente no processo de neutralização.

Controladores convencionais, baseados em técnicas lineares como o PID, possuem grandes des-vantagens em processos com alterações de ganho dessa magnitude. Um controlador convencional programado para trabalhar nas regiões de baixo ganho, precisa encaminhar um grande esforço de controle para perfazer uma pequena alteração na faixa de pH. Entretanto, para a faixa de alto ganho,

(30)

mesmo uma pequena alteração na variável manipulada (vazão de base ou ácido) pode resultar em um grande salto na variável controlada. Portanto, verifica-se praticamente impossível o bom desempenho de um controlador baseado em parâmetros fixos devido a característica conflitante dos pontos de operação do processo.

Para que o processo de neutralização seja operado em situações reais, faz-se uma sintonia visando a robustez do controlador de modo que este seja insensível a pequenas mudanças, mesmo que para isso o controle apresente comportamento ineficiente. Entretanto, esse procedimento não possui garantia de sucesso. Na ocorrência de alguma perturbação não prevista ou mudança brusca no sinal de referência, o comportamento em malha fechada pode tornar-se instável e oscilatório.

Outra forma de compensação comum na prática é a inclinação da curva estática do processo por adição de solução tampão, permitindo o trabalho na região intermediária do processo. A solução tamponada é fácil de ser controlada já que, nesse caso, é o sistema que fica insensível às mudanças no processo. Contudo, essa aparente facilidade é alcançada ao custo do uso de grandes quantidades de ácido ou base para se chegar ao patamar desejável, o que pode resultar em danos as redondezas, como apontado por Gustafsson et al (1995).

Diversas metodologias baseadas no auto-ajuste dos parâmetros do controlador (self-tuning ou adaptativo) foram encaminhadas na tentativa de amenizar a perda de desempenho dos controladores convencionais para o controle de pH. Destaca-se aqui trabalhos como os de Gustafsson e Waller (1992), Henson e Seborg (1994) e Henson e Seborg (1997), fundamentados principalmente na modelagem baseada em princípios básicos do sistema proveniente das contribuições de McAvoy et al (1972) e Gustafsson e Waller (1983).

Outros trabalhos importantes, também baseados na auto-ajuste do controlador convencional de acordo com sua faixa de operação, foram apresentados no contexto da lógica fuzzy (Babuska et al, 2002; Salehi et al, 2009). Técnicas interessantes também foram estabelecidas no uso de algoritmos genéticos para otimização dos parâmetros do PID baseado em objetivos múltiplos e conflitantes na perspectiva dos ótimos de pareto (Tan et al, 2005).

(31)

atenção para o desenvolvimento de modelos eficientes para a descrição do processo a ser controlado. Nesse caso, salienta-se que a etapa de identificação de modelos para o controle de pH também constitui uma tarefa difícil, já que o sistema passa com rapidez pela região de alto ganho (intermediária), provendo pouca informação sobre esta faixa de operação nos dados coletados (Aguirre, 2007). Tal fato fica evidenciado a partir da análise do comportamento estático (regime permanente) do processo de

neutralização, apresentado na Figura2.5.

Observa-se com clareza, pelas Figuras 2.5(a) e 2.5(b), os diferentes regimes de operação do

processo. Nota-se também, a partir das Figuras2.5(c)e2.5(d)o declive ocasionado no ganho estático

do processo quando em presença de solução tampão.

(a) 0 20 40 60 80 100 120 2 3 4 5 6 7 8 9 10 11 q4(l/h) pH (−) (b) (c) 0 20 40 60 80 100 120 2 3 4 5 6 7 8 9 10 11 q4(l/h) pH (−) (d)

Figura 2.5: Curva de titulação (regime permanente) do sistema de neutralização:(a)–(b)sem adição

de solução tampão, variando as vazões de ácido e base e somente base, respectivamente; (c)–(d)

com adição de solução tampão (0,55 ml/s), variando as vazões de ácido e base e somente base, respectivamente.

(32)

Trabalhos recentes como Mahmoodi et al (2009), Montandon et al (2008) e Obut e Ozgen (2008), ao contrário de fundamentarem-se na alteração dos algoritmos de controle para lidar com as não-linearidades inerentes ao processo de neutralização, são fortemente embasados na escolha de modelos factíveis para uso no controlador preditivo.

Em Silva (2009), o estudo de controladores robustos com linearização local aplicado ao processo de neutralização foi efetuado em um sistema experimental. Segundo o autor, além das dificuldades já citadas foram encontradas diversos problemas de caráter experimental podendo-se mencionar a presença de bolhas no sistema dificultando a medida de vazão das correntes manipuladas. Em seu estudo, o autor desenvolveu e testou diversos controladores preditivos com desempenho robusto e estabilidade garantida aplicados ao controle multivariável de pH com ausência de solução tampão, ressaltando a aplicabilidade e limitações dos controladores propostos.

Nesse contexto, os fatos ressaltados nos diversos trabalhos presentes na literatura apontam para o potencial do uso do processo de neutralização no estudo, avaliação e projeto de controladores baseados na identificação de processos. Isto se adéqua às características das rede de modelos lineares locais, que são notadamente capazes de capturar com bom desempenho a não-linearidade dos processos não-lineares através da inclusão de informação referente aos ganhos e constantes de tempos variáveis no modelo do planta.

(33)

Fundamentação teórica

3.1 Rede de modelos lineares locais

Uma rede de modelos lineares locais é composta por m representações locais definidas pela divisão do vetor de espaços que determina o sistema identificado. Ou seja, cada partição local define um subconjunto do vetor de espaços que orienta e delimita uma faixa de operação do sistema global para uma representação local. Assim, em cada faixa de operação existe um único modelo que estabelece localmente a relação entre as entradas e saídas da rede.

A estrutura básica da rede de modelos lineares locais é apresentada na Figura3.1. A contribuição

relativa dos modelos localmente ativos é determinada pela função de ativação ou validade φi. A função

de validade descreve a partição completa do sistema identificado por faixas de operação, indicando a transição de cada modelo local entre suas vizinhanças.

Dentro de cada partição existe um modelo local que a representa, sendo considerado uma repre-sentação precisa para sua faixa de operação. Portanto, considerando que m modelos locais estejam

disponíveis, é possível estimar a saída de um modelo global (saída da rede, ˆy) por meio da contribuição

de cada subsistema local que a constitui.

Deste modo, definidos os elementos básicos de uma rede de modelos lineares locais, segue-se com o detalhamento dos principais aspectos que a compõem:

(34)

Figura 3.1: Rede de modelos lineares locais.

Partições Locais

As partições locais estabelecem a geometria básica de cada faixa de operação dos modelos locais. Cada partição local i relativa à p variáveis que compõem o modelo global é definida pela coordenada

que indica o centro da faixa (xcentro_i ) e sua extensão (∆_i), portanto (Equação3.1):

xcentro_i = xcentro_i1 , xcentro_i2 , . . . , xcentro_ip T

∆_i = (∆i1, ∆i2, . . . , ∆ip)T (3.1)

Para ilustrar esta definição, considera-se como exemplo um vetor de espaços formado por duas

variáveis (x1, x2), compondo duas faixas de operação ortogonais, apresentadas na Figura3.2.

(35)

hiper-retângulos (no espaço definido pelas variáveis de entrada da rede), sendo necessário mencionar que outras geometrias são possíveis por meio de algoritmos como o de agrupamento de dados (clustering).

Figura 3.2: Partições locais para vetor de espaços com dimensão p = 2.

Além disso, a hipótese de ortogonalidade das divisões é um meio de simplificação do algoritmo e nem sempre derivam uma representação do sistema com significado físico. Ressaltando que o ponto de operação descrito aqui não equivale necessariamente ao ponto de equilíbrio do sistema dinâmico, e sim a faixa de atuação de uma partição local no sistema global como um todo.

Função de validade

Na modelagem e controle de processos contínuos diferenciáveis, as funções de base decrescem

monotonicamente de um máximo (xi = xcentroi ) em direção a zero (distância métrica nula), de acordo

com a distância: xi − xcentroi (MURRAY-SMITH, 1994). Nesse caso, ocorre um decréscimo da

influência do modelo local associado à função de base ou faixa de operação à medida que o ponto xi

se distancie do centro da partição. Portanto, é comum definir a validade do modelo de acordo com o

(36)

φi(x, vi) = µi(x, vi) m X j=1 µj(x, vi) (3.2)

sendo que, µi(x, vi), são funções de base gaussianas não normalizadas representadas pela Equação3.3:

µi(x, vi) = exp ( −1 2 p X z=1 (xz− xcentroiz ) 2 σ2 iz ) (3.3)

Na qual z ∈ {1, 2, . . . , p} indica o número de variáveis de entrada da rede ou a dimensão de seu vetor

de espaços, definido aqui pela variável x, mostrada na Equação3.4:

x = (x1, x2, . . . , xp)T (3.4)

e os parâmetros que estabelecem a geometria e a interpolação de cada faixa de operação, são reunidos

na variável vi, apresentada na Equação3.5:

vi = xcentroi , σi

(3.5)

sendo que os elementos do vetor σ_idenotam extensão ou largura e implicam no grau de sobreposição

entre cada função de validade e por sua vez o modelo que a representa. Portanto (Nelles, 2001):

σiz = ∆izkσ (3.6)

para,

σ_i = (σi1, σi2, . . . , σip)T (3.7)

O parâmetro kσ define a proporção do grau de sobreposição entre funções de validade e tem um

valor padrão definido em 1/3. Sua influência em relação a uma função gaussiana não normalizada,

(37)

−6 −4 −2 0 2 4 6 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 x µ σ=0.5 σ=1 σ=1.5

Figura 3.3: Influência do parâmetro σiz em uma função gaussiana unidimensional com xcentroi = 0.

Perfis típicos de funções base gaussiana (não-normalizadas) e validade (normalizadas), para um sistema com uma dimensão (p = 1) e um sistema com duas dimensões (p = 2), são apresentados na

Figura3.4.

Destaca-se que pelo menos um modelo local deve ser relevante ou válido sobre todas as combina-ções possíveis das condicombina-ções de operação. Em outras palavras, é necessário que as contribuicombina-ções locais

das m funções de validade (ver Equação3.2) resultem sempre em uma contribuição global igual ao

valor unitário, ou seja, somem a 100%. Isto implica nas relações apresentadas nas Equações3.8e3.9:

m X i=1 µi > 0 (3.8) m X i=1 φi = 1 (3.9)

Submodelos Locais e Composição da saída global

Cada faixa de operação é determinada por uma relação multi-paramétrica (modelo local) entre as entradas da rede e seus parâmetros. Ao contrário da relação de mapeamento não linear encontrada nas funções de validade, a rede é linear em relação a seus parâmetros. Isto significa que cada modelo

(38)

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 x µ (a) 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 x φ (b) (c) (d)

Figura 3.4: Perfis típicos de funções de base gaussianas e funções de validade (gaussianas

normaliza-das), respectivamente: (a),(b)para uma dimensão;(c),(d)para duas dimensões.

local é uma relação linear entre a saída (ˆy) e as entradas (x) do sistema identificado, representados de

acordo com a Equação3.10:

yi = wi0+ wi1x1+ . . . + wipxp (3.10)

Da qual é possível especificar o vetor w_i (Equação3.11), que representa o conjunto de parâmetros ou

coeficientes que definem os modelos locais de acordo com a faixa de operação para i ∈ (1 . . . m).

w_i = (wi0, wi1, . . . , wip)T (3.11)

A saída estimada do modelo identificado, ˆy, considerando que m modelos locais estejam

(39)

na Equação3.12: ˆ y = m X i=1 φ(x, vi)yi(x, wi) (3.12)

3.1.1 Algoritmo de decomposição incremental

Uma vez definidos os aspectos fundamentais da rede de modelos lineares locais é possível especifi-car um método para determinação dos modelos locais e suas respectivas faixas de operação. Para isso, foi utilizado o algoritmo de decomposição incremental LOLIMOT (Local Linear Model Trees; vide

Seção4.2.4), proposto por Nelles e Isermann (1996). A ideia básica do método consiste em decompor

o vetor de espaços das entradas em faixas retangulares ortogonais aos eixos do vetor de espaços, para o qual, modelos locais são adicionados à rede a cada divisão da faixa de operação do modelo com pior desempenho.

A decomposição e estimativa dos modelos locais para a identificação ou treinamento da rede tem andamento em duas vertentes: um laço externo no qual a informação referente à faixa de operação,

vi, é determinada pela geometria da nova partição; e um laço interno em que os parâmetros widos

modelos locais são estimados. É importante observar, como discutido na Seção 3.1, que a rede é

linear em relação aos parâmetros dos modelos locais. Desta forma, os parâmetros w_i são obtidos a

partir do método de mínimos quadrados (MQ), minimizando o resíduo gerado entre a saída do modelo

identificado e a saída observada (medida) da planta. O fluxograma apresentado na Figura3.5ilustra a

progressão do algoritmo.

A primeira etapa do fluxograma é a própria inicialização do procedimento, ou seja, o ponto de partida para a decomposição, que é determinado pela identificação de um modelo global. Sua estimativa é feita considerando que a informação disponível no conjunto de dados é igualmente relevante em toda faixa de operação. Posteriormente têm-se início os laços propriamente ditos, sendo que o laço interno, responsável pela estimativa dos parâmetros dos modelos locais, está implícito no bloco intermediário (etapa anterior ao incremento M = M + 1).

(40)

Figura 3.5: Algoritmo de decomposição incremental (LOLIMOT).

Deste modo, antes de prosseguir com a elucidação das próximas etapas, as seguintes variáveis são definidas: Yobs =          y(1) y(2) .. . y(n)          Xobs =          x1(1) x2(1) · · · xp(1) x1(2) x2(2) · · · xp(2) .. . ... ... x1(n) x2(n) · · · xp(n)          (3.13)

Na qual Xobs ∈ Rn×p refere-se a matriz relativa a n observações de p variáveis de entrada do

modelo e Yobs ∈ Rn é o vetor de n observações da variável de saída. O par Xobs e Yobs constitui o

referido conjunto de dados para treinamento da rede.

Seguindo a mesma nomenclatura, define-se na Equação3.14o vetor Yestim∈ Rnque compreende

os valores estimados (calculados) pela rede, tal que y(n) = f (x_n); e a matriz diagonal Qv, que

estabelece a validade do modelo local referente à faixa de operação i. Na qual, x_ncompreende as

(41)

Yestim =          ˆ y(1) ˆ y(2) .. . ˆ y(n)          Qv =          φi(x1, vi) 0 · · · 0 0 φi(x2, vi) · · · 0 .. . ... . .. ... 0 0 · · · φi(xn, vi)          (3.14) x_n= (x1(n), x2(n), . . . , xp(n)) (3.15)

Definidas as variáveis, prossegue-se com as etapas do algoritmo:

Escolha da partição com pior desempenho

A avaliação do desempenho da partição i é efetuada com base no índice que representa o quadrado

da soma do vetor de resíduos locais (Ii,sse; sum of squared errors):

Ii,sse = ξTQvξ (3.16)

Para a qual o vetor de resíduo do modelo ξ é apresentado na Equação3.17:

ξ = Yobs− Yestim =          y(1) − ˆy(1) y(2) − ˆy(2) .. . y(n) − ˆy(n)          (3.17)

Divisão ortogonal da faixa selecionada

Nesta etapa, a estrutura da rede é modificada. A partição com maior índice Ii,sse, selecionada para

o refinamento é dividida ortogonalmente em duas partes iguais em todas as suas dimensões, dando origem a duas novas partições em relação a cada variável de entrada. A partir desta nova geometria,

são determinados as faixas de operação dos novos modelos locais (vi), ou seja, os centros da partição

(42)

Identificação dos modelos locais

Com a determinação das novas faixas de operação, cada modelo local pode ter seus coeficientes

w_i estimados separadamente. Nessa fase, a identificação dos parâmetros é feita a partir da matriz

Ψ ∈ Rn×p+1apresentada na Equação3.18. A matriz Ψ nada mais é do que a matriz de observações

das variáveis de entrada do modelo Xobs, acrescida de uma coluna unitária, responsável pela estimativa

da constante do modelo local (wi0) (ver Equação3.10).

Ψ =          1 x1(1) · · · xp(1) 1 x1(2) · · · xp(2) .. . ... ... 1 x1(n) · · · xp(n)          (3.18)

A estimativa dos parâmetros é baseada na minimização da função objetivo, Vi , apresentada pela

Equação3.19:

argmin

wi

Vi = kξk2_Q_v = ξTQvξ (3.19)

com resultado da minimização demonstrado algebricamente para o conjunto de parâmetros w_i(Equação

3.20):

w_i = ΨTQvΨ

−1

ΨTQvYobs (3.20)

o que equivale ao estimador de mínimos quadrados ponderados (MQP) a partir da matriz Qv.

É relevante notar que, para a determinação de cada modelo local, todos os dados de treinamento são considerados. Entretanto, quanto mais próximas as observações estiverem do centro das funções de validade, mais significantes estes dados serão para a estimativa dos modelos locais. Isto confirma o fato de cada centro da função de validade ser interpretado como um ponto de operação para o modelo local correspondente. Deve-se mencionar também que, como parte da proposição de estimativa local

(43)

dos parâmetros, a sobreposição das funções de validade é ignorada na identificação dos coeficientes dos modelos locais, esta fato será elucidado posteriormente.

Escolha da melhor estrutura e armazenamento dos parâmetros

A escolha da melhor estrutura é feita considerando o índice Isse global (Equação3.21). Nesta

etapa, o índice é calculado para todas as disposições dos cortes que definem as estruturas candidatas e seus respectivos modelos locais. A seleção é feita para aquela estrutura que obteve o menor índice, ou seja, o melhor desempenho.

Isse = ξTξ (3.21)

Escolhida a estrutura final, procede-se com o armazenamento dos coeficientes estimados para os modelos locais e os parâmetros identificados para seus pontos de operação. Em seguida, faz-se uma

avaliação de desempenho, que pode ser uma tolerância ao próprio índice Isseou a escolha de outro

índice mais adequado para determinada circunstância. Pode-se também definir a complexidade da rede, ou seja, a capacidade máxima de modelos locais permitidos na rede. Isto é feito limitando a quantidade de iterações do algoritmo. Seja qual for o critério, se este for satisfeito, o algoritmo é interrompido e a estrutura resultante é definida como a rede de modelos lineares locais, caso contrário, prossegue-se com o algoritmo até que o critério seja satisfeito.

O algoritmo LOLIMOT pode ser considerado uma rotina de identificação eficiente. No que diz respeito à demanda computacional, somente os parâmetros de dois modelos locais precisam ser estimados a cada iteração, sendo que todos os outros modelos permanecem inalterados. Além disso, a estimativa do algoritmo considera o ajuste dos dados localmente, o que não é necessariamente possível em uma estimativa global.

Em geral, se as funções de validade forem conhecidas, cada modelo local pode ser estimado separadamente ou ajustado globalmente (de uma única vez). Portanto, se m modelos locais com p + 1 parâmetros forem considerados, uma estimativa global implica no ajuste simultâneo de m(p + 1)

(44)

coeficientes. Se por outro lado, o algoritmo LOLIMOT e consequentemente a estimativa local for empregada, apenas p+1 parâmetros são estimados m vezes, resultando em uma redução computacional considerável, em se tratando de cálculos matriciais.

O preço que se paga pela estimativa local no algoritmo LOLIMOT é a consideração feita para a sobreposição das funções de validade durante a estimativa dos parâmetros dos modelos locais. Como já mencionado, a estimativa local negligencia esta sobreposição. Isto implica em uma diminuição do desempenho do modelo, elevando o erro de predição da rede proporcionalmente ao aumento do

parâmetro kσ. Contudo, este fato é compensado por um aumento no efeito de regularização da rede na

estimativa local (Fischer et al, 1998).

Uma descrição detalhada sobre o problema de estimação global e local, assim como os efeitos de regularização no contexto das redes de modelos locais é tratada em Abonyi e Babuska (2000) e Johansen e Babuska (2003). Além disso, a decomposição incremental permite que o desempenho da rede seja acompanhado a cada iteração. Este fato é bastante desejável na prática, pois permite acompanhar os critérios de satisfação da rede, ajudando a analisar e evitar situações como o sobre-ajuste dos dados, possibilitando uma seleção mais intuitiva da complexidade da rede.

Para facilitar a compreensão do procedimento demonstrado até o momento, apresenta-se um exemplo da aplicação do algoritmo LOLIMOT. O exemplo corresponde à aproximação de um conjunto

de pontos que formam a superfície apresentada na Figura3.6. O objetivo é identificar uma função que

represente esta superfície por modelos lineares (planos), de complexidade inferior.

Para o ajuste dos dados pela rede de modelos lineares locais empregou-se o algoritmo LOLIMOT utilizando duas iterações. A progressão do algoritmo é demonstrada para a divisão das faixas de

operação dos modelos locais na Figura 3.7. Na Figura 3.8, é feita a comparação entre os dados

disponíveis (pontos) e a saída estimada pela rede (superfície). As iterações do algoritmo são detalhas a seguir:

• Primeira iteração: O algoritmo tem início com um único modelo linear que representa toda a faixa de operação da rede. Nesse caso, como o vetor de espaços possui duas dimensões (duas