• Nenhum resultado encontrado

Controle cooperativo de sistemas dinâmicos através de redes de comunicação

N/A
N/A
Protected

Academic year: 2021

Share "Controle cooperativo de sistemas dinâmicos através de redes de comunicação"

Copied!
72
0
0

Texto

(1)

UNIVERSIDADE ESTADUAL DE CAMPINAS

Faculdade de Engenharia Elétrica e de Computação

Thais Tóssoli de Sousa

Controle Cooperativo de Sistemas Dinâmicos

Através de Redes de Comunicação

Campinas

2015

(2)

Thais Tóssoli de Sousa

Controle Cooperativo de Sistemas Dinâmicos Através de

Redes de Comunicação

Dissertação apresentada à Faculdade de Enge-nharia Elétrica e de Computação da Univer-sidade Estadual de Campinas como parte dos requisitos exigidos para a obtenção do título de Mestra em Engenharia Elétrica, na Área de Automação.

Orientador: Prof. Dr. José Cláudio Geromel

Este exemplar corresponde à versão final da tese defendida pela aluna Thais Tóssoli de Sousa, e orientada pelo Prof. Dr. José Cláudio Geromel

Campinas

2015

(3)
(4)
(5)

Aos meus pais, Paulo Eduardo e Marly, e à minha irmã, Letícia.

(6)

Agradecimentos

É com muito carinho e admiração que gostaria de registrar meus sinceros agra-decimentos às pessoas que estiveram ao meu lado, que sempre me apoiaram e contribuíram para o meu crescimento pessoal e intelectual.

Primeiramente, agradeço a Deus por todas as bençãos recebidas ao longo de toda a minha vida.

Aos meus pais, Paulo Eduardo e Marly, por todos os ensinamentos que me torna-ram a pessoa que sou hoje, pelo amor incondicional, apoio e incentivo em todas as minhas decisões e conquistas, pessoais e profissionais, ao longo da minha vida, nas quais, sem dúvida nenhuma, desempenharam papéis essenciais.

À minha querida irmã, Letícia, que, com o seu jeito divertido e descontraído, cooperou para que eu enfrentasse as dificuldades encontradas ao longo das minhas conquistas, sempre me incentivando a seguir em frente.

Aos meus avós maternos, Nelson (in memorian) e Elza (in memorian), e paternos, Benedicto (in memorian) e Maria, por sempre me incentivarem, rezarem e torcerem para o meu sucesso, pelas ótimas lembranças e marcas que deixaram na minha vida, que me tornaram a pessoa que sou hoje.

Finalmente, ao meu orientador, José C. Geromel, pela oportunidade do desenvol-vimento deste projeto conjunto e por todos os conhecimentos transmitidos desde a época da graduação, que foram essenciais para a realização deste trabalho e para o meu crescimento intelectual.

(7)

Resumo

Nesta dissertação, são propostas técnicas de projeto de controladores para sistemas dinâmi-cos lineares que disputam uma faixa do canal de comunicação e são controlados através de sinais de controle transmitidos por um canal com largura de banda limitada. A fim de obter um controlador para estes sistemas em rede, são apresentadas três abordagens de controle distintas, a saber: controle centralizado, controle descentralizado e controle desacoplado. De-senvolvemos, para cada uma das abordagens propostas, um método de cálculo das matrizes de controle e da regra de comutação, baseado em um sistema de desigualdades matriciais li-neares capaz de melhorar o desempenho. Os resultados teóricos são aplicados em um exemplo prático constituído por dois pêndulos invertidos que devem ser controlados através de uma rede de comunicação de tal forma a mantê-los em equilíbrio na posição vertical para cima. O projeto, a implementação e a validação dos resultados através de simulação numérica de cada uma das estratégias de controle sugeridas foram realizados e comparações dos resulta-dos obtiresulta-dos para cada uma delas colocam em evidência que o controle desacoplado resulta na estratégia mais eficiente para solucionar o problema abordado.

(8)

Abstract

In this work, new design techniques for networked control systems are proposed. The main feature is that the control signal transmission must be done in a cooperative basis in or-der to take into account the channel bandwidth limitation. Three different control strategies are considered, namely: centralized, decentralized and decoupled control. For each control structure we propose a switching rule able to improve performance, expressed in terms of linear matrix inequalities. The theoretical results are applied to the control of two inverted pendulums mounted in two independent cars. They are controlled through a communica-tion channel with limited bandwidth by taking into account a performance index. Several comparisons put in clear evidence the most useful and efficient control strategy to solve the proposed problem is decoupled control.

(9)

Lista de ilustrações

Figura 1 – Estrutura do sistema de controle em rede . . . 14

Figura 2 – Pêndulo invertido . . . 42

Figura 3 – Deslocamentos obtidos com o controle centralizado . . . 46

Figura 4 – Regra de comutação para o controle centralizado . . . 47

Figura 5 – Deslocamentos obtidos com o controle descentralizado . . . 49

Figura 6 – Regra de comutação para o controle descentralizado . . . 50

Figura 7 – Deslocamentos obtidos com o controle desacoplado . . . 52

Figura 8 – Regra de comutação para o controle desacoplado . . . 52

Figura 9 – Carros - controle centralizado, descentralizado e desacoplado . . . 54

Figura 10 – Pêndulos - controle centralizado, descentralizado e desacoplado . . . 54

Figura 11 – Esforço de controle - controle centralizado, descentralizado e desacoplado 55 Figura 12 – Programa de simulação no ambiente Simulink . . . 72

(10)

Lista de tabelas

Tabela 1 – Parâmetros dos dois pêndulos invertidos . . . 43 Tabela 2 – Custo calculado para cada uma das estratégias de controle . . . 53

(11)

Lista de acrônimos e abreviações

K Conjunto de subsistemas N(A) Espaço nulo da matriz A N Conjunto dos números naturais R Conjunto dos números reais

Rn Vetor coluna com coeficientes reais de dimensão n Rn×m Matriz com coeficientes reais de dimensão n × m tr(A) Traço da matriz A

ATransposta da matriz A

A−1 Inversa da matriz A

HConjugado transposto da matriz complexa H

P >0 Matriz simétrica P é definida positiva P ≥0 Matriz simétrica P é semi-definida positiva

(12)

Sumário

1 Introdução . . . . 14

1.1 Descrição Sumária dos Capítulos . . . 17

2 Resultados Básicos . . . . 19

2.1 Sistemas Lineares Invariantes no Tempo . . . 19

2.2 Estabilidade . . . 20

2.3 Norma H2 . . . 23

2.3.1 Norma H2 para Sistemas a Tempo Contínuo . . . 23

2.3.2 Norma H2 para Sistemas a Tempo Discreto . . . 25

2.4 Sistema Discreto Equivalente . . . 27

2.5 Sistemas com Comutação . . . 28

2.6 Conclusão . . . 30

3 Síntese de Controle via Rede . . . . 31

3.1 Descrição do problema . . . 31

3.2 Síntese da lei de controle . . . 34

3.2.1 Controle Centralizado . . . 36

3.2.2 Controle Descentralizado . . . 37

3.2.3 Controle Desacoplado . . . 38

3.3 Conclusão . . . 40

4 Modelagem e Implementação Numérica . . . . 41

4.1 Modelagem Matemática do Pêndulo Invertido . . . 41

4.2 Implementação Numérica . . . 44 4.2.1 Controle Centralizado . . . 45 4.2.2 Controle Descentralizado . . . 47 4.2.3 Controle Desacoplado . . . 50 4.2.4 Comparação . . . 53 4.3 Conclusão . . . 55 Conclusão . . . . 56 Referências . . . . 58

APÊNDICE A Resultados Auxiliares . . . . 59

APÊNDICE B Programas . . . . 62

(13)

B.2 Programa Principal - Controle Desacoplado . . . 64

B.3 Programa Sistema Discreto Equivalente . . . 67

B.4 Programa LMI - Controle Centralizado e Descentralizado . . . 67

B.5 Programa LMI - Controle Desacoplado . . . 70

B.6 Programa de Simulação - Supervisor . . . 71

(14)

14

1 Introdução

Recentemente, os avanços tecnológicos, principalmente relacionados ao acesso e controle remoto de sistemas dinâmicos, têm atraído a atenção da comunidade científica para o estudo conjunto de dois temas até então independentes, sistemas de controle e sistemas de comunicação. A denominação, já bem sedimentada na literatura técnica internacional, é Networked Control Systems - NCS. Neste contexto, as teorias de controle e de comunicação são estudadas de forma única, a fim de colocar em evidência os seus pontos de contato.

O artigo base (HESPANHA et al., 2007) aponta os problemas importantes para a síntese de controle nesta nova área de pesquisa, apresentando as limitações impostas pelo uso dos canais de comunicação para conectar os diversos subsistemas e os seus respectivos controladores. Nele, é dado maior destaque para as principais limitações impostas pela rede de comunicação, como limitação da taxa de transmissão de pacotes, taxa de amostragem, atraso na transmissão do sinal e perda de pacotes.

A Figura 1 apresenta uma possível estrutura para o controle simultâneo e coope-rativo de sistemas dinâmicos lineares, a qual será utilizada como uma referência importante no presente estudo. Os sinais de controle competem pelo mesmo canal de comunicação, que é modelado como um meio físico com largura de banda igual a 1/T . Dessa forma, o período em que o sinal de controle pode ser modificado está limitado inferiormente pelo valor T > 0.

C

S1 S2 SN

Figura 1 – Estrutura do sistema de controle em rede

(15)

Capítulo 1. Introdução 15

representação de estado mínima dada por

˙xi(t) = Aixi(t) + Biui(t) , xi(0) = xi0 (1.1)

zi(t) = Cixi(t) + Diui(t) (1.2)

em que xi(t) ∈ Rné a sua variável de estado, ui(t) ∈ Rm é o seu sinal de controle e zi(t) ∈ Rr

é a sua variável de saída controlada. Esses N subsistemas devem ser controlados através de um dispositivo C, cujo objetivo é implementar de forma cooperativa uma lei de controle que preserve a estabilidade e imponha um bom desempenho para o sistema global. Neste sentido, adotamos a seguinte estratégia: Em cada instante genérico de tempo tk0, ∀k ∈ N, tal que

tk+1 − tk = T , um coordenador estabelece, com base nas informações disponíveis, o índice

de um dos subsistemas σ(tk) = i ∈ K no qual o sinal de controle efetivamente atua. Assim

sendo, para todo t ∈ [tk, tk+1), o controle pode ser definido da seguinte forma

uj(t) =    uj(tk−1) j 6= σ(tk) vj(tk) j = σ(tk) (1.3)

É importante ressaltar os seguintes aspectos:

Para os subsistemas que não foram escolhidos pelo coordenador em t = tk, ou seja,

j 6= σ(tk), o sinal de controle permanece o mesmo até o tempo final tk+1. Nesta situação,

o controlador atua localmente e apenas repete o sinal de controle adotado no período de tempo anterior. Dessa forma, o canal de comunicação não é ocupado pela ação do controle nesse subsistema.

Para o subsistema que foi escolhido pelo coordenador em t = tk, ou seja, j = σ(tk),

o sinal de controle a ser aplicado até o instante final tk+1 é definido por um ganho de

realimentação de estado

vj(t) = Kjuj(tk−1) + Ljxj(tk) , t ∈ [tk, tk+1) (1.4)

que deve ser calculado tendo em vista a estabilidade e a otimização do desempenho do sistema global em malha fechada. Note que, nesse caso, o canal de comunicação é ocupado pela ação de controle nesse subsistema.

Neste trabalho, serão desenvolvidas condições e métodos numéricos para obter os ganhos de realimentação de estado Kj ∈ Rm×m e Lj ∈ Rm×n, ∀j ∈ K, e a estratégia de

(16)

Capítulo 1. Introdução 16

forma a otimizar o seguinte critério de desempenho: J =X i∈K Z ∞ 0 zi(t)z i(t)dt (1.5)

Como podemos notar, trata-se de um problema do tipo Linear-Quadrático, que leva em consideração duas características importantes, a saber: limitação da largura de banda do canal de comunicação e a existência de um coordenador, veja a Figura 1, que tem como ob-jetivo orquestrar a atuação do controle global de forma cooperativa. Alguns aspectos teóricos relevantes no estudo proposto devem ser ressaltados.

• Estabilidade: Não é evidente como será o comportamento dinâmico do sistema global em malha fechada quando há uma eventual falha de informação para implementar o controle local, tendo em vista

1. A existência de subsistemas com índices i ∈ K que não são escolhidos para que o seu sinal de controle seja atualizado no intervalo t ∈ [tk, tk+1), para algum k ∈ N.

2. O valor da largura de banda 1/T , que determina que o controle permaneça cons-tante no intervalo de tempo t ∈ [tk, tk+1), para todo k ∈ N, mesmo para o

sub-sistema que foi escolhido pelo coordenador. Há grande interesse em considerar o período de amostragem T o maior possível desde que isso não venha a comprome-ter, em excesso, o desempenho do sistema em malha fechada.

• Desempenho: Além de estabelecer as condições de estabilidade, é essencial estudar o problema de controle ótimo, o qual, ao ser resolvido, fornece uma lei de comutação σ(x) : Rn → K e os ganhos de realimentação locais K

j e Lj, para todo j ∈ K. É

importante verificar se uma lei de comutação do tipo σ(x) = arg min

i∈K xP

ix (1.6)

com Pi >0, para todo i ∈ K, se adapta bem ao problema aqui proposto.

• Controle Descentralizado: Nesta abordagem, a estrutura de controle proposta em (1.3)-(1.4) é do tipo descentralizada, ou seja, o controle em cada um dos subsistemas, que disputam uma banda no canal de comunicação, depende apenas de suas variáveis locais. Essa configuração torna a etapa de síntese bastante desafiadora.

(17)

Capítulo 1. Introdução 17

• Controle Centralizado: Nesta abordagem, a estrutura de controle proposta em (1.3)-(1.4) é modificada para uj(t) =    uj(tk−1) j 6= σ(tk) vj(tk) j = σ(tk) (1.7) vj(t) = Kju(tk−1) + Ljx(tk) , t ∈ [tk, tk+1) (1.8)

a qual é do tipo centralizada, ou seja, o controle em cada um dos subsistemas que disputam uma banda no canal de comunicação depende, não apenas das suas variáveis locais, mas também de todas as variáveis associadas aos demais subsistemas.

• Controle Desacoplado: Nesta abordagem, a estrutura de controle proposta em (1.3)-(1.4) é do tipo desacoplada, ou seja, o controle de cada um dos subsistemas, que disputam uma banda no canal de comunicação, é calculado de maneira independente de tal forma a ser igual ao ganho ótimo obtido através da solução da equação de Riccati. Com este ganho ótimo em mãos, é calculada a regra de comutação.

1.1 Descrição Sumária dos Capítulos

Esta dissertação está organizada em quatro capítulos que passamos a descrever sumariamente em seguida:

• Capítulo 1: Neste capítulo, é apresentada uma breve introdução do problema que será analisado ao longo do texto, descrevendo a sua formulação e os seus objetivos. Apresentamos ainda uma breve descrição dos demais capítulos.

• Capítulo 2: Neste capítulo, é apresentado o conceito de estabilidade. Inicialmente, através dos pontos de equilíbrio, os tipos de equilíbrio e, a partir disso, a estabilidade de sistemas lineares é estudada usando a teoria de Lyapunov. Também é apresentado um estudo a respeito de normas de sistemas dinâmicos e de suas trajetórias, mostrando métodos para o cálculo da norma H2 através de problemas de otimização convexa, com

restrições descritas por desigualdades matriciais lineares (Linear Matrix Inequalities -LMIs). Além disso, os sistemas dinâmicos com comutação são apresentados e discutidos. • Capítulo 3: Neste capítulo, é apresentada uma descrição detalhada do problema a ser resolvido através de algumas possíveis abordagens de síntese da lei de controle para o mesmo. Inicialmente, é apresentada a sua descrição, baseando-se no modelo do sistema

(18)

Capítulo 1. Introdução 18

dinâmico descrito pelas suas equações de estado a tempo contínuo, as quais são uti-lizadas, em seguida, para calcular o sistema a tempo discreto equivalente. Estas duas classes de problemas são utilizadas frequentemente no decorrer desta dissertação. Além disso, é apresentada a síntese da lei de controle para as três abordagens escolhidas, a saber: controle centralizado, controle descentralizado e controle desacoplado. Estes três procedimentos de síntese são expressos através de problemas de otimização con-vexa com restrições descritas por LMIs. As contribuições teóricas estão descritas em (SOUSA et al., 2015).

• Capítulo 4: Neste capítulo, é obtido, primeiramente, um modelo matemático para um sistema dinâmico composto por dois pêndulos invertidos desacoplados que devem ser controlados através de uma rede de comunicação visando equilibrá-los na posição vertical para cima. Em seguida, é realizado o projeto, implementação e validação através de simulação numérica de cada uma das estratégias de controle abordadas no capítulo anterior. Finalmente, é apresentada uma comparação entre estas abordagens propostas para o controle deste sistema dinâmico, a partir de condições iniciais idênticas e mesmo período de amostragem. A implementação prática e os resultados obtidos estão descritos em (SOUSA et al., 2015).

• Apêndice A: Neste apêndice, discutimos o teorema de Parseval e o cálculo do com-plemento de Schur no contexto de desigualdades matriciais lineares.

• Apêndice B: Este apêndice contém uma listagem comentada dos programas compu-tacionais desenvolvidos para os ambientes MatLab e Simulink.

(19)

19

2 Resultados Básicos

Neste capítulo, são apresentados e discutidos alguns conceitos fundamentais para o desenvolvimento desta dissertação. Primeiramente, é apresentada a definição de estabi-lidade, através do conceito de pontos de equilíbrio, os tipos de equilíbrio e, a partir dele, a estabilidade de sistemas lineares é estudada utilizando a teoria de Lyapunov. A seguir, procedemos ao cálculo de normas de sistemas dinâmicos e de suas trajetórias. Devido a sua importância, apresentamos métodos numéricos para o cálculo da norma H2, através de

pro-blemas de otimização convexa com restrições descritas por LMIs. Além disso, é apresentada uma formulação que permite obter o sistema a tempo discreto equivalente a um determi-nado sistema linear a tempo contínuo, (SOUZA, 2012). Finalmente, são discutidos conceitos básicos importantes de sistemas com comutação a tempo discreto.

2.1 Sistemas Lineares Invariantes no Tempo

Um sistema linear invariante no tempo pode ser representado através de seu mo-delo de estado, na forma

Gc :    ˙x(t) = Ax(t) + Ew(t), x(0) = ξ z(t) = Cx(t) + Rw(t) (2.1)

em tempo contínuo, e na forma

Gd :    xk+1 = Axk+ Ewk, x0 = ξ zk = Cxk+ Rwk (2.2) em tempo discreto. Em ambos os modelos, x ∈ Rn é o vetor de estado, w ∈ Rq representa

uma entrada externa e z ∈ Rr é o vetor de saída. As matrizes (A, E, C, R), com dimensões

compatíveis, definem uma determinada realização. Um sistema linear é classificado como estritamente próprio se R = 0, e próprio, caso contrário.

A função de transferência do sistema a tempo contínuo (2.1) é dada, em termos da transformada de Laplace, por

H(s) = C(sI − A)−1E+ R (2.3)

enquanto que a função de transferência do sistema a tempo discreto (2.2) é dada, em termos da sua transformada Z, por

(20)

Capítulo 2. Resultados Básicos 20

É importante ressaltar que a matriz A ∈ Rn×n desempenha papel central no

com-portamento dinâmico de ambos os sistemas, uma vez que seus autovalores determinam os pó-los da função de transferência e, portanto, os seus modos próprios, (GEROMEL; PALHARES, 2011). Dessa forma, a análise da estabilidade de um sistema linear é essencialmente baseada na matriz que define a sua dinâmica, isto é, na verificação da região do plano complexo em que se situam todos os seus autovalores.

2.2 Estabilidade

O estudo de estabilidade de sistemas dinâmicos é muito explorado na literatura e é essencial para o projeto de sistemas de controle (GEROMEL; KOROGUI, 2011). Nesta seção, apresentamos o conceito de estabilidade para os sistemas lineares (2.1) e (2.2) considerando w ≡ 0. Primeiramente, discutimos a seguir o conceito de ponto de equilíbrio de sistemas dinâmicos (LUENBERGER, 1979).

Definição 2.1 (Ponto de Equilíbrio) O vetor xe ∈ Rn é um ponto de equilíbrio de um

sistema dinâmico a tempo contínuo (discreto) se a condição inicial x(0) = xe (x0 = xe) for

tal que x(t) = xe, ∀t ≥0 (xk = xe, ∀k ∈ N).

Sendo assim, xe é um ponto de equilíbrio de (2.1) se ele definir uma trajetória

constante no tempo, desde o instante inicial t = 0 até qualquer instante de tempo futuro t > 0. Como o vetor de estado deve permanecer constante nos pontos de equilíbrio, é fácil notar que xe satisfaz Axe= 0, ou seja, xe∈ N(A) . De maneira semelhante, se xe é ponto de

equilíbrio de (2.2) então ele satisfaz Axe = xe, ou seja, xe é um ponto fixo da transformação

linear definida pela matriz A.

Portanto, qualquer sistema linear possui a origem como um ponto de equilíbrio, que pode ou não ser único. Considerando essa propriedade, a análise a ser feita a partir desse momento será voltada exclusivamente para o ponto de equilíbrio xe= 0.

Definição 2.2 (Estabilidade) O ponto de equilíbrio xe = 0 é dito estável se, para qualquer

ǫ >0, existe δ(ǫ) tal que

(i) ||x(0)||2 < δ(ǫ) ⇒ ||x(t)||2 < ǫ, ∀t ≥0, no caso do sistema (2.1);

(ii) ||x0||2 < δ(ǫ) ⇒ ||xk||2 < ǫ, ∀k ∈ N, no caso do sistema (2.2).

(21)

Capítulo 2. Resultados Básicos 21

Além disso, a origem é dita globalmente assintoticamente estável se for estável e se, para qualquer condição inicial,

(i) lim

t→∞x(t) = 0, no caso do sistema (2.1);

(ii) lim

k→∞xk= 0, no caso do sistema (2.2).

É possível demonstrar que o sistema a tempo contínuo (2.1) é globalmente as-sintoticamente estável se, e somente se, a matriz A for Hurwitz estável1. De forma análoga,

o sistema a tempo discreto (2.2) é globalmente assintoticamente estável se, e somente se, a matriz A for Schur estável2.

A análise de estabilidade de sistemas lineares também pode ser realizada através da aplicação do critério de Lyapunov, que exige um comportamento decrescente, em relação ao tempo, de uma função ν(x(t)), que pode ser interpretada como a distância ao quadrado entre um ponto genérico da trajetória x(t) e o ponto de equilíbrio x = 0. Essa função ν : Rn→ Ré

denominada função de Lyapunov quando satisfaz as seguintes propriedades (LUENBERGER, 1979):

1. ν é continuamente diferenciável (ou apenas contínua no caso discreto); 2. ν(0) = 0 e ν(x) > 0 para todo x 6= 0;

3. ao longo de qualquer trajetória do sistema, o valor da função nunca cresce.

Note que a última condição pode ser reescrita como ˙ν(x) ≤ 0 para todo x(t) ∈ Rn, t ≥0, que

corresponde a uma trajetória genérica do sistema (2.1), ou ν(xk+1) − ν(xk) ≤ 0 para todo

xk∈ Rn, k ∈ N, que corresponde a uma trajetória genérica do sistema (2.2).

Como o valor da função de Lyapunov nunca aumenta em qualquer trajetória do sistema, a existência de ν garante a estabilidade da origem. A fim de garantir a estabili-dade assintótica global da origem, é necessário que a função de Lyapunov seja estritamente decrescente em qualquer trajetória. O teorema a seguir enuncia esse resultado.

Teorema 2.1 (Teorema de Lyapunov) Considere um sistema dinâmico autônomo, ou

seja, com entrada nula. Se existir uma função de Lyapunov ν : Rn → R tal que

(i) ν é estritamente decrescente para todo x 6= 0;

1 Matriz cujos autovalores possuem parte real negativa.

(22)

Capítulo 2. Resultados Básicos 22

(ii) ν(x) → ∞ sempre que ||x||2 → ∞.

então o ponto de equilíbrio x = 0 é globalmente assintoticamente estável.

Para estudar a estabilidade de sistemas lineares, é necessário escolher uma função de Lyapunov adequada. Uma possível candidata, muito utilizada no estudo de estabilidade de sistemas lineares, é a função quadrática ν(x) = xP x, na qual P ∈ Rn×n é uma matriz

definida positiva (P > 0).

Considerando o sistema (2.1), deve-se impor que ˙ν(x) = ˙xP x+ xP˙x

= x(AP + P A)x

< 0 (2.5)

para todo x 6= 0. Portanto, pelo Teorema 2.1, a matriz A é Hurwitz estável se, e somente se, existir uma matriz P > 0 tal que

AP + P A < 0 (2.6)

Tal condição é denominada desigualdade matricial de Lyapunov, e representa uma LMI, sendo, desta maneira, uma restrição convexa na variável matricial P. Note que essa de-sigualdade, quando factível, apresenta infinitas soluções. Uma solução específica pode ser obtida resolvendo-se a equação matricial AP + P A + Q = 0, com Q > 0 dada. O

re-sultado apresentado a seguir enuncia o critério de Lyapunov para os sistemas contínuos (GEROMEL; KOROGUI, 2011).

Lema 2.1 (Critério de Lyapunov - Tempo Contínuo) O sistema dinâmico linear a

tem-po contínuo ˙x = Ax é globalmente assintoticamente estável se, e somente se, para qualquer matriz Q > 0 dada, existir P > 0 solução da equação matricial de Lyapunov

AP + P A + Q = 0 (2.7)

Realizando a mesma análise para o sistema a tempo discreto (2.2), deve-se impor que

ν(xk+1) − ν(xk) = xk(AP A − P)xk

< 0 (2.8)

para todo xk 6= 0. Portanto, pelo Teorema 2.1, a matriz A é Schur estável se, e somente se,

existir uma matriz P > 0 tal que

(23)

Capítulo 2. Resultados Básicos 23

Esta LMI é a desigualdade de Lyapunov para sistemas discretos. De maneira análoga ao caso contínuo, uma solução específica de (2.9) pode ser obtida resolvendo-se AP A − P + Q = 0, para Q > 0 dada. O resultado apresentado a seguir enuncia o critério de

Lyapunov para os sistemas a tempo discreto, (GEROMEL; KOROGUI, 2011).

Lema 2.2 (Critério de Lyapunov - Tempo Discreto) O sistema dinâmico linear a

tem-po discreto xk+1 = Axk é globalmente assintoticamente estável se, e somente se, para qualquer

matriz Q > 0 dada, existir P > 0 solução da equação matricial de Lyapunov

AP A − P + Q = 0 (2.10)

Os Lemas 2.1 e 2.2 caracterizam a estabilidade assintótica global para os sistemas lineares (2.1) e (2.2), respectivamente, considerando-se a entrada w ≡ 0.

2.3 Norma H

2

A norma H2 é um dos critérios mais utilizados para a análise do desempenho de

sistemas dinâmicos. Nesta seção, será apresentado o seu cálculo através de gramianos e, no contexto da programação convexa, através de desigualdades matriciais lineares (LMIs), para os sistemas dinâmicos lineares a tempo contínuo e a tempo discreto descritos, respectiva-mente, em (2.1) e (2.2).

2.3.1

Norma

H

2

para Sistemas a Tempo Contínuo

Considerando o sistema a tempo contínuo (2.1), cuja função de transferência é dada por (2.3). Define-se a sua norma H2 como

||Gc||22 = 1 Z ∞ −∞tr(H(jω)H(jω)) dω (2.11)

Pode-se dizer que Gc ∈ H2 se, e somente se, a integral (2.11) convergir. Utilizando o teorema

de Parseval, apresentado no Apêndice A, a norma H2 pode ser reescrita como

||Gc||22 =

Z ∞

0 tr(h(t)

h(t)) dt (2.12)

sendo h(t) a resposta ao impulso, ou seja, h(t) = L−1[H(s)].

Note que a função de transferência, descrita em (2.3), pertence à classe H2 se, e

somente se, A for Hurwitz estável e R = 0. De fato, considerando o caso geral, a resposta ao impulso deste sistema é dada por

h(t) = L−1[H(s)] = CeAt

(24)

Capítulo 2. Resultados Básicos 24 Portanto, a integral Z ∞ 0 tr(h(t)h(t)) dt = trE′Z ∞ 0 e At CCeAt dt E  + tr(ECR) + tr(RCE) +Z ∞ 0 tr(RR)δ2(t) dt (2.14)

converge se, e somente se, ambos os requisitos mencionados sejam atendidos. Sendo assim, apenas sistemas assintoticamente estáveis e estritamente próprios compõem a classe H2.

Do resultado acima, tendo em vista a propriedade de invariância do traço quanto à transposição obtém-se ||Gc||22 = tr  E′ Z ∞ 0 e At CCeAt dt E  = trC Z ∞ 0 e At EEeAt dt C′  (2.15) Então, ||Gc||22 = tr (EPoE) = tr (CPcC′) (2.16)

em que a matriz Po é o gramiano de observabilidade do sistema (2.1), dado por

Po =

Z ∞

0 e

At

CCeAt dt (2.17)

e a matriz Pc é o gramiano de controlabilidade deste mesmo sistema, dado por

Pc =

Z ∞

0 e

AtEEeAt

dt (2.18)

É importante notar que estas matrizes podem ser obtidas pela resolução das equa-ções de Lyapunov (GEROMEL; KOROGUI, 2011)

APo+ PoA+ CC = 0 (2.19)

APc + PcA+ EE′ = 0 (2.20)

Observe que as condições necessárias e suficientes para que os gramianos Po e Pc sejam

matrizes definidas positivas são, respectivamente, a observabilidade do par (A, C) e a con-trolabilidade do par (A, E).

A seguir, é apresentado como a norma H2 do sistema linear (2.1) pode ser obtida

através da resolução de problemas de otimização convexa. O lema a seguir (OLIVEIRA, 1999) é essencial para atingir esse objetivo.

Lema 2.3 Seja A uma matriz Hurwitz estável. Se os pares (P1, Q1) e (P2, Q2) satisfazem a

equação de Lyapunov AP + P A + Q = 0, então Q

(25)

Capítulo 2. Resultados Básicos 25

Considerando a desigualdade de Lyapunov AP + P A + CC <0, então qualquer

solução P > 0 desta inequação é tal que P > Po. Dessa forma, dado que P > 0 satisfaz esta

desigualdade, pode-se concluir que existe V > 0 tal que AP + P A + CC = −V e, usando o

Lema 2.3 conclui-se que P > Po. Portanto, a norma H2 do sistema (2.1) pode ser calculada

a partir do solução do problema de otimização semidefinida ||Gc||22 = inf

P >0{tr (E

P E) : AP + P A + CC <0} (2.21)

De maneira análoga, para o gramiano de controlabilidade, é possível obter a norma H2

resolvendo-se

||Gc||22 = inf

P >0{tr (CP C

) : AP + P A + EE<0} (2.22)

Note que as soluções dos problemas (2.21) e (2.22) são obtidas com P = Po>0 e P = Pc >0,

em cada um dos casos. A vantagem destas formulações é que a norma H2 é calculada através

da solução de problemas convexos. A literatura atual traz diversos algoritmos capazes de manipular de forma eficiente problemas de otimização desta classe.

2.3.2

Norma

H

2

para Sistemas a Tempo Discreto

Considerando o sistema a tempo discreto (2.2), cuja função de transferência é dada por (2.4). Define-se a sua norma H2 como

||Gd||22 = 1 Z 0 tr(H(e )H(e) dω (2.23)

De maneira análoga ao caso contínuo, pode-se dizer que Gd∈ H2 se, e somente se,

a integral (2.23) convergir. Utilizando o teorema de Parseval, apresentado no Apêndice A, a norma H2 pode ser reescrita como

||Gd||22 =

X

k∈N

tr(h

khk) (2.24)

sendo hk a resposta ao impulso, ou seja, hk = Z−1[H(z)].

É importante observar que o sistema Gd, com função de transferência descrita em

(2.4), pertence à classe H2 se, e somente se, A for Schur estável. Desta forma, utilizando a

transformada Z inversa, a resposta ao impulso deste sistema é dada por

hk= Z−1[H(z)] =    R , se k = 0 CAk−1E , se k ≥ 1 (2.25) Portanto, a série X k∈N tr(hkhk) = tr  E′X k∈N (A)kCCAkE  + tr(RR) (2.26)

(26)

Capítulo 2. Resultados Básicos 26

é convergente se, e somente se, A for Schur estável.

Portanto, de forma análoga à realizada para sistemas a tempo contínuo, a norma H2 pode ser obtida através da relação

||Gd||22 = tr (EPoE) + tr(RR) = tr (CPcC) + tr(RR) (2.27) na qual Po = X k∈N (A)kCCAk (2.28) é o gramiano de observabilidade e Pc = X k∈N (A)k EE(A′)k (2.29)

é o gramiano de controlabilidade do sistema (2.2). Observe que as condições necessárias e suficientes para que os gramianos Po e Pc sejam matrizes definidas positivas são,

respectiva-mente, a observabilidade do par (A, C) e a controlabilidade do par (A, E). Sendo assim, as matrizes Po > 0 e Pc >0 definidas acima são soluções das equações de Lyapunov a tempo

discreto (GEROMEL; KOROGUI, 2011)

APoA − Po+ CC = 0 (2.30)

APcA− Pc+ EE′ = 0 (2.31)

Para finalizar essa seção, será apresentado o cálculo da norma H2 do sistema (2.2)

através da solução de um problema de otimização semidefinida. O lema a seguir possibilita a obtenção desse resultado.

Lema 2.4 Seja A uma matriz Schur estável. Se os pares (P1, Q1) e (P2, Q2) satisfazem a

equação de Lyapunov AP A − P + Q = 0, então Q

1 > Q2 implica em P1 > P2.

Considerando a desigualdade de Lyapunov AP A − P + CC <0, então qualquer

solução P > 0 desta inequação é tal que P > Po. Sendo assim, se P > 0 satisfaz esta

desigualdade, então existe V > 0 tal que AP A − P + CC = −V e, através do Lema 2.4,

conclui-se que P > Po. Portanto, a norma H2 do sistema (2.2) pode ser calculada a partir da

solução do problema de otimização semidefinida ||Gd||22 = infP >

0{tr (E

P E+ RR) : AP A − P + CC <0} (2.32)

De maneira análoga, para o gramiano de controlabilidade, é possível obter a norma H2

resolvendo-se

||Gd||22 = infP >

0{tr (CP C

(27)

Capítulo 2. Resultados Básicos 27

Como no caso contínuo, as soluções dos problemas (2.32) e (2.33) são obtidas com P = Po > 0 e P = Pc > 0, respectivamente. Note que, ||Gd||2 finita não requer que a

função de transferência seja estritamente própria. É importante ressaltar que os problemas de otimização acima são convexos e, portanto, podem ser resolvidos sem grandes dificuldades, (BOYD L. EL GHAOUI; BALAKRISHNAN, 1994).

2.4 Sistema Discreto Equivalente

Considere o sistema dinâmico linear invariante no tempo descrito por

G :    ˙x(t) = Ax(t) + Buk(t) + Ew(t), x(0) = ξ z(t) = Cx(t) + Duk(t) + Rw(t) (2.34)

em que x ∈ Rn é vetor de estado, u

k ∈ Rm é o vetor de entrada de controle e w ∈ Rq é o

vetor de entrada exógena. Além disso, definimos as matrizes aumentadas

A =   A B 0 0  ∈ R(n+m)×(n+m) (2.35) C = h C D i∈ Rr×(n+m) (2.36)

que apresentam estruturas bastante particulares. Elas serão frequentemente utilizadas no decorrer desta dissertação. Suponha que este sistema evolua a partir da condição inicial ξ 6= 0, porém sem perturbações externas, ou seja, w ≡ 0. O teorema a seguir apresenta um sistema a tempo discreto que é equivalente ao sistema que acabamos de introduzir no que diz respeito ao cálculo de normas, (SOUZA, 2012).

Teorema 2.2 (Sistema Discreto Equivalente) Considere o sistema (2.34), com w ≡ 0

e uk(t) = u(tk) = uk, ∀t ∈ [tk, tk+1). Defina as matrizes (Ad, Bd, Cd, Dd) de dimensões

compatíveis tais que

eAT =   Ad Bd 0 I   (2.37) Z T 0 e A′t C′CeAt dt=   Cd Dd     Cd Dd′   ′ (2.38)

e o sistema linear a tempo discreto Ge :    ˙xk+1 = Adxk+ Bduk, x(0) = ξ zk = Cdxk+ Dduk (2.39)

(28)

Capítulo 2. Resultados Básicos 28

Então, a seguinte igualdade é satisfeita

Z ∞

0 z(t)

z(t) dt = X

k∈N

zkzk (2.40)

Prova: A prova deste Teorema pode ser encontrada na integra em (SOUZA, 2012).

É importante ressaltar que a identidade (2.40) apresentada no Teorema 2.2 é exata, ou seja, não é baseada em nenhuma aproximação. Portanto, podemos computar a norma H2 da saída do sistema a tempo contínuo (2.34) através do cálculo da norma H2 de

um sistema a tempo discreto o qual, por esta razão, é denominado equivalente. Observe que a equação dinâmica (2.39) pode ser facilmente obtida a partir do sistema original através do cálculo da exponencial de matriz, eAT, uma vez que existem na literatura técnicas bem

eficientes para o seu cálculo. Para determinar as matrizes Cde Dd, devemos calcular a integral

Q(T ) =Z T

0 e

A′τ

C′Ce (2.41)

que pode ser obtida a partir de rotinas de integração numérica, (LUENBERGER, 1979). Em seguida, as matrizes Cd e Dd são determinadas através da decomposição em valores

singulares de Q(T ). De fato, como Q(T ) é simétrica e definida positiva, existem matrizes U ∈ R(n+m)×(n+m) unitária e S ≥ 0 ∈ R(n+m)×(n+m) diagonal, tais que

Q(T ) = USU(2.42)

Sendo assim, de (2.38) e (2.42), temos que

h

Cd Dd

i

= S1

2U′ (2.43)

Portanto, Cd e Dd são partições de S

1

2U, a primeira contendo as n primeiras colunas e a

segunda contendo as m restantes. Note que, no caso acima, as matrizes Cd e Dd possuem

n+ m linhas, fazendo com que, em geral, a dimensão do vetor de saída do sistema discreto equivalente seja sensivelmente maior que a dimensão do vetor de saída do sistema a tempo contínuo original. Finalmente, é importante notar em (2.37) que as matrizes Ad e Bd podem

ser facilmente obtidas pelo fato de serem partições de eAT, sendo A

d∈ Rn×n e Bd∈ Rn×m.

2.5 Sistemas com Comutação

Sistemas com comutação a tempo discreto, representados por Gσ, são variantes

no tempo e caracterizados por possuírem uma função de comutação σk : k ∈ N → K

(29)

Capítulo 2. Resultados Básicos 29

dissertação o sinal de controle u(t) é considerado constante para todo t ∈ [tk, tk+1), de tal

forma a respeitar a limitação de largura de banda do canal de comunicação, focamos nossa atenção apenas nos sistemas com comutação a tempo discreto, apesar de existirem outras aplicações que utilizem a abordagem a tempo contínuo, (DEAECTO, 2010). Considere o sistema com comutação em tempo discreto Gσ descrito por

xk+1 = Aσkxk (2.44)

zk = Cσkxk (2.45)

com condição inicial x0 dada. Seja xk ∈ Rn o vetor de estado, zk ∈ Rr o vetor de saída

controlada e σk : k ∈ N → K a função de comutação. Esta função seleciona em cada

instante de tempo um subsistema Gi = (Ai, Ci), i ∈ K dentre os N possíveis, com matrizes

de dimensões compatíveis.

Definição 2.3 (Matriz de Metzler) Uma matriz quadrada Π = {πji} ∈ RN×N com todos

os seus elementos fora da diagonal principal não-negativos é denominada matriz de Metzler. Para N dado, todas as matrizes de Metzler de mesma dimensão constituem o conjunto M. Um subconjunto denominado Md, constituído por todas as matrizes de Metzler

que satisfazem

πii0,

X

j∈K

πji = 1, ∀i ∈ K (2.46)

é utilizado no estudo dos sistemas com comutação a tempo discreto. As matrizes de Metzler apresentam inúmeras propriedades importantes e úteis. Elas decorrem do fato de que se Π ∈ M sempre existe um escalar c > 0 de tal forma que Π + cI seja uma matriz com todos os seus elementos não-negativos, incluindo aqueles da sua diagonal principal. Assim sendo, viabiliza-se a utilização do Teorema de Frobenius-Perron, (LUENBERGER, 1979). Com base nessa classe de matrizes, adotamos algumas notações especiais

Ppi=

X

j∈K

πjiPj (2.47)

sendo que Pj >0 para todo j ∈ K e Π = {πji} ∈ Md.

Teorema 2.3 (DEAECTO, 2010) Para o sistema a tempo discreto (2.44)-(2.45), a regra de

comutação (1.6) é globalmente estabilizante e a desigualdade ||z||2

2 <mini∈Kx′0Pix0 é válida

(30)

Capítulo 2. Resultados Básicos 30 as desigualdades de Lyapunov-Metzler      Pi • • PpiAi PpiEi 0 I     >0, i ∈ K (2.48)

Prova: Veja a referência (DEAECTO, 2010). Maiores detalhes a respeito deste resultado

podem ser encontrados em (GEROMEL; COLANERI, 2006).

Nota-se que estas condições não são expressas por LMIs em relação às variáveis matriciais Pi, i ∈ K e Π ∈ Md. Felizmente, para Π ∈ Md dada, as referidas condições

tornam-se LMIs e, assim sendo, são resolvidas sem dificuldades para que as matrizes Pi, i ∈ K,

sejam calculadas. Neste contexto, o resultado do Teorema 2.3 será utilizado no Capítulo 3.

2.6 Conclusão

Neste capítulo, apresentamos conceitos fundamentais para a análise de sistemas dinâmicos e de sistemas de controle. Os conceitos de estabilidade e de pontos de equilíbrio foram apresentados e, a partir deles, a teoria de Lyapunov foi utilizada para estudar a esta-bilidade de sistemas lineares. Com base nestes resultados, foram obtidas LMIs que fornecem condições de estabilidade para sistemas lineares invariantes no tempo. Posteriormente, foi apresentada a norma H2 para sistemas a tempo contínuo e a tempo discreto, cujo cálculo é

baseado em problemas de otimização convexa com restrições descritas por LMIs. Também foi apresentada uma formulação que permite obter o sistema a tempo discreto equivalente a um determinado sistema linear a tempo contínuo sem que nenhuma aproximação seja in-troduzida. Finalmente, foram apresentados conceitos básicos importantes de sistemas com comutação a tempo discreto.

(31)

31

3 Síntese de Controle via Rede

Neste capítulo, é apresentada uma descrição detalhada do problema a ser resol-vido nesta dissertação, através de algumas possíveis abordagens específicas de síntese da lei de controle para o mesmo. Primeiramente, é apresentada a sua descrição, tendo como base o modelo do sistema dinâmico descrito por suas equações de estado a tempo contínuo, as quais, em seguida, permitem calcular o sistema a tempo discreto equivalente. Estas duas classes de sistemas dinâmicos serão utilizadas frequentemente no decorrer deste e do capítulo seguinte. A seguir, apresentamos a síntese da lei de controle para as três abordagens escolhidas, ini-ciando com o controle centralizado, seguido pelo controle descentralizado e, finalmente, com o controle desacoplado, no qual a lei de controle e a regra de comutação são determinadas separadamente. Todos esses três procedimentos de síntese são expressos através de problemas de otimização convexa com restrições descritas por LMIs.

3.1 Descrição do problema

Considere um conjunto de subsistemas dinâmicos, cada um deles denominado Si,

para i ∈ K, cuja representação de estado mínima é dada por

˙xi(t) = Aixi(t) + Biui(t) , xi(0) = xi0 (3.1)

zi(t) = Cixi(t) + Diui(t) (3.2)

em que xi(t) ∈ Rné a sua variável de estado, ui(t) ∈ Rm é o seu sinal de controle e zi(t) ∈ Rr

é a sua variável de saída controlada. Esta representação pode ser escrita na forma mais compacta

˙x(t) = Ax(t) + Bu(t) , x(0) = x0 (3.3)

z(t) = Cx(t) + Du(t) (3.4)

na qual os vetores com dimensões expandidas x, u, z são dados por x = [x

1· · · xN]′ ∈ RN n,

u= [u

1· · · uN]′ ∈ RN m e z = [z1′ · · · zN]′ ∈ RN r, e as matrizes indicadas se escrevem na forma

A = diag{A1, · · · , AN}

B = diag{B1, · · · , BN}

C = diag{C1, · · · , CN}

(32)

Capítulo 3. Síntese de Controle via Rede 32

É importante ressaltar que, neste caso, estas matrizes aumentadas (A, B, C, D) são bloco diagonais, devido ao fato de que todos os sistemas descritos em (3.1)-(3.2) são desacoplados. No entanto, não é necessário que esta estrutura seja mantida para que os resultados apre-sentados a seguir permaneçam válidos. De fato, eles se aplicam para sistemas mais gerais, da forma (3.3)-(3.4), sem a exigência de que as matrizes (A, B, C, D) tenham alguma estrutura particular.

Este sistema, apresentado em (3.3)-(3.4), é controlado através da entrada de con-trole u(t) ∈ RN m, que é transmitida através do canal com largura de banda limitada, que

é modelado através da imposição de que instantes sucessivos de amostragem obedeçam a relação tk+1− tk = T > 0, k ∈ N, em que 1/T é máxima frequência suportada pelo canal.

Sendo assim, este sinal é expresso na forma

u(t) = Fσu(tk−1) + Gσv(tk) (3.5)

v(tk) = Ku(tk−1) + Lx(tk) (3.6)

que é válida para todo t ∈ [tk, tk+1), k ∈ N. Desejamos implementar uma lei de controle

que faça uso do canal de comunicação para apenas um dos subsistemas em cada intervalo de tempo entre duas amostras sucessivas. Sendo i ∈ K o índice do subsistema a ser controlado, então ui(t) = vi(tk), ∀t ∈ [tk, tk+1) e uj(t) = uj(tk−1), ∀t ∈ [tk, tk+1), para todo j 6= i ∈ K.

Em outras palavras, enquanto um subsistema é controlado, o sinal de controle dos demais é repetido para que a limitação da capacidade de transmissão da rede seja atendida. Devemos notar que a lei de controle que acabamos de descrever é implementada através da definição das matrizes F{σ=i} ∈ RN m×N m e G{σ=i} ∈ RN m×N m para todo i ∈ K

F{σ=i} = diag{1, · · · , 1, 0, 1, · · · , 1}

G{σ=i} = I − F{σ=i}

onde o elemento nulo na diagonal de F{σ=i} ocorre na i-ésima posição. Portanto, a

represen-tação de estado do sistema em malha fechada é dada por

˙x = Ax + Bu(t) , x(0) = x0 (3.7)

z = Cx + Du(t) (3.8)

u(t) = Fσu(tk−1) + Gσv(tk) (3.9)

v(tk) = Ku(tk−1) + Lx(tk) (3.10)

Note que se trata de um modelo híbrido, contendo ambos os tipos de variáveis, a saber contínuas e discretas. Neste contexto, devemos determinar os ganhos de realimentação K ∈

(33)

Capítulo 3. Síntese de Controle via Rede 33

RN×N m e L ∈ RN×N n. Com este objetivo em mente, substituindo (3.10) em (3.9), obtemos a seguinte equação para o sinal de controle

u(tk) = (Fσ + GσK)u(tk−1) + GσLx(tk) (3.11)

e, portanto, u(t) = u(tk) para todo t ∈ [tk, tk+1), que são dois instantes de amostragem

sucessivos, para todo k ∈ N. Como já foi dito, a interpretação desta lei de controle é simples, se σ(tk) = i ∈ K, então o controle do i-ésimo subsistema é aplicado através da variável vi(tk),

enquanto os sinais de controle dos demais subsistemas permanecem inalterados.

É importante ressaltar que sistemas dinâmicos a tempo discreto operando em regime de comutação, como descritos anteriormente, são caracterizados pela existência de uma função de comutação σ(·) que é responsável por escolher, em cada instante de tempo k ∈ N, um dos N subsistemas que compõem o sistema principal. O subsistema que é escolhido por σ, em um determinado instante de tempo, terá seus ganhos de controle recalculados a fim de garantir a sua estabilidade, enquanto que nos demais subsistemas permanecerá atuante o mesmo controle imposto no instante anterior.

Neste ponto, fazemos referência a um resultado já bem estabelecido, que dis-cutimos com detalhes no capítulo anterior. De fato, para este tipo de entrada, o sistema (3.3)-(3.4) pode ser exatamente1 convertido no seu sistema discreto, chamado equivalente,

(SOUZA, 2012)

x(tk+1) = Adx(tk) + Bdu(tk) , x(0) = x0 (3.12)

z(tk) = Cdx(tk) + Ddu(tk) (3.13)

de tal maneira que a seguinte igualdade seja preservada J =X i∈K Z ∞ 0 zi(t)z i(t)dt = X k∈N z(tk)′z(tk) (3.14)

Dessa forma, adotando a notação x(tk) = xkpara todas as variáveis amostradas nos instantes

de tempo sucessivos tk e tk+1 e levando em conta (3.11)-(3.14), o modelo dinâmico a tempo

discreto pode ser reescrito como

ηk+1 =   Ad+ BdGσL BdFσ+ BdGσK GσL Fσ+ GσK  ηk (3.15) zk = h Cd+ DdGσL Dd(Fσ+ GσK) i ηk (3.16)

(34)

Capítulo 3. Síntese de Controle via Rede 34

sendo (Ad, Bd, Cd, Dd) as matrizes do sistema discreto equivalente e ηk ∈ RN(n+m) o vetor

de estado aumentado dado por

ηk=   xk uk−1  , η0 =   x0 0   (3.17)

Para determinarmos as matrizes de ganho do controlador, é importante fatorarmos as ma-trizes do modelo discreto, o que coloca em evidência as suas estruturas particulares

  Ad+ BdGσL BdFσ+ BdGσK GσL Fσ+ GσK   = Aσ + BσK (3.18) h Cd+ DdGσL DdFσ + DdGσK i = Cσ + DσK (3.19)

nas quais as seguintes matrizes são obtidas

Aσ =   Ad BdFσ 0   (3.20) Bσ =   BdGσ   (3.21) Cσ = h Cd DdFσ i (3.22) Dσ = h DdGσ i (3.23) K = h L K i (3.24)

Neste ponto, finalizamos o modelamento do sistema dinâmico em estudo. É importante enfati-zar que, neste modelo, as matrizes incógnitas que estão incluídas em K atuam de forma linear nas equações (3.15)-(3.16). Essa propriedade é essencial para determinarmos essa matriz na etapa de síntese, que passamos a estudar em seguida. Para maiores detalhes ver (DEAECTO, 2010) e (GEROMEL et al., 2009).

3.2 Síntese da lei de controle

Nesta seção, desenvolveremos três possibilidades para abordar o problema de sín-tese da lei de controle, que é caracterizada por exibir duas estruturas lógicas. Uma delas está associada aos ganhos de realimentação da lei de controle que podem ser sintetizados pela adoção de técnicas de projeto clássicas. A outra, mais complexa, diz respeito à determinação de qual sinal de controle é enviado pela rede de dados em cada instante de tempo. O nosso objetivo central é de expressar esta etapa de síntese através de um sistema de controle com comutação. Aspectos de decomposição dessas duas estruturas lógicas serão abordados.

(35)

Capítulo 3. Síntese de Controle via Rede 35

Inicialmente, vamos sintetizar apenas a lei de controle com comutação. Para tanto, reescrevemos o modelo (3.15)-(3.16) na forma de realimentação de estado

ηk+1 = Aσηk+ Bσυk (3.25)

zk = Cσηk+ Dσυk (3.26)

υk = Kηk (3.27)

com a matriz de ganho K definida e particionada em (3.24). Como uma estratégia de solução, considere inicialmente, apenas como uma etapa inicial de síntese, que este sistema opera em malha aberta, ou seja, K = 0. Desta forma, é possível obter uma lei de chaveamento que minimiza um critério de desempenho escolhido, a qual será, em seguida, generalizada para o caso em que o ganho de realimentação (3.27) for considerado. Como se trata de um sistema linear a tempo discreto, definimos a função quadrática como uma função de Lyapunov candidata

ν(η) = ηP

(3.28)

em que Pi >0 para todo i ∈ K satisfazem

A′ i  X j∈K πjiPj  Ai− Pi+ Ci′Ci <0, i ∈ K (3.29)

em que Π = {πji} ∈ RN×N é uma matriz de Metzler da classe Md. Considerando a função

de comutação como sendo

σ(ηk) = arg min i∈K η

kPiηk (3.30)

e que em um instante genérico k ∈ N tenhamos σ(ηk) = i ∈ K, então as relações

ν(ηk+1) − ν(ηk) = min ∈K ηkA ′ iPAiηk− ηkPiηk ≤ ηkA′i  X j∈K πjiPj  Aiηk− ηk′Piηk < −ηk′Ci′Ciηk < −zkzk , ∀zk 6= 0 (3.31)

permitem duas conclusões importantes. A primeira é que ν(ηk+1) < ν(ηk), ∀ηk 6= 0,

indi-cando que o sistema é globalmente assintoticamente estável. A segunda decorre de somarmos a relação apresentada na equação (3.31) para todo k ∈ N, isto é

X k∈N zkzk < ν(η0) = min i∈K η ′ 0P0 (3.32)

a qual, em conjunto com (3.14), permite concluir que o critério de desempenho J =Pk∈Nzkzk

(36)

Capítulo 3. Síntese de Controle via Rede 36

Para fazermos a síntese da matriz de ganho K, necessitamos de algumas mani-pulações algébricas adicionais. Inicialmente, com o complemento de Schur, escrevemos as desigualdades (3.29) na forma equivalente

     Pi A′i Ci′ • Pj∈KπjiPj −1 0 • • I     >0, i ∈ K (3.33) ou ainda     G+ G′ − Y i G′A′i G′Ci′ • Pj∈KπjiYj−1 −1 0 • • I     >0, i ∈ K (3.34)

onde procedemos à mudança de variáveis Yi = Pi−1 >0 e utilizamos a desigualdade G′PiG ≥

G+ G′ − P−1

i , válida para todas as matrizes G e Pi > 0. Por outro lado, introduzindo as

variáveis matriciais adicionais Θi e Zij tais que

  Zij Θ ′ i • Yj  >0, i, j ∈ K (3.35)

as desigualdades (3.34) podem ser substituídas por

     G+ G′− Y i G′A′i G′Ci′ • Θi+ Θ′i− P j∈KπjiZij 0 • • I      >0, i ∈ K (3.36)

Esta forma é mais complicada que a original (3.29). Entretanto, é importante salientar que ambas são equivalentes e esta última, como veremos, está perfeitamente adaptada a ser generalizada para viabilizar a etapa de síntese de controle conjunta, para determinar simul-taneamente os ganhos de realimentação e a regra de comutação.

3.2.1

Controle Centralizado

Considerando o ganho de realimentação (3.27), ou seja, υk = Kηk, as matrizes

do sistema em malha fechada são obtidas pela simples substituição de Ai → Ai + BiK e

Ci → Ci+ DiK, para todo i ∈ K. Assim procedendo, as LMIs (3.36) são reescritas na forma

     G+ G′− Y i G′A′i+ L′Bi′ G′Ci′ + L′D′i • Θi+ Θ′i− P j∈KπjiZij 0 • • I     >0, i ∈ K (3.37)

(37)

Capítulo 3. Síntese de Controle via Rede 37

através das quais a matriz de ganho K = LG−1 e as matrizes de comutação P

i = Yi−1 >0,

para todo i ∈ K, são calculadas. Assim sendo, podemos determiná-las de tal maneira que o limitante superior do critério de desempenho J < mini∈Kη0′P0 seja minimizado. Este

limitante superior, denotado por ρ > 0, deve satisfazer as desigualdades

  ρ η ′ 0 • Θi+ Θ′i− P j∈KπjiZij  >0, i, j ∈ K (3.38)   Zij Θ ′ i • Yj  >0, i, j ∈ K (3.39)

De fato, o complemento de Schur, aplicado em (3.39), permite determinar Zij > Θ′iYi−1Θi

> Θ′i+ Θi− Yi (3.40)

a qual multiplicando ambos os membros por πji, somando para todo j ∈ K e calculando as

inversas, leva a η0′P0 < η′0  Θi+ Θi− X j∈K πjiZij   −1 η0 (3.41)

Portanto, aplicando o complemento de Schur na desigualdade (3.38), notamos que a desi-gualdade (3.41) implica em que o limitante superior do critério de desempenho já calculado, J <mini∈Kη′0P0 < ρ, seja imposto. Consequentemente, o problema de minimização acima

descrito se escreve na forma final inf

ρ,L,G,Θi,Yj,Zij

: (3.37) − (3.39)} (3.42)

que é um problema convexo em relação a todas as variáveis, pois a matriz de Metzler Π ∈ Md

é dada. A introdução desta última matriz como uma variável adicional do problema de otimização (3.42) torna-o não convexo devido ao produto de variáveis e, consequentemente, de difícil solução.

3.2.2

Controle Descentralizado

Nosso propósito é determinar um controle com estrutura descentralizada, isto é, as matrizes de ganho L e K devem apresentar as estruturas

L = diag{L1, · · · , LN} (3.43)

(38)

Capítulo 3. Síntese de Controle via Rede 38

e, assim sendo, a matriz K definida em (3.24) deve ser tal que K=h diag{L1, · · · , LN} diag{K1, · · · , KN}

i

(3.45) Retomando a parametrização K = LG−1, notamos que a estrutura (3.45) pode

ser imposta se restringimos a matriz L a ter esta mesma estrutura e G ser bloco diagonal. Ambas com todos os seus blocos de dimensões compatíveis. Portanto, o problema de síntese é exatamente igual ao problema (3.42), mas com estas restrições estruturais adicionais. É importante salientar que estas restrições são tratadas sem dificuldades, pois são lineares e, portanto, convexas. Devido à presença dessas restrições adicionais, o custo mínimo associado ao problema de controle centralizado é naturalmente sempre menor ou igual ao custo mínimo associado ao problema de controle descentralizado. Este aspecto será ilustrado através de simulações numéricas.

3.2.3

Controle Desacoplado

Nesta abordagem, o cálculo das matrizes de ganho L e K e da regra de comutação é realizado de maneira independente. Adotamos o seguinte procedimento composto de duas etapas independentes, a saber:

• Ganhos: Para cada subsistema isolado, as matrizes de ganho (Ki, Li), para todo i ∈ K,

são determinadas como sendo os ganhos ótimos referentes ao critério de desempenho adotado.

• Regra de Comutação: Em seguida, com os ganhos de realimentação fixos, a regra de comutação que orquestra a utilização da rede é determinada.

Para a primeira etapa, notamos inicialmente que o i-ésimo subsistema em malha fechada é descrito pela equação dinâmica

ηi k+1 =   Adi+ BdiLi BdiKi Li Ki  ηi k (3.46) zi k = h Cdi+ DdiLi DdiKi i ηi k (3.47)

sujeita à condição inicial ηi

0 = [xi0 0]′ a qual pode ser reescrita na forma de realimentação de

estado

ηik+1 = Adiηik+ Bdiυki (3.48)

zi

k = Cdiηik+ Ddiυki (3.49)

(39)

Capítulo 3. Síntese de Controle via Rede 39

na qual Ki= [Li Ki], para todo i ∈ K. Nesta formulação, as matrizes indicadas são

determi-nadas pela simples fatoração das equações (3.46)-(3.47), que fornece

Adi =   Adi 0 0 0   (3.51) Bdi =   Bdi I   (3.52) Cdi = h Cdi 0 i (3.53) Ddi = h Ddi i (3.54)

Neste momento, estamos em posição de determinar a matriz de ganho de rea-limentação Ki de tal forma que o critério de desempenho associado ao i-ésimo subsistema

isolado, Ji =Pk∈Nzi

kzik, seja minimizado. É preciso colocar em evidência, mais uma vez, que

devemos resolver N problemas de otimização desacoplados, pois os subsistemas e os ganhos de realimentação são independentes entre si. Sendo assim, devemos resolver minPdi>0η

i

0Pdiη0i

sujeito a

(Adi+ BdiKi)′Pdi(Adi+ BdiKi) − Pdi+ (Cdi+ DdiKi)′(Cdi+ DdiKi) < 0 (3.55)

cuja solução ótima, bastante conhecida, se situa na borda desta desigualdade e é dada por Ki = − (Bdi′ PdiBdi+ Ddi′ Ddi)

−1(B

diPdiAdi+ Ddi′ Cdi) (3.56)

sendo Pdi >0 a solução estabilizante da equação algébrica de Riccati

A′diPdiAdi− Pdi+ Cdi′ Cdi− Ki′(B

diPdiBdi+ Ddi′ Ddi) Ki = 0 (3.57)

que pode ser determinada sem nenhuma dificuldade através de diversos métodos numéri-cos disponíveis na literatura, (BOYD L. EL GHAOUI; BALAKRISHNAN, 1994). Os ganhos (Li, Ki) com dimensões compatíveis, que sintetizam o controle via realimentação de estado

de cada subsistema isolado são extraídos da estrutura Ki = [Li Ki], que é válida para todo

i ∈ K.

Para a segunda etapa, inicialmente dispomos convenientemente das matrizes de ganho determinadas na etapa anterior para formar

K=h diag{L1, · · · , LN} diag{K1, · · · , KN}

i

(3.58) que permite adotar as seguintes associações Ai + BiK → Ai e Ci + DiK → Ci, para todo

(40)

Capítulo 3. Síntese de Controle via Rede 40

superior do custo garantido min0′P0 é dada por σ(ηk) = arg mini∈KηkPiηk, sendo que as

matrizes Pi >0 satisfazem as LMIs

A′ i  X j∈K πjiPj  Ai− Pi+ Ci′Ci <0, i ∈ K (3.59)

nas quais Π = {πji} ∈ RN×N é uma matriz de Metzler da classe Md dada. Neste sentido,

devemos obter a solução ótima do problema de otimização convexa inf

ρ,Pi>0 : (3.59), η

0P0 < ρ, ∀i ∈ K} (3.60)

Desejamos deixar claro que, se comparado com as duas estratégias de síntese anteriores, este procedimento reduz significativamente o esforço computacional necessário para a síntese dos ganhos de realimentação de estado e da regra de comutação que define, em cada instante de tempo, o controle ativo. De fato, o procedimento que acabamos de discutir se baseia em duas etapas que são realizadas separadamente. A qualidade da solução proposta será verificada através de ensaios numéricos aplicados em um exemplo que será discutido no capítulo seguinte.

3.3 Conclusão

Neste capítulo, apresentamos, primeiramente, a descrição do problema abordado nesta dissertação, tendo como base o modelo do sistema dinâmico a tempo contínuo des-crito pelas suas equações de estado, as quais foram utilizadas no cálculo do sistema a tempo discreto equivalente. Uma descrição detalhada dos diversos aspectos desse problema foi reali-zada, dando particular ênfase ao projeto de diversas estruturas de controle de interesse. Mais precisamente, foram apresentados os procedimentos de síntese de três estruturas de controle, a saber: controle centralizado, controle descentralizado e controle desacoplado. Deve-se res-saltar que os três procedimentos de síntese mencionados são expressos através de problemas de otimização convexa com restrições descritas por LMIs.

(41)

41

4 Modelagem e Implementação Numérica

Este capítulo é inteiramente dedicado a obter um modelo matemático de um pêndulo invertido e aplicar os resultados obtidos anteriormente para a síntese de controle. Serão adotadas as diversas abordagens descritas de maneira detalhada no Capítulo 3, a sa-ber: controle centralizado, controle descentralizado e controle desacoplado. Consideramos um sistema dinâmico composto por dois pêndulos invertidos desacoplados, que serão con-trolados através de uma rede de comunicação visando mantê-los na posição vertical para cima. Inicialmente, é apresentada a modelagem matemática deste sistema, como proposta em (GEROMEL; KOROGUI, 2011) e, em seguida, cada uma das estratégias de controle mencionadas será projetada, implementada e validada através de simulação numérica. Final-mente, é realizada uma comparação de cada uma das abordagens propostas para o controle deste sistema dinâmico.

4.1 Modelagem Matemática do Pêndulo Invertido

Considere um conjunto de subsistemas dinâmicos, cada um deles denominado Si,

para i ∈ K, cuja representação de estado mínima é repetida por comodidade

˙xi(t) = Aixi(t) + Biui(t) , xi(0) = xi0 (4.1)

zi(t) = Cixi(t) + Diui(t) (4.2)

na qual xi(t) ∈ Rné a sua variável de estado, ui(t) ∈ Rm é o seu sinal de controle e zi(t) ∈ Rr

é a sua variável de saída controlada.

Para validar o desempenho do controle desenvolvido durante esse trabalho, consi-deramos um sistema dinâmico composto por dois subsistemas, cada um constituído por um pêndulo invertido como representado na Figura 2. Como estes pêndulos são desacoplados, podemos obter o modelo matemático de cada um deles separadamente. O pêndulo com massa m, com haste rígida de comprimento ℓ é montado sobre um carro com massa M. A partir de uma condição inicial dada, deseja-se mover o pêndulo para a sua posição de equilíbrio vertical (φ = +90o), movimentando o carro através da aplicação de uma força horizontal f.

O carro deverá retornar para a sua posição original (r = 0) mantendo o pêndulo na posição de equilíbrio mencionada. Devido ao movimento relativo do pêndulo com o ar, ocorre uma força de atrito viscoso proporcional à velocidade, com coeficiente b. Aplicando o Princípio de D’Alembert, determinamos as equações que regem o seu comportamento dinâmico, a saber:

Referências

Documentos relacionados

In the present study, different probiotics application strategies were evaluated with the objective to show the methodology that have the ability of enhance growth parameters and

Como aspectos facilitadores para a garantia da integralidade pode-se mencionar: o estreito relacionamento das equipes com as comunidades através do estabelecimento de

Compostos contendo as funcionalidades semicarbazona e tiossemicarbazona também são amplamente pesquisados quanto às suas atividades biológicas, e tem apresentado excelentes

Com efeito, os resultados das análises das propostas envolvendo a produção de gêneros e tipos textuais Oficina de produção e das atividades envolvendo a oralidade Sobre o texto

A formação de dois grupos referentes aos períodos seco e chuvoso dentro de Rio Formoso, supõe que as mudanças climáticas e suas consequências exercem influência nas

Esse tipo de razão está presente nas ações positivas para com os outros, por exemplo, como descrito no livro que inspirou o filme “Pay it forward” (HYDE, 2014) (tradução:

Esta pesquisa estabelece um diálogo entre O cuidado de si em Michel Foucault e a Filosofia Ubuntu: “Eu sou porque nós somos”, no âmbito das teorias contemporâneas

Tendo em vista os fatos supracitados, e com a necessidade de melhorar o processo de ensino/aprendizagem nos cursos de EaD, este trabalho justifica-se por buscar desenvolver