Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

(1)

CONTROLE H2 AMOSTRADO DE SISTEMAS LINEARES COM SALTOS

MARKOVIANOS VIA REALIMENTA ¸C ˜AO DE ESTADO

Gabriela W. Gabriel∗ _{Matheus Souza}† _Jos´_{e C. Geromel}∗ ∗_{Faculdade de Engenharia El´}_{etrica e de Computa¸cao (FEEC), UNICAMP}

Campinas, SP, Brasil

†_{Hamilton Institute, National University of Ireland Maynooth (NUIM)} Maynooth, Co. Kildare, Irlanda

Email: gvital@dca.unicamp.br, souza@dsce.fee.unicamp.br, geromel@dsce.fee.unicamp.br

Abstract— This paper is entirely devoted to analyze the H2 optimal state-feedback sampled-data control design problem for Markov Jump Linear Systems. It is proposed to search for a solution to this problem by imbedding it in a more general class of dynamic systems that we call Hybrid Markov Jump Linear System (HMJLS). In this new and wide context, it is shown how to evaluate a sampled-data state feedback control that minimizes the H2norm of the closed-loop system from the solution of a specific two-point boundary value problem. This result is then adapted to provide optimal control conditions based on linear matrix inequalities (LMIs). The theory is illustrated by means of an academical example.

Keywords— Markov jump linear systems (MJLS), Hybrid systems, Sampled-data control.

Resumo— Este artigo é inteiramente dedicado à análise do problema de controle ótimo H2 amostrado via realimenta¸cão de estado para sistemas lineares com saltos markovianos. A solu¸cão desse problema é obtida quando ele é visto como membro de uma classe mais abrangente de sistemas dinâmicos que denominamos Sistemas Lineares H´ıbridos com Saltos Markovianos (HMJLS). Nesse novo contexto, coloca-se em evidência como calcular um controle amostrado via realimenta¸cão de estado que minimiza a norma H2 do sistema em malha fechada a partir da solu¸cão de um problema com duas condi¸cões de contorno. Este resultado é então adaptado para que seja expresso por meio de desigualdades matriciais lineares (LMIs). A teoria desenvolvida é ilustrada por meio de um exemplo numérico.

Palavras-chave— Sistemas lineares markovianos (MJLS), Sistemas h´ıbridos, Controle de sistemas amostra-dos.

1 Introdu¸c˜ao

Sistemas de controle amostrados vêm ganhando grande importância no âmbito de controle de sis-temas dinâmicos. Esta estrutura é amplamente empregada em arquiteturas modernas de controle, como sistemas de controle digital (Chen and cis, 1995; Ragazzini and Franklin, 1958; Fran-klin et al., 1997) e sistemas de controle via rede (Hespanha et al., 2007; Wang and Liu, 2008). Es-pecificamente para o último caso, é importante lembrar que as caracter´ısticas apresentadas pelo meio f´ısico em que os sinais são transmitidos po-dem provocar uma degrada¸cão inaceitável de de-sempenho em malha fechada. Tais limita¸cões en-volvem atrasos de transporte, perda de pacotes de dados transmitidos e limita¸cão de largura de faixa. Neste artigo, as duas últimas limita¸cões são espe-cialmente abordadas.

O problema de controle com largura de faixa limitada pode ser resolvido com estratégias bem estabelecidas no contexto de controle amostrado; ver (Souza et al., 2013). Para o caso especial em que a taxa de amostragem é constante, os pro-blemas de estabiliza¸cão e de controle ótimo H2,

ambos via realimenta¸cão de estado, são resolvidos em (Souza et al., 2013; Chen, 1999) com o uso de um sistema a tempo discreto equivalente ao ori-ginal, sem lan¸car mão de qualquer tipo de aproxi-ma¸cão. Estratégias mais gerais como acionamento

por evento e auto-acionamento podem ser aplica-das para considerar taxas de dados variantes no tempo (Mazo Jr. and Tabuada, 2008; Mazo Jr. et al., 2009; Souza et al., 2013). Sistemas lineares com saltos markovianos (MJLS) podem ser uti-lizados para modelar perdas de pacotes e falhas em atuadores; ver (Gon¸calves et al., 2010; Costa et al., 2013; Costa et al., 2005) para detalhes. De fato, a planta pode ser modelada como um MJLS a tempo cont´ınuo, em que um modo representa a opera¸cão nominal e outro está associado à perda de pacote ou falha em atuadores ou sensores.

Neste artigo, o principal propósito é proje-tar uma lei de controle amostrado via realimen-ta¸cão de estado para sistemas lineares com sal-tos markovianos. Por conseguinte, visa abordar as duas limita¸cões, detalhadas acima, e que estão presentes em sistemas de controle em rede. Deve-se notar que a modelagem a tempo discreto do sistema em malha fechada não é capaz de incor-porar toda informa¸cão dispon´ıvel entre os instan-tes de amostragem, uma vez que os estados do processo de Markov a tempo cont´ınuo mudam de forma totalmente independente destes instantes. Desta forma, os resultados clássicos de controle de MJLS a tempo discreto não podem ser efeti-vamente aplicados neste caso. A ausência de um número expressivo de contribui¸cões para a reso-lu¸cão deste problema pode ser assim justificada,

(2)

sendo (Hu et al., 2006) uma importante exce¸cão. Neste artigo, apresenta-se uma nova formu-la¸cão do problema de controle amostrado de sis-temas lineares com saltos markovianos utilizando uma abordagem de sistemas h´ıbridos – como em (Souza et al., 2014), em que é considerado o caso linear e invariante no tempo. A partir disso, torna-se poss´ıvel avaliar a sua estabilidade e calcular a sua norma H2sem que qualquer aproxima¸cão seja

introduzida. Para esse fim, na Se¸cão 2, o problema e sua reformula¸cão em um sistema h´ıbrido equiva-lente são apresentados. Na Se¸cão 3, o resultado teórico básico, com o qual será poss´ıvel avaliar a estabilidade do sistema h´ıbrido equivalente, é de-senvolvido. Este resultado também permite calcu-lar sua norma H2 do sistema de interesse através

da solu¸cão de um problema com duas condi¸cões de contorno. O problema de controle ótimo H2é

então resolvido na Se¸cão 4. Um exemplo numérico é apresentado e discutido na Se¸cão 5. A Se¸cão 6 é dedicada às conclusões finais.

A nota¸cão utilizada é padrão. Para matrizes quadradas, denota-se a fun¸cão tra¸co como tr(·). Para matrizes ou vetores reais, indica-se a trans-posta através de (′_{). Para matrizes simétricas,}

denota-se cada um dos blocos simétricos como (•). Indica-se o conjunto dos números reais e o conjunto dos números naturais como R e N, res-pectivamente. Para qualquer matriz simétrica, indica-se que X é (semi)definida positiva através de X > 0 (X ≥ 0). Denota-se por E{·} o operador esperan¸ca matemática e por P(·) a probabilidade de (·). Indica-se o limite à esquerda de ξ(t) para t_{→ t}_k com t_k_{≥ 0, k ∈ N, atrav´}es de ξ(t−

k). Uma

matriz quadrada é Hurwitz estável quando todos os seus autovalores estiverem situados na região Re(s) < 0 e é Schur estável quando estiverem em |z| < 1.

2 Apresenta¸c˜ao do Problema Considera-se a classe de Sistemas Lineares com Saltos Markovianos (MJLS) e realiza¸c˜ao m´ınima no espa¸co de estados dada por

˙x(t) = Aθ(t)x(t) + B_θ(t)u(t) + E_θ(t)w(t) (1) z(t) = C_θ(t)x(t) + D_θ(t)u(t) (2) em que os vetores x ∈ Rn_{, u ∈ R}m_{, w ∈ R}r _{e z ∈}

Rs _{s˜ao, respectivamente, o estado, a entrada de}

controle, a entrada exógena e a sa´ıda controlada. Define-se o conjunto K = {1, · · · , N } e a variável θ(t) ∈ K, um parâmetro variante no tempo cuja evolu¸cão é governada por um processo markoviano cont´ınuo com matriz de taxa de transi¸cão {λij} = Λ ∈ RN ×N _{tal que}

P(θ(t + h) = j|θ(t) = i) = δi−j+ λijh+ o(h) (3) onde δi−j indica a fun¸c˜ao delta de Kronecker, ou

seja, δi−j = 1 se i = j ∈ K e δi−j = 0, caso

contr´ario e limh→0+o(h)/h = 0. Os elementos da matriz Λ ∈ RN ×N _{s˜ao tais que λ}

ij ≥ 0, ∀i 6= j e P

j∈Kλij = 0, ∀i ∈ K o que implica em λii ≤ 0, ∀i ∈ K. Assume-se que o sistema evolui a par-tir de uma condi¸c˜ao inicial x(0) = 0 e θ(0) = θ0

com P(θ0 = i) = πi0, ∀i ∈ K. Baseados na

de-fini¸cão de norma H2, a entrada exógena w(t) é

uma série de impulsos (delta de Dirac), a ser de-finida posteriormente; ver (Colaneri et al., 1997) para maiores detalhes. Finalmente, introduz-se a classe de entrada controlada que é caracterizada por um controle linear amostrado por realimenta-¸cão de estado da forma

u(t) = L_θ(t

k)x(tk), t ∈ [tk, tk+1) (4)

onde {tk}k∈N s˜ao instantes de amostragem

su-cessivos tais que t0 = 0, tk+1 > t_k,_{∀k ∈ N e} limk→∞t_k = ∞. Neste artigo deseja-se fornecer condi¸c˜oes para garantir a estabilidade assint´otica e otimizar a norma H2 do sistema em malha

fe-chada em rela¸c˜ao `as matrizes de ganho Li, ∀i ∈ K.

Para esse fim, introduz-se uma apresenta¸c˜ao alternativa para a classe MJLS definida em (1)-(4), por´em totalmente equivalente

˙ ξ(t) = A_θ(t) B_θ(t) 0 0 ξ(t) + E_θ(t) 0 w(t) (5) z(t) = C_θ(t) D_θ(t)ξ(t) (6) ξ(t_k) = I_n 0 L_θ(t k) 0 ξ(t− k) (7)

sujeita `a condi¸c˜ao inicial ξ(0−_{) = ξ}

0= 0, θ(0−) =

θ(0) = θ₀ e válida para todo t ∈ [t_k, t_k+1), k ∈ N. Este é denominado Sistema Linear H´ıbrido com Saltos Markovianos cuja razão, por trás desta re-formula¸cão, é simples. Definindo-se o estado au-mentado ξ(t) = [x(t)′ _u_(t)′_]′_{, a segunda}

compo-nente da equa¸c˜ao diferencial em (5) fornece u(t) = u(t_k) a qual em conjunto com (7) implica em u(t) = L_θ(t

k)x(tk). Al´em disso, substituindo-se

esta solu¸cão na equa¸cão (5) tem-se x(t) e z(t) váli-dos para todo t ∈ [tk, t_k+1) que é exatamente o sis-tema em malha aberta (1)-(2) controlado pela lei de controle amostrado (4). Dessa forma, deseja-se determinar a solu¸cão do seguinte problema de otimiza¸cão inf L1,··· ,LN r X l=1 Z ∞ 0 E {z l(t)′z_l(t)}dt (8) onde zl(t) é a sa´ıda associada à entrada impulsiva

w(t) = e_lδ(t−), em que e_l_{∈ R}ré a l-ésima coluna da matriz identidade. Trata-se de um problema de controle ótimo H2 via realimenta¸cão de estado

com controle amostrado caracterizado pela restri-¸cão (4). Sob certas considera¸cões iniciais envol-vendo a sua observabilidade, a caracter´ıstica finita da fun¸cão objetivo descrita em (8) implica em sua estabilidade assintótica.

(3)

3 Sistemas Lineares H´ıbridos com Saltos Markovianos

Nesta se¸c˜ao considera-se o seguinte HMJLS ˙ ξ(t) = F_θ(t)ξ(t) (9) z(t) = G_θ(t)ξ(t) (10) ξ(t_k) = H_θ(t k)ξ(t − k) (11)

evoluindo a partir da condi¸cão inicial arbitrária ξ(0−) = ξ₀, θ(0−) = θ(0) = θ₀. Verifica-se que este modelo contém, como caso particular, o descrito pelas equa¸cões (5)-(7) com w(t) = 0. Para facilitar a apresenta¸cão, denota-se ¯F_i= F_i+ (λii/2)I, ∀i ∈ K e considera-se amostragem uni-forme Tk = tk+1 − tk = T > 0, ∀k ∈ N. O

resultado mais importante desta se¸c˜ao ´e obtido introduzindo-se o vetor π(t) ∈ RN _cujas

compo-nentes s˜ao πi(t) = P(θ(t) = i), i ∈ K, e que

sa-tisfazem ˙π(t) = Λ′_π_{(t) (Costa et al., 2013),}

evo-luindo a partir da condi¸c˜ao inicial π(0) = π0, onde

π_i0 = P(θ₀ = i), ∀i ∈ K. Obviamente π(t) ≥ 0 e P

i∈Kπi(t) = 1 para todo t ≥ 0. O pr´oximo

teo-rema ´e central para os desenvolvimentos apresen-tados a seguir.

Teorema 1 Considere T > 0 dado. Se existem

matrizes definidas positivas Si > 0, ∀i ∈ K que

satisfazem as equa¸c˜oes acopladas de Lyapunov

˙ P_i+ F′ iPi+ PiF_i+ X j∈K λ_ijP_j = −G′ iGi (12) sujeitas `as condi¸c˜oes de contorno inicial Pi(0) <

S_i e final P_i(T ) > H′

iSiH_i para todo i ∈ K ent˜ao

o HMJLS (9)-(11) é estável em média quadrática e satisfaz J = Z ∞ 0 E {z(t) ′_z_(t)}dt < X i∈K π_i0ξ₀′H_i′S_iH_iξ₀ (13) Prova: Define-se a variável ν(t) = (ξ(t), θ(t)) e a

fun¸c˜ao quadr´atica

V(ν(t)) = ξ(t)′P_θ(t)(t)ξ(t) (14) válida para todo t ∈ [tk, t_k+1), ∀k ∈ N. Devi-do a sua natureza invariante no tempo, a solu-¸cão do problema com duas condi¸cões de contorno no primeiro intervalo [0, T ) permanece a mesma nos intervalos seguintes [kT, (k + 1)T ), ∀k ∈ N, desde que as condi¸cões Pi(tk) = Pi(0) e Pi(t−_k+1) =

P_i(T ) para todo i ∈ K sejam impostas.

Para todo intervalo de tempo t ∈ [tk, t_k+1), k _{∈ N, levando-se em conta (12) a f´}ormula de Dynkin, veja (Costa et al., 2013), tem-se

V(ν(t_k)) − EV(ν(t− k+1))|ν(tk) = = E Z tk+1 tk z(t)′z(t)dt|ν(t_k) (15)

Por outro lado, utilizando-se as condi¸c˜oes de con-torno do problema, verifica-se que V (ν(tk)) <

ξ(t_k)′S_θ(t

k)ξ(tk)) e, em decorrˆencia da

desconti-nuidade da vari´avel de estado ξ(t) entre os ins-tantes de tempo t−_k+1 e tk+1, tem-se

EV(ν(t− k+1))|ν(tk) = = Enξ(t− k+1)′Pθ(t− k+1)(t − k+1)ξ(t−k+1)|ν(tk) o >_Eξ(t_k+1)′S_θ(t k+1)ξ(tk+1)|ν(tk) (16) uma vez que a continuidade do processo estoc´ as-tico (3) imp˜oe θ(t− k+1) = θ(tk+1) e a condi¸c˜ao de contorno implica em P θ(t− k+1)(t − k+1) = Pθ(tk+1)(t − k+1) > H′ θ(tk+1) S_θ(t k+1)Hθ(tk+1)(17)

Dessa forma, definindo-se a fun¸cão quadrática v(ν(t_k))=ξ(t_k)′S_θ(t k)ξ(tk) em conjunto com (15) e (16), tem-se E {v(ν(tk+1))|ν(tk)} − v(ν(tk)) < <_−E Z tk+1 tk z(t)′z(t)dt|ν(t_k) (18) e como Si > 0, ∀i ∈ K então v(ν(t_k)) é po-sitiva definida e E{v(ν(tk))} pode ser

conside-rada uma fun¸c˜ao de Lyapunov associada ao pro-cesso a tempo discreto ξ(tk) → ξ(tk+1) para todo

k_{∈ N. Nota-se duas consequˆ}encias imediatas. A primeira, devido a desigualdade estrita em (18), existe ε > 0 suficientemente pequeno tal que E {v(ν(tk+1))|ν(tk)} ≤ (1 − ε)v(ν(tk)) o que

im-plica em E{v(ν(tk+1))} → 0 quando k ∈ N tende

a infinito e consequentemente E{kξ(t)k2

} → 0 quando t → ∞ o que assegura a estabilidade assin-tótica em média quadrática. Ademais, obtém-se (13) a partir da desigualdade J = E ( X k∈N E Z tk+1 tk z(t)′z(t)dt|ν(t_k) ) <_E ( X k∈N v(ν(t_k)) − E{v(ν(t_k+1))|ν(t_k)} ) <_{E {v(ν(0))}} (19)

tendo em vista que ξ(0) = Hθ0ξ0 e πi0 = P(θ0=

i), i ∈ K, completando a prova do teorema

pro-posto. ✷

Nota-se que o limitante superior proposto do custo total é calculado pela soma das contribui¸cões que ocorrem entre dois instantes de amostragem sucessivos. Para que isso ocorra, uma solu¸cão do problema com dois valores de contorno deve ser determinada.

Nota-se também através da prova do Teorema 1 que a quantidade expressa no lado direto de (13) não é apenas um limitante superior para o custo tendo em vista que J → P

i∈Kπi0ξ′

(4)

sempre que Pi(0) → Si > 0 e P_i(T ) → H′

iSiH_i para todo i ∈ K o que reproduz o custo ótimo. Segundo o conhecimento dos autores, não existe resultado similar na literatura. Esta condi¸cão de-pende fortemente da descontinuidade imposta em (11), pois o problema com duas condi¸cões de con-torno deve admitir uma solu¸cão mesmo que (9) não seja estocasticamente estável. Em outras pa-lavras, a realimenta¸cão se dá através das matrizes H_i,_{∀i ∈ K fazendo com que o efeito de fecharmos} a malha através do controle amostrado (4) seja a descontinuidade (11) produzida nos instantes de amostragem.

Apresenta-se o segundo comentário na forma de um corolário ao Teorema 1, o qual se refere à generaliza¸cão para se obter a norma H2 de um

HMJLS da forma ˙ ξ(t) = F_θ(t)ξ(t) + J_θ(t)w(t) (20) z(t) = G_θ(t)ξ(t) (21) ξ(t_k) = H_θ(t k)ξ(t − k) (22)

que evolui, no tempo, a partir da condi¸c˜ao inicial ξ(0−) = 0, θ(0−) = θ(0) = θ₀.

Corol´ario 1 Considere T >0 dado. Se existem

matrizes definidas positivas Si >0, ∀i ∈ K

satis-fazendo o problema com duas condi¸cões de con-torno apresentado no Teorema 1 então o HMJLS (20)-(22) é estável em média quadrática e satisfaz

J = r X l=1 Z ∞ 0 E {z l(t)′z_l(t)}dt < X i∈K π_i0tr(J_i′H_i′S_iH_iJ_i) (23) Prova: A prova decorre do resultado to Teorema 1 considerando, sucessivamente, o conjunto de en-tradas impulsivas w(t) = elδ(t−), onde e_l _{∈ R}r ´e a l-´esima coluna da matriz identidade, e as sa´ıdas correspondentes zl(t) para l = 1, · · · , r.

Completa-se a prova como decorrˆencia do sistema original possuir condi¸c˜ao inicial ξ(0−_{) = 0, a qual,}

devido a cada impulso, se altera instantaneamente para ξ(0−_{) = J}

θ(0−₎e_l para todo l = 1, · · · , r. Em seguida, invocando-se a continuidade da cadeia de Markov que imp˜oe θ(0) = θ(0−_{), a desigualdade}

(13) fornece (23) e a prova está completa. ✷ Com este resultado, discute-se como resolver o problema com duas condi¸cões de contorno do Teorema 1. Com algumas manipula¸cões algébricas simples mostra-se que as fun¸cões matriciais

P_i(t) = e− ¯F ′ it(P_i(0) − R_i(P, t))) e− ¯Fit ₍₂₄₎ em que R_i(P, t) = Z t 0 eF¯ ′ iτ  G′iGi+ X j6_=i∈K λ_ijP_j(τ )   e ¯ Fiτ_dτ (25)

definidas para todo t ∈ [0, T ) e i ∈ K resolvem (implicitamente) a equa¸c˜ao diferencial linear (12). De fato, fixadas as condi¸c˜oes iniciais Pi(0) ou

fi-nais Pi(T ) para todo i ∈ K, elas podem ser

resol-vidas sem grandes dificuldades. Por outro lado, o problema com duas condi¸cões de contorno é resolvido impondo-se as restri¸cões Pi(0) < Si e

P_i(T ) > H_i′S_iH_i, as quais podem ser reescritas na forma conjunta

eF¯

′ iTH′

iSiH_ieF¯iT < S_i_{− R}_i(P, T ) (26) para todo i ∈ K. O procedimento iterativo para resolver o problema com duas condi¸c˜oes de con-torno, para T > 0 dado, ´e sumarizado nos seguin-tes passos:

1. Inicializa-se o contador de itera¸c˜oes ℓ = 0. Define-se Sℓ

i = 0, para todo i ∈ K e Jℓ= 0.

2. Determina-se a solu¸c˜ao Pℓ

i(t) das equa¸c˜oes

di-ferenciais acopladas ˙ P_i+ F_i′P_i+ P_iF_i+ X j∈K λ_ijP_j = −G′_iG_i

sob as condi¸c˜oes finais Pi(T ) = Hi′SiℓHi, para

todo i ∈ K e todo t ∈ [0, T ).

3. Determina-se Siℓ+1>0 solu¸c˜ao do problema

inf Si>0 {tr(Ji′Hi′SiH_iJ_i) : eF¯ ′ iTH_i′S_iH_ieF¯iT < S_i_{− R}_i(Pℓ, T) o para cada i ∈ K, bem como o valor ótimo do critério Jℓ+1=P_i∈Kπ_i0tr(J_i′H_i′S_iℓ+1H_iJ_i). 4. Faz-se ℓ + 1 → ℓ até que Jℓ+1− Jℓ seja

sufi-cientemente pequeno.

Este procedimento iterativo é similar aos ado-tados na resolu¸cão de problemas com duas condi-¸cões de contorno, bastante frequentes em controle ótimo. Em (Geromel and Vital, 2014) encontra-se a prova formal de sua convergência. Conforme apresentado a seguir, adapta-se este procedimento para resolver o problema indicado em (8) que é o principal objetivo deste trabalho.

4 Projeto de Controle Amostrado Nesta se¸c˜ao aborda-se o problem (8) a partir do re-sultado do Teorema 1 e, por conseguinte, no passo 2 do algoritmo deve-se resolver

inf Li,Si>0 ( X i∈K π_i0tr(J_i′H_i′S_iH_iJ_i) : eF¯ ′ iTH_i′S_iH_ieF¯iT < S_i_{− R}_i(Pℓ, T) o (27) e observa-se que para Ri(Pℓ, T), ∀i ∈ K fixo este problema é reescrito como N subproblemas desa-coplados. Antes de prosseguir, é necessário definir

(5)

as seguintes estruturas de blocos matriciais parti-cionados de acordo com as dimensões da variável de estado e da variável de controle

S−1 i = X_i Y_i • Z_i (28) R_i(Pℓ, T) = C_di′ D_di′ C_di D_di (29) para todo i ∈ K. Nota-se que a fatora¸cão (29) pode ser realizada pois Ri(Pℓ, T) ≥ 0, ∀i ∈ K. Além disso, considerando-se as equa¸cões (5)-(7), manipula¸cões algébricas simples evidenciam que

H_ieF¯iT = I_n 0 L_i 0 eAiT RT 0 e Aiτdτ B_i 0 I_m e( λii 2 )T = I_n L_i h eAiT RT 0 e Aiτdτ B_i i e( λii 2 )T = I_n L_i A_di B_di (30)

onde pode-se identificar Adi = e(λii/2)TeAiT _e

B_di = e(λii/2)TRT 0 e

Aiτdτ B_i para todo i ∈ K. O próximo teorema mostra que o problema de otimi-za¸cão convexa (27) pode ser expresso através de LMIs de tal forma que a sua solu¸cão ótima glo-bal é determinada sem maiores dificuldades com o uso de rotinas numéricas dispon´ıveis na literatura atual.

Teorema 2 O problema (27) ´e fact´ıvel se e so-mente se existem matrizes sim´etricas Xi, Z_i, W_i e

matrizes Yi, M_i de dimens˜oes compat´ıveis tais que   W_i W_i M′ i • X_i Y_i • • Z_i   >0 (31) W_i 0 0 I > A_di B_di C_di D_di X_i Y_i • Z_i A_di B_di C_di D_di ′ (32) para todo i ∈ K.

Prova: Primeiramente, prova-se a suficiência assumindo-se que as desigualdades (31)-(32) se verificam. Fazendo Li = MiW_i−1, considerando (28), multiplicando os dois lados de (31) por diag(Wi−1, In, I_m) e calculando o complemento de Schur em rela¸cão às duas últimas linhas e colunas, tem-se que W−1 i > I_n L′_iS_i I_n L_i , i_{∈ K} (33) Por outro lado, (32) é equivalente a

S_i> A_di B_di C_di D_di ′ W_i−1 0 0 I A_di B_di C_di D_di (34)

a qual, em conjunto com (30) e (33), resulta em S_i_{− R}_i(Pℓ, T) = = Si− C′ di D′ di C_di D_di > A′ di B′_di W−1 i A_di B_di > A′_di B′ di I_n L′ i S_i I_n L_i A_di B_di > eF¯ ′ iTH_i′S_iH_ieF¯iT, i_{∈ K} (35) que é exatamente a restri¸cão do problema (27) completando esta parte da prova. Para a necessi-dade, assume-se que o problema (27) seja fact´ıvel para algum par de matrizes (Li, S_i >0), i ∈ K. Posto isso, as restri¸cões do problema (27) podem ser escritas como

S_i > A′ di B′ di Φi A_di B_di + + C_di′ D_di′ C_di D_di, i_{∈ K} (36) onde Φi = [In L′_i]S_i[I_n L′_i]′ >0. Através de ma-nipula¸cões algébricas simples, (36) é reescrita na forma equivalente Φ−1 ₀ 0 I > > A_di B_di C_di D_di X_i Y_i • Z_i A_di B_di C_di D_di ′ (37) e conclui-se que esta desigualdade continua válida substituindo Φ−1i por Wi = Φ−1i − ǫI > 0 com

ǫ >0 suficientemente pequeno o que fornece (32). No entanto, isso implica em Wi−1 > Φi e

conse-quentemente W_i > W_iΦ_iW_i >W_i M_i′S_i W_i M_i , i_{∈ K} (38) reproduz a desigualdade matricial linear (31) e a

prova est´a conclu´ıda. ✷

O resultado acima mostra que o problema (27) é convexo e pode ser expresso por LMIs. Além disso, aplicando o Corolário 1, a fun¸cão objetivo que define um limitante superior para o ´ındice de desempenho H2do sistema em considera¸cão pode

ser escrita como uma fun¸cão do novo conjunto de variáveis matriciais introduzidas no Teorema 2. De fato, com (23) e (33) obtém-se

J <X i∈K π_i0tr(J_i′H_i′S_iH_iJ_i) < X i∈K π_i0tr E′_iI_n L′_iS_i I_n L_i E_i < X i∈K π_i0tr E_i′W−1 i Ei (39)

(6)

o que significa que o problema (27) reduz-se a N problemas de programa¸c˜ao convexa desacoplados

min Xi,Yi,Zi,Wi,Mi tr(E′ iW −1 i Ei) : (31) − (32) (40) cada um deles associado a um modo espec´ıfico da cadeia de Markov que fornece uma matriz de ga-nho ´otima para a realimenta¸c˜ao de estados (4) da forma Li = MiW−1

i , i ∈ K. Mantendo-se esta

propriedade em mente vê-se que o problema com duas condi¸cões de contorno definido no Teorema 1 e acrescido da determina¸cão dos ganhos ótimos de realimenta¸cão de estado é simples de ser resolvido numericamente através do procedimento iterativo proposto.

Neste ponto, deve-se colocar em evidência al-guns aspectos relacionados à solu¸cão do problema de s´ıntese de controle amostrado para sistemas li-neares com saltos markovianos.

4.1 Independˆencia do modo

Para que o controle amostrado (4) possa ser im-plementado é necessário medir o estado da ca-deia de Markov θ(t) nos instantes de amostragem t_k,_{∀k ∈ N. Para eliminar essa necessidade, ´}e pre-ciso fazer com que os ganhos de realimenta¸cão de estado não dependam do estado da cadeia, o que é conseguido impondo-se Li = L, ∀i ∈ K. Em

rela¸cão às variáveis do Teorema 2 isto é for¸cado através de

(Wi, M_i) = (W, M ) i ∈ K (41) o que faz com que o problema (27) deixe de ser desacoplado e assuma a forma

min Xi,Yi,Zi,W,M ( X i∈K π_i0tr E_i′W−1E_i ) (42)

sujeito às LMIs que são obtidas substituindo-se as variáveis matriciais (Wi, M_i) para todo i ∈ K por (W, M ) nas desigualdades (31) e (32). É evidente que o esfor¸co computacional envolvido na resolu-¸cão de (42) é maior que o necessário para resolver os N problemas desacoplados (40). A diferen¸ca torna-se cada vez mais acentuada conforme o n´ u-mero de estados N da cadeia de Markov aumenta.

4.2 O caso limite T → 0

Observa-se a relevância de se estudar o que ocorre quando o per´ıodo de amostragem é arbitraria-mente pequeno. O propósito é determinar o pro-blema limite de (40) considerando T > 0 arbi-trariamente pequeno. O Complemento de Schur relativo à segunda linha e coluna de (31) fornece

W_i_{− W}_iX−1 i Wi M′ i− WiX−1 i Yi • Z_i_{− Y}_i′X_i−1Y_i >0 (43)

e nota-se que o primeiro elemento da diagonal principal imp˜oe Wi−1> X

−1

i >0, o qual tendo em

vista o crit´erio a ser minimizado, requer Wi→ Xi.

Isso pode ser feito desde que M′

i → Yi. Nesse caso,

tem-se Li = MiW−1

i = Yi′X −1

i e a factibilidade

de (43) ´e assegurada pela escolha de Zi tal que

Z_i> L_iX_iL′

ipara todo i ∈ K.

Por outro lado, a desigualdade (32) pode ser reescrita na forma equivalente1

S_i_{− R}_i> A′_di B′_di W−1 i A_di B_di (44) ou ainda, após a aplica¸cão do Complemento de Schur, como W_i> A_di B_di (S_i_{− R}_i)−1 A′ di B′ di (45) Considerando T → 0+ _{em (25), determina-se a} aproxima¸cão Ri= T Qi em que Q_i= C_i′ D′_i C_i′ D′_i ′ + X j6_=i∈K λ_ijS_j (46)

onde utiliza-se a condi¸c˜ao inicial Pj(0) = Sj para

todo j ∈ K. Em seguida, o desenvolvimento em primeira ordem leva a (Si− Ri)−1 = Si−1+

S−1

i RiS −1

i . Da mesma forma, obt´em-se as

aproxi-ma¸c˜oes Adi= I + ¯A_iT em que ¯A_i= A_i+ (λ_ii/2)I e Bdi = BiT. Substituindo-se estas rela¸c˜oes em (45), os termos de ordem zero que aparecem em cada lado se cancelam pois Xi = [I 0]Si−1[I 0]′ e

o termo de primeira ordem imp˜oe X_iA¯′_i+ Y_iB′_i + ¯A_iX_i+ B_iY_i′+ + X_i Y_iQ_i X_i Y′ i <0 (47) Denotando-se Vi = Xi−1 > 0, multiplicando-se

esta desigualdade ambos os lados por Xi−1, ap´os

algumas manipula¸cões algébricas, obtém-se (Ai + BiL_i)′V_i+ V_i(A_i+ B_iL_i) + X j∈K λ_ijV_j+ + (Ci+ DiL_i)′(C_i+ D_iL_i) + Γ_i<0 (48) em que Γi= X j6=i∈K λ_ij I L_i ′ S_j₋ X−1 j 0 0 0 I L_i (49) Finalmente, utilizando-se a igualdade (28), o c´ al-culo de Si através da inversão por blocos leva a

S_j = I 0 X−1 j I 0 + + −L′j I Z_j_{− L}_jX_jL′_j−1_−L_j I(50) 1

(7)

e consequentemente Γi= X j6_=i∈K λ_ij(L_i_{− L}_j)′ Z_j_{− L}_jX_jL′_j−1(L_i_{− L}_j) (51) da qual se nota que Γi≥ 0 e que a escolha da va-ri´avel independente Zj → ∞, ∀j ∈ K faz com que Γi→ 0 para todo i ∈ K. Com isto recupera-se de (48) as desigualdades menos restritivas poss´ıveis que constituem as restri¸c˜oes de

min Li,Vi>0 ( X i∈K π_i0tr(E′ iViE_i) ) (52)

que corresponde ao problema de controle ´otimo em norma H2 via realimenta¸c˜ao de estado para

MJLS a tempo cont´ınuo, (Costa et al., 2013). Este resultado coloca em evidência a impor-tância do problema (8) proposto inicialmente pois a sua solu¸cão generaliza os resultados existentes na literatura para o controle via realimenta¸cão de estado de MJLS em tempo cont´ınuo. Trata-se de uma lei de controle linear amostrado que é válida para todo T > 0 e, como deveria ser, tende para a lei de controle ótimo em norma H2 quando o

per´ıodo de amostragem torna-se arbitrariamente pequeno.

5 Exemplo

Nesta se¸cão, apresentam-se algumas simula¸cões numéricas que colocam em evidência os resulta-dos teóricos obtiresulta-dos anteriormente. Neste sen-tido, considera-se um sistema linear sujeito a sal-tos Markovianos com dois N = 2 modos e com realiza¸cão dada por (1)-(2), em que

A₁= 0 1 −4 0 , A₂= 0 1 −1 0 , B₁= B₂=0 1 , E₁= E₂=1 1 , C₁= C₂=1 0 0 0 , D₁= D₂=0 1 . A matriz taxa de transi¸c˜ao Λ ∈ R2×2 _que

deter-mina as caracter´ısticas estoc´asticas do sistema, ´e dada por Λ = −0.5 0.5 0.2 −0.2

com o vetor de probabilidades inicial π0 = [1 0]′.

Em um primeiro ensaio, deseja-se projetar o con-trole amostrado via realimenta¸c˜ao de estado, de-finido em (4), em que o per´ıodo de amostragem ´e dado por tk+1− tk = T = 250 ms. Aplicando-se

as condi¸cões do Corolário 1 em conjunto com o algoritmo proposto, obtém-se os ganhos de reali-menta¸cão de estado L₁ =0.1791 −0.5561 L₂ =_−0.2972 _−0.8691 0 1 2 3 4 5 6 7 0 1 2 3 ℓ

Figura 1: Evolu¸c˜ao do algoritmo

0 2 4 6 8 10 −0.5 0 0.5 1 1.5 2 t(s) k z ( t) k 2 2

Figura 2: Simula¸c˜ao temporal

que asseguram o custo H2 ´otimo dado por

Jopt=

Z ∞

0 E {z(t)

′_z_{(t)}dt = 2.9524.}

A evolu¸cão, em cada itera¸cão, do algoritmo para obten¸cão desta solu¸cão é mostrada na Figura 1. Naquela figura, para cada itera¸cão ℓ ∈ N, a curva cont´ınua (em azul) representa evolu¸cão do custo ótimo obtido resolvendo-se o problema de otimi-za¸cão (27) no passo 3 do algoritmo.

Essa figura também coloca em evidência que o algoritmo proposto é bastante adequado para a solu¸cão do problema aqui formulado. Sua conver-gência uniforme, que é teoricamente assegurada segundo o que se estabelece em (Geromel and Vi-tal, 2014), ocorre em poucas itera¸cões, fazendo com que o esfor¸co computacional seja bastante re-duzido.

Na Figura 2 mostra-se a evolu¸c˜ao temporal da norma quadr´atica kz(t)k2

2, na qual a linha

cont´ı-nua (em vermelho) é o seu valor médio delimitado por duas trajetórias com um desvio padrão para mais e para menos. Essas trajetórias foram obti-das por meio de 2.000 simula¸cões temporais que permitem calcular o custo aproximado associado à lei de controle amostrado proposta como sendo igual a 2.9275. Este valor, bem próximo do custo ótimo fornecido pelo nosso algoritmo (difere de uma quantidade menor que 1% do valor ótimo), demonstra a qualidade dos resultados teóricos ob-tidos.

(8)

Aplicou-se também as condi¸cões de projeto de controle independente do modo. Neste caso, foi poss´ıvel obter factibilidade, para o mesmo sis-tema, considerando-se o per´ıodo de amostragem T = 250 ms. O algoritmo proposto fornece o ga-nho de realimenta¸cão de estado

L=_−0.1525 _−1.8189

com o qual assegura-se o custo garantido Jgar =

8.8555 que ´e um limitante superior para o custo H2 associado ao sistema em malha fechada.

6 Conclus˜ao

Neste artigo propôs-se a solu¸cão de um problema de projeto de controle que não encontra similar na literatura. Trata-se da determina¸cão de um con-trole amostrado via realimenta¸cão de estado para um sistema linear a tempo cont´ınuo sujeito a sal-tos markovianos. A dificuldade em abordar essa classe de problemas reside no fato de que os modos da cadeia de Markov mudam no decorrer do tempo segundo um processo estocástico próprio que não depende do per´ıodo de amostragem. Essa solu-¸cão passa pela defini¸cão de um MJLS h´ıbrido e pela determina¸cão de uma lei de controle que mi-nimiza um ´ındice de desempenho similar à norma H2. Isso é feito a partir do desenvolvimento de

um método iterativo que tem convergência uni-forme assegurada. Um exemplo constitu´ıdo por dois modos ilustra os resultados teóricos e coloca em clara evidência a validade e a qualidade do algoritmo proposto. No futuro, deseja-se genera-lizar o mesmo procedimento para o tratamento de problemas definidos no contexto H∞.

Agradecimentos

Os autores agradecem ao “Conselho Nacional de Desenvolvimento Cient´ıfico e Tecnológico - CNPq” e à “Funda¸cão de Amparo À Pesquisa do Estado de São Paulo - FAPESP” por possibilitarem o de-senvolvimento deste projeto de pesquisa.

Referˆencias

Chen, C.-T. (1999). Linear System Theory and

Design, 3rd edn, Oxford University Press, New York, NY.

Chen, T. and Francis, B. A. (1995). Optimal Sampled-Data Control Systems, Springer-Verlag, London, UK.

Colaneri, P., Geromel, J. C. and Locatelli, A. (1997). Control Theory and Design: An RH2 / RH∞Viewpoint, Academic Press, London,

UK.

Costa, O. L. V., Fragoso, M. D. and Marques, R. P. (2005). Discrete-time Markov Jump

Li-near Systems, Probability and Its Applicati-ons, Springer-Verlag, London, UK.

Costa, O. L. V., Fragoso, M. D. and Todorov, M. G. (2013). Continuous-time Markov Jump

Linear Systems, Probability and Its Applica-tions, Springer-Verlag, Berlin, DE.

Franklin, G. F., Powell, J. D. and Workman, M. L. (1997). Digital Control of Dynamic Systems, 3rd edn, Prentice Hall, Englewood Cliffs, NJ. Geromel, J. C. and Vital, G. W. G. (2014). Opti-mal H2 state feedback sampled-data control

design for markov jump linear systems. (sub-mitted).

Gon¸calves, A. P. C., Fioravanti, A. R. and Geromel, J. C. (2010). Markov jump li-near systems and filtering through network transmitted measurements, Signal Processing 90(10): 2842 – 2850.

Hespanha, J. P., Naghshtabrizi, P. and Xu, Y. (2007). A survey of recent results in networ-ked control systems, Proc. of the IEEE —

Special Issue on Technology of Networked Control Systems 95(1): 138–162.

Hu, L.-S., Shi, P. and Frank, P. M. (2006). Robust sampled-data control for Markovian jump li-near systems, Automatica 42(11): 2025–2030. Mazo Jr., M., Anta, A. and Tabuada, P. (2009). On self–triggered control for linear systems: guarantees and complexity, 10th European

Control Conference.

Mazo Jr., M. and Tabuada, P. (2008). On event– triggered and self–triggered control over senso/actuator networks, Proc. of the 47th

IEEE Conf. on Dec. and Contr.pp. 435–440. Ragazzini, J. R. and Franklin, G. F. (1958).

Sampled-data Control Systems, McGraw-Hill Series in Control Systems Engineering, McGraw-Hill, New York, NY.

Souza, M., Deaecto, G. S., Geromel, J. C. and Daafouz, J. (2013). Self-triggered li-near quadratic networked control, Optimal

Control Applications and Methods . doi: 10.1002/oca.2085.

Souza, M., Vital, G. W. G. and Geromel, J. C. (2014). Optimal sampled-data state feedback control of linear systems, 19th IFAC World

Congress - IFAC 2014 . To appear.

Wang, F.-Y. and Liu, D. (2008). Networked Control Systems: Theory and Applications, Springer-Verlag, London, UK.