CONTROLE H2 AMOSTRADO DE SISTEMAS LINEARES COM SALTOS
MARKOVIANOS VIA REALIMENTA ¸C ˜AO DE ESTADO
Gabriela W. Gabriel∗ Matheus Souza† Jos´e C. Geromel∗ ∗Faculdade de Engenharia El´etrica e de Computa¸cao (FEEC), UNICAMP
Campinas, SP, Brasil
†Hamilton Institute, National University of Ireland Maynooth (NUIM) Maynooth, Co. Kildare, Irlanda
Email: gvital@dca.unicamp.br, souza@dsce.fee.unicamp.br, geromel@dsce.fee.unicamp.br
Abstract— This paper is entirely devoted to analyze the H2 optimal state-feedback sampled-data control design problem for Markov Jump Linear Systems. It is proposed to search for a solution to this problem by imbedding it in a more general class of dynamic systems that we call Hybrid Markov Jump Linear System (HMJLS). In this new and wide context, it is shown how to evaluate a sampled-data state feedback control that minimizes the H2norm of the closed-loop system from the solution of a specific two-point boundary value problem. This result is then adapted to provide optimal control conditions based on linear matrix inequalities (LMIs). The theory is illustrated by means of an academical example.
Keywords— Markov jump linear systems (MJLS), Hybrid systems, Sampled-data control.
Resumo— Este artigo ´e inteiramente dedicado `a an´alise do problema de controle ´otimo H2 amostrado via realimenta¸c˜ao de estado para sistemas lineares com saltos markovianos. A solu¸c˜ao desse problema ´e obtida quando ele ´e visto como membro de uma classe mais abrangente de sistemas dinˆamicos que denominamos Sistemas Lineares H´ıbridos com Saltos Markovianos (HMJLS). Nesse novo contexto, coloca-se em evidˆencia como calcular um controle amostrado via realimenta¸c˜ao de estado que minimiza a norma H2 do sistema em malha fechada a partir da solu¸c˜ao de um problema com duas condi¸c˜oes de contorno. Este resultado ´e ent˜ao adaptado para que seja expresso por meio de desigualdades matriciais lineares (LMIs). A teoria desenvolvida ´e ilustrada por meio de um exemplo num´erico.
Palavras-chave— Sistemas lineares markovianos (MJLS), Sistemas h´ıbridos, Controle de sistemas amostra-dos.
1 Introdu¸c˜ao
Sistemas de controle amostrados vˆem ganhando grande importˆancia no ˆambito de controle de sis-temas dinˆamicos. Esta estrutura ´e amplamente empregada em arquiteturas modernas de controle, como sistemas de controle digital (Chen and cis, 1995; Ragazzini and Franklin, 1958; Fran-klin et al., 1997) e sistemas de controle via rede (Hespanha et al., 2007; Wang and Liu, 2008). Es-pecificamente para o ´ultimo caso, ´e importante lembrar que as caracter´ısticas apresentadas pelo meio f´ısico em que os sinais s˜ao transmitidos po-dem provocar uma degrada¸c˜ao inaceit´avel de de-sempenho em malha fechada. Tais limita¸c˜oes en-volvem atrasos de transporte, perda de pacotes de dados transmitidos e limita¸c˜ao de largura de faixa. Neste artigo, as duas ´ultimas limita¸c˜oes s˜ao espe-cialmente abordadas.
O problema de controle com largura de faixa limitada pode ser resolvido com estrat´egias bem estabelecidas no contexto de controle amostrado; ver (Souza et al., 2013). Para o caso especial em que a taxa de amostragem ´e constante, os pro-blemas de estabiliza¸c˜ao e de controle ´otimo H2,
ambos via realimenta¸c˜ao de estado, s˜ao resolvidos em (Souza et al., 2013; Chen, 1999) com o uso de um sistema a tempo discreto equivalente ao ori-ginal, sem lan¸car m˜ao de qualquer tipo de aproxi-ma¸c˜ao. Estrat´egias mais gerais como acionamento
por evento e auto-acionamento podem ser aplica-das para considerar taxas de dados variantes no tempo (Mazo Jr. and Tabuada, 2008; Mazo Jr. et al., 2009; Souza et al., 2013). Sistemas lineares com saltos markovianos (MJLS) podem ser uti-lizados para modelar perdas de pacotes e falhas em atuadores; ver (Gon¸calves et al., 2010; Costa et al., 2013; Costa et al., 2005) para detalhes. De fato, a planta pode ser modelada como um MJLS a tempo cont´ınuo, em que um modo representa a opera¸c˜ao nominal e outro est´a associado `a perda de pacote ou falha em atuadores ou sensores.
Neste artigo, o principal prop´osito ´e proje-tar uma lei de controle amostrado via realimen-ta¸c˜ao de estado para sistemas lineares com sal-tos markovianos. Por conseguinte, visa abordar as duas limita¸c˜oes, detalhadas acima, e que est˜ao presentes em sistemas de controle em rede. Deve-se notar que a modelagem a tempo discreto do sistema em malha fechada n˜ao ´e capaz de incor-porar toda informa¸c˜ao dispon´ıvel entre os instan-tes de amostragem, uma vez que os estados do processo de Markov a tempo cont´ınuo mudam de forma totalmente independente destes instantes. Desta forma, os resultados cl´assicos de controle de MJLS a tempo discreto n˜ao podem ser efeti-vamente aplicados neste caso. A ausˆencia de um n´umero expressivo de contribui¸c˜oes para a reso-lu¸c˜ao deste problema pode ser assim justificada,
sendo (Hu et al., 2006) uma importante exce¸c˜ao. Neste artigo, apresenta-se uma nova formu-la¸c˜ao do problema de controle amostrado de sis-temas lineares com saltos markovianos utilizando uma abordagem de sistemas h´ıbridos – como em (Souza et al., 2014), em que ´e considerado o caso linear e invariante no tempo. A partir disso, torna-se poss´ıvel avaliar a sua estabilidade e calcular a sua norma H2sem que qualquer aproxima¸c˜ao seja
introduzida. Para esse fim, na Se¸c˜ao 2, o problema e sua reformula¸c˜ao em um sistema h´ıbrido equiva-lente s˜ao apresentados. Na Se¸c˜ao 3, o resultado te´orico b´asico, com o qual ser´a poss´ıvel avaliar a estabilidade do sistema h´ıbrido equivalente, ´e de-senvolvido. Este resultado tamb´em permite calcu-lar sua norma H2 do sistema de interesse atrav´es
da solu¸c˜ao de um problema com duas condi¸c˜oes de contorno. O problema de controle ´otimo H2´e
ent˜ao resolvido na Se¸c˜ao 4. Um exemplo num´erico ´e apresentado e discutido na Se¸c˜ao 5. A Se¸c˜ao 6 ´e dedicada `as conclus˜oes finais.
A nota¸c˜ao utilizada ´e padr˜ao. Para matrizes quadradas, denota-se a fun¸c˜ao tra¸co como tr(·). Para matrizes ou vetores reais, indica-se a trans-posta atrav´es de (′). Para matrizes sim´etricas,
denota-se cada um dos blocos sim´etricos como (•). Indica-se o conjunto dos n´umeros reais e o conjunto dos n´umeros naturais como R e N, res-pectivamente. Para qualquer matriz sim´etrica, indica-se que X ´e (semi)definida positiva atrav´es de X > 0 (X ≥ 0). Denota-se por E{·} o operador esperan¸ca matem´atica e por P(·) a probabilidade de (·). Indica-se o limite `a esquerda de ξ(t) para t→ tk com tk≥ 0, k ∈ N, atrav´es de ξ(t−
k). Uma
matriz quadrada ´e Hurwitz est´avel quando todos os seus autovalores estiverem situados na regi˜ao Re(s) < 0 e ´e Schur est´avel quando estiverem em |z| < 1.
2 Apresenta¸c˜ao do Problema Considera-se a classe de Sistemas Lineares com Saltos Markovianos (MJLS) e realiza¸c˜ao m´ınima no espa¸co de estados dada por
˙x(t) = Aθ(t)x(t) + Bθ(t)u(t) + Eθ(t)w(t) (1) z(t) = Cθ(t)x(t) + Dθ(t)u(t) (2) em que os vetores x ∈ Rn, u ∈ Rm, w ∈ Rr e z ∈
Rs s˜ao, respectivamente, o estado, a entrada de
controle, a entrada ex´ogena e a sa´ıda controlada. Define-se o conjunto K = {1, · · · , N } e a vari´avel θ(t) ∈ K, um parˆametro variante no tempo cuja evolu¸c˜ao ´e governada por um processo markoviano cont´ınuo com matriz de taxa de transi¸c˜ao {λij} = Λ ∈ RN ×N tal que
P(θ(t + h) = j|θ(t) = i) = δi−j+ λijh+ o(h) (3) onde δi−j indica a fun¸c˜ao delta de Kronecker, ou
seja, δi−j = 1 se i = j ∈ K e δi−j = 0, caso
contr´ario e limh→0+o(h)/h = 0. Os elementos da matriz Λ ∈ RN ×N s˜ao tais que λ
ij ≥ 0, ∀i 6= j e P
j∈Kλij = 0, ∀i ∈ K o que implica em λii ≤ 0, ∀i ∈ K. Assume-se que o sistema evolui a par-tir de uma condi¸c˜ao inicial x(0) = 0 e θ(0) = θ0
com P(θ0 = i) = πi0, ∀i ∈ K. Baseados na
de-fini¸c˜ao de norma H2, a entrada ex´ogena w(t) ´e
uma s´erie de impulsos (delta de Dirac), a ser de-finida posteriormente; ver (Colaneri et al., 1997) para maiores detalhes. Finalmente, introduz-se a classe de entrada controlada que ´e caracterizada por um controle linear amostrado por realimenta-¸c˜ao de estado da forma
u(t) = Lθ(t
k)x(tk), t ∈ [tk, tk+1) (4)
onde {tk}k∈N s˜ao instantes de amostragem
su-cessivos tais que t0 = 0, tk+1 > tk,∀k ∈ N e limk→∞tk = ∞. Neste artigo deseja-se fornecer condi¸c˜oes para garantir a estabilidade assint´otica e otimizar a norma H2 do sistema em malha
fe-chada em rela¸c˜ao `as matrizes de ganho Li, ∀i ∈ K.
Para esse fim, introduz-se uma apresenta¸c˜ao alternativa para a classe MJLS definida em (1)-(4), por´em totalmente equivalente
˙ ξ(t) = Aθ(t) Bθ(t) 0 0 ξ(t) + Eθ(t) 0 w(t) (5) z(t) = Cθ(t) Dθ(t)ξ(t) (6) ξ(tk) = In 0 Lθ(t k) 0 ξ(t− k) (7)
sujeita `a condi¸c˜ao inicial ξ(0−) = ξ
0= 0, θ(0−) =
θ(0) = θ0 e v´alida para todo t ∈ [tk, tk+1), k ∈ N. Este ´e denominado Sistema Linear H´ıbrido com Saltos Markovianos cuja raz˜ao, por tr´as desta re-formula¸c˜ao, ´e simples. Definindo-se o estado au-mentado ξ(t) = [x(t)′ u(t)′]′, a segunda
compo-nente da equa¸c˜ao diferencial em (5) fornece u(t) = u(tk) a qual em conjunto com (7) implica em u(t) = Lθ(t
k)x(tk). Al´em disso, substituindo-se
esta solu¸c˜ao na equa¸c˜ao (5) tem-se x(t) e z(t) v´ali-dos para todo t ∈ [tk, tk+1) que ´e exatamente o sis-tema em malha aberta (1)-(2) controlado pela lei de controle amostrado (4). Dessa forma, deseja-se determinar a solu¸c˜ao do seguinte problema de otimiza¸c˜ao inf L1,··· ,LN r X l=1 Z ∞ 0 E {z l(t)′zl(t)}dt (8) onde zl(t) ´e a sa´ıda associada `a entrada impulsiva
w(t) = elδ(t−), em que el∈ Rr´e a l-´esima coluna da matriz identidade. Trata-se de um problema de controle ´otimo H2 via realimenta¸c˜ao de estado
com controle amostrado caracterizado pela restri-¸c˜ao (4). Sob certas considera¸c˜oes iniciais envol-vendo a sua observabilidade, a caracter´ıstica finita da fun¸c˜ao objetivo descrita em (8) implica em sua estabilidade assint´otica.
3 Sistemas Lineares H´ıbridos com Saltos Markovianos
Nesta se¸c˜ao considera-se o seguinte HMJLS ˙ ξ(t) = Fθ(t)ξ(t) (9) z(t) = Gθ(t)ξ(t) (10) ξ(tk) = Hθ(t k)ξ(t − k) (11)
evoluindo a partir da condi¸c˜ao inicial arbitr´aria ξ(0−) = ξ0, θ(0−) = θ(0) = θ0. Verifica-se que este modelo cont´em, como caso particular, o descrito pelas equa¸c˜oes (5)-(7) com w(t) = 0. Para facilitar a apresenta¸c˜ao, denota-se ¯Fi= Fi+ (λii/2)I, ∀i ∈ K e considera-se amostragem uni-forme Tk = tk+1 − tk = T > 0, ∀k ∈ N. O
resultado mais importante desta se¸c˜ao ´e obtido introduzindo-se o vetor π(t) ∈ RN cujas
compo-nentes s˜ao πi(t) = P(θ(t) = i), i ∈ K, e que
sa-tisfazem ˙π(t) = Λ′π(t) (Costa et al., 2013),
evo-luindo a partir da condi¸c˜ao inicial π(0) = π0, onde
πi0 = P(θ0 = i), ∀i ∈ K. Obviamente π(t) ≥ 0 e P
i∈Kπi(t) = 1 para todo t ≥ 0. O pr´oximo
teo-rema ´e central para os desenvolvimentos apresen-tados a seguir.
Teorema 1 Considere T > 0 dado. Se existem
matrizes definidas positivas Si > 0, ∀i ∈ K que
satisfazem as equa¸c˜oes acopladas de Lyapunov
˙ Pi+ F′ iPi+ PiFi+ X j∈K λijPj = −G′ iGi (12) sujeitas `as condi¸c˜oes de contorno inicial Pi(0) <
Si e final Pi(T ) > H′
iSiHi para todo i ∈ K ent˜ao
o HMJLS (9)-(11) ´e est´avel em m´edia quadr´atica e satisfaz J = Z ∞ 0 E {z(t) ′z(t)}dt < X i∈K πi0ξ0′Hi′SiHiξ0 (13) Prova: Define-se a vari´avel ν(t) = (ξ(t), θ(t)) e a
fun¸c˜ao quadr´atica
V(ν(t)) = ξ(t)′Pθ(t)(t)ξ(t) (14) v´alida para todo t ∈ [tk, tk+1), ∀k ∈ N. Devi-do a sua natureza invariante no tempo, a solu-¸c˜ao do problema com duas condi¸c˜oes de contorno no primeiro intervalo [0, T ) permanece a mesma nos intervalos seguintes [kT, (k + 1)T ), ∀k ∈ N, desde que as condi¸c˜oes Pi(tk) = Pi(0) e Pi(t−k+1) =
Pi(T ) para todo i ∈ K sejam impostas.
Para todo intervalo de tempo t ∈ [tk, tk+1), k ∈ N, levando-se em conta (12) a f´ormula de Dynkin, veja (Costa et al., 2013), tem-se
V(ν(tk)) − EV(ν(t− k+1))|ν(tk) = = E Z tk+1 tk z(t)′z(t)dt|ν(tk) (15)
Por outro lado, utilizando-se as condi¸c˜oes de con-torno do problema, verifica-se que V (ν(tk)) <
ξ(tk)′Sθ(t
k)ξ(tk)) e, em decorrˆencia da
desconti-nuidade da vari´avel de estado ξ(t) entre os ins-tantes de tempo t−k+1 e tk+1, tem-se
EV(ν(t− k+1))|ν(tk) = = Enξ(t− k+1)′Pθ(t− k+1)(t − k+1)ξ(t−k+1)|ν(tk) o >Eξ(tk+1)′Sθ(t k+1)ξ(tk+1)|ν(tk) (16) uma vez que a continuidade do processo estoc´ as-tico (3) imp˜oe θ(t− k+1) = θ(tk+1) e a condi¸c˜ao de contorno implica em P θ(t− k+1)(t − k+1) = Pθ(tk+1)(t − k+1) > H′ θ(tk+1) Sθ(t k+1)Hθ(tk+1)(17)
Dessa forma, definindo-se a fun¸c˜ao quadr´atica v(ν(tk))=ξ(tk)′Sθ(t k)ξ(tk) em conjunto com (15) e (16), tem-se E {v(ν(tk+1))|ν(tk)} − v(ν(tk)) < <−E Z tk+1 tk z(t)′z(t)dt|ν(tk) (18) e como Si > 0, ∀i ∈ K ent˜ao v(ν(tk)) ´e po-sitiva definida e E{v(ν(tk))} pode ser
conside-rada uma fun¸c˜ao de Lyapunov associada ao pro-cesso a tempo discreto ξ(tk) → ξ(tk+1) para todo
k∈ N. Nota-se duas consequˆencias imediatas. A primeira, devido a desigualdade estrita em (18), existe ε > 0 suficientemente pequeno tal que E {v(ν(tk+1))|ν(tk)} ≤ (1 − ε)v(ν(tk)) o que
im-plica em E{v(ν(tk+1))} → 0 quando k ∈ N tende
a infinito e consequentemente E{kξ(t)k2
} → 0 quando t → ∞ o que assegura a estabilidade assin-t´otica em m´edia quadr´atica. Ademais, obt´em-se (13) a partir da desigualdade J = E ( X k∈N E Z tk+1 tk z(t)′z(t)dt|ν(tk) ) <E ( X k∈N v(ν(tk)) − E{v(ν(tk+1))|ν(tk)} ) <E {v(ν(0))} (19)
tendo em vista que ξ(0) = Hθ0ξ0 e πi0 = P(θ0=
i), i ∈ K, completando a prova do teorema
pro-posto. ✷
Nota-se que o limitante superior proposto do custo total ´e calculado pela soma das contribui¸c˜oes que ocorrem entre dois instantes de amostragem sucessivos. Para que isso ocorra, uma solu¸c˜ao do problema com dois valores de contorno deve ser determinada.
Nota-se tamb´em atrav´es da prova do Teorema 1 que a quantidade expressa no lado direto de (13) n˜ao ´e apenas um limitante superior para o custo tendo em vista que J → P
i∈Kπi0ξ′
sempre que Pi(0) → Si > 0 e Pi(T ) → H′
iSiHi para todo i ∈ K o que reproduz o custo ´otimo. Segundo o conhecimento dos autores, n˜ao existe resultado similar na literatura. Esta condi¸c˜ao de-pende fortemente da descontinuidade imposta em (11), pois o problema com duas condi¸c˜oes de con-torno deve admitir uma solu¸c˜ao mesmo que (9) n˜ao seja estocasticamente est´avel. Em outras pa-lavras, a realimenta¸c˜ao se d´a atrav´es das matrizes Hi,∀i ∈ K fazendo com que o efeito de fecharmos a malha atrav´es do controle amostrado (4) seja a descontinuidade (11) produzida nos instantes de amostragem.
Apresenta-se o segundo coment´ario na forma de um corol´ario ao Teorema 1, o qual se refere `a generaliza¸c˜ao para se obter a norma H2 de um
HMJLS da forma ˙ ξ(t) = Fθ(t)ξ(t) + Jθ(t)w(t) (20) z(t) = Gθ(t)ξ(t) (21) ξ(tk) = Hθ(t k)ξ(t − k) (22)
que evolui, no tempo, a partir da condi¸c˜ao inicial ξ(0−) = 0, θ(0−) = θ(0) = θ0.
Corol´ario 1 Considere T >0 dado. Se existem
matrizes definidas positivas Si >0, ∀i ∈ K
satis-fazendo o problema com duas condi¸c˜oes de con-torno apresentado no Teorema 1 ent˜ao o HMJLS (20)-(22) ´e est´avel em m´edia quadr´atica e satisfaz
J = r X l=1 Z ∞ 0 E {z l(t)′zl(t)}dt < X i∈K πi0tr(Ji′Hi′SiHiJi) (23) Prova: A prova decorre do resultado to Teorema 1 considerando, sucessivamente, o conjunto de en-tradas impulsivas w(t) = elδ(t−), onde el ∈ Rr ´e a l-´esima coluna da matriz identidade, e as sa´ıdas correspondentes zl(t) para l = 1, · · · , r.
Completa-se a prova como decorrˆencia do sistema original possuir condi¸c˜ao inicial ξ(0−) = 0, a qual,
devido a cada impulso, se altera instantaneamente para ξ(0−) = J
θ(0−)el para todo l = 1, · · · , r. Em seguida, invocando-se a continuidade da cadeia de Markov que imp˜oe θ(0) = θ(0−), a desigualdade
(13) fornece (23) e a prova est´a completa. ✷ Com este resultado, discute-se como resolver o problema com duas condi¸c˜oes de contorno do Teorema 1. Com algumas manipula¸c˜oes alg´ebricas simples mostra-se que as fun¸c˜oes matriciais
Pi(t) = e− ¯F ′ it(Pi(0) − Ri(P, t))) e− ¯Fit (24) em que Ri(P, t) = Z t 0 eF¯ ′ iτ G′iGi+ X j6=i∈K λijPj(τ ) e ¯ Fiτdτ (25)
definidas para todo t ∈ [0, T ) e i ∈ K resolvem (implicitamente) a equa¸c˜ao diferencial linear (12). De fato, fixadas as condi¸c˜oes iniciais Pi(0) ou
fi-nais Pi(T ) para todo i ∈ K, elas podem ser
resol-vidas sem grandes dificuldades. Por outro lado, o problema com duas condi¸c˜oes de contorno ´e resolvido impondo-se as restri¸c˜oes Pi(0) < Si e
Pi(T ) > Hi′SiHi, as quais podem ser reescritas na forma conjunta
eF¯
′ iTH′
iSiHieF¯iT < Si− Ri(P, T ) (26) para todo i ∈ K. O procedimento iterativo para resolver o problema com duas condi¸c˜oes de con-torno, para T > 0 dado, ´e sumarizado nos seguin-tes passos:
1. Inicializa-se o contador de itera¸c˜oes ℓ = 0. Define-se Sℓ
i = 0, para todo i ∈ K e Jℓ= 0.
2. Determina-se a solu¸c˜ao Pℓ
i(t) das equa¸c˜oes
di-ferenciais acopladas ˙ Pi+ Fi′Pi+ PiFi+ X j∈K λijPj = −G′iGi
sob as condi¸c˜oes finais Pi(T ) = Hi′SiℓHi, para
todo i ∈ K e todo t ∈ [0, T ).
3. Determina-se Siℓ+1>0 solu¸c˜ao do problema
inf Si>0 {tr(Ji′Hi′SiHiJi) : eF¯ ′ iTHi′SiHieF¯iT < Si− Ri(Pℓ, T) o para cada i ∈ K, bem como o valor ´otimo do crit´erio Jℓ+1=Pi∈Kπi0tr(Ji′Hi′Siℓ+1HiJi). 4. Faz-se ℓ + 1 → ℓ at´e que Jℓ+1− Jℓ seja
sufi-cientemente pequeno.
Este procedimento iterativo ´e similar aos ado-tados na resolu¸c˜ao de problemas com duas condi-¸c˜oes de contorno, bastante frequentes em controle ´otimo. Em (Geromel and Vital, 2014) encontra-se a prova formal de sua convergˆencia. Conforme apresentado a seguir, adapta-se este procedimento para resolver o problema indicado em (8) que ´e o principal objetivo deste trabalho.
4 Projeto de Controle Amostrado Nesta se¸c˜ao aborda-se o problem (8) a partir do re-sultado do Teorema 1 e, por conseguinte, no passo 2 do algoritmo deve-se resolver
inf Li,Si>0 ( X i∈K πi0tr(Ji′Hi′SiHiJi) : eF¯ ′ iTHi′SiHieF¯iT < Si− Ri(Pℓ, T) o (27) e observa-se que para Ri(Pℓ, T), ∀i ∈ K fixo este problema ´e reescrito como N subproblemas desa-coplados. Antes de prosseguir, ´e necess´ario definir
as seguintes estruturas de blocos matriciais parti-cionados de acordo com as dimens˜oes da vari´avel de estado e da vari´avel de controle
S−1 i = Xi Yi • Zi (28) Ri(Pℓ, T) = Cdi′ Ddi′ Cdi Ddi (29) para todo i ∈ K. Nota-se que a fatora¸c˜ao (29) pode ser realizada pois Ri(Pℓ, T) ≥ 0, ∀i ∈ K. Al´em disso, considerando-se as equa¸c˜oes (5)-(7), manipula¸c˜oes alg´ebricas simples evidenciam que
HieF¯iT = In 0 Li 0 eAiT RT 0 e Aiτdτ Bi 0 Im e( λii 2 )T = In Li h eAiT RT 0 e Aiτdτ Bi i e( λii 2 )T = In Li Adi Bdi (30)
onde pode-se identificar Adi = e(λii/2)TeAiT e
Bdi = e(λii/2)TRT 0 e
Aiτdτ Bi para todo i ∈ K. O pr´oximo teorema mostra que o problema de otimi-za¸c˜ao convexa (27) pode ser expresso atrav´es de LMIs de tal forma que a sua solu¸c˜ao ´otima glo-bal ´e determinada sem maiores dificuldades com o uso de rotinas num´ericas dispon´ıveis na literatura atual.
Teorema 2 O problema (27) ´e fact´ıvel se e so-mente se existem matrizes sim´etricas Xi, Zi, Wi e
matrizes Yi, Mi de dimens˜oes compat´ıveis tais que Wi Wi M′ i • Xi Yi • • Zi >0 (31) Wi 0 0 I > Adi Bdi Cdi Ddi Xi Yi • Zi Adi Bdi Cdi Ddi ′ (32) para todo i ∈ K.
Prova: Primeiramente, prova-se a suficiˆencia assumindo-se que as desigualdades (31)-(32) se verificam. Fazendo Li = MiWi−1, considerando (28), multiplicando os dois lados de (31) por diag(Wi−1, In, Im) e calculando o complemento de Schur em rela¸c˜ao `as duas ´ultimas linhas e colunas, tem-se que W−1 i > In L′iSi In Li , i∈ K (33) Por outro lado, (32) ´e equivalente a
Si> Adi Bdi Cdi Ddi ′ Wi−1 0 0 I Adi Bdi Cdi Ddi (34)
a qual, em conjunto com (30) e (33), resulta em Si− Ri(Pℓ, T) = = Si− C′ di D′ di Cdi Ddi > A′ di B′di W−1 i Adi Bdi > A′di B′ di In L′ i Si In Li Adi Bdi > eF¯ ′ iTHi′SiHieF¯iT, i∈ K (35) que ´e exatamente a restri¸c˜ao do problema (27) completando esta parte da prova. Para a necessi-dade, assume-se que o problema (27) seja fact´ıvel para algum par de matrizes (Li, Si >0), i ∈ K. Posto isso, as restri¸c˜oes do problema (27) podem ser escritas como
Si > A′ di B′ di Φi Adi Bdi + + Cdi′ Ddi′ Cdi Ddi, i∈ K (36) onde Φi = [In L′i]Si[In L′i]′ >0. Atrav´es de ma-nipula¸c˜oes alg´ebricas simples, (36) ´e reescrita na forma equivalente Φ−1 0 0 I > > Adi Bdi Cdi Ddi Xi Yi • Zi Adi Bdi Cdi Ddi ′ (37) e conclui-se que esta desigualdade continua v´alida substituindo Φ−1i por Wi = Φ−1i − ǫI > 0 com
ǫ >0 suficientemente pequeno o que fornece (32). No entanto, isso implica em Wi−1 > Φi e
conse-quentemente Wi > WiΦiWi >Wi Mi′Si Wi Mi , i∈ K (38) reproduz a desigualdade matricial linear (31) e a
prova est´a conclu´ıda. ✷
O resultado acima mostra que o problema (27) ´e convexo e pode ser expresso por LMIs. Al´em disso, aplicando o Corol´ario 1, a fun¸c˜ao objetivo que define um limitante superior para o ´ındice de desempenho H2do sistema em considera¸c˜ao pode
ser escrita como uma fun¸c˜ao do novo conjunto de vari´aveis matriciais introduzidas no Teorema 2. De fato, com (23) e (33) obt´em-se
J <X i∈K πi0tr(Ji′Hi′SiHiJi) < X i∈K πi0tr E′iIn L′iSi In Li Ei < X i∈K πi0tr Ei′W−1 i Ei (39)
o que significa que o problema (27) reduz-se a N problemas de programa¸c˜ao convexa desacoplados
min Xi,Yi,Zi,Wi,Mi tr(E′ iW −1 i Ei) : (31) − (32) (40) cada um deles associado a um modo espec´ıfico da cadeia de Markov que fornece uma matriz de ga-nho ´otima para a realimenta¸c˜ao de estados (4) da forma Li = MiW−1
i , i ∈ K. Mantendo-se esta
propriedade em mente vˆe-se que o problema com duas condi¸c˜oes de contorno definido no Teorema 1 e acrescido da determina¸c˜ao dos ganhos ´otimos de realimenta¸c˜ao de estado ´e simples de ser resolvido numericamente atrav´es do procedimento iterativo proposto.
Neste ponto, deve-se colocar em evidˆencia al-guns aspectos relacionados `a solu¸c˜ao do problema de s´ıntese de controle amostrado para sistemas li-neares com saltos markovianos.
4.1 Independˆencia do modo
Para que o controle amostrado (4) possa ser im-plementado ´e necess´ario medir o estado da ca-deia de Markov θ(t) nos instantes de amostragem tk,∀k ∈ N. Para eliminar essa necessidade, ´e pre-ciso fazer com que os ganhos de realimenta¸c˜ao de estado n˜ao dependam do estado da cadeia, o que ´e conseguido impondo-se Li = L, ∀i ∈ K. Em
rela¸c˜ao `as vari´aveis do Teorema 2 isto ´e for¸cado atrav´es de
(Wi, Mi) = (W, M ) i ∈ K (41) o que faz com que o problema (27) deixe de ser desacoplado e assuma a forma
min Xi,Yi,Zi,W,M ( X i∈K πi0tr Ei′W−1Ei ) (42)
sujeito `as LMIs que s˜ao obtidas substituindo-se as vari´aveis matriciais (Wi, Mi) para todo i ∈ K por (W, M ) nas desigualdades (31) e (32). ´E evidente que o esfor¸co computacional envolvido na resolu-¸c˜ao de (42) ´e maior que o necess´ario para resolver os N problemas desacoplados (40). A diferen¸ca torna-se cada vez mais acentuada conforme o n´ u-mero de estados N da cadeia de Markov aumenta.
4.2 O caso limite T → 0
Observa-se a relevˆancia de se estudar o que ocorre quando o per´ıodo de amostragem ´e arbitraria-mente pequeno. O prop´osito ´e determinar o pro-blema limite de (40) considerando T > 0 arbi-trariamente pequeno. O Complemento de Schur relativo `a segunda linha e coluna de (31) fornece
Wi− WiX−1 i Wi M′ i− WiX−1 i Yi • Zi− Yi′Xi−1Yi >0 (43)
e nota-se que o primeiro elemento da diagonal principal imp˜oe Wi−1> X
−1
i >0, o qual tendo em
vista o crit´erio a ser minimizado, requer Wi→ Xi.
Isso pode ser feito desde que M′
i → Yi. Nesse caso,
tem-se Li = MiW−1
i = Yi′X −1
i e a factibilidade
de (43) ´e assegurada pela escolha de Zi tal que
Zi> LiXiL′
ipara todo i ∈ K.
Por outro lado, a desigualdade (32) pode ser reescrita na forma equivalente1
Si− Ri> A′di B′di W−1 i Adi Bdi (44) ou ainda, ap´os a aplica¸c˜ao do Complemento de Schur, como Wi> Adi Bdi (Si− Ri)−1 A′ di B′ di (45) Considerando T → 0+ em (25), determina-se a aproxima¸c˜ao Ri= T Qi em que Qi= Ci′ D′i Ci′ D′i ′ + X j6=i∈K λijSj (46)
onde utiliza-se a condi¸c˜ao inicial Pj(0) = Sj para
todo j ∈ K. Em seguida, o desenvolvimento em primeira ordem leva a (Si− Ri)−1 = Si−1+
S−1
i RiS −1
i . Da mesma forma, obt´em-se as
aproxi-ma¸c˜oes Adi= I + ¯AiT em que ¯Ai= Ai+ (λii/2)I e Bdi = BiT. Substituindo-se estas rela¸c˜oes em (45), os termos de ordem zero que aparecem em cada lado se cancelam pois Xi = [I 0]Si−1[I 0]′ e
o termo de primeira ordem imp˜oe XiA¯′i+ YiB′i + ¯AiXi+ BiYi′+ + Xi YiQi Xi Y′ i <0 (47) Denotando-se Vi = Xi−1 > 0, multiplicando-se
esta desigualdade ambos os lados por Xi−1, ap´os
algumas manipula¸c˜oes alg´ebricas, obt´em-se (Ai + BiLi)′Vi+ Vi(Ai+ BiLi) + X j∈K λijVj+ + (Ci+ DiLi)′(Ci+ DiLi) + Γi<0 (48) em que Γi= X j6=i∈K λij I Li ′ Sj− X−1 j 0 0 0 I Li (49) Finalmente, utilizando-se a igualdade (28), o c´ al-culo de Si atrav´es da invers˜ao por blocos leva a
Sj = I 0 X−1 j I 0 + + −L′j I Zj− LjXjL′j−1−Lj I(50) 1
e consequentemente Γi= X j6=i∈K λij(Li− Lj)′ Zj− LjXjL′j−1(Li− Lj) (51) da qual se nota que Γi≥ 0 e que a escolha da va-ri´avel independente Zj → ∞, ∀j ∈ K faz com que Γi→ 0 para todo i ∈ K. Com isto recupera-se de (48) as desigualdades menos restritivas poss´ıveis que constituem as restri¸c˜oes de
min Li,Vi>0 ( X i∈K πi0tr(E′ iViEi) ) (52)
que corresponde ao problema de controle ´otimo em norma H2 via realimenta¸c˜ao de estado para
MJLS a tempo cont´ınuo, (Costa et al., 2013). Este resultado coloca em evidˆencia a impor-tˆancia do problema (8) proposto inicialmente pois a sua solu¸c˜ao generaliza os resultados existentes na literatura para o controle via realimenta¸c˜ao de estado de MJLS em tempo cont´ınuo. Trata-se de uma lei de controle linear amostrado que ´e v´alida para todo T > 0 e, como deveria ser, tende para a lei de controle ´otimo em norma H2 quando o
per´ıodo de amostragem torna-se arbitrariamente pequeno.
5 Exemplo
Nesta se¸c˜ao, apresentam-se algumas simula¸c˜oes num´ericas que colocam em evidˆencia os resulta-dos te´oricos obtiresulta-dos anteriormente. Neste sen-tido, considera-se um sistema linear sujeito a sal-tos Markovianos com dois N = 2 modos e com realiza¸c˜ao dada por (1)-(2), em que
A1= 0 1 −4 0 , A2= 0 1 −1 0 , B1= B2=0 1 , E1= E2=1 1 , C1= C2=1 0 0 0 , D1= D2=0 1 . A matriz taxa de transi¸c˜ao Λ ∈ R2×2 que
deter-mina as caracter´ısticas estoc´asticas do sistema, ´e dada por Λ = −0.5 0.5 0.2 −0.2
com o vetor de probabilidades inicial π0 = [1 0]′.
Em um primeiro ensaio, deseja-se projetar o con-trole amostrado via realimenta¸c˜ao de estado, de-finido em (4), em que o per´ıodo de amostragem ´e dado por tk+1− tk = T = 250 ms. Aplicando-se
as condi¸c˜oes do Corol´ario 1 em conjunto com o algoritmo proposto, obt´em-se os ganhos de reali-menta¸c˜ao de estado L1 =0.1791 −0.5561 L2 =−0.2972 −0.8691 0 1 2 3 4 5 6 7 0 1 2 3 ℓ
Figura 1: Evolu¸c˜ao do algoritmo
0 2 4 6 8 10 −0.5 0 0.5 1 1.5 2 t(s) k z ( t) k 2 2
Figura 2: Simula¸c˜ao temporal
que asseguram o custo H2 ´otimo dado por
Jopt=
Z ∞
0 E {z(t)
′z(t)}dt = 2.9524.
A evolu¸c˜ao, em cada itera¸c˜ao, do algoritmo para obten¸c˜ao desta solu¸c˜ao ´e mostrada na Figura 1. Naquela figura, para cada itera¸c˜ao ℓ ∈ N, a curva cont´ınua (em azul) representa evolu¸c˜ao do custo ´otimo obtido resolvendo-se o problema de otimi-za¸c˜ao (27) no passo 3 do algoritmo.
Essa figura tamb´em coloca em evidˆencia que o algoritmo proposto ´e bastante adequado para a solu¸c˜ao do problema aqui formulado. Sua conver-gˆencia uniforme, que ´e teoricamente assegurada segundo o que se estabelece em (Geromel and Vi-tal, 2014), ocorre em poucas itera¸c˜oes, fazendo com que o esfor¸co computacional seja bastante re-duzido.
Na Figura 2 mostra-se a evolu¸c˜ao temporal da norma quadr´atica kz(t)k2
2, na qual a linha
cont´ı-nua (em vermelho) ´e o seu valor m´edio delimitado por duas trajet´orias com um desvio padr˜ao para mais e para menos. Essas trajet´orias foram obti-das por meio de 2.000 simula¸c˜oes temporais que permitem calcular o custo aproximado associado `a lei de controle amostrado proposta como sendo igual a 2.9275. Este valor, bem pr´oximo do custo ´otimo fornecido pelo nosso algoritmo (difere de uma quantidade menor que 1% do valor ´otimo), demonstra a qualidade dos resultados te´oricos ob-tidos.
Aplicou-se tamb´em as condi¸c˜oes de projeto de controle independente do modo. Neste caso, foi poss´ıvel obter factibilidade, para o mesmo sis-tema, considerando-se o per´ıodo de amostragem T = 250 ms. O algoritmo proposto fornece o ga-nho de realimenta¸c˜ao de estado
L=−0.1525 −1.8189
com o qual assegura-se o custo garantido Jgar =
8.8555 que ´e um limitante superior para o custo H2 associado ao sistema em malha fechada.
6 Conclus˜ao
Neste artigo propˆos-se a solu¸c˜ao de um problema de projeto de controle que n˜ao encontra similar na literatura. Trata-se da determina¸c˜ao de um con-trole amostrado via realimenta¸c˜ao de estado para um sistema linear a tempo cont´ınuo sujeito a sal-tos markovianos. A dificuldade em abordar essa classe de problemas reside no fato de que os modos da cadeia de Markov mudam no decorrer do tempo segundo um processo estoc´astico pr´oprio que n˜ao depende do per´ıodo de amostragem. Essa solu-¸c˜ao passa pela defini¸c˜ao de um MJLS h´ıbrido e pela determina¸c˜ao de uma lei de controle que mi-nimiza um ´ındice de desempenho similar `a norma H2. Isso ´e feito a partir do desenvolvimento de
um m´etodo iterativo que tem convergˆencia uni-forme assegurada. Um exemplo constitu´ıdo por dois modos ilustra os resultados te´oricos e coloca em clara evidˆencia a validade e a qualidade do algoritmo proposto. No futuro, deseja-se genera-lizar o mesmo procedimento para o tratamento de problemas definidos no contexto H∞.
Agradecimentos
Os autores agradecem ao “Conselho Nacional de Desenvolvimento Cient´ıfico e Tecnol´ogico - CNPq” e `a “Funda¸c˜ao de Amparo `A Pesquisa do Estado de S˜ao Paulo - FAPESP” por possibilitarem o de-senvolvimento deste projeto de pesquisa.
Referˆencias
Chen, C.-T. (1999). Linear System Theory and
Design, 3rd edn, Oxford University Press, New York, NY.
Chen, T. and Francis, B. A. (1995). Optimal Sampled-Data Control Systems, Springer-Verlag, London, UK.
Colaneri, P., Geromel, J. C. and Locatelli, A. (1997). Control Theory and Design: An RH2 / RH∞Viewpoint, Academic Press, London,
UK.
Costa, O. L. V., Fragoso, M. D. and Marques, R. P. (2005). Discrete-time Markov Jump
Li-near Systems, Probability and Its Applicati-ons, Springer-Verlag, London, UK.
Costa, O. L. V., Fragoso, M. D. and Todorov, M. G. (2013). Continuous-time Markov Jump
Linear Systems, Probability and Its Applica-tions, Springer-Verlag, Berlin, DE.
Franklin, G. F., Powell, J. D. and Workman, M. L. (1997). Digital Control of Dynamic Systems, 3rd edn, Prentice Hall, Englewood Cliffs, NJ. Geromel, J. C. and Vital, G. W. G. (2014). Opti-mal H2 state feedback sampled-data control
design for markov jump linear systems. (sub-mitted).
Gon¸calves, A. P. C., Fioravanti, A. R. and Geromel, J. C. (2010). Markov jump li-near systems and filtering through network transmitted measurements, Signal Processing 90(10): 2842 – 2850.
Hespanha, J. P., Naghshtabrizi, P. and Xu, Y. (2007). A survey of recent results in networ-ked control systems, Proc. of the IEEE —
Special Issue on Technology of Networked Control Systems 95(1): 138–162.
Hu, L.-S., Shi, P. and Frank, P. M. (2006). Robust sampled-data control for Markovian jump li-near systems, Automatica 42(11): 2025–2030. Mazo Jr., M., Anta, A. and Tabuada, P. (2009). On self–triggered control for linear systems: guarantees and complexity, 10th European
Control Conference.
Mazo Jr., M. and Tabuada, P. (2008). On event– triggered and self–triggered control over senso/actuator networks, Proc. of the 47th
IEEE Conf. on Dec. and Contr.pp. 435–440. Ragazzini, J. R. and Franklin, G. F. (1958).
Sampled-data Control Systems, McGraw-Hill Series in Control Systems Engineering, McGraw-Hill, New York, NY.
Souza, M., Deaecto, G. S., Geromel, J. C. and Daafouz, J. (2013). Self-triggered li-near quadratic networked control, Optimal
Control Applications and Methods . doi: 10.1002/oca.2085.
Souza, M., Vital, G. W. G. and Geromel, J. C. (2014). Optimal sampled-data state feedback control of linear systems, 19th IFAC World
Congress - IFAC 2014 . To appear.
Wang, F.-Y. and Liu, D. (2008). Networked Control Systems: Theory and Applications, Springer-Verlag, London, UK.