• Nenhum resultado encontrado

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

N/A
N/A
Protected

Academic year: 2021

Share "Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014"

Copied!
8
0
0

Texto

(1)

CONTROLE H2 AMOSTRADO DE SISTEMAS LINEARES COM SALTOS

MARKOVIANOS VIA REALIMENTA ¸C ˜AO DE ESTADO

Gabriela W. Gabriel∗ Matheus SouzaJos´e C. Geromel∗ ∗Faculdade de Engenharia El´etrica e de Computa¸cao (FEEC), UNICAMP

Campinas, SP, Brasil

Hamilton Institute, National University of Ireland Maynooth (NUIM) Maynooth, Co. Kildare, Irlanda

Email: gvital@dca.unicamp.br, souza@dsce.fee.unicamp.br, geromel@dsce.fee.unicamp.br

Abstract— This paper is entirely devoted to analyze the H2 optimal state-feedback sampled-data control design problem for Markov Jump Linear Systems. It is proposed to search for a solution to this problem by imbedding it in a more general class of dynamic systems that we call Hybrid Markov Jump Linear System (HMJLS). In this new and wide context, it is shown how to evaluate a sampled-data state feedback control that minimizes the H2norm of the closed-loop system from the solution of a specific two-point boundary value problem. This result is then adapted to provide optimal control conditions based on linear matrix inequalities (LMIs). The theory is illustrated by means of an academical example.

Keywords— Markov jump linear systems (MJLS), Hybrid systems, Sampled-data control.

Resumo— Este artigo ´e inteiramente dedicado `a an´alise do problema de controle ´otimo H2 amostrado via realimenta¸c˜ao de estado para sistemas lineares com saltos markovianos. A solu¸c˜ao desse problema ´e obtida quando ele ´e visto como membro de uma classe mais abrangente de sistemas dinˆamicos que denominamos Sistemas Lineares H´ıbridos com Saltos Markovianos (HMJLS). Nesse novo contexto, coloca-se em evidˆencia como calcular um controle amostrado via realimenta¸c˜ao de estado que minimiza a norma H2 do sistema em malha fechada a partir da solu¸c˜ao de um problema com duas condi¸c˜oes de contorno. Este resultado ´e ent˜ao adaptado para que seja expresso por meio de desigualdades matriciais lineares (LMIs). A teoria desenvolvida ´e ilustrada por meio de um exemplo num´erico.

Palavras-chave— Sistemas lineares markovianos (MJLS), Sistemas h´ıbridos, Controle de sistemas amostra-dos.

1 Introdu¸c˜ao

Sistemas de controle amostrados vˆem ganhando grande importˆancia no ˆambito de controle de sis-temas dinˆamicos. Esta estrutura ´e amplamente empregada em arquiteturas modernas de controle, como sistemas de controle digital (Chen and cis, 1995; Ragazzini and Franklin, 1958; Fran-klin et al., 1997) e sistemas de controle via rede (Hespanha et al., 2007; Wang and Liu, 2008). Es-pecificamente para o ´ultimo caso, ´e importante lembrar que as caracter´ısticas apresentadas pelo meio f´ısico em que os sinais s˜ao transmitidos po-dem provocar uma degrada¸c˜ao inaceit´avel de de-sempenho em malha fechada. Tais limita¸c˜oes en-volvem atrasos de transporte, perda de pacotes de dados transmitidos e limita¸c˜ao de largura de faixa. Neste artigo, as duas ´ultimas limita¸c˜oes s˜ao espe-cialmente abordadas.

O problema de controle com largura de faixa limitada pode ser resolvido com estrat´egias bem estabelecidas no contexto de controle amostrado; ver (Souza et al., 2013). Para o caso especial em que a taxa de amostragem ´e constante, os pro-blemas de estabiliza¸c˜ao e de controle ´otimo H2,

ambos via realimenta¸c˜ao de estado, s˜ao resolvidos em (Souza et al., 2013; Chen, 1999) com o uso de um sistema a tempo discreto equivalente ao ori-ginal, sem lan¸car m˜ao de qualquer tipo de aproxi-ma¸c˜ao. Estrat´egias mais gerais como acionamento

por evento e auto-acionamento podem ser aplica-das para considerar taxas de dados variantes no tempo (Mazo Jr. and Tabuada, 2008; Mazo Jr. et al., 2009; Souza et al., 2013). Sistemas lineares com saltos markovianos (MJLS) podem ser uti-lizados para modelar perdas de pacotes e falhas em atuadores; ver (Gon¸calves et al., 2010; Costa et al., 2013; Costa et al., 2005) para detalhes. De fato, a planta pode ser modelada como um MJLS a tempo cont´ınuo, em que um modo representa a opera¸c˜ao nominal e outro est´a associado `a perda de pacote ou falha em atuadores ou sensores.

Neste artigo, o principal prop´osito ´e proje-tar uma lei de controle amostrado via realimen-ta¸c˜ao de estado para sistemas lineares com sal-tos markovianos. Por conseguinte, visa abordar as duas limita¸c˜oes, detalhadas acima, e que est˜ao presentes em sistemas de controle em rede. Deve-se notar que a modelagem a tempo discreto do sistema em malha fechada n˜ao ´e capaz de incor-porar toda informa¸c˜ao dispon´ıvel entre os instan-tes de amostragem, uma vez que os estados do processo de Markov a tempo cont´ınuo mudam de forma totalmente independente destes instantes. Desta forma, os resultados cl´assicos de controle de MJLS a tempo discreto n˜ao podem ser efeti-vamente aplicados neste caso. A ausˆencia de um n´umero expressivo de contribui¸c˜oes para a reso-lu¸c˜ao deste problema pode ser assim justificada,

(2)

sendo (Hu et al., 2006) uma importante exce¸c˜ao. Neste artigo, apresenta-se uma nova formu-la¸c˜ao do problema de controle amostrado de sis-temas lineares com saltos markovianos utilizando uma abordagem de sistemas h´ıbridos – como em (Souza et al., 2014), em que ´e considerado o caso linear e invariante no tempo. A partir disso, torna-se poss´ıvel avaliar a sua estabilidade e calcular a sua norma H2sem que qualquer aproxima¸c˜ao seja

introduzida. Para esse fim, na Se¸c˜ao 2, o problema e sua reformula¸c˜ao em um sistema h´ıbrido equiva-lente s˜ao apresentados. Na Se¸c˜ao 3, o resultado te´orico b´asico, com o qual ser´a poss´ıvel avaliar a estabilidade do sistema h´ıbrido equivalente, ´e de-senvolvido. Este resultado tamb´em permite calcu-lar sua norma H2 do sistema de interesse atrav´es

da solu¸c˜ao de um problema com duas condi¸c˜oes de contorno. O problema de controle ´otimo H2´e

ent˜ao resolvido na Se¸c˜ao 4. Um exemplo num´erico ´e apresentado e discutido na Se¸c˜ao 5. A Se¸c˜ao 6 ´e dedicada `as conclus˜oes finais.

A nota¸c˜ao utilizada ´e padr˜ao. Para matrizes quadradas, denota-se a fun¸c˜ao tra¸co como tr(·). Para matrizes ou vetores reais, indica-se a trans-posta atrav´es de (′). Para matrizes sim´etricas,

denota-se cada um dos blocos sim´etricos como (•). Indica-se o conjunto dos n´umeros reais e o conjunto dos n´umeros naturais como R e N, res-pectivamente. Para qualquer matriz sim´etrica, indica-se que X ´e (semi)definida positiva atrav´es de X > 0 (X ≥ 0). Denota-se por E{·} o operador esperan¸ca matem´atica e por P(·) a probabilidade de (·). Indica-se o limite `a esquerda de ξ(t) para t→ tk com tk≥ 0, k ∈ N, atrav´es de ξ(t−

k). Uma

matriz quadrada ´e Hurwitz est´avel quando todos os seus autovalores estiverem situados na regi˜ao Re(s) < 0 e ´e Schur est´avel quando estiverem em |z| < 1.

2 Apresenta¸c˜ao do Problema Considera-se a classe de Sistemas Lineares com Saltos Markovianos (MJLS) e realiza¸c˜ao m´ınima no espa¸co de estados dada por

˙x(t) = Aθ(t)x(t) + Bθ(t)u(t) + Eθ(t)w(t) (1) z(t) = Cθ(t)x(t) + Dθ(t)u(t) (2) em que os vetores x ∈ Rn, u ∈ Rm, w ∈ Rr e z ∈

Rs s˜ao, respectivamente, o estado, a entrada de

controle, a entrada ex´ogena e a sa´ıda controlada. Define-se o conjunto K = {1, · · · , N } e a vari´avel θ(t) ∈ K, um parˆametro variante no tempo cuja evolu¸c˜ao ´e governada por um processo markoviano cont´ınuo com matriz de taxa de transi¸c˜ao {λij} = Λ ∈ RN ×N tal que

P(θ(t + h) = j|θ(t) = i) = δi−j+ λijh+ o(h) (3) onde δi−j indica a fun¸c˜ao delta de Kronecker, ou

seja, δi−j = 1 se i = j ∈ K e δi−j = 0, caso

contr´ario e limh→0+o(h)/h = 0. Os elementos da matriz Λ ∈ RN ×N s˜ao tais que λ

ij ≥ 0, ∀i 6= j e P

j∈Kλij = 0, ∀i ∈ K o que implica em λii ≤ 0, ∀i ∈ K. Assume-se que o sistema evolui a par-tir de uma condi¸c˜ao inicial x(0) = 0 e θ(0) = θ0

com P(θ0 = i) = πi0, ∀i ∈ K. Baseados na

de-fini¸c˜ao de norma H2, a entrada ex´ogena w(t) ´e

uma s´erie de impulsos (delta de Dirac), a ser de-finida posteriormente; ver (Colaneri et al., 1997) para maiores detalhes. Finalmente, introduz-se a classe de entrada controlada que ´e caracterizada por um controle linear amostrado por realimenta-¸c˜ao de estado da forma

u(t) = Lθ(t

k)x(tk), t ∈ [tk, tk+1) (4)

onde {tk}k∈N s˜ao instantes de amostragem

su-cessivos tais que t0 = 0, tk+1 > tk,∀k ∈ N e limk→∞tk = ∞. Neste artigo deseja-se fornecer condi¸c˜oes para garantir a estabilidade assint´otica e otimizar a norma H2 do sistema em malha

fe-chada em rela¸c˜ao `as matrizes de ganho Li, ∀i ∈ K.

Para esse fim, introduz-se uma apresenta¸c˜ao alternativa para a classe MJLS definida em (1)-(4), por´em totalmente equivalente

˙ ξ(t) =  Aθ(t) Bθ(t) 0 0  ξ(t) +  Eθ(t) 0  w(t) (5) z(t) = Cθ(t) Dθ(t)ξ(t) (6) ξ(tk) =  In 0 Lθ(t k) 0  ξ(t− k) (7)

sujeita `a condi¸c˜ao inicial ξ(0−) = ξ

0= 0, θ(0−) =

θ(0) = θ0 e v´alida para todo t ∈ [tk, tk+1), k ∈ N. Este ´e denominado Sistema Linear H´ıbrido com Saltos Markovianos cuja raz˜ao, por tr´as desta re-formula¸c˜ao, ´e simples. Definindo-se o estado au-mentado ξ(t) = [x(t)′ u(t)], a segunda

compo-nente da equa¸c˜ao diferencial em (5) fornece u(t) = u(tk) a qual em conjunto com (7) implica em u(t) = Lθ(t

k)x(tk). Al´em disso, substituindo-se

esta solu¸c˜ao na equa¸c˜ao (5) tem-se x(t) e z(t) v´ali-dos para todo t ∈ [tk, tk+1) que ´e exatamente o sis-tema em malha aberta (1)-(2) controlado pela lei de controle amostrado (4). Dessa forma, deseja-se determinar a solu¸c˜ao do seguinte problema de otimiza¸c˜ao inf L1,··· ,LN r X l=1 Z ∞ 0 E {z l(t)′zl(t)}dt (8) onde zl(t) ´e a sa´ıda associada `a entrada impulsiva

w(t) = elδ(t−), em que el∈ Rr´e a l-´esima coluna da matriz identidade. Trata-se de um problema de controle ´otimo H2 via realimenta¸c˜ao de estado

com controle amostrado caracterizado pela restri-¸c˜ao (4). Sob certas considera¸c˜oes iniciais envol-vendo a sua observabilidade, a caracter´ıstica finita da fun¸c˜ao objetivo descrita em (8) implica em sua estabilidade assint´otica.

(3)

3 Sistemas Lineares H´ıbridos com Saltos Markovianos

Nesta se¸c˜ao considera-se o seguinte HMJLS ˙ ξ(t) = Fθ(t)ξ(t) (9) z(t) = Gθ(t)ξ(t) (10) ξ(tk) = Hθ(t k)ξ(t − k) (11)

evoluindo a partir da condi¸c˜ao inicial arbitr´aria ξ(0−) = ξ0, θ(0−) = θ(0) = θ0. Verifica-se que este modelo cont´em, como caso particular, o descrito pelas equa¸c˜oes (5)-(7) com w(t) = 0. Para facilitar a apresenta¸c˜ao, denota-se ¯Fi= Fi+ (λii/2)I, ∀i ∈ K e considera-se amostragem uni-forme Tk = tk+1 − tk = T > 0, ∀k ∈ N. O

resultado mais importante desta se¸c˜ao ´e obtido introduzindo-se o vetor π(t) ∈ RN cujas

compo-nentes s˜ao πi(t) = P(θ(t) = i), i ∈ K, e que

sa-tisfazem ˙π(t) = Λ′π(t) (Costa et al., 2013),

evo-luindo a partir da condi¸c˜ao inicial π(0) = π0, onde

πi0 = P(θ0 = i), ∀i ∈ K. Obviamente π(t) ≥ 0 e P

i∈Kπi(t) = 1 para todo t ≥ 0. O pr´oximo

teo-rema ´e central para os desenvolvimentos apresen-tados a seguir.

Teorema 1 Considere T > 0 dado. Se existem

matrizes definidas positivas Si > 0, ∀i ∈ K que

satisfazem as equa¸c˜oes acopladas de Lyapunov

˙ Pi+ F′ iPi+ PiFi+ X j∈K λijPj = −G′ iGi (12) sujeitas `as condi¸c˜oes de contorno inicial Pi(0) <

Si e final Pi(T ) > H′

iSiHi para todo i ∈ K ent˜ao

o HMJLS (9)-(11) ´e est´avel em m´edia quadr´atica e satisfaz J = Z ∞ 0 E {z(t) ′z(t)}dt < X i∈K πi0ξ0′Hi′SiHiξ0 (13) Prova: Define-se a vari´avel ν(t) = (ξ(t), θ(t)) e a

fun¸c˜ao quadr´atica

V(ν(t)) = ξ(t)′Pθ(t)(t)ξ(t) (14) v´alida para todo t ∈ [tk, tk+1), ∀k ∈ N. Devi-do a sua natureza invariante no tempo, a solu-¸c˜ao do problema com duas condi¸c˜oes de contorno no primeiro intervalo [0, T ) permanece a mesma nos intervalos seguintes [kT, (k + 1)T ), ∀k ∈ N, desde que as condi¸c˜oes Pi(tk) = Pi(0) e Pi(t−k+1) =

Pi(T ) para todo i ∈ K sejam impostas.

Para todo intervalo de tempo t ∈ [tk, tk+1), k ∈ N, levando-se em conta (12) a f´ormula de Dynkin, veja (Costa et al., 2013), tem-se

V(ν(tk)) − EV(ν(t− k+1))|ν(tk) = = E Z tk+1 tk z(t)′z(t)dt|ν(tk)  (15)

Por outro lado, utilizando-se as condi¸c˜oes de con-torno do problema, verifica-se que V (ν(tk)) <

ξ(tk)′Sθ(t

k)ξ(tk)) e, em decorrˆencia da

desconti-nuidade da vari´avel de estado ξ(t) entre os ins-tantes de tempo t−k+1 e tk+1, tem-se

EV(ν(t− k+1))|ν(tk) = = Enξ(t− k+1)′Pθ(t− k+1)(t − k+1)ξ(t−k+1)|ν(tk) o >Eξ(tk+1)′Sθ(t k+1)ξ(tk+1)|ν(tk) (16) uma vez que a continuidade do processo estoc´ as-tico (3) imp˜oe θ(t− k+1) = θ(tk+1) e a condi¸c˜ao de contorno implica em P θ(t− k+1)(t − k+1) = Pθ(tk+1)(t − k+1) > H′ θ(tk+1) Sθ(t k+1)Hθ(tk+1)(17)

Dessa forma, definindo-se a fun¸c˜ao quadr´atica v(ν(tk))=ξ(tk)′Sθ(t k)ξ(tk) em conjunto com (15) e (16), tem-se E {v(ν(tk+1))|ν(tk)} − v(ν(tk)) < <−E Z tk+1 tk z(t)′z(t)dt|ν(tk)  (18) e como Si > 0, ∀i ∈ K ent˜ao v(ν(tk)) ´e po-sitiva definida e E{v(ν(tk))} pode ser

conside-rada uma fun¸c˜ao de Lyapunov associada ao pro-cesso a tempo discreto ξ(tk) → ξ(tk+1) para todo

k∈ N. Nota-se duas consequˆencias imediatas. A primeira, devido a desigualdade estrita em (18), existe ε > 0 suficientemente pequeno tal que E {v(ν(tk+1))|ν(tk)} ≤ (1 − ε)v(ν(tk)) o que

im-plica em E{v(ν(tk+1))} → 0 quando k ∈ N tende

a infinito e consequentemente E{kξ(t)k2

} → 0 quando t → ∞ o que assegura a estabilidade assin-t´otica em m´edia quadr´atica. Ademais, obt´em-se (13) a partir da desigualdade J = E ( X k∈N E Z tk+1 tk z(t)′z(t)dt|ν(tk) ) <E ( X k∈N v(ν(tk)) − E{v(ν(tk+1))|ν(tk)} ) <E {v(ν(0))} (19)

tendo em vista que ξ(0) = Hθ0ξ0 e πi0 = P(θ0=

i), i ∈ K, completando a prova do teorema

pro-posto. ✷

Nota-se que o limitante superior proposto do custo total ´e calculado pela soma das contribui¸c˜oes que ocorrem entre dois instantes de amostragem sucessivos. Para que isso ocorra, uma solu¸c˜ao do problema com dois valores de contorno deve ser determinada.

Nota-se tamb´em atrav´es da prova do Teorema 1 que a quantidade expressa no lado direto de (13) n˜ao ´e apenas um limitante superior para o custo tendo em vista que J → P

i∈Kπi0ξ′

(4)

sempre que Pi(0) → Si > 0 e Pi(T ) → H′

iSiHi para todo i ∈ K o que reproduz o custo ´otimo. Segundo o conhecimento dos autores, n˜ao existe resultado similar na literatura. Esta condi¸c˜ao de-pende fortemente da descontinuidade imposta em (11), pois o problema com duas condi¸c˜oes de con-torno deve admitir uma solu¸c˜ao mesmo que (9) n˜ao seja estocasticamente est´avel. Em outras pa-lavras, a realimenta¸c˜ao se d´a atrav´es das matrizes Hi,∀i ∈ K fazendo com que o efeito de fecharmos a malha atrav´es do controle amostrado (4) seja a descontinuidade (11) produzida nos instantes de amostragem.

Apresenta-se o segundo coment´ario na forma de um corol´ario ao Teorema 1, o qual se refere `a generaliza¸c˜ao para se obter a norma H2 de um

HMJLS da forma ˙ ξ(t) = Fθ(t)ξ(t) + Jθ(t)w(t) (20) z(t) = Gθ(t)ξ(t) (21) ξ(tk) = Hθ(t k)ξ(t − k) (22)

que evolui, no tempo, a partir da condi¸c˜ao inicial ξ(0−) = 0, θ(0−) = θ(0) = θ0.

Corol´ario 1 Considere T >0 dado. Se existem

matrizes definidas positivas Si >0, ∀i ∈ K

satis-fazendo o problema com duas condi¸c˜oes de con-torno apresentado no Teorema 1 ent˜ao o HMJLS (20)-(22) ´e est´avel em m´edia quadr´atica e satisfaz

J = r X l=1 Z ∞ 0 E {z l(t)′zl(t)}dt < X i∈K πi0tr(Ji′Hi′SiHiJi) (23) Prova: A prova decorre do resultado to Teorema 1 considerando, sucessivamente, o conjunto de en-tradas impulsivas w(t) = elδ(t−), onde el ∈ Rr ´e a l-´esima coluna da matriz identidade, e as sa´ıdas correspondentes zl(t) para l = 1, · · · , r.

Completa-se a prova como decorrˆencia do sistema original possuir condi¸c˜ao inicial ξ(0−) = 0, a qual,

devido a cada impulso, se altera instantaneamente para ξ(0−) = J

θ(0−)el para todo l = 1, · · · , r. Em seguida, invocando-se a continuidade da cadeia de Markov que imp˜oe θ(0) = θ(0−), a desigualdade

(13) fornece (23) e a prova est´a completa. ✷ Com este resultado, discute-se como resolver o problema com duas condi¸c˜oes de contorno do Teorema 1. Com algumas manipula¸c˜oes alg´ebricas simples mostra-se que as fun¸c˜oes matriciais

Pi(t) = e− ¯F ′ it(Pi(0) − Ri(P, t))) e− ¯Fit (24) em que Ri(P, t) = Z t 0 eF¯ ′ iτ  G′iGi+ X j6=i∈K λijPj(τ )   e ¯ Fiτ (25)

definidas para todo t ∈ [0, T ) e i ∈ K resolvem (implicitamente) a equa¸c˜ao diferencial linear (12). De fato, fixadas as condi¸c˜oes iniciais Pi(0) ou

fi-nais Pi(T ) para todo i ∈ K, elas podem ser

resol-vidas sem grandes dificuldades. Por outro lado, o problema com duas condi¸c˜oes de contorno ´e resolvido impondo-se as restri¸c˜oes Pi(0) < Si e

Pi(T ) > Hi′SiHi, as quais podem ser reescritas na forma conjunta

eF¯

′ iTH′

iSiHieF¯iT < Si− Ri(P, T ) (26) para todo i ∈ K. O procedimento iterativo para resolver o problema com duas condi¸c˜oes de con-torno, para T > 0 dado, ´e sumarizado nos seguin-tes passos:

1. Inicializa-se o contador de itera¸c˜oes ℓ = 0. Define-se Sℓ

i = 0, para todo i ∈ K e Jℓ= 0.

2. Determina-se a solu¸c˜ao Pℓ

i(t) das equa¸c˜oes

di-ferenciais acopladas ˙ Pi+ Fi′Pi+ PiFi+ X j∈K λijPj = −G′iGi

sob as condi¸c˜oes finais Pi(T ) = Hi′SiℓHi, para

todo i ∈ K e todo t ∈ [0, T ).

3. Determina-se Siℓ+1>0 solu¸c˜ao do problema

inf Si>0 {tr(Ji′Hi′SiHiJi) : eF¯ ′ iTHi′SiHieF¯iT < Si− Ri(Pℓ, T) o para cada i ∈ K, bem como o valor ´otimo do crit´erio Jℓ+1=Pi∈Kπi0tr(Ji′Hi′Siℓ+1HiJi). 4. Faz-se ℓ + 1 → ℓ at´e que Jℓ+1− Jℓ seja

sufi-cientemente pequeno.

Este procedimento iterativo ´e similar aos ado-tados na resolu¸c˜ao de problemas com duas condi-¸c˜oes de contorno, bastante frequentes em controle ´otimo. Em (Geromel and Vital, 2014) encontra-se a prova formal de sua convergˆencia. Conforme apresentado a seguir, adapta-se este procedimento para resolver o problema indicado em (8) que ´e o principal objetivo deste trabalho.

4 Projeto de Controle Amostrado Nesta se¸c˜ao aborda-se o problem (8) a partir do re-sultado do Teorema 1 e, por conseguinte, no passo 2 do algoritmo deve-se resolver

inf Li,Si>0 ( X i∈K πi0tr(Ji′Hi′SiHiJi) : eF¯ ′ iTHi′SiHieF¯iT < Si− Ri(Pℓ, T) o (27) e observa-se que para Ri(Pℓ, T), ∀i ∈ K fixo este problema ´e reescrito como N subproblemas desa-coplados. Antes de prosseguir, ´e necess´ario definir

(5)

as seguintes estruturas de blocos matriciais parti-cionados de acordo com as dimens˜oes da vari´avel de estado e da vari´avel de controle

S−1 i =  Xi Yi • Zi  (28) Ri(Pℓ, T) =  Cdi′ Ddi′   Cdi Ddi (29) para todo i ∈ K. Nota-se que a fatora¸c˜ao (29) pode ser realizada pois Ri(Pℓ, T) ≥ 0, ∀i ∈ K. Al´em disso, considerando-se as equa¸c˜oes (5)-(7), manipula¸c˜oes alg´ebricas simples evidenciam que

HieF¯iT =  In 0 Li 0  eAiT RT 0 e Aiτdτ Bi 0 Im  e( λii 2 )T =  In Li  h eAiT RT 0 e Aiτdτ Bi i e( λii 2 )T =  In Li   Adi Bdi (30)

onde pode-se identificar Adi = e(λii/2)TeAiT e

Bdi = e(λii/2)TRT 0 e

Aiτdτ Bi para todo i ∈ K. O pr´oximo teorema mostra que o problema de otimi-za¸c˜ao convexa (27) pode ser expresso atrav´es de LMIs de tal forma que a sua solu¸c˜ao ´otima glo-bal ´e determinada sem maiores dificuldades com o uso de rotinas num´ericas dispon´ıveis na literatura atual.

Teorema 2 O problema (27) ´e fact´ıvel se e so-mente se existem matrizes sim´etricas Xi, Zi, Wi e

matrizes Yi, Mi de dimens˜oes compat´ıveis tais que   Wi Wi M′ i • Xi Yi • • Zi   >0 (31)  Wi 0 0 I  >  Adi Bdi Cdi Ddi  Xi Yi • Zi  Adi Bdi Cdi Ddi ′ (32) para todo i ∈ K.

Prova: Primeiramente, prova-se a suficiˆencia assumindo-se que as desigualdades (31)-(32) se verificam. Fazendo Li = MiWi−1, considerando (28), multiplicando os dois lados de (31) por diag(Wi−1, In, Im) e calculando o complemento de Schur em rela¸c˜ao `as duas ´ultimas linhas e colunas, tem-se que W−1 i >  In L′iSi  In Li  , i∈ K (33) Por outro lado, (32) ´e equivalente a

Si>  Adi Bdi Cdi Ddi ′ Wi−1 0 0 I  Adi Bdi Cdi Ddi  (34)

a qual, em conjunto com (30) e (33), resulta em Si− Ri(Pℓ, T) = = Si−  C′ di D′ di   Cdi Ddi >  A′ di B′di  W−1 i  Adi Bdi >  A′di B′ di   In L′ i  Si  In Li   Adi Bdi > eF¯ ′ iTHi′SiHieF¯iT, i∈ K (35) que ´e exatamente a restri¸c˜ao do problema (27) completando esta parte da prova. Para a necessi-dade, assume-se que o problema (27) seja fact´ıvel para algum par de matrizes (Li, Si >0), i ∈ K. Posto isso, as restri¸c˜oes do problema (27) podem ser escritas como

Si >  A′ di B′ di  Φi  Adi Bdi + +  Cdi′ Ddi′   Cdi Ddi, i∈ K (36) onde Φi = [In L′i]Si[In L′i]′ >0. Atrav´es de ma-nipula¸c˜oes alg´ebricas simples, (36) ´e reescrita na forma equivalente  Φ−1 0 0 I  > >  Adi Bdi Cdi Ddi  Xi Yi • Zi  Adi Bdi Cdi Ddi ′ (37) e conclui-se que esta desigualdade continua v´alida substituindo Φ−1i por Wi = Φ−1i − ǫI > 0 com

ǫ >0 suficientemente pequeno o que fornece (32). No entanto, isso implica em Wi−1 > Φi e

conse-quentemente Wi > WiΦiWi >Wi Mi′Si  Wi Mi  , i∈ K (38) reproduz a desigualdade matricial linear (31) e a

prova est´a conclu´ıda. ✷

O resultado acima mostra que o problema (27) ´e convexo e pode ser expresso por LMIs. Al´em disso, aplicando o Corol´ario 1, a fun¸c˜ao objetivo que define um limitante superior para o ´ındice de desempenho H2do sistema em considera¸c˜ao pode

ser escrita como uma fun¸c˜ao do novo conjunto de vari´aveis matriciais introduzidas no Teorema 2. De fato, com (23) e (33) obt´em-se

J <X i∈K πi0tr(Ji′Hi′SiHiJi) < X i∈K πi0tr  E′iIn L′iSi  In Li  Ei  < X i∈K πi0tr Ei′W−1 i Ei  (39)

(6)

o que significa que o problema (27) reduz-se a N problemas de programa¸c˜ao convexa desacoplados

min Xi,Yi,Zi,Wi,Mi tr(E′ iW −1 i Ei) : (31) − (32) (40) cada um deles associado a um modo espec´ıfico da cadeia de Markov que fornece uma matriz de ga-nho ´otima para a realimenta¸c˜ao de estados (4) da forma Li = MiW−1

i , i ∈ K. Mantendo-se esta

propriedade em mente vˆe-se que o problema com duas condi¸c˜oes de contorno definido no Teorema 1 e acrescido da determina¸c˜ao dos ganhos ´otimos de realimenta¸c˜ao de estado ´e simples de ser resolvido numericamente atrav´es do procedimento iterativo proposto.

Neste ponto, deve-se colocar em evidˆencia al-guns aspectos relacionados `a solu¸c˜ao do problema de s´ıntese de controle amostrado para sistemas li-neares com saltos markovianos.

4.1 Independˆencia do modo

Para que o controle amostrado (4) possa ser im-plementado ´e necess´ario medir o estado da ca-deia de Markov θ(t) nos instantes de amostragem tk,∀k ∈ N. Para eliminar essa necessidade, ´e pre-ciso fazer com que os ganhos de realimenta¸c˜ao de estado n˜ao dependam do estado da cadeia, o que ´e conseguido impondo-se Li = L, ∀i ∈ K. Em

rela¸c˜ao `as vari´aveis do Teorema 2 isto ´e for¸cado atrav´es de

(Wi, Mi) = (W, M ) i ∈ K (41) o que faz com que o problema (27) deixe de ser desacoplado e assuma a forma

min Xi,Yi,Zi,W,M ( X i∈K πi0tr Ei′W−1Ei ) (42)

sujeito `as LMIs que s˜ao obtidas substituindo-se as vari´aveis matriciais (Wi, Mi) para todo i ∈ K por (W, M ) nas desigualdades (31) e (32). ´E evidente que o esfor¸co computacional envolvido na resolu-¸c˜ao de (42) ´e maior que o necess´ario para resolver os N problemas desacoplados (40). A diferen¸ca torna-se cada vez mais acentuada conforme o n´ u-mero de estados N da cadeia de Markov aumenta.

4.2 O caso limite T → 0

Observa-se a relevˆancia de se estudar o que ocorre quando o per´ıodo de amostragem ´e arbitraria-mente pequeno. O prop´osito ´e determinar o pro-blema limite de (40) considerando T > 0 arbi-trariamente pequeno. O Complemento de Schur relativo `a segunda linha e coluna de (31) fornece

 Wi− WiX−1 i Wi M′ i− WiX−1 i Yi • Zi− Yi′Xi−1Yi  >0 (43)

e nota-se que o primeiro elemento da diagonal principal imp˜oe Wi−1> X

−1

i >0, o qual tendo em

vista o crit´erio a ser minimizado, requer Wi→ Xi.

Isso pode ser feito desde que M′

i → Yi. Nesse caso,

tem-se Li = MiW−1

i = Yi′X −1

i e a factibilidade

de (43) ´e assegurada pela escolha de Zi tal que

Zi> LiXiL′

ipara todo i ∈ K.

Por outro lado, a desigualdade (32) pode ser reescrita na forma equivalente1

Si− Ri>  A′di B′di  W−1 i  Adi Bdi  (44) ou ainda, ap´os a aplica¸c˜ao do Complemento de Schur, como Wi> Adi Bdi  (Si− Ri)−1  A′ di B′ di  (45) Considerando T → 0+ em (25), determina-se a aproxima¸c˜ao Ri= T Qi em que Qi=  Ci′ D′i   Ci′ D′i ′ + X j6=i∈K λijSj (46)

onde utiliza-se a condi¸c˜ao inicial Pj(0) = Sj para

todo j ∈ K. Em seguida, o desenvolvimento em primeira ordem leva a (Si− Ri)−1 = Si−1+

S−1

i RiS −1

i . Da mesma forma, obt´em-se as

aproxi-ma¸c˜oes Adi= I + ¯AiT em que ¯Ai= Ai+ (λii/2)I e Bdi = BiT. Substituindo-se estas rela¸c˜oes em (45), os termos de ordem zero que aparecem em cada lado se cancelam pois Xi = [I 0]Si−1[I 0]′ e

o termo de primeira ordem imp˜oe XiA¯′i+ YiB′i + ¯AiXi+ BiYi′+ + Xi YiQi  Xi Y′ i  <0 (47) Denotando-se Vi = Xi−1 > 0, multiplicando-se

esta desigualdade ambos os lados por Xi−1, ap´os

algumas manipula¸c˜oes alg´ebricas, obt´em-se (Ai + BiLi)′Vi+ Vi(Ai+ BiLi) + X j∈K λijVj+ + (Ci+ DiLi)′(Ci+ DiLi) + Γi<0 (48) em que Γi= X j6=i∈K λij  I Li ′ Sj  X−1 j 0 0 0   I Li  (49) Finalmente, utilizando-se a igualdade (28), o c´ al-culo de Si atrav´es da invers˜ao por blocos leva a

Sj =  I 0  X−1 j  I 0 + +  −L′j I  Zj− LjXjL′j−1−Lj I(50) 1

(7)

e consequentemente Γi= X j6=i∈K λij(Li− Lj)′ Zj− LjXjL′j−1(Li− Lj) (51) da qual se nota que Γi≥ 0 e que a escolha da va-ri´avel independente Zj → ∞, ∀j ∈ K faz com que Γi→ 0 para todo i ∈ K. Com isto recupera-se de (48) as desigualdades menos restritivas poss´ıveis que constituem as restri¸c˜oes de

min Li,Vi>0 ( X i∈K πi0tr(E′ iViEi) ) (52)

que corresponde ao problema de controle ´otimo em norma H2 via realimenta¸c˜ao de estado para

MJLS a tempo cont´ınuo, (Costa et al., 2013). Este resultado coloca em evidˆencia a impor-tˆancia do problema (8) proposto inicialmente pois a sua solu¸c˜ao generaliza os resultados existentes na literatura para o controle via realimenta¸c˜ao de estado de MJLS em tempo cont´ınuo. Trata-se de uma lei de controle linear amostrado que ´e v´alida para todo T > 0 e, como deveria ser, tende para a lei de controle ´otimo em norma H2 quando o

per´ıodo de amostragem torna-se arbitrariamente pequeno.

5 Exemplo

Nesta se¸c˜ao, apresentam-se algumas simula¸c˜oes num´ericas que colocam em evidˆencia os resulta-dos te´oricos obtiresulta-dos anteriormente. Neste sen-tido, considera-se um sistema linear sujeito a sal-tos Markovianos com dois N = 2 modos e com realiza¸c˜ao dada por (1)-(2), em que

A1=  0 1 −4 0  , A2=  0 1 −1 0  , B1= B2=0 1  , E1= E2=1 1  , C1= C2=1 0 0 0  , D1= D2=0 1  . A matriz taxa de transi¸c˜ao Λ ∈ R2×2 que

deter-mina as caracter´ısticas estoc´asticas do sistema, ´e dada por Λ =  −0.5 0.5 0.2 −0.2 

com o vetor de probabilidades inicial π0 = [1 0]′.

Em um primeiro ensaio, deseja-se projetar o con-trole amostrado via realimenta¸c˜ao de estado, de-finido em (4), em que o per´ıodo de amostragem ´e dado por tk+1− tk = T = 250 ms. Aplicando-se

as condi¸c˜oes do Corol´ario 1 em conjunto com o algoritmo proposto, obt´em-se os ganhos de reali-menta¸c˜ao de estado L1 =0.1791 −0.5561 L2 =−0.2972 −0.8691 0 1 2 3 4 5 6 7 0 1 2 3 ℓ

Figura 1: Evolu¸c˜ao do algoritmo

0 2 4 6 8 10 −0.5 0 0.5 1 1.5 2 t(s) k z ( t) k 2 2

Figura 2: Simula¸c˜ao temporal

que asseguram o custo H2 ´otimo dado por

Jopt=

Z ∞

0 E {z(t)

z(t)}dt = 2.9524.

A evolu¸c˜ao, em cada itera¸c˜ao, do algoritmo para obten¸c˜ao desta solu¸c˜ao ´e mostrada na Figura 1. Naquela figura, para cada itera¸c˜ao ℓ ∈ N, a curva cont´ınua (em azul) representa evolu¸c˜ao do custo ´otimo obtido resolvendo-se o problema de otimi-za¸c˜ao (27) no passo 3 do algoritmo.

Essa figura tamb´em coloca em evidˆencia que o algoritmo proposto ´e bastante adequado para a solu¸c˜ao do problema aqui formulado. Sua conver-gˆencia uniforme, que ´e teoricamente assegurada segundo o que se estabelece em (Geromel and Vi-tal, 2014), ocorre em poucas itera¸c˜oes, fazendo com que o esfor¸co computacional seja bastante re-duzido.

Na Figura 2 mostra-se a evolu¸c˜ao temporal da norma quadr´atica kz(t)k2

2, na qual a linha

cont´ı-nua (em vermelho) ´e o seu valor m´edio delimitado por duas trajet´orias com um desvio padr˜ao para mais e para menos. Essas trajet´orias foram obti-das por meio de 2.000 simula¸c˜oes temporais que permitem calcular o custo aproximado associado `a lei de controle amostrado proposta como sendo igual a 2.9275. Este valor, bem pr´oximo do custo ´otimo fornecido pelo nosso algoritmo (difere de uma quantidade menor que 1% do valor ´otimo), demonstra a qualidade dos resultados te´oricos ob-tidos.

(8)

Aplicou-se tamb´em as condi¸c˜oes de projeto de controle independente do modo. Neste caso, foi poss´ıvel obter factibilidade, para o mesmo sis-tema, considerando-se o per´ıodo de amostragem T = 250 ms. O algoritmo proposto fornece o ga-nho de realimenta¸c˜ao de estado

L=−0.1525 −1.8189

com o qual assegura-se o custo garantido Jgar =

8.8555 que ´e um limitante superior para o custo H2 associado ao sistema em malha fechada.

6 Conclus˜ao

Neste artigo propˆos-se a solu¸c˜ao de um problema de projeto de controle que n˜ao encontra similar na literatura. Trata-se da determina¸c˜ao de um con-trole amostrado via realimenta¸c˜ao de estado para um sistema linear a tempo cont´ınuo sujeito a sal-tos markovianos. A dificuldade em abordar essa classe de problemas reside no fato de que os modos da cadeia de Markov mudam no decorrer do tempo segundo um processo estoc´astico pr´oprio que n˜ao depende do per´ıodo de amostragem. Essa solu-¸c˜ao passa pela defini¸c˜ao de um MJLS h´ıbrido e pela determina¸c˜ao de uma lei de controle que mi-nimiza um ´ındice de desempenho similar `a norma H2. Isso ´e feito a partir do desenvolvimento de

um m´etodo iterativo que tem convergˆencia uni-forme assegurada. Um exemplo constitu´ıdo por dois modos ilustra os resultados te´oricos e coloca em clara evidˆencia a validade e a qualidade do algoritmo proposto. No futuro, deseja-se genera-lizar o mesmo procedimento para o tratamento de problemas definidos no contexto H∞.

Agradecimentos

Os autores agradecem ao “Conselho Nacional de Desenvolvimento Cient´ıfico e Tecnol´ogico - CNPq” e `a “Funda¸c˜ao de Amparo `A Pesquisa do Estado de S˜ao Paulo - FAPESP” por possibilitarem o de-senvolvimento deste projeto de pesquisa.

Referˆencias

Chen, C.-T. (1999). Linear System Theory and

Design, 3rd edn, Oxford University Press, New York, NY.

Chen, T. and Francis, B. A. (1995). Optimal Sampled-Data Control Systems, Springer-Verlag, London, UK.

Colaneri, P., Geromel, J. C. and Locatelli, A. (1997). Control Theory and Design: An RH2 / RHViewpoint, Academic Press, London,

UK.

Costa, O. L. V., Fragoso, M. D. and Marques, R. P. (2005). Discrete-time Markov Jump

Li-near Systems, Probability and Its Applicati-ons, Springer-Verlag, London, UK.

Costa, O. L. V., Fragoso, M. D. and Todorov, M. G. (2013). Continuous-time Markov Jump

Linear Systems, Probability and Its Applica-tions, Springer-Verlag, Berlin, DE.

Franklin, G. F., Powell, J. D. and Workman, M. L. (1997). Digital Control of Dynamic Systems, 3rd edn, Prentice Hall, Englewood Cliffs, NJ. Geromel, J. C. and Vital, G. W. G. (2014). Opti-mal H2 state feedback sampled-data control

design for markov jump linear systems. (sub-mitted).

Gon¸calves, A. P. C., Fioravanti, A. R. and Geromel, J. C. (2010). Markov jump li-near systems and filtering through network transmitted measurements, Signal Processing 90(10): 2842 – 2850.

Hespanha, J. P., Naghshtabrizi, P. and Xu, Y. (2007). A survey of recent results in networ-ked control systems, Proc. of the IEEE —

Special Issue on Technology of Networked Control Systems 95(1): 138–162.

Hu, L.-S., Shi, P. and Frank, P. M. (2006). Robust sampled-data control for Markovian jump li-near systems, Automatica 42(11): 2025–2030. Mazo Jr., M., Anta, A. and Tabuada, P. (2009). On self–triggered control for linear systems: guarantees and complexity, 10th European

Control Conference.

Mazo Jr., M. and Tabuada, P. (2008). On event– triggered and self–triggered control over senso/actuator networks, Proc. of the 47th

IEEE Conf. on Dec. and Contr.pp. 435–440. Ragazzini, J. R. and Franklin, G. F. (1958).

Sampled-data Control Systems, McGraw-Hill Series in Control Systems Engineering, McGraw-Hill, New York, NY.

Souza, M., Deaecto, G. S., Geromel, J. C. and Daafouz, J. (2013). Self-triggered li-near quadratic networked control, Optimal

Control Applications and Methods . doi: 10.1002/oca.2085.

Souza, M., Vital, G. W. G. and Geromel, J. C. (2014). Optimal sampled-data state feedback control of linear systems, 19th IFAC World

Congress - IFAC 2014 . To appear.

Wang, F.-Y. and Liu, D. (2008). Networked Control Systems: Theory and Applications, Springer-Verlag, London, UK.

Referências

Documentos relacionados

Com relação ao fluxo de umidade, observou-se de modo geral, que o fluxo médio da AMZ e NEB fornece maior parte de vapor d’água na borda leste, sugerindo que

• Scollegare sempre la presa di alimentazione prima di installare, tagliare o modificare le componenti • Srotolare perfettamente la striscia luminosa prima di collegare ad una

AVALIAÇÃO EM MÉDIO PRAZO DA PRESSÃO INTRA-SACO APÓS CORREÇÃO ENDOVASCULAR DE ANEURISMA DE AORTA ABDOMINAL COM O USO DE SENSOR SEM FIO MEDIUM-TERM EVALUATION OF INTRA-SAC

A razão pela qual existem dois sinais de controle de feedback idênticas é que a ação de controle é dividida entre dois atuadores e, devido à simetria, os mesmos ganhos

TABELA 4 – Atividades acompanhadas e/ou desenvolvidas em Clínica Reprodutiva durante o Estágio Curricular Supervisionado em Medicina Veterinária na Empresa LAB

BUENOS AIRES – Cerimônia de Boas-vindas e Sessão de Abertura do Presidente PT interessadas para ajudar a moldar a internet do futuro, continuar esse trabalho tão importante

Nossos resultados encontraram valores mais altos em todas as faixas de classificação de capacidade funcional quando comparados aos de Cooper e do FRIEND.. Esses valores

Em 2010, a Companhia fortaleceu sua posição de liderança no mercado doméstico através da r, também apoiada (i) na manutenção de sua estratégia comercial; (ii) no