1.2 Exemplos
1.2.8 Um Problema de Controle ´ Otimo
Seja Ω⊂ Rn compacto e f : Rn× Ω → Rn uma aplica¸c˜ao cont´ınua, Lipschitz na primeira vari´avel (veja Defini¸c˜ao 259) e uniformemente na segunda. Seja7
Uad := {u : [t0, t1]→ Rm; u(t)∈ Ω q.s. em [t0, t1]}
o conjunto dos controles vi´aveis. Considere agora a equa¸c˜ao de evolu¸c˜ao das vari´aveis de estado
½
z0(t) = f (z(t), u(t)), q.s. em [t0, t1] z(t0) = z0
A teoria de equa¸c˜oes diferenciais ordin´arias garante que, para cada u∈ Uad, o problema acima possui uma ´unica solu¸c˜ao absolutamente cont´ınua em [t0, t1]. Nosso objetivo ´e encontrar um controle ¯u que minimize o funcional objetivo
J(t, z; u) := L1(z(t)) + Z t1
t0
L(z(t), u(t)) dt,
onde as fun¸c˜oes L e L1 definem respectivamente os custos operacional e final do modelo. Suponha L∈ C1(Rn× Ω) e L
1 ∈ C1(Rn).
Tal problema de controle ´otimo ´e denominado problema com hori- zonte finito8. Fazemos aqui uma abordagem baseada no m´etodo dos
7Nota¸c˜ao: q.s. ´e abrevia¸c˜ao de ’quase sempre’ e se refere `a medida de Lebesgue
no intervalo em quest˜ao.
8Note que o tempo final t
22 [CAP. 1: INTRODUC¸ ˜AO multiplicadores de Lagrange (veja Exemplo 1.2.2) que nos permite en- contrar algumas condi¸c˜oes necess´arias para otimalidade de uma solu¸c˜ao (compare com os resultados do Apˆendice B).
Definimos inicialmente a vari´avel adjunta (ou co-estado) λ = λ(t) e o funcional estendido
I(z, u, λ) := Z t1
t0
[L(z, u)− λ (z0− f(z, u))] ds + L1(z(t1)). Suponha que as fun¸c˜oes envolvidas na defini¸c˜ao de I s˜ao suficientemente regulares e que (¯z, ¯u, ¯λ) ´e um m´ınimo (local) de I. Sejam ainda φi(t), i = 1, 2, 3 fun¸c˜oes regulares com φ1(t0) = 0. Definimos ent˜ao
zε := ¯z + εφ1, uε := ¯u + εφ2, λε := ¯λ + εφ3
e I(ε) := I(zε, uε, λε) ∈ R, para |ε| ’pequeno’. Logo I(ε) possui um m´ınimo local em ε = 0. Note que
(1.42) ∂I dε(ε) = Z t1 t0 · ∂h ∂zφ1+ ∂h ∂uφ2− ( ˙z ε− f)φ 3− λε( ˙φ1−∂f ∂zφ1− ∂f ∂uφ2) ¸ dt + ∂g ∂z(z ε(t 1)) φ1(t1). Integramos por partes o termo λεφ˙1 Z t1 t0 λεφ˙1dt = [λεφ1]tt10 − Z t1 t0 ˙λεφ 1dt = λε(t1) φ1(t1)− Z t1 t0 ˙λεφ 1dt e substituimos em (1.42), obtendo 0 = ∂I dε ¯ ¯ ¯ ¯ ε=0 = Z t1 t0 · φ1 µ ∂L ∂z(¯z, ¯u) + ¯λ ∂f ∂z(¯z, ¯u) + ˙¯λ ¶ + φ2 µ ∂L ∂u(¯z, ¯u) + ¯λ ∂f ∂u(¯z, ¯u) ¶ + φ3(− ˙¯z + f(¯z, ¯u)) ¸ dt + φ1(t1) ·∂L 1 ∂z (¯z(t1))− ¯λ(t1) ¸ .
Tomando φ1= φ2 = 0 e φ3 arbitr´ario, obtemos a equa¸c˜ao de estado ˙¯z = f(¯z, ¯u).
[SEC. 1.2: EXEMPLOS 23 Tomando φ1 = 0 e φ2 qualquer, obtemos a condi¸c˜ao de otimalidade
∂L
∂u(¯z, ¯u) + ¯λ ∂f
∂u(¯z, ¯u) = 0.
Tomando agora φ1 qualquer com φ1(t1) = 0, obtemos a equa¸c˜ao adjunta (ou de co-estado)
˙¯λ = −∂L
∂z(¯z, ¯u) − ¯λ ∂f ∂z(¯z, ¯u).
Por fim, escolhendo φ1 qualquer com φ1(t1)6= 0, obtemos a condi¸c˜ao de contorno para a equa¸c˜ao adjunta
∂L1
∂z (¯z(t1)) − ¯λ(t1) = 0.
Definimos agora a fun¸c˜ao de Hamilton H : Rn× Rn× Rm → R H(z, λ, u) := hλ, f(z, u)i + L(z, u)
e supomos que ´e poss´ıvel explicitar (atrav´es da condi¸c˜ao de otimalidade) o controle em fun¸c˜ao das vari´aveis de estado e adjunta (¯u = U (¯z, ¯λ)). Obtemos das equa¸c˜oes de estado e adjunta o sistema hamiltoniano
(1.43) ˙¯z = +∂H∂λ(¯z, ¯λ, U (¯z, ¯λ)) ˙¯λ = −∂H∂z (¯z, ¯λ, U (¯z, ¯λ)) ¯ z(t0) = z0, ¯λ(t1) = ∂L∂z1(¯z(t1))
Note por fim que derivando H em rela¸c˜ao a u no ponto (¯z, ¯λ, ¯u) obtemos da condi¸c˜ao de otimalidade
(1.44) ∂H ∂u(¯z, ¯λ, ¯u) = ¯λ ∂f ∂u(¯z, ¯u) + ∂L ∂u(¯z, ¯u) = 0.
Isto ´e, H(¯z(t), ¯λ(t),·) : Rm → R possui um m´ınimo local em u = ¯u(t), t ∈ [t0, t1]. Por este motivo, a condi¸c˜ao de otimalidade tamb´em ´e conhecida como condi¸c˜ao de m´ınimo.
As condi¸c˜oes necess´arias que procur´avamos podem ser resumidas em (1.43) e (1.44), isto ´e, se (¯z, ¯u) ´e uma solu¸c˜ao para o problema de con- trole ´otimo, ent˜ao existe λ : [t0, t1] → Rn tal que estas condi¸c˜oes s˜ao satisfeitas.
24 EXERC´ICIOS
A an´alise das condi¸c˜oes (1.43) e (1.44) ´e um dos principais t´opicos de interesse na ´area de controle ´otimo. A obten¸c˜ao destas condi¸c˜oes corres- ponde, no caso geral, ao teorema conhecido na literatura por princ´ıpio do m´aximo ou de Pontryagin (veja [PBG], [Tr], [Za]). Retornamos ao estudo das mesmas no Cap´ıtulo 10 (um caso particular pode ainda ser encontrado na Sec¸c˜ao 9.5).
Exerc´ıcios
1.1. Sejam F , G : R2 → R definidas por F (x, y) := 1 2 ³ x y´ µ1 1 1 2 ¶ µ x y ¶ + y, G(x, y) := x− 3. a) Utilizando o teorema de multiplicadores de Lagrange, resolva o seguinte problema de otimiza¸c˜ao:
Minimizar F (x, y) sujeito a G(x, y) = 0
b) Calcule∇F (¯x, ¯y) e ∇G(¯x, ¯y), onde (¯x, ¯y) ´e a solu¸c˜ao encontrada no item a).
1.2. Encontre a menor distˆancia (vertical) entre a par´abola y = ax2+ bx + c e a reta y = x + d.
1.3. Um meteoro percorre a ´orbita hiperb´olica descrita por x2
a2 − y2 b2 = 1
(a Terra est´a na or´ıgem (0, 0)), enquanto que um sat´elite em ´orbita geoestacion´aria se encontra na posi¸c˜ao (x0, y0). Encontre o ponto da ´orbita do meteoro de menor distˆancia ao sat´elite.
1.4. Considere o seguinte modelo de investimento de capital: xk+1 = (1 + r)xk+ uk, k + 1, 2, . . .
onde xk ´e o capital ao final do k-´esimo ano, uk ´e o capital investido ao longo do ano k e r > 0 ´e a taxa de juros anual. Suponha que o custo de
EXERC´ICIOS 25
investimento do capital ao longo dos anos k = 0, . . . , N ´e descrito pela fun¸c˜ao
C(u) := c N −1X
k=0 u2k,
onde u = (u0, . . . , uN). Encontre uma pol´ıtica ´otima de investimento u para N = 10, x10= 100000, r = 7.
1.5. Considere um circuito com um resistor (de resistˆencia R) e um capacitor (de capacitˆancia C). Sejam u(t) a tens˜ao, y(t) a intensidade da corrente el´etrica e q(t) a carga el´etrica no tempo t. Temos ent˜ao as seguintes hip´oteses f´ısicas:
• y(t) ´e igual `a varia¸c˜ao temporal de q(t);
• a diferen¸ca de potencial no capacitor ´e igual a q(t)/C; • a diferen¸ca de potencial no resistor ´e igual a Ry(t);
• a lei de Kirchhoff vigora: a voltagem aplicada no circuito ´e igual ao somat´orio das diferen¸cas de potencial no circuito.
Obtenha uma equa¸c˜ao diferencial para q e resolva-a, obtendo q em fun¸c˜ao de u e q(0) = q0.
1.6. A equa¸c˜ao diferencial (†) ¨x = εK, onde K 6= 0, descreve fenˆomenos da cinem´atica (e.g., na queda livre: ε = −1 e K = g, a constante gravitacional). A partir do sistema ˙x = v, ˙v = εK (onde x ´e o deslocamento e v a velocidade), obtemos a equa¸c˜ao (‡) dv/dx = (εK)/v. Resolva a equa¸c˜ao diferencial (‡) e esboce o gr´afico das solu¸c˜oes no plano (x, v) para o caso particular ε = 1.
1.7. Considere a equa¸c˜ao diferencial (†) do Exerc´ıcio 1.6 com a seguinte estrat´egia de realimenta¸c˜ao:
K = K(x) = ½
−b, x > 0 b, x < 0 .
Dada uma condi¸c˜ao inicial (x0, v0) e uma condi¸c˜ao final (x1, v1), encontre uma trajet´oria correspondente que as una.
Cap´ıtulo 2
Observabilidade
Neste cap´ıtulo analisamos o problema de adquirir informa¸c˜oes sobre o estado presente de um sistema a partir da observa¸c˜ao da sa´ıda do sistema em tempos passados. Conseguimos assim classificar o espa¸co de estados em componentes observ´aveis, n˜ao observ´aveis e detect´aveis (para esta ´ultima ´e necess´aria uma an´alise do comportamento assint´otico das vari´aveis de estado). Devido a sua simplicidade, os sistemas lineares autˆonomos s˜ao estudados separadamente. Na ´ultima sec¸c˜ao ´e apresen- tada uma t´ecnica de reconstru¸c˜ao de estados a partir de observa¸c˜oes. A rela¸c˜ao existente entre os conceitos de observabilidade e controlabilidade ´e analisada no cap´ıtulo seguinte.
2.1
Sistemas Lineares
Considere o seguinte sistema linear de controle: (2.1)
½
z0 = A(t) z + B(t) u y = C(t) z
onde as vari´aveis possuem a seguinte interpreta¸c˜ao: z : [t0, t1]7→ Rn : vetor das vari´aveis de estado;
u : [t0, t1]7→ Rm : vetor das vari´aveis de controle (entrada); y : [t0, t1]7→ Rl : vetor de observa¸c˜ao (sa´ıda).
Os operadores
[SEC. 2.1: SISTEMAS LINEARES 27 s˜ao supostos cont´ınuos em seus dom´ınios de defini¸c˜ao. O sistema de controle linear (2.1) ´e denominado abreviadamente por (A, B, C). Se as fun¸c˜oes matriciais A, B, C n˜ao dependem explicitamente do tempo, o sistema de controle ´e dito autˆonomo; caso contr´ario, o sistema ´e deno- minado n˜ao autˆonomo.
Considere inicialmente a seguinte quest˜ao: dado um sistema de con- trole (A, B, C), em que circunstˆancias ´e poss´ıvel a partir do conheci- mento da entrada do sistema
u : [t0, t1]7→ Rm e de sua sa´ıda
y : [t0, t1]7→ Rl,
reconstruir o estado inicial z0 := z(t0) ∈ Rn. Uma vez conhecido o vetor z0, ´e poss´ıvel substituir o controle dado u na equa¸c˜ao diferencial em (2.1) e calcular as vari´aveis de estado z(t) em qualquer instante de tempo t∈ [t0, t1].
Como estrat´egias de controle admiss´ıveis consideramos as fun¸c˜oes L1([t0, t1]; Rm). Conforme resultados do Cap´ıtulo A, temos que:
y(t) = C(t) ΦA(t, t0) z0 + y1(t), y1(t) =
Z t1
t0
C(t) ΦA(t, s) B(s) u(s) ds, t∈ [t0, t1].
Note que, conhecida a entrada u, a fun¸c˜ao y1 pode ser calculada a priori, independente do fato de conhecermos (ou n˜ao) a condi¸c˜ao inicial z0. Portanto, a determina¸c˜ao de z0 a partir do par (y, u) ´e equivalente `a determina¸c˜ao de z0 a partir da diferen¸ca y− y1, a qual corresponde `a sa´ıda do sistema homogˆeneo
z0 = A(t) z.
Isto significa que, para estudar a determina¸c˜ao do estado inicial z0 de um sistema linear, basta concentrarmo-nos em sistemas homogˆeneos da forma:
(2.2) z0 = A(t) z, y = C(t) z,
os quais representamos pela nota¸c˜ao abreviada (A, , C). Estamos agora em condi¸c˜oes de formalizar o conceito de observabilidade, discutido no Cap´ıtulo 1.
28 [CAP. 2: OBSERVABILIDADE Defini¸c˜ao 6. O sistema (A, , C) ´e denominado observ´avel em [t0, t1] quando para toda fun¸c˜ao z∈ C1([t0, t1]; Rn) a condi¸c˜ao
z0(t) = A(t) z(t), C(t) z(t) = 0, ∀t ∈ [t0, t1],
implicar em z(t0) = 0. 2
Em outras palavras, a observabilidade do sistema (A, , C) ´e equiva- lente ao fato da aplica¸c˜ao linear
G : Rn −→ C([t0, t1]; Rn) z0 7−→ C(·) ΦA(·, t0) z0
ser injetiva. No teorema a seguir analisamos uma forma equivalente de definir a observabilidade de um sistema.
Teorema 7. As seguintes afirma¸c˜oes s˜ao equivalentes: a) O sistema (A, , C) ´e observ´avel em [t0, t1];
b) A matriz
W (t0, t1) := Z t1
t0
ΦA(t, t0)∗C(t)∗C(t) ΦA(t, t0) dt ´e positiva definida.
Demonstra¸c˜ao: (a) =⇒ (b) Suponha que W (t0, t1) n˜ao ´e positiva definida. Por constru¸c˜ao, a matriz W (t0, t1) ´e sim´etrica e, al´em disto, satisfaz: hx, W (t0, t1)xi ≥ 0, ∀x ∈ Rn. (por quˆe?).
Logo, existe z0 ∈ Rn\{0} tal que hz0, W (t0, t1)z0i = 0. Definindo agora a fun¸c˜ao z(·) := ΦA(·; t0)z0, temos que esta fun¸c˜ao ´e solu¸c˜ao do problema de valor inicial z0 = A(t)z, z(t0) = z0. Al´em disso, z satisfaz
Z t1 t0 |C(t) z(t)|2dt = Z t1 t0 |C(t)ΦA(t, t0)z0|2dt = Z t1 t0 hC(t)ΦA(t, t0)z0, C(t)ΦA(t, t0)z0i dt = Z t1 t0 hz0, ΦA(t, t0)∗C(t)∗C(t)ΦA(t, t0)z0i dt = hz0, W (t0, t1)z0i = 0.
Encontramos assim uma fun¸c˜ao z satisfazendo
[SEC. 2.1: SISTEMAS LINEARES 29 o que contradiz a hip´otese do sistema ser observ´avel.
(b) =⇒ (a) Suponha que para alguma fun¸c˜ao z tenhamos z0(t) = A(t) z(t), C(t) z(t) = 0, ∀t ∈ [t0, t1]. Logo, temos z = Φ(·; t0)z0, onde z0 := z(t0) e
hz0, W (t0, t1) z0i = Z t1
t0
hC(t)z(t), C(t)z(t)i dt = 0. Da hip´otese de W (t0, t1) ser positiva definida, segue z0 = 0.
Os sistemas de controle lineares com matrizes invariantes no tempo (autˆonomos) representam um importante caso especial que ´e tratado no teorema a seguir. No texto que segue adotamos a nota¸c˜ao: Dada uma matriz M , representamos por Po(M ), Ke(M ), Im(M ) respectivamente o posto, o n´ucleo e a imagem de M (para detalhes veja [Gan]).
Teorema 8. Seja (A, , C) um sistema de controle autˆonomo. As se- guintes afirmativas s˜ao equivalentes:
a) (A, , C) ´e observ´avel em [0, T ] para todo T > 0; b) (A, , C) ´e observ´avel em [0, T ] para algum T > 0; c) A Matriz WT :=R0TeA
∗s
C∗CeAsds ´e n˜ao singular para algum T > 0; d) A Matrix WT :=R0T eA
∗s
C∗CeAsds ´e n˜ao singular para todo T > 0 ; e) Po(C∗|A∗C∗| . . . |(A∗)n−1C∗) = n; 1
f ) n−1T k=0
Ke(CAk) ={0}.
Demonstra¸c˜ao: a) =⇒ b) Nada a fazer.
b) =⇒ c) Seja T > 0 escolhido de acordo com b). Tome z0 ∈ Rn e defina a fun¸c˜ao z(t) := eAt z0 para t∈ R. A identidade
hz0, WT z0i = Z T
0 |C z(s)| 2ds
´e obtida como na demonstra¸c˜ao do Teorema 7. Esta identidade e a hip´otese de observabilidade do sistema (A, , C) no intervalo [0, T ] impli- cam em z0= 0.
1A matriz M
0 = (C∗|A∗C∗| . . . |(A∗)n−1C∗) ´e chamada matriz de observa¸c˜ao do
30 [CAP. 2: OBSERVABILIDADE c) =⇒ d) Seja T > 0 escolhido de acordo com c) e seja ˆT > 0. Da Identidade
hz0, WTˆz0i = Z Tˆ
0 |C z(s)| 2ds, temos quehz0, WTˆz0i = 0 implica em
a(t) := C eAtz0 = 0, ∀t ∈ [0, ˆT ]. Da´ı segue que
(2.3) a(k)(0) = C Akz0 = 0, k = 0, 1, . . . Portanto,
C Akskz0 = 0, k = 0, 1, . . . , s∈ [0, T ]. Esta ´ultima igualdade implica em
hz0, WT z0i = Z T 0 |C e Atz 0|2ds = Z T 0 | ∞ X k=0 1 k!CA kskz 0|2ds = 0. A escolha de T implica por fim em z0 = 0.
d) =⇒ e) Suponha por contradi¸c˜ao que P o(C∗|A∗C∗| . . . |(A∗)n−1C∗) < n. Ent˜ao, as n linhas da matriz n× nl (C∗|A∗C∗| . . . |(A∗)n−1C∗) s˜ao linearmente dependentes e existe um elemento z0 ∈ Rn, z0 6= 0, satis- fazendo
(2.4) z0∗(A∗)kC∗ = 0, C Akz0 = 0 , k = 0, . . . , n− 1. Seja pA(λ) := λn+
n−1P k=0
αkλk, o polinˆomio caracter´ıstico da matriz A. O teorema de Caley–Hamilton da ´algebra linear nos garante que A ´e um zero de seu polinˆomio caracter´ıstico (veja [Gan] ou [So]), isto ´e
pA(A) := An + n−1 X k=0
αkAk = 0,
de onde conclu´ımos que
Am = n−1X k=0
[SEC. 2.1: SISTEMAS LINEARES 31 Isto nos permite escrever2
eAt = n−1 X k=0
αk(t) Ak.
Sendo assim, temos de (2.4)
C eAtz0 = n−1 X k=0 αk(t) C Akz0 = 0, t∈ [0, T ], e portanto, hz0, WTz0i = Z T 0 |Ce Atz 0|2dt = 0, o que contradiz a hip´otese em d), pois z0 6= 0.
e)⇐⇒ f) De (2.4) conclu´ımos que z0∈T Ke(CAk)⇐⇒ z∗0(Ak)∗C∗ = 0, k = 0, . . . , n− 1.
f ) =⇒ a) Suponha que z0 ∈ Rn ´e tal que CeAtz0 = 0, para todo t ∈ [0, T ]. Como em (2.3), podemos concluir que CAkz
0 = 0 para k = 0, 1, . . .. A hip´otese em f ) implica ent˜ao que z0= 0.
Um sistema autˆonomo (A, , C) ´e portanto observ´avel, quando for observ´avel em [0, T ] para um T > 0 qualquer.
Exemplo 9. Consideramos um modelo para representar o movimento de um sat´elite artificial de massa unit´aria orbitando a Terra. Definindo as vari´aveis:
r : altura da ´orbita; ˙0 : velocidade ˆangular;
u1 : empuxo radial dos motores; u2 : empuxo tangencial dos motores; ω2 : constante gravitacional (ω2 = g); o sistema de equa¸c˜oes que descreve o fenˆomeno ´e: (2.5) ½ ¨ r = ˙02r − ω2r−2 + u 1 ¨ 0 = −2˙0 ˙rr−2 + r−1u2 2Verifique que α k(t) = n−1P j=0 tj j! + ∞ P j=n tjα(j)k j! .
32 [CAP. 2: OBSERVABILIDADE Note que a solu¸c˜ao deste sistema para u1 = u2 = 0 ´e dada por r(t) = 1 e 0(t) = ωt. Portanto, ao definirmos as vari´aveis normalizadas
z1 := r− 1, z2 := z10= ˙r, z3 := 0− ωt, z4 := z30 = ˙0− ω, estamos estudando perturba¸c˜oes desta solu¸c˜ao, a qual representa a ´orbita livre (controle u = 0) do sat´elite. Reescrevendo o sistema a partir das novas vari´aveis z1, . . . , z4, temos
(2.6) z10 = z2 z20 = (z4+ ω)2(z1+ 1) − ω 2 (z1+ 1)2 + u1 z30 = z4 z40 = −2(z4z+ ω)z2 1+ 1 + u2 z1+ 1 Linearizando agora o sistema (2.6) no ponto
z1 = z2 = z3 = z4 = u1 = u2 = 0, obtemos o novo sistema
z0 = A z + B u, onde as matrizes A e B s˜ao dadas por:
A = 0 1 0 0 3ω2 0 0 2ω 0 0 0 1 0 −2ω 0 0 e B = 0 0 1 0 0 0 0 1 .
Se supomos que tanto varia¸c˜oes no raio da ´orbita, quanto no ˆangulo podem ser medidas, ent˜ao as vari´aveis z1 e z3 s˜ao conhecidas. Nesse caso, o vetor de observa¸c˜ao y satisfaz:
y = C z onde C = µ 1 0 0 0 0 0 1 0 ¶ .
A matriz de observa¸c˜ao, dada por M0 := (C∗| . . . |(A∗)n−1C∗), se escreve neste caso como
M0= 1 0 0 0 ∗ . . . ∗ 0 0 1 0 ∗ . . . ∗ 0 1 0 0 ∗ . . . ∗ 0 0 0 1 ∗ . . . ∗
Temos assim que a condi¸c˜ao Po(M0) = 4 = n ´e verificada, garantindo a
[SEC. 2.2: SUBESPAC¸ O N˜AO OBSERV´AVEL 33