• Nenhum resultado encontrado

Um Problema de Controle ´ Otimo

1.2 Exemplos

1.2.8 Um Problema de Controle ´ Otimo

Seja Ω⊂ Rn compacto e f : Rn× Ω → Rn uma aplica¸c˜ao cont´ınua, Lipschitz na primeira vari´avel (veja Defini¸c˜ao 259) e uniformemente na segunda. Seja7

Uad := {u : [t0, t1]→ Rm; u(t)∈ Ω q.s. em [t0, t1]}

o conjunto dos controles vi´aveis. Considere agora a equa¸c˜ao de evolu¸c˜ao das vari´aveis de estado

½

z0(t) = f (z(t), u(t)), q.s. em [t0, t1] z(t0) = z0

A teoria de equa¸c˜oes diferenciais ordin´arias garante que, para cada u∈ Uad, o problema acima possui uma ´unica solu¸c˜ao absolutamente cont´ınua em [t0, t1]. Nosso objetivo ´e encontrar um controle ¯u que minimize o funcional objetivo

J(t, z; u) := L1(z(t)) + Z t1

t0

L(z(t), u(t)) dt,

onde as fun¸c˜oes L e L1 definem respectivamente os custos operacional e final do modelo. Suponha L∈ C1(Rn× Ω) e L

1 ∈ C1(Rn).

Tal problema de controle ´otimo ´e denominado problema com hori- zonte finito8. Fazemos aqui uma abordagem baseada no m´etodo dos

7Nota¸c˜ao: q.s. ´e abrevia¸c˜ao de ’quase sempre’ e se refere `a medida de Lebesgue

no intervalo em quest˜ao.

8Note que o tempo final t

22 [CAP. 1: INTRODUC¸ ˜AO multiplicadores de Lagrange (veja Exemplo 1.2.2) que nos permite en- contrar algumas condi¸c˜oes necess´arias para otimalidade de uma solu¸c˜ao (compare com os resultados do Apˆendice B).

Definimos inicialmente a vari´avel adjunta (ou co-estado) λ = λ(t) e o funcional estendido

I(z, u, λ) := Z t1

t0

[L(z, u)− λ (z0− f(z, u))] ds + L1(z(t1)). Suponha que as fun¸c˜oes envolvidas na defini¸c˜ao de I s˜ao suficientemente regulares e que (¯z, ¯u, ¯λ) ´e um m´ınimo (local) de I. Sejam ainda φi(t), i = 1, 2, 3 fun¸c˜oes regulares com φ1(t0) = 0. Definimos ent˜ao

zε := ¯z + εφ1, uε := ¯u + εφ2, λε := ¯λ + εφ3

e I(ε) := I(zε, uε, λε) ∈ R, para |ε| ’pequeno’. Logo I(ε) possui um m´ınimo local em ε = 0. Note que

(1.42) ∂I dε(ε) = Z t1 t0 · ∂h ∂zφ1+ ∂h ∂uφ2− ( ˙z ε− f)φ 3− λε( ˙φ1−∂f ∂zφ1− ∂f ∂uφ2) ¸ dt + ∂g ∂z(z ε(t 1)) φ1(t1). Integramos por partes o termo λεφ˙1 Z t1 t0 λεφ˙1dt = [λεφ1]tt10 − Z t1 t0 ˙λεφ 1dt = λε(t1) φ1(t1)− Z t1 t0 ˙λεφ 1dt e substituimos em (1.42), obtendo 0 = ∂I dε ¯ ¯ ¯ ¯ ε=0 = Z t1 t0 · φ1 µ ∂L ∂z(¯z, ¯u) + ¯λ ∂f ∂z(¯z, ¯u) + ˙¯λ ¶ + φ2 µ ∂L ∂u(¯z, ¯u) + ¯λ ∂f ∂u(¯z, ¯u) ¶ + φ3(− ˙¯z + f(¯z, ¯u)) ¸ dt + φ1(t1) ·∂L 1 ∂z (¯z(t1))− ¯λ(t1) ¸ .

Tomando φ1= φ2 = 0 e φ3 arbitr´ario, obtemos a equa¸c˜ao de estado ˙¯z = f(¯z, ¯u).

[SEC. 1.2: EXEMPLOS 23 Tomando φ1 = 0 e φ2 qualquer, obtemos a condi¸c˜ao de otimalidade

∂L

∂u(¯z, ¯u) + ¯λ ∂f

∂u(¯z, ¯u) = 0.

Tomando agora φ1 qualquer com φ1(t1) = 0, obtemos a equa¸c˜ao adjunta (ou de co-estado)

˙¯λ = −∂L

∂z(¯z, ¯u) − ¯λ ∂f ∂z(¯z, ¯u).

Por fim, escolhendo φ1 qualquer com φ1(t1)6= 0, obtemos a condi¸c˜ao de contorno para a equa¸c˜ao adjunta

∂L1

∂z (¯z(t1)) − ¯λ(t1) = 0.

Definimos agora a fun¸c˜ao de Hamilton H : Rn× Rn× Rm → R H(z, λ, u) := hλ, f(z, u)i + L(z, u)

e supomos que ´e poss´ıvel explicitar (atrav´es da condi¸c˜ao de otimalidade) o controle em fun¸c˜ao das vari´aveis de estado e adjunta (¯u = U (¯z, ¯λ)). Obtemos das equa¸c˜oes de estado e adjunta o sistema hamiltoniano

(1.43)            ˙¯z = +∂H∂λ(¯z, ¯λ, U (¯z, ¯λ)) ˙¯λ = −∂H∂z (¯z, ¯λ, U (¯z, ¯λ)) ¯ z(t0) = z0, ¯λ(t1) = ∂L∂z1(¯z(t1))

Note por fim que derivando H em rela¸c˜ao a u no ponto (¯z, ¯λ, ¯u) obtemos da condi¸c˜ao de otimalidade

(1.44) ∂H ∂u(¯z, ¯λ, ¯u) = ¯λ ∂f ∂u(¯z, ¯u) + ∂L ∂u(¯z, ¯u) = 0.

Isto ´e, H(¯z(t), ¯λ(t),·) : Rm → R possui um m´ınimo local em u = ¯u(t), t ∈ [t0, t1]. Por este motivo, a condi¸c˜ao de otimalidade tamb´em ´e conhecida como condi¸c˜ao de m´ınimo.

As condi¸c˜oes necess´arias que procur´avamos podem ser resumidas em (1.43) e (1.44), isto ´e, se (¯z, ¯u) ´e uma solu¸c˜ao para o problema de con- trole ´otimo, ent˜ao existe λ : [t0, t1] → Rn tal que estas condi¸c˜oes s˜ao satisfeitas.

24 EXERC´ICIOS

A an´alise das condi¸c˜oes (1.43) e (1.44) ´e um dos principais t´opicos de interesse na ´area de controle ´otimo. A obten¸c˜ao destas condi¸c˜oes corres- ponde, no caso geral, ao teorema conhecido na literatura por princ´ıpio do m´aximo ou de Pontryagin (veja [PBG], [Tr], [Za]). Retornamos ao estudo das mesmas no Cap´ıtulo 10 (um caso particular pode ainda ser encontrado na Sec¸c˜ao 9.5).

Exerc´ıcios

1.1. Sejam F , G : R2 → R definidas por F (x, y) := 1 2 ³ x y´ µ1 1 1 2 ¶ µ x y ¶ + y, G(x, y) := x− 3. a) Utilizando o teorema de multiplicadores de Lagrange, resolva o seguinte problema de otimiza¸c˜ao:

   Minimizar F (x, y) sujeito a G(x, y) = 0

b) Calcule∇F (¯x, ¯y) e ∇G(¯x, ¯y), onde (¯x, ¯y) ´e a solu¸c˜ao encontrada no item a).

1.2. Encontre a menor distˆancia (vertical) entre a par´abola y = ax2+ bx + c e a reta y = x + d.

1.3. Um meteoro percorre a ´orbita hiperb´olica descrita por x2

a2 − y2 b2 = 1

(a Terra est´a na or´ıgem (0, 0)), enquanto que um sat´elite em ´orbita geoestacion´aria se encontra na posi¸c˜ao (x0, y0). Encontre o ponto da ´orbita do meteoro de menor distˆancia ao sat´elite.

1.4. Considere o seguinte modelo de investimento de capital: xk+1 = (1 + r)xk+ uk, k + 1, 2, . . .

onde xk ´e o capital ao final do k-´esimo ano, uk ´e o capital investido ao longo do ano k e r > 0 ´e a taxa de juros anual. Suponha que o custo de

EXERC´ICIOS 25

investimento do capital ao longo dos anos k = 0, . . . , N ´e descrito pela fun¸c˜ao

C(u) := c N −1X

k=0 u2k,

onde u = (u0, . . . , uN). Encontre uma pol´ıtica ´otima de investimento u para N = 10, x10= 100000, r = 7.

1.5. Considere um circuito com um resistor (de resistˆencia R) e um capacitor (de capacitˆancia C). Sejam u(t) a tens˜ao, y(t) a intensidade da corrente el´etrica e q(t) a carga el´etrica no tempo t. Temos ent˜ao as seguintes hip´oteses f´ısicas:

• y(t) ´e igual `a varia¸c˜ao temporal de q(t);

• a diferen¸ca de potencial no capacitor ´e igual a q(t)/C; • a diferen¸ca de potencial no resistor ´e igual a Ry(t);

• a lei de Kirchhoff vigora: a voltagem aplicada no circuito ´e igual ao somat´orio das diferen¸cas de potencial no circuito.

Obtenha uma equa¸c˜ao diferencial para q e resolva-a, obtendo q em fun¸c˜ao de u e q(0) = q0.

1.6. A equa¸c˜ao diferencial (†) ¨x = εK, onde K 6= 0, descreve fenˆomenos da cinem´atica (e.g., na queda livre: ε = −1 e K = g, a constante gravitacional). A partir do sistema ˙x = v, ˙v = εK (onde x ´e o deslocamento e v a velocidade), obtemos a equa¸c˜ao (‡) dv/dx = (εK)/v. Resolva a equa¸c˜ao diferencial (‡) e esboce o gr´afico das solu¸c˜oes no plano (x, v) para o caso particular ε = 1.

1.7. Considere a equa¸c˜ao diferencial (†) do Exerc´ıcio 1.6 com a seguinte estrat´egia de realimenta¸c˜ao:

K = K(x) = ½

−b, x > 0 b, x < 0 .

Dada uma condi¸c˜ao inicial (x0, v0) e uma condi¸c˜ao final (x1, v1), encontre uma trajet´oria correspondente que as una.

Cap´ıtulo 2

Observabilidade

Neste cap´ıtulo analisamos o problema de adquirir informa¸c˜oes sobre o estado presente de um sistema a partir da observa¸c˜ao da sa´ıda do sistema em tempos passados. Conseguimos assim classificar o espa¸co de estados em componentes observ´aveis, n˜ao observ´aveis e detect´aveis (para esta ´ultima ´e necess´aria uma an´alise do comportamento assint´otico das vari´aveis de estado). Devido a sua simplicidade, os sistemas lineares autˆonomos s˜ao estudados separadamente. Na ´ultima sec¸c˜ao ´e apresen- tada uma t´ecnica de reconstru¸c˜ao de estados a partir de observa¸c˜oes. A rela¸c˜ao existente entre os conceitos de observabilidade e controlabilidade ´e analisada no cap´ıtulo seguinte.

2.1

Sistemas Lineares

Considere o seguinte sistema linear de controle: (2.1)

½

z0 = A(t) z + B(t) u y = C(t) z

onde as vari´aveis possuem a seguinte interpreta¸c˜ao: z : [t0, t1]7→ Rn : vetor das vari´aveis de estado;

u : [t0, t1]7→ Rm : vetor das vari´aveis de controle (entrada); y : [t0, t1]7→ Rl : vetor de observa¸c˜ao (sa´ıda).

Os operadores

[SEC. 2.1: SISTEMAS LINEARES 27 s˜ao supostos cont´ınuos em seus dom´ınios de defini¸c˜ao. O sistema de controle linear (2.1) ´e denominado abreviadamente por (A, B, C). Se as fun¸c˜oes matriciais A, B, C n˜ao dependem explicitamente do tempo, o sistema de controle ´e dito autˆonomo; caso contr´ario, o sistema ´e deno- minado n˜ao autˆonomo.

Considere inicialmente a seguinte quest˜ao: dado um sistema de con- trole (A, B, C), em que circunstˆancias ´e poss´ıvel a partir do conheci- mento da entrada do sistema

u : [t0, t1]7→ Rm e de sua sa´ıda

y : [t0, t1]7→ Rl,

reconstruir o estado inicial z0 := z(t0) ∈ Rn. Uma vez conhecido o vetor z0, ´e poss´ıvel substituir o controle dado u na equa¸c˜ao diferencial em (2.1) e calcular as vari´aveis de estado z(t) em qualquer instante de tempo t∈ [t0, t1].

Como estrat´egias de controle admiss´ıveis consideramos as fun¸c˜oes L1([t0, t1]; Rm). Conforme resultados do Cap´ıtulo A, temos que:

y(t) = C(t) ΦA(t, t0) z0 + y1(t), y1(t) =

Z t1

t0

C(t) ΦA(t, s) B(s) u(s) ds, t∈ [t0, t1].

Note que, conhecida a entrada u, a fun¸c˜ao y1 pode ser calculada a priori, independente do fato de conhecermos (ou n˜ao) a condi¸c˜ao inicial z0. Portanto, a determina¸c˜ao de z0 a partir do par (y, u) ´e equivalente `a determina¸c˜ao de z0 a partir da diferen¸ca y− y1, a qual corresponde `a sa´ıda do sistema homogˆeneo

z0 = A(t) z.

Isto significa que, para estudar a determina¸c˜ao do estado inicial z0 de um sistema linear, basta concentrarmo-nos em sistemas homogˆeneos da forma:

(2.2) z0 = A(t) z, y = C(t) z,

os quais representamos pela nota¸c˜ao abreviada (A, , C). Estamos agora em condi¸c˜oes de formalizar o conceito de observabilidade, discutido no Cap´ıtulo 1.

28 [CAP. 2: OBSERVABILIDADE Defini¸c˜ao 6. O sistema (A, , C) ´e denominado observ´avel em [t0, t1] quando para toda fun¸c˜ao z∈ C1([t0, t1]; Rn) a condi¸c˜ao

z0(t) = A(t) z(t), C(t) z(t) = 0, ∀t ∈ [t0, t1],

implicar em z(t0) = 0. 2

Em outras palavras, a observabilidade do sistema (A, , C) ´e equiva- lente ao fato da aplica¸c˜ao linear

G : Rn −→ C([t0, t1]; Rn) z0 7−→ C(·) ΦA(·, t0) z0

ser injetiva. No teorema a seguir analisamos uma forma equivalente de definir a observabilidade de um sistema.

Teorema 7. As seguintes afirma¸c˜oes s˜ao equivalentes: a) O sistema (A, , C) ´e observ´avel em [t0, t1];

b) A matriz

W (t0, t1) := Z t1

t0

ΦA(t, t0)∗C(t)∗C(t) ΦA(t, t0) dt ´e positiva definida.

Demonstra¸c˜ao: (a) =⇒ (b) Suponha que W (t0, t1) n˜ao ´e positiva definida. Por constru¸c˜ao, a matriz W (t0, t1) ´e sim´etrica e, al´em disto, satisfaz: hx, W (t0, t1)xi ≥ 0, ∀x ∈ Rn. (por quˆe?).

Logo, existe z0 ∈ Rn\{0} tal que hz0, W (t0, t1)z0i = 0. Definindo agora a fun¸c˜ao z(·) := ΦA(·; t0)z0, temos que esta fun¸c˜ao ´e solu¸c˜ao do problema de valor inicial z0 = A(t)z, z(t0) = z0. Al´em disso, z satisfaz

Z t1 t0 |C(t) z(t)|2dt = Z t1 t0 |C(t)ΦA(t, t0)z0|2dt = Z t1 t0 hC(t)ΦA(t, t0)z0, C(t)ΦA(t, t0)z0i dt = Z t1 t0 hz0, ΦA(t, t0)∗C(t)∗C(t)ΦA(t, t0)z0i dt = hz0, W (t0, t1)z0i = 0.

Encontramos assim uma fun¸c˜ao z satisfazendo

[SEC. 2.1: SISTEMAS LINEARES 29 o que contradiz a hip´otese do sistema ser observ´avel.

(b) =⇒ (a) Suponha que para alguma fun¸c˜ao z tenhamos z0(t) = A(t) z(t), C(t) z(t) = 0, ∀t ∈ [t0, t1]. Logo, temos z = Φ(·; t0)z0, onde z0 := z(t0) e

hz0, W (t0, t1) z0i = Z t1

t0

hC(t)z(t), C(t)z(t)i dt = 0. Da hip´otese de W (t0, t1) ser positiva definida, segue z0 = 0.

Os sistemas de controle lineares com matrizes invariantes no tempo (autˆonomos) representam um importante caso especial que ´e tratado no teorema a seguir. No texto que segue adotamos a nota¸c˜ao: Dada uma matriz M , representamos por Po(M ), Ke(M ), Im(M ) respectivamente o posto, o n´ucleo e a imagem de M (para detalhes veja [Gan]).

Teorema 8. Seja (A, , C) um sistema de controle autˆonomo. As se- guintes afirmativas s˜ao equivalentes:

a) (A, , C) ´e observ´avel em [0, T ] para todo T > 0; b) (A, , C) ´e observ´avel em [0, T ] para algum T > 0; c) A Matriz WT :=R0TeA

s

C∗CeAsds ´e n˜ao singular para algum T > 0; d) A Matrix WT :=R0T eA

s

C∗CeAsds ´e n˜ao singular para todo T > 0 ; e) Po(C∗|AC| . . . |(A)n−1C) = n; 1

f ) n−1T k=0

Ke(CAk) ={0}.

Demonstra¸c˜ao: a) =⇒ b) Nada a fazer.

b) =⇒ c) Seja T > 0 escolhido de acordo com b). Tome z0 ∈ Rn e defina a fun¸c˜ao z(t) := eAt z0 para t∈ R. A identidade

hz0, WT z0i = Z T

0 |C z(s)| 2ds

´e obtida como na demonstra¸c˜ao do Teorema 7. Esta identidade e a hip´otese de observabilidade do sistema (A, , C) no intervalo [0, T ] impli- cam em z0= 0.

1A matriz M

0 = (C∗|A∗C∗| . . . |(A∗)n−1C∗) ´e chamada matriz de observa¸c˜ao do

30 [CAP. 2: OBSERVABILIDADE c) =⇒ d) Seja T > 0 escolhido de acordo com c) e seja ˆT > 0. Da Identidade

hz0, WTˆz0i = Z Tˆ

0 |C z(s)| 2ds, temos quehz0, WTˆz0i = 0 implica em

a(t) := C eAtz0 = 0, ∀t ∈ [0, ˆT ]. Da´ı segue que

(2.3) a(k)(0) = C Akz0 = 0, k = 0, 1, . . . Portanto,

C Akskz0 = 0, k = 0, 1, . . . , s∈ [0, T ]. Esta ´ultima igualdade implica em

hz0, WT z0i = Z T 0 |C e Atz 0|2ds = Z T 0 | ∞ X k=0 1 k!CA kskz 0|2ds = 0. A escolha de T implica por fim em z0 = 0.

d) =⇒ e) Suponha por contradi¸c˜ao que P o(C|A∗C∗| . . . |(A∗)n−1C∗) < n. Ent˜ao, as n linhas da matriz n× nl (C|AC| . . . |(A)n−1C) s˜ao linearmente dependentes e existe um elemento z0 ∈ Rn, z0 6= 0, satis- fazendo

(2.4) z0∗(A∗)kC∗ = 0, C Akz0 = 0 , k = 0, . . . , n− 1. Seja pA(λ) := λn+

n−1P k=0

αkλk, o polinˆomio caracter´ıstico da matriz A. O teorema de Caley–Hamilton da ´algebra linear nos garante que A ´e um zero de seu polinˆomio caracter´ıstico (veja [Gan] ou [So]), isto ´e

pA(A) := An + n−1 X k=0

αkAk = 0,

de onde conclu´ımos que

Am = n−1X k=0

[SEC. 2.1: SISTEMAS LINEARES 31 Isto nos permite escrever2

eAt = n−1 X k=0

αk(t) Ak.

Sendo assim, temos de (2.4)

C eAtz0 = n−1 X k=0 αk(t) C Akz0 = 0, t∈ [0, T ], e portanto, hz0, WTz0i = Z T 0 |Ce Atz 0|2dt = 0, o que contradiz a hip´otese em d), pois z0 6= 0.

e)⇐⇒ f) De (2.4) conclu´ımos que z0∈T Ke(CAk)⇐⇒ z∗0(Ak)∗C∗ = 0, k = 0, . . . , n− 1.

f ) =⇒ a) Suponha que z0 ∈ Rn ´e tal que CeAtz0 = 0, para todo t ∈ [0, T ]. Como em (2.3), podemos concluir que CAkz

0 = 0 para k = 0, 1, . . .. A hip´otese em f ) implica ent˜ao que z0= 0.

Um sistema autˆonomo (A, , C) ´e portanto observ´avel, quando for observ´avel em [0, T ] para um T > 0 qualquer.

Exemplo 9. Consideramos um modelo para representar o movimento de um sat´elite artificial de massa unit´aria orbitando a Terra. Definindo as vari´aveis:

r : altura da ´orbita; ˙0 : velocidade ˆangular;

u1 : empuxo radial dos motores; u2 : empuxo tangencial dos motores; ω2 : constante gravitacional (ω2 = g); o sistema de equa¸c˜oes que descreve o fenˆomeno ´e: (2.5) ½ ¨ r = ˙02r − ω2r−2 + u 1 ¨ 0 = −2˙0 ˙rr−2 + r−1u2 2Verifique que α k(t) = n−1P j=0 tj j! + ∞ P j=n tjα(j)k j! .

32 [CAP. 2: OBSERVABILIDADE Note que a solu¸c˜ao deste sistema para u1 = u2 = 0 ´e dada por r(t) = 1 e 0(t) = ωt. Portanto, ao definirmos as vari´aveis normalizadas

z1 := r− 1, z2 := z10= ˙r, z3 := 0− ωt, z4 := z30 = ˙0− ω, estamos estudando perturba¸c˜oes desta solu¸c˜ao, a qual representa a ´orbita livre (controle u = 0) do sat´elite. Reescrevendo o sistema a partir das novas vari´aveis z1, . . . , z4, temos

(2.6)              z10 = z2 z20 = (z4+ ω)2(z1+ 1) − ω 2 (z1+ 1)2 + u1 z30 = z4 z40 = −2(z4z+ ω)z2 1+ 1 + u2 z1+ 1 Linearizando agora o sistema (2.6) no ponto

z1 = z2 = z3 = z4 = u1 = u2 = 0, obtemos o novo sistema

z0 = A z + B u, onde as matrizes A e B s˜ao dadas por:

A =     0 1 0 0 3ω2 0 0 2ω 0 0 0 1 0 −2ω 0 0     e B =     0 0 1 0 0 0 0 1     .

Se supomos que tanto varia¸c˜oes no raio da ´orbita, quanto no ˆangulo podem ser medidas, ent˜ao as vari´aveis z1 e z3 s˜ao conhecidas. Nesse caso, o vetor de observa¸c˜ao y satisfaz:

y = C z onde C = µ 1 0 0 0 0 0 1 0 ¶ .

A matriz de observa¸c˜ao, dada por M0 := (C∗| . . . |(A∗)n−1C∗), se escreve neste caso como

M0=     1 0 0 0 ∗ . . . ∗ 0 0 1 0 ∗ . . . ∗ 0 1 0 0 ∗ . . . ∗ 0 0 0 1 ∗ . . . ∗    

Temos assim que a condi¸c˜ao Po(M0) = 4 = n ´e verificada, garantindo a

[SEC. 2.2: SUBESPAC¸ O N˜AO OBSERV´AVEL 33