TEMPO
Paulo Lopes dos Santos
Departamento de Engenharia Electrot´
ecnica e Computadores
Faculdade de Engenharia da Universidade do Porto
Rua Dr Roberto Frias, s/n
4200-464 Porto, Portugal
Email: pjsantos@fe.up.pt
Conte´
udo
1 Representa¸c˜ao de Sistemas no Espa¸co de Estados 2
2 Estabilidade assint´otica 4
3 Acessibilidade e Controlabilidade 9
4 Observabilidade 15
5 Decomposi¸c˜ao Can´onica de Kalman 22
6 Fun¸c˜oes de Transferˆencia e Realiza¸c˜oes M´ınimas 27
7 Realiza¸c˜oes Equilibradas 28
1
Representa¸
c˜
ao de Sistemas no Espa¸
co de Estados
Um sistema linear e invariante no tempo com m entradas e ℓ sa´ıdas pode ser representado atrav´es do seguinte modelo
x(t + 1) = Ax(t) + Bu(t) (1)
y(t) = Cx(t) + Du(t) (2)
onde x(t)∈ IRn ´e o vector de estado, u(t)∈ IRm o vector das entradas e y(t)∈ IRℓ o vector das sa´ıdas. As matrizes A ∈ IRn×n, B ∈ IRn×m, C ∈ IRℓ×n e D ∈ IRℓ×m s˜ao constantes e constituem os parˆametros do modelo.
Se conhecermos x(t0), podemos calcular x(t0+ 1) e x(t0+ 2) da seguinte forma
x(t0+ 1) = Ax(t0) + Bu(t0)
x(t0+ 2) = Ax(t0+ 1) + Bu(t0+ 1) =
= A (Ax(t0) + Bu(t0)) + Bu(t0 + 1) = A2x(t0) + ABu(t0) + Bu(t0+ 1).
Admitindo que, para t > t0,
x(t) = At−t0x(t
0) + At−t0−1Bu(t0) + At−t0−2Bu(t0+ 1) +· · · + ABu(t − 2) + Bu(t − 1),
ent˜ao, atrav´es de (1), teremos
x(t + 1) = Ax(t) + Bu(t) =
= A(At−t0x(t
0) + At−t0−1Bu(t0) + At−t0−2Bu(t0+ 1) +· · · + Bu(t − 1)
)
+ Bu(t) = = At+1−t0x(t
0) + At−t0Bu(t0) + At−t0−1Bu(t0+ 1) +· · · + ABu(t − 1) + Bu(t),
ficando demonstrado, por indu¸c˜ao, que
x(t) = At−t0x(t 0) + t−t∑0−1 τ′=0 At−t0−1−τ′Bu(t 0+ τ′). (3)
De (2), a sa´ıda do sistema ser´a
y(t) = CAt−t0x(t 0) + t−t∑0−1 τ′=0 CAt−t0−1−τ′Bu(t 0+ τ′) + Du(t). (4) Definindo τ = t− t0− τ (τ′ = t− t0− τ′), ent˜ao y(t) = CAt−t0x(t 0) + Du(t) + t−t0 ∑ τ =1 CAτ−1Bu(t− τ) (5)
Se, nesta equa¸c˜ao, t0 = 0, x(0) = 0n e se u(t) for um impulso de Dirac, ou seja, se
u(t) =
{
1, t = 0 0, t̸= 0 ,
obtemos a resposta impulsional do sistema dada por
h(t) =
{
D, t = 0
CAt−1B, t > 0
Fazendo t0 → −∞ e x(t0) = 0, vemos que y(t) ´e pode ser calculado a partir da soma de
convolu¸c˜ao y(t) = ∞ ∑ τ =0 h(τ )u(t− τ),
que ´e dependente da sequˆencia de entrada u(k) desde de k = −∞ at´e k = t. A equa¸c˜oes (4) e (5) mostram-nos, por´em, que, para saber a evolu¸c˜ao do sistema a partir de t0 ̸= ∞, s´o
necessitamos de conhecer x(t0) e u(k) a partir desse instante. Deste modo, x(t0) constitui a
mem´oria de todo o comportamento do sistema para t < t0, sendo, por isso, o seu estado no
instante t0 e (1)-(2) o seu modelo de estado.
Exemplo 1 :
O modelo de estado discreto duma massa M em movimento numa superf´ıcie sem atrito ´e
[ x1(t + 1) x2(t + 1) ] = [ 1 1 0 1 ] [ x1(t) x2(t) ] + 1 M [ 1 2 1 ] u(t) (6) [ y1(t) y2(t) ] = [ 1 0 0 1 ] [ x1(t) x2(t) ] (7)
Neste modelo y1(t) = x1(t) ´e a posi¸c˜ao do corpo, y2(t) = x2(t) ´e a sua velocidade e u(t) a for¸ca
que lhe ´e aplicada que se mant´em constante entre dois instantes de amostragem consecutivos. O per´ıodo de amostragem ´e de 1 segundo. Se M = 1000 Kg e se, no instante t = 0 a massa estiver na posi¸c˜ao nula com uma velocidade de 20 m/s (x1(0) = 0 e x2(0) = 20) e lhe for
aplicada uma for¸ca constante de −1000 N (u(t) = −1000 N, t > 0), o corpo p´ara em 20 segundos a uma distˆancia de 200 metros da origem. Se, no entanto, a velocidade no instante inicial for de 40m/s (x1(0) = 0 e x2(0) = 40), a mesma entrada s´o faz parar a massa ao fim
0 5 10 15 20 0 0 200 20 40 400 600 60 d2(t) v2(t) v1(t) d1(t) v(m/s) d(m) t(seg)
Figura 1: Resposta do sistema (6)-(7) para diferentes condi¸c˜oes iniciais. Nesta figura v1(t)
e d1(t) s˜ao, respectivamente, a velocidade e a distˆancia percorrida (y1(t) e y2(t)) quando
xT(0) = [ 0 20 ] e v2(t) e d2(t) as mesmas vari´aveis quando xT(0) = [ 0 40 ]
2
Estabilidade assint´
otica
Se u(t) = 0m, ∀t, o sistema (1)-(2) passa a ser aut´onomo sendo descrito pela equa¸c˜ao
x(t + 1) = Ax(t). (8)
O pontos {x|Ax = x} s˜ao os pontos de equil´ıbrio. Como
Ax = x⇔ Ax − x = 0n ⇔ (A − In) x = 0n,
podemos concluir que o conjunto dos pontos de equil´ıbrio ´e o n´ucleo de A− In. Se esta for tiver caracter´ıstica n (se for n˜ao singular) ent˜ao este conjunto ser´a constitu´ıdo unicamente pela origem. Se for singular, ser´a um subespa¸co de dimens˜ao n− car(A − In). Se largarmos o sistema num estado x(0) = x0, este segue uma traject´oria
x(t) = Atx0 (9)
Defini¸c˜ao 1: O sistema (8) ´e assintoticamente est´avel se, quando largado em qualquer
estado inicial x(0) ∈ IRn, o seu vector de estado x(t) convergir para a origem. Nestas condi¸c˜oes, dizemos, simplesmente, que A ´e uma matriz est´avel.
O teorema de Lyapunov permite-nos verificar se um sistema ´e est´avel.
Teorema 1 (Teorema de Lyapunov): O sistema (8) ´e est´avel se e s´o se qualquer uma
1. Os valores absolutos de todos os valores pr´oprios de A serem inferiores a 1, isto ´e,
|λi(A)| < 1 i = 1, . . . , n (10)
ou
ρ(A) < 1
em que ρ(A) significa raio espectral de A.
2. Se para qualquer Q≻ 0n×n a equa¸c˜ao de Lyapunov
P = ATP A + Q (11)
tem uma ´unica solu¸c˜ao P ≻ 0n×n. Aqui as nota¸c˜oes X ≻ 0n×ne X ≻ Y , para X, Y ∈ IRn×n significam X e X− Y s˜ao,respectivamente, matrizes definidas positivas.
Demonstra¸c˜ao:
1. De (9) conclu´ımos que limt→∞ = 0n se e s´o se (10) se verificar.
2. • Condi¸c˜ao necess´aria: Vectorizando (11) teremos
vec(P ) = (AT ⊗ AT)vec(P ) + vec(Q).
Como esta ´e uma equa¸c˜ao linear em vec(P ), ter´a uma ´unica solu¸c˜ao se In2− AT⊗ AT
for n˜ao singular. Como
λi(In− X) = 1 − λi(X), i = 1, . . . , n, ∀X∈IRn×n
λℓ(X⊗ X) = λi(X)λj(X), ℓ = 1, . . . , n2, i, j = 1, . . . , n, ∀X∈IRn×n
ent˜ao se A for est´avel In2−AT⊗AT ´e n˜ao singular pois n˜ao tem nenhum valor pr´oprio
nulo. Por outro lado, nestas condi¸c˜oes a s´erie
P = ∞ ∑ k=0 ( AT)kQAk
converge e ´e a solu¸c˜ao de (11) pois ATP A + Q = AT ∞ ∑ k=0 ( AT)kQAkA + Q = (AT)0QA0+ ∞ ∑ k=1 ( AT)kQAkA0 = = ∞ ∑ k=0 ( AT)kQAk= P. Como Q≻ 0n×n, ent˜ao P ≻ 0n×n. • Condi¸c˜ao suficiente:
Suponhamos agora que P ≻ 0n×n e que A ´e inst´avel. Isto significa que A tem um valor pr´oprio λ0 tal que ∥λ0| ≥ 0. Se λ0´e valor pr´oprio de A ent˜ao λ∗0, onde∗ significa
conjugado complexo, tamb´em ´e. Por outro lado, se v0 for um vector pr´oprio associado
a λ0, v∗0 ´e um vector pr´oprio associado a λ∗0. Se multiplicarmos (11) `a esquerda por
v0H = (v0T)∗ e `a direita por v0, obtemos
v0HP v0 = v0HA T P Av0+ v0HQv0 = λ∗0v H 0 P v0λ0+ vH0 Qv0 =|λ0|2v0HP v0+ vH0 Qv0 ⇔ ⇔ (1− |λ0| 2) v0HP v0 = vH0 Qv0.
Sendo Q≻ 0n×nent˜ao v0HQv0 > 0 e, consequentemente,
(
1− |λ0|2
)
vH0 P v0 > 0. Como
|λ0| > 1, ent˜ao 1 − |λ0|2 < 0 e v0HP v0 < 0, o que nunca pode acontecer pois, P ´e, por
hip´otese, uma matriz definida positiva (P ≻ 0n×n).
2
Exemplo 2 - Estabilidade dum sistema de ordem 1:
Consideremos o seguinte sistema de primeira ordem x(t + 1) = ax(t) x(t), a ∈ IR
Como a ∈ IR, n = 1 e λ1(a) = a. Logo o sistema ser´a est´avel se e s´o se |a| < 1.
Alterna-tivamente podemos deduzir a condi¸c˜ao de estabilidade da solu¸c˜ao da equa¸c˜ao de Lyapunov que, nestas, condi¸c˜oes, ser´a
p = a2p + q, q > 0.
A solu¸c˜ao desta equa¸c˜ao ´e p = q
e, como q ´e positivo, s´o ser´a positiva se e s´o se a2 < 1 ⇔ |a| < 1, que n˜ao ´e mais do que a condi¸c˜ao de estabilidade obtida pelo crit´erio baseado na localiza¸c˜ao dos valores pr´oprios do sistema no interior do c´ırculo unit´ario.
Exemplo 3 - Estabilidade dum sistema de de ordem 2 com valores pr´oprios
reais e distintos:
Consideremos o seguinte sistema
x(t + 1) = Ax(t), x(t)∈ IR2, A∈ IR2×2
em que λ1 ̸= λ2 s˜ao os valores pr´oprios de A associados aos vectores pr´oprios v1 e v2,
respectivamente. Uma condi¸c˜ao necess´aria e suficiente para que este sistema seja est´avel ´e que solu¸c˜ao P da equa¸c˜ao de Lyapunov
P = ATP A + Q
seja ´unica e definida positiva. Seja T ∈ IR2×2 uma matriz n˜ao singular. Multiplicando ambos os membros desta equa¸c˜ao `a esquerda por TT e ´a direita por T obtemos a seguinte igualdade
TTP T = TTATP AT + TTQT = TTATT−TTTP T T−1AT + TTQT =
= (T−1AT)T (TTP T) (T−1AT)+ TTQT
Definindo ¯P = TTP T , ¯A = T−1AT e ¯Q = TTQT , podemos reescrever esta igualdade na forma
¯
P = ¯ATP ¯A + ¯Q, (12)
e verificar que continua a ser uma equa¸c˜ao de Lyapunov. Como A e ¯A tˆem os mesmos valores pr´oprios, o sistema ser´a est´avel se e s´o se a solu¸c˜ao ¯P desta equa¸c˜ao for ´unica e definida positiva. Se T =[ v1 v2 ] ent˜ao, ¯ A = Λ = [ λ1 0 0 λ2 ] . (13)
Nestas condi¸c˜oes, a solu¸c˜ao de (12) ´e a matriz cuja vectoriza¸c˜ao ´e vec( ¯P ) =(I4− ΛT ⊗ ΛT
)−1
vec( ¯Q) = (I4− Λ ⊗ Λ)−1vec( ¯Q), (14)
pois Λ ´e diagonal. Seja
¯ Q = [ ¯ q11 q¯12 ¯ q12 q¯22 ] . (15)
Como ¯Q ´e definida positiva ent˜ao ¯ q11 > 0 (16) ¯ q22 > 0 (17) det ¯Q = q¯11q¯22− ¯q122 > 0 (18)
pois, sabe-se a verifica¸c˜ao simultˆanea destas desigualdades ´e uma condi¸c˜ao necess´aria e su-ficiente para que uma matriz de R2×2 seja definida positiva. Utilizando as defini¸c˜oes de Λ e Q em (13) e (15), respectivamente, podemos reescrever a express˜ao (14) da vectoriza¸c˜ao de
¯ P , na forma vec( ¯P ) = 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 − λ2 1 0 0 0 0 λ1λ2 0 0 0 0 λ2λ1 0 0 0 0 λ2 2 −1 ¯ q11 ¯ q12 ¯ q12 ¯ q22 = = 1 1−λ2 1 0 0 0 0 1−λ1 1λ2 0 0 0 0 1−λ1 1λ2 0 0 0 0 1−λ1 2 2 −1 ¯ q11 ¯ q12 ¯ q12 ¯ q22 = ¯ q11 1−λ2 1 ¯ q12 1−λ1λ2 ¯ q12 1−λ1λ2 ¯ q22 1−λ2 2 sendo ¯ P = [ q¯ 11 1−λ2 1 ¯ q12 1−λ1λ2 ¯ q12 1−λ1λ2 ¯ q22 1−λ2 2 ]
Atrav´es de (16) e (17) podemos concluir que, se ¯P for definida positiva, ent˜ao |λ1| < 1 e
|λ2| < 1 e, consequentemente, o sistema ´e est´avel. Por outro lado, como
( 1− λ21) (1− λ22)− (1 − λ1λ2)2 =−(λ2− λ1)2 < 0 ⇒ ( 1− λ21) (1− λ22) < (1− λ1λ2)2 e ¯ q11q¯22 > ¯q122
ent˜ao, se |λ1| < 1 e |λ2| < 1 (se o sistema for est´avel) temos
¯ q11q¯22 (1− λ2 1) (1− λ22) > q¯ 2 12 (1− λ1λ2)2
e, consequentemente, ¯P ´e definida positiva. Como P = T−TP T¯ −1, P e ¯P tˆem o mesmo sinal, ou seja, se uma ´e definida positiva a outra tamb´em o ´e e vice-versa.
3
Acessibilidade e Controlabilidade
Nesta sec¸c˜ao iremos estudar a acessibilidade que ´e uma das propriedades mais importantes dos sistemas discretos. Veremos que a controlabilidade que ´e um conceito muito pr´oximo do da acessibilidade. Quando a matriz de estado A ´e n˜ao singular os conceitos de acessibili-dade e controlabiliacessibili-dade s˜ao mesmo equivalentes. Definiremos tamb´em o conceito de sistema estabiliz´avel que, tal como o nome diz, indica-nos se ´e poss´ıvel estabilizar um sistema.
Defini¸c˜ao 2: Acessibilidade.
Um sistema ´e acess´ıvel se a origem puder ser transferida para qualquer estado x1 ∈ IRn
em n per´ıodos de amostragem, ou seja, se existir uma sequˆencia de n entradas u(t0), u(t0+
1), . . . , u(t0+ n− 1) que transfira o sistema do estado x(t0) = 0n para x(n) = x1 em que x1
´
e qualquer estado de Rn.
Defini¸c˜ao 3: Controlabilidade.
Um sistema ´e control´avel se qualquer estado x(t0) = x0 ∈ IRn puder ser transferido para a
origem atrav´es de uma sequˆencia de n entradas u(t0), u(t0+ 1), . . . , u(t0+ n− 1).
Quando o sistema (1)-(2) ´e acess´ıvel dizemos simplesmente que o par (A, B) ´e acess´ıvel. Se for control´avel dizemos, identicamente, que o par (A, B) ´e control´avel.
Teorema 2: As condi¸c˜oes seguintes s˜ao condi¸c˜oes necess´arias e suficientes para que o par
(A, B) seja acess´ıvel
1. car(C) = n ou im(C) = IRn em que C =[ B AB . . . An−1B ]∈ IRn×nm. 2. car([ A− λiIn | B
])
= n, para todos os valores pr´oprios λi de A.
3. Os valores pr´oprios de A− BK, K ∈ IRm×n podem ser alocados arbitrariamente.
Demonstra¸c˜ao: 1. Se fizermos τ′ = t− t0− τ em (3) teremos x(t) = At−t0x(t 0) + t−t0 ∑ τ′=1 Aτ′−1Bu(t− τ′) = = At−t0x(t 0) + [ B AB · · · At−t0−1B ] u(t− 1) u(t− 2) .. . u(t0) =Ct−t0U R to:t−1
em que UR to:t−1 = u(t− 1) u(t− 2) .. . u(t0) . e Ct−t0 = [ B AB · · · At−t0−1B ].
Se partirmos dum estado inicial x(t0) = 0n, o sistema atinge, ao fim de n per´ıodos de
amostragem um estado x1 = x(t0+ n) = CUtR0:t0+n−1. Isto significa que x1 ∈ im(C) e que,
consequentemente, x1 pode ser qualquer ponto de Rn se e s´o se
im(C) = Rn⇔ car(C) = n.
2. • Condi¸c˜ao necess´aria Seja car([ A− λiIn | B
])
= r ≥ n. O subespa¸co gerado pelas colunas desta ma-triz, im([ A− λiIn | B
])
, ter´a ent˜ao dimens˜ao r, sendo n− r a dimens˜ao do seu complemento ortogonal, ker([ A− λiIn | B
])T . Se v∈ ker([ A− λiIn | B ])T , vT [ A− λiIn | B ] = 01×(n+m) (19)
Para que esta condi¸c˜ao se verifique, vT tem que ser ortogonal `as colunas de A− λiIn
e de B, isto ´e { vT(A− λiI n) = 01×n ⇔ vTA = λivT vTB = 01×m ⇒ vTAB = λ ivTB = 01×m vTA2B = λ ivTAB = λ2ivTB = 01×m .. . λivTAkB = λivTAk−1B =· · · = λkivTB = = 01×m .. . Multiplicando vT porC, vTC = vT[ B AB · · · An−1B ] =[ vTB vTAB · · · vTAn−1B ] = = [ 01×m 01×m · · · 01×m ] = 01×nm,
verificamos que v ∈ ker(CT). Logo ker([ A− λiIn | B ]T) ⊆ ker(CT)⇒ ⇒ n − car([ A− λiIn | B ]) ≤ n − car(C) ⇒ ⇒ car (C) ≤ car([ A− λiIn | B ]).
Se (A, B) for acess´ıvel ent˜ao car(CT)= n e, consequentemente,
car([ A− λiIn | B ])= n.
• Condi¸c˜ao suficiente:
Para provar que ´e condi¸c˜ao temos primeiro que transformar o sistema numa forma triangular. Os detalhes desta demonstra¸c˜ao podem ser vistos na sec¸c˜ao 2.4.3 de Kailath (1980).
3. Ver Kailath (1980).
2
De acordo com a defini¸c˜ao, um sistema ´e control´avel se, para qualquer estado inicial x(t0) =
x0 ∈ IRn, existir um vector −UtR0:t0+n que seja a solu¸c˜ao da equa¸c˜ao
x(t0+ n) = Anx0− CUtR0:t0+n−1 = 0n⇔ A
nx
0 =CUtR0:t0+n−1
Esta equa¸c˜ao mostra-nos que o sistema ´e control´avel se e s´o , Anx
0 ∀x0∈IRn pertencer `a
imagem de C, ou seja, se e s´o se,
im(A) ⊆ im(C) (20)
Se A for n˜ao singular e o sistema control´avel, ent˜ao car (C) = n e o sistema tamb´em ´e acess´ıvel. Conclu´ımos, assim, que os conceitos de Controlabilidade e de Acessibilidade s˜ao equivalentes quando A n˜ao ´e singular. Por outro lado, podemos ver facilmente que
Acessibilidade ⇒ Controlabilidade, qualquer que seja A. No entanto, se A for n˜ao
singular, o sistema pode n˜ao ser acess´ıvel e ser control´avel desde que a condi¸c˜ao (20) se verifique.
O facto de um sistema n˜ao ser acess´ıvel n˜ao significa que todos os estados sejam
in-acess´ıveis. Como, para x(t0) = 0n,
podemos sempre transferir o sistema da origem para qualquer estado de im(C) em n per´ıodos de amostragem. A imagem de C ser´a, ent˜ao, o conjunto dos estados acess´ıveis. Como este conjunto ´e um subespa¸co, ´e natural que exista uma representa¸c˜ao em que o conjunto dos estados acess´ıveis seja definido por nc vari´aveis de estado (nc = car(C)) e o seu complemento
ortogonal definido pelas n− nc restantes. Esta possibilidade ´e confirmada pelo seguinte teorema
Teorema 3: Se o par (A, B) n˜ao for acess´ıvel tal que car(C) = nc < n, ent˜ao existe uma matriz T n˜ao singular tal que
¯ A = T−1AT = [ ¯ A11 A¯12 0n−nc×nc A¯22 ] ¯ B = T−1B = [ ¯ B1 0n−nc×m ] Demonstra¸c˜ao: Sejam C = [ B AB · · · An−1B ] e ¯ C = [ B¯ A ¯¯B · · · ¯An−1B¯ ] = = [ T−1B | T−1AT T−1B | · · · | T−1An−1T T−1B ] = = [ T−1B T−1AB · · · T−1An−1B ] = T−1[ B AB · · · An−1B ] = T−1C as matrizes de controlabilidade dos pares (A, B) e ( ¯A, ¯B), respectivamente. Como
¯ A ¯B = [ ¯ A11 A¯12 0n−nc×nc A¯22 ] [ ¯ B1 0n−nc×m ] = [ ¯ A11B¯1 0n−nc×m ] ¯ A2B =¯ A¯(A ¯¯B)= [ ¯ A11 A¯12 0n−nc×nc A¯22 ] [ ¯ A11B¯1 0n−nc×m ] = [ ¯ A211B¯1 0n−nc×m ] .. . ¯ AkB =¯ A¯(A¯k−1B¯)= [ ¯ A11 A¯12 0n−nc×nc A¯22 ] [ ¯ Ak11−1B¯1 0n−nc×m ] = [ ¯ Ak 11B¯1 0n−nc×m ] , ent˜ao ¯ C = T−1C =[ B¯1 A¯11B¯1 . . . A¯n11−1B¯1 0n−nc×m 0n−nc×m 0n−nc×m 0n−nc×m ] .
A decomposi¸c˜ao em valores singular (svd) de C ´e
onde S = [ S+ 0nc×nm−nc 0n−nc×nc 0n−nc×nm−nc ] V = [ Vnc Vn−nc ] com S+ = σ1 0 · · · 0 0 σ2 · · · 0 .. . ... . .. ... 0 0 · · · σn−nc Vnc = [ v1 v2 · · · vnc ] Vn−nc = [ vnc+1 vnc+2 · · · vn ] Se fizermos T = U temos T−1C = UTU SVT = [ S+ 0nc×nm−nc 0n−nc×nc 0n−nc×nm−nc ] [ VT nc VnT−nc ] = [ S+VnTc 0n−nc×mn ] = = [ ¯ B1 A¯11B¯1 . . . A¯n11−1B¯1 0n−nc×m 0n−nc×m 0n−nc×m 0n−nc×m ] = ¯C. 2
Este teorema permite-nos dividir este sistema em dois: Um acess´ıvel e outro n˜ao acess´ıvel. A sua demonstra¸c˜ao sugere uma forma de obtermos esta separa¸c˜ao que sistematizamos no seguinte algoritmo.
Algoritmo 1: Determina¸c˜ao do subsistema control´avel
• Entrada: Par (A, B)
• Sa´ıda: Transforma¸c˜ao de Similaridade T
1. Calcular a Matriz da Controlabilidade C =[ B AB · · · An−1B ]. 2. Efectuar a decomposi¸c˜ao em valores singulares (svd) de C = USVT 3. Fazer T = U .
Exemplo 4 - Determina¸c˜ao do subsistema control´avel num sistema de 2a or-dem
Consideremos o seguinte sistema x(t + 1) = [ 1.4 0.48 −1 0 ] x(t) + [ −0.6 1 ] u(t) y(t) = [ 1 0.8 ]x(t).
A sua matriz da controlabilidade ´e C = [ [ −0.6 1 ] [ 1.4 0.48 −1 0 ] [ −0.6 1 ] ] = [ −0.6 −0.36 1 0.6 ] .
Como det(C) = 0 a sua caracter´ıstica ´e 1 e, consequentemente, o sistema n˜ao ´e acess´ıvel. Os valores pr´oprios deste sistema s˜ao λ1 = 0.6 e λ2 = 0.8. Como
car {[ [ 1.4 0.48 −1 0 ] − λ2 [ 1 0 0 1 ] [ −0.6 1 ] ]} = car {[ 0.6 0.48 −0.6 −1 −0.8 1 ]} = 1 O modo λt2 = 0.8t n˜ao ´e acess´ıvel.
Efectuando a decomposi¸c˜ao em valores singulares de C, C = USVT = [ −0.5145 0.8575 0.8575 0.5145 ] [ 1.36 0 0 0 ] [ 0.8575 0.5145 0.5145 −0.8575 ]
e fazendo a mudan¸ca de coordenadas
¯ x(t) = [ ¯ xc(t) ¯ x¯c(t) ] = T−1x(t) com T = U =[ Uc Ur ] = [ −0.5145 0.8575 0.8575 0.5145 ] obtemos a representa¸c˜ao [ ¯ xc(t + 1) ¯ xc¯(t + 1) ] = [ 0.6 −1.48 0 0.8 ] [ ¯ xc(t) ¯ x¯c(t) ] + [ 1.1662 0 ] u(t) y(t) = [ 0.1715 1.2691 ] [ ¯xc(t) ¯ x¯c(t) ]
Onde o eixo ¯xc constitui o subespa¸co dos estados acess´ıveis e ¯x¯c o seu complemento ortogonal. Dado que a matriz de estado ¯A ´e triangular inferior, os elementos da sua diagonal principal s˜ao os valores pr´oprios do sistema. Por outro lado, uma vez que o segundo elemento do
+ 0.6 −1.48 0.8 1.2691 0.1715 1.1662 y(t) + + z−1 z−1 ¯ xc(t + 1) x¯c(t) ¯ x¯c(t + 1) x¯c¯(t) u(t) + +
Figura 2: Representa¸c˜ao dum sistema de 2a ordem com separa¸c˜ao dos subsistemas acess´ıvel
e n˜ao acess´ıvel.
vector de controlo ¯B ´e nulo, confirmamos que [ ¯A]22= λ2 = 0.8 ´e o valor pr´oprio cujo modo
n˜ao ´e acess´ıvel (ver fig. 2). Se trocarmos a ordem das colunas de T , isto ´e, se fizermos T1 = [ Ur Uc ] = [ 0.8575 −0.5145 0.5145 0.8575 ] , obtemos a permuta¸c˜ao [ x¯T ¯ c x¯Tc ]T
do vector de estado a que corresponde o seguinte modelo
[ ¯ xc¯(t + 1) ¯ xc(t + 1) ] = [ 0.8 0 −1.48 0.6 ] [ ¯ x¯c(t) ¯ xc(t) ] + [ 0 1.1662 ] u(t) y(t) = [ 1.2691 0.1715 ] [ ¯x¯c(t) ¯ xc(t) ]
4
Observabilidade
Nos sistemas que estamos a considerar os ´unicos sinais acess´ıveis ao exterior (medidos) s˜ao a entrada u(t) e a sa´ıda y(t). No entanto, muitas vezes tamb´em estamos interessados em conhecer as suas vari´aveis de estado. Se o sistema for observ´avel podemos estimar estas vari´aveis sem ter necessidade de colocar outros sensores.
Defini¸c˜ao 4: Dizemos que um sistema ´e observ´avel se o seu estado inicial for recuper´avel das n primeiras observa¸c˜oes da sa´ıda y(0), y(1),. . . ,y(n− 1). Nestas condi¸c˜oes dizemos que o par (C, A) ´e observ´avel.
O pr´oximo teorema diz-nos em que condi¸c˜oes ´e que um sistema ´e observ´avel.
Teorema 4: As condi¸c˜oes seguintes s˜ao condi¸c˜oes necess´arias e suficientes para que o par
1. car(O) = n ou im(O) = IRn em que O = C CA .. . CAn−1 ∈ IR nℓ×n . 2. car ([ A− λiIn C ])
= n, para todos os valores pr´oprios λi de A.
3. Os valores pr´oprios de A− LC, L ∈ IRn×ℓ podem ser alocados arbitrariamente.
Demonstra¸c˜ao:
1. Vimos anteriormente que, para t0=0,
x(t) = Atx(0) +CtU0:tR−1 = Atx(0) +[ B AB · · · At−1B ] u(t− 1) u(t− 2) .. . u(0) . Se definirmos CR t = [ At−1B · · · AB B ] e Ut −1 u(0) u(1) .. . u(t− 1) podemos escrever x(t) = Atx(0) +CRUt−1. Como y(t) = Cx(t) + Du(t) = CAtx(0) +[ CCtR D ]Ut,
ent˜ao
y(0) = Cx(0) + Du(0) =
= Cx(0) +[ D 0 0 · · · 0 ]Un−1
y(1) = CAx(0) +[ CC1R D ]U1 = CAx(0) + CBu(0) + Du(1) =
= [ CB D 0 · · · 0 ]Un−1
y(2) = CA2x(0) +[ CC1R D ]U2 = CA2x(0) + CABu(0) + CBu(1) + Du(2) =
= [ CAB CB D · · · 0 ]Un−1 .. . y(n− 1) = CAn−1x(0) +[ CC1R D ]Un−1 = = CAn−1x(0) +[ CAn−2B CAn−3B CAn−4 · · · D ]Un −1.
Este sistema de equa¸c˜oes pode ser escrito na forma matricial
Yn−1 =Ox(0) + HnUn−1 ⇔ Ox(0) = Yn−1− HnUn−1 (21)
onde O foi definido anteriormente e
Hn = D 0 0 · · · 0 CB D 0 · · · 0 CAB CB D · · · 0 .. . ... ... . .. ... CAn−2B CAn−3B CAn−4 · · · D .
Como o n´umero ℓn de linhas de O ´e maior ou igual ao seu n´umero n de colunas, ent˜ao, se car(O) = n, o seu pseudo-inverso ser´a O† =(OTO)−1OT e O†O = In. Podemos ent˜ao
determinar x(0) multiplicando `a esquerda ambos os membros da ´ultima equa¸c˜ao de (21) por O†, ou seja
x(0) = O†(Yn−1− HnUn−1) =
(
OTO)−1OT
(Yn−1− HnUn−1) .
Se O n˜ao tiver caracter´ıstica n, ent˜ao O†O ∈ IRn×n ´e singular e, consequentemente, (21) tem uma infinidade de solu¸c˜oes n˜ao sendo, por isso, poss´ıvel determinar x(0).
2. e 3. Se definirmos o sistema
xd(t + 1) = ATxd(t) + CTu(t) yd(t) = BTxd(t)
verificamos que existe uma dualidade entre os conceitos de controlabilidade e observabili-dade. Esta dualidade significa que a observabilidade do par (C, A) ´e equivalente `a contro-labilidade de (AT, CT). Deste modo, todas as condi¸c˜oes deste teorema s˜ao equivalentes `as
do teorema 2.
2
Nos sistemas n˜ao observ´aveis s´o n˜ao ´e poss´ıvel determinar as componentes do estado inicial situadas no n´ucleo da matriz de observabilidade O. Por este motivo, este subespa¸co ´e designado por subespa¸co dos estados n˜ao observ´aveis. O pr´oximo teorema mostra-nos que ´
e poss´ıvel determinar uma representa¸c˜ao de estado em que o subespa¸co dos estados n˜ao observ´aveis ´e gerado por eixos da base can´onica, o que nos permite dividir o sistema em dois subsistemas: um observ´avel e outro n˜ao observ´avel.
Teorema 5: Se o par (C, A) n˜ao for observ´avel tal que car(O) = no < n, ent˜ao existe uma matriz T n˜ao singular tal que
¯ A = T−1AT = [ ¯ A11 0no×n−no ¯ A21 A¯22 ] ¯ C = CT =[ C¯1 0ℓ×n−no ] Demonstra¸c˜ao: Sejam O = C CA .. . CAn−1 e ¯ O = ¯ C ¯ C ¯A .. . ¯ C ¯An−1 = CT CT T−1AT .. . CT T−1An−1T = CT CAT · · · CAn−1T = C CA · · · CAn−1 = CT
as matrizes de observabilidade dos pares (C, A) e ( ¯C, ¯A), respectivamente. Como ¯ C ¯A = [ C¯1 0ℓ×n−no ] [ ¯A11 0no×n−no ¯ A21 A¯22 ] =[ C ¯¯A11 0ℓ×n−no ] ¯ C ¯A2 = (C ¯¯A)A =¯ [ C ¯¯A11 0ℓ×n−no ] [ ¯A11 0ℓ×n−no ¯ A21 A¯22 ] =[ C ¯¯A211 0ℓ×n−no ] .. . ¯ C ¯Ak = (C ¯¯Ak−1)A =¯ [ C ¯¯Ak11−1 0ℓ×n−no ] [ ¯A11 0ℓ×n−no ¯ A21 A¯22 ] = = [ C ¯¯Ak11 0ℓ×n−no ] , ent˜ao ¯ O = ¯ C 0ℓ×n−no ¯ C ¯A11 0ℓ×n−no .. . ... ¯ C ¯An11−1 0ℓ×n−no =OT.
A decomposi¸c˜ao em valores singulares (svd) de O ´e
O = USVT onde S = [ S+ 0no×n−no 0ℓn−no×no 0ℓn−no×n−no ] U = [ Uno Un−no ] com S+ = σ1 0 · · · 0 0 σ2 · · · 0 .. . ... . .. ... 0 0 · · · σn−no Uno = [ u1 u2 · · · uno ] Un−no = [ uno+1 uno+2 · · · un ] Se fizermos T = V
temos OT = USVTV = U S =[ U no Un−no ] [ S+ 0no×n−no 0ℓn−no×no 0ℓn−no×n−no ] = = [ UnoS+ 0ℓn×n−no ] = ¯ C 0ℓ×n−no ¯ C ¯A11 0ℓ×n−no .. . ... ¯ C ¯An11−1 0ℓ×n−no = ¯O. 2
No algoritmo seguinte sistematizamos a divis˜ao dum sistema num subsistema observ´avel e noutro n˜ao observ´avel.
Algoritmo 2: Determina¸c˜ao do subsistema observ´avel
• Entrada: Par (C, A)
• Sa´ıda: Transforma¸c˜ao de Similaridade T
1. Calcular a Matriz da Observabilidade O =
C CA .. . CAn−1 .
2. Efectuar a decomposi¸c˜ao em valores singulares (svd) de O = USVT 3. Fazer T = V .
Exemplo 5 - Determina¸c˜ao do subsistema observ´avel num sistema de 2a ordem
Consideremos o seguinte sistema
x(t + 1) = [ 1.4 0.48 −1 0 ] x(t) + [ −0.8 1 ] u(t) y(t) = [ 1 0.6 ]x(t).
A sua matriz da observabilidade ´e
O = [ 1 0.6 ] [ 1 0.6 ] [ 1.4 0.48 −1 0 ] = [ 1 0.6 0.8 0.48 ] .
Como det(O) = 0 a sua caracter´ıstica ´e 1 e, consequentemente, o sistema n˜ao ´e observ´avel. Recordemos que os valores pr´oprios deste sistema s˜ao λ1 = 0.6 e λ2 = 0.8. Como
car [ 1.4 0.48 −1 0 ] − λ1 [ 1 0 0 1 ] [ 1 0.6 ] = car 0.8−1 −0.60.48 1 0.6 = 1
O modo λt1 = 0.6t n˜ao ´e observ´avel.
Efectuando a decomposi¸c˜ao em valores singulares de O, O = USVT = [ −0.7809 −0.6247 −0.6247 0.7809 ] [ 1.4835 0 0 0 ] [ −0.8575 −0.5145 −0.5145 0.8575 ]
e fazendo a mudan¸ca de coordenadas
¯ x(t) = [ ¯ xo(t) ¯ x¯o(t) ] = T−1x(t) com T = V =[ Vo Vr ] = [ −0.8575 −0.5145 −0.5145 0.8575 ] obtemos a representa¸c˜ao [ ¯ xo(t + 1) ¯ xo¯(t + 1) ] = [ 0.8 0 1.48 0.6 ] [ ¯ xo(t) ¯ xo¯(t) ] + [ −0.1715 −1.2691 ] u(t) y(t) = [ 1.1662 0 ] [ ¯xo(t) ¯ xo¯(t) ]
Onde o eixo ¯x¯o constitui o subespa¸co dos estados n˜ao observ´aveis e ¯xo o seu complemento
¯ xo¯(t + 1) 0.8 1.48 1.1662 0.6 −0.1715 −1.2691 + + z−1 z−1 ¯ xo(t + 1) x¯o(t) ¯ xo¯(t) + + + y(t) u(t)
Figura 3: Representa¸c˜ao dum sistema de 2aordem com separa¸c˜ao dos subsistemas observ´avel
e n˜ao observ´avel.
principal s˜ao os valores pr´oprios do sistema. Por outro lado, uma vez que o segundo elemento de ¯C ´e nulo, confirmamos que [ ¯A]22= λ1 = 0.6 ´e o valor pr´oprio cujo modo n˜ao ´e acess´ıvel
(ver fig. 3).
Se trocarmos a ordem das colunas de T , isto ´e, se fizermos T1 = [ Vr Vo ] = [ −0.5145 −0.8575 0.8575 −0.5145 ]
obtemos a permuta¸c˜ao [ x¯To¯ x¯To ]T do vector de estado a que corresponde o seguinte modelo
[ ¯ xo¯(t + 1) ¯ xo(t + 1) ] = [ 0.6 1.48 0 0.8 ] [ ¯ xo¯(t) ¯ xo(t) ] + [ −1.2691 −0.1715 ] u(t) y(t) = [ 0 1.1662 ] [ ¯xo¯(t) ¯ xo(t) ] .
5
Decomposi¸
c˜
ao Can´
onica de Kalman
u(t) Sco¯ S¯c¯o Sc¯o D Sco y(t)
Figura 4: Decomposi¸c˜ao can´onica de Kalman.
Se decompusermos um sistemaS em dois subsistemas, um acess´ıvel e outro n˜ao acess´ıvel, e, se cada um destes sistemas for dividido em subsistemas observ´aveis e n˜ao observ´aveis, obtemos a decomposi¸c˜ao can´onica de kalman, representada na figura 4, e que ´e constitu´ıda pelos seguintes subsistemas
• Sco, control´avel e observ´avel
• Sc¯o, control´avel e n˜ao observ´avel • Sc¯¯o, n˜ao control´avel e n˜ao observ´avel
• Soc¯ , n˜ao control´avel e observ´avel
Esta decomposi¸c˜ao ´e formalizada pelo seguinte teorema.
Teorema 6 : Decomposi¸c˜ao can´onica de Kalman
Um sistema S = (A, B, C, D), com A ∈ IRn×n, B ∈ IRn×m, C ∈ IRℓ×n e D ∈ IRℓ×m, pode ser representado na forma ¯ xc¯o(t + 1) ¯ xco(t + 1) ¯ x¯c¯o(t + 1) ¯ x¯co(t + 1) = ¯ A11 A¯12 A¯13 A¯14 0nco×nc¯o A¯22 A¯23 A¯24 0nc¯¯o×nc¯o 0n¯c¯o×nco A¯33 A¯34 0nco¯ ×nc¯o 0n¯co×nco 0n¯co×n¯c¯o A¯44 ¯ xc¯o(t) ¯ xco(t) ¯ x¯c¯o(t) ¯ x¯co(t) + ¯ B1 ¯ B2 0n¯c¯o×m 0n¯co×m u(t) y(t) = [ 0ℓ×nc¯o C¯2 0ℓ×n¯c¯o C¯4 ] ¯ xc¯o(t) ¯ xco(t) ¯ x¯c¯o(t) ¯ x¯co(t) + Du(t) (22) onde
• xc¯o(t)∈ IRnc¯o ´e acess´ıvel mas n˜ao observ´avel; • xco(t)∈ IRnco ´e acess´ıvel e observ´avel;
• xc¯¯o(t)∈ IRn¯c¯o ´e n˜ao acess´ıvel e n˜ao observ´avel; • xco¯ (t)∈ IRn¯co ´e n˜ao acess´ıvel e observ´avel;
• nc¯o+ nco+ n¯c¯o+ nco¯ = n.
Demonstra¸c˜ao:
Utilizando o algoritmo 1 calculemos uma matriz de similaridade T1 ∈ IRn×nque nos permita
obter a representa¸c˜ao [ xc(t + 1) xc¯(t + 1) ] = [ ¯ Acc A¯c¯c 0n¯c×nc A¯¯c¯c ] [ xc(t) xc¯(t) ] + [ ¯ Bc 0n¯c×m ] u(t) y(t) = [ C¯c C¯¯c ] [ xc(t) x¯c(t) ]
onde xc(t)∈ IRnc ´e acess´ıvel, x¯c(t)∈ IRn¯c ´e n˜ao acess´ıvel e nc+ n¯c = n. Calculemos a seguir
as matrizes da observabilidade ¯Oc e ¯O¯c dos subsistemas acess´ıvel e n˜ao acess´ıvel xc(t + 1) = A¯ccxc(t) + ¯Bcu(t)
e xc¯(t + 1) = A¯¯c¯cxc¯(t) y(t)¯c = C¯¯cxc¯(t), respectivamente. Sejam nco = car( ¯Oc) nc¯o = nc− nco n¯co = car( ¯Oc¯) n¯c¯o = nc− n¯co.
Efectuemos, agora, as decomposi¸c˜oes em valores singulares de ¯Oc e ¯O¯c,
¯ Oc = UcSc [ VT co VT c¯o ] ¯ O¯c = Uc¯Sc¯ [ V¯coT VT ¯ c¯o ]
em que Vco∈ IRnc×nco e V¯co∈ IRn¯c×nco¯ s˜ao, respectivamente, bases ortonormais para im( ¯OTc)
e im( ¯OT
¯
c), respectivamente, sendo Vc¯o ∈ IRnc×nc¯o e V¯c¯o ∈ IRnc¯×n¯c¯o bases ortonormais dos seus
n´ucleos (ker( ¯Oc) e ker( ¯O¯c)). Notemos que nco+ nc¯o = nc e que nco¯ + n¯c¯o = n¯c. Se definirmos Tc = [ Vc¯o Vco ] ∈ IRnc×nc, ent˜ao ¯ OcTc = UcSc [ VT co Vc¯To ] [ Vc¯o Vco ] =[ Uco Uc¯o ] [ S+ 0nco×nc¯o 0nc¯o×nco 0nc¯o×nc¯o ] [ VT coVc¯o VcoTVco Vc¯ToVc¯o Vc¯ToVco ] = = [ UcoS+ 0nco×nc¯o ] [ 0nco×nc¯o Inco×nco Inc¯o×nc¯o 0nc¯o×nco ] =[ 0nco×nc¯o UcoS+ ] .
Isto significa que
Tc−1AccTc¯ = [ ¯ A11 A¯12 0nc¯o×nc¯o A¯22 ] (23) Tc−1B¯c = [ ¯ B1 ¯ B2 ] (24) ¯ CcTc = [ 0ℓ×nc¯o C¯2 ] . (25)
Pode-se provar, de forma idˆentica, que para
T¯c =
[
V¯c¯o Vco¯
]
tem-se T¯c−1Ac¯¯cTc¯ = [ ¯ A33 A¯34 0nco¯ ×nc¯¯o A44 ] (26) ¯ C¯cTc¯ = [ 0ℓ×n¯c¯o C¯4 ] . (27) Definindo T2 = [ Tc 0nc×nc¯ 0n¯c×nc T¯c ] , teremos ¯ A = T2−1 [ ¯ Acc A¯c¯c 0nc¯×nc A¯¯c¯c ] T2 = [ Tc−1 0nc×n¯c 0nc¯×nc T¯c−1 ] [ ¯ Acc A¯c¯c 0n¯c×nc A¯¯c¯c ] [ Tc 0nc×nc¯ 0n¯c×nc T¯c ] = = [ Tc−1A¯ccTc Tc−1Ac¯cT¯c 0n¯c×nc T −1 ¯ c A¯¯c¯cT¯c¯c ] . fazendo Tc−1Ac¯cTc¯= [ ¯ A13 A¯14 ¯ A23 A¯24 ] ∈ IRnc×nc¯¯o+nco¯ ,
de (23) e (26), e uma vez que 0n¯c×nc = [ 0n¯c¯o×nc¯o 0n¯c¯o×nco 0n¯co×nc¯o 0n¯co×nco ] , podemos escrever ¯ A = ¯ A11 A¯12 A¯13 A¯14 0nco×nc¯o A¯22 A¯23 A¯24 0n¯c¯o×nc¯o 0nc¯¯o×nco A¯33 A¯34 0n¯co×nc¯o 0nco¯ ×nco 0n¯co×nc¯¯o A¯44 . Por outro lado,
T2−1 [ ¯ Bc 0nc ] = [ Tc−1 0nc×n¯c 0n¯c×nc T −1 ¯ c ] [ ¯ Bc 0nc ] = [ Tc−1B¯c 0nc ] = ¯ B1 ¯ B2 0nc¯¯o 0nco¯ e [ ¯ Cc C¯¯c ] T2 = [ ¯ Cc C¯¯c ] [ Tc 0nc×nc¯ 0n¯c×nc T¯c ] =[ C¯cTc C¯¯cT¯c ] = = [ 0ℓ×nc¯o C¯2 0ℓ×nc¯¯o C¯4 ] .
Conclu´ımos, ent˜ao, que se fizermos a mudan¸ca de vari´avel ¯x = T−1x com T = T2T1, obtemos
a decomposi¸c˜ao can´onica de Kalman dada por (22), ficando assim completa a demonstra¸c˜ao.
2
A demonstra¸c˜ao deste teorema sugere-nos o seguinte algoritmo para efectuar a decomposi¸c˜ao can´onica de Kalman:
Algoritmo 3: Determina¸c˜ao duma decomposi¸c˜ao can´onica de Kalman
• Entrada: Sistema (A, B, C), A ∈ IRn×n
, B ∈ IRn×m e C ∈ IRℓ×n. • Sa´ıda: Matriz de Transforma¸c˜ao de Similaridade T ∈ IRn×n
1 - Calcular a Matriz da Controlabilidade C =[ B AB · · · An−1B ]. 2 - Fazer nc = car(C) e n¯c = n− nc.
3 - Efectuar a decomposi¸c˜ao em valores singulares (svd) de C = USVT 4 - Fazer T1 = U e calcular [ ¯ Acc A¯c¯c 0n¯c×nc A¯¯c¯c ] = T1AT1T (T1 ´e ortonormal logo T1−1 = T T 1 ) T1TB = [ ¯ Bc 0nc¯×m ] CT1 = [ ¯ Cc C¯c¯ ] com ¯Acc ∈ IRnc×nc, ¯Ac¯c ∈ IRnc×nc¯, ¯A¯c¯c ∈ IRn¯c×nc¯, ¯Bc ∈ IRnc×m, ¯Cc ∈ IRℓ×nc e ¯ C¯c ∈ IRℓ×n¯c. 5 - Calcular ¯ Oc = ¯ Cc ¯ CcA¯cc .. . ¯ CcA¯nccc−1 ∈ IR ℓnc×nc
6 - Fazer nco = car( ¯Oc) e nc¯o= nc− nco.
7 - Efectuar a svd de ¯Oc, ¯ Oc = UcSc [ VT co VT c¯o ] com Vco ∈ IRnc×nco e Vc¯o ∈ IRnc×nco¯ . 8 - Fazer Tc = [ Vc¯o Vco ] ∈ IRnc×nc. 9 - Calcular ¯ O¯c = ¯ Cc¯ ¯ C¯cA¯c¯¯c .. . ¯ C¯cA¯n¯c¯cc−1 ∈ IRℓn¯c×nc¯
10 - Fazer nco¯ = car( ¯O¯c) e n¯c¯o= n¯c− nco.¯ 11 - Efectuar a svd de ¯O¯c, ¯ O¯c = Uc¯Sc¯ [ VT ¯ co V¯c¯To ] com V¯co∈ IRnc¯×n¯co e V¯c¯o ∈ IRn¯c×nc¯¯o. 12 - Fazer T¯c = [ V¯c¯o Vco¯ ] ∈ IRnc¯×n¯c. 13 - Fazer T2 = [ Tc 0nc×n¯c 0n¯c×ncT¯c ] ∈ IRm×n T = T1T2
6
Fun¸
c˜
oes de Transferˆ
encia e Realiza¸
c˜
oes M´ınimas
Vimos, anteriormente, que a resposta impulsional dum sistema S = (A, B, C, D) ´e
h(t) =
{
D, t = 0 CAt−1B t > 0
Os elementos desta sequˆencia, h(0) = D e h(t) = CAt−1B, t = 1, 2, . . . s˜ao habitualmente
designados por parˆametros de Markov. A fun¸c˜ao de transferˆencia do sistema ´e a trans-formada z da sua resposta impulsional, ou seja
H(z) = ∞ ∑ t=0 h(t)z−t = D + ∞ ∑ t=1 CAt−1Bz−1
A partir de (1) e (2) tamb´em podemos chegar a
H(z) = C(zIn− A)−1B + D.
Pode-se verificar facilmente que S e ST = (T−1AT, T−1B, CT, D) onde T ´e uma matriz
n×n com caracter´ıstica n, tˆem a mesma resposta impulsional e, consequentemente, a mesma
fun¸c˜ao de transferˆencia. Vemos, assim, que uma fun¸c˜ao de transferˆencia pode ser represen-tada por uma infinidade de modelos de estado. Chamamos, a cada um desses modelos de estado, uma realiza¸c˜ao de H(s). A dimens˜ao das diferentes realiza¸c˜oes tamb´em n˜ao ´e ´unica. No entanto, cada realiza¸c˜ao tem que ter uma dimens˜ao superior ou igual a um determinado
limite inferior. Quando a dimens˜ao de uma realiza¸c˜ao ´e igual a esse limite dizemos que essa realiza¸c˜ao ´e m´ınima. Segue-se um teorema que caracteriza as realiza¸c˜oes m´ınimas.
Teorema 7: Uma realiza¸c˜ao (A, B, C, D) de H(z) ´e m´ınima se e s´o se os pares (A, B) e
(A, C) forem simultaneamente acess´ıvel e observ´avel, respectivamente. SeS1 = (A1, B1, C1, D1)
e S2 = (A2, B2, C2, D2) forem realiza¸c˜oes m´ınimas de ordem n da mesma fun¸c˜ao de
trans-ferˆencia H(z), ent˜ao existe uma matriz n˜ao singular T ∈ IRn×n tal que A2 = T−1A1T
B2 = T−1B1
C2 = C1T
D2 = D1
Demonstra¸c˜ao: ver Katayama
2
7
Realiza¸
c˜
oes Equilibradas
Vimos, na sec¸c˜ao anterior, que o n´umero de realiza¸c˜oes de uma fun¸c˜ao de transferˆencia ´
e infinito. No entanto, existem umas que, por um motivo ou por outro, assumem uma particular importˆancia. Entre estas podemos destacar as realiza¸c˜oes
• Can´onica Control´avel; • Can´onica Observ´avel • Diagonal
• etc.
Nesta sec¸c˜ao vamos estudar as realiza¸c˜oes equilibradas. Estas realiza¸c˜oes s˜ao numerica-mente robustas e facilitam a aproxima¸c˜ao de um sistema por modelos de ordem inferior, as suas vari´aveis de estado definem a subespa¸cos com graus de acessibilidade e observabilidade equivalentes. Os graus de acessibilidade e observabilidade podem ser definidos a partir dos Gramianos da Controlabilidade e Observabilidade, respectivamente.
Defini¸c˜ao 5: Se (A, B, C, D) for uma realiza¸c˜ao est´avel ent˜ao as solu¸c˜oes P e Q das equa¸c˜oes de Lyapunov
P = AP AT + BBT
Q = ATQA + CTC
s˜ao, respectivamente, os Gramianos da Controlabilidade e da Observabilidade.
O teorema seguinte mostra-nos que os gramianos da controlabilidade e da obervabilidade permitem testar a acessibilidade e a observabilidade de um sistema
Teorema 8: Se A for est´avel, ent˜ao,
(A, B) acess´ıvel ⇔ P ≻ 0n×n (28)
(C, A) observ´avel ⇔ Q ≻ 0n×n (29)
Demonstra¸c˜ao:
Vimos, anteriormente, que, se A for est´avel, a solu¸c˜ao de (28) ´e
P = ∞ ∑ i=1 AiBBT (AT)i =[ B AB · · · AiB · · · ] BT BTAT .. . BT (AT)i .. . =C∞C∞T onde C∞=[ B AB · · · AiB · · · ] ´
e a matriz da controlabilidade alargada a um horizonte infinito. Esta express˜ao mostra-nos que car(P ) = car(C∞). Por outro lado, sabemos que, como consequˆencia do teorema de CayleyHamilton, para A∈ IRn×n e i ≥ n, Ai ´e uma combina¸c˜ao linear das n− 1 primeiras potˆencias de A, isto ´e,
Ai = α0In+ α1A +· · · + αn−1An−1, i≥ n, αk ∈ IR, k = 0, . . . , n − 1. (30)
Daqui resulta que os blocos de colunas AiB, i = n, n + 1, . . . , de C
∞ sejam combina¸c˜oes
lineares de AkB, k = 0, . . . , n− 1, ou seja, dos seus n primeiros blocos de colunas. Deste
car(C∞) = car(C) e que, consequentemente, car(P ) = car(C). Logo, o par (A, B) s´o ´e acess´ıvel se e s´o se car(P ) = n o que ´e equivalente a P ≻ 0n×n pois, sendo A est´avel,
P ´e sempre uma matriz n˜ao negativa. A dualidade entre os conceitos de observabilidade e acessibilidade anteriormente referidas, juntamente com os argumentos que acabamos de expor, permitem-nos provar a afirma¸c˜ao (29) e que Q = OT
∞O∞ onde O∞= C CA CA2 .. . CAi .. . . 2
Recordemos que, partindo dum estado inicial nulo, o sistema (A, B, C, D) atingir´a, no in-stante t > t0, o estado x(t) = Ct−t0UtRo:t−1 onde UR to:t−1 = u(t− 1) u(t− 2) .. . u(t0) Ct−t0 = [ B AB · · · At−t0−1 ]. Se t0 → −∞, teremos x(t) =C∞U∞R
onde U∞R ´e a matriz de cauda infinita
UR ∞ = u(t− 1) u(t− 2) .. . . Calculemos agora
x(t)TP−1x(t) = (C∞U∞R)T(C∞C∞T)−1(C∞U∞R) = U∞RT C∞T (C∞C∞T)−1C∞U∞R. (31) Fazendo a svd deC∞,
podemos verificar que CT ∞ ( C∞C∞T )−1C ∞= V VT.
o que nos permite rescrever (31) na forma
x(t)TP−1x(t) = U∞RT V VTU∞R =(VTU∞R)T (VTU∞R)= VTU∞R 2
2.
Ora, sendo V uma matriz ortonormal, VT ´e um alinhador, isto ´e, uma matriz que, na transforma¸c˜ao VTUR
∞, se limita a rodar U∞R por forma a alinhar as colunas de V com a base
can´onica. Assim
VTU∞R 22 = U∞R 22 = U∞RT U∞R =
t
∑
τ =−∞ u2(τ )
o que nos permite concluir que x(t)TP−1x(t) ´e a energia Ec que a entrada u(t) necessita para
que, no intervalo de tempo (−∞, t], consiga levar o estado do sistema da origem at´e x(t). Seja
P = UpSpUpT
a svd de P (recordemos que P ´e sim´etrica) sendo σp1, σp2, . . . , σpn os seus valores singulares
(elementos da diagonal principal de Sp) e up1, up2, . . . , upn as colunas de Up. Decomponhamos
x(t) segundo up1, up2, . . . , upn, ou seja, x(t) = α1up1+ α2up2 +· · · + αnupn = [ up1 up2 · · · upn ] α1 α2 .. . αn = Upα
A energia da entrada para levar o sistema da origem at´e x(t) no intervalo de tempo (−∞, t] ser´a
Ec = x(t)TP−1x(t) = (Upα)T (UpSpUpT)−1(Upα) = αTUpT (UpSp−1UpT)Upα = αTSp−1α
= α1 σp1 + α2 σp2 +· · · + αn σpn
Como σp1 ≥ σp2· · · ≥ σpn, ent˜ao, se i < j < n e αi = αj, a entrada necessita de menos
energia para levar o sistema ao estado xi = αiupi do que para o levar a xj = αjupj. Podemos,
ent˜ao, afirmar que os estados na direc¸c˜ao de upi s˜ao mais acess´ıveis do que os da direc¸c˜ao de
de estados em subespa¸cos com diferentes graus de acessibilidade.
Se, no instante t = 0 largarmos o sistema no estado x0, teremos
y(0) = Cx0 y(1) = CAx0 y(2) = CA2x0 .. . y(t) = At−1x0 .. . ⇔ Y0:∞=O∞x0 onde Y0:∞ = y(0) y(1) y(2) .. . y(t) .. . eO∞= C CA CA2 .. . CAt−1 .. . ,
sendo a energia da sa´ıda dada por
E0 = ∞ ∑ t=0 y2(t) =Y0:T∞Y0:∞= (O∞x0) T (O∞x0) = xT0O T ∞O∞x0 = xT0 ( OT ∞O∞)x0 = xT0Qx0 (32) em que Q ´e o Gramiano da Observabilidade. Se
Q = UqSqUqT
for a svd de Q sendo σq1, σq2, . . . , σqn s˜ao os valores singulares de Sq e uq1, uq2, . . . , uqn as
colunas de Uq. Se decompusermos x0 segundo as colunas de Uq, isto ´e, se
x0 = β1uq1 + β2uq2 +· · · + βnuqn = [ uq1 uq2 · · · uqn ] β1 β2 .. . βn = Uqβ
podemos reescrever (32) na forma
E0 = xT0Qx0 = (Uqβ)T ( UqSqUqT ) (Uqβ) = βTUqTUqSqUqTUqβ = βTSqβ = = β1σq1 + β2σq2 +· · · + βσqn.
Esta express˜ao mostra que tamb´em podemos dividir o espa¸co de estados em subespa¸cos com diferentes graus de observabilidade.
Se, num determinado sistema, v´arios valores singulares do Gramiano da Controlabilidade (ou do Gramiano da Observabilidade) forem muito pequenos, podemos ser tentados a re-duzir a ordem do modelo, retirando do espa¸co de estados o subespa¸co gerado pelos vectores singulares associados a esses valores singulares. Isto, porque a fun¸c˜ao de transferˆencia ´e de-terminada pelo subsistema acess´ıvel e observ´avel e, consequentemente, os modos associados a estados pouco acess´ıveis (ou pouco observ´aveis) n˜ao dever˜ao ter influˆencia significativa. Este racioc´ınio falha porque um subespa¸co pouco acess´ıvel pode ser muito observ´avel (e vice-versa)
e, previsivelmente, ter uma influˆencia significativa na fun¸c˜ao de transferˆencia. No entanto, existem realiza¸c˜oes onde os graus de acessibilidade e controlabilidade s˜ao idˆenticos. Essas realiza¸c˜oes s˜ao designadas como realiza¸c˜oes equilibradas e permitem-nos fazer a reduzir
a ordem de um modelo desprezando os subespa¸cos de estado que s˜ao simultaneamente pouco acess´ıveis e pouco control´aveis.
Defini¸c˜ao 6: Seja ( ¯A, ¯B, ¯C, ¯D) uma realiza¸c˜ao m´ınima da fun¸c˜ao de transferˆencia H(z).
( ¯A, ¯B, ¯C, ¯D) ´e designada como realiza¸c˜ao equilibrada se 1. A for uma matriz est´avel
2. Os Gramianos da Controlabilidade e da Observabilidade ¯P e ¯Q, respectivamente, s˜ao ma-trizes diagonais iguais, isto ´e,
¯ P = ¯Q = Σ = σ1 0 · · · 0 0 σ2 · · · 0 .. . ... . .. ... 0 0 · · · σn com σ1 ≥ σ2 ≥ · · · > σn e satisfazendo Σ = AΣ ¯¯ AT + ¯B ¯BT Σ = A¯TΣ ¯A + ¯CTC¯
Segue-se um algoritmo que nos permite obter uma realiza¸c˜ao equilibrada ( ¯A, ¯B, ¯C, ¯D) a
Algoritmo 4: Determina¸c˜ao duma Realiza¸c˜ao Equilibrada
• Entrada: Realiza¸c˜ao m´ınima est´avel (A, B, C), A ∈ IRn×n
, B ∈ IRn×m e C ∈
IRℓ×n.
• Sa´ıda: Matriz de valores singulares do sistema Σ e Matriz de Transforma¸c˜ao de Similaridade T ∈ IRn×n tal que ( ¯A, ¯B, ¯C) = (T−1AT, T−1B, CT ) seja uma realiza¸c˜ao equilibrada
1. Calcular P e Q atrav´es da resolu¸c˜ao de P = AP AT + BBT Q = ATQA + CTC 2. Efectuar a svd de Q Q = UqSqUqT 3. Definir R = S 1 2 qUqT 4. Calcular a svd de RP RT RP RT = U SUT 5. Fazer Σ = S12 T = R−1U Σ12
Para demonstrarmos que, com T calculada atrav´es deste algoritmo, a realiza¸c˜ao ( ¯A, ¯B, ¯C) =
(T−1AT, T−1B, CT ) ´e equilibrada podemos, em primeiro lugar verificar que
¯
C∞ = [ B¯ A ¯¯B · · · ¯AiB¯ · · · ]=[ T−1B T−1AT T−1B · · · T−1AiT T−1B · · · ] =
= [ T−1B T−1AB · · · T−1AiB · · · ]= T−1[ B AB · · · AiB · · · ]= T−1C∞ ⇒ ¯P = ¯C∞C¯∞T = T−1C∞C∞TT−T = T−1P T−T
e que ¯ O∞ = ¯ C ¯ C ¯A .. . ¯ C ¯Ai .. . = CT CT T−1AT .. . CT T−1AiT .. . = CT CAT .. . CAiT .. . = C CA .. . CAi .. . T = O∞T ⇒ ⇒ ¯Q = ¯C∞TC∞¯ = TTC∞TC∞T = TTQT. Fazendo Q = UqSqUqT R = S 1 2 qUqT ⇒ Q = RTR RP RT = U SUT Σ = S12 ⇔ S = Σ2 e T = R−1U Σ12 teremos ¯ P = T−1P T = Σ−12UTRP RTU Σ− 1 2 = Σ− 1 2UT(RP RT)U Σ− 1 2 = = Σ−12(UTU )S(UTU )Σ− 1 2 = Σ− 1 2Σ2Σ− 1 2 = Σ e ¯ Q = TTQT = Σ12UTR−TQR−1U Σ 1 2 = Σ 1 2UTR−T(RTR)R−1U Σ 1 2 = = Σ12UT(R−TRT)(RR−1)U Σ 1 2 = Σ 1 2UTU Σ 1 2 = Σ 1 2Σ 1 2 = Σ
pelo que podemos concluir que Σ ´e a matriz de valores singulares do sistema e T = R−1U Σ12
a matriz de similaridade que nos permite obter uma realiza¸c˜ao equilibrada.
8
Redu¸
c˜
ao da Ordem do Modelo
Como, nas realiza¸c˜oes equilibradas, os Graminanos da Controlabilidade e Observabilidade s˜ao iguais e diagonais podemos efectuar uma redu¸c˜ao de ordem do modelo, eliminado as
vari´aveis de estado (subespa¸cos) com reduzido grau de acessibilidade e observabilidade. Seja [ ¯ x1(t + 1) ¯ x2(t + 1) ] = [ ¯ A11 A¯12 ¯ A21 A¯22 ] [ ¯ x1(t) ¯ x2(t) ] + [ ¯ B1 ¯ B2 ] u(t) (33) y(t) = [ C¯1 C¯2 ] [ ¯x1(t) ¯ x2(t) ] + ¯Du(t) (34)
onde ¯x1(t) ∈ IRnr, x2(t) ∈ IRk, u(t) ∈ IRm, y(t) ∈ IRℓ, ¯A11 ∈ IRnr×nr, ¯A12 ∈ IRnr×k,
¯
A21 ∈ IRk×nr, ¯A22 ∈ IRk×k, ¯B1 ∈ IRnr×m, ¯B2 ∈ IRk×m, ¯C1 ∈ IRℓ×nr, ¯C2 ∈ IRℓ×k, ¯D∈ IRℓ×m e
nr+ k = n, uma realiza¸c˜ao equilibrada com ¯ P = Q = Σ =¯ [ Σ1 0 0 Σ2 ] (35) Σ1 = σ1 0 · · · 0 0 σ2 · · · 0 .. . ... . .. ... 0 0 · · · σnr ∈ IRnr×nr (36) Σ2 = σnr+1 0 · · · 0 0 σ2 · · · 0 .. . ... . .. ... 0 0 · · · σn ∈ IRk×k (37) e σ1 ≥ σ2 ≥ · · · ≥ σnr > σnr+1 ≥ · · · ≥ σn > 0. (38)
Se σnr+1 ≈ 0 podemos aproximar o sistema por
¯
x1(t + 1) = A¯11x¯1(t) + ¯B1u(t)
yr(t) = C¯1x¯1(t) + ¯Du(t).
Lema 1: Se (33)-(34) for uma realiza¸c˜ao equilibrada de uma fun¸c˜ao de transferˆencia H(z) com os Gramianos de Controlabilidade e Observabilidade dados por (35)-(38) ent˜ao a fun¸c˜ao de transferˆencia Hr(z) = ¯C1
(
Inr − ¯A11
)−1 ¯
B1+ ¯D tem as seguintes caracter´ısticas:
1. ´E est´avel
2. ( ¯A11, ¯B1, ¯C1, ¯D) ´e uma realiza¸c˜ao m´ınima de Hr
3. ∥H(ejω)− Hr(ejω)∥
Demonstra¸c˜ao: ver Katayama.
2
Embora seja uma boa aproxima¸c˜ao de H(z), a realiza¸c˜ao ( ¯A11, ¯B1, ¯C1, ¯D) n˜ao ´e equilibrada
e o ganho `as baixas frequˆencias (ganho DC) de Hr(z) ´e diferente do de H(z). Podemos, no
entanto, obter uma realiza¸c˜ao equilibrada duma outra fun¸c˜ao de transferˆencia Hr1(z) com
ordem e erro de aproxima¸c˜ao igual `as de Hr(z), e ganho DC igual ao de H(z). Para ver
como se pode obter esta realiza¸c˜ao consideremos de novo a realiza¸c˜ao equilibrada de H(z) ¯
x1(t + 1) = A¯11x¯1(t) + ¯A12x¯2(t) + ¯B1u(t) (39)
¯
x2(t + 1) = A¯21x¯1(t) + ¯A22x¯2(t) + ¯B2u(t) (40)
y(t) = C¯1x¯1(t) + ¯C2x¯2(t) + ¯Du(t). (41)
Se u(t) for um sinal cont´ınuo x2(t) vai estabilizar em
¯ x2ss = A¯21x¯1(t) + ¯A22x¯2ss+ ¯B2u(t)⇔ ( Ik− ¯A22 ) ¯ x2ss = ¯A21x¯1(t) + ¯B2u(t)⇔ ¯ x2ss = ( Ik− ¯A22 )−1 ¯ A21x¯1(t) + ( Ik− ¯A22 )−1 ¯ B2u(t)
Substituindo x2(t) por x2ss em (39) e (41) chegamos `a realiza¸c˜ao
¯ x1(t + 1) = ( ¯ A11+ ¯A12 ( Ik− ¯A22 )−1 ¯ A21 ) ¯ x1(t) + ( ¯ B1+ ¯A12 ( Ik− ¯A22 )−1 ¯ B2 ) u(t) yr1(t) = ( ¯ C1+ ¯C2 ( Ik− ¯A22 )−1 ¯ A21 ) ¯ x1(t) + ( ¯ D + ¯C2 ( Ik− ¯A22 )−1 ¯ B2 ) u(t)
da fun¸c˜ao de transferˆencia
Hr1(z) = C¯r ( Inr − ¯Ar )−1 ¯ Br+ ¯Dr (42) onde ¯ Ar = A¯11+ ¯A12 ( Ik− ¯A22 )−1 ¯ A21 ¯ Br = B¯1+ ¯A12 ( Ik− ¯A22 )−1 ¯ B2 ¯ Cr = C¯1+ ¯C2 ( Ik− ¯A22 )−1 ¯ A21 ¯ Dr = D + ¯¯ C2 ( Ik− ¯A22 )−1 ¯ B2.
Como, quando u(t) for constante, yr1(t) = y(t) o ganho DC de Hr1(z) ´e igual ao de H(z).