Equação de Lyapunov e equação de Stein : algumas propriedades e relações

Texto

(1)

(2) T e s eo r i e n t a d ap e l o. Pr o f . Do ut o rF e r n a n d oAbe l d aCo n c e i ç ã oSi l v a.

(3) “encontrar um problema, ver a sua beleza e apaixonar-se por ele; casar e viver feliz com ele até que a morte nos separe − a não ser que encontrem um outro problema ainda mais fascinante, ou, evidentemente, a não ser que obtenhamos uma solução. Mas, mesmo que obtenhamos uma solução, poderemos então descobrir, para nosso deleite, a existência de toda uma família de problemas-filhos, encantadores ainda que talvez difíceis, para cujo bem-estar poderemos trabalhar, com um sentido, até ao fim dos nossos dias.” K. Popper.

(4) agradecimentos. ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho.. aos responsáveis pelo Centro de Estruturas Lineares e Combinatórias (CELC), pelo apoio financeiro para participação em reuniões científicas no país e no estrangeiro.. aos colegas do departamento de Matemática da Universidade de Aveiro e a todos os que nele trabalham, pelo companheirismo e pelas excelentes condições de trabalho.. a todos aqueles que me deram sugestões, críticas e esclarecimentos para uma maior simplicidade e clareza na escrita deste texto, em particular ao Professor Doutor Paolo Vettori, pela disponibilidade e pelo apoio.. aos Amigos que, estando sempre presentes, me deram força para continuar nos momentos mais difíceis.. aos meus Pais e às minhas Manas, pelo carinho e pelo apoio constantes em todas as fases deste trabalho.. ao Bruno, pelo Amor, pelo aconchego.. à Carolina, por fazer da minha vida Amor.. Bolsa de Doutoramento. SFRH/BD/11133/2002.

(5) resumo. O objectivo deste trabalho é estabelecer relações entre a classe de semelhança de uma matriz quadrada A e as classes de congruência de matrizes quadradas hermíticas K e H , quando é válida a equação de Lyapunov AH + HA∗ = K . O teorema geral da inércia é uma solução parcial deste problema, bem como outros teoremas sobre inércia já conhecidos. Nesta tese, mostramos relações entre a classe de semelhança da matriz A e as classes de congruência das matrizes K e H , quando é válida a equação de Lyapunov para os seguintes casos:. H é uma matriz definida positiva A é uma matriz não derrogatória Estudamos também o problema correspondente para sistemas lineares discretos, ou seja, estabelecemos relações entre a classe de semelhança da matriz A e as classes de congruência das matrizes. K e H , quando é válida a equação de Stein H − AHA∗ = K . A resposta a este problema é imediata para os casos referidos anteriormente, dada a existência de uma transformada de Cayley que relaciona as duas equações.. palavras-chave. inércia de matrizes equação de Lyapunov equação de Stein estabilidade transformada de Cayley.

(6) abstract. The aim of this work is to establish relations between the similarity class of a square matrix A and the congruence classes of hermitian squares matrices K and H , when the Lyapunov equation. AH + HA∗ = K is satisfied. The main inertia theorem is a partial solution to this problem as well as other known inertia theorems. We obtain relations between the similarity class of A and the congruence classes of K and H , when the Lyapunov equation is satisfied for the following cases:. H is a definite positive matrix A is a nonderogatory matrix We also study the corresponding problem for discrete linear systems, that is, establish relations between the similarity class of A and the congruence classes of K and H , when the Stein equation H − AHA∗ =. K is satisfied. The answer to this became immediate for the cases mentioned above, due to a Cayley transform that relates the two equations.. keywords. inertia of matrices Lyapunov equation Stein equation stability Cayley transform.

(7) notação C. corpo dos números complexos. C[x]. anel dos polinómios com indeterminada x e coeficientes em C. Cn×m. conjunto das matrizes de ordem n × m com entradas em C. Cn×m [x]. conjunto das matrizes de ordem n × m com entradas em C[x]. A = [aij ]. matriz cuja entrada (i, j) é igual a aij. In. matriz identidade de ordem n. 0p×q. matriz nula de ordem p × q. 0p. matriz nula de ordem p × p. diag(λ1 , . . . , λn ). matriz diagonal cuja diagonal principal é λ1 , . . . , λn. car A. característica da matriz A. det A. determinante da matriz A. tr A. traço da matriz A. Nuc A. núcleo da matriz A: Nuc A = {X : AX = 0}. A−1. inversa da matriz A. AT. transposta da matriz A. A. conjugada da matriz A. A∗. transposta da conjugada da matriz A: A∗ = A. A⊕B. soma directa das matrizes A e B. i. unidade imaginária. <(λ). parte real do número complexo λ. =(λ). parte imaginária do número complexo λ. gr(f ). grau do polinómio f. f |g. polinómio f divide polinómio g. (a, b, c) ≥ (u, v, w) a ≥ u, b ≥ v e c ≥ w. T.

(8) Índice. 1 Preliminares. 2. 1.1 Revisões de conceitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 2. 1.2 Inércia matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 7. 1.3 Estabilidade de sistemas e estabilidade matricial . . . . . . . . . . . . . . . . .. 10. 2 Equação de Lyapunov. 15. 2.1 Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 15. 2.2 A nossa contribuição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 19. 2.2.1 H é uma matriz definida positiva . . . . . . . . . . . . . . . . . . . . .. 19. 2.2.2 L é uma matriz não derrogatória. 34. . . . . . . . . . . . . . . . . . . . . .. 3 Equação de Stein. 43. 3.1 Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 43. 3.2 A nossa contribuição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 48. 3.2.0 Lemas Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 48. 3.2.1 H é uma matriz definida positiva . . . . . . . . . . . . . . . . . . . . .. 52. 3.2.2 S é uma matriz não derrogatória. 57. . . . . . . . . . . . . . . . . . . . . .. Bibliografia. 59. Índice Remissivo. 62. 1.

(9) Capítulo 1 Preliminares “The structures of mathematics and the propositions about them are ways for the imagination to travel and the wings, or legs, or vehicles to take you where you want to go.” S. Buchanan. Este capítulo é dedicado à exposição de conceitos e resultados já conhecidos. São apresentados tópicos sobre a teoria das matrizes que consideramos fundamentais para a compreensão dos resultados obtidos nos capítulos seguintes e que podem ser encontrados, na sua generalidade, em [8, 10, 11, 12, 25].. 1.1. Revisões de conceitos. Nesta secção são revistos tópicos da teoria das matrizes, com o intuito de tornar este trabalho tão auto-contido quanto possível. Dadas duas matrizes A, B ∈ Cn×m , dizemos que A e B são equivalentes se existem matrizes não singulares P ∈ Cn×n e Q ∈ Cm×m tais que B = P AQ.. 2.

(10) 1.1 Revisões de conceitos. Em particular, se m = n, dizemos que as matrizes A e B são semelhantes se P = Q−1 , ou seja, se existe uma matriz não singular Q ∈ Cn×n tal que B = Q−1 AQ. Se a matriz Q for uma matriz de permutação (isto é, uma matriz que se obtém da matriz identidade por permutação de linhas ou de colunas), dizemos que A e B são semelhantes por permutação. Dizemos ainda que as matrizes A, B ∈ Cn×n são congruentes se existe uma matriz não singular R ∈ Cn×n tal que B = RAR∗ . Dada uma matriz A ∈ Cn×n chamamos polinómio característico de A ao polinómio mónico det(xIn − A) ∈ C[x]. Os valores próprios de A são as raízes do seu polinómio característico. Ao conjunto de todos os valores próprios de A chamamos espectro de A e representamos por σ(A). Claramente que, atendendo ao teorema fundamental da Álgebra, toda a matriz n × n tem n valores próprios em C (contando com as multiplicidades). É sabido que, se λ1 , . . . , λn ∈ C são os valores próprios da matriz A, então tr A = λ1 + · · · + λn. e. det A = λ1 · · · · · λn .. Seja λ ∈ C um valor próprio de A. A multiplicidade algébrica de λ, que representamos por ma (λ), é a multiplicidade de λ enquanto zero do polinómio característico e, por isso, é usual referir a multiplicidade algébrica apenas por multiplicidade. A multiplicidade geométrica de λ, que representamos por mg (λ), é a dimensão do subespaço vectorial Nuc(λIn − A). Se cada valor próprio de A tem multiplicidade geométrica 1, dizemos que A é uma matriz não derrogatória. Caso contrário, dizemos que A é uma matriz derrogatória. O próximo resultado permite concluir que matrizes semelhantes partilham diversas propriedades: o mesmo polinómio característico e, consequentemente, os mesmos valores próprios, o mesmo determinante, o mesmo traço, entre outras. Teorema 1.1.1 (Decomposição de Schur) [25] Seja A ∈ Cn×n uma matriz. Então A é semelhante a uma matriz triangular superior cuja diagonal principal é constituída pelos seus valores próprios.. 3.

(11) 1.1 Revisões de conceitos. Outro resultado que interessa recordar estabelece uma relação entre os valores próprios de uma matriz hermítica e os valores próprios de uma sua submatriz principal. Recorde-se que uma matriz A ∈ Cn×n é hermítica se A∗ = A. Teorema 1.1.2 (Entrelaçamento dos valores próprios) [11] Seja A ∈ Cn×n uma matriz hermítica particionada da seguinte forma:   A11 ∗  , onde A11 ∈ Cr×r para algum r ∈ {1, . . . , n}. A= ∗ ∗ Sejam λ1 , . . . , λn ∈ R os valores próprios de A tais que λ1 ≤ · · · ≤ λn e sejam α1 , . . . , αr ∈ R os valores próprios de A11 tais que α1 ≤ · · · ≤ αr . Então, para todo t ∈ {1, . . . , r}, λt ≤ αt ≤ λt+n−r . Para cada k ∈ {1, . . . , n}, chamamos k-ésimo divisor determinantal da matriz polinomial xIn − A ∈ Cn×n [x], e representamos por dk , ao máximo divisor comum mónico de todos os determinantes das submatrizes de ordem k da matriz xIn − A. Convenciona-se que d0 ≡ 1 e prova-se que, na sequência dos divisores determinantais, cada polinómio é divisível pelo seu sucessor, isto é, dk−1 | dk , para todo k ∈ {1, . . . , n}. Definimos o k-ésimo factor invariante da matriz xIn − A, e representamos por fk , como sendo o polinómio fk =. dk ∈ C[x]. dk−1. Cada factor invariante pode ser decomposto na forma fk = (x − λ1 )αk1 (x − λ2 )αk2 · · · (x − λt )αkt , onde λ1 , . . . , λt são os valores próprios distintos da matriz A e αkj ∈ N0 , para todo k ∈ {1, . . . , n} e para todo j ∈ {1, . . . , t}. Chamamos divisor elementar da matriz xIn − A a cada elemento da forma (x − λj )αkj com αkj > 0. Chamamos polinómios invariantes da matriz A aos factores invariantes da matriz xIn − A. O polinómio característico de uma matriz é igual ao produto dos seus polinómios invariantes. Além disso, duas matrizes são semelhantes se e só se têm os mesmos polinómios invariantes.. 4.

(12) 1.1 Revisões de conceitos. Existe uma relação entre a multiplicidade geométrica de um valor próprio e os polinómios invariantes de uma matriz. De facto, se λ é um valor próprio da matriz A, então a multiplicidade geométrica de λ é o número de polinómios invariantes de A que admitem λ como raiz. Podemos então dizer que uma matriz é não derrogatória se e só se tem apenas um polinómio invariante não constante. Chamamos matriz companheira de um polinómio mónico f (x) ∈ C[x] de grau p ≥ 1 da forma f (x) = xp + ap−1 xp−1 + · · · + a1 x + a0 , à matriz definida por  C(f ) = . 0. . Ip−1. −a0. −a1 . . .. −ap−1.  ∈ Cp×p .. A matriz C(f ) tem polinómios invariantes 1, . . . , 1, f (x). Teorema 1.1.3 (Forma normal companheira) [12] Seja A ∈ Cn×n uma matriz. Sejam ainda f1 , . . . , ft ∈ C[x] polinómios mónicos diferentes de 1 tais que f1 | · · · |ft e gr(f1 · · · ft ) = n. A matriz A é semelhante à matriz C(f1 ) ⊕ · · · ⊕ C(ft ) se e só se f1 , . . . , ft são os polinómios invariantes de A diferentes de 1. Chamamos bloco de Jordan de tamanho p × p associado a λ ∈ C à matriz triangular superior da forma.       Jp (λ) =     . ··· .... λ. 1. 0. 0 .. .. λ .. .. 1 .. .. 0 ···. 0. λ. 0 ···. 0. 0. ... ..  0  ..  .    p×p 0 ∈C .   1   λ. A matriz Jp (λ) tem polinómios invariantes 1, . . . , 1, (x − λ)p .. 5.

(13) 1.1 Revisões de conceitos. Teorema 1.1.4 (Forma normal de Jordan) [12] Seja A ∈ Cn×n uma matriz e sejam p1 , . . . , pt inteiros positivos tais que p1 + · · · + pt = n. Sejam ainda λ1 , . . . , λt ∈ C. A matriz A é semelhante à matriz Jp1 (λ1 ) ⊕ · · · ⊕ Jpt (λt ) se e só se (x − λ1 )p1 , . . . , (x − λt )pt são os divisores elementares da matriz xIn − A. Note-se que λ1 , . . . , λt são os valores próprios da matriz A (não necessariamente distintos). Para cada i ∈ {1, . . . , t}, a multiplicidade geométrica de λi é o número de blocos de Jordan associados a λi e a sua multiplicidade algébrica é a soma das ordens dos blocos de Jordan associados a λi , que surgem na forma normal de Jordan da matriz A. Os dois próximos lemas são necessários nas demonstrações dos nossos resultados. As respectivas demonstrações são omitidas uma vez que consistem na simples aplicação de operações de permutação. Seja λ ∈ C e sejam r1 , . . . , rp inteiros positivos tais que r1 + · · · + rp = n. Então: Lema 1.1.5 Toda a matriz da forma Jr1 (λ) ⊕ · · · ⊕ Jrp (λ) ∈ Cn×n é semelhante por permutação a uma matriz da forma  . λIp 0 ∗. ∗.   ∈ Cn×n .. Lema 1.1.6 Se ma (λ) ≥ 2 então toda a matriz da forma Jr1 (λ) ⊕ · · · ⊕ Jrp (λ) ∈ Cn×n é semelhante por permutação a uma matriz da forma   λI 0 0  p     Ip λIp 0  ∈ Cn×n .   ∗ ∗ ∗. Por fim recordamos algumas propriedades das matrizes definidas positivas.. 6.

(14) 1.2 Inércia matricial. Seja A ∈ Cn×n uma matriz hermítica. Dizemos que A é uma matriz definida positiva, e representamos por A > 0, se, para qualquer vector não nulo x ∈ Cn×1 \ {0}, x∗ Ax > 0. Se enfraquecermos a desigualdade estrita obtemos um novo conceito: dizemos que A é uma matriz semi-definida positiva, e representamos por A ≥ 0, se x∗ Ax ≥ 0, qualquer que seja x ∈ Cn×1 \ {0}. Prova-se que uma matriz é definida positiva se e só se é congruente com a matriz identidade. Analogamente, uma matriz A é semi-definida positiva se e só se é congruente com a matriz Ir ⊕ 0n−r , onde r = car A. Seja A ∈ Cn×n uma matriz definida positiva. Então prova-se que: toda a submatriz principal da matriz A é definida positiva; os valores próprios da matriz A são números reais positivos; para todo α > 0, αA é uma matriz definida positiva; se α < 0, então a matriz −αA é definida positiva; seja B ∈ Cn×n uma matriz congruente com a matriz A, então B também é uma matriz definida positiva. Invertendo as desigualdades das definições anteriores, obtemos conceitos duais. Dizemos que a matriz A é definida negativa, e representamos por A < 0, se −A é uma matriz definida positiva. Analogamente, dizemos que A é uma matriz semi-definida negativa, e representamos por A ≤ 0, se a matriz −A é semi-definida positiva. Se a matriz A não é definida positiva (respectivamente, negativa) nem semi-definida positiva (respectivamente, negativa) então dizemos que A é uma matriz indefinida.. 1.2. Inércia matricial. Nesta secção recordamos um dos conceitos fundamentais para o nosso trabalho: apresentamos a definição de inércia matricial e analisamos algumas das suas propriedades.. 7.

(15) 1.2 Inércia matricial. Seja A ∈ Cn×n uma matriz. A inércia de A (ou a inércia de A relativamente ao eixo imaginário) é o terno In(A) = (π(A), ν(A), δ(A)) onde π(A) denota o número de valores próprios da matriz A com parte real positiva, ν(A) o número de valores próprios da matriz A com parte real negativa e δ(A) denota o número de valores próprios da matriz A com parte real nula (contando sempre com as multiplicidades). A inércia de A relativamente ao círculo unitário é o terno In1 (A) = (π1 (A), ν1 (A), δ1 (A)) onde π1 (A) denota o número de valores próprios da matriz A com módulo inferior a 1, ν1 (A) o número de valores próprios da matriz A módulo superior a 1 e δ1 (A) denota o número de valores próprios da matriz A módulo igual a 1 (contando sempre com as multiplicidades). Em qualquer uma das definições, é fácil verificar que: π(A) + ν(A) + δ(A) = n = π1 (A) + ν1 (A) + δ1 (A). Recorde-se que, dadas duas matrizes A, B ∈ Cn×n , temos que: λ1 , . . . , λn ∈ σ(A) se e só se −λ1 , . . . , −λn ∈ σ(−A); λ1 , . . . , λn ∈ σ(A) e µ1 , . . . , µn ∈ σ(B) se e só se λ1 , . . . , λn , µ1 , . . . , µn ∈ σ(A ⊕ B); −1 −1 se A é uma matriz não singular então λ1 , . . . , λn ∈ σ(A) se e só se λ−1 1 , . . . , λn ∈ σ(A ).. se A e B são matrizes semelhantes então λ1 , . . . , λn ∈ σ(A) se e só se λ1 , . . . , λn ∈ σ(B). Assim, estas propriedades dos valores próprios de uma matriz permitem estabelecer algumas propriedades para as inércias. Teorema 1.2.1 Sejam A, B ∈ Cn×n matrizes. Então: In(−A) = (ν(A), π(A), δ(A)). In1 (−A) = In1 (A). In(A ⊕ B) = In(A) + In(B). In1 (A ⊕ B) = In1 (A) + In1 (B). Se A é uma matriz não singular então In(A−1 ) = In(A) e In1 (A−1 ) = (ν1 (A), π1 (A), δ1 (A)). Além disso, se A e B são matrizes semelhantes então In(A) = In(B) e In1 (A) = In1 (B).. 8.

(16) 1.2 Inércia matricial. Os dois próximos resultados permitem afirmar que a inércia de matrizes hermíticas é também invariante para a congruência de matrizes. Teorema 1.2.2 (Teorema da inércia de Sylvester) [12] Toda a matriz hermítica A ∈ Cn×n é congruente com uma única matriz da forma Iπ ⊕ (−Iν ) ⊕ 0δ e, além disso, In(A) = (π, ν, δ). Corolário 1.2.3 [12] Duas matrizes hermíticas são congruentes se e só se têm a mesma inércia. O teorema seguinte é um caso particular do resultado obtido em [1] por B. E. Cain e E. M. Sá e relaciona a inércia de uma matriz hermítica com as inércias de duas suas submatrizes principais complementares. Teorema 1.2.4 [1] Sejam H1 ∈ Cn1 ×n1 e H2 ∈ Cn2 ×n2 matrizes hermíticas, com n1 + n2 = n, tais que In(H1 ) = (π1 , ν1 , δ1 ). e. In(H2 ) = (π2 , ν2 , δ2 ).. Sejam ainda π, ν, δ inteiros não negativos. Então existe uma matriz X ∈ Cn1 ×n2 tal que   H1 X  = (π, ν, δ) In  ∗ X H2 se e só se π e ν satisfazem as seguintes condições: (i) π + ν ≤ n; (ii) max{π1 , π2 } ≤ π ≤ min{n1 + π2 , n2 + π1 }; (iii) max{ν1 , ν2 } ≤ ν ≤ min{n1 + ν2 , n2 + ν1 }; (iv) π − ν ≤ π1 + π2 ; (v) ν − π ≤ ν1 + ν2 .. 9.

(17) 1.3 Estabilidade de sistemas e estabilidade matricial. 1.3. Estabilidade de sistemas e estabilidade matricial. Nesta secção, fazemos uma breve abordagem aos sistemas contínuos e discretos. É com base no estudo destes sistemas que surgem as equações que são mote deste trabalho. Por se tratar de uma teoria que não se insere no âmbito deste trabalho, omitimos as demonstrações, podendo estas ser encontradas em [5, 8, 11]. Num modelo matemático, o comportamento de um sistema real pode ser descrito por uma lista de parâmetros que variam ao longo do tempo, chamados variáveis de estado do sistema. Frequentemente, existem relações de dependência entre as variáveis de estado que tomam a forma de equações diferenciais ou equações com diferenças, as chamadas equações de estado do sistema. O objectivo do estudo matemático destes sistemas é conseguir determinar o seu comportamento. Um conceito subjacente a esse estudo é o de estabilidade. Consideremos um sistema descrito por uma lista finita de variáveis de estado, que obedecem a um sistema contínuo de equações diferenciais lineares com coeficientes constantes definido por χ(t) ˙ = Aχ(t) onde A ∈ Cn×n e χ˙ representa a derivada de χ em ordem ao tempo t. Dizemos que o sistema contínuo descrito anteriormente é estável se todas as suas soluções convergem para 0 quando t converge para +∞, ou equivalentemente, se eAt converge para 0 quando t converge para +∞. Um dos critérios de estabilidade de sistemas contínuos é apresentado no próximo resultado. Teorema 1.3.1 [5] Seja A ∈ Cn×n uma matriz. O sistema χ(t) ˙ = Aχ(t) é estável se e só se todos os valores próprios da matriz A têm parte real negativa. Em 1892, na sua tese de doutoramento, Lyapunov publica um resultado histórico na estabilidade de sistemas não lineares de equações diferenciais, que pode ser formulado para sistemas lineares, com equações matriciais.. 10.

(18) 1.3 Estabilidade de sistemas e estabilidade matricial. A relação entre a teoria da estabilidade e as equações matriciais é estabelecida definindo uma matriz Z. +∞. H=−. ∗. eAt KeA t dt. 0. onde K é uma matriz arbitrária definida positiva. Note-se que, sendo A uma matriz representativa de um sistema contínuo estável, então eAt converge para 0 quando t converge para +∞ e este integral impróprio é convergente. Mostra-se (cf. [5]) que H satisfaz a equação AH + HA∗ = K.. (1.1). Esta equação é conhecida como equação de Lyapunov e é um dos objectos de estudo do nosso trabalho. Vamos ver no próximo capítulo que a estabilidade de um sistema contínuo está associada à existência de soluções desta equação. Existem sistemas cujo modelo natural é discreto. Consideremos um sistema discreto descrito pelas seguintes equações com diferenças lineares com coeficientes constantes xk = Axk−1 , com k ∈ {1, . . . , n} onde A ∈ Cn×n e xi ∈ Cn×1 , para todo i ∈ {1, . . . , n}. Dizemos que um sistema discreto da forma anterior é estável se uma solução do sistema da forma x0 , x1 , x2 , . . . converge para 0, qualquer que seja a escolha inicial de x0 ou, equivalentemente, se Ak converge para 0 quando k converge para +∞. Um dos critérios de estabilidade de sistemas discretos é análogo ao referido para sistemas contínuos, mas usando o conceito de inércia relativamente ao círculo unitário. Teorema 1.3.2 [5] Seja A ∈ Cn×n uma matriz. O sistema xk = Axk−1 , com k ∈ {1, . . . , n}, é estável se e só se todos os valores próprios da matriz A têm módulo inferior a 1. Em 1952, Stein publica um estudo análogo ao de Lyapunov mas relativo à estabilidade de sistemas discretos. Este estudo baseia-se na definição de uma matriz H da forma H=. +∞ X. Ak K(A∗ )k. (1.2). k=0. 11.

(19) 1.3 Estabilidade de sistemas e estabilidade matricial. onde K é uma matriz arbitrária definida positiva. De facto, se A é uma matriz representativa de um sistema discreto estável, então Ak converge para 0 quando t converge para +∞ e esta série é convergente. Mostra-se que H satisfaz a equação H − AHA∗ = K.. (1.3). Esta equação é denominada por equação de Stein e é também objecto de estudo do nosso trabalho. No último capítulo, vamos ver que a estabilidade de sistemas discretos está também associada à existência de soluções da equação de Stein. De seguida, introduzimos a estabilidade matricial tendo por base a estabilidade de sistemas. Seja A ∈ Cn×n uma matriz. Dizemos que A é uma matriz estável se o sistema contínuo que lhe está associado χ(t) ˙ = Aχ(t) é estável, ou seja, se todos os valores próprios da matriz A têm parte real negativa. Repare-se que a matriz A é estável se e só se In(A) = (0, n, 0). Dadas as propriedades da inércia (enunciadas no teorema 1.2.1), podemos concluir que se A é uma matriz estável então A é uma matriz não singular e A−1 , A∗ e AT também são matrizes estáveis. E, além disso, como a inércia é invariante para a semelhança, o mesmo se pode afirmar para a estabilidade, ou seja, se A é uma matriz estável então qualquer matriz semelhante a A é estável. Um conceito dual de estabilidade é definido da seguinte forma: dizemos que a matriz A é estável positiva se todos os seus valores próprios têm parte real positiva, ou seja, In(A) = (n, 0, 0). Claramente que a matriz A é estável positiva se e só se −A é uma matriz estável. Assim é possível reescrever qualquer resultado referente a matrizes estáveis num resultado idêntico sobre matrizes estáveis positivas, inserindo adequadamente o sinal −, e vice-versa. Por conveniência de notação, vamos utilizar o conceito de matrizes estáveis positivas em detrimento do conceito de matrizes estáveis. Podemos ainda definir estabilidade de uma matriz associada a um sistema discreto.. 12.

(20) 1.3 Estabilidade de sistemas e estabilidade matricial. Dizemos que a matriz A é estável relativamente ao círculo unitário se o sistema discreto que lhe está associado, xk = Axk−1 , com k ∈ {1, . . . , n}, é estável, ou seja, se todos os valores próprios da matriz A têm módulo inferior a 1, isto é, In1 (A) = (n, 0, 0). Em [21], O. Taussky (e, indirectamente, Stein [17]) aplica uma transformação matricial estabelecendo uma relação entre matrizes estáveis e matrizes estáveis relativamente ao círculo unitário. Seja A ∈ Cn×n uma matriz tal que a matriz In + A é não singular, ou seja, −1 ∈ / σ(A). Chamamos transformada de Cayley da matriz A, e denotamos por C(A), à matriz definida por C(A) = (In + A)−1 (In − A) ∈ Cn×n .. Teorema 1.3.3 Seja A ∈ Cn×n uma matriz tal que −1 ∈ / σ(A). Então In1 (A) = In(C(A)). Demonstração.. Seja A ∈ Cn×n uma matriz tal que µ1 , . . . , µn são os seus valores próprios.. Note-se que, como −1 ∈ / σ(A), é possível definir a sua transformada de Cayley, C(A). Pela decomposição de Schur, existe uma matriz não singular U ∈ Cn×n tal que U −1 AU é uma matriz triangular superior cuja diagonal é µ1 , . . . , µn . Então: −1 In + U −1 AU In − U −1 AU  (1 + µ1 )−1 (1 − µ1 ) ∗   ... =   0 (1 + µn )−1 (1 − µn ). U −1 C(A)U =.     . e os valores próprios da matriz C(A) são λ1 , . . . , λn , onde λk = (1 + µk )−1 (1 − µk ), para todo k ∈ {1, . . . , n}. Note-se que, para cada k ∈ {1, . . . , n}, λk = |1 + µk |−2 1 − |µk |2 − 2=(µk )i e, consequentemente, <(λk ) = |1 + µk |−2 1 − |µk |2 . Assim, se |µk | = 1 (respectivamente, |µk | > 1 e |µk | < 1), então <(λk ) = 0 (respectivamente, <(λk ) < 0 e <(λk ) > 0), para todo k ∈ {1, . . . , n}, e, portanto, In1 (A) = In(C(A)).. 13.

(21) 1.3 Estabilidade de sistemas e estabilidade matricial. Note-se que se A é uma matriz estável relativamente ao círculo unitário e se µ1 , . . . , µn são os seus valores próprios, então |µk | < 1, para todo k ∈ {1, . . . , n}. Donde −1 ∈ / σ(A) e, portanto, a matriz C(A) está bem definida. Aplicando o teorema anterior obtemos: Corolário 1.3.4 Seja A ∈ Cn×n uma matriz. A matriz A é estável relativamente ao círculo unitário se e só se a matriz C(A) é estável positiva. Também fazendo uso da transformada de Cayley, anteriormente definida, é possível criar uma relação entre a equação de Lyapunov e a equação de Stein. Teorema 1.3.5 Seja H ∈ Cn×n uma matriz hermítica e seja A ∈ Cn×n uma matriz estável relativamente ao círculo unitário. Então In(C(A)H + HC(A)∗ ) = In(H − AHA∗ ). Demonstração.. Seja H ∈ Cn×n uma matriz hermítica e seja A ∈ Cn×n uma matriz estável. relativamente ao círculo unitário. Repare-se que −1 ∈ / σ(A) e, portanto, a matriz C(A) está bem definida. Então: C(A)H + HC(A)∗ = K ⇔ (In + A)−1 (In − A)H + H(In − A∗ )(In + A∗ )−1 = K ⇔ (In − A)H(In + A∗ ) + (In + A)H(In − A∗ ) = (In + A)K(In + A∗ ) ⇔ 2 (H − AHA∗ ) = (In + A)K(In + A∗ ) 1 1 ⇔ H − AHA∗ = 2− 2 (In + A) K 2− 2 (In + A∗ ) 1. Logo existe uma matriz não singular X = 2− 2 (In + A) ∈ Cn×n tal que H − AHA∗ = X (C(A)H + HC(A)∗ ) X ∗ e, portanto, a matriz C(A)H + HC(A)∗ é congruente com a matriz H − AHA∗ . Como são matrizes hermíticas, pelo Corolário 1.2.3, In(C(A)H + HC(A)∗ ) = In(H − AHA∗ ).. 14.

(22) Capítulo 2 Equação de Lyapunov “But, in this respect, hardly any other method of investigation could be said to be completely satisfactory.” A. Lyapunov. O objectivo principal deste capítulo é estabelecer relações entre a classe de semelhança da matriz L e as classes de congruência das matrizes K e H quando é válida a equação de Lyapunov LH + HL∗ = K. Obtêm-se conjuntos completos de relações nos seguintes dois casos: (i) H é uma matriz definida positiva e (ii) L é uma matriz não derrogatória. Os resultados principais deste capítulo podem ser encontrados em [18, 19].. 2.1. Motivação. Nesta secção recordamos o teorema de Lyapunov e algumas generalizações que motivaram a formulação do nosso problema. Analisamos também esses resultados enquanto soluções particulares desse problema.. 15.

(23) 2.1 Motivação. Tal como já referimos, em 1892, Lyapunov publica um resultado histórico que estabelece uma relação entre as matrizes estáveis positivas e as matrizes definidas positivas. Teorema 2.1.1 (Teorema de Lyapunov) [12] Sejam L, K ∈ Cn×n matrizes tais que K é uma matriz definida positiva. A matriz L é estável positiva se e só se existe uma matriz definida positiva H ∈ Cn×n que satisfaz a equação de Lyapunov LH + HL∗ = K. Uma das generalizações mais importantes deste teorema é o teorema geral da inércia. Este resultado é obtido por A. Ostrowski e H. Schneider [16] e, independentemente, por O. Taussky [20] que prova o caso particular K = In . Teorema 2.1.2 (Teorema geral da inércia) [16] Sejam L, K ∈ Cn×n matrizes tais que K é uma matriz definida positiva. Então existe uma matriz hermítica H ∈ Cn×n tal que LH + HL∗ = K se e só se δ(L) = 0. Além disso, se existir uma matriz hermítica H ∈ Cn×n tal que LH + HL∗ = K então In(L) = In(H). Repare-se que, para toda a matriz não singular R ∈ Cn×n , a equação de Lyapunov é equivalente à equação (RLR−1 )(RHR∗ ) + (RHR∗ )(RLR−1 )∗ = RKR∗ .. (2.1). Atendendo a esta observação, o teorema anterior pode ser formulado da seguinte forma: Teorema 2.1.3 Sejam L, H ∈ Cn×n matrizes tais que H é uma matriz hermítica. Então existe uma matriz L0 ∈ Cn×n semelhante à matriz L e existe uma matriz H 0 ∈ Cn×n congruente com a matriz H tais que L0 H 0 + H 0 L0∗ é definida positiva se e só se δ(L) = 0 e In(L) = In(H). Demonstração. Sejam L, H ∈ Cn×n matrizes tais que H é uma matriz hermítica. Suponhamos que existe uma matriz L0 ∈ Cn×n semelhante à matriz L e que existe uma matriz H 0 ∈ Cn×n congruente com a matriz H tais que L0 H 0 + H 0 L0∗ > 0. Pelo teorema geral da inércia, δ(L0 ) = 0 e In(L0 ) = In(H 0 ). Donde, pelas propriedades da inércia (teorema 1.2.1) e pelo corolário 1.2.3, vem que δ(L) = 0 e In(L) = In(H).. 16.

(24) 2.1 Motivação. Reciprocamente, suponhamos que δ(L) = 0 e In(L) = In(H). Novamente pelo teorema geral da inércia, existe uma matriz hermítica H 0 ∈ Cn×n tal que LH 0 + H 0 L∗ > 0 e In(L) = In(H 0 ). Logo In(H 0 ) = In(H), ou seja, a matriz H 0 é congruente com a matriz H, pelo corolário 1.2.3. Além disso, atendendo a (2.1), existe uma matriz L0 ∈ Cn×n semelhante à matriz L tal que a matriz L0 H 00 + H 00 L0∗ é definida positiva, onde H 00 ∈ Cn×n é uma matriz congruente às matrizes H e H 0. Assim, este teorema fornece um sistema completo de relações entre a classe de semelhança da matriz L e a classe de congruência da matriz H, quando K é uma matriz definida positiva e é válida a equação de Lyapunov. E sugere o problema base do nosso trabalho. Problema 1 Determinar um sistema completo de relações entre a classe de semelhança da matriz L e as classes de congruência das matrizes H e K quando é válida a equação de Lyapunov. Existem na literatura algumas soluções parciais. Por exemplo, o teorema geral da inércia é uma solução parcial do problema para o caso em que K é uma matriz definida positiva. Também o teorema de Lyapunov é uma solução parcial do problema para o caso em que K e H são matrizes definidas positivas. De facto, podemos enunciá-lo do seguinte modo: Teorema 2.1.4 Sejam L, H ∈ Cn×n matrizes tais que H é uma matriz definida positiva. Então existe uma matriz L0 ∈ Cn×n semelhante à matriz L e existe uma matriz definida positiva H 0 ∈ Cn×n congruente com a matriz H tais que a matriz L0 H 0 + H 0 L0∗ é definida positiva se e só se π(L) = n. Demonstração. Sejam L, H ∈ Cn×n matrizes tais que H é uma matriz definida positiva. Suponhamos que existe uma matriz L0 ∈ Cn×n semelhante à matriz L e que existe uma matriz definida positiva H 0 ∈ Cn×n congruente com a matriz H tais que L0 H 0 +H 0 L0∗ > 0. Pelo teorema de Lyapunov, L0 é uma matriz estável positiva, ou seja, π(L0 ) = n. Donde, pelas propriedades da inércia (teorema 1.2.1), vem que π(L) = n. O recíproco é aplicação directa do teorema 2.1.3, uma vez que δ(L) = 0.. 17.

(25) 2.1 Motivação. O próximo resultado, obtido por D. Carlson e H. Schneider [2] motivados pelo teorema de Lyapunov enfraquecendo a condição “K é uma matriz definida positiva”, fornece um sistema completo de relações entre a classe de semelhança da matriz L e a classe de congruência da matriz H quando L é uma matriz não singular e K é uma matriz semi-definida positiva. No final da próxima secção é apresentada uma demonstração alternativa deste teorema enquanto corolário de um dos principais resultados (corolário 2.2.8). Teorema 2.1.5 [2] Seja L ∈ Cn×n uma matriz. Então existe uma matriz definida positiva H ∈ Cn×n tal que LH + HL∗ é semi-definida positiva se e só se a matriz L não tem divisores elementares com raízes imaginárias múltiplas e ν(L) = 0. Em [6], L. M. DeAlba e C. R. Johnson estudam uma variante do problema 1 e garantem que as inércias das matrizes L, H e K são independentes, sob certas condições, sempre que é válida a equação de Lyapunov e K é uma matriz indefinida. Observe-se que no artigo referido é estudada a equação de Stein. No entanto, pelo que foi visto anteriormente, facilmente se podem reescrever os resultados obtidos em análogos para a equação de Lyapunov, uma vez que são válidas as condições do teorema 1.3.5. Teorema 2.1.6 [6, Teorema 3] Sejam πk , νk ,δk , πh , νh , δh , π, ν, δ inteiros não negativos tais que πk > 0, νk ≤ πh + νh e πk + νk + δk = πh + νh + δh = π + ν + δ = n. Então existe uma matriz não singular L ∈ Cn×n e existem matrizes hermíticas H, K ∈ Cn×n tais que é válida a equação de Lyapunov LH + HL∗ = K e In(K) = (πk , νk , δk ),. In(H) = (πh , νh , δh ). e. In(L) = (π, ν, δ).. 18.

(26) 2.2 A nossa contribuição. 2.2. A nossa contribuição. 2.2.1 H é uma matriz definida positiva Nesta secção apresentamos um sistema completo de relações entre a classe de semelhança de L e a classe de congruência de K quando é válida a equação de Lyapunov, H é uma matriz definida positiva e, ou L é uma matriz não derrogatória ou K é uma matriz semi-definida positiva. Seguimos de perto [18]. Sejam L, K, H ∈ Cn×n matrizes. Tal como vimos anteriormente, LH + HL∗ = K é equivalente a (2.1). Assim, nas demonstrações, a matriz L é substituída, sempre que necessário, por uma qualquer matriz que lhe seja semelhante, sem que haja perda de generalidade. Denotamos por i(L) o número de polinómios invariantes não constantes de L. Denotamos por i+ (L) o número de polinómios invariantes de L com pelo menos uma raiz com parte real positiva, por i− (L) o número de polinómios invariantes de L com pelo menos uma raiz com parte real negativa e por i0 (L) o número de polinómios invariantes de L com pelo menos uma raiz com parte real nula. Denotamos ainda por i20 (L) o número de polinómios invariantes de L com pelo menos uma raiz com a parte real nula e multiplicidade superior ou igual a 2. O próximo teorema apresenta condições necessárias para a solução parcial do problema 1 quando H é uma matriz definida positiva. Teorema 2.2.1 Sejam L, K, H ∈ Cn×n matrizes tais que K é uma matriz hermítica e H é uma matriz definida positiva. Se LH + HL∗ = K então são válidas as seguintes condições: π(K) ≥ max{i+ (L), i20 (L)}. (2.2). ν(K) ≥ max{i− (L), i20 (L)}. (2.3). δ(K) ≥ 2i0 (L) − n. (2.4). 19.

(27) 2.2 A nossa contribuição. π(K) + δ(K) ≥ i0 (L). (2.5). ν(K) + δ(K) ≥ i0 (L). (2.6). e o seguinte caso não é válido: (S) δ(L) > δ(K), i20 (L) = 0 e min{π(K), ν(K)} = 0. Demonstração. Sejam L, K, H ∈ Cn×n matrizes tais que K é uma matriz hermítica e H é uma matriz definida positiva. Suponhamos que LH + HL∗ = K. demonstração de ν(K) ≥ i− (L) Seja p = i− (L). Pelo lema 1.1.5, a forma normal de Jordan da matriz L é semelhante por permutação a uma matriz da forma   λI 0 p  , para algum λ ∈ C tal que <(λ) < 0. L0 =  ∗ ∗ Note-se que, dada a cadeia de divisibilidade entre os polinómios invariantes, é possível escolher um valor próprio λ da matriz L tal que <(λ) < 0 e mg (λ) = p. Sem perda de generalidade, suponhamos que L = L0 . Particione-se a matriz H da seguinte forma:   H11 H12  , com H11 ∈ Cp×p . H= ∗ H12 H22. (2.7). Então −2<(λ)H11 é uma submatriz principal da matriz −K e é definida positiva. Pelo entrelaçamento dos valores próprios, ν(K) = π(−K) ≥ p = i− (L). demonstração de π(K) ≥ i+ (L) Análoga à demonstração de anterior. demonstração de ν(K) ≥ i (L) e π(K) ≥ i (L) Seja p = i20 (L). Pelo lema 1.1.6, a forma normal de Jordan da matriz L é semelhante por permutação a uma matriz da forma   λIp 0 0     0 L =  Ip λIp 0  , para algum λ ∈ C tal que <(λ) = 0.   ∗ ∗ ∗. 20.

(28) 2.2 A nossa contribuição. Novamente, dada a cadeia de divisibilidade entre os polinómios invariantes, é possível escolher um valor próprio λ da matriz L tal que <(λ) = 0, mg (λ) = p e ma (λ) ≥ 2. Sem perda de generalidade, suponhamos que L = L0 e particione-se a matriz H da seguinte forma:   H H12 H13   11   ∗ H =  H12 H22 H23  , onde H11 , H22 ∈ Cp×p .   ∗ ∗ H13 H23 H33 Então.  Kp = . 0. H11. ∗ H11 H12 + H12.  . é uma submatriz principal da matriz K. Como Kp é uma matriz não singular e 0p é uma sua submatriz principal, pelo entrelaçamento dos valores próprios, In(Kp ) = (p, p, 0). Consequentemente, ν(K) ≥ p = i20 (L) e π(K) ≥ p = i20 (L). E concluímos que as condições (2.2) e (2.3) são válidas. demonstração de δ(K) ≥ i (L) − n Seja p = i0 (L). Pelo lema 1.1.5, a forma normal de Jordan da matriz L é semelhante por permutação a uma matriz da forma   λI 0 p  , para algum λ ∈ C tal que <(λ) = 0. L0 =  ∗ ∗ Sem perda de generalidade, suponhamos que L = L0 e particione-se a matriz H como em (2.7). Então 0p é uma submatriz principal da matriz K e, consequentemente, car K ≤ n − p. Logo, como K é uma matriz hermítica, δ(K) = n − car K ≥ p − car K ≥ p − (n − p) = 2i0 (L) − n. demonstração de π(K) + δ(K) ≥ i (L) e ν(K) + δ(K) ≥ i (L) Aplicando um raciocínio análogo ao da demonstração anterior, seja p = i0 (L). A forma normal de Jordan da matriz L é semelhante por permutação a uma matriz da forma   λIp 0  , para algum λ ∈ C tal que <(λ) = 0. L0 =  ∗ ∗. 21.

(29) 2.2 A nossa contribuição. Sem perda de generalidade, suponhamos que L = L0 e particione-se a matriz H como em (2.7). Então 0p é uma submatriz principal da matriz K e, portanto, car K ≤ n − p. Então: π(K) + δ(K) = π(K) + (n − car K) ≥ π(K) + (n − (n − p)) ≥ p = i0 (L). Analogamente, ν(K) + δ(K) ≥ ν(K) + (n − (n − p)) ≥ p = i0 (L). demonstração de (S) não é válido Por indução em n. Se n = 1, suponhamos que L = [l11 ] e H = [h11 ], para algum l11 ∈ C e para algum h11 ∈ R tal que h11 > 0. Então: LH + HL∗ = [2<(l11 )h11 ]. e. In(L) = In(LH + HL∗ ) = In(K).. Logo o caso (S) não se verifica. Seja n ≥ 2. Com vista a uma contradição, suponhamos que (S) é válido. Então, como δ(L) > 0 e i20 (L) = 0, a matriz L admite pelo menos um valor próprio imaginário puro com multiplicidade 1 e, portanto, é semelhante a uma matriz da forma [λ] ⊕ L0 , para algum λ ∈ C tal que <(λ) = 0 e L0 ∈ C(n−1)×(n−1) . Sem perda de generalidade, suponhamos que L = [λ] ⊕ L0 e particione-se a matriz H da seguinte forma:   h g  ∈ Cn×n , onde H0 ∈ C(n−1)×(n−1) . H= ∗ g H0 Então.  K=. Se g(λIn−1 + L∗0 ) 6= 0 então  M =. 0. g(λIn−1 +. L∗0 ). (−λIn−1 + L0 )g ∗ L0 H0 + H0 L∗0. 0. m12. m∗12. m22.  ..   ∈ C2×2 , com m12 , m22 ∈ C \ {0},. é uma submatriz principal da matriz K tal que In(M ) = (1, 1, 0). Pelo entrelaçamento dos valores próprios, π(K) ≥ π(M ) = 1 e. ν(K) ≥ ν(M ) = 1,. 22.

(30) 2.2 A nossa contribuição. o que é absurdo pois, por (S), min{π(K), ν(K)} = 0. Suponhamos agora que g(λIn−1 + L∗0 ) = 0. Seja K0 = L0 H0 + H0 L∗0 ∈ C(n−1)×(n−1) . Note-se que i20 (L0 ) = 0 e, como (S) é válido, δ(L0 ) = δ(L) − 1 > δ(K) − 1 = δ(K0 ). Por hipótese de indução, (S) não é válido para a matriz K0 , logo min{π(K0 ), ν(K0 )} > 0. Mas π(K) = π(K0 ) e ν(K) = ν(K0 ) e obtemos de novo uma contradição. Concluímos assim que o caso (S) não é válido. Tal como vamos ver mais adiante, as condições (2.2) a (2.6) não são condições suficientes para quaisquer matrizes L e K. Chamamos τ -matriz a toda a matriz triangular superior T = [tij ] ∈ Cn×n tal que ti,i+1 6= 0, para todo i ∈ {1, . . . , n − 1}. Os próximos lemas envolvem este conceito e são úteis na demonstração do resultado principal desta secção. Lema 2.2.2 Sejam λ1 , ..., λn ∈ C ordenados por forma a que: se λi = λj , para algum i < j, então λi = λk , para todo k ∈ {i, . . . , j}. Seja    T = . ∗. λ1 .. 0. . λn.     ∈ Cn×n . (2.8). uma τ -matriz. Então T é uma matriz não derrogatória. Demonstração. Começamos por mostrar que i(A) = n − RC (A), onde RC (A) = min car(αIn − A), para qualquer matriz A ∈ Cn×n (cf. [15]). α∈C. 23.

(31) 2.2 A nossa contribuição. Suponhamos que a matriz A tem t valores próprios distintos, com 1 ≤ t ≤ n, e que os seus divisores elementares são da forma (x − λi )ri,1 , . . . , (x − λi )ri,si , para todo i ∈ {1, . . . , t}, onde 0 < ri,1 ≤ · · · ≤ ri,si . Então i(A) = max si . i∈{1,...,t}. Como RC (A) é invariante para a semelhança, podemos considerar, sem perda de generalidade, a matriz A na forma normal de Jordan. Na matriz λj In − A existem sj linhas nulas e sj colunas nulas e a matriz que resulta da eliminação dessas linhas e dessas colunas é não singular e, portanto, car(λj In − A) = n − sj . Logo RC (A) = min car(αIn − A) = n − max si = n − i(A). α∈C. i∈{1,...,t}. Assim, em particular, RC (T ) = n − i(T ). Atendendo à forma da matriz T , RC (T ) = n − 1. Donde i(T ) = 1, isto é, T é uma matriz não derrogatória. Lema 2.2.3 Sejam a, b ∈ R e λ ∈ C. Seja ainda K ∈ C3×3 uma matriz hermítica tal que In(K) ≥ (1, 1, 0). Então, para todo z ∈ C \ {0}, existe y ∈ C tal que a matriz   ia z y     T =  0 ib 1  ∈ C3×3   0 0 λ satisfaz a condição In(T + T ∗ ) = In(K). Demonstração. Seja    S= . 1 0. 0 1. −z −1 −y z −1. 0. .   3×3 0 ∈C .  1. Então a matriz T + T ∗ é congruente com a matriz   0 z  ⊕ 2<(λ) − 2<(yz −1 ) . S(T + T ∗ )S ∗ =  z 0. 24.

(32) 2.2 A nossa contribuição. Como.  In . 0 z z 0.   = (1, 1, 0),. o valor de y pode ser escolhido por forma a que In(T + T ∗ ) = In(K). Lema 2.2.4 Seja L ∈ Cn×n uma matriz não derrogatória tal que π(L) = 0. Seja K ∈ Cn×n uma matriz hermítica. Sejam ainda λ1 , . . . , λn os valores próprios da matriz L ordenados por forma a que: se λi = λj , para algum i < j, então λi = λk , para todo k ∈ {i, . . . , j}; se <(λi ) = 0, para algum i, então <(λk ) = 0, para todo k ∈ {1, . . . , i}. Suponhamos ainda que o seguinte caso não é válido: (S0 ) n ≥ 2, δ(L) > 0 e min{π(K), ν(K)} = 0. Se são válidas as condições (2.2) a (2.6) então a matriz L é semelhante a uma τ -matriz da forma (2.8) e In(T + T ∗ ) = In(K). Demonstração. Por indução em n. Suponhamos n = 1. Como L é uma matriz não derrogatória, i(L) = 1 e i20 (L) = 0. Além disso, por hipótese, i+ (L) = 0. Assim In(L) = (0, 1, 0) ou In(L) = (0, 0, 1). Por outro lado, das condições (2.2) a (2.4) vem que π(K) = 0, ν(K) ≥ i− (L) e δ(K) ≥ 2i0 (L) − 1. Logo In(L) = In(L + L∗ ) = In(K). Suponhamos agora que n = 2. Então, para todo t ∈ C \ {0}, a matriz L é semelhante à matriz   λ1 t  ∈ C2×2 . T = 0 λ2 Note-se que L e T são matrizes não derrogatórias e têm os mesmos valores próprios. Por hipótese, ou <(λ1 ) = 0 ou <(λ1 ) < 0. Se <(λ1 ) = 0, então a matriz T + T ∗ tem uma submatriz nula de ordem 1 e det(T + T ∗ ) 6= 0. Pelo entrelaçamento dos valores próprios, In(T + T ∗ ) = (1, 1, 0), para todo t ∈ C \ {0}.. 25.

(33) 2.2 A nossa contribuição. Por outro lado, pelas condições (2.2) a (2.4), sabemos que π(K) ≥ 1 e δ(K) ≥ 0. Além disso, como (S0 ) não é válido e δ(L) > 0, então min{π(K), ν(K)} 6= 0 e, consequentemente, ν(K) ≥ 1. O que permite concluir que In(K) = (1, 1, 0) = In(T + T ∗ ). Se <(λ1 ) < 0, pela forma como os valores próprios da matriz L foram ordenados e recordando que π(L) = 0, concluímos que <(λ2 ) < 0. Além disso, a condição (2.3) implica que ν(K) ≥ 1. Como.    (0, 2, 0),   ∗ In(T + T ) = (1, 1, 0),     (0, 1, 1),. se se se. p 0 < |t| < 2 <(λ1 )<(λ2 ) p |t| > 2 <(λ1 )<(λ2 ) p |t| = 2 <(λ1 )<(λ2 ). basta escolher t ∈ C \ {0} por forma a que In(T ∗ + T ) = In(K). Por fim, suponhamos que n ≥ 3. Seja L0 ∈ C(n−1)×(n−1) uma matriz não derrogatória cujos valores próprios são λ1 , . . . , λn−1 . Se n = 3 e In(K) = (1, 1, 1), seja K0 = diag(1, −1); caso contrário, seja K0 ∈ C(n−1)×(n−1) uma matriz hermítica tal que min{π(K), 1} ≤ π(K0 ) ≤ π(K) min{ν(K), 1} ≤ ν(K0 ) ≤ ν(K) min{δ(K), 1} ≤ δ(K0 ) ≤ δ(K). De acordo com a hipótese de indução, a matriz L0 é semelhante a uma τ -matriz da forma     λ1 ∗   t    ∗ ...  ∈ C(n−1)×(n−1) , (2.9) T0 =  =   0 λn−1 0 λn−1 com t ∈ C(n−2)×1 e In(T0 + T0∗ ) = In(K0 ). Como π(L) = 0, ou <(λn−1 ) < 0 ou <(λn−1 ) = 0. caso 1 Suponhamos que <(λn−1 ) < 0. Seja   −1 In−2 −(2<(λn−1 )) t  ∈ C(n−1)×(n−1) . X0 =  0 1. 26.

(34) 2.2 A nossa contribuição. Então a matriz T0 + T0∗ é congruente com a matriz X0 (T0 + T0∗ )X0∗ = S ⊕ [2<(λn−1 )] ∈ C(n−1)×(n−1) , para alguma matriz S ∈ C(n−2)×(n−2) . Logo In(K0 ) = In(T0 + T0∗ ) = In(S) + In ([2<(λn−1 )]), ou seja, In(S) = In(K0 ) − (0, 1, 0). Seja Kr ∈ C2×2 uma matriz tal que In(Kr ) = In(K) − In(S) ≥ In(K0 ) − In(S) = (0, 1, 0). Por hipótese de indução, existe ν ∈ C \ {0} tal que a matriz   λn−1 ν  ∈ C2×2 R= 0 λn satisfaz a condição In(R + R∗ ) = In(Kr ). Seja   T0  T =  0. (2<(λn−1 ))−1 νt ν λn.     ∈ Cn×n . . Pelo lema 2.2.2, T é uma matriz não derrogatória e, consequentemente, T e L são matrizes semelhantes. Seja X = X0 ⊕ [1]. Então a matriz T + T ∗ é congruente com a matriz X(T + T ∗ )X ∗ = S ⊕ (R + R∗ ), o que mostra que In(T + T ∗ ) = In(S) + In(R + R∗ ) = In(K). caso 2 Suponhamos agora que <(λn−1 ) = 0. Então, pela forma como foram ordenados os valores próprios da matriz L, <(λi ) = 0, para todo i ∈ {1, . . . , n − 1}, ou seja, todas as entradas principais da matriz T0 + T0∗ são iguais a 0. Particione-se a matriz T0 da seguinte forma:   T11 T12  ∈ C(n−1)×(n−1) , T0 =  0 T22   λn−2 t ∗  ∈ C2×2 , com t ∈ C \ {0}. Consequentemente, In(T2,2 + T2,2 onde T22 =  )= 0 λn−1 (1, 1, 0).. 27.

(35) 2.2 A nossa contribuição. Se n = 3, consideremos T0 = T22 . Como In(K) ≥ (1, 1, 0), pelo lema 2.2.3, existe y ∈ C tal que a matriz . λ t y  1  T =  0 λ2 1  0 0 λ3.     ∈ C3×3 . é semelhante à matriz L e satisfaz a condição In(T + T ∗ ) = In(K). Suponhamos agora que n > 3. Seja   ∗ −1 In−3 −T12 (T22 + T22 )  ∈ C(n−1)×(n−1) . X0 =  0 I2 Então a matriz T0 + T0∗ é congruente com a matriz ∗ ) ∈ C(n−1)×(n−1) , X0 (T0 + T0∗ )X0∗ = S ⊕ (T22 + T22. para alguma matriz S ∈ C(n−3)×(n−3) . Então ∗ In(K0 ) = In(T0 + T0∗ ) = In(S) + In(T22 + T22 ), ∗ ou seja, In(S) = In(K0 ) − In(T22 + T22 ). Novamente, pelo lema 2.2.3, existe y ∈ C tal que a. matriz.   T22  R=  0. y. .   3×3 1 ∈C  λn. satisfaz a condição In(R + R∗ ) = In(K) − In(S). Note-se que ∗ In(K) − In(S) ≥ In(K0 ) − In(S) = In(T22 + T22 ) = (1, 1, 0).. Seja . ∗ −1 T11 T12 T12 (T22 + T22 ) M.   T = 0  0. T22. M. 0. λn.     ∈ Cn×n , . com M = [y 1]T ∈ C2×1 . Pelo lema 2.2.2, T é uma matriz não derrogatória e como as matrizes T e L têm os mesmos valores próprios, são semelhantes. Seja X = X0 ⊕ [1] ∈ Cn×n . Então a matriz T + T ∗ é congruente com a matriz X(T + T ∗ )X ∗ = S ⊕ (R + R∗ ), o que mostra que In(T + T ∗ ) = In(S) + In(R + R∗ ) = In(K).. 28.

(36) 2.2 A nossa contribuição. Analogamente se mostra que: Lema 2.2.5 Seja L ∈ Cn×n uma matriz não derrogatória tal que ν(L) = 0. Seja K ∈ Cn×n uma matriz hermítica. Sejam ainda λ1 , . . . , λn os valores próprios de L ordenados de acordo com o lema 2.2.4. Suponhamos ainda que não é válido o caso (S0 ). Se são válidas as condições (2.2) a (2.6) então L é semelhante a uma τ -matriz da forma (2.8) e In(T + T ∗ ) = In(K). O próximo teorema é uma das soluções parciais do problema 1 a apresentar neste trabalho. Este resultado estabelece as relações entre a classe de semelhança da matriz L e a classe de congruência da matriz K quando é válida a equação de Lyapunov e H é uma matriz definida positiva e ou L é uma matriz não derrogatória ou K é uma matriz semi-definida positiva. Teorema 2.2.6 Sejam L, K ∈ Cn×n matrizes tais que K é uma matriz hermítica. Suponhamos que ou L é uma matriz não derrogatória ou K é uma matriz semi-definida positiva. Suponhamos ainda que não é válido o caso (S), referido no enunciado no teorema 2.2.1. Então existe uma matriz definida positiva H ∈ Cn×n tal que In(LH + HL∗ ) = In(K) se e só se são válidas as condições (2.2) a (2.6). Demonstração.. Note-se que o teorema 2.2.1 é a condição suficiente. Resta apenas mostrar. a condição necessária. Sejam L, K ∈ Cn×n matrizes tais que K é uma matriz hermítica e suponhamos não é válido o caso (S). Se a matriz L é escalar então é da forma L = λIn , para algum λ ∈ C. As condições (2.2) a (2.6) implicam que existe uma matriz definida positiva H ∈ Cn×n tal que In(K) = In(LH + HL∗ ). De facto, como In(L + L∗ ) = In(L), basta considerar H = In . Suponhamos agora que a matriz L é não escalar. A demonstração é feita por indução em n. Para n = 1, a demonstração é trivial. Suponhamos então que n ≥ 2.. 29.

(37) 2.2 A nossa contribuição. caso 1 Suponhamos que L é uma matriz não derrogatória. Vamos considerar 3 casos: (i) π(L) = 0, (ii) ν(L) = 0 e (iii) π(L) > 0 e ν(L) = 0. Suponhamos que π(L) = 0 Sejam λ1 , . . . , λn os valores próprios da matriz L. Sem perda de generalidade, suponhamos que estão ordenados de acordo com o lema 2.2.4. Se não é válido o caso (S0 ) então, pelo lema 2.2.4, existe uma matriz não singular X ∈ Cn×n tal que a matriz L é semelhante à matriz T = X −1 LX e In(T + T ∗ ) = In(K). Por outro lado, In(T + T ∗ ) = In (X(T + T ∗ )X ∗ ) = In(LXX ∗ + XX ∗ L∗ ). Logo existe uma matriz definida positiva H = XX ∗ ∈ Cn×n tal que In(LH + HL∗ ) = In(K). Note-se que XX ∗ é uma matriz definida positiva pois x∗ (XX ∗ )x > 0, para todo x ∈ C \ {0}. Suponhamos agora que (S0 ) é válido, ou seja, δ(L) > 0 e min{π(K), ν(K)} = 0. Então, pelas condições (2.2) a (2.6), concluimos que i20 (L) = 0, i0 (L) = 1 e δ(K) > 0. Além disso, como (S) não é válido, temos que δ(K) ≥ δ(L). Sem perda de generalidade, suponhamos que <(λ1 ) = 0. Suponhamos que n = 2. Suponhamos ainda que <(λ2 ) = 0. Como i20 (L) = 0, vem que λ1 6= λ2 e a matriz L é semelhante à matriz diag(λ1 , λ2 ). Sem perda de generalidade, suponhamos L = diag(λ1 , λ2 ). Então In(L + L∗ ) = (0, 0, 2) = In(K), pois δ(K) ≥ δ(L) = 2. Suponhamos agora que <(λ2 ) 6= 0. Sendo π(L) = 0, <(λ2 ) < 0. Novamente, sem perda de generalidade, consideremos L = diag(λ1 , λ2 ). Como δ(K) ≥ δ(L) = 1 e i− (L) = 1, pela condição (2.3), vem que ν(K) ≥ 1 e é fácil verificar que In(L + L∗ ) = (0, 1, 1) = In(K). Suponhamos agora que n ≥ 3. Como <(λ1 ) = 0 e i20 (L) = 0, a matriz L é semelhante à matriz [λ1 ] ⊕ L0 , para alguma matriz L0 ∈ C(n−1)×(n−1) . Sem perda de generalidade, seja L = [λ1 ]⊕L0 . Seja K0 ∈ C(n−1)×(n−1) uma matriz hermítica tal que In(K0 ) = In(K)−(0, 0, 1). De acordo com a hipótese de indução, existe uma matriz definida positiva H0 ∈ C(n−1)×(n−1) tal que In(L0 H0 + H0 L∗0 ) = In(K0 ). Seja H = [1] ⊕ H0 ∈ Cn×n . Então In(LH + HL∗ ) = In(K) e a demonstração para o caso π(L) = 0 fica completa. Suponhamos que ν(L) = 0 Este caso demonstra-se de forma análoga ao anterior.. 30.

(38) 2.2 A nossa contribuição. Suponhamos agora que ν(L) > 0 e π(L) > 0 Pelas condições (2.2) e (2.3), ν(K) > 0 e π(K) > 0. Assim a matriz L é semelhante a uma matriz da forma L+ ⊕ L− , onde L+ ∈ Cn+ ×n+ é uma matriz não derrogatória e ν(L+ ) = 0, L− ∈ Cn− ×n− é uma matriz não derrogatória e π(L− ) = δ(L− ) = 0, com n+ + n− = n. Sejam π+ , ν+ , δ+ , π− , ν− e δ− inteiros definidos por: π+ = max{1, min{π(K), n+ } − 1}, ν+ = min{ν(K), n+ − π+ }, δ+ = n + − π + − ν + , ν− = min{ν(K), n− }, π− = min{π(K), n− − ν− }, δ− = n − − π − − ν − . É fácil verificar que qualquer um dos inteiros π+ , ν+ , δ+ , π− , ν− e δ− é não negativo. Além disso, as seguintes desigualdades são satisfeitas: π+ ≥ 1, ν+ ≥ 1,. (2.10) a menos que. n+ = 1,. (2.11). ν− ≥ 1,. (2.12). max{π+ , π− } ≤ π(K) ≤ min{n+ + π− , n− + π+ },. (2.13). max{ν+ , ν− } ≤ ν(K) ≤ min{n+ + ν− , n− + ν+ },. (2.14). π(K) − ν(K) ≤ π+ + π− ,. (2.15). ν(K) − π(K) ≤ ν+ + ν− .. (2.16). De acordo com a hipótese de indução, existem matrizes definidas positivas H+ ∈ Cn+ ×n+ e H− ∈ Cn− ×n− tais que In(L+ H+ +H+ L∗+ ) = (π+ , ν+ , δ+ ) e In(L− H− +H− L∗− ) = (π− , ν− , δ− ). Dadas as condições (2.13) a (2.16) e, de acordo com o teorema 1.2.4, existe uma matriz X ∈ Cn+ ×n− tal que a matriz  . L+ H+ + X. ∗. H+ L∗+. . X L− H− +. H− L∗−.  ∈ Cn×n. (2.17). 31.

(39) 2.2 A nossa contribuição. tem a mesma inércia de K. Como as matrizes L+ e L− não têm valores próprios comuns, podemos supor, sem perda de generalidade, que   −1 L+ XH− . L= 0 L− Seja H = H+ ⊕ H− ∈ Cn×n . Então a matriz LH + HL∗ tem a forma (2.17) e, portanto, In(LH + HL∗ ) = In(K). caso 2 Suponhamos que K é uma matriz semi-definida positiva e L é uma matriz derrogatória. Sem perda de generalidade, consideremos a matriz L na sua forma normal companheira e suponhamos que L = L0 ⊕ Lr , com L0 = C(f1 ) ⊕ · · · ⊕ C(fr−1 ) ∈ Cn0 ×n0 e Lr = C(fr ) ∈ Cnr ×nr , onde f1 | · · · |fr são os polinómios invariantes da matriz L e n0 + nr = n. Sejam π0 , δ0 , πr e δr inteiros definidos por: π0 = max{i+ (L0 ), δ(Lr ) + π(K) − nr }, δ0 = n 0 − π 0 , πr = π(K) − π0 , δr = nr − πr . É fácil verificar que estes inteiros são não negativos. Como K ≥ 0 e ν(K) = 0, pela condição (2.3), temos que i− (L) = i20 (L) = 0. Além disso, como (S) não é válido, δ(L) ≤ δ(K). Não é difícil verificar que π0 ≥ i+ (L0 ), δ0 ≥ δ(L0 ) ≥ i0 (L0 ) ≥ 2i0 (L0 ) − n0 , πr ≥ i+ (Lr ), δr ≥ δ(Lr ) ≥ i0 (Lr ) ≥ 2i0 (Lr ) − nr . De acordo com a hipótese de indução, existem matrizes definidas positivas H0 ∈ Cn0 ×n0 e Hr ∈ Cnr ×nr tais que In(L0 H0 + H0 L∗0 ) = (π0 , 0, δ0 ) e In(Lr Hr + Hr L∗r ) = (πr , 0, δr ). Seja H = H0 ⊕ Hr ∈ Cn×n . Então In(LH + HL∗ ) = In(K).. 32.

(40) 2.2 A nossa contribuição. O teorema 2.2.6 nem sempre é válido quando L é uma matriz derrogatória e a matriz K não é semi-definida positiva, como se pode verificar no exemplo seguinte. Exemplo 2.2.7 Seja L = λ1 Ip ⊕ λ2 Iq ∈ Cn×n , onde λ1 , λ2 ∈ C são tais que λ1 6= λ2 e <(λ1 ) = <(λ2 ) = 0 e p+q = n. Suponhamos que é válido o teorema 2.2.6, ou seja, suponhamos que existe uma matriz definida positiva   H11 H12  ∈ Cn×n , H= ∗ H12 H22 tal que In(LH + HL∗ ) = In(K). Então  LH + HL∗ = . com. H11 ∈ Cp×p ,. 0. (λ1 − λ2 )H12. ∗ (λ2 − λ1 )H12. 0. (2.18).  . e pelas condições (iv) e (v) do teorema 1.2.4, π(K) = ν(K). Suponhamos que n = 5, p = 3 e q = 2 e seja K ∈ C5×5 uma matriz hermítica tal que In(K) = (2, 1, 2). Então, como 2 = δ(L) = δ(K) e min{π(K), ν(K)} = 1 6= 0, o caso (S) não é válido. Por outro lado, as condições (2.2) a (2.6) são válidas. E, no entanto, o teorema 2.2.6 não é válido pois, neste caso, 2 = π(K) 6= ν(K) = 1. O próximo resultado é o teorema 2.1.5 formulado como corolário do teorema anterior, apresentando assim uma demonstração alternativa à dada em [2, Corolário III]. Corolário 2.2.8 Seja L ∈ Cn×n uma matriz. Então existe uma matriz definida positiva H ∈ Cn×n tal que LH + HL∗ ≥ 0 se e só se a matriz L não tem divisores elementares com raízes imaginárias múltiplas e ν(L) = 0. Demonstração.. Seja L ∈ Cn×n uma matriz. Suponhamos que existe uma matriz definida. positiva H ∈ Cn×n tal que a matriz K = LH +HL∗ é semi-definida positiva, ou seja, π(K) > 0, ν(K) = 0 e δ(K) > 0. De acordo com o teorema 2.2.1, max{i− (L), i20 (L)} = 0, ou seja:. 33.

(41) 2.2 A nossa contribuição. i− (L) = 0, isto é, ν(L) = 0, i20 (L)} = 0, isto é, a matriz L não admite divisores elementares com raízes imaginárias múltiplas. Reciprocamente, suponhamos que a matriz L não admite divisores elementares com raízes imaginárias múltiplas e ν(L) = 0. Seja K ∈ Cn×n uma matriz hermítica tal que In(K) = (i+ (L), 0, n − i+ (L)). É fácil verificar que as condições (2.2) a (2.6) são válidas e δ(L) ≤ δ(K). Então, pelo teorema 2.2.6, existe uma matriz definida positiva H ∈ Cn×n tal que In(LH + HL∗ ) = In(K). Donde LH + HL∗ ≥ 0.. 2.2.2 L é uma matriz não derrogatória Nesta secção apresentamos condições para as classes de congruência das matrizes K e H quando é válida a equação de Lyapunov, L é uma matriz não derrogatória e K é uma matriz indefinida. O nosso resultado generaliza os resultados obtidos por L. M. DeAlba em [7]. Seguiremos de perto [19]. O próximo resultado é uma generalização do lema 2.2.3. Lema 2.2.9 Sejam a ∈ R e λ, µ ∈ C. Seja ainda K ∈ C3×3 uma matriz hermítica tal que In(K) ≥ (1, 1, 0). Então, para todo z ∈ C \ {0}, existe y ∈ C tal que a matriz   λ 1 y     T =  0 ia z  ∈ C3×3   0 0 µ satisfaz a condição In(T + T ∗ ) = In(K).. 34.

(42) 2.2 A nossa contribuição. Demonstração. Seja S ∈ Cn×n uma matriz definida por:  1 z −1 (2<(µ)z −1 − y) −z −1   S= 0 1 0  0 0 1.    . . Então a matriz T + T ∗ é congruente com a matriz   i h

(43)

(44) 0 z 2 . S(T + T ∗ )S ∗ = 2<(λ) + 2<(µ)

(45) z −1

(46) − 2< yz −1 ⊕  z 2<(µ) Assim  h.

(47)

(48) 2 In(T + T ∗ ) = In 2<(λ) + 2<(µ)

(49) z −1