Esta seção será dedicada a responder à pergunta surgida ao final do Exemplo 6.5.2: qual é a relação entre matrizes de
Começamos com um resultado fundamental na construção de uma resposta adequada.
Proposição 6.7.1Sejam𝑈 e𝑉 espaços vetoriais de dimensão finita, seja𝑇:𝑈 → 𝑉 uma transformação linear e sejamBeCbases ordenadas de𝑈e de𝑉, respectivamente. Então,𝑇 é bijetora se, e somente se, a matriz[𝑇]B C for inversível. Além disso, neste caso,[𝑇]−1B C =[𝑇−1]C B.
Demonstração Denote𝑛=dim(𝑈).
Suponha, primeiramente, que𝑇 é bijetora. Pelo Corolário 6.3.7, dim(𝑉) = 𝑛, e, portanto, [𝑇]B C é uma matriz quadrada de tamanho𝑛. Ainda, a bijetividade de𝑇 implica, pela Proposição 6.3.5, que existe a transformação inversa 𝑇−1:𝑉→𝑈e ela satisfaz𝑇◦𝑇−1=I𝑉 e𝑇−1◦𝑇 =I𝑈. Logo, usando a fórmula para a matriz da composta, obtida na Proposição 6.6.2,
[𝑇]B C[𝑇−1]C B=[𝑇◦𝑇−1]C =[I𝑉]C =𝐼𝑛, como vimos no Exemplo 6.5.3. Analogamente,
[𝑇−1]C B[𝑇]B C =[𝑇−1◦𝑇]B =[I𝑈]B=𝐼𝑛. Logo,[𝑇]B C é inversível, e[𝑇]−1B C =[𝑇−1]C B.
Reciprocamente, suponha que[𝑇]B C é inversível. Em particular,[𝑇]B Cé quadrada de tamanho𝑛e dim(𝑈)=𝑛= dim(𝑉). Seja𝐴=[𝑇]−1B C. Considere a transformação linear𝑆:𝑉 →𝑈tal que[𝑆]C B =𝐴. Mostremos que𝑆◦𝑇 =I𝑈
e que𝑇◦𝑆=I𝑉. Isso implicará que𝑇é bijetora (e que𝑆=𝑇−1). Por um lado, [𝑆◦𝑇]B =[𝑆]C B[𝑇]B C =𝐴[𝑇]B C =𝐼𝑛=[I𝑈]B.
Isso quer dizer que as transformações lineares𝑆◦𝑇e I𝑈, que já têm domínio e contradomínio comuns, coincidem em todos os elementos da baseB. Logo,𝑆◦𝑇 =I𝑈. De modo análogo,
[𝑇 ◦𝑆]C =[𝑇]B C[𝑆]C B =[𝑇]B C𝐴=𝐼𝑛=[I𝑉]C,
e isso implica𝑇◦𝑆=I𝑉, como queríamos.
Exemplo 6.7.2Mostre que a transformação linear
𝐿: R2 −→ P1(R)
(𝑥, 𝑦) ↦−→ (3𝑥−4𝑦) + (−𝑥+2𝑦)𝑡 é bijetora e encontre uma expressão para sua inversa.
Solução:Considere as bases canônicasB={(1,0),(0,1)}eC={1, 𝑡}deR2eP1(R), respectivamente. Então, como 𝐿(1,0)=3−𝑡e𝐿(0,1)=−4+2𝑡, segue que
[𝐿]B C =
3 −4
−1 2
.
Como det
3 −4
−1 2
= 2 ≠ 0, essa matriz é inversível. Pelo que vimos acima,𝐿 é bijetora e a transformação linear inversa𝐿−1: P1(R) →R2é tal que
[𝐿−1]C B =[𝐿]−1B C =
3 −4
−1 2 −1
= 1 2
12 3 2
. Isso quer dizer que𝐿−1(1)=1(1,0) +12(0,1)= 1,12
e que𝐿−1(𝑡)=2(1,0) +32(0,1)= 2,32
. Mas, conhecendo as imagens por𝐿−1de elementos de uma base deP1(R), conhecemos a imagem por𝐿−1de qualquer elemento deP1(R):
𝐿−1(𝑎+𝑏𝑡)=𝑎𝐿−1(1) +𝑏𝐿−1(𝑡)=𝑎
1,1 2
+𝑏
2,3 2
=
𝑎+2𝑏,𝑎+3𝑏 2
. ^
Já temos condição de responder à questão colocada no início da seção.
Teorema 6.7.3Sejam𝑈e𝑉espaços vetoriais de dimensão finita, seja𝑇:𝑈→𝑉uma transformação linear, sejamB eB′bases ordenadas de𝑈e sejamCeC′bases ordenadas de𝑉. Então,
[𝑇]B′C′ =𝑃[𝑇]B C𝑄−1, (6.17)
em que𝑃=[I𝑉]C C′e𝑄=[I𝑈]B B′.
Demonstração Para efeitos de verificação de compatibilidade de tamanhos das matrizes envolvidas, suponha que dim(𝑈) = 𝑛 e que dim(𝑉) = 𝑚. Então, [𝑇]B C,[𝑇]B′C′ ∈ 𝑀𝑚×𝑛(R). Além disso, 𝑃 = [I𝑉]C C′ ∈ 𝑀𝑚(R) e 𝑄= [I𝑈]B B′ ∈ 𝑀𝑛(R). Como a transformação identidade I𝑈 é obviamente bijetora, segue da Proposição 6.7.1 que 𝑄é inversível (e sua inversa𝑄−1tem mesmo tamanho que𝑄). Portanto, o produto de três matrizes no lado direito de (6.17) está definido e tem tamanho igual ao da matriz no lado esquerdo. Resta-nos, assim, demonstrar a igualdade.
Considere a transformação composta𝑇 ◦I𝑈:𝑈 →𝑉. Como I𝑈 é a transformação identidade de𝑈, é claro que 𝑇 ◦I𝑈 =𝑇. De modo análgo, I𝑉◦𝑇 =𝑇. Da Proposição 6.6.2, obtemos
[𝑇]B′C′[I𝑈]B B′ =[𝑇◦I𝑈]B C′=[𝑇]B C′=[I𝑉◦𝑇]B C′=[I𝑉]C C′[𝑇]B C.
Para obter, finalmente, (6.17), basta, agora, multiplicar ambos os termos dessa igualdade por𝑄−1à esquerda.
Aqui cabem alguns comentários. O primeiro é que para lembrar da expressão (6.17), o seguinte diagrama pode ser útil:
𝑈B′ 𝑉C′
𝑈B 𝑉C
𝑇 𝑇
I𝑈 I𝑉
Veja que, no diagrama, indicamos, além dos espaços vetoriais e das transformações entre eles, as bases envolvidas na determinação das matrizes de transformações lineares.
Em segundo lugar, observe que, como I𝑉 também é uma transformação linear bijetora, a matriz 𝑃 também é inversível. Assim, (6.17) poderia ter sido apresentada na seguinte forma alternativa:
[𝑇]B C =𝑃−1[𝑇]B′C′𝑄. (6.18)
(Enquanto (6.17) fornece[𝑇]B′C′a partir de[𝑇]B C, (6.18) faz o oposto, dá uma expressão para[𝑇]B Cem função de [𝑇]B′C′. Claro que uma das fórmula pode ser obtida a partir da outra, e ambas a partir do diagrama acima.)
O Teorema 6.7.3 será mais frequentemente utilizado para o estudo de operadores lineares. O corolário a seguir é uma consequência imediada do teorema (na forma (6.18), com𝑈=𝑉,B=CeB′=C′).
Corolário 6.7.4Seja𝑉 um espaço vetorial de dimensão finita, seja𝑇:𝑉 →𝑉 um operador linear e sejamB eC bases ordenadas de𝑉. Então,
[𝑇]C =𝑃−1[𝑇]B𝑃, (6.19)
em que𝑃=[I𝑉]C B.
Aqui, o diagrama também ajuda:
𝑉 𝑉
𝑉C 𝑉C
𝑇 𝑇
I𝑉 I𝑉
As matrizes dos operadores identidade que aparecem nas fórmula vistas acima são chamadasmatrizes de mudança de base. Elas, além de relacionarem [𝑇]B C e[𝑇]B′C′, também servem para “mudar coordenadas”, como mostra o próximo resultado.
Proposição 6.7.5Seja𝑉um espaço vetorial de dimensão finita e sejamBeCbases ordenadas de𝑉. Então, para todo 𝑢∈𝑉, temos
[𝑢]B=𝑃[𝑢]C, em que𝑃=[I𝑉]C B.
Demonstração Sabemos, do Teorema 6.5.6 (aplicado ao operador linear I𝑉:𝑉 →𝑉, usando as basesCno domínio eBno contradomínio), que
[𝑢]B =[I𝑉(𝑢)]B=[I𝑉]C B[𝑢]C,
que é o que desejávamos.
Note que, como I𝑉(𝑢)=𝑢, para todo𝑢∈𝑉, as colunas de[I𝑉]C Bsão precisamente as coordenadas, em relação à baseBdos vetores que compõem a baseC, na ordem em que eles estão listados emC.
Mais um comentário a respeito de matrizes de mudança de base merece registro. Sabemos que uma matriz de mudança de base é sempre inversível (já que é a matriz do operador identidade, que é bijetor), mas vale mais. Se𝑉é um espaço vetorial de dimensão finita eBeCsão bases ordenadas de𝑉, então
[I𝑉]C B=[I𝑉]−B C1 . (6.20)
Isso segue da Proposição 6.7.1 e do fato óbvio que I−𝑉1 =I𝑉.
Observação O conceito de matriz de mudança de base já havia surgido no contexto de vetores deV3, mais especifi-camente, na ocasião em que vimos o Teorema 2.6.1. Veja que a notação que foi utilizada então se expressa, agora, da seguinte maneira:𝑀
C B=[IV3]C B, de sorte que há uniformidade na nomenclatura.
Exemplo 6.7.6Considere o operador linear deR2definido por 𝑇:R2 −→R2
(𝑥, 𝑦) ↦−→ (𝑥−𝑦, 𝑥+2𝑦).
Encontre as matrizes[𝑇]Be[𝑇]C, em queBdenota a base canônica deR2eC={(1,3),(−1,0)}. Solução:Temos𝑇(1,0) = (1,1) e𝑇(0,1) = (−1,2), o que acarreta [𝑇]B =
1−1 1 2
. Agora, usaremos (6.19) para determinar[𝑇]C. Para tanto, é preciso encontrar𝑃=[IR2]C B. Como
IR2(1,3)=(1,3)=1(1,0) +3(0,1) e IR2(−1,0)=(−1,0)=(−1)(1,0) +0(0,1), segue que𝑃=
1−1 3 0
. Logo4,
[𝑇]C=𝑃−1[𝑇]B𝑃= 1−1
3 0 −1
1−1 1 2
1−1 3 0
= 1 3
0 1
−3 1 1−1 1 2
1−1 3 0
= 1 3
7 −1 13 2
. Obviamente, uma outra solução seria calcular diretamente:
4Aqui usaremos a utilíssima fórmula 𝑎 𝑏 𝑐 𝑑
−1
= 1 𝑎𝑑−𝑏𝑐
𝑑 −𝑏
−𝑐 𝑎
,
que vale sempre que det
𝑎 𝑏
𝑐 𝑑
=𝑎𝑑−𝑏𝑐≠0.
𝑇(1,3)=(−2,7)=7
3(1,3) + 13
3 (−1,0) e 𝑇(−1,0)=(−1,−1)=
−1 3
(1,3) + 2
3(−1,0). ^ Exemplo 6.7.7(Prova 2, Álgebra Linear II, 2015) Sabendo que a matriz da transformação linear𝑇:P2(R) →R2em relação às bases ordenadasB={1, 𝑥+𝑥2, 𝑥2}eC={(1,−1),(1,1)}deP2(R)e deR2, respectivamente, é
3 0 1 1 2−1
, o vetor𝑇(𝑥2−𝑥+1)é
(A)(5,−3) (B)(2,−8) (C)(5,3) (D)(−2,−8) (E)(−5,−5)
Solução:Seja𝑣=𝑥2−𝑥+1. Sabemos, pelo Teorema 6.5.6, que[𝑇(𝑣)]C=[𝑇]B C[𝑣]B. Agora, pela Proposição 6.7.5, [𝑣]B =𝑃[𝑣]D, em queDdenota a base canônica deP2(R)(isto é,D={1, 𝑥, 𝑥2}), e𝑃=[I]D B, em que I denota o operador identidade deP2(R). É claro que [𝑣]D =
1
−1 1
. Agora, sabemos que𝑃 =[I]D B =[I]−B D1 , e essa segunda matriz é fácil de descrever :
[I]B D=
1 0 0 0 1 0 0 1 1
.
(O que foi feito aqui foi escrever as coordenadas dos vetores deBem relação à baseD, o que é fácil, poisDé a base canônica.) Procedemos, agora, à inversão dessa matriz:
1 0 0 1 0 0 0 1 0 0 1 0 0 1 1 0 0 1
→
1 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0−1 1
Assim,
𝑃=[I]D B=[I]−1B D =
1 0 0 0 1 0 0 1 1
−1
=
1 0 0 0 1 0 0−1 1
. Concluímos, portanto, que
[𝑣]B=𝑃[𝑣]D =
1 0 0 0 1 0 0−1 1
1
−1 1
=
1
−1 2
. Logo,
[𝑇(𝑣)]C=[𝑇]B C[𝑣]B = 3 0 1
1 2−1
1
−1 2
= 5
−3
. Assim,𝑇(𝑣)=5(1,−1) + (−3)(1,1)=(2,−8).Resposta:(B)
Poderíamos ir além e encontrar a expressão para𝑇(𝑎+𝑏𝑥+𝑐𝑥2). Basta fazer
[𝑎+𝑏𝑥+𝑐𝑥2]B=𝑃[𝑎+𝑏𝑥+𝑐𝑥2]D =
1 0 0 0 1 0 0−1 1
𝑎 𝑏 𝑐
=
𝑎 𝑏
−𝑏+𝑐
, donde
[𝑇(𝑎+𝑏𝑥+𝑐𝑥2)]C =[𝑇]B C[𝑎+𝑏𝑥+𝑐𝑥2]B= 3 0 1
1 2−1
𝑎 𝑏
−𝑏+𝑐
=
3𝑎−𝑏+𝑐 𝑎+3𝑏−𝑐
. Portanto,𝑇(𝑎+𝑏𝑐+𝑐𝑥2)=(3𝑎−𝑏+𝑐)(1,−1) + (𝑎+3𝑏−𝑐)(1,1)=(4𝑎+2𝑏,−2𝑎+4𝑏−2𝑐). ^
Observação Neste capítulo, vimos que se 𝑈 e𝑉 são espaços vetoriais de dimensão finita, com dim(𝑈) = 𝑛 e dim(𝑉) =𝑚, e seBeCsão bases ordenadas de𝑈e de𝑉, respectivamente, a cada transformação linear𝑇:𝑈 →𝑉 associa-se uma matriz[𝑇]B C ∈ 𝑀𝑚×𝑛(R). Dois comentários a respeito dessa associação são devidos:
(i) Essa associação é injetora, no sentido de que se𝑇1 e𝑇2 são transformações lineares de𝑈 em𝑉 tais que [𝑇1]B C=[𝑇2]B C, então𝑇1=𝑇2. (Isso decorre do fato de, além de terem o mesmo domínio e contradomínio, as tranformações lineares𝑇1 e𝑇2 têm a mesma imagem em cada elemento do domínio. Com efeito, dado 𝑢 ∈𝑈, temos
[𝑇1(𝑢) −𝑇2(𝑢)]C =[𝑇1(𝑢)]C− [𝑇2(𝑢)]C =[𝑇1]B C[𝑢]B− [𝑇2]B C[𝑢]B
= [𝑇1]B C− [𝑇2]B C
[𝑢]B=0[𝑢]B =0.
Logo,𝑇1(𝑢)=𝑇2(𝑢), uma vez que o único vetor de𝑉 que têm todas as coordenadas nulas é 0𝑉.)
(ii) Essa associação é também sobrejetora; em outras palavras, dada 𝐴 ∈ 𝑀𝑚×𝑛(R) existe uma (única, como acabamos de ver) transformação linear 𝑇:𝑈 → 𝑉 tal que [𝑇]B C = 𝐴. (Com efeito, suponha que B = {𝑢1, . . . , 𝑢𝑛} eC = {𝑣1, . . . , 𝑣𝑚}, então, se 𝐴 = (𝑎𝑖 𝑗), basta tomar𝑇 como sendo a transformação linear definida por𝑇(𝑢𝑗)=𝑎1𝑗𝑣1+𝑎2𝑗𝑣2+ · · · +𝑎𝑚 𝑗𝑣𝑚, para todo 𝑗 =1, . . . , 𝑛.)
Note que essas observações foram tacitamente assumidas nos Exemplos 6.5.8, 6.5.9 e 6.7.7, nos quais, dada uma matriz, assumimos que estava definida uma única transformação linear cuja matriz coincidia com a matriz dada.
Exercícios Lista 2 - Álgebra Linear II: Exs. 44–48.
Capítulo 7
Diagonalização de operadores
Neste capítulo, procedemos a uma análise mais profunda de operadores lineares em espaço de dimensão finita a fim de descrevê-los da maneira mais simples possível, em um sentido que ficará claro à medida que progredimos.
Para introduzir o conceito principal deste capítulo, o de autovetor de um operador linear, comecemos por um exemplo simples, aparentemente não diretamente relacionado com o estudo de operadores lineares.
Seja 𝑛 um inteiro positivo. Dizemos que uma matriz 𝐷 = (𝑑𝑖 𝑗) ∈ 𝑀𝑛(R) édiagonal se 𝑑𝑖 𝑗 = 0 para todos 𝑖, 𝑗 =1, . . . , 𝑛tais que𝑖 ≠ 𝑗. Em outras palavras,𝐷é diagonal se apenas as entradas em sua diagonal principal são eventualmente não nulas, isto é, se𝐷o seguinte formato:
𝐷=
𝜆1 0 . . . 0 0 0 𝜆2 . . . 0 0 ... ... . .. ... ... 0 0 . . . 𝜆𝑛−1 0 0 0 . . . 0 𝜆𝑛
(Destacamos as entradas na diagonal principal de𝐷 com a cor vermelha. Todas as demais entradas são nulas.) Em algumas ocasiões, quando for conveniente, denotaremos a matriz diagonal 𝐷 ∈ 𝑀𝑛(R) cujas entradas na diagonal principal são𝜆1, 𝜆2, . . . , 𝜆𝑛, nessa ordem, por𝐷=diag(𝜆1, 𝜆2, . . . , 𝜆𝑛).
De acordo com a definição do produto entre matrizes, fica claro que as potências da matriz diagonal𝐷são também matrizes diagonais, dadas por
𝐷𝑟 =
𝜆𝑟1 0 . . . 0 0 0 𝜆𝑟2 . . . 0 0 ... ... . .. ... ... 0 0 . . . 𝜆𝑟𝑛−1 0 0 0 . . . 0 𝜆𝑟𝑛
,
para todo inteiro positivo 𝑟. Usando a notação introduzida acima, se 𝐷 = diag(𝜆1, 𝜆2, . . . , 𝜆𝑛), então 𝐷𝑟 = diag(𝜆𝑟1, 𝜆𝑟2, . . . , 𝜆𝑟𝑛).
Em geral, calcular a potência de uma matriz quadrada é muito custoso, pois são muitas as operações envolvendo suas entradas a serem efetuadas. Porém, se𝐷é diagonal, como vimos, suas potências são calculadas de modo imediado.
Há um caso intermediário, em que, apesar de não se tratar de uma matriz diagonal, é bastante rápido o cálculo de suas potências. Este é o caso destacado na definição a seguir.
Definição Seja𝑛um inteiro positivo. Dizemos que uma matriz 𝐴 ∈ 𝑀𝑛(R) édiagonalizávelse existir uma matriz inversível𝑃∈𝑀𝑛(R)tal que𝑃−1𝐴𝑃seja uma matriz diagonal.
Voltando à nossa discussão sobre potências, se𝐴 ∈ 𝑀𝑛(R)é diagonalizável, digamos,𝑃−1𝐴𝑃= 𝐷, com𝑃, 𝐷 ∈ 𝑀𝑛(R),𝑃inversível e𝐷diagonal, então, para calcular a𝑟-ésima potência de𝐴, procedemos da seguinte maneira: de 𝑃−1𝐴𝑃=𝐷, segue que𝐴=𝑃𝐷𝑃−1; assim,
𝐴𝑟 =(𝑃𝐷𝑃−1)𝑟=(𝑃𝐷𝑃−1)(𝑃𝐷𝑃−1). . .(𝑃𝐷𝑃−1),
em que o produto do lado direito tem𝑟fatores da forma𝑃𝐷𝑃−1. Nessa expressão, toda ocorrência da matriz𝑃, exceto pela mais à esquerda, vem acompanhada de𝑃−1multiplicada por ela à esquerda:
(𝑃𝐷𝑃−1)(𝑃𝐷𝑃−1). . .(𝑃𝐷𝑃−1)(𝑃𝐷𝑃−1)=𝑃𝐷(𝑃−1𝑃)𝐷(𝑃−1𝑃)𝐷 . . . 𝐷(𝑃−1𝑃)𝐷𝑃−1.
Cada um dos produtos𝑃−1𝑃 é igual à matriz identidade𝐼𝑟. Portanto, todas as ocorrências de𝑃 e𝑃−1 entre𝐷’s se cancelam, de modo que temos, ao final,
𝐴𝑟 =(𝑃𝐷𝑃−1)𝑟 =𝑃𝐷𝑟𝑃−1,
que resulta em uma expressão para a potência de𝐴envolvendo um número muito menor de cálculos a serem efetuados entre as entradas de𝐴.
Em resumo, se𝐴for diagonalizável, suas potências são fáceis de serem calculadas. Nem toda matriz é diagonalizável, entretanto. Será objeto deste capítulo determinar condições necessárias e suficientes para tanto. E, em caso afirmativo, veremos como encontrar as matrizes𝑃e𝐷.