Mudança de base - Álgebra Linear

Esta seção será dedicada a responder à pergunta surgida ao ﬁnal do Exemplo 6.5.2: qual é a relação entre matrizes de

Começamos com um resultado fundamental na construção de uma resposta adequada.

Proposição 6.7.1Sejam𝑈 e𝑉 espaços vetoriais de dimensão ﬁnita, seja𝑇:𝑈 → 𝑉 uma transformação linear e sejamBeCbases ordenadas de𝑈e de𝑉, respectivamente. Então,𝑇 é bĳetora se, e somente se, a matriz[𝑇]_{B C} for inversível. Além disso, neste caso,[𝑇]⁻¹_{B C} =[𝑇⁻¹]_{C B}.

Demonstração Denote𝑛=dim(𝑈).

Suponha, primeiramente, que𝑇 é bĳetora. Pelo Corolário 6.3.7, dim(𝑉) = 𝑛, e, portanto, [𝑇]_{B C} é uma matriz quadrada de tamanho𝑛. Ainda, a bĳetividade de𝑇 implica, pela Proposição 6.3.5, que existe a transformação inversa 𝑇⁻¹:𝑉→𝑈e ela satisfaz𝑇◦𝑇⁻¹=I_𝑉 e𝑇⁻¹◦𝑇 =I_𝑈. Logo, usando a fórmula para a matriz da composta, obtida na Proposição 6.6.2,

[𝑇]_{B C}[𝑇⁻¹]_{C B}=[𝑇◦𝑇⁻¹]_C =[I_𝑉]_C =𝐼_𝑛, como vimos no Exemplo 6.5.3. Analogamente,

[𝑇⁻¹]_{C B}[𝑇]_{B C} =[𝑇⁻¹◦𝑇]B =[I_𝑈]_B=𝐼_𝑛. Logo,[𝑇]_{B C} é inversível, e[𝑇]⁻¹_{B C} =[𝑇⁻¹]_{C B}.

Reciprocamente, suponha que[𝑇]_{B C} é inversível. Em particular,[𝑇]_{B C}é quadrada de tamanho𝑛e dim(𝑈)=𝑛= dim(𝑉). Seja𝐴=[𝑇]⁻¹_{B C}. Considere a transformação linear𝑆:𝑉 →𝑈tal que[𝑆]_{C B} =𝐴. Mostremos que𝑆◦𝑇 =I𝑈

e que𝑇◦𝑆=I_𝑉. Isso implicará que𝑇é bĳetora (e que𝑆=𝑇⁻¹). Por um lado, [𝑆◦𝑇]_B =[𝑆]_{C B}[𝑇]_{B C} =𝐴[𝑇]_{B C} =𝐼_𝑛=[I𝑈]B.

Isso quer dizer que as transformações lineares𝑆◦𝑇e I𝑈, que já têm domínio e contradomínio comuns, coincidem em todos os elementos da baseB. Logo,𝑆◦𝑇 =I𝑈. De modo análogo,

[𝑇 ◦𝑆]_C =[𝑇]_{B C}[𝑆]_{C B} =[𝑇]_{B C}𝐴=𝐼_𝑛=[I𝑉]C,

e isso implica𝑇◦𝑆=I_𝑉, como queríamos.

Exemplo 6.7.2Mostre que a transformação linear

𝐿: R² −→ P¹(R)

(𝑥, 𝑦) ↦−→ (3𝑥−4𝑦) + (−𝑥+2𝑦)𝑡 é bĳetora e encontre uma expressão para sua inversa.

Solução:Considere as bases canônicasB={(1,0),(0,1)}eC={1, 𝑡}deR²eP1(R), respectivamente. Então, como 𝐿(1,0)=3−𝑡e𝐿(0,1)=−4+2𝑡, segue que

[𝐿]_{B C} =

3 −4

−1 2

Como det

3 −4

−1 2

= 2 ≠ 0, essa matriz é inversível. Pelo que vimos acima,𝐿 é bĳetora e a transformação linear inversa𝐿⁻¹: P¹(R) →R²é tal que

[𝐿⁻¹]_{C B} =[𝐿]⁻¹_{B C} =

3 −4

−1 2 ₋1

= 1 2

12 3 2

. Isso quer dizer que𝐿⁻¹(1)=1(1,0) +¹2(0,1)= 1,¹₂

e que𝐿⁻¹(𝑡)=2(1,0) +³2(0,1)= 2,³₂

. Mas, conhecendo as imagens por𝐿⁻¹de elementos de uma base deP1(R), conhecemos a imagem por𝐿⁻¹de qualquer elemento deP1(R):

𝐿⁻¹(𝑎+𝑏𝑡)=𝑎𝐿⁻¹(1) +𝑏𝐿⁻¹(𝑡)=𝑎

1,1 2

+𝑏

2,3 2

𝑎+2𝑏,𝑎+3𝑏 2

. ^

Já temos condição de responder à questão colocada no início da seção.

Teorema 6.7.3Sejam𝑈e𝑉espaços vetoriais de dimensão ﬁnita, seja𝑇:𝑈→𝑉uma transformação linear, sejamB eB^′bases ordenadas de𝑈e sejamCeC^′bases ordenadas de𝑉. Então,

[𝑇]_B^′_C^′ =𝑃[𝑇]_{B C}𝑄⁻¹, (6.17)

em que𝑃=[I_𝑉]_{C C}′e𝑄=[I_𝑈]_{B B}′.

Demonstração Para efeitos de veriﬁcação de compatibilidade de tamanhos das matrizes envolvidas, suponha que dim(𝑈) = 𝑛 e que dim(𝑉) = 𝑚. Então, [𝑇]_{B C},[𝑇]_B′C^′ ∈ 𝑀_𝑚_×_𝑛(R). Além disso, 𝑃 = [I𝑉]_{C C}′ ∈ 𝑀_𝑚(R) e 𝑄= [I𝑈]_{B B}′ ∈ 𝑀_𝑛(R). Como a transformação identidade I𝑈 é obviamente bĳetora, segue da Proposição 6.7.1 que 𝑄é inversível (e sua inversa𝑄⁻¹tem mesmo tamanho que𝑄). Portanto, o produto de três matrizes no lado direito de (6.17) está deﬁnido e tem tamanho igual ao da matriz no lado esquerdo. Resta-nos, assim, demonstrar a igualdade.

Considere a transformação composta𝑇 ◦I𝑈:𝑈 →𝑉. Como I𝑈 é a transformação identidade de𝑈, é claro que 𝑇 ◦I_𝑈 =𝑇. De modo análgo, I_𝑉◦𝑇 =𝑇. Da Proposição 6.6.2, obtemos

[𝑇]_B′C^′[I_𝑈]_{B B}′ =[𝑇◦I_𝑈]_{B C}′=[𝑇]_{B C}′=[I_𝑉◦𝑇]_{B C}′=[I_𝑉]_{C C}′[𝑇]_{B C}.

Para obter, ﬁnalmente, (6.17), basta, agora, multiplicar ambos os termos dessa igualdade por𝑄⁻¹à esquerda.

Aqui cabem alguns comentários. O primeiro é que para lembrar da expressão (6.17), o seguinte diagrama pode ser útil:

𝑈_B′ 𝑉_C′

𝑈_B 𝑉_C

𝑇 𝑇

I_𝑈 I_𝑉

Veja que, no diagrama, indicamos, além dos espaços vetoriais e das transformações entre eles, as bases envolvidas na determinação das matrizes de transformações lineares.

Em segundo lugar, observe que, como I_𝑉 também é uma transformação linear bĳetora, a matriz 𝑃 também é inversível. Assim, (6.17) poderia ter sido apresentada na seguinte forma alternativa:

[𝑇]_{B C} =𝑃⁻¹[𝑇]_B^′_C^′𝑄. (6.18)

(Enquanto (6.17) fornece[𝑇]_B′C^′a partir de[𝑇]_{B C}, (6.18) faz o oposto, dá uma expressão para[𝑇]_{B C}em função de [𝑇]_B′C^′. Claro que uma das fórmula pode ser obtida a partir da outra, e ambas a partir do diagrama acima.)

O Teorema 6.7.3 será mais frequentemente utilizado para o estudo de operadores lineares. O corolário a seguir é uma consequência imediada do teorema (na forma (6.18), com𝑈=𝑉,B=CeB^′=C^′).

Corolário 6.7.4Seja𝑉 um espaço vetorial de dimensão ﬁnita, seja𝑇:𝑉 →𝑉 um operador linear e sejamB eC bases ordenadas de𝑉. Então,

[𝑇]_C =𝑃⁻¹[𝑇]_B𝑃, (6.19)

em que𝑃=[I𝑉]_{C B}.

Aqui, o diagrama também ajuda:

𝑉 𝑉

𝑉_C 𝑉_C

𝑇 𝑇

I𝑉 I𝑉

As matrizes dos operadores identidade que aparecem nas fórmula vistas acima são chamadasmatrizes de mudança de base. Elas, além de relacionarem [𝑇]_{B C} e[𝑇]_B′C^′, também servem para “mudar coordenadas”, como mostra o próximo resultado.

Proposição 6.7.5Seja𝑉um espaço vetorial de dimensão ﬁnita e sejamBeCbases ordenadas de𝑉. Então, para todo 𝑢∈𝑉, temos

[𝑢]_B=𝑃[𝑢]_C, em que𝑃=[I_𝑉]_{C B}.

Demonstração Sabemos, do Teorema 6.5.6 (aplicado ao operador linear I𝑉:𝑉 →𝑉, usando as basesCno domínio eBno contradomínio), que

[𝑢]_B =[I_𝑉(𝑢)]_B=[I_𝑉]_{C B}[𝑢]_C,

que é o que desejávamos.

Note que, como I_𝑉(𝑢)=𝑢, para todo𝑢∈𝑉, as colunas de[I_𝑉]_{C B}são precisamente as coordenadas, em relação à baseBdos vetores que compõem a baseC, na ordem em que eles estão listados emC.

Mais um comentário a respeito de matrizes de mudança de base merece registro. Sabemos que uma matriz de mudança de base é sempre inversível (já que é a matriz do operador identidade, que é bĳetor), mas vale mais. Se𝑉é um espaço vetorial de dimensão ﬁnita eBeCsão bases ordenadas de𝑉, então

[I𝑉]_{C B}=[I𝑉]⁻_{B C}¹ . (6.20)

Isso segue da Proposição 6.7.1 e do fato óbvio que I⁻_𝑉¹ =I_𝑉.

Observação O conceito de matriz de mudança de base já havia surgido no contexto de vetores deV³, mais especiﬁ-camente, na ocasião em que vimos o Teorema 2.6.1. Veja que a notação que foi utilizada então se expressa, agora, da seguinte maneira:𝑀

C B=[IV³]_{C B}, de sorte que há uniformidade na nomenclatura.

Exemplo 6.7.6Considere o operador linear deR²deﬁnido por 𝑇:R² −→R²

(𝑥, 𝑦) ↦−→ (𝑥−𝑦, 𝑥+2𝑦).

Encontre as matrizes[𝑇]_Be[𝑇]_C, em queBdenota a base canônica deR²eC={(1,3),(−1,0)}. Solução:Temos𝑇(1,0) = (1,1) e𝑇(0,1) = (−1,2), o que acarreta [𝑇]_B =

1−1 1 2

. Agora, usaremos (6.19) para determinar[𝑇]_C. Para tanto, é preciso encontrar𝑃=[IR2]_{C B}. Como

IR²(1,3)=(1,3)=1(1,0) +3(0,1) e IR²(−1,0)=(−1,0)=(−1)(1,0) +0(0,1), segue que𝑃=

1−1 3 0

. Logo4,

[𝑇]_C=𝑃⁻¹[𝑇]_B𝑃= 1−1

3 0 −1

1−1 1 2

1−1 3 0

= 1 3

0 1

−3 1 1−1 1 2

1−1 3 0

= 1 3

7 −1 13 2

. Obviamente, uma outra solução seria calcular diretamente:

4Aqui usaremos a utilíssima fórmula 𝑎 𝑏 𝑐 𝑑

−1

= 1 𝑎𝑑−𝑏𝑐

𝑑 −𝑏

−𝑐 𝑎

que vale sempre que det

𝑎 𝑏

𝑐 𝑑

=𝑎𝑑−𝑏𝑐≠0.

𝑇(1,3)=(−2,7)=7

3(1,3) + 13

3 (−1,0) e 𝑇(−1,0)=(−1,−1)=

−1 3

(1,3) + 2

3(−1,0). ^ Exemplo 6.7.7(Prova 2, Álgebra Linear II, 2015) Sabendo que a matriz da transformação linear𝑇:P²(R) →R²em relação às bases ordenadasB={1, 𝑥+𝑥², 𝑥²}eC={(1,−1),(1,1)}deP2(R)e deR², respectivamente, é

3 0 1 1 2−1

, o vetor𝑇(𝑥²−𝑥+1)é

(A)(5,−3) (B)(2,−8) (C)(5,3) (D)(−2,−8) (E)(−5,−5)

Solução:Seja𝑣=𝑥²−𝑥+1. Sabemos, pelo Teorema 6.5.6, que[𝑇(𝑣)]_C=[𝑇]_{B C}[𝑣]_B. Agora, pela Proposição 6.7.5, [𝑣]_B =𝑃[𝑣]_D, em queDdenota a base canônica deP2(R)(isto é,D={1, 𝑥, 𝑥²}), e𝑃=[I]_{D B}, em que I denota o operador identidade deP2(R). É claro que [𝑣]D = 



−1 1



. Agora, sabemos que𝑃 =[I]_{D B} =[I]⁻_{B D}¹ , e essa segunda matriz é fácil de descrever :

[I]_{B D}=



1 0 0 0 1 0 0 1 1



.

(O que foi feito aqui foi escrever as coordenadas dos vetores deBem relação à baseD, o que é fácil, poisDé a base canônica.) Procedemos, agora, à inversão dessa matriz:





1 0 0 1 0 0 0 1 0 0 1 0 0 1 1 0 0 1



 →



1 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0−1 1





Assim,

𝑃=[I]_{D B}=[I]⁻¹_{B D} =



1 0 0 0 1 0 0 1 1





−1

=



1 0 0 0 1 0 0−1 1



. Concluímos, portanto, que

[𝑣]_B=𝑃[𝑣]_D =



1 0 0 0 1 0 0−1 1









−1 1



 = 



−1 2



. Logo,

[𝑇(𝑣)]_C=[𝑇]_{B C}[𝑣]_B = 3 0 1

1 2−1 



−1 2



 = 5

−3

. Assim,𝑇(𝑣)=5(1,−1) + (−3)(1,1)=(2,−8).Resposta:(B)

Poderíamos ir além e encontrar a expressão para𝑇(𝑎+𝑏𝑥+𝑐𝑥²). Basta fazer

[𝑎+𝑏𝑥+𝑐𝑥²]B=𝑃[𝑎+𝑏𝑥+𝑐𝑥²]D =



1 0 0 0 1 0 0−1 1









𝑎 𝑏 𝑐



 =



𝑎 𝑏

−𝑏+𝑐



, donde

[𝑇(𝑎+𝑏𝑥+𝑐𝑥²)]_C =[𝑇]_{B C}[𝑎+𝑏𝑥+𝑐𝑥²]_B= 3 0 1

1 2−1 



𝑎 𝑏

−𝑏+𝑐



 =

3𝑎−𝑏+𝑐 𝑎+3𝑏−𝑐

. Portanto,𝑇(𝑎+𝑏𝑐+𝑐𝑥²)=(3𝑎−𝑏+𝑐)(1,−1) + (𝑎+3𝑏−𝑐)(1,1)=(4𝑎+2𝑏,−2𝑎+4𝑏−2𝑐). ^

Observação Neste capítulo, vimos que se 𝑈 e𝑉 são espaços vetoriais de dimensão ﬁnita, com dim(𝑈) = 𝑛 e dim(𝑉) =𝑚, e seBeCsão bases ordenadas de𝑈e de𝑉, respectivamente, a cada transformação linear𝑇:𝑈 →𝑉 associa-se uma matriz[𝑇]_{B C} ∈ 𝑀_𝑚×𝑛(R). Dois comentários a respeito dessa associação são devidos:

(i) Essa associação é injetora, no sentido de que se𝑇₁ e𝑇₂ são transformações lineares de𝑈 em𝑉 tais que [𝑇₁]_{B C}=[𝑇₂]_{B C}, então𝑇₁=𝑇₂. (Isso decorre do fato de, além de terem o mesmo domínio e contradomínio, as tranformações lineares𝑇₁ e𝑇₂ têm a mesma imagem em cada elemento do domínio. Com efeito, dado 𝑢 ∈𝑈, temos

[𝑇₁(𝑢) −𝑇₂(𝑢)]_C =[𝑇₁(𝑢)]_C− [𝑇₂(𝑢)]_C =[𝑇₁]_{B C}[𝑢]_B− [𝑇₂]_{B C}[𝑢]_B

= [𝑇₁]_{B C}− [𝑇₂]_{B C}

[𝑢]_B=0[𝑢]_B =0.

Logo,𝑇₁(𝑢)=𝑇₂(𝑢), uma vez que o único vetor de𝑉 que têm todas as coordenadas nulas é 0𝑉.)

(ii) Essa associação é também sobrejetora; em outras palavras, dada 𝐴 ∈ 𝑀_𝑚_×_𝑛(R) existe uma (única, como acabamos de ver) transformação linear 𝑇:𝑈 → 𝑉 tal que [𝑇]_{B C} = 𝐴. (Com efeito, suponha que B = {𝑢₁, . . . , 𝑢_𝑛} eC = {𝑣₁, . . . , 𝑣_𝑚}, então, se 𝐴 = (𝑎_{𝑖 𝑗}), basta tomar𝑇 como sendo a transformação linear deﬁnida por𝑇(𝑢_𝑗)=𝑎₁_𝑗𝑣₁+𝑎₂_𝑗𝑣₂+ · · · +𝑎_{𝑚 𝑗}𝑣_𝑚, para todo 𝑗 =1, . . . , 𝑛.)

Note que essas observações foram tacitamente assumidas nos Exemplos 6.5.8, 6.5.9 e 6.7.7, nos quais, dada uma matriz, assumimos que estava deﬁnida uma única transformação linear cuja matriz coincidia com a matriz dada.

Exercícios Lista 2 - Álgebra Linear II: Exs. 44–48.

Capítulo 7

Diagonalização de operadores

Neste capítulo, procedemos a uma análise mais profunda de operadores lineares em espaço de dimensão finita a fim de descrevê-los da maneira mais simples possível, em um sentido que ficará claro à medida que progredimos.

Para introduzir o conceito principal deste capítulo, o de autovetor de um operador linear, comecemos por um exemplo simples, aparentemente não diretamente relacionado com o estudo de operadores lineares.

Seja 𝑛 um inteiro positivo. Dizemos que uma matriz 𝐷 = (𝑑_{𝑖 𝑗}) ∈ 𝑀_𝑛(R) édiagonal se 𝑑_{𝑖 𝑗} = 0 para todos 𝑖, 𝑗 =1, . . . , 𝑛tais que𝑖 ≠ 𝑗. Em outras palavras,𝐷é diagonal se apenas as entradas em sua diagonal principal são eventualmente não nulas, isto é, se𝐷o seguinte formato:

𝐷=







𝜆₁ 0 . . . 0 0 0 𝜆₂ . . . 0 0 ... ... . .. ... ... 0 0 . . . 𝜆_𝑛−1 0 0 0 . . . 0 𝜆_𝑛







(Destacamos as entradas na diagonal principal de𝐷 com a cor vermelha. Todas as demais entradas são nulas.) Em algumas ocasiões, quando for conveniente, denotaremos a matriz diagonal 𝐷 ∈ 𝑀_𝑛(R) cujas entradas na diagonal principal são𝜆₁, 𝜆₂, . . . , 𝜆_𝑛, nessa ordem, por𝐷=diag(𝜆₁, 𝜆₂, . . . , 𝜆_𝑛).

De acordo com a deﬁnição do produto entre matrizes, ﬁca claro que as potências da matriz diagonal𝐷são também matrizes diagonais, dadas por

𝐷^𝑟 =







𝜆^𝑟₁ 0 . . . 0 0 0 𝜆^𝑟₂ . . . 0 0 ... ... . .. ... ... 0 0 . . . 𝜆^𝑟_𝑛₋₁ 0 0 0 . . . 0 𝜆^𝑟_𝑛





 ,

para todo inteiro positivo 𝑟. Usando a notação introduzida acima, se 𝐷 = diag(𝜆₁, 𝜆₂, . . . , 𝜆_𝑛), então 𝐷^𝑟 = diag(𝜆^𝑟₁, 𝜆^𝑟₂, . . . , 𝜆^𝑟_𝑛).

Em geral, calcular a potência de uma matriz quadrada é muito custoso, pois são muitas as operações envolvendo suas entradas a serem efetuadas. Porém, se𝐷é diagonal, como vimos, suas potências são calculadas de modo imediado.

Há um caso intermediário, em que, apesar de não se tratar de uma matriz diagonal, é bastante rápido o cálculo de suas potências. Este é o caso destacado na deﬁnição a seguir.

Deﬁnição Seja𝑛um inteiro positivo. Dizemos que uma matriz 𝐴 ∈ 𝑀_𝑛(R) édiagonalizávelse existir uma matriz inversível𝑃∈𝑀_𝑛(R)tal que𝑃⁻¹𝐴𝑃seja uma matriz diagonal.

Voltando à nossa discussão sobre potências, se𝐴 ∈ 𝑀_𝑛(R)é diagonalizável, digamos,𝑃⁻¹𝐴𝑃= 𝐷, com𝑃, 𝐷 ∈ 𝑀_𝑛(R),𝑃inversível e𝐷diagonal, então, para calcular a𝑟-ésima potência de𝐴, procedemos da seguinte maneira: de 𝑃⁻¹𝐴𝑃=𝐷, segue que𝐴=𝑃𝐷𝑃⁻¹; assim,

𝐴^𝑟 =(𝑃𝐷𝑃⁻¹)^𝑟=(𝑃𝐷𝑃⁻¹)(𝑃𝐷𝑃⁻¹). . .(𝑃𝐷𝑃⁻¹),

em que o produto do lado direito tem𝑟fatores da forma𝑃𝐷𝑃⁻¹. Nessa expressão, toda ocorrência da matriz𝑃, exceto pela mais à esquerda, vem acompanhada de𝑃⁻¹multiplicada por ela à esquerda:

(𝑃𝐷𝑃⁻¹)(𝑃𝐷𝑃⁻¹). . .(𝑃𝐷𝑃⁻¹)(𝑃𝐷𝑃⁻¹)=𝑃𝐷(𝑃⁻¹𝑃)𝐷(𝑃⁻¹𝑃)𝐷 . . . 𝐷(𝑃⁻¹𝑃)𝐷𝑃⁻¹.

Cada um dos produtos𝑃⁻¹𝑃 é igual à matriz identidade𝐼_𝑟. Portanto, todas as ocorrências de𝑃 e𝑃⁻¹ entre𝐷’s se cancelam, de modo que temos, ao ﬁnal,

𝐴^𝑟 =(𝑃𝐷𝑃⁻¹)^𝑟 =𝑃𝐷^𝑟𝑃⁻¹,

que resulta em uma expressão para a potência de𝐴envolvendo um número muito menor de cálculos a serem efetuados entre as entradas de𝐴.

Em resumo, se𝐴for diagonalizável, suas potências são fáceis de serem calculadas. Nem toda matriz é diagonalizável, entretanto. Será objeto deste capítulo determinar condições necessárias e suﬁcientes para tanto. E, em caso aﬁrmativo, veremos como encontrar as matrizes𝑃e𝐷.

No documento Álgebra Linear (páginas 140-148)