• Nenhum resultado encontrado

Mudança de base

No documento Álgebra Linear (páginas 140-148)

Esta seção será dedicada a responder à pergunta surgida ao final do Exemplo 6.5.2: qual é a relação entre matrizes de

Começamos com um resultado fundamental na construção de uma resposta adequada.

Proposição 6.7.1Sejam𝑈 e𝑉 espaços vetoriais de dimensão finita, seja𝑇:𝑈 → 𝑉 uma transformação linear e sejamBeCbases ordenadas de𝑈e de𝑉, respectivamente. Então,𝑇 é bijetora se, e somente se, a matriz[𝑇]B C for inversível. Além disso, neste caso,[𝑇]−1B C =[𝑇−1]C B.

Demonstração Denote𝑛=dim(𝑈).

Suponha, primeiramente, que𝑇 é bijetora. Pelo Corolário 6.3.7, dim(𝑉) = 𝑛, e, portanto, [𝑇]B C é uma matriz quadrada de tamanho𝑛. Ainda, a bijetividade de𝑇 implica, pela Proposição 6.3.5, que existe a transformação inversa 𝑇1:𝑉→𝑈e ela satisfaz𝑇◦𝑇1=I𝑉 e𝑇1◦𝑇 =I𝑈. Logo, usando a fórmula para a matriz da composta, obtida na Proposição 6.6.2,

[𝑇]B C[𝑇1]C B=[𝑇◦𝑇1]C =[I𝑉]C =𝐼𝑛, como vimos no Exemplo 6.5.3. Analogamente,

[𝑇1]C B[𝑇]B C =[𝑇1◦𝑇]B =[I𝑈]B=𝐼𝑛. Logo,[𝑇]B C é inversível, e[𝑇]−1B C =[𝑇−1]C B.

Reciprocamente, suponha que[𝑇]B C é inversível. Em particular,[𝑇]B Cé quadrada de tamanho𝑛e dim(𝑈)=𝑛= dim(𝑉). Seja𝐴=[𝑇]−1B C. Considere a transformação linear𝑆:𝑉 →𝑈tal que[𝑆]C B =𝐴. Mostremos que𝑆◦𝑇 =I𝑈

e que𝑇◦𝑆=I𝑉. Isso implicará que𝑇é bijetora (e que𝑆=𝑇−1). Por um lado, [𝑆◦𝑇]B =[𝑆]C B[𝑇]B C =𝐴[𝑇]B C =𝐼𝑛=[I𝑈]B.

Isso quer dizer que as transformações lineares𝑆◦𝑇e I𝑈, que já têm domínio e contradomínio comuns, coincidem em todos os elementos da baseB. Logo,𝑆◦𝑇 =I𝑈. De modo análogo,

[𝑇 ◦𝑆]C =[𝑇]B C[𝑆]C B =[𝑇]B C𝐴=𝐼𝑛=[I𝑉]C,

e isso implica𝑇◦𝑆=I𝑉, como queríamos.

Exemplo 6.7.2Mostre que a transformação linear

𝐿: R2 −→ P1(R)

(𝑥, 𝑦) ↦−→ (3𝑥−4𝑦) + (−𝑥+2𝑦)𝑡 é bijetora e encontre uma expressão para sua inversa.

Solução:Considere as bases canônicasB={(1,0),(0,1)}eC={1, 𝑡}deR2eP1(R), respectivamente. Então, como 𝐿(1,0)=3−𝑡e𝐿(0,1)=−4+2𝑡, segue que

[𝐿]B C =

3 −4

−1 2

.

Como det

3 −4

−1 2

= 2 ≠ 0, essa matriz é inversível. Pelo que vimos acima,𝐿 é bijetora e a transformação linear inversa𝐿−1: P1(R) →R2é tal que

[𝐿−1]C B =[𝐿]−1B C =

3 −4

−1 2 1

= 1 2

12 3 2

. Isso quer dizer que𝐿−1(1)=1(1,0) +12(0,1)= 1,12

e que𝐿−1(𝑡)=2(1,0) +32(0,1)= 2,32

. Mas, conhecendo as imagens por𝐿1de elementos de uma base deP1(R), conhecemos a imagem por𝐿1de qualquer elemento deP1(R):

𝐿−1(𝑎+𝑏𝑡)=𝑎𝐿−1(1) +𝑏𝐿−1(𝑡)=𝑎

1,1 2

+𝑏

2,3 2

=

𝑎+2𝑏,𝑎+3𝑏 2

. ^

Já temos condição de responder à questão colocada no início da seção.

Teorema 6.7.3Sejam𝑈e𝑉espaços vetoriais de dimensão finita, seja𝑇:𝑈→𝑉uma transformação linear, sejamB eBbases ordenadas de𝑈e sejamCeCbases ordenadas de𝑉. Então,

[𝑇]BC =𝑃[𝑇]B C𝑄−1, (6.17)

em que𝑃=[I𝑉]C Ce𝑄=[I𝑈]B B.

Demonstração Para efeitos de verificação de compatibilidade de tamanhos das matrizes envolvidas, suponha que dim(𝑈) = 𝑛 e que dim(𝑉) = 𝑚. Então, [𝑇]B C,[𝑇]BC ∈ 𝑀𝑚×𝑛(R). Além disso, 𝑃 = [I𝑉]C C ∈ 𝑀𝑚(R) e 𝑄= [I𝑈]B B ∈ 𝑀𝑛(R). Como a transformação identidade I𝑈 é obviamente bijetora, segue da Proposição 6.7.1 que 𝑄é inversível (e sua inversa𝑄−1tem mesmo tamanho que𝑄). Portanto, o produto de três matrizes no lado direito de (6.17) está definido e tem tamanho igual ao da matriz no lado esquerdo. Resta-nos, assim, demonstrar a igualdade.

Considere a transformação composta𝑇 ◦I𝑈:𝑈 →𝑉. Como I𝑈 é a transformação identidade de𝑈, é claro que 𝑇 ◦I𝑈 =𝑇. De modo análgo, I𝑉◦𝑇 =𝑇. Da Proposição 6.6.2, obtemos

[𝑇]BC[I𝑈]B B =[𝑇◦I𝑈]B C=[𝑇]B C=[I𝑉◦𝑇]B C=[I𝑉]C C[𝑇]B C.

Para obter, finalmente, (6.17), basta, agora, multiplicar ambos os termos dessa igualdade por𝑄1à esquerda.

Aqui cabem alguns comentários. O primeiro é que para lembrar da expressão (6.17), o seguinte diagrama pode ser útil:

𝑈B 𝑉C

𝑈B 𝑉C

𝑇 𝑇

I𝑈 I𝑉

Veja que, no diagrama, indicamos, além dos espaços vetoriais e das transformações entre eles, as bases envolvidas na determinação das matrizes de transformações lineares.

Em segundo lugar, observe que, como I𝑉 também é uma transformação linear bijetora, a matriz 𝑃 também é inversível. Assim, (6.17) poderia ter sido apresentada na seguinte forma alternativa:

[𝑇]B C =𝑃1[𝑇]BC𝑄. (6.18)

(Enquanto (6.17) fornece[𝑇]BCa partir de[𝑇]B C, (6.18) faz o oposto, dá uma expressão para[𝑇]B Cem função de [𝑇]BC. Claro que uma das fórmula pode ser obtida a partir da outra, e ambas a partir do diagrama acima.)

O Teorema 6.7.3 será mais frequentemente utilizado para o estudo de operadores lineares. O corolário a seguir é uma consequência imediada do teorema (na forma (6.18), com𝑈=𝑉,B=CeB=C).

Corolário 6.7.4Seja𝑉 um espaço vetorial de dimensão finita, seja𝑇:𝑉 →𝑉 um operador linear e sejamB eC bases ordenadas de𝑉. Então,

[𝑇]C =𝑃1[𝑇]B𝑃, (6.19)

em que𝑃=[I𝑉]C B.

Aqui, o diagrama também ajuda:

𝑉 𝑉

𝑉C 𝑉C

𝑇 𝑇

I𝑉 I𝑉

As matrizes dos operadores identidade que aparecem nas fórmula vistas acima são chamadasmatrizes de mudança de base. Elas, além de relacionarem [𝑇]B C e[𝑇]BC, também servem para “mudar coordenadas”, como mostra o próximo resultado.

Proposição 6.7.5Seja𝑉um espaço vetorial de dimensão finita e sejamBeCbases ordenadas de𝑉. Então, para todo 𝑢∈𝑉, temos

[𝑢]B=𝑃[𝑢]C, em que𝑃=[I𝑉]C B.

Demonstração Sabemos, do Teorema 6.5.6 (aplicado ao operador linear I𝑉:𝑉 →𝑉, usando as basesCno domínio eBno contradomínio), que

[𝑢]B =[I𝑉(𝑢)]B=[I𝑉]C B[𝑢]C,

que é o que desejávamos.

Note que, como I𝑉(𝑢)=𝑢, para todo𝑢∈𝑉, as colunas de[I𝑉]C Bsão precisamente as coordenadas, em relação à baseBdos vetores que compõem a baseC, na ordem em que eles estão listados emC.

Mais um comentário a respeito de matrizes de mudança de base merece registro. Sabemos que uma matriz de mudança de base é sempre inversível (já que é a matriz do operador identidade, que é bijetor), mas vale mais. Se𝑉é um espaço vetorial de dimensão finita eBeCsão bases ordenadas de𝑉, então

[I𝑉]C B=[I𝑉]B C1 . (6.20)

Isso segue da Proposição 6.7.1 e do fato óbvio que I𝑉1 =I𝑉.

Observação O conceito de matriz de mudança de base já havia surgido no contexto de vetores deV3, mais especifi-camente, na ocasião em que vimos o Teorema 2.6.1. Veja que a notação que foi utilizada então se expressa, agora, da seguinte maneira:𝑀

C B=[IV3]C B, de sorte que há uniformidade na nomenclatura.

Exemplo 6.7.6Considere o operador linear deR2definido por 𝑇:R2 −→R2

(𝑥, 𝑦) ↦−→ (𝑥−𝑦, 𝑥+2𝑦).

Encontre as matrizes[𝑇]Be[𝑇]C, em queBdenota a base canônica deR2eC={(1,3),(−1,0)}. Solução:Temos𝑇(1,0) = (1,1) e𝑇(0,1) = (−1,2), o que acarreta [𝑇]B =

1−1 1 2

. Agora, usaremos (6.19) para determinar[𝑇]C. Para tanto, é preciso encontrar𝑃=[IR2]C B. Como

IR2(1,3)=(1,3)=1(1,0) +3(0,1) e IR2(−1,0)=(−1,0)=(−1)(1,0) +0(0,1), segue que𝑃=

1−1 3 0

. Logo4,

[𝑇]C=𝑃1[𝑇]B𝑃= 1−1

3 0 −1

1−1 1 2

1−1 3 0

= 1 3

0 1

−3 1 1−1 1 2

1−1 3 0

= 1 3

7 −1 13 2

. Obviamente, uma outra solução seria calcular diretamente:

4Aqui usaremos a utilíssima fórmula 𝑎 𝑏 𝑐 𝑑

−1

= 1 𝑎𝑑𝑏𝑐

𝑑 𝑏

𝑐 𝑎

,

que vale sempre que det

𝑎 𝑏

𝑐 𝑑

=𝑎𝑑𝑏𝑐0.

𝑇(1,3)=(−2,7)=7

3(1,3) + 13

3 (−1,0) e 𝑇(−1,0)=(−1,−1)=

−1 3

(1,3) + 2

3(−1,0). ^ Exemplo 6.7.7(Prova 2, Álgebra Linear II, 2015) Sabendo que a matriz da transformação linear𝑇:P2(R) →R2em relação às bases ordenadasB={1, 𝑥+𝑥2, 𝑥2}eC={(1,−1),(1,1)}deP2(R)e deR2, respectivamente, é

3 0 1 1 2−1

, o vetor𝑇(𝑥2−𝑥+1)é

(A)(5,−3) (B)(2,−8) (C)(5,3) (D)(−2,−8) (E)(−5,−5)

Solução:Seja𝑣=𝑥2−𝑥+1. Sabemos, pelo Teorema 6.5.6, que[𝑇(𝑣)]C=[𝑇]B C[𝑣]B. Agora, pela Proposição 6.7.5, [𝑣]B =𝑃[𝑣]D, em queDdenota a base canônica deP2(R)(isto é,D={1, 𝑥, 𝑥2}), e𝑃=[I]D B, em que I denota o operador identidade deP2(R). É claro que [𝑣]D = 



1

−1 1



. Agora, sabemos que𝑃 =[I]D B =[I]B D1 , e essa segunda matriz é fácil de descrever :

[I]B D=



1 0 0 0 1 0 0 1 1



.

(O que foi feito aqui foi escrever as coordenadas dos vetores deBem relação à baseD, o que é fácil, poisDé a base canônica.) Procedemos, agora, à inversão dessa matriz:





1 0 0 1 0 0 0 1 0 0 1 0 0 1 1 0 0 1



 →



1 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0−1 1





Assim,

𝑃=[I]D B=[I]−1B D =



1 0 0 0 1 0 0 1 1





1

=



1 0 0 0 1 0 0−1 1



. Concluímos, portanto, que

[𝑣]B=𝑃[𝑣]D =



1 0 0 0 1 0 0−1 1









1

−1 1



 = 



1

−1 2



. Logo,

[𝑇(𝑣)]C=[𝑇]B C[𝑣]B = 3 0 1

1 2−1 



1

−1 2



 = 5

−3

. Assim,𝑇(𝑣)=5(1,−1) + (−3)(1,1)=(2,−8).Resposta:(B)

Poderíamos ir além e encontrar a expressão para𝑇(𝑎+𝑏𝑥+𝑐𝑥2). Basta fazer

[𝑎+𝑏𝑥+𝑐𝑥2]B=𝑃[𝑎+𝑏𝑥+𝑐𝑥2]D =



1 0 0 0 1 0 0−1 1









𝑎 𝑏 𝑐



 =



𝑎 𝑏

−𝑏+𝑐



, donde

[𝑇(𝑎+𝑏𝑥+𝑐𝑥2)]C =[𝑇]B C[𝑎+𝑏𝑥+𝑐𝑥2]B= 3 0 1

1 2−1 



𝑎 𝑏

−𝑏+𝑐



 =

3𝑎−𝑏+𝑐 𝑎+3𝑏−𝑐

. Portanto,𝑇(𝑎+𝑏𝑐+𝑐𝑥2)=(3𝑎−𝑏+𝑐)(1,−1) + (𝑎+3𝑏−𝑐)(1,1)=(4𝑎+2𝑏,−2𝑎+4𝑏−2𝑐). ^

Observação Neste capítulo, vimos que se 𝑈 e𝑉 são espaços vetoriais de dimensão finita, com dim(𝑈) = 𝑛 e dim(𝑉) =𝑚, e seBeCsão bases ordenadas de𝑈e de𝑉, respectivamente, a cada transformação linear𝑇:𝑈 →𝑉 associa-se uma matriz[𝑇]B C ∈ 𝑀𝑚×𝑛(R). Dois comentários a respeito dessa associação são devidos:

(i) Essa associação é injetora, no sentido de que se𝑇1 e𝑇2 são transformações lineares de𝑈 em𝑉 tais que [𝑇1]B C=[𝑇2]B C, então𝑇1=𝑇2. (Isso decorre do fato de, além de terem o mesmo domínio e contradomínio, as tranformações lineares𝑇1 e𝑇2 têm a mesma imagem em cada elemento do domínio. Com efeito, dado 𝑢 ∈𝑈, temos

[𝑇1(𝑢) −𝑇2(𝑢)]C =[𝑇1(𝑢)]C− [𝑇2(𝑢)]C =[𝑇1]B C[𝑢]B− [𝑇2]B C[𝑢]B

= [𝑇1]B C− [𝑇2]B C

[𝑢]B=0[𝑢]B =0.

Logo,𝑇1(𝑢)=𝑇2(𝑢), uma vez que o único vetor de𝑉 que têm todas as coordenadas nulas é 0𝑉.)

(ii) Essa associação é também sobrejetora; em outras palavras, dada 𝐴 ∈ 𝑀𝑚×𝑛(R) existe uma (única, como acabamos de ver) transformação linear 𝑇:𝑈 → 𝑉 tal que [𝑇]B C = 𝐴. (Com efeito, suponha que B = {𝑢1, . . . , 𝑢𝑛} eC = {𝑣1, . . . , 𝑣𝑚}, então, se 𝐴 = (𝑎𝑖 𝑗), basta tomar𝑇 como sendo a transformação linear definida por𝑇(𝑢𝑗)=𝑎1𝑗𝑣1+𝑎2𝑗𝑣2+ · · · +𝑎𝑚 𝑗𝑣𝑚, para todo 𝑗 =1, . . . , 𝑛.)

Note que essas observações foram tacitamente assumidas nos Exemplos 6.5.8, 6.5.9 e 6.7.7, nos quais, dada uma matriz, assumimos que estava definida uma única transformação linear cuja matriz coincidia com a matriz dada.

Exercícios Lista 2 - Álgebra Linear II: Exs. 44–48.

Capítulo 7

Diagonalização de operadores

Neste capítulo, procedemos a uma análise mais profunda de operadores lineares em espaço de dimensão finita a fim de descrevê-los da maneira mais simples possível, em um sentido que ficará claro à medida que progredimos.

Para introduzir o conceito principal deste capítulo, o de autovetor de um operador linear, comecemos por um exemplo simples, aparentemente não diretamente relacionado com o estudo de operadores lineares.

Seja 𝑛 um inteiro positivo. Dizemos que uma matriz 𝐷 = (𝑑𝑖 𝑗) ∈ 𝑀𝑛(R) édiagonal se 𝑑𝑖 𝑗 = 0 para todos 𝑖, 𝑗 =1, . . . , 𝑛tais que𝑖 ≠ 𝑗. Em outras palavras,𝐷é diagonal se apenas as entradas em sua diagonal principal são eventualmente não nulas, isto é, se𝐷o seguinte formato:

𝐷=







𝜆1 0 . . . 0 0 0 𝜆2 . . . 0 0 ... ... . .. ... ... 0 0 . . . 𝜆𝑛−1 0 0 0 . . . 0 𝜆𝑛







(Destacamos as entradas na diagonal principal de𝐷 com a cor vermelha. Todas as demais entradas são nulas.) Em algumas ocasiões, quando for conveniente, denotaremos a matriz diagonal 𝐷 ∈ 𝑀𝑛(R) cujas entradas na diagonal principal são𝜆1, 𝜆2, . . . , 𝜆𝑛, nessa ordem, por𝐷=diag(𝜆1, 𝜆2, . . . , 𝜆𝑛).

De acordo com a definição do produto entre matrizes, fica claro que as potências da matriz diagonal𝐷são também matrizes diagonais, dadas por

𝐷𝑟 =







𝜆𝑟1 0 . . . 0 0 0 𝜆𝑟2 . . . 0 0 ... ... . .. ... ... 0 0 . . . 𝜆𝑟𝑛−1 0 0 0 . . . 0 𝜆𝑟𝑛





 ,

para todo inteiro positivo 𝑟. Usando a notação introduzida acima, se 𝐷 = diag(𝜆1, 𝜆2, . . . , 𝜆𝑛), então 𝐷𝑟 = diag(𝜆𝑟1, 𝜆𝑟2, . . . , 𝜆𝑟𝑛).

Em geral, calcular a potência de uma matriz quadrada é muito custoso, pois são muitas as operações envolvendo suas entradas a serem efetuadas. Porém, se𝐷é diagonal, como vimos, suas potências são calculadas de modo imediado.

Há um caso intermediário, em que, apesar de não se tratar de uma matriz diagonal, é bastante rápido o cálculo de suas potências. Este é o caso destacado na definição a seguir.

Definição Seja𝑛um inteiro positivo. Dizemos que uma matriz 𝐴 ∈ 𝑀𝑛(R) édiagonalizávelse existir uma matriz inversível𝑃∈𝑀𝑛(R)tal que𝑃−1𝐴𝑃seja uma matriz diagonal.

Voltando à nossa discussão sobre potências, se𝐴 ∈ 𝑀𝑛(R)é diagonalizável, digamos,𝑃−1𝐴𝑃= 𝐷, com𝑃, 𝐷 ∈ 𝑀𝑛(R),𝑃inversível e𝐷diagonal, então, para calcular a𝑟-ésima potência de𝐴, procedemos da seguinte maneira: de 𝑃1𝐴𝑃=𝐷, segue que𝐴=𝑃𝐷𝑃1; assim,

𝐴𝑟 =(𝑃𝐷𝑃1)𝑟=(𝑃𝐷𝑃1)(𝑃𝐷𝑃1). . .(𝑃𝐷𝑃1),

em que o produto do lado direito tem𝑟fatores da forma𝑃𝐷𝑃1. Nessa expressão, toda ocorrência da matriz𝑃, exceto pela mais à esquerda, vem acompanhada de𝑃1multiplicada por ela à esquerda:

(𝑃𝐷𝑃1)(𝑃𝐷𝑃1). . .(𝑃𝐷𝑃1)(𝑃𝐷𝑃1)=𝑃𝐷(𝑃1𝑃)𝐷(𝑃1𝑃)𝐷 . . . 𝐷(𝑃1𝑃)𝐷𝑃1.

Cada um dos produtos𝑃−1𝑃 é igual à matriz identidade𝐼𝑟. Portanto, todas as ocorrências de𝑃 e𝑃−1 entre𝐷’s se cancelam, de modo que temos, ao final,

𝐴𝑟 =(𝑃𝐷𝑃−1)𝑟 =𝑃𝐷𝑟𝑃−1,

que resulta em uma expressão para a potência de𝐴envolvendo um número muito menor de cálculos a serem efetuados entre as entradas de𝐴.

Em resumo, se𝐴for diagonalizável, suas potências são fáceis de serem calculadas. Nem toda matriz é diagonalizável, entretanto. Será objeto deste capítulo determinar condições necessárias e suficientes para tanto. E, em caso afirmativo, veremos como encontrar as matrizes𝑃e𝐷.

No documento Álgebra Linear (páginas 140-148)