linear

(1)

Álgebra Linear - Um guia veraneio

João Paulo Costalonga

Depto. de Matemática - UFES

Versão de 07/04/2016.

7 Soma Direta 17 8 Subespaços invariantes e decomposição de operadores 18 9 Teorema da Decomposição Primária 19 10 Autovalores e Polinômios de Operadores e Matrizes 19 11 Diagonalização de Operadores e Polinômio Minimal 20 12 Forma de Jordan 22 12.1 A forma de Jordan e suas implicações . . . 22

12.2 Operadores Nilpotentes . . . 23

(2)

Prefácio da Versão de 2014

Estas notas têm um caráter experimental e foram desenvolvidas para um curso de Verão na Universidade Federal do Espírito Santo em 2014.

Neste texto, muitas demonstrações não estão incluídas, ficando a cargo do leitor. Estão incluídas as demonstrações que envolvem algum passo nada trivial, algumas em formato de dicas. Também estão inclusas algumas demonstrações que envolvem cálculos um pouco mais longos e mecânicos para que o leitor não perca muito tempo em tarefas que, ao meu ver, não contribuem muito para seu intelecto. Em compensação, há um enorme esforço em introduzir conceitos e resultados de forma que as demonstrações apareçam de forma mais natural pos-sível e a teoria se desdobre em torno de uma espinha vertebral minimalista. As demonstrações a cargo do leitor podem ser feitas de formas simples e diretas. E em poucos passos em sua maioria. Portanto, se algo parece muito complicado, provavelmente não estará sendo feito do jeito mais simples, o que nem sempre implica que é uma boa ideia desistir da estratégia ado-tada. Fazer as demonstrações por si, mesmo que de forma não otimizadas, pode ser muito frutífero.

Apenas os resultados imprescindíveis ao curso estão enunciados como teoremas ou proposições, embora alguns resultados clássicos apareçam como exercícios.

Essa versão cobre desde os conceitos mais básicos até o estudo da forma de Jordan pas-sando por todos os pré-requisitos. Destaco neste texto a demonstração da existência da forma Jordan, feita de forma bem direta e e um tanto construtiva. Também o estudo dos determi-nantes com motivações geométricas.

1 Espaços Vetoriais

Seja K um corpo. Um espaço vetorial sobre K (ou K -espaço vetorial) é um conjunto V com uma operação de soma + : V ×V → V ; (u, v) 7→ u + v e um produto por escalares · : K ×V → V ; (a, v) 7→ a.v = av, tais que:

(a) Existe um elemento 0 ∈ V tal que 0 + u = u para todo u ∈ V ; Além disso para u, v, w ∈ V e a,b ∈ K :

(b) u + v = v + u;

(c) u + (v + w) = (u + v) + w;

(d) Existe um elemento −u tal que u + (−u) = 0; (e) 1u = u;

(f ) a(u + v) = au + av; (g) (a + b)u = au + bu; e: (h) a(bu) = (ab)u.

Proposição 1.1 Para um espaço vetorial V .

(a) Existe um único elemento 0 ∈ V tal que 0 + u = u para todo u ∈ V ; Para todos u, v ∈ V e a,b ∈ K :

(b) Existe um único elemento −u tal que u + (−u) = 0; (c) 0u = 0

(d) Se au = 0, então a = 0 ou u = 0. (e) Se au = bu então a = b se u 6= 0. (f ) (−1)u = −u

(3)

(g) (−a)u = −(au)

Se V é um espaço vetorial, dizemos que um conjunto não vazio U ⊆ V é um subespaço

vetorial de V se para todo u, v ∈ U e a ∈ R, au ∈ V e u+v ∈ V , ou, equivalentemente: au+v ∈ U . Exercício 1.1 Seja V um espaço vetorial e U ⊆ V . Mostre que U é um subespaço de V s e e só se

U é um K -espaço vetorial com as operações herdadas de V . Além disso, neste, caso 0 ∈ U .

Se V é um espaço vetorial, e x, x1, . . . , xn ∈ V são tais que existem escalares a1, . . . , an tais

que:

x = a1x1+ · · · + anxn.

Então dizemos que x é combinação linear de x1, . . . , xn e x1, . . . , xngeram x. Mais geralmente

dizemos que um conjunto X ⊆ V gera x se existem x1, . . . , xn∈ X que geram x além disso

con-vencionamos que ; gera 0.

Se Y ⊆ spam(X ) dizemos que X gera Y ou é um conjunto gerador de Y .

Proposição 1.2 Seja V um espaço vetorial. O conjunto de todos os elementos gerados por um

conjunto X ⊆ V , o qual denotaremos por spam(X ) é um subespaço vetorial de V , o qual chamamos o subespaço gerado por X . Denotamos também [x1, . . . , xn] := [{x1, . . . , xn}].

Exercício 1.2 Seja V um espaço vetorial e X ⊆ V . Mostre que spam(X ) é a interseção de todos os

subespaços vetoriais de V contendo X .

Exercício 1.3 Seja V us espaço vetorial e X , Y ⊆ V . Mostre

(i) X ⊆ spam(X ).

(ii) Se X ⊆ Y , então spam(X ) ⊆ spam(Y ). (iii) spam(spam(X )) = spam(X ).

(iv) Se Y ⊆ spam(X ), então spam(X ∪ Y ) = spam(X ).

Seja V um espaço vetorial. Se em X ⊆ V existem x1, . . . , xn distintos e escalares a1, . . . , an

não todos nulos tais que

a1x1+ · · · + anxn= 0,

então dizemos que X é linearmente dependente (L.D.). Se X não é linearmente dependente, dizemos que X é linearmente independente (L.I.). Quando nos referimos a uma sequência finita de vetores v1, . . . , vn, dizemos que tal sequência é L.I. se {v1, . . . , vn} é L.I. e esses vetores

são todos distintos.

Exercício 1.4 Seja V um espaço vetorial e X ⊆ V . Mostre que as seguintes condições são

equiva-lentes:

(a) (i) X é linearmente dependente.

(b) (ii) Existem x1, . . . , xn∈ X distintos e escalares a1, . . . , an todos não nulos tais que a1x1+

· · · + anxn= 0;

(c) (iii) Todos os subconjuntos de V que contém X são linearmente dependentes. (d) (iv) Existe um elemento x ∈ X gerado por X − {x}; e:

(e) (v) X = {0} ou existem x, x1, . . . , xn∈ X distintos tais que x é combinação linear de x1, . . . , xn. Exercício 1.5 Seja V um espaço vetorial e X ⊆ V as seguintes condições são equivalentes:

(4)

(b) (ii) Se x1, . . . , xn∈ X são distintos e a1x1+ · · · + anxn= 0, então a1= · · · = an= 0;

(c) (iii) Todos os subconjuntos de X são linearmente independentes. (d) (iv) Não existe um elemento x ∈ X gerado por X − {x}; e:

(e) (v) X 6= {0} e não existe x ∈ X que é combinação linear de elementos de X − x.

Lema 1.3 Suponha que num espaço vetorial I é L.I. e gera x 6= 0, então existe y ∈ I tal que (I −

{y}) ∪ x gera x.

Prova: Como I gera x, existe,m y1, . . . , ym∈ I e a1, . . . , am∈ K − {0} tais que x = a1v1+ · · · +

anvn. ä

Um espaço vetorial é finitamente gerado se admite um conjunto gerador finito.

Teorema 1.4 Se G é un conjunto gerador finito de um espaço vetorial V e I um conjunto L.I. de

V , então |G| ≥ |I |.

Prova: Suponha que o teorema não seja válido em um espaço vetorial V . Sejam G um

gerador de V e I um conjunto L.I. contrariando o teorema, de forma que |G − I | seja mínimo. Como |I | > |G|, então existe x ∈ I −G. Como G gera V , existem v1, . . . , vm∈ G e a1, . . . , am∈ K −{0}

tais que x = a1v1+· · ·+amvm. Note que {x, v1, . . . , vm} não pode estar contido em I por ser L.D..

Então existe k ∈ [m] tal que vk∉ I . Isolando vkna última equação, temos:

vk= x −

X

i ∈[m]−k

aivi.

Portanto, G0:= (G − {vk}) ∪ x gera G. Isso implica que G0é um gerador de V . Mas vk∈ G e

G0− I ⊆ (G − I ) − {vk}. Isso contradiz a minimalidade de |G − I |. ä

Um conjunto linearmente independente que gera um espaço vetorial V é chamado uma

base de V .

Corolário 1.5 Num espaço vetorial finitamente gerado:

(a) Um conjunto gerador não pode ter menos elementos que uma base.

(b) Um conjunto linearmente independente não pode ter mais elementos que uma base. (c) Todas as bases possuem o mesmo número de elementos, tal número é chamado a

dimen-são de V : dimV .

(d) Se X ⊆ V e x ∈ spam(X ) − X , então X ∪ {x} é L.D..

Lema 1.6 Seja V um espaço vetorial e I L.I. em V e x ∈ V − spam(I ). Então I ∪ x é L.I.

Prova: Suponha que I ∪ {x} é L.D.. Então existem v1, . . . , vm ∈ I ∪ x e a1, . . . , am ∈ K − {0} tais

que 0 = a1v1+ · · · + amvm. Como I é L.I., x ∈ {v1, . . . , vm}. Digamos que x = v1. Então x =

−a2v2− · · · − amvm e I gera x. ä

Corolário 1.7 Num espaço vetorial V

(a) Todo independente não gerador está propriamente contido em outro independente. (b) Se V é finitamente gerado, então todo gerador contém uma base e todo independente está

contido em uma base.

(c) Se V é finitamente gerado, então as bases de V coiincidem com os independentes de V de maior tamanho.

(5)

Corolário 1.8 Num espaço vetorial, x1, . . . , xn são L.I. se e só se para todo 1 ≤ k ≤ n, xk não é

gerado por {x1, . . . , xk−1}.

Exercício 1.6 Mostre que se I e J são conjuntos L.I. num espaço vetorial tais que |J| > |I |, então

existe v ∈ J − I tal que I ∪ {v} é L.I.

Exercício 1.7 Mostre que num espaço vetorial finitamente gerado, todo conjunto gerador

con-tém uma base e todo conjunto linearmente independente está contido numa base.

Exercício 1.8 Mostre que todo subespaço de um espaço vetorial finitamente gerado é

finita-mente gerado.

Exercício 1.9 Sejam V um espaço vetorial e V1,V2⊆ V subespaços. Mostre que V1∩V2e V1+V2:=

{u + v : u ∈ V1e v ∈ V2} são subespaços de V .

Proposição 1.9 Se V1e V2são subespaços finitamente gerados de um espaço vetorial. Então:

dim(V1+ V2) = dimV1+ dimV2− dim(V1∩ V2).

Prova: Considere uma base de V1∩ V2complete-a para bases de V1 e V2 e mostre que a

união dessas duas bases formadas por esses completamentos é uma base de V1+ V2. ä

Proposição 1.10 (Escrita única) Seja V um espaço vetorial com uma base B e v ∈ V . Sejam

v1, . . . , vnvetores de B e a1, . . . , ane b1, . . . , bnescalares tais que:

v = a1v1+ · · · + anvn= b1v1+ · · · + bnvn.

Então ai= bi para i = 1,...,n.

2 Transformações Lineares

Segue abaixo algumas perguntas que vamos responder de forma simples com o uso do que definiremos aqui por transformações lineares.

Problema 1 Qual a fórmula para as seguintes transformações do plano:

(a) Uma rotação do plano segundo um ângulo θ no sentido anti-horário ao redor de um ponto?

(b) Uma reflexão em torno de uma reta?

(c) Uma projeção em uma reta paralelamente a outra? E no espaço?

Sejam U e V espaços vetoriais. Uma transformação linear de U em V é uma função T :

U → V ; v 7→ T v; tal que para todos u, v ∈ U e a ∈ K , temos T (u + v) = Tu + T v e T (av) = aT v.

Como exemplos temos os casos chave do Problema 1. Rotações ao redor da origem, e pro-jeções sobre e reflexões em volta de retas passando pela origem. Mais especificamente para resolver tal problema podemos usar o seguinte teorema:

Teorema 2.1 Sejam V e W espaços vetoriais e B uma base de V . Se f : B → W é uma função,

(6)

Prova: Decorre da escrita única numa base que T µ P v∈B av.v ¶ = P v∈B av. f (v) define a única

transformação com essa propriedade. ä

Exercício 2.1 Mostre que T : U → V é uma transformação linear se e só se para todo a ∈ K e

u, v ∈ U vale T (u + av) = Tu + aT v.

Corolário 2.2 Sejam V e W são espaços vetoriais, {v1, . . . , vn} uma base de V e w1, . . . , wnvetores

quaisquer de W (não necessariamente uma base nem L.I.). Então existe uma única transfor-mação linear T : V → W tal que T (vi) = wi para todo i = 1,...,n.

Se T : V → W é uma transformação linear definimos o núcleo de T como a pré-imagem do zero de W , isso é, o núcleo de T é o conjunto ker(T ) := {v ∈ V : T v = 0}. Definimos a imagem de T simplesmente como a imagem de T como função Im(T ) = {w ∈ W : existe v ∈ V tal que

t (v) = w}.

Exercício 2.2 Mostre que ker(T ) é um subespaço vetorial de V e Im(T ) um subespaço vetorial de

W .

Exercício 2.3 Seja T : V → W uma transformação linear. As seguintes afirmações são

equiva-lentes:

(a) T é injetiva. (b) ker(T ) = {0}.

(c) A imagem de todo conjunto L.I. por T é um conjunto L.I.

Lema 2.3 Se T : V → W é uma transformação linear bijetiva, então sua inversa é uma

transfor-mação linear.

Prova: T−1(u + av) = T−1(T T−1u + aT T−1v) = T−1T (T−1u + aT−1v) = T−1u + aT−1v. ä Uma transformação linear bijetiva é chamada de isomorfismo. Dois espaços são ditos

iso-morfos se existe um isomorfismo entre eles. Denotamos V ∼= W se V é isomorfo a W .

Teorema 2.4 Sejam V e W espaços vetoriais e seja T : V → W uma transformação linear. Suponha

que B1é uma base de ker(T ) e que B2⊆ V − B1é tal que B1∪ B2é uma base de V . Entao T (B2) é

uma base de Im(T ) e T |B2 é injetiva.

Prova: Dado v ∈ V existem a1, . . . , am, b1, . . . , bn∈ K , v1, . . . , vm∈ B1e w1, . . . , wn∈ B2tais que

v = Pm i =1 aivi+ n P j =1 bjwje T v = n P j =1

bjT wj, já que T (v1) = ··· = T (vm) = 0. Então T (B2) gera Im(T ).

Para finalizar a prova, basta mostrar que, para b1, . . . , bn∈ K e w1, . . . , wn∈ B2, sempre temos

n P j =1 bjT wj = 0 implicando b1= · · · = bn = 0. De fato, se 0 = n P i =1 bjT wj = T Ã n P j =1 bjwj ! , então n P j =1

bjwj∈ ker(T ). Ou seja, existem v1, . . . , vm∈ B1e a1, . . . , am ∈ K tais que m P i =1 aivi= m P j =1 bjwj.

Segue da independência linear de B1∪ B2que b1= · · · = bn= 0. ä

Corolário 2.5 (Teorema do Núcleo e Imagem) Sejam V e W espaços vetoriais com dimV < ∞

e seja T : V → W uma transformação linear. Então

(7)

Corolário 2.6 Sejam V e W espaços vetoriais com dimW = dimV < ∞ e seja T : V → W uma

transformação linear. Então T é injetiva se e só se é sobrejetiva.

Combinando este último Corolário com o Corolário 2.2 e o Exercício 2.3, temos o seguinte Teorema, que nos dá uma classificação dos espaços vetoriais de dimensão finita.

Teorema 2.7 Dois espaços vetoriais de dimensão finita são isomorfos se e só se possuem a mesma

dimensão. Em particular, V ∼= KdimV se dim(V ) < ∞. Em geral dois espaços são isomorfos se possuem bases em bijeção.

Se U e V são espaços vetoriais, denotamos porL (U,V ) o conjunto das transformações lineares de U e V . existe uma estrutura natural de espaço vetorial emL (U,V ), se definirmos para T, S ∈ L (U ,V ) e a ∈ K as transformações T +S e aT por (T +U )v = Tu +T v e (aT )u = aTu para todos u, v ∈ U .

Exercício 2.4 Sejam U e V espaços vetoriais com respectivas bases u1, . . . , ume v1, . . . , vn. Seja Ti j

a transformação linear tal que Ti j(ui) = vj e Ti j(uk) = 0 para k 6= i . Mostre que {Ti j: i = 1,...,m

e j = 1,...,n} é uma base de L (U ,V ). Conclua que dimL (U ,V ) = (dimU ).(dimV ).

3 Matrizes

Uma matriz de dimensões m × n sobre um corpo K é uma tabela da forma:    a11 · · · a1n .. . . .. ... am1 · · · amn   , (1)

onde, para cada par de índices i e j , ai j ∈ K . Abreviadamente denotamos tal matriz dessa

forma por [ai j].

Uma matriz-linha é uma matriz com uma única linha e uma matriz-coluna é uma matriz com uma única coluna. Definimos o produto de uma matriz-linha por uma matriz-coluna com o mesmo número de entradas como uma matriz 1 × 1 como abaixo:

¡a1 · · · an¢ ·    b1 .. . bn    = (a1b1+ · · · + anbn) .

Em geral, se A = [ai j] é uma matriz l ×m e B = [bi j] uma matriz m ×n, definimos o produto

A.B como a matriz l ×n, cuja entrada na i -ésima linha e j -ésima coluna é ai 1b1 j+· · ·+ai mbm j.

Parece uma definição sem sentido e complexa a priori. Mas pode ser pensado em termos do produto mais simples de matriz-linha por matriz-coluna definindo anteriormente da seguinte forma. Denote por Li = (ai 1· · · ai m) a i -ésima linha de A e a j -ésima coluna de B por: Cj :=

   b1 j .. . bm j   . Então: A · B =    L1 .. . Ll    · (C1· · ·Cn) =    L1·C1 · · · L1·Cn .. . . .. ... Ll·C1 · · · Ll·Cn   . A seguir vamos listar algumas aplicações que justificam essa definição.

(8)

Uma cervejaria produz cerveja a partir de três tipos de malte, M 1, M 2 e M 3, dois tipos de lúpulo L1 e L2. A cervejaria produz 3 tipos de cerveja: stout (ST ), red ale (R A) e india pale ale (I P A), as quais requerem as quantidades de ingredientes (em alguma determinada unidade) segundo a tabela abaixo:

A _:=   M 1 M 2 M 3 L1 L2 ST 10 1 1 5 5 R A 7 5 0 1 2 I P A 11 1 0 15 15   (2)

Digamos que os ingredientes têm os seguintes custos:

B :=        M 1 5 M 2 8 M 3 9 L1 4 L2 5        (3)

Observe que se fizermos o produto A · B teremos uma tabela com o custo de produção de cada cerveja: A.B =   ST 10.5 + 1.8 + 1.9 + 5.4 + 5.5 R A 7.5 + 5.8 + 0.9 + 1.4 + 2.5 I P A 11.5 + 1.8 + 0.9 + 15.4 + 15.5   (4)

Se quisermos saber o custo de produzir um lote com as respectivas cervejas nas quanti-dades 50, 30 e 100 bastaria fazer o produto (50 30 100) · A · B.

Considere um sistema linear de equações, nas variáveis x1, . . . , xnda seguinte forma:

a11x1+ · · · + a1nxn = b1

..

. ...

am1x1+ · · · + amnxn = bm

(5)

Este sistema pode ser melhor estudado na forma de uma equação de matrizes da forma:    a11 · · · a1n .. . . .. ... am1 · · · amn       x1 .. . xn    =    b1 .. . bm   .

Abreviadamente codificado na matriz:    a11 · · · a1n b1 .. . . .. ... ... am1 · · · amn bm   .

Na seção 5, vamos mostrar um método para resolver tais sistemas.

O conjunto das matrizes m ×n é um espaço vetorial com as operações definidas por [ai j] +

(9)

4 Relação entre matrizes e transformações lineares

Geralmente identificamos o vetor v = (a1, . . . , an) ∈ Kn com a matriz-coluna com respectivas

entradas a1, . . . , an. Note que se A é uma matriz de dimensões m × n então a aplicação que

associa a cada v ∈ Kno vetor A·v ∈ Kmé uma transformação linear. Por simplicidade podemos denotar essa aplicação simplesmente por “A” quando não houver risco de confusão.

Proposição 4.1 Uma função T : Km → Kn é uma transformação linear se e só se existe uma matriz n × m A tal que T v = Av para todo v ∈ Kn. Em particular A = [Te1· · · Ten], onde ei é o

vetor cuja única coordenada não nula é a i -ésima, a qual é igual a 1.

Considere um espaço V de dimensão finita e uma base ordenada B := v1, . . . , vn de V . se

v = a1v1+ · · · + anvndefinimos o vetor [v]B:= (a1, . . . , an) de Kn.

Exercício 4.1 Mostre que se B é uma base de um espaço vetorial V de dimensão n < ∞, então a

aplicação T : V → Kn; T v = [v]Bé uma transformação linear, em particular um isomorfismo. Exercício 4.2 Sejam V e W espaços de dimensões finitas n e m respectivamente. Sejam BV =

v1, . . . , vn e BW bases de V e W e T : V → W uma transformação linear. Mostre que existe uma

única matriz m × n [T ]BV

BW tal que, para todo v ∈ V , [T ]

BV

BW[v]BV = [T v]BW. Mostre que [T ]

BV

BW = ([T v1]BW· · · [T vn]BW).

Exercício 4.3 Seja V um espaço de dimensão n < ∞ e sejam B e B0bases de V . Seja T : V → V uma transformação linear. Em geral, denotamos [T ]B:= [T ]B_B. Mostre que [T ]B_B= [Id]B

0

B[T ]B

0

B0[Id]B_B0

e [Id]B_B0é a inversa de [Id]B 0

B .

5 Algoritmo de Gauss-Jordan

Lema 5.1 Se, no sistema

a11x1+ · · · + a1nxn = b1

..

. ...

am1x1+ · · · + amnxn = bm

, (6)

fizermos uma das alterações abaixo, não expandimos ou restringimos seu conjunto de soluções. (a) Mudar a ordem das equações.

(b) Substituir uma equação pelo seu produto por uma constante não nula. (c) Adicionar a uma equação um múltiplo de outra.

Prova: Suponha que um sistema (6)’ é obtido de (6) através de uma dessa equações. É simples

de verificar que todas as soluções de (6) são soluções de (6)’. Mas por outro lado cada uma dessas alterações pode ser revertida por uma alteração do mesmo tipo. Então o lema é valido. ä

As alterações descritas no lema acima são chamada de operações elementares. Ao invés de executá-las no sistema (6) podemos simplesmente executá-las na matriz que codifica tal sistema:    a11 · · · a1n b1 .. . . .. ... ... am1 · · · amn bm    (7)

(10)

Neste caso, dizemos que as respectivas operações elementares são operações elementares

por linhas quando executadas nas linhas da matriz. Quando uma matriz A é obtida de um a

matriz B através de uma sequência de operações elementares por linha, dizemos que A e B são

linha-equivalentes. Segue do lema anterior:

Lema 5.2 Se duas matrizes são linha-equivalentes então estas codificam sistemas com o mesmo

conjunto de soluções.

Em seguida veremos que a recíproca do lema acima é valida, e, além disso, apresentaremos um método para a resolução de sistemas lineares. Para isso vamos introduzir o conceito de matriz linha-reduzida.

Chamemos o primeiro elemento de uma linha não nula de uma matriz de pivô da respec-tiva linha. Dizemos que uma matriz A é linha-reduzida se:

(a) A não possui uma linha nula acima de uma linha não nula.

(b) Se a linha i está acima da linha j então o pivô da linha i está à esquerda do pivô da linha

j .

(c) Todo pivô de A é igual a 1

(d) Todo pivô de A é o único elemento não nulo de sua coluna.

Muitos autores chamam uma matriz linha-reduzida de uma forma de Echelon. O algo-ritmo abaixo serve para encontrar uma matriz-linha reduzida linha-equivalente a uma dada matriz.

Algoritmo 5.3 (Gauss-Jordan) Entrada: Uma matriz A = [ai j] ∈ M(m × n) Saída: A matriz linha-reduzida linha-equivalente a A.

Complexidade: O(m2n) operações aritméticas.

(0) Comece com i := 1 e j := 1;

(i) Se j > m ou i > n, pare e retorne a matriz [ai j];

(ii) Se ai j= · · · = am j = 0, redefina j := j + 1 e volte para o passo (i); (Não há pivô na coluna)

(iii) (Há pivô na coluna) Escolha o menor índice i ≤ k ≤ m tal que ak j 6= 0. Troque as linhas

Li e Lk de A. Divida Li por ai j. (*)Para k = 1,...,m, se k 6= i troque Lk por Lk− ak jLi.

Redefina i := i + 1 e j := j + 1. Volte para o passo (i).

Exercício 5.1 Verificar a funcionalidade do algoritmo acima. Verifique que termina com um

número finito de passos. Verifique também que a resposta dada é a desejada. (Dica: Veja que ao fim de cada passo, a matriz restrita das colunas de 1 a j fica linha-reduzida).

Um resultado importante que demonstraremos aqui é o seguinte:

Teorema 5.4 Toda matriz é linha-equivalente a uma única matriz linha-reduzida e duas

ma-trizes de mesmas dimensões são linha-equivalentes se e só se possuem o mesmo espaço-linha.

Antes de provar esse teorema, vamos mostrar o seguinte lema:

Lema 5.5 Se duas matrizes linha-reduzidas possuem o mesmo espaço-linha então estas são

(11)

Prova: Sejam A e B matrizes contradizendo o lema. Podemos claramente supor que as

ma-trizes possuem linhas não-nulas. Pela igualdade das dimensões dos espaços, A e B possuem o mesmo número de linhas não nulas. Sejam u1, . . . , um e v1, . . . , vm as linhas-não nulas de A e B

respectivamente. Seja k o maior índice tal que vk6= uk. Digamos que a coordenada do pivô de

vk seja maior ou igual à coordenada do pivô de uk.

Podemos escrever de forma única: vk= a1u1+ · · · + amum. Como, em vk as coordenadas

anteriores à k-ésima são nulas, então a1= · · · = ak−1= 0. Para t > k, temos vt = utpor causa da

escolha de k. Então, para t > k, a coordenada do t-ésimo pivô de A e B coincidem e, portanto, ambos uke vkpossuem a t -ésima coordenada nula. Como a t -ésima coordenada de vké igual

a at, então at = 0. Portanto vk = akuk. Mas ambos vetores possuem a primeira coordenada

não nula igual a 1 e, portanto, ak= 1 e vk= uk. Uma contradição. ä

Dizemos que o espaço-linha de uma matriz m × n A é o espaço das matrizes-linha com n entradas gerado pelas linhas de A, muitas vezes identificado com sua imagem em Knatravés do isomorfismo natural que associa a matriz-linha (a1· · · an) ao vetor (a1, . . . , an) ∈ Kn.

Lema 5.6 Seja V um espaço vetorial e X ⊆ V . Suponha que v ∈ X e a é um escalar não nulo.

Então spam[(X − {x}) ∪ {ax}] = spam(X ) e, se y ∈ X − {x}, então spam[(X − {x}) ∪ {x + a y}] =

spam(X ).

Prova do Teorema 5.4: Seja A e B matrizes de mesma dimensão. Segue do algoritmo de

Gauss-Jordan que A é linha-equivalente a uma matriz linha-reduzida R. Se S é uma matriz linha reduzida linha-equivalente a A, então pelo lema 5.6, A, R e S possuem o mesmo espaço linha. Pelo Lema 5.5, R = S. Isso mostra a primeira parte do Teorema.

Para a segunda parte, como vimos, segue do lema 5.6 que se A e B são linha-equivalentes, então possuem o mesmo espaço-linha. Por outro lado, sejam R e S matrizes linha-reduzidas linha-equivalentes a A e B respectivamente. Então R e S possuem o mesmo espaço-linha e, pelo lema 5.5, são iguais. Isso implica que A e B são linha-equivalentes. ä O próximo algoritmo dá uma resposta menos refinada que a forma linha-reduzida, dada pelo algoritmo de Gauss-Jordan, mas que é suficiente para muitas situações, por exemplo o cálculo de determinantes, e do posto de uma matriz e a resolução de sistemas. A vantagem sobre o algoritmo de Gauss-Jordan é que este é executado com a metade do número de oper-ações.

Algoritmo 5.7 (Eliminação Gaussiana) Entrada: Uma matriz A = [ai j] ∈ M(m × n)

Saída: Uma matriz linha-equivalente a A satisfazendo os itens 1,2 e 3 da definição de

matriz-linha reduzida.

Complexidade: O(m2n) operações aritméticas.

Este algoritmo difere do de Gauss-Jordan apenas pela substituição da linha marcada com um * por:

(12)

6 Determinantes

6.1 Volumes - Motivação

Pensemos no simples problema de determinar o volume do paralelepípedo oblíquo determi-nado por 3 vetores emR3, como na figura abaixo:

z

x

y

Denotemos tal volume por V (x, y, z). Bem o que fazemos com vetores? Somamos e mul-tiplicamos por escalares. E como tal volume se comporta perante tais operações? Quais as relações entre V (x, y, z), V (x, y, w ) e V (x, y, z + w)? Na figura abaixo temos os dois casos que podem ocorrer.

z

w

z+w

y

x

z w

z+w

y

x

Na figura acima estão ilustradas duas situações, respectivamente:

(a) z e w apontam para lados contrários do plano spam{x, y}, e V (x, y, z + w) = |V (x, y, z) −

V (x, y, w )|, e

(b) z e w apontam para o mesmo lado do plano spam{x, y} e V (x, y, z + w) = V (x, y, z) +

V (x, y, w ).

Essa quebra de casos pode ser eliminada se adicionarmos um sinal no volume que indica sua orientação. A este volume com sinal denotamos det(x, y, z) e o chamaremos determinante. Definimos det(x, y, z) negativo se z está em um determinado lado do plano spam{x, y}, como no desenho da esquerda na figura abaixo e positivo se z está no lado do plano spam{x, y} como no desenho da direita.

(13)

Com essa definição, temos:

det(x, y, z + w) = det(x, y, z) + det(x, y, w), det(x, y + w, z) = det(x, y, z) + det(x, w, z), det(x + w, y, z) = det(x, y, z) + det(w, y, z),

(8)

Também é geometricamente claro que, para a ∈ R:

a. det(x, y, z) = det(a.x, y, z) = det(x, a.y, z) = det(x, y, a.z). (9) E, se mudarmos a ordem de dois vetores, mudamos a orientação do terno (x, y, z). Ou seja: − det(x, y, z) = det(y, x, z) = det(z, y, x) = det(x, z, y). (10) Além disso, o volume de um cubo de aresta 1 é 1. Então det((1, 0, 0), (0, 1, 0), (0, 0, 1)) = 1. Finalmente, se x, y e z são L.D., então estes vetores são coplanares e determinam um par-alelepípedo de volume zero.

Em vez de pensar em determinantes de ternos de vetores, podemos pensar em determi-nantes de matrizes, da seguinte forma. Denote x := (x1, x2, x3), y := (y1, y2, y3) e z := (z1, z2, z3).

Definimos: det   x1 y1 z1 x2 y2 z2 x3 y3 z3  := det(x, y, z). Como x = µ_x 1 x2 x3 ¶ = µ_x 1 0 0 ¶ + µ₀ x2 0 ¶ + µ₀ 0 x3 ¶

e vale o análogo para y e z, ao aplicarmos a propriedade (8) em x, y e z em det(x, y, z) e considerarmos que conjuntos L.D possuem determinante zero, então: det   x1 y1 z1 x2 y2 z2 x3 y3 z3   = det   x1 y2 z3  + det   x1 z2 y3  + det   y1 x2 z3   + det   z1 x2 y3  + det   y1 z2 x3  + det   z1 y2 x3  .

Agora se considerarmos a propriedade (9), esse determinante fica:

det   x1 y1 z1 x2 y2 z2 x3 y3 z3   = x₁y₂z₃. det   1 1 1  + x₁y₃z₂. det   1 1 1  + x₂y₁z₃. det   1 1 1   +x2y3z1. det   1 1 1  + x3y1z2. det   1 1 1  + x3y2z1. det   1 1 1  . (11)

Se levarmos em consideração agora a propriedade (10), juntamente com o fato que det(Id3) =

(14)

det(x, y, z) = (x1y2z3+ x2y3z1+ x3y1z2) − (x1z2y3+ x2y1z3+ x3y2z1). (12)

Com isso, finalmente conseguimos uma fórmula para o determinante. O sinal dos coefi-cientes acima depende de quantas vezes foi necessário trocar as colunas das respectivas ma-trizes para chegar à identidade. Um número par de trocas nos dá um sinal positivo e um ímpar, um negativo.

Essas trocas podem ser observadas nos índices das parcelas da soma. Por exemplo, x2y3z1

aparece com sinal positivo pois a sequência 2, 3, 1 é obtida de 1, 2, 3 através de duas trocas de pares de números: 1, 2, 3 → 2,1,3 → 2,3,1. Enquanto x3y2z1aparece com sinal negativo, pois

3, 2, 1 é obtida de 1, 2, 3 por uma única troca entre um par de números.

A cada reordenação R dos números de 1 a n podemos atribuir um sinal dependendo da paridade do número de quantas trocas de pares de elementos são necessárias para obter R de 1 . . . n. Apesar de R poder ser obtida de várias formas diferentes dessa maneira, veremos na próxima subseção que a paridade do números de trocas é sempre constante.

6.2 Permutações e sinais

Uma permutação de [n] := {1,...,n}, aqui chamada somente de permutação, é uma bijeção de [n] em [n]. Denotamos por Sno conjunto das permutações de [n]. Considere duas cópias dos

diagramas do conjunto [n], alinhada como no exemplo da figura abaixo, com segmentos de retas ligando cada elemento da cópia da esquerda à sua imagem porσ ∈ Snna cópia da direita.

s s s s s s s s s s s s 6 6 5 5 4 4 3 3 2 2 1 1 # # # # # # c c c c c c !! !! !! !! !! !! c c c c c c

Definimos o sinal deσ como como (−1)k, onde k é o número pares de segmentos que se cruzam como no diagrama acima. Note que, para i < j , os segmentos i σ(i ) e j σ(j ) se cruzam se e só seσ(i) < σ(j). Um definição mais formal para sgn(σ) é dada por (−1)k, onde:

k := |{(i , j ) ∈ [n] × [n] : i < j e σ(i ) > σ(j )}|,

Isso é, o sinal deσ está relacionado à paridade do número de pares cuja ordem é invertida por

σ. Por exemplo, na permutação representada acima, temos k = 5, os pares de segmentos que

se cruzam são (13, 21), (13, 32), (46, 55), (46, 64) e (55, 64). Vamos ver que essa definição está de acordo com a motivação da última subseção no próximo teorema.

Um 2-ciclo é uma permutação que fixa todos, exceto 2 elementos. Denotamos o 2-ciclo que inverte os elementos i e j por (i j ). Veja a figura 1.

(15)

s s .. . ... s s j # σ(i) # # # # # s s s s .. . ... s s i σ(j) c c c c c c s s s s .. . ... s s Figure 1: Um 2-ciclo

(a) Toda permutação é composição de 2-ciclos.

(b) Seσ é uma permutação e i < j, então sgn(σ ◦ (i j)) = −sgn(σ).

(c) Seσ é a composição de um número par de 2-ciclos, então sgn(σ) = 1 e, se σ e a composição de um número ímpar de 2-ciclos, então sgn(σ) = −1.

(d) Seσ1eσ2são permutações, então sgn(σ1◦ σ2) = sgn(σ1).sgn(σ2).

Prova: A afirmação (a) se verifica por indução. O resultado é trivial para n ≤ 2. Para n ≥ 3

observe que (nσ(n)) ◦ σ fixa n. Pela hipótese de indução aplicada à restrição de (n σ(n)) ◦ σ à {1, . . . , n − 1}, (n σ(n)) ◦ σ é um produto de 2-ciclos. Então σ = (n σ(n)) ◦ (n σ(n)) ◦ σ também o é e o item (a) vale.

Para (b), podemos supor que i < j . Primeiro verifiquemos o resultado para σ(i ) < σ(j ), considere as representações abaixo deσ e σ ◦ (i j):

# # # # # # c c c c c c # # # # # # T T T T T T T T T c c c c c c k > j j k ∈ (j,i ) i k < i σ(k) > σ(j) σ(j) σ(k) ∈ (σ(j),σ(i)) σ(i) σ(k) < σ(i) .. . ... s s .. . ... s s .. . ... s s .. . ... s s .. . ... s s .. . ... Figure 2:σ # # # # # # c c c c c c # # # # # # T T T T T T T T T c c c c c c # # # # # # c c c c c c k > j j k ∈ (j,i ) i k < i σ(k) > σ(j) σ(j) σ(k) ∈ (σ(j),σ(i)) σ(i) σ(k) < σ(i) .. . ... s s .. . ... s s .. . ... s s .. . ... s s .. . ... s s .. . ... Figure 3:σ ◦ (i j)

Em ambos diagrama acima o número de cruzamentos entre linhas cinzas é o mesmo. Cada linha cinza com extremidade esquerda em pontos rotulados por elementos de [n] − {i ,..., j } e extremidade direita em [n] − {σ(i ),...,σ(j )} cruzam ou ambas linhas pretas ou nenhuma delas em ambos diagramas, portanto o número de cruzamentos preto-cinza deste tipo é o mesmo em ambos diagramas. As linhas com extremidade esquerda em [n] − {i ,..., j } e ex-tremidade direita em {σ(i),...,σ(j)} e aquelas com extremidade esquerda em {i,..., j} e direita em {σ(i),...,σ(j)} cruzam apenas uma linha preta em cada diagrama. Portanto, o número de cruzamentos preto-cinza deste tipo também é o mesmo em ambos diagramas. Finalmente as linhas cinzas com extremidade esquerda em {i , . . . , j } e direita em {σ(i),...,σ(j)} não cruzam as linhas pretas do diagrama esquerdo e cruzam ambas linha pretas no diagrama direito. Então a paridade do número de cruzamentos cinza-cinza e preto-cinza é a mesma nos dois diagra-mas. Mas apenas um dos diagramas possui um cruzamento preto-preto. Então a paridade do número total de cruzamentos é distinta em ambos diagramas. Logo sgn(σ ◦ (i j) = −sgn(σ) se

σ(i) < σ(i j). Se σ(i) > σ(j), basta aplicar o resultado anterior a σ ◦ (i j), que teremos sgn(σ) =

(16)

Note que (c) e (d) decorrem de (b). ä

6.3 Definição e Propriedades

Definimos o determinante de uma matriz A := [ai j] de dimensões n × n por

det(A) := X

σ∈Sn

sgn(σ).a1σ(n). . . anσ(n),

generalizando o o processo de dedução de (12). Dessa definição segue:

Exercício 6.1 Mostre que se A é uma matriz triangular, isso é, uma matriz quadrada, todas as

entradas abaixo da diagonal ou todas as entradas acima da diagonal são iguais a zero, então o determinante de A é o produto dos elementos de sua diagonal.

Proposição 6.2 Se A é uma matriz n × n, então:

(a) det(A) = det(AT);

(b) Se trocarmos duas colunas ou linhas de A obtemos uma matriz de determinante −det(A); (c) Se multiplicarmos uma linha ou coluna de A por um escalar a, obtemos uma matriz de

determinante a. det(A);

(d) Se A possui duas linhas ou colunas iguais, então det(A) = 0. (e) Se A = [c1, . . . , cn] e B = [c1, . . . , ci −1, di, ci +1, . . . , cn], então:

det[c1, . . . , ci −1, di+ ci, ci +1, . . . , cn] = det(A) + det(B).

(f ) Se c1, . . . , cnsão L.D., então d et [c1, . . . , cn] = 0.

(g) Se as linhas ou colunas de A são L.D., então det(A) = 0.

(h) Se a uma linha ou coluna de A, adicionarmos uma combinação das outras linhas ou col-unas respectivamente, então obtemos uma matriz com determinante igual ao de A. (i) Se A é uma matriz triangular, então det(A) é o produto das entradas na diagonal de A.

Corolário 6.3 O Algoritmo da Eliminação Gaussiana nos dá um algoritmo em tempo

polino-mial para o cálculo do determinante de uma matriz.

Corolário 6.4 As seguintes afirmações são equivalentes para uma matriz A de dimensões n × n:

(a) det(A) = 0.

(b) As linhas de A são L.D. (c) As colunas de A são L.D. (d) A não é inversível.

Corolário 6.5 O posto de uma matriz A é a dimensão da maior submatriz quadrada de A com

determinante não nulo.

Exercício 6.2 Mostre que se B é uma matriz obtida de A por uma operação elementar com

lin-has, então B = E .A, onde E é a matriz obtida da identidade pela operação elementar correspon-dente. Uma matriz obtida da identidade através de uma única operação elementar é chamada uma matriz elementar. Mostre que uma matriz é inversível se e só se é produto de matrizes elementares. Conclua que:

(17)

6.4 Adjunta clássica e regra de Cramer

Considere a uma matriz, de dimensões n×n, A := [ai j] definimos a matriz adjunta clássica(por

alguns autores, chamada simplesmente de adjunta) de A, pela matriz adj(A) = [ci j], onde ci j é

(−1)i +j vezes o determinante da matriz obtida de A pela remoção da linha i e da coluna j . Segue diretamente da definição de determinante que:

Proposição 6.6 Se i , j ∈ {1,...,n}, então: (a) det(A) = n P k=1 ai kci k= n P k=1 al jcl j e (b) A · adj(A) = det(A) · Idn.

Corolário 6.7 Se A é uma matriz inversível, então A−1= det(A)−1· adj(A).

Corolário 6.8 (Regra de Cramer) Se:

A ·    x1 .. . xn    =    b1 .. . bn   ,

Então para i = 1,...,n, xi. det(A) é igual ao determinante da matriz obtida de A pela troca da

coluna i pela coluna de entradas b1, . . . , bn.

7 Soma Direta

Sejam V um espaço vetorial e F uma família de subespaços de F . Definimos a soma de F como P W ∈FW := spam µ S W ∈F W ¶ .

Dizemos que a soma deF é direta se a interseção de cada dois subespaços distintos de F é zero e para quaisquer V1, . . . ,Vn∈ F e vi ∈ Vi− {0} com i ∈ [n], temos que v1, . . . , vn são L.I..

Neste caso, denotamos L

W ∈FW :=

P

W ∈F

W .

Lema 7.1 Sejam V um espaço vetorial de dimensão finita eF = {V1, . . . ,Vn} uma família com n

subespaços distintos de F . As seguintes afirmações são equivalentes: (a) A soma deF é direta.

(b) O vetor nulo se escreve de forma única como 0 =

n

P

i =1

vi com vi∈ Vipara i ∈ [n].

(c) Cada vetor v ∈ V se escreve de forma única como v = Pn

i =1

vi com vi∈ Vi para i ∈ [n].

(d) Para todas bases B1, . . . , Bnde V1, . . . ,Vn, respectivamente, B1∪ · · · ∪ Bné uma base de V1+

· · · + Vne Bi∩ Bj= ; para 1 ≤ i < j ≤ n.

(e) Existem bases B1, . . . , Bnde V1, . . . ,Vn, respectivamente, tais que, B1∪· · ·∪Bné uma base de

V1+ · · · + Vne Bi∩ Bj = ; para 1 ≤ i < j ≤ n.

(f ) dim(V1+ · · · + Vn) = dim(V1) + ··· + dim(Vn).

Prova: Claramente, (d)⇒(e)⇒(f). Vamos mostrar que (f) impica (d). Suponha (f) e considere

bases B1, . . . , Bn de V1, . . . ,Vn, respectivamente. Note que X := B1∪ · · · ∪ Bn é um gerador de

W := V1+ · · · + Vn. Logo X contém uma base B de W . Mas, por (f ), |B| = |B1| + · · · + |Bn| ≥ |X |.

(18)

É simples de verificar que (a) e (b) são equivalentes e que (c) implica (b). Vamos mostrar que (b) implica (c). Se v = n P i =1 vi = n P i =1 vi com vi, wi ∈ Vi, então 0 = v − v = v = n P i =1 vi− wi, e por

(b), para cada i ∈ [n], temos vi− wi= 0 e, portanto vi = wi. Então (a)⇔(b)⇔(c). Para finalizara

demonstração basta verificar que (b)⇒(d) e (d)⇒(a), como segue.

Suponha (b) e sejam, considere bases B1, . . . , Bnde V1, . . . ,Vn, respectivamente, e para cada

i ∈ [n], escalres av : v ∈ Bi. Se n P i =1 avv P v∈Bi

= 0, então, por (b), os escalares são todos nulos. Isso im-plica que B1∪. . .∪Bné L.I. e essas bases são par-a-par disjuntas. Pode-se verificar diretamente

que B1∪ . . . ∪ Bngera W e, portanto, vale (d).

Agora suponha (d). Seja I ⊆ [n] e vi∈ Vi− {0} para i ∈ I . Precisamos mostrar que v1, . . . , vn

são L.I. para mostrar (a). De fato, considere para cada k ∈ [n] uma base Bkde Vi, de forma que

vk∈ Bkse k ∈ I . Por (d), como v1, . . . , vn∈ B1∪ · · · ∪ Bn, então v1, . . . , vnsão L.I. ä

8 Subespaços invariantes e decomposição de operadores

Nesta seção vamos falar sobre como “quebrar” um operador linear em operadores atuando em dimensão menor. Uma ferramenta útil para demonstrações indutivas.

Seja V um espaço vetorial e T : V → V um operador linear. Dizemos que um subespaço

W ⊆ V é invariante por T (T -invariante para alguns autores) se T (W ) ⊆ W .

Exercício 8.1 Mostre que para n natural, ker Tne ImTnsão subespaços invariantes por T .

Exercício 8.2 Mostre que se ImTn = ImTn+1, então ImTk = ImTn para todo k ≥ n. Mostre o mesmo para núcleo em vez de imagem, em particular com o mesmo valor.

A existência de um número n tal que ImTn= ImTn+1(ou equivalentemente ker Tn= ker Tn+1), como no exercício acima é assegurado no caso de um espaço vetorial de dimensão finita. Neste caso chamamos tal número de estabilizador de T e o denotamos estT . (Essa definição foi in-ventada neste texto).

Exercício 8.3 Seja T um operador linear atuando num espaço vetorial de dimensão finita. Mostre

que para k ≥ estT , kerTk= ker TestT.

Se T é um operador linear atuando em V e W1, . . . ,Wmsão subespaços de V invariantes por

T tais que V = W1⊕ · · · ⊕ Wm, dizemos que T é a soma direta dos operadores T |W1, . . . , T |Wn e denotamos T = T |W1⊕ · · · ⊕ T |Wm.

Exercício 8.4 Suponha que V = W1⊕ · · · ⊕Wme, para cada i , Bi é uma base ordenada e Ti é um

operador de Wi. Seja B := B1, . . . , Bm. Mostre que:

[T ]B=    [T1]B1 . .. [Tm]Bm   .

Lema 8.1 Seja T um operador atuando num espaço vetorial V de dimensão finita. Então V =

(19)

9 Teorema da Decomposição Primária

Se x é uma indeterminada, denotamos x0:= 1. Se T é um operador linear ou matriz quadrada, denotamos T0:= Id. Se p(x) :=

m

P

k=0

xk é um polinômio e T um operador linear ou uma matriz quadrada, definimos p(T ) :=

m

P

k=0

Tk.

Lema 9.1 Se f e g são polinômios con M DC ( f1, f2) = 1, e T é um operador de um espaço vetorial

V , então ker( f1(T ) f2(T )) = ker( f1(T )) ⊕ ker( f2(T )).

Prova: Primero mostremos W := ker( f1(T )) ∩ ker( f2(T )) = {0}. Seja p o polinômio minimal

de TW := T |W. Como f1e f2anulam p, então p divide f1e f2. Como M DC ( f1, f2) = 1, então

p = 1 e p(T ) = I d anula W . Logo W = {0}. Agora mostremos que ker(f1(T ) f2(T )) = ker( f1(T )) +

ker( f2(T )). Como ker( f1(T )) e ker( f2(T )) estão contidos em ker( f1(T ) f2(T )), o mesmo vale para

ker( f1(T ))+ker( f2(T )). Como M DC ( f1, f2) = 1, então existem polinômios p1e p2tais que p1f1+

p2f2= I d. Se v ∈ ker( f1(T ) f2(T )), então v = p1(T ) f1(T )v + p2(T ) f2(T )v. Mas para {i , j } = {1,2},

pi(T ) fi(T )v ∈ ker( fj(T )). Então ker( f1(T ) f2(T )) ⊆ ker( f1(T )) + ker( f2(T )) e o lema vale. ä

Usando indução e o lema anterior:

Lema 9.2 Seja p = p1. . . pn um polinômio com M DC (pi, pj) = 1 para 1 ≤ i < j ≤ n e T um

operador de um espaço vetorial V . Então ker(p(T )) =Ln

i =1

ker(pi(T )).

Teorema 9.3 (da decomposição primária) Seja Seja p = p1. . . pnum polinômio com M DC (pi, pj) =

1 e T um operador de um espaço vetorial V . Suponha que p(T ) = 0. Então

(a) V =

n

L

i =1

ker(pi(T )),

(b) se f1e f2são polinômios tais que p = f1f2e M DC ( f1, f2) = 1, então ker( f1(T )) = Im( f2(T ))

e

(c) para i ∈ [n], ker(pi(T )) = Im

¡p

pi(T )¢.

Prova: O lema anterior implica (a). Mostremos (b). A inclusão Im( f2(T )) ⊆ ker( f1(T )) é

verificada diretamente. Como M DC ( f1, f2) = 1, então existem polinômios g1 e g2 tais que

g1f1+ g2f2 = I d. Se v ∈ ker( f1(T )), então v = g1(T ) f1(T )v + g2(T ) f2(T )v = g2(T ) f2(T )v ∈

Im( f2(T )) e vale a inclusão contrária. Então vale (b). De (a) e (b) segue (c). ä

10 Autovalores e Polinômios de Operadores e Matrizes

Se V é um espaço vetorial, dizemos que uma transformação linear de V em V é um operador

linear. A menos de menção contrária, nesta seção, T denota arbitrariamente um operador

em espaço vetorial de dimensão finita V nesta seção ou uma matriz quadrada, vista como um operador atuando em Kn. Dizemos que v ∈ V é um autovetor de T associado ao autovalor

λ ∈ K se T v = λv. Podemos observar que λ é um a autovalor de T se e só se ker(T − λId) 6= {0}.

Motivados por isso, definimos o auto-espaço de T associado aλ por: {v ∈ V ;T v = λv} = ker(T − λId).

Observe que um autovetor não pode estar associado a dois autovalores distintos. Mais geralmente:

(20)

Proposição 10.1 Seλ1, . . . ,λmsão autovalores distintos de T , então:

ker(T − λmId) + ··· + ker(T − λmId) = ker(T − λmId) ⊕ ··· ⊕ ker(T − λmId).

Em particular, se v1, . . . , vk são autovetores associados aos respectivos autovalores distintos

λ1, . . . ,λk. Então v1, . . . , vké L.I..

Corolário 10.2 T possui no máximo dimV autovalores.

Proposição 10.3 Se T é uma matriz quadrada. São equivalentes:

(a) λ é autovalor de T ; (b) ker(T − λId) 6= 0;

(c) det(T − λId) = 0.

Se x é uma indeterminada, denotamos x0:= 1. Se T é um operador linear ou matriz quadrada, denotamos T0:= Id. Se p(x) :=

m

P

k=0

xk é um polinômio e T um operador linear ou uma matriz quadrada, definimos p(T ) :=

m

P

k=0

Tk. Segue do Corolário 10.3 que:

Considere uma indeterminada x e uma matriz quadrada T . Observe que det(T − xId) = 0 é um polinômio em x. Motivados pelo lema anterior vamos chamá-lo o polinômio

caracterís-tico de T e denotaremos pT(x). Podemos estender o conceito de polinômio caraterístico para

um operador linear T definindo pT(x) = P[T ]B(x), onde B é uma base de V . É bem simples ver queλ é um autovalor de T se e só se λ é autovalor de [T ]B. Porém isso não é o suficiente para

mostrar que essa definição de PT(x) não depende da escolha da base B . Isso segue do seguinte

lema:

Lema 10.4 Se A, B e P são matrizes quadradas de mesma ordem com P invertível tal que: A =

P B P−1, então pA(x) = pB(x).

Segue da Proposição 10.3 que

Corolário 10.5 Suponha que T é uma matriz quadrada ou um operador de um espaço vetorial

de dimensão finita. Entãoλ é um autovalor de T se e só se pT(λ) = 0.

11 Diagonalização de Operadores e Polinômio Minimal

Teorema 11.1 Uma base ordenada B = v1, . . . , vnde V , é tal que [T ]B é diagonal da forma

   λ1 . .. λn   

se e só se, para cada i = 1,...,n λi é autovalor de T associado ao autovetor vi.

Um operador é dito diagonalizável se existe uma base B de V , tal que [T ]B é diagonal. Corolário 11.2 T é diagonalizável se e só se existe uma base de V formada por autovetores de T .

(21)

Corolário 11.3 Se dimV = n e T : V → V possui n autovalores distintos então V é

diagonal-izável.

Como dim(L (V,V )) = (dimV )2_{, então Id, T, . . . , T}n_{são L.D. e existe um polinômio não nulo}

que anula T .

Proposição 11.4 Existe um único polinômio mônico não nulo de grau mínimo mT,

denomi-nado o polinômio minimal de T tal que mT divide todos os polinômios que anulam T .

Prova: Para o leitor que dispões de conhecimentos prévios sobre anéis de polinômios, basta

verifica que o conjunto dos polinômios que anulam T é um ideal num domínio principal e portanto possui um gerador, mônico mT. Faremos aqui uma demonstração que não usa tais

pré-requisitos.

Pelo comentário antecedendo a proposição, existe um polinômio mônico não nulo de grau mínimo mT anulando T . Seja P um polinômio que anula T . Então o grau de P é maior ou igual

o de mT. Seja Q o quociente e R o resto de P por mT. Observe que R = 0 ou deg(R) < deg(mT)

e portanto R(T ) 6= 0 se R 6= 0. Mas:

0 = P(T ) = Q(T ).mT(T ) + R(T ) = R(T ).

Portanto R(T ) = 0 e R = 0. Isso implica que R divide P. Então tal polinômio mT existe. A

unicidade segue do fato de que se m0é um polinômio com as mesmas propriedades, então m0

divide mT e mT divide m0e, logo, são iguais. ä

Lema 11.5 Seλ é uma raiz de mT entãoλ é uma autovalor de T .

Prova: Seλ é uma raiz de mT então, existe um polinômio p(x) tal que mT(x) = (x − λ)p(x).

Se p(T ) = 0, temos uma contradição com a minimalidade de T . Então existe v ∈ V tal que

p(T )v 6= 0. Mas (T − λId).p(T )v = mT(T )v = 0. Portanto p(T )v é autovetor de V associado a λ.

ä

Lema 11.6 Seja T um operador em um espaço de dimensão finita V . Se p é um polinômio primo

e v ∈ V − {0} é tal que p(T )v = 0, então p divide mT.

Prova: Em caso contrário M DC (p, mT) = 1. Pelo Lema 9.1, V = ker(m(T )) = ker(m(T )) ⊕

ker(p(T )) com ker(p(T )) 6= ;. Uma contradição. ä

Lema 11.7 T é diagonalizável se e só se mT é o um produto de fatores lineares distintos mT(t ) =

(t − λ1) . . . (t − λk).

Prova: Sejamλ1, . . . ,λk os autovalores distintos de T . Pelo Corolário 11.2, T é diagonalizável

se e só se V = Pk

i =1ker(T − λi

I d ). Portanto, Pela Proposição 10.1, T é diagonalizável se e só se

k

L

i =1ker(T − λiI d ). Pelo Teorema da Decomposição Primária, isso é equivalente a V = ker((T −

λ1) . . . (T − λk)), o que equivale a mT(t ) dividir (t − λ1) . . . (t − λk). Mas, pelo Lema anterior,

cada (t − λi) obrigatoriamente divide mT(t ). Então (t − λ1) . . . (t − λk) divide mT. Portanto, T é

diagonalizável se e só se mT(t ) = (t − λ1) . . . (t − λk). ä

(22)

Teorema 11.8 Seλ1, . . . ,λksão os autovalores de T : V → V então são equivalentes:

(a) T é diagonalizável;

(b) Existe uma base de V formada por autovetores de T ; (c) (x − λ1) . . . (x − λk) anula T ;

(d) mT(x) = (x − λ1) . . . (x − λk);

(e) dimV = dim ker(T − λ1I d ) + ··· + dim ker(T − λkI d );

Em termos práticos é difícil encontrar o polinômio minimal de um operador. Os resultados seguintes são corolários da Forma Canônica de Jordan (Teorema 12.1), que veremos mais a frente, e podem ser úteis nessa tarefa.

Teorema 11.9 (Cayley Hamilton) O polinômio característico de T anula T . Isso é: PT(T ) = 0. Lema 11.10 Os polinômios característico e minimal de um operador têm as mesmas raizes

(in-cluindo as raizes complexas no caso real e raizes em uma determinada extensão de corpos no caso geral).

12 Forma de Jordan

12.1 A forma de Jordan e suas implicações

Um bloco de Jordan com autovalorλ é uma matriz cujos elementos da diagonal são iguais a um valorλ, os elementos abaixo da diagonal iguais a 1 e os demais nulos, como ilustrado abaixo.      λ 1 λ . .. ... 1 λ     

Exercício 12.1 Mostre que o polinômio mínimo de um bloco de Jordan com autovalorλ e

di-mensão n é igual a seu polinômio característico: (t − λ)n.

Exercício 12.2 Deduza uma fórmula para uma potência de um bloco de Jordan.

Dizemos que uma matriz é uma forma de Jordan se é da forma:      J1 J2 . .. Jk      ,

onde cada Ji é um bloco de Jordan.

Exercício 12.3 Mostre que o polinômio minimal de uma forma de Jordan com autovalores

dis-tintos l1, . . . , lm é igual a (t − λ1)k1· · · (t − λm)km, onde kié a dimensão do maior bloco com

auto-valorλi.

Teorema 12.1 Seja T um operador linear num espaço vetorial de dimensão finita V sobre um

corpo K . Suponha que o polinômio característico de T seja um produto de fatores lineares, cada qual com coeficientes em K . Então V possui uma base B tal que [T ]B é uma forma de Jordan.

Além disso, se B0é uma outra base com essa propriedade, então [T ]B e [T ]0_B só diferem,

(23)

A demonstração desse teorema será feita nas próximas subseções. Tal base B , como no teorema, na qual a matriz está na forma de Jordan, é denominada uma base de Jordan do operador T .

Exercício 12.4 Seja A uma matriz n × n e T um operador linear de um espaço V de dimensão

n. Seja B0uma base de V . Mostre que existe uma base B de V tal que [T ]B = A se e só se existe

uma matriz n × n inversível P tal que [T ]B= P AP−1.

Exercício 12.5 Sejamλ1e l2autovalores distintos de T e m, n ∈ N. Mostre que ker(T − λ1)m∩

ker(T − λ2)n= {0} e que ker[(T − λ1)m(T − λ2)n] = ker(T − λ1)m⊕ ker(T − λ2)n.

12.2 Operadores Nilpotentes

Dizemos que um operador T : V → V é nilpotente se existe um inteiro não negativo n tal que

Tn = 0. Em particular isso é equivalente a dizer que TestT = 0. Nesta seção vamos provar e existência e unicidade de formas de Jordan para operadores nilpotentes. Começamos com dois lemas simples, em seguida explicaremos um pouco sobre o formato das bases de Jordan para operadores nilpotentes demonstraremos a existência e unicidade.

Lema 12.2 Suponha que dimV < ∞, T : V → W é uma transformação linear e X ⊆ V é um um

conjunto L.I. tal que que T (X ) gera ImT . Então existe Y ⊆ ker(T ) tal que X ∪Y é uma base de V .

Prova: Vamos verificar que V = spam(X ) + ker(T ). De fato, se v ∈ V , então existe w ∈ spam(X )

tal que T (w ) = T (v). Portanto v = w + (v − w) com w ∈ spam(X ) e v − w ∈ ker(T ). Portanto

V = spam(X )+ker(T ). Agora X é L.I. e X ∪ker(T ) é um gerador de V . Então podemos completar X a uma base de V usando elementos de X ∪ ker(T ). Isso implica o lema. ä

A prova do próximo lema fica a cargo do leitor.

Lema 12.3 Se T : V → V é nilpotente então:

(a) 0 é o único autovalor de T

(b) Se dim(V ) < ∞, a B é uma base de V tal que [T ]B_B é triangular, então a diagonal de [T ]B_B tem todas entradas nulas.

(c) Se dim(V ) < ∞, então, para cada n com Tn6= 0, temos dim(Im(Tn+1)) < dim(Im(Tn)). De acordo com o lema anterior, numa forma de Jordan de um operador nilpotente, todos os elementos da diagonal serão nulos vejamos um exemplo de uma forma de jordan para um operador T :            v₀1 v₁1 v1₂ v₃1 v2₀ v₁2 v₀3 v₀1 0 v₁1 1 0 v₂1 1 0 v₃1 1 0 v₀2 0 v₁2 1 0 v₀3 0            .

Note que vi_j = Tjv₀i para os devidos índices. Então, se escrevermos vi := v₀i, temos que a

base de Jordan relativa à matriz acima é

(24)

Note também que T3v1, T v2, v3∈ ker(T ). Se definirmos r1= 3, r2= 1 e r3= 0. Podemos

escr-ever:

B = {Tjvi: i ∈ [3];0 ≤ j ≤ ri}.

Respectivamente r1+ 1, r2+ 1 e r3+ 1 são os tamanhos dos blocos na matriz acima. Então, em

geral, bases de Jordan de operadores nilpotentes possuem o formato {Tjvi : i ∈ [n],0 ≤ j ≤ ri}

com Tri+1_v

i = 0 para i ∈ [n]. A seguir demonstramos a existência e unicidade a menos de

ordem de blocos da forma de Jordan para operadores nilpotentes.

Lema 12.4 Seja T : V → V um operador nilpotente num espaço de dimensão finita. Então T

possui uma base de Jordan na forma {Tjvi : i ∈ [n],0 ≤ j ≤ ri} com Tri+1vi = 0 para i ∈ [n]. Além

disso, se B1e B2são bases de Jordan de T , então [T ]B_B1₁ e [T ]B_B2₂ podem diferir apenas pela ordem

dos blocos de Jordan.

Prova: Para a primeira parte, vamos proceder por indução na dimensão de V . Suponha que

o resultado seja válido para espaços com dimensão menor que a de V . Podemos supor que dim(V ) ≥ 1. Pelo Lema 12.3, dim(ImT ) < dimV . Seja B1:= {Tj(wi) : i ∈ [m],0 ≤ i ≤ si} uma

base de Jordan de Im(T ). Seja, para i ∈ [m], vi ∈ V tal que T vi= wi e ri := si+ 1. Então

B1= {Tj(vi) : j ∈ [m],1 ≤ j ≤ ri}. (13)

Defina

I := {Tj(vi) : i ∈ [k],0 ≤ j ≤ ri}.

Vamos mostrar que I é L.I.. De fato, suponha que:

0 = k X i =1 ri X j =0 ai , jTjvi. (14) Note que Tri+1_v

i= 0. Então, aplicando T na expressão acima, temos:

0 = k X i =1 ri X j =0 a_{i , j +1}Tj +1vi= k X i =1 ri+1 X j =1 ai , jTjvi = k X i =1 ri X j =1 ai , jTjvi.

Pela independência linear de B1e por (13), temos ai , j = 0 para j > 0. De (14) temos, portanto,

0 =

k

P

i =1

ai , jvi = 0. Aplicando T a essa expressão, temos 0 = k

P

i =1

ai ,0T vi = 0. Novamente, pela

independência linear de B1e por (13), temos que cada ai ,0é nulo. Então todos os coeficientes

de (14) se anulam e I é, portanto, L.I..

Pelo Lema 12.2, existem v_k+1, . . . , vm ∈ ker(T ) tais que B := I ∪ {v_k+1, . . . , vm} é uma base

de V . Defina ri = 0 para k + 1 ≤ i ≤ m. Então B = {Tj(vi) : i ∈ [n],0 ≤ i ≤ ri} é a base que

procuramos. Isso demonstra a primeira parte do lema.

Para a segunda parte também procederemos por indução em dim(V ). Suponha que o re-sultado seja válido para espaços com dimensão menor que a de V . Pelo Lema 12.3 (b), toda forma de Jordan de T possui diagonal com elementos nulos. Então todas as bases de Jordan de

T estão estão no formato da base B do enunciado do lema. no formato da base B do enunciado

do lema. Sejam B1:= {Tjvi : i ∈ [m],0 ≤ j ≤ ri} e B2:= {Tjwi : i ∈ [n],0 ≤ j ≤ si}. Escolha os

rótulos dos elementos de forma que r1≤ · · · ≤ rm e s1≤ · · · ≤ sn. Sejam a e b os maiores índices

tais que ra, sb ≥ 1. Tudo o que precisamos mostrar é que m = n e si = ri para cada i ∈ [n].

Note que B₁0 := {Tj(T vi) : i ∈ [a],0 ≤ j ≤ ri− 1} e B₂0 := {Tj(T wi) : i ∈ [b],0 ≤ j ≤ si− 1} são

(25)

ri− 1 = si− 1 e, portanto, ri = si para i ≤ a. Mas sa+1= · · · = sn= ra+1= · · · = rn= 0 e, como o

tamanho do k-ésimo bloco de J (resp. K ) é (rk+ 1) (resp. sk+ 1), então:

n − a = dimV − [(r1+ 1) + · · · (ra+ 1)] = dimV − [(r1+ 1) + · · · (ra+ 1)] = m − a.

Portanto, m = n e o lema vale. ä

Obs: A demostração do Lema nos dá um método para construir uma base de Jordan de T

a partir de uma de T |ImT . Para Tk= 0, podemo começar com uma base de T |_ImTk−1 construir uma de T |ImTk−2, com essa, construir uma de T |ImTk−3e assim sucessivamente. Isso nos dá um algoritmo para encontrar bases de Jordan de operadores nilpotentes em dimensão finita.

12.3 Demonstração

Lema 12.5 Seja J um bloco de Jordan de tamanho r . Então:

(a) Se o autovalor de J é diferente de zero, então cada potência de J possui posto r e não possui colunas nulas.

(b) Se o autovalor de J é zero, então Jnpossui max{n, r } colunas nulas e posto r − max{n,r }.

Lema 12.6 Seja A uma matriz na forma de Jordan, bno número de blocos de A com autovalor

zero e tamanho n e cn o número de colunas não nulas de An. Seja também r o tamanho do

maior bloco de autovalor zero e s a soma dos tamanhos dos blocos com autovalor diferente de zero. Então

(a) para cada 0 ≤ k ≤ r :

postoAk= ck= s + (r − k)br+ (r − k − 1)br −1+ · · · + 2bk+2+ bk+1.

(b) b1, . . . , bn, . . . estão en função dos postos das potências de A.

Prova: Vamos provar (a). Primeiro observeos que, se A possui blocos J1, . . . , Jl, então Aké uma

matriz com blocos J₁k, . . . , J_lk e postoAk = postoJ₁k+ · · · + postoJk_l. Pelo Lema anterior, temos postoAk= ck para cada k. Além disso, temos que o posto de cada J_ik é o número de colunas

não nulas desse bloco.

Para, cada bloco Ji com autovalor zero, temos que Jn_i = 0 para n ≥ r e, portanto cn = s.

Note que Jr −1_i possui exatamente uma coluna não nula se possui tamanho r e todas as colunas nulas se possui tamamnho menor que r . Então c_{r −1}= s + br. Já J_ir −1possui duas colunas não

nulas de o tamanho de Ji é r , exatamente uma coluna não nula se o tamanh é r − 1 e todas

colunas nulas para tamanhos menores. Portanto c_{r −2}= s + 2br+ br −1. Assim, sucessivamente,

concluímos o lema.

Para (b). Já inferimos que, para n ≥ r , bn = s = postoAn. Verificamos que, para todo n,

postoAn= cn. Então basta mostrarmos que para n < r , bnesté em função de c1, . . . , cr.

Pode-mos isolar br na equação cr −1= s + br e isso vale para br. Da equação cr −2 = s + 2br+ br −1,

Concluímos que b_{r −1} está em função br e cr −2 e, portanto em função de c1, . . . , cr. Isolando

cada bnseguindo essa lógica, concluímos o resultado. ä

Corolário 12.7 Se T é um operador num espaço de dimensão finita, A uma matriz na forma

de Jordan eλ um autovalor de T , então o número de blocos de A com autovalor de λ com cada tamanho está em função de T .

linear

Álgebra Linear - Um guia veraneio

Contents

Prefácio da Versão de 2014

1 Espaços Vetoriais

2 Transformações Lineares

3 Matrizes

4 Relação entre matrizes e transformações lineares

5 Algoritmo de Gauss-Jordan

6 Determinantes

6.1 Volumes - Motivação

z

x

y

z

w

z+w

y

y

y

x

x

x

z w

z+w

y

y

y

x

x

x

6.2 Permutações e sinais

6.3 Definição e Propriedades

6.4 Adjunta clássica e regra de Cramer

7 Soma Direta

8 Subespaços invariantes e decomposição de operadores

9 Teorema da Decomposição Primária

10 Autovalores e Polinômios de Operadores e Matrizes

11 Diagonalização de Operadores e Polinômio Minimal

12 Forma de Jordan

12.1 A forma de Jordan e suas implicações

12.2 Operadores Nilpotentes

12.3 Demonstração