To be continued

(1)

Aula n´umero 2 (08/03)

Defini¸c˜ao. Um subconjunto U ⊂IRⁿ ´e chamado aberto se para todo x∈U existe r >0 tal que B(x;r)⊂U.

Nota¸c~ao: para x ∈ IRⁿ e r > 0 denotamos por B(x;r) a bola aberta de centro x e raio r definida por:

B(x;r) ={

y ∈IRⁿ:∥x−y∥< r} e por B[x;r] a bola fechada de centro x e raio r definida por:

B[x;r] ={

y∈IRⁿ :∥x−y∥ ≤r} .

Por ∥ · ∥ denotamos anorma Euclideana: ∥x∥=( ∑n i=1x²_i

)¹₂ .

Defini¸cão. Seja U ⊂IR^m um aberto e considere uma fun¸cão f : U →IRⁿ. Dizemos que f é diferenciável num ponto x0 ∈U se existe uma transforma¸cão linearT :IR^m→IRⁿ de modo que a aplica¸cão r definida por:

f(x0+h) =f(x0) +T(h) +r(h), satisfaz a condi¸c˜ao lim_h→0 ^r(h)_∥_h_∥ = 0.

De modo abreviado: f ´e diferenci´avel em x0 ∈ U se existe T : IR^m → IRⁿ linear tal que:

hlim→0

f(x0+h)−f(x0)−T(h)

∥h∥ = 0.

(1) O caso n=m=1.

Recordar que as transforma¸cões lineares T : IR→IR são todas da forma T(h) =Lh, onde L é um número real.

Teorema. Uma fun¸cão f : U ⊂IR → IR é diferenciável num ponto x0 ∈U se e somente se f é derivável no ponto x₀ (no sentido do Cálculo I), i.e., se existe o limite:

f^′(x₀) = lim

h→0

f(x0+h)−f(x0)

h .

Demonstra¸cão. Observe que f é diferenciável no ponto x0 se e somente se existe L∈IR tal que:

lim

h→0

f(x₀+h)−f(x₀)−Lh h

h

|h| = 0;

notando que a quantidade _|h|^h =±1 ´e limitada, vemos que a condi¸c˜ao acima equivale a:

lim

h→0

f(x₀+h)−f(x₀)−Lh

h = lim

h→0

f(x₀+h)−f(x₀)

h −L = 0.

(2)

Isso completa a demonstra¸c˜ao.

Observa¸c~ao: note que a transforma¸cão linear T que aparece na defini¸cão de fun¸cão dife- renciável é T(h) =f^′(x0)h nesse caso.

Exemplo: Considerando a fun¸c˜ao f : IR → IR, f(x) = x³, e o ponto x0 = 4 ent˜ao escrevemos:

f(x₀+h) = (4 +h)³ = 64 + 48h+ 12h²+h³ =f(x₀) +T(h) +r(h),

onde escolhemos T(h) = 48h (que ´e linear!) e da´ır(h) = 12h²+h³. Observe que de fato lim_h→0 ^r(h)_|_h_| = lim_h→0 ^r(h)_h = 0.

(2) Relacionando diferencia¸c˜ao com derivadas direcionais e derivadas parciais.

Defini¸cão. Dada uma fun¸cão f : U → IRⁿ definida num aberto U ⊂ IR^m, um ponto x₀ ∈U e um vetorv ∈IR^m então a derivada direcional de f no ponto x₀ e na dire¸cão v é definida por (se existir):

∂f

∂v(x0) = lim

t→0

f(x0+tv)−f(x0)

t .

Se e_i denota o i-ésimo vetor da base canônica de IR^m então a derivada direcional _∂e^∂f

i(x₀)

´e denotada tamb´em por _∂x^∂f

i(x0) e é chamada a i-´esima derivada parcial de f no ponto x0. Suponha quef :U ⊂IR^m →IRⁿé diferenciável no pontox0 ∈U, de modo que existe T :IR^m →IRⁿ linear tal que:

hlim→0

f(x₀+h)−f(x₀)−T(h)

∥h∥ = 0.

Fixe v ∈ IR^m n˜ao nulo; vamos fazer a mudan¸ca de vari´avel h = tv no limite acima, onde t→0:

tlim→0

f(x₀+tv)−f(x₀)−T(tv)

∥tv∥ = 0.

Obtemos ent˜ao:

tlim→0

1

∥v∥

[f(x0+tv)−f(x0)−T(tv) t

] t

|t| = 0;

pela linearidade de T, T(tv) =tT(v) e portanto:

tlim→0

1

∥v∥

[f(x₀ +tv)−f(x₀)

t −T(v)

] t

|t| = 0.

Como _∥_v¹_∥ é constante e _|^t_t_| =±1 é limitado, a igualdade acima é equivalente a:

tlim→0

f(x₀+tv)−f(x₀)

t −T(v) = 0,

o que mostra que a derivada direcional ^∂f_∂v(x0) existe e ´e igual a T(v).

(3)

Teorema. Se f : U ⊂ IR^m → IRⁿ é diferenciável num ponto x₀ ∈ U então f admite derivadas direcionais no ponto x0 em qualquer dire¸cão e vale a fórmula:

∂f

∂v(x0) =T(v),

para todo v ∈ IR^m, onde T : IR^m → IRⁿ é uma transforma¸cão linear como a que aparece na defini¸cão de fun¸cão diferenciável.

Demonstra¸c˜ao. O caso v̸= 0 foi provado acima e o caso v= 0 ´e trivial.

Corolário. A transforma¸cão linear T que aparece na defini¸cão de fun¸cão diferenciável é

´ unica.

Demonstra¸cão. SeT eT^′ são duas transforma¸cões lineares que “servem” para a defini¸cão de fun¸cão diferenciável então T(v) = ^∂f_∂v(x₀) = T^′(v) para todo v ∈ IR^m, pelo Teorema acima.

Defini¸cão. A transforma¸cão linear T que aparece na defini¸cão de fun¸cão diferenciável (que é única, pelo Corolário acima) é denotada por df(x₀) e é chamada a diferencial da fun¸cão f no ponto x0.

Quando f ´e diferenci´avel no pontox0 podemos escrever agora:

f(x₀+h) =f(x₀) + df(x₀)·h+r(h), com limh→0 r(h)

∥h∥ = 0.

Observa¸c~ao: provamos a seguinte fórmula importante para uma fun¸cão diferenciável f :U ⊂IR^m→IRⁿ num ponto x0 ∈U:

df(x0)·v= ∂f

∂v(x0), para todo v∈IR^m. (3) Matriz Jacobiana.

Recorde da álgebra linear que se T : V → V^′ é uma aplica¸cão linear, com V, V^′ espa¸cos vetoriais, B = (b1, . . . , bm) uma base de V e B^′ = (b^′₁, . . . , b^′_n) uma base de V^′ então a matriz que representa T nas bases BeB^′, denotada por [T]BB^′, é a matriz n×m cuja entrada na linha i, colunaj, é a i-´esima coordenada do vetor T(bj) na base B^′ (veja exerc´ıcios).

Defini¸cão. Se f : U ⊂ IR^m → IRⁿ é uma fun¸cão diferenciável num ponto x0 ∈ U então a matriz Jacobiana de f no ponto x₀, denotada por Jf(x₀), ´e a matriz que representa a aplica¸cão linear df(x0) :IR^m →IRⁿ nas bases canônicas de IR^m e IRⁿ.

Para calcular as entradas de Jf(x0) fazemos o seguinte:

Jf(x0)ij =[

df(x0)·ej

]i

= [∂f

∂e_j(x0) ]i

= [ ∂f

∂x_j(x0) ]i

= ∂fⁱ

∂x_j(x0),

i= 1, . . . , n, j = 1, . . . , m;

para a ´ultima passagem acima veja os exerc´ıcios.

Provamos o seguinte:

(4)

Teorema. Se f :U ⊂IR^m → IRⁿ é uma fun¸cão diferenciável num ponto x₀ ∈U então a matriz Jacobiana de f no ponto x0 é dada por:

Jf(x₀) =





∂f¹

∂x1(x0) · · · _∂x^∂fm¹ (x0) ... . .. ...

∂fⁿ

∂x₁(x₀) · · · _∂x^∂f^mⁿ(x₀)



.

Exemplo: Se f :U ⊂IR² →IR² ´e dada por f(x, y) =

( 1

xy,cosx )

, U ={

(x, y)∈IR² :xy ̸= 0}

(U ´e aberto!)

ent˜ao a diferencial de f num ponto (x₀, y₀)∈U ´e dada por (use a matriz Jacobiana!):

df(x₀, y₀)·(h, k) = (

− h

x²₀y₀ − k

x₀y₀²,−hsenx₀ )

,

para (h, k)∈IR². Para ser rigoroso,ainda não temos teoria suficiente para ver rapidamente que f é diferenciável! Admitindo esse fato por enquanto, obtemos a f´ormula acima para df(x0, y0).

Observa¸c~ao: Quando f : U ⊂ IR^m → IRⁿ é diferenciável em todos os pontos de U então dizemos que f é diferenciável em U. Para cada x0 ∈U, df(x0) é uma aplica¸cão linear de IR^m em IRⁿ; que tipo de objeto seria df? Considere o espa¸co vetorial:

Lin(IR^m, IRⁿ) = aplica¸c˜oes lineares deIR^m em IRⁿ;

recorde da álgebra linear que Lin(IR^m, IRⁿ) pode ser identificado naturalmente com o espa¸co vetorial de todas as matrizes reais n×m (que tem dimensãonm). A diferencial de f nos dá então uma aplica¸cão:

df :U ⊂IR^m−→Lin(IR^m, IRⁿ),

que leva cada x₀ ∈U em df(x₀)∈Lin(IR^m, IRⁿ). No casom=n= 1 então Lin(IR^m, IRⁿ) pode ser identificado com IR (matrizes 1×1!) e da´ı df vira uma aplica¸cão de U ⊂IR em IR; essa aplica¸c˜ao é a clássica derivada f^′ de f do Cálculo I!

(4) O caso n=1: gradientes.

Esse assunto ser´a retomado depois com mais detalhes.

Se f : U ⊂ IR^m → IR é uma fun¸cão a valores reais diferenciável num ponto x₀ ∈ U então a diferencial de f em x0 define um elemento do dual de IR^m, i.e., df(x0) ∈ IR^m∗

(recorde que o dual de um espa¸co vetorial real V ´e o espa¸co vetorial Lin(V, IR)).

O produto interno canˆonico de IR^m induz um isomorfismo de IR^m sobre seu dual IR^m∗ dado por v 7→ ⟨v,·⟩. Esse isomorfismo leva o vetor v = (v1, . . . , vm) de IR^m sobre o

(5)

elemento de IR^m∗ que é representado pela matriz (v₁ · · · v_m) (é uma matriz 1×m!). Já vimos que a matriz que representa df(x0) (ou seja, Jf(x0)) é dada por:

Jf(x0) = ( ∂f

∂x1

(x0) · · · ∂f

∂xm

(x0) )

. O vetor de IR^m correspondente a df(x₀)∈IR^m∗ ´e portanto o vetor

∇f(x0) = ( ∂f

∂x1

(x0), . . . , ∂f

∂xm

(x0) )

conhecido como o gradiente de f no ponto x₀. Obtemos ent˜ao a f´ormula:

∂f

∂v(x₀) = df(x₀)·v=⟨∇f(x₀), v⟩, para todo v ∈IR^m.

(5) Fun¸cões diferenciáveis são cont´ınuas.

Vamos usar aqui que transforma¸cões linearesT :IR^m →IRⁿ são cont´ınuas; isso segue do fato que as mesmas podem ser escritas em termos de somas e produtos (isso será rediscutido depois).

Teorema. Se f :U ⊂IR^m →IRⁿ é diferenciável no ponto x0 ∈U então f é cont´ınua no ponto x0 ∈U.

Demonstra¸c˜ao. Escrevemos:

f(x₀+h) =f(x₀) + df(x₀)·h+r(h),

com lim_h→0 ^r(h)_∥_h_∥ = 0; a fortiori lim_h→0r(h) = lim_h→0 ^r(h)_∥_h_∥∥h∥ = 0. Fazendo h → 0 na f´ormula acima obtemos, usando a continuidade da transforma¸c˜ao linear df(x0):

lim

h→0f(x₀+h) =f(x₀) + df(x₀)·0 =f(x₀).

Observa¸c~ao: A existˆencia das derivadas parciais _∂x^∂f

i(x₀), i= 1, . . . , m, n˜ao garante que f

é diferenciável emx0. Nem a existência de todas as derivadas direcionais def emx0, junto com a continuidade de f em x0 (e até mesmo junto com a linearidade de v 7→ ^∂f_∂v(x0)) implicam a diferenciabilidade de f em x0. Para contra-exemplos estranhos procurem o Curso de Análise Vol. II (cap´ıtulo 3) ou o livro de Cálculo II do Guidorizzi. Não daremos importância a tais exemplos.

Observa¸c~ao: Toda teoria desenvolvida até agora pode ser feita trocando IR^m e IRⁿ por espa¸cos vetoriais reais de dimensão finita arbitrários! Para isso precisamos apenas fazer alguns esclarecimentos sobre normas em espa¸cos vetoriais quaisquer (fica para depois).

Observamos também que a no¸cão de derivada parcial não faz sentido quando trocamos IR^m por um espa¸co vetorial qualquer, a não ser que uma base seja fixada em tal espa¸co;

similarmente, para dar sentido `a matriz Jacobiana, precisamos fazer escolhas de bases nos espa¸cos vetoriais em quest˜ao.

(6)

Exerc´ıcios.

(não é para entregar, mas é bom dar uma olhada e quem tiver problemas me procura).

´Algebra Linear.

1. Seja T : V → V^′ uma transforma¸cão linear, onde V e V^′ são espa¸cos vetoriais de dimensão finita. Sejam B e B^′ bases de V e V^′ respectivamente. Denote por [T]BB^′

a matriz que representa T com respeito às bases Be B^′; por [x]_B denotamos o vetor coluna que contém as coordenadas com respeito à base B de um vetorx∈V.

(a) Mostre que

[T]_BB′[x]_B =[ T(x)]

B^′.

(b) Se S : V^′ → V^′′ é uma outra transforma¸cão linear, com V^′′ um espa¸co vetorial de dimensão finita eB^′′ uma base de V^′′, mostre que

[S]B^′B^′′[T]BB^′ = [S◦T]BB^′′.

Diferencia¸c~ao.

2. Seja f : U → IRⁿ uma fun¸c˜ao com U ⊂ IR^m aberto. Escreva f = (f¹, . . . , fⁿ) com cada fⁱ :U →IR. Para x₀ ∈U, mostre que:

(a) f é diferenciável emx₀ se e somente se cadafⁱ é diferenciável emx₀, sendo nesse caso [

df(x0)]i

= dfⁱ(x0), i = 1, . . . , n (“a i-´esima coordenada da diferencial ´e a diferencial da i-´esima coordenada”).

(b) parav ∈IR^m, mostre que ^∂f_∂v(x0) existe se e somente se ^∂f_∂vⁱ(x0) existe para cada i = 1, . . . , n; nesse caso, mostre que [_∂f

∂v(x₀)]i

= ^∂f_∂vⁱ(x₀), i = 1, . . . , n (“ a i-

´esima coordenada de uma derivada direcional ´e a derivada direcional da i-´esima coordenada”).

(7)

Aula n´umero 3 (13/03)

(1) O caso m=1: curvas em IRⁿ; relacionando vetores tangentes e diferenciais.

Quando m = n = 1, vimos que a no¸cão de diferenciabilidade coincide com a no¸cão clássica de derivada do Cálculo I: mais precisamente, f : U ⊂IR → IR é diferenciável em x₀ ∈U se e somente se existe a derivadaf^′(x₀)∈IR(do Cálculo I) e nesse caso a diferencial def no pontox0 é dada por df(x0)·h=f^′(x0)h. Vamos agora ver o que acontece quando apenas m = 1; estamos falando então de curvas em IRⁿ. Como mostraremos a seguir, o casom= 1 com nqualquer é essencialmente idêntico ao casom=n= 1 discutido na aula anterior (na verdade, só separamos o caso m=n= 1 por motivos didáticos).

Defini¸cão. Dada uma aplica¸cão f : U ⊂ IR → IRⁿ então o vetor tangente a f no ponto x0 ∈U é definido pelo limite (se existir):

f^′(x0) = lim

t→0

f(x0+t)−f(x0)

t ∈IRⁿ.

Observe que f^′(x₀) é a mesma coisa que a derivada direcional ^∂f_∂v(x₀) com v = 1 (parece estranho? números reais também são vetores!).

Recorde que uma transforma¸cão linear T : IR → IRⁿ é sempre da forma T(h) = zh, onde z ∈IRⁿ é um vetor (veja os exerc´ıcios).

Teorema. Uma aplica¸cão f : U ⊂ IR → IRⁿ é diferenciável num ponto x0 ∈ U se e so- mente se o vetor tangentef^′(x₀)existe; as duas seguintes fórmulas relacionam a diferencial df(x0) :IR→IRⁿ com o vetor tangente f^′(x0)∈IRⁿ:

f^′(x₀) = df(x₀)·1, df(x₀)·h=f^′(x₀)h, h ∈IR.

Demonstra¸cão. E igual a que fizemos quando´ n=m= 1. A fun¸cãof é diferenciável no ponto x₀ ∈U se e somente se existe z ∈IRⁿ tal que:

h→0lim

f(x0+h)−f(x0)−zh

|h| = 0;

como já fizemos várias vezes agora, trocamos _|¹_h_| por _h¹_|^h_h_| e observamos que _|^h_h_| = ±1 é limitado. Da´ı, f é diferenciável em x0 se e somente se:

hlim→0

f(x0+h)−f(x0)−zh

h = lim

h→0

f(x0+h)−f(x0)

h −z = 0.

Observa¸c~ao: Quando m = 1, flexibilizamos um pouco a hip´otese que U seja um aberto;

admitimos também queU ⊂IRseja um intervalo não necessariamente aberto. Para quem se sentir incomodado com isso, observe que todas as demonstra¸cões que fizermos funcionam quando m = 1 e U é um intervalo qualquer. Também no caso U ⊂ IR^m (m arbitrário) é

(8)

poss´ıvel flexibilizar a hipótese queU seja aberto na maioria dos teoremas, mas ébem mais dif´ıcil descrever quais são os subconjuntosU ⊂IR^m “admiss´ıveis” para o desenvolvimento da teoria e por isso preferimos trabalhar só com abertos quando m ̸= 1 (voltaremos um pouco a esse assunto quando discutirmos variedades com bordo).

Observa¸c~ao: Quando m = 1 é mais comum pensar nas coisas da seguinte maneira: em vez de escrever f : U ⊂ IR → IRⁿ escrevemos γ : I → IRⁿ, onde I ⊂ IR é um intervalo (tipicamente, I = [a, b]). Dizemos que γ é uma curva em IRⁿ; os elementos de I são tipicamente denotados por letras como t e s e são chamados de instantes (em vez de pontos). É comum também dizer que t é o parâmetro da curva γ; dizemos a´ı que γ^′(t) é o vetor tangente a γ no instante t.

(2) Dois exemplos f´aceis.

Exemplo. Sef :IR^m→IRⁿé uma fun¸cão constante entãof é diferenciável e sua diferencial

´e zero em qualquer ponto.

Exemplo. Sef :IR^m→IRⁿé uma transforma¸cão linear entãofé diferenciável e df(x0) =f para todo x0 ∈IR^m.

(afinal de contas, a melhor aproxima¸cão linear de uma transforma¸cão linear é ela mesma!).

Em ambos os exemplos acima, quando escrevemos a defini¸c˜ao de diferenciabilidade vemos que o resto r(h) ´e zero, de modo que limh→0 r(h)

∥h∥ = 0 ´e trivial.

(3) Soma e produto de aplica¸c˜oes diferenci´aveis.

Teorema. Se f, g : U ⊂ IR^m → IRⁿ são ambas diferenciáveis em x₀ ∈ U então f +g é diferenciável em x0 e d(f +g)(x0) = df(x0) + dg(x0).

Intuitivamente, se df(x0) ´e uma boa aproxima¸c˜ao linear para f perto de x0 e dg(x0)

é uma boa aproxima¸cão linear para g perto de x₀ então df(x₀) + dg(x₀) é uma boa aproxima¸cão linear paraf +g perto de x0. A prova segue basicamente esse padrão:

Demonstra¸c˜ao. Escrevemos:

f(x₀+h) =f(x₀) + df(x₀)·h+r₁(h), g(x0+h) =g(x0) + dg(x0)·h+r2(h), com limh→0 r1(h)

∥h∥ = limh→0 r2(h)

∥h∥ = 0. Somando as duas igualdades obtemos:

(f +g)(x0+h) = (f +g)(x0) +[

df(x0) + dg(x0)]

·h+r(h), com r = r1+r2. Obviamente, limh→0 r(h)

∥h∥ = limh→0 r1(h)+r2(h)

∥h∥ = 0 e df(x0) + dg(x0) ´e uma transforma¸c˜ao linear.

Observa¸c~ao: O seguinte truque (parece bobagem, mas não é) facilita às vezes o trabalho com a defini¸cão de diferenciabilidade: usamos

f(x₀ +h) =f(x₀) + df(x₀)·h+ρ(h)∥h∥,

com limh→0ρ(h) = 0, em vez da formula¸c˜ao dada inicialmente com o resto r.

Como é de se esperar, a diferencia¸cão de um produto dá um pouco mais de trabalho.

Nesse caso, s´o faz sentido considerar aplica¸c˜oes a valores reais.

(9)

Teorema. Se f, g :U ⊂IR^m →IR são diferenciáveis num ponto x₀ ∈ U então o produto f g é diferenciável em x0 e vale a fórmula:

d(f g)(x₀)·h =[

df(x₀)·h]

g(x₀) +f(x₀)[

dg(x₀)·h] , para todo h ∈IR^m.

Demonstra¸cão. O lado direito da fórmula acima define de fato uma transforma¸cão linear em h, o que j´a é um bom come¸co. Escrevemos:

f(x₀+h) =f(x₀) + df(x₀)·h+ρ₁(h)∥h∥, g(x₀+h) =g(x₀) + dg(x₀)·h+ρ₂(h)∥h∥,

com limh→0ρ1(h) = limh→0ρ2(h) = 0. Multiplicando as duas igualdades acima obtemos:

(f g)(x0+h) = (f g)(x0) +[

df(x0)·h]

g(x0) +f(x0)[

dg(x0)·h]

+ρ(h)∥h∥, onde ρ ´e dado por:

ρ(h) =

[df(x₀)·h][

dg(x₀)·h]

∥h∥ +g(x0)ρ1(h) +[

dg(x0)·h] ρ1(h) +f(x₀)ρ₂(h) +[

df(x₀)·h]

ρ₂(h) +ρ₁(h)ρ₂(h)∥h∥.

Devemos mostrar que limh→0ρ(h) = 0. Para isso, observe que os seis termos aparecendo na expressão para ρ são o produto de alguma coisa que tende a zero por alguma coisa limitada (quando h está próximo de zero) — alguns termos têm até mais de um fator que vai para zero. Só o primeiro termo é um pouco mais complicado: sua análise depende da observa¸cão que df(x0)·( _h

∥h∥

) é limitado; isso segue do fato que a aplica¸cão cont´ınua df(x0) : IR^m → IR é limitada na esfera unitária {

v ∈ IR^m : ∥v∥ = 1}

de IR^m, já que a mesma é compacta (voltaremos a esse assunto na revisão de topologia).

(4) Mais ´algebra linear: aplica¸c˜oes bilineares e multi-lineares.

Defini¸cão. Sejam V₁, V₂, W espa¸cos vetoriais. Uma aplica¸cão B : V₁ × V₂ → W é chamadabilinearquando Bfor linear em cada variável, i.e., para todosv1 ∈V1, v2 ∈V2 as aplica¸cões B(v₁,·) :V₂ →W e B(·, v₂) :V₁ →W são lineares. De maneira mais expl´ıcita, B é bilinear quando valem as seguintes condi¸cões:

(i) B(v1+v^′₁, v2) =B(v1, v2) +B(v₁^′, v2);

(ii) B(cv₁, v₂) =c B(v₁, v₂);

(iii) B(v1, v2+v₂^′) =B(v1, v2) +B(v1, v₂^′);

(iv) B(v₁, cv₂) =c B(v₁, v₂);

para todos v1, v^′₁ ∈V1, v2, v₂^′ ∈V2 e c∈IR. Quando W =IR dizemos tamb´em que B

´e uma forma bilinear.

Observa¸c~ao: Acustumem-se com a nota¸cão· porque ela é muito prática. Por exemplo, na defini¸cão acima, t´ınhamos uma aplica¸cão B de duas variáveis; fixando uma das variáveis,

(10)

sobra uma aplica¸cão de uma única variável. Essa aplica¸cão obtida de B fixando uma variável, é denotada colocando um · na variável que ficou livre. Assim, por exemplo, se B :V1×V2 →W e v1 ∈V1 então B(v1,·) denota a aplica¸cão de V2 em W que leva v2 em B(v1, v2).

Exemplo: A multiplica¸cão de números reais é uma aplica¸cão (e na verdade uma forma) bilinear, i.e., a aplica¸cão:

m:IR×IR−→IR dada por m(x, y) =xy ´e bilinear.

Exemplo: O produto interno canˆonico de IRⁿ definido por ⟨x, y⟩ = ∑n

i=1xiyi é uma aplica¸cão bilinear ⟨·,·⟩:IRⁿ×IRⁿ →IR (e também uma forma bilinear).

Exemplo: O produto vetorial em IR³, i.e., a aplica¸c˜ao IR³ ×IR³ ∋ (x, y) 7→ x×y ∈IR³ ´e bilinear.

Em vista dos exemplos acima, observe que uma aplica¸cão bilinear (x, y) 7→ B(x, y) pode ser visualizada como uma “opera¸cão binária que satisfaz a propriedade distributiva”

(na verdade, as propriedades (i) e (iii) s˜ao a propriedade distributiva, (ii) e (iv) dizem um pouco a mais).

Exemplo: Se M_n_×_m(IR) denota o espa¸co vetorial de todas as matrizes reaisn×m ent˜ao a multiplica¸c˜ao de matrizes:

Mn×m(IR)×Mm×p(IR)∋(A, B)7−→AB ∈Mn×p(IR)

´e uma aplica¸c˜ao bilinear.

Exemplo: Se V, V^′ e V^′′ são espa¸cos vetoriais então a aplica¸cão de composi¸cão de trans- forma¸cões lineares:

Lin(V^′, V^′′)×Lin(V, V^′)∋(T, S)7−→T ◦S ∈Lin(V, V^′′)

é bilinear. Se V =IR^p, V^′ =IR^m,V^′′ =IRⁿ então este exemplo é essencialmente o mesmo que o anterior, identificando aplica¸cões lineares e matrizes através das bases canônicas.

N~ao-Exemplo: A aplica¸c˜ao soma de vetores s :IRⁿ×IRⁿ →IRⁿ definida por:

s(x, y) =x+y, x, y ∈IRⁿ,

não é bilinear. Na verdade, s é linear quando identificamos IRⁿ×IRⁿ com IR²ⁿ!

E bastante natural generalizar o conceito de bilinearidade para aplica¸c˜´ oes de mais de duas variáveis: obtemos então as no¸cões de trilinearidade, quadrilinearidade, . . ., ou em geral n-linearidade: todas essas no¸c˜oes são denominadas por multi-linearidade, quando não se quer especificar o número de variáveis na senten¸ca em questão.

Defini¸cão. Sejam V₁, V₂, . . .,V_n,W espa¸cos vetoriais e seja B :V₁×V₂× · · · ×V_n →W uma aplica¸cão. Dizemos que B é multi-linear (ou n-linear) quando B for linear em cada variável; mais explicitamente, B é multi-linear quando dado i = 1, . . . , n e dados vetores vj ∈Vj, j = 1, . . . , i−1, i+ 1, . . . , n então a aplica¸cão

B(v1, . . . , vi−1,·, vi+1, . . . , vn) :Vi −→W

(11)

é linear. Quando W =IR dizemos também que B é uma forma multi-linear.

Exemplo: A aplica¸c˜ao:

det :IR| ⁿ×IRⁿ{z× · · · ×IRⁿ}

nfatores

−→IR

que associa a cadan-upla (v₁, . . . , v_n)∈(IRⁿ)ⁿ o determinante da matrizn×nque possui os vetoresvi em suas colunas (ou linhas, tanto faz aqui) ´e multi-linear; det ´e portanto uma forma n-linear em IRⁿ.

Recorde que uma aplica¸cão linearT :V →W fica univocamente determinada quando especificamos seu valor sobre os vetores de uma base de V: de maneira mais expl´ıcita, se B= (b₁, . . . , b_m) é uma base deV então dados vetoresw₁, . . . , w_m ∈W, existe uma única aplica¸cão linear T : V → W tal que T(bi) = wi, i = 1, . . . , m. Como se calcula T num vetor arbitrário v∈V? Escreva v=∑m

i=1α_ib_i e da´ı:

T(v) =

∑m i=1

αiT(bi) =

∑m i=1

αiwi;

quem trabalhou com os exerc´ıcios de álgebra linear da aula anterior (ou quem já tinha uma forma¸cão básica de álgebra linear) não vai ter problemas com as afirma¸cões acima!

Quando escolhemos também uma base B^′ em W então os vetores T(bi)∈ W podem ser descritos através de suas coordenadas na base B^′ e da´ı obtemos o fato básico que a aplica¸cão linear T pode ser descrita completamente através da matriz [T]BB^′.

Quando trabalhamos com aplica¸cões bilineares e multi-lineares em geral, a situa¸cão não é muito diferente (a diferen¸ca é que a nota¸cão fica mais feia e come¸cam a aparecer um monte de ´ındices). Veja os exerc´ıcios!

Observa¸c~ao: Aplica¸cões multi-lineares não serão muito importantes agora. Voltaremos a esse assunto quando estudarmos formas diferenciais na parte final do curso.

(5) Diferenciando aplica¸c˜oes bilineares e multi-lineares.

Vamos assumir agora que aplica¸c˜oes multi-lineares B : IR^m¹ × · · · ×IR^m^r → IRⁿ s˜ao cont´ınuas (veja os exerc´ıcios).

Teorema. Seja B : IR^m×IRⁿ → IR^p uma aplica¸cão bilinear. Então B é diferenciável e sua diferencial é dada por:

dB(x, y)·(h, k) =B(h, y) +B(x, k), para todos (x, y)∈IR^m×IRⁿ e (h, k)∈IR^m×IRⁿ.

Demonstra¸cão. Observe primeiro que a expressão acima define uma aplica¸cão linear com respeito a (h, k). Pela bilinearidade de B temos:

B(x+h, y+k) =B(x, y) +B(h, y) +B(x, k) +r(h, k), onde r(h, k) =B(h, k). Devemos mostrar que:

lim

(h,k)→0

B(h, k)

∥(h, k)∥ = 0,

(12)

onde ∥(h, k)∥=√

∥h∥²+∥k∥². Temos:

B(h, k)

∥(h, k)∥ =B ( h

∥h∥, k

∥k∥ )

· ∥h∥

∥(h, k)∥ · ∥k∥;

o terceiro fator à direita da igualdade acima tende a zero e o segundo é limitado (menor ou igual a 1). O primeiro também é limitado, pois B é cont´ınua e o conjunto

{(v, w)∈IR^m×IRⁿ :∥v∥=∥w∥= 1}

´e compacto (retomaremos esse assunto na revis˜ao de topologia).

Segue ent˜ao que lim_(h,k)_→₀ _∥^B(h,k)_(h,k)_∥ = lim_(h,k)_→₀ _∥^r(h,k)_(h,k)_∥ = 0.

Observa¸c~ao: Com um pouco de paciência é poss´ıvel demonstrar (seguindo as idéias da demonstra¸cão anterior) que toda aplica¸cão multi-linear B : IR^m¹ × · · · ×IR^m^r → IRⁿ é diferenciável e que sua diferencial é dada por:

dB(x₁, . . . , x_r)·(h₁, . . . , h_r) =

∑r i=1

B(x₁, . . . , x_i₋₁, h_i, x_i+1, . . . , x_r), para todos x_i ∈IR^mⁱ, h_i ∈IR^mⁱ, i= 1, . . . , r.

(13)

Exerc´ıcios.

(não é para entregar, mas é bom dar uma olhada e quem tiver problemas me procura).

´Algebra Linear.

1. Seja V um espa¸co vetorial real. Mostre que todas as transforma¸c˜oes lineares T :IR→V

são da formaT(h) =zh para algum vetor z ∈V (dica: T(h) =T(h·1)). Conclua que Lin(IR, V) é isomorfo a V; mais precisamente, mostre que a aplica¸cão:

Lin(IR, V)∋T 7−→T(1)∈V

´e um isomorfismo.

2. Sejam V, V^′, V^′′ espa¸cos vetoriais e sejam B = (b1, . . . , bn), B^′ = (b^′₁, . . . , b^′_m) e B^′′ = (b^′′₁, . . . , b^′′_p) bases de V, V^′ e V^′′ respectivamente. Mostre que:

(a) SeB:V×V^′ →V^′′é uma aplica¸cão bilinear então para todosv =∑n

i=1αibi ∈V, v^′ =∑m

j=1α^′_jb^′_j ∈V^′ vale a identidade:

B(v, v^′) =

∑n i=1

∑m j=1

αiα^′_jB(bi, b^′_j).

(b) Mostre que uma aplica¸cão bilinear V ×V^′ →V^′′ fica univocamente determinada por seus valores em vetores de uma base de V e de uma base de V^′, i.e., mostre que dados vetores v_ij^′′ ∈ V^′′, i = 1, . . . , n, j = 1, . . . , m então existe uma única aplica¸cão bilinearB :V ×V^′ →V^′′ tal queB(bi, b^′_j) =v_ij^′′ para todosi= 1, . . . , n e j = 1, . . . , m.

(c) SeV =IRⁿ,V^′ =IR^meV^′′ =IR^p, conclua do item (a) que toda aplica¸cão bilinear B:V ×V^′ →V^′′ é cont´ınua (dica: somas e produtos de aplica¸cões cont´ınuas são cont´ınuas).

(d) Dada uma aplica¸cão bilinear B : V ×V^′ → V^′′, denote por B_ij^k a k-´esima coordenada na base B^′′ do vetor B(b_i, b^′_j) ∈ V^′′. Obtemos então uma “matriz tri- dimensional” (B_ij^k)_n×m×p. Conclua do item (b) que existe uma correspondência biun´ıvoca entre aplica¸cões bilinearesB :V ×V^′ →V^′′ e matrizes tri-dimensionais n×m×p de números reais. Dizemos que a matriz tri-dimensional (B_ij^k)_n_×_m_×_p representa a aplica¸cão bilinear B com respeito às bases B, B^′ e B^′′.

Observa¸c~ao: Quando V^′′ =IR, i.e., no caso de formas bilineares B:V ×V^′ →IR então é poss´ıvel omitir o ´ındice k nas matrizes tri-dimensionais do item (d), de modo que formas bilineares B:V ×V^′ →IR são representadas por matrizes comuns (B_ij)_n×m.

(e) Generalize (se você tiver muita paciência com nota¸cão chata, somatórias e ´ındices) os itens anteriores para o caso de aplica¸cões multi-lineares.

Diferencia¸c~ao.

3. Uma transforma¸cão afim A: IR^m →IRⁿ é uma aplica¸cão da forma A(x) =T(x) +v, com T : IR^m → IRⁿ uma aplica¸cão linear e v ∈ IRⁿ um vetor fixado. Mostre que dA(x) =T para todox ∈IR^m. Conclua que se A é uma transla¸cão (i.e., se m =n e T é a identidade) então dA(x) = Id, para todox ∈IR^m.

(14)

Aula n´umero 4 (15/03) Enunciamos agora a regra da cadeia:

Teorema. Sejam f : U ⊂ IR^m → IRⁿ e g : V ⊂ IRⁿ → IR^p aplica¸cões com U ⊂ IR^m, V ⊂ IRⁿ abertos e f(U) ⊂V. Se f é diferenciável num ponto x0 ∈U e g é diferenciável no ponto f(x₀)∈ V então a composta g◦f :U → IR^p é diferenciável no ponto x₀ ∈U e sua diferencial é dada por:

d(g◦f)(x₀) = dg(

f(x₀))

◦df(x₀).

Numa frase: “a composta de aplica¸cões diferenciáveis é diferenciável e a diferencial da composta é a composta das diferenciais”.

A regra da cadeia pode ser pensada de modo intuitivo da seguinte forma: se df(x0)

´e uma boa aproxima¸c˜ao linear para f perto de x₀ e dg(

f(x₀))

é uma boa aproxima¸cão linear para gperto de f(x0) então a composta dg(

f(x0))

◦df(x0) ´e uma boa aproxima¸c˜ao linear para a composta g◦f perto de x₀.

A demonstra¸cão da regra da cadeia, embora seja simples, será deixada para depois da revisão de topologia. O objetivo dessa aula é compreender vários aspectos do enunciado da regra da cadeia.

Observa¸c~ao: Nesse ponto já temos várias ferramentas para mostrar que uma aplica¸cão é diferenciável. A saber:

(i) aplica¸cões constantes, lineares e multi-lineares são diferenciáveis;

(ii) a soma e o produto de aplica¸cões diferenciáveis é diferenciável (no caso do produto, só podemos considerar aplica¸cões a valores reais);

(iii) quando o dom´ınio é unidimensional, diferenciabilidade equivale à derivabilidade do Cálculo I; em particular, aplica¸cões familiares como seno, cosseno, exponencial, etc, etc, etc, são diferenciáveis;

(iv) uma aplica¸cão a valores em IRⁿ é diferenciável se e somente se cada uma de suas n coordenadas é diferenciável;

(v) a composta de aplica¸cões diferenciáveis é diferenciável.

Obtemos em particular que aplica¸cões definidas por fórmulas são diferenciáveis (com exce¸cão das que envolvem ra´ızes de expressões que podem se anular, já que √

· não é derivável na origem).

(1) Interpretando a regra da cadeia em termos de matrizes Jacobianas: a regra da cadeia cl´assica.

Como vimos nos exerc´ıcios da aula número 2, a matriz que representa a composta de duas transforma¸cões lineares é obtida fazendo o produto das matrizes que representam cada transforma¸cão linear envolvida. Em termos de matrizes, a regra da cadeia nos diz então que:

J(g◦f)(x0) = Jg(

f(x0))

Jf(x0);

expandindo o produto de matrizes obtemos:

∂(g◦f)ⁱ

∂xj

(x0) =

∑n k=1

∂gⁱ

∂xk

(f(x0))∂f^k

∂xj

(x0).

(15)

Alternativamente, aplicando os dois lados da igualdade d(g◦f)(x₀) = dg(

f(x₀))

◦df(x₀) no j-´esimo vetor ej da base canˆonica deIR^m obtemos:

∂(g◦f)

∂x_j (x0) = dg(

f(x0))

· ∂f

∂x_j(x0) = dg(

f(x0))

· ( _n

∑

k=1

∂f^k

∂x_j(x0)ek

)

=

∑n k=1

[ dg(

f(x₀))

·e_k ]∂f^k

∂x_j(x₀) =

∑n k=1

∂g

∂x_k

(f(x₀))∂f^k

∂x_j(x₀), ou seja:

∂(g◦f)

∂x_j (x0) =

∑n k=1

∂g

∂x_k

(f(x0))∂f^k

∂x_j(x0).

E muito comum denotar pontos de “ambientes diferentes” por letras diferentes; por´ exemplo, os pontos do dom´ınio de f podem ser denotados com x e os pontos do dom´ınio de g com y (n˜ao por motivos matem´aticos, apenas porque muitas vezes facilita a leitura).

Da´ı, intuitivamente pensa-se que f é “fun¸cão de x” e g é “fun¸cão de y” (embora isso n˜ao queira dizer nada, formalmente) e reescreve-se a regra da cadeia sob a forma:

∂(g◦f)

∂x_j (x0) =

∑n k=1

∂g

∂y_k

(f(x0))∂f^k

∂x_j(x0).

Muitas vezes também os matemáticos resolvem aderir àquela nota¸cão (às vezes, confusa, para dizer a verdade) que é encontrada principalmente em textos de f´ısica, onde não se fala explicitamente em fun¸cões e composi¸cão de fun¸cões, mas apenas em “variáveis dependendo umas das outras” e as composi¸cões são todas subentendidas (essa nota¸cão também tem seus méritos). Pensando então em “variáveis” x∈U ⊂IR^m,y ∈V ⊂IRⁿ ez ∈IR^p, com y dependendo dex (i.e., temos a fun¸cão f), z dependendo dey (i.e., temos a fun¸cãog) e da´ı z também depende de x (i.e., subentende-se a composi¸cão g◦f) ent˜ao a regra da cadeia fica:

∂z

∂xj

=

∑n k=1

∂z

∂yk

∂y_k

∂xj

,

onde também os pontos onde as derivadas são calculadas são omitidos (e devem ser “adi- vinhados” pelo contexto).

(2) A vis˜ao funtorial da regra da cadeia.

Algumas vezes em matemática precisamos descrever igualdades entre composi¸cões de certas fun¸cões que seriam dif´ıceis de serem escritas e de serem visualizadas usando a

“nota¸cão bola” padrão (g◦f). Em vez disso, utiliza-se um recurso gráfico mais eficiente, conhecido como diagrama comutativo. Abaixo temos um exemplo:

(16)

IR^m ^f //

ρ

g

IRⁿ

hOO'' OO OO

IR^k IR^p

F //

~σ

~~

~

>>

~~

IR^m ^α

77o

oo oo o

O diagrama acima codifica as igualdades σ ◦g = f, α ◦ F = h ◦ σ e ρ = h ◦f. A vantagem da formula¸cão da regra da cadeia na forma “a diferencial da composta é a composta das diferenciais” é que podemos diferenciar todas as flechas que aparecem num diagrama comutativo obtendo um novo diagrama comutativo. No nosso exemplo:

IR^m ^df //

dρ

dg

IRⁿ

dhOOO'' OO O

IR^k IR^p

dF //

~dσ

~~

~

>>

~~

IR^m ^dα

77o

oo oo o

no diagrama acima omitimos os pontos onde as diferenciais são calculadas para simplificar a exposi¸cão, mas não é dif´ıcil adivinhar quais são tais pontos: por exemplo, sefé diferenciada no ponto x₀ ∈IR^m então h é diferenciada no ponto f(x₀) (complete o resto!).

Observa¸c~ao: O nome “funtorial” usado nessa se¸cão vem da teoria das categorias: um funtor é essencialmente uma regra que pode ser aplicada em um diagrama comutativo produzindo um novo diagrama comutativo (mas esse assunto não tem nada a ver com o nosso curso).

(3) Compondo fun¸c˜oes e curvas.

Seja γ :I ⊂IR→IR^m uma curva (onde I ⊂IR é um intervalo) e f : U ⊂IR^m →IRⁿ uma fun¸cão definida num aberto U ⊂IR^m contendo a imagem de γ. Suponha que t ∈I é tal que γ é diferenciável emt ef é diferenciável emγ(t) (isso acontece, por exemplo, se γ ef forem diferenciáveis em todo seu dom´ınio). A aplica¸cão compostaf◦γ :I ⊂IR→IRⁿ

é uma curva emIRⁿ que é diferenciável em t pela regra da cadeia; a diferencial de f◦γ no instante t é dada por:

d(f◦γ)(t) = df( γ(t))

◦dγ(t).

Recorde que o vetor tangente a uma curva ´e obtido aplicando sua diferencial ao vetor 1∈IR(vide in´ıcio da aula n´umero 3); aplicando os dois lados da igualdade acima a 1∈IR obtemos:

(f◦γ)^′(t) = df( γ(t))

·γ^′(t).

Exemplo: SeT :IR^m →IRⁿ é uma transforma¸cão linear (por exemplo, imagine o caso que m=n= 3 eT é uma rota¸cão) e se γ :I ⊂IR→IR^mé uma curva diferenciável no instante t então:

(T ◦γ)^′(t) =T( γ^′(t))

.