• Nenhum resultado encontrado

Aproxima¸c˜ ao em espa¸cos de Hilbert

Problema. Mostrar queos polinˆomios de Chebyshev de primeira esp´ecie Tn(x) = cosnarccosx

s˜ao ortogonais em [−1,1] com rela¸c˜ao `a fun¸c˜ao pesoµ(x) = 1 1x2. Mostrar queos polinˆomios de Chebyshev de segunda esp´ecie

Un(x) :=Tn+1 (x)

s˜ao ortogonais em [−1,1] relativamente `a fun¸c˜ao pesoµ(x) =√ 1−x2. Os polinˆomios de Legendre e de Chebyshev de primeira e de segunda esp´ecies s˜ao casos especiais dos polinˆomios de Jacobi {Pn(α,β)}, que s˜ao ortogonais em [−1,1] com rela¸c˜ao `a fun¸c˜ao peso (1−x)α(1+x)β, paraα, β >−1. S˜ao definidos pela f´ormula

Pn(α,β)(x) = (−1)n

2nn!(1−x)α(1 +x)β dn

dxn{(1−x)n+α(1 +x)n+β}.

Esta express˜ao ´e um polinˆomio do segundo grau emt. Consequentemente, seu discriminante ´e n˜ao-positivo, isto ´e,

[(f, g)]2≤(f, f) (g, g).

A desigualdade est´a provada. Se f =αg, obviamente a desigualdade torna-se igualdade. ´E verdade a rec´ıproca, isto ´e, se tivermos igualdade, ent˜ao f e g s˜ao linearmente dependentes. De fato, se fosse o contr´ario, obter´ıamos, por um lado, (f −αg, f−αg)>0 para todoαe, por outro,

(f −αg, f−αg) = (f, f)−2α(f, g) +α2(g, g) =³p

(f, f)−αp (g, g)´2

= 0 paraα=p

(f, f)/p

(g, g). A demonstra¸c˜ao est´a completa.

Desigualdade triangular: Para quaisquer f eg deH temos

(2) p

(f+g, f+g)≤p

(f, f) +p (g, g),

com a igualdade sendo atingida se, e somente se,f eg s˜ao linearmente depen- dentes.

Demonstra¸c˜ao. Aplicando a desigualdade de Cauchy-Schwartz obtemos (f+g, f+g) = (f, f) + 2(f, g) + (g, g)

≤ (f, f) + 2p

(f, f)(g, g) + (g, g)

= np

(f, f) +p (g, g)o2

,

o que implica em (2). A igualdade ´e atingida se, e somente se, [(f, g)]2 = (f, f)(g, g). Mas, como j´a observamos, isto ´e verdade somente quandof egs˜ao linearmente dependentes.

Com a nota¸c˜ao (1), podemos escrever (2) da forma kf+gk ≤ kfk+kgk.

Isto mostra que a rela¸c˜aof → kfk, introduzida por (1), satisfaz `a desigualdade triangular. As demais propriedades da defini¸c˜ao de norma, isto ´e,kfk>0 para f 6= 0 e kλfk = |λ|kfk), s˜ao obviamente satisfeitas. Consequentemente, (1) define uma norma emH.

A norma (1), por outro lado, gera a distˆancia d(f, g) :=kf−gk=p

(f−g, f−g).

Daqui por diante, quando falarmos em espa¸co de Hilbert, vamos supor que ele

´e normado e m´etrico pelo esquema descrito acima.

Sejam ϕ0, ϕ1, . . . , ϕn arbitr´arios, mas elementos fixos deH. Denotemos por Ωn:=

( n X

i=0

aiϕi : (a0, . . . , an)∈ IRn+1 )

.

Consideremos o problema de aproxima¸c˜ao de elementosf de H por elementos de Ωn. Primeiramente, observamos que H ´e um espa¸coestritamente normado.

Isto ´e consequˆencia da desigualdade triangular (2) formulada e demonstrada acima. Consequentemente, pelo teorema geral de aproxima¸c˜ao em espa¸cos line- ares normados:

Para todo f de H, existe um ´unico elemento de Ωn que ´e a melhor apro- xima¸c˜ao para f.

Basta considerar a importante quest˜ao de constru¸c˜ao do elemento da melhor aproxima¸c˜ao. Primeiramente, forneceremos sua caracteriza¸c˜ao.

Dizeremos quef ´eortogonala ge escrevemosf ⊥g, se (f, g) = 0.

Teorema 30 SejamH um espa¸co de Hilbert ef ∈H. O elementopdeΩn ´e o elemento de melhor aproxima¸c˜ao paraf por elementos de Ωn se, e somente se,

(3) (f−p, ϕ) = 0 para todo ϕdeΩn.

Demonsta¸c˜ao. Vamos supor quep´e o elemento de melhor aproxima¸c˜ao, isto

´e,

kf−pk= inf{ kf−ϕk : ϕ∈Ωn }=:εn(f).

Ent˜ao, para qualquerϕ∈Ωn eϕ6= 0, a fun¸c˜ao

r(λ) := kf−p+λϕk2= (f−p+λϕ, f−p+λϕ)

= ε2n(f) + 2λ(f−p, ϕ) +λ2(ϕ, ϕ)

tem ponto de m´ınimo para λ = 0. Isto implica em r(0) = 0. Mas r(0) = 2(f −p, ϕ). Consequentemente, (f−p, ϕ) = 0 para todoϕ∈Ωn.

Reciprocamente, vamos supor quep∈Ωnsatisfaz `as condi¸c˜oes de ortogona- lidade (3). Seja ϕqualquer outro elemento de Ωn. Ent˜ao, δ:=p−ϕ∈Ωn e, portanto,

kf −ϕk2 = kf −p+p−ϕk2= (f−p+δ, f−p+δ)

= kf −pk+ 2(f−p, δ) +kδk2

= kf −pk2+kδk2 (porquef−p⊥δ)

≥ kf −pk2. Aqui, sepsatisfaz (3), ent˜ao

kf−pk ≤ kf −ϕk para todoϕ∈Ωn.

Al´em disso, a igualdade ´e atingida somente paraδ= 0, isto ´e, para ϕ=p. O teorema est´a provado.

Agora, construiremos o elemento de melhor aproxima¸c˜ao de f usando a caracteriza¸c˜ao (3). Procuraremos pda forma

p=a0ϕ0+a1ϕ1+. . .+anϕn.

Desde quef−p⊥ϕi parai= 0,1, . . . , n, ent˜ao os coeficientes {ai} satisfazem

`as condi¸c˜oes :

a00, ϕ0) +a11, ϕ0) +. . .+ann, ϕ0) = (f, ϕ0) (4) a00, ϕ1) +a11, ϕ1) +. . .+ann, ϕ1) = (f, ϕ1) ...

a00, ϕn) +a11, ϕn) +. . .+ann, ϕn) = (f, ϕn)

que ´e um sistema linear de n+ 1 equa¸c˜oes com n+ 1 inc´ognitas. Denotemos porD(ϕ0, . . . , ϕn) o seu determinante,

D(ϕ0, . . . , ϕn) := det

0, ϕ0) (ϕ1, ϕ0) . . . (ϕn, ϕ0) (ϕ0, ϕ1) (ϕ1, ϕ1) . . . (ϕn, ϕ1)

... ... . .. ... (ϕ0, ϕn) (ϕ1, ϕn) . . . (ϕn, ϕn)

 .

Este ´e o determinante de Gram, que ´e diferente de zero pois ϕ0, . . . , ϕn s˜ao linearmente independentes. Consequentemente, o sistema (4) tem uma ´unica solu¸c˜aoa0, . . . , an. Ent˜ao, o c´alculo do elemento de melhor aproxima¸c˜ao em um espa¸co de Hilbert reduz-se `a solu¸c˜ao do sistema (4).

A solu¸c˜ao do sistema (4) pode ser facilitada se a baseϕ0, . . . , ϕn´e ortogonal.

Sabe-se, por exemplo, que em todo espa¸co linear existe uma base ortogonal.

Vamos supor queϕ0, . . . , ϕn seja um sitema ortogonal, isto ´e, (ϕi, ϕj) = 0 para i6=j. Ent˜ao, (4) reduz-se a forma

akk, ϕk) = (f, ϕk), k= 0, . . . , n, de onde obtemos

(5) ak= (f, ϕk)

k, ϕk) , k= 0, . . . , n.

Assim, mostramos a seguinte afirma¸c˜ao.

Teorema 31 Seja ϕ0, . . . , ϕn um sistema ortogonal. Ent˜ao, o elemento p de melhor aproxima¸c˜ao def ∈H por elementos deΩn ´e dado pela f´ormula

p=

n

X

k=0

(f, ϕk) (ϕk, ϕk) ϕk.

Vamos obter uma express˜ao para o erroεn(f) =kf −pk. Temos que ε2n(f) = (f−p, f−p) = (f, f)−(p, f) ( ondef−p⊥p).

Por esta igualdade, representandopda formap=a0ϕ0+. . .+anϕn, obtemos a rela¸c˜ao

a0o, f) +a11, f) +. . .+ann, f) = (f, f)−ε2n(f).

Usando esta rela¸c˜ao junto com o sitema (4) formamos um sistema homogˆenio de n+ 2 equa¸c˜oes lineares com rela¸c˜ao a (a0, a1, . . . , an,1). Desde que este sistema tem solu¸c˜ao n˜ao-nula, seu determinante ´e igual a zero, isto ´e,

det

0, ϕ0) . . . (ϕn, ϕ0) (f, ϕ0) ... . .. ... ... (ϕ0, ϕn) . . . (ϕn, ϕn) (f, ϕn)

0, f) . . . (ϕn, f) (f, f)−ε2n(f)

= 0.

Por esta igualdade, determinamosε2n(f):

(6) ε2n(f) =D(f, ϕ0, . . . , ϕn) D(ϕ0, . . . , ϕn) . Ent˜ao, provamos a igualdade

{minak}n0

°

°

°

°

° f −

n

X

k=0

akϕk

°

°

°

°

°

2

= D(f, ϕ0, . . . , ϕn) D(ϕ0, . . . , ϕn) .

Esta f´ormula vale para qualquer escolha da base ϕ0, . . . , ϕn. Se ϕ0, . . . , ϕn ´e um sistema ortonormal, isto ´e, se (ϕi, ϕj) = 0 para i 6=j e (ϕi, ϕi) = 1 para i= 0, . . . n, obtemos diretamente

ε2n(f) = (f−p, f−p) = (f, f)−(p, f)

= (f, f)−

n

X

k=0

akk, f)

= kfk2n

n

X

k=0

a2k (pois, de acordo com (5),ak = (ϕk, f)).

Desde queε2n(f)>0 paraf 6∈Ωn, isto implica nadesigualdade de Bessel:

à n X

k=0

a2k

!1/2

≤ kfk.

Observa¸c˜ao. Por (6) e sabendo queD(g1) = (g1, g1)>0 para todog16= 0, segue por indu¸c˜ao, que o determinante de Gram, D(g1, . . . , gn), ´e estritamente positivo se os elementosg1, . . . , gn s˜ao linearmente independentes.

Casos Particulares I. Aproxima¸c˜oes em L2.

Seja [a, b] um dado intervalo, finito ou infinito. Sejaµ(x) uma fun¸c˜ao peso in- tegr´avel em [a, b]. Denotamos porL2[a, b] o espa¸co de todas as fun¸c˜oes definidas em [a, b], para as quais

Z b a

µ(x)f2(x)dx <∞.

E claro que´ L2[a, b] ´e um espa¸co linear. Definiremos o produto interno neste espa¸co da seguinte maneira:

(f, g) :=

Z b a

µ(x)f(x)g(x)dx.

N˜ao ´e dif´ıcil mostrar que o produto dado por esta defini¸c˜ao satisfaz a todas as exigˆencias de produto interno. Assim, L2[a, b] torna-se um espa¸co de Hilbert.

A norma

kfk:=nZ b a

µ(x)f2(x)dxo1/2

´e chamadam´edia quadr´atica. Ela gera a distˆanciam´edia quadr´atica ρ(f, g) :=

(Z b a

µ(x) [f(x)−g(x)]2 dx )1/2

.

Sejamϕ0(x), . . . ϕn(x) fun¸c˜oes arbitr´arias e linearmente independentes do espa¸co L2[a, b]. Particularmente,{ϕi}podem ser polinˆomios alg´ebricos 1, x, x2, . . . , xn. Ent˜ao, emL2[a, b] podemos considerar o problema deaproxima¸c˜ao m´edia quadr´atica de uma dada fun¸c˜aof ∈L2[a, b] porpolinˆomios generalizadosa0ϕ0(x)+a1ϕ1(x)+

. . .+anϕn(x).

De acordo com a teoria geral de aproxima¸c˜ao em espa¸cos de Hilbert vale o seguinte teorema:

Teorema 32 Para toda fun¸c˜aof deL2[a, b] existe um ´unico polinˆomio p(x) =

n

X

k=0

akϕk(x), para o qual

Z b a

µ(x) [f(x)−p(x)]2dx= min

{ak}

Z b a

µ(x)

"

f(x)−

n

X

k=0

akϕk(x)

#2

dx.

Al´em disso, seϕ0, . . . , ϕn ´e um sistema ortonormal,

(7) p(x) =

n

X

k=0

"

Z b a

µ(t)f(t)ϕk(t)dt

# ϕk(x).

II. M´etodo dos m´ınimos quadrados.

Na pr´atica, frequentemente precisamos resolver o seguinte problema.

Vamos supor que sabemos, por raz˜oes te´oricas, que a fun¸c˜ao f ´e de uma determinada forma que depende de n parˆametrosa1, . . . , an. Por exemplo, f pode ser da forma

n

X

k=1

akxk1,

n

Y

k=1

senakxou

n

X

k=1

eakx. Podemos calcular os valores de f com uma determinada precis˜ao em um n´umero finito de pontos.

Al´em disso, o c´alculo do valor def em um ponto `as vezes ´e um processo caro.

O objetivo ´e recuperar aproximadamente os parˆametrosa1, . . . , ancom a maior precis˜ao poss´ıvel com base na informa¸c˜ao

f(x1), f(x2), . . . , f(xm) m > n.

Em geral, estes n´umeros s˜ao aproxima¸c˜oes dos valores exatos da fun¸c˜aof. Por exemplo, vamos supor que a rela¸c˜aoy=f(x) que investigamos ´e linear, isto ´e,

f(x) =Ax+B,

x

1

x

i

x

m

l(x)

}di

Figura 7

para algunsA eB. Temos, `a disposi¸c˜ao, os valores def(x) obtidos experimen- talmente: fi=f(xi), i= 1, . . . , m, representados na figura abaixo.

Devido `a falta de precis˜ao no processo de medi¸c˜ao ou `a imperfei¸c˜ao do expe- rimento, os pontos (xi, fi), i= 1, . . . , n, obviamente n˜ao pertencem a uma reta.

Sabemos que a fun¸c˜aof(x) ´e linear. Ent˜ao, qual a reta que representa os dados obtidos experimentalmente? Existem os candidatos para tais representantes.

Por exemplo, podemos escolher quaisquer dois pontos (xi, fi),(xj, fj) da tabela e considerar a reta que passa por eles como aproxima¸c˜ao de f. Esta seria uma escolha aleat´oria.

Vamos tentar abordar o problema de forma mais te´orica e sistem´atica. Pro- curemos uma fun¸c˜ao da forma

l(x) =Ax+B.

Denotaremos pordi a discrepˆancia entre o valorfi no pontoxi obtido experi- mentalmente o valor del no mesmo ponto,

di:=fi−(Axi+B), i= 1, . . . , m.

Existem algumas abordagens de como escolher os parˆametrosAeB del.

1) Escolher AeB de modo que

1maxim|di|

seja o m´ınimo poss´ıvel. Assim, tentar minimizar a maior distˆancia entre f e l nos pontos x1, . . . , xm. Tal crit´erio ´e aceit´avel mas a realiza¸c˜ao na pr´atica ´e

dificil porque o problema ´e n˜ao-linear p que max

i |di|´e uma fun¸c˜ao n˜ao-linear nas vari´aveisAeB.

2) Escolher AeB de modo que

m

X

i=1

|di|

seja o m´ınimo poss´ıvel. As obje¸c˜oes contra o crit´erio 1) valem com a mesma for¸ca neste caso. Estas obje¸c˜oes foram consideradas seriamente no passado quando n˜ao existiam ferramentas para c´alculos r´apidos. Talvez, por isto, foi escolhido um crit´erio que leva a um sistema linear para a obten¸c˜ao dos parˆametros.

3) Escolher AeB de modo que S(A, B) :=

n

X

i=1

d2i. seja o m´ınimo poss´ıvel. Temos

S(A, B) =

m

X

i=1

[fi−(Axi+B)]2,

e as condi¸c˜oes necess´arias para o m´ınimo, que neste caso tamb´em s˜ao suficientes, levam ao sistema

∂S

∂A = 0 ⇒

m

X

i=1

[fi−(Ax+B)]xi= 0,

∂S

∂B = 0 ⇒

m

X

i=1

[fi−(Ax+B)] = 0.

Esta abordagem para determinar as inc´ognitas da fun¸c˜ao pela tabela dos da- dos ´e chamadam´etodo dos m´ınimos quadrados. Vamos represent´a-lo de forma mais geral. Seja {F(x, a1, . . . , an)} uma fam´ılia de fun¸c˜oes , descritas pelos parˆametrosai ∈Ii, i= 1, . . . , n. Sejam f1, . . . , fm os valores de uma fun¸c˜ao desta fam´ılia nos pontosx1, . . . , xm.

Defini¸c˜ao 11 Dizemos queF(x, a1, . . . , an)´e a aproxima¸c˜ao dos dadosf1, . . . , fm

pelo m´etodo dos m´ınimos quadrados sea1, . . . , an minimizam a express˜ao

m

X

i=1

µi[F(xi, a1, . . . , an)−fi]2,

onde{µi}mi s˜ao n´umeros positivos dados a priori, chamados “pesos”.

Consideremos uma situa¸c˜ao particular, a saber, a aproxima¸c˜ao de uma fun¸c˜ao por polinˆomios alg´ebricos de graunnos pontosx1< . . . < xm (m > n).

Ent˜ao, queremos achar a aproxima¸c˜ao

p(x) =a0xn+a1xn1+. . .+an

def pelo m´etodo dos m´ınimos quadrados baseada nos valores fi =f(xi), i= 1, . . . , m. Sejam{µi} alguns pesos dados. Ent˜ao, de acordo com o que foi dito, a0, a1, . . . , an s˜ao determinados de tal maneira que minimizem a express˜ao

Φ(a0, . . . , an) :=

m

X

i=1

µi

"

fi

n

X

k=0

akxki

#2

.

Vˆe-se que Φ2(a0, . . . , an) ´e de fato a distˆancia entref epno espaco de Hilbert H das fun¸c˜oes definidas em x1, . . . , xme equipado com o produto interno

(f, g) :=

m

X

i=1

µif(xi)g(xi).

De fato, este produto interno gera a norma kfk:=nXm

i=1

µif2(xi)o1/2

, que, por outro lado, gera a distˆancia

ρ(f, g) = ( m

X

i=1

µi[f(xi)−g(xi)]2 )12

.

Nestes termos, a fun¸c˜ao Φ(a0, . . . , an) ´e igual `a distˆancia dentro de f ep. Con- sequentemente, o m´etodo dos m´ınimos quadrados leva ao problema de melhor aproxima¸c˜ao por polinˆomios alg´ebricos no espa¸co de HilbertH. A teoria geral implica que a solu¸c˜aoa0, . . . , an´e determinada pelo sistema linear (4) que, neste caso, toma a forma

a0 m

X

i=1

xki +a1 m

X

i=1

xk+1i +· · ·+an m

X

i=1

xk+ni =

m

X

i=1

f(xi)xki, k= 0, . . . , n.

Para evitar a solu¸c˜ao deste sistema, podemos escolher, a priori, uma base apro- priada no espa¸co de polinˆomios alg´ebricos πn. Por exemplo, se procur´assemos um polinˆomiopda forma

p(x) =b0P0(x) +· · ·+bnPn(x),

onde os polinˆomios{Pk(x)}formam um sistema ortogonal no conjunto dos pon- tosx1, . . . xmcom pesos{µi}, o sistema acima reduzir-se-ia ao sistema diagonal

bk n

X

i=1

µiPk2(xi) =

n

X

i=1

µiPk(xi)f(xi), onde os coeficientesbk seriam determinados imediatamente.

Diferencia¸ c˜ ao e Integra¸ c˜ ao Num´ ericas

O c´alculo aproximado da derivada ou da integral definida de uma dada fun¸c˜ao s˜ao temas importantes no c´alculo num´erico. Conheceremos alguns m´eto- dos cl´assicos baseados na id´eia de que uma f´ormula de aproxima¸c˜ao ´e boa quando ela ´e exata para polinˆomios alg´ebricos de maior grau poss´ıvel. As f´ormulas s˜ao obtidas n˜ao da derivada ou da integral da fun¸c˜ao, mas sim da derivada e da integral do correspondente polinˆomio interpolador.

2.1 Diferencia¸ c˜ ao num´ erica

Discutiremos a quest˜ao de diferencia¸c˜ao num´erica, isto ´e, do c´alculo aproxi- mado da derivadaf(x). Notemos que a diferencia¸c˜ao ´e uma opera¸c˜ao inst´avel no sentido de que pequenas altera¸c˜oes da fun¸c˜ao f podem causar grandes al- tera¸c˜oes da sua derivada. Isto exige uma abordagem muito cuidadosa quando diferenciamos numericamente e uma an´alise detalhada em cada caso particular.

Seja f(x) definida em [a, b] e x0, . . . , xn pontos distintos de [a, b]. Vamos supor que f(x) tem derivadas cont´ınuas de ordem suficientemente alta. Pela f´ormula de Newton

(1) f(x) =Ln(f;x) +f[x0, . . . , xn, x]ω(x), onde

ω(x) = (x−x0). . .(x−xn),

eLn(f;x) ´e o polinˆomio interpolador de f com n´os x0, . . . , xn. Provemos que a fun¸c˜aog(x) =f[x0, . . . , xn, x] ´e diferenci´avel no pontox. De fato, de acordo com a defini¸c˜ao de derivada,

g(x) = lim

h0

g(x+h)−g(x) h

= lim

h0

f[x0, . . . , xn, x+h]−f[x0, . . . , xn, x]

x+h−x

= lim

h0f[x0, . . . , xn, x+h, x]

= f[x0, . . . , xn, x, x],

pois, como j´a vimos (Teorema 6.5) a diferen¸ca dividida ´e uma fun¸c˜ao cont´ınua de seus argumentos sef ´e suficientemente suave. Ent˜ao,

d

dxf[x0, . . . , xn, x] =f[x0, . . . , xn, x, x].

Portanto, de (1), obtemos

f(x) =Ln(f;x) +f[x0, . . . , xn, x, x]ω(x) +f[x0, . . . , xn, x]ω(x).

Consequentemente, o erroE(f) da aproxima¸c˜ao f(x)≈Ln(f;x) ´e dado pela express˜ao

E(f) =f[x0, . . . , xn, x, x]ω(x) +f[x0, . . . , xn, x]ω(x).

Usando a rela¸c˜ao

f[y0, . . . , yk] = f(k)(ξ) k! , podemos escreverE(f) como

(2) E(f) = f(n+2)(ξ)

(n+ 2)! ω(x) +f(n+1)(η) (n+ 1)! ω(x),

ondeξeηs˜ao pontos do intervalo(a, b). Geralmente conhecemosf(n+1)ef(n+2) e, sobreξ eη, sabemos somente que eles est˜ao em (a, b). Por isto, na pr´atica, usamos a seguinte estimativa

|E(f)| ≤ Mn+2

(n+ 2)!|ω(x)|+ Mn+1

(n+ 1)!|ω(x)|, ondeMk ´e o limite superior de|f(k)(t)|em [a, b].

Em alguns casos, a express˜ao para o erro (2) pode ser simplificada significati- vamente, por exemplo quando o pontoxcoincide com algum dos n´osx0, . . . , xn, ou quandoω(x) = 0. No primeiro caso parax=xk, temos ω(xk) = 0 e

ω(xk) =

n

Y

i=0,i6=k

(xk−xi).

Ent˜ao, (2) toma a forma

(3) E(f) = f(n+1)(η)

(n+ 1)!

n

Y

i=0,i6=k

(xk−xi),

para algumη∈(a, b).

Analogamente, seω(x) = 0, ent˜ao (2) toma a forma

(4) E(f) =f(n+2)(ξ)

(n+ 2)! ω(x).

Temos ω(x) = 0 quando, por exemplo, os n´os s˜ao sim´etricos com rela¸c˜ao ao pontox, isto ´e, quando

x−xi=xni−x, i= 0, . . . ,n−1 2 . Ent˜ao, (t−xi)(t−xni) = (t−x)2−(x−xi)2 e, portanto,

ω(t) =

(n1)/2

Y

i=0

h(t−x)2−(x−xi)2i . Desde que

d dt

h(t−x)2−(x−xi)2i ¯

¯

¯t=x= 2(t−x)¯

¯

¯t=x= 0,

temos ω(x) = 0. Ent˜ao, se os n´os {xk} satisfazem `a condi¸c˜ao de simetria, a express˜ao para o erro (2) pode ser escrita como

E(f) =f(n+2)(ξ) (n+ 2)!

(n1)/2

Y

i=0

[−(x−xi)2].

Consideraremos agora alguns casos particulares simples.

Sejan= 1. Escolhemos como n´os os pontos x0 =a ex1 =a+h. Vamos achar uma express˜ao para aproximar def(x) emx=a. Temos

f(a)≈L1(f;a),

ondeL1(f;t) =f(a) +f[a, a+h](t−a). Consequentemente, (5) f(a)≈f[a, a+h] = f(a+h)−f(a)

h .

Neste caso, o ponto a´e n´o e, por esta raz˜ao, aplicaremos a f´ormula (3) para achar a estimativa do erro. Obtemos

(6) E(f) = f′′(η)

2 h.

A f´ormula (5) tem interpreta¸c˜ao geom´etrica simples. A derivada f(a), que

´e igual ao coeficiente angular da tangente a f(x) no ponto com abscissa a, ´e substituida pelo coeficiente angular da secante pelos pontos com abscissasa e a+h(veja Figura 8).

d

f

a a + h

Figura 8

Tomemos novamente n= 1 e os n´osx0 ex1 localizados sim´etricamente em rela¸c˜ao ao pontoa, onde aproximamos a derivada. Denotemos porx0=a−h ex1=a+h. Obviamente,

L1(f;t) =f(a−h) +f[a−h, a+h](t−a+h).

Consequentemente,f(a)≈L1(f;a) =f[a−h, a+h]. Assim, obtemos a f´ormula (7) f(a)≈ f(a+h)−f(a−h)

2h .

A interpreta¸c˜ao geom´etrica de (7) ´e representada na Figura 9. O coeficiente angular da tangente a f(x) no ponto a´e aproximado pelo coeficiente angular da secante pelos pontosa−hea+h.

d

f

a a + h

a - h

Figura 9

Determinando o erro E(f) por (4), obtemos

(8) E(f) =nf′′′(ξ)

6 h2.

Observemos que o erro (8) ´e muito menor, parahpequeno, do que o erro (6), enquanto que as correspondentes f´ormulas (5) e (7) s˜ao “igualmente comple- xas”: as duas usam dois valores da fun¸c˜aof(x). Para caracterizar a ordem do erro, como de outras quantidades na an´alise num´erica, usaremos os s´ımbolosO (”o”mai´usculo) eo (”o”min´usculo). Dizemos queϕ(h) ´e O(ψ(h)) para h→0, se existe constante K, tal que ϕ(h)ψ(h) ≤ K quando h→0. Dizemos que ϕ(h) ´e o(ψ(h)) parah→0 se ϕ(h)ψ(h) →0 quandoh→0. Ent˜ao, de acordo com essas de- fini¸c˜oes, a f´ormula (5) tem erro de ordemO(h), enquanto o erro de (7) ´eO(h2).

Mais adiante, vamos perceber que a f´ormula (7) ´e usada frequentemente, especi- almente na an´alise de m´etodos num´ericos para solu¸c˜ao de equa¸c˜oes diferenciais.

Infelizmente, ela pode ser aplicada somente para aproxima¸c˜ao da derivada nos pontos internos, x1, . . . xn1, de uma tabela de valores, f(x0), . . . , f(xn), da fun¸c˜ao f(x). Para os pontos limites, x0 e xn, podemos usar (5). Mas, esta

´

ultima tem erroO(h). O ideal seria uma f´ormula para o c´alculo aproximado de f(x0) ef(xn) com erro da ordemO(h2). Agora, vamos obter tal f´ormula. Para este fim, vamos utilizar mais um n´o para aumentar a precis˜ao da aproxima¸c˜ao.

Sejan= 2. Escolhemos os n´osx0 =a, x1=a+hex2=a+ 2h. Aproxi- memos a derivada def(x) parax=a. Neste caso, temos

L2(f;x) =f(a) +f[a, a+h](x−a) +f[a, a+h, a+ 2h](x−a)(x−a−h).

Daqu´ı obtemos

L2(f;a) = f[a, a+h] +f[a, a+h, a+ 2h](−h)

= f(a)

−h +f(a+h)

h −h

½f(a)

2h2 +f(a+h)

−h2 +f(a+ 2h) 2h2

¾

= −3f(a) + 4f(a+h)−f(a+ 2h)

2h .

Consequentemente,

(9) f(a)≈−3f(a) + 4f(a+h)−f(a+ 2h)

2h .

Desde que o pontoa´e n´o, para achar o limite para o erroE(f), aplicaremos a f´ormula (3). Obtemos

(10) E(f) =f′′′(η)

3 h2. O erro tem ordemO(h2).

Se construirmos uma f´ormula para aproximar f(a) com n´os x0 = a−h, x1 = a e x2 = a+h, da maneira descrita acima, obteremos uma f´ormula idˆentica a (7), isto ´e, o coeficiente de f(a) na aproxima¸c˜ao ser´a igual a zero.

Isto revela a raz˜ao para a melhor precis˜ao de (7) em compara¸c˜ao com (5): a f´ormula (7) ´e constru´ıda com trˆes e n˜ao com dois valores da fun¸c˜ao f(x) em quest˜ao.

O polinˆomio interpolador de Lagrange Ln(f;x) com n´osx0, . . . , xn ´e usado tamb´em para o c´alculo aproximado de derivadas de ordem mais alta. O valor def(k)(x) ´e simplesmente substitu´ıdo pelo valor deL(k)n (f;x). Para determinar o limite do erro precisamos diferenciar a fun¸c˜aof[x0, . . . , xk, x]ω(x)k vezes, e assim obter as express˜oes da forma (2) comk+ 1 termos. N˜ao obteremos essas f´ormulas explicitamente. Finalmente, notemos que a rela¸c˜ao entre a derivada e a diferen¸ca dividida nos permite obter a seguinte f´ormula para a diferencia¸c˜ao num´erica: parax∈[x0, xn],

(11) f(n)(x)≈f[x0, . . . , xn]n!.

Podemos observar que a f´ormula (5) pode ser obtida por (11) para n = 1 e x=x0.

Pelas f´ormulas do erro para a diferencia¸c˜ao num´erica at´e agora obtidas, vˆe- se que o erro diminue quando o passo h diminue. Desta forma, poder´ıamos obter a derivada de f(a) com qualquer precis˜ao se pud´essemos calcular f(x) em pontos x suficientemente perto do ponto a. Acontece que na pr´atica isto

n˜ao ´e verdade. Ou seja, durante o uso pr´atico de qualquer uma das f´ormulas obtidas, quando diminuimos h o erro tamb´em diminue no in´ıcio mas, depois, volta a crescer. A raz˜ao para este efeito ´e que as f´ormulas para diferencia¸c˜ao num´erica s˜ao “inst´aveis”. Expliquemos detalhadamente este fenˆomeno.

Vamos supor que aproximamosf(a) pela f´ormula (7), f(a)≈ f(a+h)−f(a−h)

2h ,

e que o computador que usamos representa os n´umeros com precisao 108. Portanto, ao inv´es dos valores exatos def(a+h) e def(a−h) trabalhamos com os n´umeros

f˜(a+h) = f(a+h) +ε1, f˜(a−h) = f(a−h) +ε2, onde

(12) |εi| ≤108, i= 1,2.

Ent˜ao, para o valor aproximado def(a), obtemos o n´umero f˜(a+h)−f˜(a−h)

2h = f(a+h)−f(a−h)

2h +ε1−ε2

2h . De acordo com (8),

f(a+h)−f(a−h)

2h =f(a) +E, onde

(13) |E| ≤M h2,

para alguma constante M. Consequentemente, a express˜ao f(a+h)˜ 2hf(a˜ h) ´e aproximada porf(a) com erroE+ (ε1−ε2)/2h. Este erro tem ordemϕ(h) = M h2+ 2.102h−8, por(12) e (13). Comoϕ(h) = 2M h−10h−82 , ϕ(h) atinge o seu m´ınimo parah=h0, ondeh0 ´e o zero deϕ(h),

h0= 3 r 1

2.108M = 1 103

3

r 5 M.

Desta forma, ϕ(h) decresce quando hdecresce at´eh0 mas volta a crescer en- quanto o passohcontinua decrescendo. Por isto, a aplica¸c˜ao pr´atica exige, em cada caso particular, a determina¸c˜ao do valor cr´ıticoh0do passo e o uso somente de passoshpara os quais h > h0.

Agora, vamos obter uma f´ormula para aproximarf′′(a) baseada nos valores f(a−h), f(a) e f(a+h), supondo que f tem quarta derivada cont´ınua em [a−h, a+h].

M´etodo 1. Denotemos por L2(f;x) o polinˆomio interpolador de Lagrange da fun¸c˜aof(x) com n´osa−h,a,a+h. De acordo com a a f´ormula de Newton L2(f;x) =f(a−h) +f[a−h, a](x−a+h) +f[a−h, a, a+h](x−a+h)(x−a) e

f(x) =L2(f;x) +f[a−h, a, a+h, x](x−a+h)(x−a)(x−a−h).

Assim podemos obter uma aproxima¸c˜ao para f′′(a) da seguinte maneira:

f′′(a)≈L′′2(f;a) = 2f[a−h, a, a+h]

= f(a−h)−2f(a) +f(a+h)

h2 .

O erro desta aproxima¸c˜ao ser´aE(f), E(f) = f′′(a)−L′′2(f;a)

= {f[a−h, a, a+h, x](x−a+h)(x−a)(x−a−h)}′′|x=a

= 2f[a−h, a, a+h, a, a]ω(a) +f[a−h, a, a+h, a]ω′′(a)

= −fIV(ξ)

12 h2 (porque ω′′(a) = 0).

M´etodo 2. Agora, oferecemos mais um m´etodo conhecido como “m´etodo dos coeficientes indefinidos”. Tal m´etodo permite a constru¸c˜ao de f´ormulas para a aproxima¸c˜ao de funcionais lineares.

Expandindo em s´erie de Taylor no pontoaos valoresf(a−h),f(a) ef(a+h), obtemos

f(a−h) = f(a)−f(a)h+f′′(a)

2! h2−f′′′(a)

3! h3+fIV1) 4! h4 (14) f(a) = f(a)

f(a+h) = f(a) +f(a)h+f′′(a)

2! h2+f′′′(a)

3! h3+fIV2) 4! h4, ondeξ12 s˜ao pontos dos intervalos (a−h, a) e (a, a+h), respectivamente.

O objetivo ´e achar coeficientesα, β eγ, tais que a express˜ao αf(a−h) +βf(a) +γf(a+h)

seja igual a f′′(a) +O(hk), onde o erro O(hk) ´e o menor poss´ıvel, isto ´e, a potˆencia k ´e a maior poss´ıvel. Multiplicando as equa¸c˜oes (14) por α, β e γ, respectivamente, e somando-as, obtemos

αf(a−h) +βf(a) +γf(a+h) = (α+β+γ)f(a) + (−α+γ)f(a)h +(α+γ)f′′(a)

2 h2+ (−α+γ)f′′′(a) 6 h3

αfIV1) +γfIV2)¤h2 24 .

O objetivo ´e obter, do lado direito, o que queremos aproximar. Neste caso particularf′′(a), e depois tentar, com uma escolha especial dos parˆametrosα, β eγ, anular os coeficientes das potˆencias baixas deh, isto ´e, deh0, h1, h2, . . ., at´e onde for poss´ıvel. Isto significa que, neste caso particular, temos que escolher α, β eγ satisfazendo `as condi¸c˜oes

(α+γ)h2

2 = 1

(α+β+γ) = 0

−α+γ = 0.

Tomemos um sistema de trˆes equa¸c˜oes lineares com trˆes inc´ognitas. Resolvendo o sistema obtemos

α=γ= 1

h2, β =− 2 h2.

Imediatamente observamos que, para esta escolha dos parˆametros α, β e γ, o coeficiente deh3´e zero:

(−α+γ)f′′′(a) 6 . Consequentemente,

f′′(a) = 1

h2f(a−h)− 2

h2f(a) + 1

h2f(a+h) +E(f), onde

E(f) =−f(IV)1) +f(IV)2) 2

h2 12 .

Desde que f(IV)(t) ´e uma fun¸c˜ao cont´ınua e o n´umero f(IV)1)+f2 (IV)2) est´a entre o limite inferior e o limite superior de f(IV)(t), existe um ponto ξ ∈ (a−h, a+h), tal que f(IV)1)+f2 (IV)2) =f(IV)(ξ). Consequentemente,

E(f) =−f(IV)(ξ) 12 h2.