Aproxima¸c˜ ao em espa¸cos de Hilbert - 1.1 F´ ormula de interpola¸ c˜ ao de Lagrange

Problema. Mostrar queos polinˆomios de Chebyshev de primeira esp´ecie Tn(x) = cosnarccosx

são ortogonais em [−1,1] com rela¸cão à fun¸cão pesoµ(x) = √ ¹ 1−x². Mostrar queos polinômios de Chebyshev de segunda espécie

Un(x) :=T_n+1^′ (x)

são ortogonais em [−1,1] relativamente à fun¸cão pesoµ(x) =√ 1−x². Os polinômios de Legendre e de Chebyshev de primeira e de segunda espécies são casos especiais dos polinômios de Jacobi {Pn^(α,β)}, que são ortogonais em [−1,1] com rela¸cão à fun¸cão peso (1−x)^α(1+x)^β, paraα, β >−1. São definidos pela fórmula

P_n^(α,β)(x) = (−1)ⁿ

2ⁿn!(1−x)⁻^α(1 +x)⁻^β dⁿ

dxⁿ{(1−x)^n+α(1 +x)^n+β}.

Esta expressão é um polinômio do segundo grau emt. Consequentemente, seu discriminante é não-positivo, isto é,

[(f, g)]²≤(f, f) (g, g).

A desigualdade está provada. Se f =αg, obviamente a desigualdade torna-se igualdade. É verdade a rec´ıproca, isto é, se tivermos igualdade, então f e g são linearmente dependentes. De fato, se fosse o contrário, obter´ıamos, por um lado, (f −αg, f−αg)>0 para todoαe, por outro,

(f −αg, f−αg) = (f, f)−2α(f, g) +α²(g, g) =³p

(f, f)−αp (g, g)´2

= 0 paraα=p

(f, f)/p

(g, g). A demonstra¸c˜ao est´a completa.

Desigualdade triangular: Para quaisquer f eg deH temos

(2) p

(f+g, f+g)≤p

(f, f) +p (g, g),

com a igualdade sendo atingida se, e somente se,f eg s˜ao linearmente dependentes.

Demonstra¸c˜ao. Aplicando a desigualdade de Cauchy-Schwartz obtemos (f+g, f+g) = (f, f) + 2(f, g) + (g, g)

≤ (f, f) + 2p

(f, f)(g, g) + (g, g)

= np

(f, f) +p (g, g)o2

o que implica em (2). A igualdade é atingida se, e somente se, [(f, g)]² = (f, f)(g, g). Mas, como já observamos, isto é verdade somente quandof egsão linearmente dependentes.

Com a nota¸c˜ao (1), podemos escrever (2) da forma kf+gk ≤ kfk+kgk.

Isto mostra que a rela¸cãof → kfk, introduzida por (1), satisfaz à desigualdade triangular. As demais propriedades da defini¸cão de norma, isto é,kfk>0 para f 6= 0 e kλfk = |λ|kfk), são obviamente satisfeitas. Consequentemente, (1) define uma norma emH.

A norma (1), por outro lado, gera a distˆancia d(f, g) :=kf−gk=p

(f−g, f−g).

Daqui por diante, quando falarmos em espa¸co de Hilbert, vamos supor que ele

´e normado e m´etrico pelo esquema descrito acima.

Sejam ϕ0, ϕ1, . . . , ϕn arbitr´arios, mas elementos fixos deH. Denotemos por Ωn:=

( _n X

i=0

aiϕi : (a0, . . . , an)∈ IRⁿ⁺¹ )

Consideremos o problema de aproxima¸c˜ao de elementosf de H por elementos de Ωn. Primeiramente, observamos que H ´e um espa¸coestritamente normado.

Isto é consequência da desigualdade triangular (2) formulada e demonstrada acima. Consequentemente, pelo teorema geral de aproxima¸cão em espa¸cos lineares normados:

Para todo f de H, existe um único elemento de Ωn que é a melhor aproxima¸cão para f.

Basta considerar a importante questão de constru¸cão do elemento da melhor aproxima¸cão. Primeiramente, forneceremos sua caracteriza¸cão.

Dizeremos quef ´eortogonala ge escrevemosf ⊥g, se (f, g) = 0.

Teorema 30 SejamH um espa¸co de Hilbert ef ∈H. O elementopdeΩn ´e o elemento de melhor aproxima¸c˜ao paraf por elementos de Ωn se, e somente se,

(3) (f−p, ϕ) = 0 para todo ϕdeΩn.

Demonsta¸cão. Vamos supor quepé o elemento de melhor aproxima¸cão, isto

´e,

kf−pk= inf{ kf−ϕk : ϕ∈Ωn }=:εn(f).

Ent˜ao, para qualquerϕ∈Ωn eϕ6= 0, a fun¸c˜ao

r(λ) := kf−p+λϕk²= (f−p+λϕ, f−p+λϕ)

= ε²_n(f) + 2λ(f−p, ϕ) +λ²(ϕ, ϕ)

tem ponto de m´ınimo para λ = 0. Isto implica em r^′(0) = 0. Mas r^′(0) = 2(f −p, ϕ). Consequentemente, (f−p, ϕ) = 0 para todoϕ∈Ωn.

Reciprocamente, vamos supor quep∈Ωnsatisfaz às condi¸cões de ortogona- lidade (3). Seja ϕqualquer outro elemento de Ωn. Então, δ:=p−ϕ∈Ωn e, portanto,

kf −ϕk² = kf −p+p−ϕk²= (f−p+δ, f−p+δ)

= kf −pk+ 2(f−p, δ) +kδk²

= kf −pk²+kδk² (porquef−p⊥δ)

≥ kf −pk². Aqui, sepsatisfaz (3), ent˜ao

kf−pk ≤ kf −ϕk para todoϕ∈Ωn.

Além disso, a igualdade é atingida somente paraδ= 0, isto é, para ϕ=p. O teorema está provado.

Agora, construiremos o elemento de melhor aproxima¸c˜ao de f usando a caracteriza¸c˜ao (3). Procuraremos pda forma

p=a0ϕ0+a1ϕ1+. . .+anϕn.

Desde quef−p⊥ϕi parai= 0,1, . . . , n, ent˜ao os coeficientes {ai} satisfazem

`as condi¸c˜oes :

a0(ϕ0, ϕ0) +a1(ϕ1, ϕ0) +. . .+an(ϕn, ϕ0) = (f, ϕ0) (4) a0(ϕ0, ϕ1) +a1(ϕ1, ϕ1) +. . .+an(ϕn, ϕ1) = (f, ϕ1) ...

a0(ϕ0, ϕn) +a1(ϕ1, ϕn) +. . .+an(ϕn, ϕn) = (f, ϕn)

que é um sistema linear de n+ 1 equa¸cões com n+ 1 incógnitas. Denotemos porD(ϕ0, . . . , ϕn) o seu determinante,

D(ϕ0, . . . , ϕn) := det







(ϕ0, ϕ0) (ϕ1, ϕ0) . . . (ϕn, ϕ0) (ϕ0, ϕ1) (ϕ1, ϕ1) . . . (ϕn, ϕ1)

... ... . .. ... (ϕ0, ϕn) (ϕ1, ϕn) . . . (ϕn, ϕn)





 .

Este é o determinante de Gram, que é diferente de zero pois ϕ0, . . . , ϕn são linearmente independentes. Consequentemente, o sistema (4) tem uma única solu¸cãoa0, . . . , an. Então, o cálculo do elemento de melhor aproxima¸cão em um espa¸co de Hilbert reduz-se à solu¸cão do sistema (4).

A solu¸c˜ao do sistema (4) pode ser facilitada se a baseϕ0, . . . , ϕn´e ortogonal.

Sabe-se, por exemplo, que em todo espa¸co linear existe uma base ortogonal.

Vamos supor queϕ0, . . . , ϕn seja um sitema ortogonal, isto ´e, (ϕi, ϕj) = 0 para i6=j. Ent˜ao, (4) reduz-se a forma

ak(ϕk, ϕk) = (f, ϕk), k= 0, . . . , n, de onde obtemos

(5) ak= (f, ϕk)

(ϕk, ϕk) , k= 0, . . . , n.

Assim, mostramos a seguinte afirma¸c˜ao.

Teorema 31 Seja ϕ0, . . . , ϕn um sistema ortogonal. Então, o elemento p de melhor aproxima¸cão def ∈H por elementos deΩn é dado pela fórmula

k=0

(f, ϕk) (ϕk, ϕk) ϕk.

Vamos obter uma express˜ao para o erroεn(f) =kf −pk. Temos que ε²_n(f) = (f−p, f−p) = (f, f)−(p, f) ( ondef−p⊥p).

Por esta igualdade, representandopda formap=a0ϕ0+. . .+anϕn, obtemos a rela¸c˜ao

a0(ϕo, f) +a1(ϕ1, f) +. . .+an(ϕn, f) = (f, f)−ε²_n(f).

Usando esta rela¸cão junto com o sitema (4) formamos um sistema homogênio de n+ 2 equa¸cões lineares com rela¸cão a (a0, a1, . . . , an,1). Desde que este sistema tem solu¸cão não-nula, seu determinante é igual a zero, isto é,

det







(ϕ0, ϕ0) . . . (ϕn, ϕ0) (f, ϕ0) ... . .. ... ... (ϕ0, ϕn) . . . (ϕn, ϕn) (f, ϕn)

(ϕ0, f) . . . (ϕn, f) (f, f)−ε²_n(f)







= 0.

Por esta igualdade, determinamosε²_n(f):

(6) ε²_n(f) =D(f, ϕ0, . . . , ϕn) D(ϕ0, . . . , ϕn) . Ent˜ao, provamos a igualdade

{mina_k}ⁿ0

° f −

k=0

akϕk

= D(f, ϕ0, . . . , ϕn) D(ϕ0, . . . , ϕn) .

Esta fórmula vale para qualquer escolha da base ϕ0, . . . , ϕn. Se ϕ0, . . . , ϕn é um sistema ortonormal, isto é, se (ϕi, ϕj) = 0 para i 6=j e (ϕi, ϕi) = 1 para i= 0, . . . n, obtemos diretamente

ε²_n(f) = (f−p, f−p) = (f, f)−(p, f)

= (f, f)−

k=0

ak(ϕk, f)

= kfk²n

k=0

a²_k (pois, de acordo com (5),ak = (ϕk, f)).

Desde queε²_n(f)>0 paraf 6∈Ωn, isto implica nadesigualdade de Bessel:

Ã _n X

k=0

a²_k

!1/2

≤ kfk.

Observa¸cão. Por (6) e sabendo queD(g1) = (g1, g1)>0 para todog16= 0, segue por indu¸cão, que o determinante de Gram, D(g1, . . . , gn), é estritamente positivo se os elementosg1, . . . , gn são linearmente independentes.

Casos Particulares I. Aproxima¸c˜oes em L2.

Seja [a, b] um dado intervalo, finito ou infinito. Sejaµ(x) uma fun¸cão peso in- tegrável em [a, b]. Denotamos porL2[a, b] o espa¸co de todas as fun¸cões definidas em [a, b], para as quais

Z b a

µ(x)f²(x)dx <∞.

E claro que´ L2[a, b] ´e um espa¸co linear. Definiremos o produto interno neste espa¸co da seguinte maneira:

(f, g) :=

Z b a

µ(x)f(x)g(x)dx.

Não é dif´ıcil mostrar que o produto dado por esta defini¸cão satisfaz a todas as exigências de produto interno. Assim, L2[a, b] torna-se um espa¸co de Hilbert.

A norma

kfk:=nZ b a

µ(x)f²(x)dxo1/2

é chamadamédia quadrática. Ela gera a distânciamédia quadrática ρ(f, g) :=

(Z b a

µ(x) [f(x)−g(x)]² dx )1/2

Sejamϕ0(x), . . . ϕn(x) fun¸cões arbitrárias e linearmente independentes do espa¸co L2[a, b]. Particularmente,{ϕi}podem ser polinômios algébricos 1, x, x², . . . , xⁿ. Então, emL2[a, b] podemos considerar o problema deaproxima¸cão média quadrática de uma dada fun¸cãof ∈L2[a, b] porpolinômios generalizadosa0ϕ0(x)+a1ϕ1(x)+

. . .+anϕn(x).

De acordo com a teoria geral de aproxima¸c˜ao em espa¸cos de Hilbert vale o seguinte teorema:

Teorema 32 Para toda fun¸cãof deL2[a, b] existe um único polinômio p(x) =

k=0

a^∗_kϕk(x), para o qual

Z b a

µ(x) [f(x)−p(x)]²dx= min

{ak}

Z b a

µ(x)

f(x)−

k=0

akϕk(x)

dx.

Al´em disso, seϕ0, . . . , ϕn ´e um sistema ortonormal,

(7) p(x) =

k=0

Z b a

µ(t)f(t)ϕk(t)dt

# ϕk(x).

II. M´etodo dos m´ınimos quadrados.

Na pr´atica, frequentemente precisamos resolver o seguinte problema.

Vamos supor que sabemos, por razões teóricas, que a fun¸cão f é de uma determinada forma que depende de n parâmetrosa1, . . . , an. Por exemplo, f pode ser da forma

k=1

akx^k⁻¹,

k=1

senakxou

k=1

eâ^k^x. Podemos calcular os valores de f com uma determinada precisão em um número finito de pontos.

Além disso, o cálculo do valor def em um ponto às vezes é um processo caro.

O objetivo é recuperar aproximadamente os parâmetrosa1, . . . , ancom a maior precisão poss´ıvel com base na informa¸cão

f(x1), f(x2), . . . , f(xm) m > n.

Em geral, estes números são aproxima¸cões dos valores exatos da fun¸cãof. Por exemplo, vamos supor que a rela¸cãoy=f(x) que investigamos é linear, isto é,

f(x) =Ax+B,

x

₁

x

l(x)

}di

Figura 7

para algunsA eB. Temos, `a disposi¸c˜ao, os valores def(x) obtidos experimentalmente: fi=f(xi), i= 1, . . . , m, representados na figura abaixo.

Devido à falta de precisão no processo de medi¸cão ou à imperfei¸cão do expe- rimento, os pontos (xi, fi), i= 1, . . . , n, obviamente não pertencem a uma reta.

Sabemos que a fun¸cãof(x) é linear. Então, qual a reta que representa os dados obtidos experimentalmente? Existem os candidatos para tais representantes.

Por exemplo, podemos escolher quaisquer dois pontos (xi, fi),(xj, fj) da tabela e considerar a reta que passa por eles como aproxima¸c˜ao de f. Esta seria uma escolha aleat´oria.

Vamos tentar abordar o problema de forma mais teórica e sistemática. Pro- curemos uma fun¸cão da forma

l(x) =Ax+B.

Denotaremos pordi a discrepˆancia entre o valorfi no pontoxi obtido experimentalmente o valor del no mesmo ponto,

di:=fi−(Axi+B), i= 1, . . . , m.

Existem algumas abordagens de como escolher os parˆametrosAeB del.

1) Escolher AeB de modo que

1max≤i≤m|di|

seja o m´ınimo poss´ıvel. Assim, tentar minimizar a maior distância entre f e l nos pontos x1, . . . , xm. Tal critério é aceitável mas a realiza¸cão na prática é

dificil porque o problema ´e n˜ao-linear p que max

i |di|é uma fun¸cão não-linear nas variáveisAeB.

2) Escolher AeB de modo que

i=1

|di|

seja o m´ınimo poss´ıvel. As obje¸cões contra o critério 1) valem com a mesma for¸ca neste caso. Estas obje¸cões foram consideradas seriamente no passado quando não existiam ferramentas para cálculos rápidos. Talvez, por isto, foi escolhido um critério que leva a um sistema linear para a obten¸cão dos parâmetros.

3) Escolher AeB de modo que S(A, B) :=

i=1

d²_i. seja o m´ınimo poss´ıvel. Temos

S(A, B) =

i=1

[fi−(Axi+B)]²,

e as condi¸cões necessárias para o m´ınimo, que neste caso também são suficientes, levam ao sistema

∂S

∂A = 0 ⇒

i=1

[fi−(Ax+B)]xi= 0,

∂S

∂B = 0 ⇒

i=1

[fi−(Ax+B)] = 0.

Esta abordagem para determinar as incógnitas da fun¸cão pela tabela dos dados é chamadamétodo dos m´ınimos quadrados. Vamos representá-lo de forma mais geral. Seja {F(x, a1, . . . , an)} uma fam´ılia de fun¸cões , descritas pelos parâmetrosai ∈Ii, i= 1, . . . , n. Sejam f1, . . . , fm os valores de uma fun¸cão desta fam´ılia nos pontosx1, . . . , xm.

Defini¸cão 11 Dizemos queF(x, a1, . . . , an)é a aproxima¸cão dos dadosf1, . . . , fm

pelo m´etodo dos m´ınimos quadrados sea1, . . . , an minimizam a express˜ao

i=1

µi[F(xi, a1, . . . , an)−fi]²,

onde{µi}^mi s˜ao n´umeros positivos dados a priori, chamados “pesos”.

Consideremos uma situa¸cão particular, a saber, a aproxima¸cão de uma fun¸cão por polinômios algébricos de graunnos pontosx1< . . . < xm (m > n).

Ent˜ao, queremos achar a aproxima¸c˜ao

p(x) =a0xⁿ+a1xⁿ⁻¹+. . .+an

def pelo método dos m´ınimos quadrados baseada nos valores fi =f(xi), i= 1, . . . , m. Sejam{µi} alguns pesos dados. Então, de acordo com o que foi dito, a0, a1, . . . , an são determinados de tal maneira que minimizem a expressão

Φ(a0, . . . , an) :=

i=1

µi

fi−

k=0

akx^k_i

Vê-se que Φ²(a0, . . . , an) é de fato a distância entref epno espaco de Hilbert H_△ das fun¸cões definidas em x1, . . . , xme equipado com o produto interno

(f, g) :=

i=1

µif(xi)g(xi).

De fato, este produto interno gera a norma kfk:=nX^m

i=1

µif²(xi)o1/2

, que, por outro lado, gera a distˆancia

ρ(f, g) = ( _m

i=1

µi[f(xi)−g(xi)]² )¹2

Nestes termos, a fun¸cão Φ(a0, . . . , an) é igual à distância dentro de f ep. Con- sequentemente, o método dos m´ınimos quadrados leva ao problema de melhor aproxima¸cão por polinômios algébricos no espa¸co de HilbertH_△. A teoria geral implica que a solu¸cãoa0, . . . , ané determinada pelo sistema linear (4) que, neste caso, toma a forma

a0 m

i=1

x^k_i +a1 m

i=1

x^k+1_i +· · ·+an m

i=1

x^k+n_i =

i=1

f(xi)x^k_i, k= 0, . . . , n.

Para evitar a solu¸cão deste sistema, podemos escolher, a priori, uma base apro- priada no espa¸co de polinômios algébricos πn. Por exemplo, se procurássemos um polinômiopda forma

p(x) =b0P0(x) +· · ·+bnPn(x),

onde os polinˆomios{Pk(x)}formam um sistema ortogonal no conjunto dos pon- tosx1, . . . xmcom pesos{µi}, o sistema acima reduzir-se-ia ao sistema diagonal

bk n

i=1

µiP_k²(xi) =

i=1

µiPk(xi)f(xi), onde os coeficientesbk seriam determinados imediatamente.

Diferencia¸ c˜ ao e Integra¸ c˜ ao Num´ ericas

O cálculo aproximado da derivada ou da integral definida de uma dada fun¸cão são temas importantes no cálculo numérico. Conheceremos alguns méto- dos clássicos baseados na idéia de que uma fórmula de aproxima¸cão é boa quando ela é exata para polinômios algébricos de maior grau poss´ıvel. As fórmulas são obtidas não da derivada ou da integral da fun¸cão, mas sim da derivada e da integral do correspondente polinômio interpolador.

2.1 Diferencia¸ c˜ ao num´ erica

Discutiremos a questão de diferencia¸cão numérica, isto é, do cálculo aproximado da derivadaf^′(x). Notemos que a diferencia¸cão é uma opera¸cão instável no sentido de que pequenas altera¸cões da fun¸cão f podem causar grandes altera¸cões da sua derivada. Isto exige uma abordagem muito cuidadosa quando diferenciamos numericamente e uma análise detalhada em cada caso particular.

Seja f(x) definida em [a, b] e x0, . . . , xn pontos distintos de [a, b]. Vamos supor que f(x) tem derivadas cont´ınuas de ordem suficientemente alta. Pela f´ormula de Newton

(1) f(x) =Ln(f;x) +f[x0, . . . , xn, x]ω(x), onde

ω(x) = (x−x0). . .(x−xn),

eLn(f;x) é o polinômio interpolador de f com nós x0, . . . , xn. Provemos que a fun¸cãog(x) =f[x0, . . . , xn, x] é diferenciável no pontox. De fato, de acordo com a defini¸cão de derivada,

g^′(x) = lim

h→0

g(x+h)−g(x) h

= lim

h→0

f[x0, . . . , xn, x+h]−f[x0, . . . , xn, x]

x+h−x

= lim

h→0f[x0, . . . , xn, x+h, x]

= f[x0, . . . , xn, x, x],

pois, como já vimos (Teorema 6.5) a diferen¸ca dividida é uma fun¸cão cont´ınua de seus argumentos sef é suficientemente suave. Então,

dxf[x0, . . . , xn, x] =f[x0, . . . , xn, x, x].

Portanto, de (1), obtemos

f^′(x) =L^′_n(f;x) +f[x0, . . . , xn, x, x]ω(x) +f[x0, . . . , xn, x]ω^′(x).

Consequentemente, o erroE(f) da aproxima¸cão f^′(x)≈L^′_n(f;x) é dado pela expressão

E(f) =f[x0, . . . , xn, x, x]ω(x) +f[x0, . . . , xn, x]ω^′(x).

Usando a rela¸c˜ao

f[y0, . . . , yk] = f^(k)(ξ) k! , podemos escreverE(f) como

(2) E(f) = f⁽ⁿ⁺²⁾(ξ)

(n+ 2)! ω(x) +f⁽ⁿ⁺¹⁾(η) (n+ 1)! ω^′(x),

ondeξeηsão pontos do intervalo(a, b). Geralmente conhecemosf⁽ⁿ⁺¹⁾ef⁽ⁿ⁺²⁾ e, sobreξ eη, sabemos somente que eles estão em (a, b). Por isto, na prática, usamos a seguinte estimativa

|E(f)| ≤ Mn+2

(n+ 2)!|ω(x)|+ Mn+1

(n+ 1)!|ω^′(x)|, ondeMk ´e o limite superior de|f^(k)(t)|em [a, b].

Em alguns casos, a express˜ao para o erro (2) pode ser simplificada significati- vamente, por exemplo quando o pontoxcoincide com algum dos n´osx0, . . . , xn, ou quandoω^′(x) = 0. No primeiro caso parax=xk, temos ω(xk) = 0 e

ω^′(xk) =

i=0,i6=k

(xk−xi).

Ent˜ao, (2) toma a forma

(3) E(f) = f⁽ⁿ⁺¹⁾(η)

(n+ 1)!

i=0,i6=k

(xk−xi),

para algumη∈(a, b).

Analogamente, seω^′(x) = 0, ent˜ao (2) toma a forma

(4) E(f) =f⁽ⁿ⁺²⁾(ξ)

(n+ 2)! ω(x).

Temos ω^′(x) = 0 quando, por exemplo, os nós são simétricos com rela¸cão ao pontox, isto é, quando

x−xi=xn−i−x, i= 0, . . . ,n−1 2 . Ent˜ao, (t−xi)(t−xn−i) = (t−x)²−(x−xi)² e, portanto,

ω(t) =

(n−1)/2

i=0

h(t−x)²−(x−xi)²i . Desde que

d dt

h(t−x)²−(x−xi)²i ¯

¯t=x= 2(t−x)¯

¯t=x= 0,

temos ω^′(x) = 0. Então, se os nós {xk} satisfazem à condi¸cão de simetria, a expressão para o erro (2) pode ser escrita como

E(f) =f⁽ⁿ⁺²⁾(ξ) (n+ 2)!

(n−1)/2

i=0

[−(x−xi)²].

Consideraremos agora alguns casos particulares simples.

Sejan= 1. Escolhemos como n´os os pontos x0 =a ex1 =a+h. Vamos achar uma express˜ao para aproximar def^′(x) emx=a. Temos

f^′(a)≈L^′₁(f;a),

ondeL1(f;t) =f(a) +f[a, a+h](t−a). Consequentemente, (5) f^′(a)≈f[a, a+h] = f(a+h)−f(a)

h .

Neste caso, o ponto aé nó e, por esta razão, aplicaremos a fórmula (3) para achar a estimativa do erro. Obtemos

(6) E(f) = f^′′(η)

2 h.

A fórmula (5) tem interpreta¸cão geométrica simples. A derivada f^′(a), que

´e igual ao coeficiente angular da tangente a f(x) no ponto com abscissa a, ´e substituida pelo coeficiente angular da secante pelos pontos com abscissasa e a+h(veja Figura 8).

a a + h

Figura 8

Tomemos novamente n= 1 e os nósx0 ex1 localizados simétricamente em rela¸cão ao pontoa, onde aproximamos a derivada. Denotemos porx0=a−h ex1=a+h. Obviamente,

L1(f;t) =f(a−h) +f[a−h, a+h](t−a+h).

Consequentemente,f^′(a)≈L^′₁(f;a) =f[a−h, a+h]. Assim, obtemos a f´ormula (7) f^′(a)≈ f(a+h)−f(a−h)

2h .

A interpreta¸cão geométrica de (7) é representada na Figura 9. O coeficiente angular da tangente a f(x) no ponto aé aproximado pelo coeficiente angular da secante pelos pontosa−hea+h.

a a + h

a - h

Figura 9

Determinando o erro E(f) por (4), obtemos

(8) E(f) =nf^′′′(ξ)

6 h².

Observemos que o erro (8) é muito menor, parahpequeno, do que o erro (6), enquanto que as correspondentes fórmulas (5) e (7) são “igualmente comple- xas”: as duas usam dois valores da fun¸cãof(x). Para caracterizar a ordem do erro, como de outras quantidades na análise numérica, usaremos os s´ımbolosO (”o”maiúsculo) eo (”o”minúsculo). Dizemos queϕ(h) é O(ψ(h)) para h→0, se existe constante K, tal que ^ϕ(h)_ψ(h) ≤ K quando h→0. Dizemos que ϕ(h) é o(ψ(h)) parah→0 se ^ϕ(h)_ψ(h) →0 quandoh→0. Então, de acordo com essas defini¸cões, a fórmula (5) tem erro de ordemO(h), enquanto o erro de (7) éO(h²).

Mais adiante, vamos perceber que a fórmula (7) é usada frequentemente, especi- almente na análise de métodos numéricos para solu¸cão de equa¸cões diferenciais.

Infelizmente, ela pode ser aplicada somente para aproxima¸c˜ao da derivada nos pontos internos, x1, . . . xn−1, de uma tabela de valores, f(x0), . . . , f(xn), da fun¸c˜ao f(x). Para os pontos limites, x0 e xn, podemos usar (5). Mas, esta

ultima tem erroO(h). O ideal seria uma fórmula para o cálculo aproximado de f^′(x0) ef^′(xn) com erro da ordemO(h²). Agora, vamos obter tal fórmula. Para este fim, vamos utilizar mais um nó para aumentar a precisão da aproxima¸cão.

Sejan= 2. Escolhemos os n´osx0 =a, x1=a+hex2=a+ 2h. Aproxi- memos a derivada def(x) parax=a. Neste caso, temos

L2(f;x) =f(a) +f[a, a+h](x−a) +f[a, a+h, a+ 2h](x−a)(x−a−h).

Daqu´ı obtemos

L^′₂(f;a) = f[a, a+h] +f[a, a+h, a+ 2h](−h)

= f(a)

−h +f(a+h)

h −h

½f(a)

2h² +f(a+h)

−h² +f(a+ 2h) 2h²

= −3f(a) + 4f(a+h)−f(a+ 2h)

2h .

Consequentemente,

(9) f^′(a)≈−3f(a) + 4f(a+h)−f(a+ 2h)

2h .

Desde que o pontoaé nó, para achar o limite para o erroE(f), aplicaremos a fórmula (3). Obtemos

(10) E(f) =f^′′′(η)

3 h². O erro tem ordemO(h²).

Se construirmos uma fórmula para aproximar f^′(a) com nós x0 = a−h, x1 = a e x2 = a+h, da maneira descrita acima, obteremos uma fórmula idêntica a (7), isto é, o coeficiente de f(a) na aproxima¸cão será igual a zero.

Isto revela a razão para a melhor precisão de (7) em compara¸cão com (5): a fórmula (7) é constru´ıda com três e não com dois valores da fun¸cão f(x) em questão.

O polinômio interpolador de Lagrange Ln(f;x) com nósx0, . . . , xn é usado também para o cálculo aproximado de derivadas de ordem mais alta. O valor def^(k)(x) é simplesmente substitu´ıdo pelo valor deL^(k)n (f;x). Para determinar o limite do erro precisamos diferenciar a fun¸cãof[x0, . . . , xk, x]ω(x)k vezes, e assim obter as expressões da forma (2) comk+ 1 termos. Não obteremos essas fórmulas explicitamente. Finalmente, notemos que a rela¸cão entre a derivada e a diferen¸ca dividida nos permite obter a seguinte fórmula para a diferencia¸cão numérica: parax∈[x0, xn],

(11) f⁽ⁿ⁾(x)≈f[x0, . . . , xn]n!.

Podemos observar que a f´ormula (5) pode ser obtida por (11) para n = 1 e x=x0.

Pelas fórmulas do erro para a diferencia¸cão numérica até agora obtidas, vê- se que o erro diminue quando o passo h diminue. Desta forma, poder´ıamos obter a derivada de f^′(a) com qualquer precisão se pudéssemos calcular f(x) em pontos x suficientemente perto do ponto a. Acontece que na prática isto

não é verdade. Ou seja, durante o uso prático de qualquer uma das fórmulas obtidas, quando diminuimos h o erro também diminue no in´ıcio mas, depois, volta a crescer. A razão para este efeito é que as fórmulas para diferencia¸cão numérica são “instáveis”. Expliquemos detalhadamente este fenômeno.

Vamos supor que aproximamosf^′(a) pela f´ormula (7), f^′(a)≈ f(a+h)−f(a−h)

2h ,

e que o computador que usamos representa os números com precisao 10⁻⁸. Portanto, ao invés dos valores exatos def(a+h) e def(a−h) trabalhamos com os números

f˜(a+h) = f(a+h) +ε1, f˜(a−h) = f(a−h) +ε2, onde

(12) |εi| ≤10⁻⁸, i= 1,2.

Ent˜ao, para o valor aproximado def^′(a), obtemos o n´umero f˜(a+h)−f˜(a−h)

2h = f(a+h)−f(a−h)

2h +ε1−ε2

2h . De acordo com (8),

f(a+h)−f(a−h)

2h =f^′(a) +E, onde

(13) |E| ≤M h²,

para alguma constante M. Consequentemente, a expressão ^f(a+h)^˜ _2h⁻^f(a^˜ ⁻^h) é aproximada porf^′(a) com erroE+ (ε1−ε2)/2h. Este erro tem ordemϕ(h) = M h²+ ^2.10_2h⁻⁸, por(12) e (13). Comoϕ^′(h) = 2M h−¹⁰h⁻⁸² , ϕ(h) atinge o seu m´ınimo parah=h0, ondeh0 é o zero deϕ^′(h),

h0= ³ r 1

2.10⁸M = 1 10³

r 5 M.

Desta forma, ϕ(h) decresce quando hdecresce atéh0 mas volta a crescer enquanto o passohcontinua decrescendo. Por isto, a aplica¸cão prática exige, em cada caso particular, a determina¸cão do valor cr´ıticoh0do passo e o uso somente de passoshpara os quais h > h0.

Agora, vamos obter uma f´ormula para aproximarf^′′(a) baseada nos valores f(a−h), f(a) e f(a+h), supondo que f tem quarta derivada cont´ınua em [a−h, a+h].

Método 1. Denotemos por L2(f;x) o polinômio interpolador de Lagrange da fun¸cãof(x) com nósa−h,a,a+h. De acordo com a a fórmula de Newton L2(f;x) =f(a−h) +f[a−h, a](x−a+h) +f[a−h, a, a+h](x−a+h)(x−a) e

f(x) =L2(f;x) +f[a−h, a, a+h, x](x−a+h)(x−a)(x−a−h).

Assim podemos obter uma aproxima¸c˜ao para f^′′(a) da seguinte maneira:

f^′′(a)≈L^′′₂(f;a) = 2f[a−h, a, a+h]

= f(a−h)−2f(a) +f(a+h)

h² .

O erro desta aproxima¸c˜ao ser´aE(f), E(f) = f^′′(a)−L^′′₂(f;a)

= {f[a−h, a, a+h, x](x−a+h)(x−a)(x−a−h)}^′′|x=a

= 2f[a−h, a, a+h, a, a]ω^′(a) +f[a−h, a, a+h, a]ω^′′(a)

= −f^IV(ξ)

12 h² (porque ω^′′(a) = 0).

Método 2. Agora, oferecemos mais um método conhecido como “método dos coeficientes indefinidos”. Tal método permite a constru¸cão de fórmulas para a aproxima¸cão de funcionais lineares.

Expandindo em s´erie de Taylor no pontoaos valoresf(a−h),f(a) ef(a+h), obtemos

f(a−h) = f(a)−f^′(a)h+f^′′(a)

2! h²−f^′′′(a)

3! h³+f^IV(ξ1) 4! h⁴ (14) f(a) = f(a)

f(a+h) = f(a) +f^′(a)h+f^′′(a)

2! h²+f^′′′(a)

3! h³+f^IV(ξ2) 4! h⁴, ondeξ1 eξ2 s˜ao pontos dos intervalos (a−h, a) e (a, a+h), respectivamente.

O objetivo ´e achar coeficientesα, β eγ, tais que a express˜ao αf(a−h) +βf(a) +γf(a+h)

seja igual a f^′′(a) +O(h^k), onde o erro O(h^k) é o menor poss´ıvel, isto é, a potência k é a maior poss´ıvel. Multiplicando as equa¸cões (14) por α, β e γ, respectivamente, e somando-as, obtemos

αf(a−h) +βf(a) +γf(a+h) = (α+β+γ)f(a) + (−α+γ)f^′(a)h +(α+γ)f^′′(a)

2 h²+ (−α+γ)f^′′′(a) 6 h³ +£

αf^IV(ξ1) +γf^IV(ξ2)¤h² 24 .

O objetivo é obter, do lado direito, o que queremos aproximar. Neste caso particularf^′′(a), e depois tentar, com uma escolha especial dos parâmetrosα, β eγ, anular os coeficientes das potências baixas deh, isto é, deh⁰, h¹, h², . . ., até onde for poss´ıvel. Isto significa que, neste caso particular, temos que escolher α, β eγ satisfazendo às condi¸cões

(α+γ)h²

2 = 1

(α+β+γ) = 0

−α+γ = 0.

Tomemos um sistema de três equa¸cões lineares com três incógnitas. Resolvendo o sistema obtemos

α=γ= 1

h², β =− 2 h².

Imediatamente observamos que, para esta escolha dos parˆametros α, β e γ, o coeficiente deh³´e zero:

(−α+γ)f^′′′(a) 6 . Consequentemente,

f^′′(a) = 1

h²f(a−h)− 2

h²f(a) + 1

h²f(a+h) +E(f), onde

E(f) =−f^(IV⁾(ξ1) +f^(IV⁾(ξ2) 2

h² 12 .

Desde que f^(IV⁾(t) é uma fun¸cão cont´ınua e o número ^f^(IV⁾^(ξ¹^)+f₂ ^(IV⁾^(ξ²⁾ está entre o limite inferior e o limite superior de f^(IV⁾(t), existe um ponto ξ ∈ (a−h, a+h), tal que ^f^(IV⁾^(ξ¹^)+f₂ ^(IV⁾^(ξ²⁾ =f^(IV⁾(ξ). Consequentemente,

E(f) =−f^(IV⁾(ξ) 12 h².

No documento 1.1 F´ ormula de interpola¸ c˜ ao de Lagrange (páginas 89-109)