Problema. Mostrar queos polinˆomios de Chebyshev de primeira esp´ecie Tn(x) = cosnarccosx
s˜ao ortogonais em [−1,1] com rela¸c˜ao `a fun¸c˜ao pesoµ(x) = √ 1 1−x2. Mostrar queos polinˆomios de Chebyshev de segunda esp´ecie
Un(x) :=Tn+1′ (x)
s˜ao ortogonais em [−1,1] relativamente `a fun¸c˜ao pesoµ(x) =√ 1−x2. Os polinˆomios de Legendre e de Chebyshev de primeira e de segunda esp´ecies s˜ao casos especiais dos polinˆomios de Jacobi {Pn(α,β)}, que s˜ao ortogonais em [−1,1] com rela¸c˜ao `a fun¸c˜ao peso (1−x)α(1+x)β, paraα, β >−1. S˜ao definidos pela f´ormula
Pn(α,β)(x) = (−1)n
2nn!(1−x)−α(1 +x)−β dn
dxn{(1−x)n+α(1 +x)n+β}.
Esta express˜ao ´e um polinˆomio do segundo grau emt. Consequentemente, seu discriminante ´e n˜ao-positivo, isto ´e,
[(f, g)]2≤(f, f) (g, g).
A desigualdade est´a provada. Se f =αg, obviamente a desigualdade torna-se igualdade. ´E verdade a rec´ıproca, isto ´e, se tivermos igualdade, ent˜ao f e g s˜ao linearmente dependentes. De fato, se fosse o contr´ario, obter´ıamos, por um lado, (f −αg, f−αg)>0 para todoαe, por outro,
(f −αg, f−αg) = (f, f)−2α(f, g) +α2(g, g) =³p
(f, f)−αp (g, g)´2
= 0 paraα=p
(f, f)/p
(g, g). A demonstra¸c˜ao est´a completa.
Desigualdade triangular: Para quaisquer f eg deH temos
(2) p
(f+g, f+g)≤p
(f, f) +p (g, g),
com a igualdade sendo atingida se, e somente se,f eg s˜ao linearmente depen- dentes.
Demonstra¸c˜ao. Aplicando a desigualdade de Cauchy-Schwartz obtemos (f+g, f+g) = (f, f) + 2(f, g) + (g, g)
≤ (f, f) + 2p
(f, f)(g, g) + (g, g)
= np
(f, f) +p (g, g)o2
,
o que implica em (2). A igualdade ´e atingida se, e somente se, [(f, g)]2 = (f, f)(g, g). Mas, como j´a observamos, isto ´e verdade somente quandof egs˜ao linearmente dependentes.
Com a nota¸c˜ao (1), podemos escrever (2) da forma kf+gk ≤ kfk+kgk.
Isto mostra que a rela¸c˜aof → kfk, introduzida por (1), satisfaz `a desigualdade triangular. As demais propriedades da defini¸c˜ao de norma, isto ´e,kfk>0 para f 6= 0 e kλfk = |λ|kfk), s˜ao obviamente satisfeitas. Consequentemente, (1) define uma norma emH.
A norma (1), por outro lado, gera a distˆancia d(f, g) :=kf−gk=p
(f−g, f−g).
Daqui por diante, quando falarmos em espa¸co de Hilbert, vamos supor que ele
´e normado e m´etrico pelo esquema descrito acima.
Sejam ϕ0, ϕ1, . . . , ϕn arbitr´arios, mas elementos fixos deH. Denotemos por Ωn:=
( n X
i=0
aiϕi : (a0, . . . , an)∈ IRn+1 )
.
Consideremos o problema de aproxima¸c˜ao de elementosf de H por elementos de Ωn. Primeiramente, observamos que H ´e um espa¸coestritamente normado.
Isto ´e consequˆencia da desigualdade triangular (2) formulada e demonstrada acima. Consequentemente, pelo teorema geral de aproxima¸c˜ao em espa¸cos line- ares normados:
Para todo f de H, existe um ´unico elemento de Ωn que ´e a melhor apro- xima¸c˜ao para f.
Basta considerar a importante quest˜ao de constru¸c˜ao do elemento da melhor aproxima¸c˜ao. Primeiramente, forneceremos sua caracteriza¸c˜ao.
Dizeremos quef ´eortogonala ge escrevemosf ⊥g, se (f, g) = 0.
Teorema 30 SejamH um espa¸co de Hilbert ef ∈H. O elementopdeΩn ´e o elemento de melhor aproxima¸c˜ao paraf por elementos de Ωn se, e somente se,
(3) (f−p, ϕ) = 0 para todo ϕdeΩn.
Demonsta¸c˜ao. Vamos supor quep´e o elemento de melhor aproxima¸c˜ao, isto
´e,
kf−pk= inf{ kf−ϕk : ϕ∈Ωn }=:εn(f).
Ent˜ao, para qualquerϕ∈Ωn eϕ6= 0, a fun¸c˜ao
r(λ) := kf−p+λϕk2= (f−p+λϕ, f−p+λϕ)
= ε2n(f) + 2λ(f−p, ϕ) +λ2(ϕ, ϕ)
tem ponto de m´ınimo para λ = 0. Isto implica em r′(0) = 0. Mas r′(0) = 2(f −p, ϕ). Consequentemente, (f−p, ϕ) = 0 para todoϕ∈Ωn.
Reciprocamente, vamos supor quep∈Ωnsatisfaz `as condi¸c˜oes de ortogona- lidade (3). Seja ϕqualquer outro elemento de Ωn. Ent˜ao, δ:=p−ϕ∈Ωn e, portanto,
kf −ϕk2 = kf −p+p−ϕk2= (f−p+δ, f−p+δ)
= kf −pk+ 2(f−p, δ) +kδk2
= kf −pk2+kδk2 (porquef−p⊥δ)
≥ kf −pk2. Aqui, sepsatisfaz (3), ent˜ao
kf−pk ≤ kf −ϕk para todoϕ∈Ωn.
Al´em disso, a igualdade ´e atingida somente paraδ= 0, isto ´e, para ϕ=p. O teorema est´a provado.
Agora, construiremos o elemento de melhor aproxima¸c˜ao de f usando a caracteriza¸c˜ao (3). Procuraremos pda forma
p=a0ϕ0+a1ϕ1+. . .+anϕn.
Desde quef−p⊥ϕi parai= 0,1, . . . , n, ent˜ao os coeficientes {ai} satisfazem
`as condi¸c˜oes :
a0(ϕ0, ϕ0) +a1(ϕ1, ϕ0) +. . .+an(ϕn, ϕ0) = (f, ϕ0) (4) a0(ϕ0, ϕ1) +a1(ϕ1, ϕ1) +. . .+an(ϕn, ϕ1) = (f, ϕ1) ...
a0(ϕ0, ϕn) +a1(ϕ1, ϕn) +. . .+an(ϕn, ϕn) = (f, ϕn)
que ´e um sistema linear de n+ 1 equa¸c˜oes com n+ 1 inc´ognitas. Denotemos porD(ϕ0, . . . , ϕn) o seu determinante,
D(ϕ0, . . . , ϕn) := det
(ϕ0, ϕ0) (ϕ1, ϕ0) . . . (ϕn, ϕ0) (ϕ0, ϕ1) (ϕ1, ϕ1) . . . (ϕn, ϕ1)
... ... . .. ... (ϕ0, ϕn) (ϕ1, ϕn) . . . (ϕn, ϕn)
.
Este ´e o determinante de Gram, que ´e diferente de zero pois ϕ0, . . . , ϕn s˜ao linearmente independentes. Consequentemente, o sistema (4) tem uma ´unica solu¸c˜aoa0, . . . , an. Ent˜ao, o c´alculo do elemento de melhor aproxima¸c˜ao em um espa¸co de Hilbert reduz-se `a solu¸c˜ao do sistema (4).
A solu¸c˜ao do sistema (4) pode ser facilitada se a baseϕ0, . . . , ϕn´e ortogonal.
Sabe-se, por exemplo, que em todo espa¸co linear existe uma base ortogonal.
Vamos supor queϕ0, . . . , ϕn seja um sitema ortogonal, isto ´e, (ϕi, ϕj) = 0 para i6=j. Ent˜ao, (4) reduz-se a forma
ak(ϕk, ϕk) = (f, ϕk), k= 0, . . . , n, de onde obtemos
(5) ak= (f, ϕk)
(ϕk, ϕk) , k= 0, . . . , n.
Assim, mostramos a seguinte afirma¸c˜ao.
Teorema 31 Seja ϕ0, . . . , ϕn um sistema ortogonal. Ent˜ao, o elemento p de melhor aproxima¸c˜ao def ∈H por elementos deΩn ´e dado pela f´ormula
p=
n
X
k=0
(f, ϕk) (ϕk, ϕk) ϕk.
Vamos obter uma express˜ao para o erroεn(f) =kf −pk. Temos que ε2n(f) = (f−p, f−p) = (f, f)−(p, f) ( ondef−p⊥p).
Por esta igualdade, representandopda formap=a0ϕ0+. . .+anϕn, obtemos a rela¸c˜ao
a0(ϕo, f) +a1(ϕ1, f) +. . .+an(ϕn, f) = (f, f)−ε2n(f).
Usando esta rela¸c˜ao junto com o sitema (4) formamos um sistema homogˆenio de n+ 2 equa¸c˜oes lineares com rela¸c˜ao a (a0, a1, . . . , an,1). Desde que este sistema tem solu¸c˜ao n˜ao-nula, seu determinante ´e igual a zero, isto ´e,
det
(ϕ0, ϕ0) . . . (ϕn, ϕ0) (f, ϕ0) ... . .. ... ... (ϕ0, ϕn) . . . (ϕn, ϕn) (f, ϕn)
(ϕ0, f) . . . (ϕn, f) (f, f)−ε2n(f)
= 0.
Por esta igualdade, determinamosε2n(f):
(6) ε2n(f) =D(f, ϕ0, . . . , ϕn) D(ϕ0, . . . , ϕn) . Ent˜ao, provamos a igualdade
{minak}n0
°
°
°
°
° f −
n
X
k=0
akϕk
°
°
°
°
°
2
= D(f, ϕ0, . . . , ϕn) D(ϕ0, . . . , ϕn) .
Esta f´ormula vale para qualquer escolha da base ϕ0, . . . , ϕn. Se ϕ0, . . . , ϕn ´e um sistema ortonormal, isto ´e, se (ϕi, ϕj) = 0 para i 6=j e (ϕi, ϕi) = 1 para i= 0, . . . n, obtemos diretamente
ε2n(f) = (f−p, f−p) = (f, f)−(p, f)
= (f, f)−
n
X
k=0
ak(ϕk, f)
= kfk2n
n
X
k=0
a2k (pois, de acordo com (5),ak = (ϕk, f)).
Desde queε2n(f)>0 paraf 6∈Ωn, isto implica nadesigualdade de Bessel:
à n X
k=0
a2k
!1/2
≤ kfk.
Observa¸c˜ao. Por (6) e sabendo queD(g1) = (g1, g1)>0 para todog16= 0, segue por indu¸c˜ao, que o determinante de Gram, D(g1, . . . , gn), ´e estritamente positivo se os elementosg1, . . . , gn s˜ao linearmente independentes.
Casos Particulares I. Aproxima¸c˜oes em L2.
Seja [a, b] um dado intervalo, finito ou infinito. Sejaµ(x) uma fun¸c˜ao peso in- tegr´avel em [a, b]. Denotamos porL2[a, b] o espa¸co de todas as fun¸c˜oes definidas em [a, b], para as quais
Z b a
µ(x)f2(x)dx <∞.
E claro que´ L2[a, b] ´e um espa¸co linear. Definiremos o produto interno neste espa¸co da seguinte maneira:
(f, g) :=
Z b a
µ(x)f(x)g(x)dx.
N˜ao ´e dif´ıcil mostrar que o produto dado por esta defini¸c˜ao satisfaz a todas as exigˆencias de produto interno. Assim, L2[a, b] torna-se um espa¸co de Hilbert.
A norma
kfk:=nZ b a
µ(x)f2(x)dxo1/2
´e chamadam´edia quadr´atica. Ela gera a distˆanciam´edia quadr´atica ρ(f, g) :=
(Z b a
µ(x) [f(x)−g(x)]2 dx )1/2
.
Sejamϕ0(x), . . . ϕn(x) fun¸c˜oes arbitr´arias e linearmente independentes do espa¸co L2[a, b]. Particularmente,{ϕi}podem ser polinˆomios alg´ebricos 1, x, x2, . . . , xn. Ent˜ao, emL2[a, b] podemos considerar o problema deaproxima¸c˜ao m´edia quadr´atica de uma dada fun¸c˜aof ∈L2[a, b] porpolinˆomios generalizadosa0ϕ0(x)+a1ϕ1(x)+
. . .+anϕn(x).
De acordo com a teoria geral de aproxima¸c˜ao em espa¸cos de Hilbert vale o seguinte teorema:
Teorema 32 Para toda fun¸c˜aof deL2[a, b] existe um ´unico polinˆomio p(x) =
n
X
k=0
a∗kϕk(x), para o qual
Z b a
µ(x) [f(x)−p(x)]2dx= min
{ak}
Z b a
µ(x)
"
f(x)−
n
X
k=0
akϕk(x)
#2
dx.
Al´em disso, seϕ0, . . . , ϕn ´e um sistema ortonormal,
(7) p(x) =
n
X
k=0
"
Z b a
µ(t)f(t)ϕk(t)dt
# ϕk(x).
II. M´etodo dos m´ınimos quadrados.
Na pr´atica, frequentemente precisamos resolver o seguinte problema.
Vamos supor que sabemos, por raz˜oes te´oricas, que a fun¸c˜ao f ´e de uma determinada forma que depende de n parˆametrosa1, . . . , an. Por exemplo, f pode ser da forma
n
X
k=1
akxk−1,
n
Y
k=1
senakxou
n
X
k=1
eakx. Podemos calcular os valores de f com uma determinada precis˜ao em um n´umero finito de pontos.
Al´em disso, o c´alculo do valor def em um ponto `as vezes ´e um processo caro.
O objetivo ´e recuperar aproximadamente os parˆametrosa1, . . . , ancom a maior precis˜ao poss´ıvel com base na informa¸c˜ao
f(x1), f(x2), . . . , f(xm) m > n.
Em geral, estes n´umeros s˜ao aproxima¸c˜oes dos valores exatos da fun¸c˜aof. Por exemplo, vamos supor que a rela¸c˜aoy=f(x) que investigamos ´e linear, isto ´e,
f(x) =Ax+B,
x
1x
ix
ml(x)
}di
Figura 7
para algunsA eB. Temos, `a disposi¸c˜ao, os valores def(x) obtidos experimen- talmente: fi=f(xi), i= 1, . . . , m, representados na figura abaixo.
Devido `a falta de precis˜ao no processo de medi¸c˜ao ou `a imperfei¸c˜ao do expe- rimento, os pontos (xi, fi), i= 1, . . . , n, obviamente n˜ao pertencem a uma reta.
Sabemos que a fun¸c˜aof(x) ´e linear. Ent˜ao, qual a reta que representa os dados obtidos experimentalmente? Existem os candidatos para tais representantes.
Por exemplo, podemos escolher quaisquer dois pontos (xi, fi),(xj, fj) da tabela e considerar a reta que passa por eles como aproxima¸c˜ao de f. Esta seria uma escolha aleat´oria.
Vamos tentar abordar o problema de forma mais te´orica e sistem´atica. Pro- curemos uma fun¸c˜ao da forma
l(x) =Ax+B.
Denotaremos pordi a discrepˆancia entre o valorfi no pontoxi obtido experi- mentalmente o valor del no mesmo ponto,
di:=fi−(Axi+B), i= 1, . . . , m.
Existem algumas abordagens de como escolher os parˆametrosAeB del.
1) Escolher AeB de modo que
1max≤i≤m|di|
seja o m´ınimo poss´ıvel. Assim, tentar minimizar a maior distˆancia entre f e l nos pontos x1, . . . , xm. Tal crit´erio ´e aceit´avel mas a realiza¸c˜ao na pr´atica ´e
dificil porque o problema ´e n˜ao-linear p que max
i |di|´e uma fun¸c˜ao n˜ao-linear nas vari´aveisAeB.
2) Escolher AeB de modo que
m
X
i=1
|di|
seja o m´ınimo poss´ıvel. As obje¸c˜oes contra o crit´erio 1) valem com a mesma for¸ca neste caso. Estas obje¸c˜oes foram consideradas seriamente no passado quando n˜ao existiam ferramentas para c´alculos r´apidos. Talvez, por isto, foi escolhido um crit´erio que leva a um sistema linear para a obten¸c˜ao dos parˆametros.
3) Escolher AeB de modo que S(A, B) :=
n
X
i=1
d2i. seja o m´ınimo poss´ıvel. Temos
S(A, B) =
m
X
i=1
[fi−(Axi+B)]2,
e as condi¸c˜oes necess´arias para o m´ınimo, que neste caso tamb´em s˜ao suficientes, levam ao sistema
∂S
∂A = 0 ⇒
m
X
i=1
[fi−(Ax+B)]xi= 0,
∂S
∂B = 0 ⇒
m
X
i=1
[fi−(Ax+B)] = 0.
Esta abordagem para determinar as inc´ognitas da fun¸c˜ao pela tabela dos da- dos ´e chamadam´etodo dos m´ınimos quadrados. Vamos represent´a-lo de forma mais geral. Seja {F(x, a1, . . . , an)} uma fam´ılia de fun¸c˜oes , descritas pelos parˆametrosai ∈Ii, i= 1, . . . , n. Sejam f1, . . . , fm os valores de uma fun¸c˜ao desta fam´ılia nos pontosx1, . . . , xm.
Defini¸c˜ao 11 Dizemos queF(x, a1, . . . , an)´e a aproxima¸c˜ao dos dadosf1, . . . , fm
pelo m´etodo dos m´ınimos quadrados sea1, . . . , an minimizam a express˜ao
m
X
i=1
µi[F(xi, a1, . . . , an)−fi]2,
onde{µi}mi s˜ao n´umeros positivos dados a priori, chamados “pesos”.
Consideremos uma situa¸c˜ao particular, a saber, a aproxima¸c˜ao de uma fun¸c˜ao por polinˆomios alg´ebricos de graunnos pontosx1< . . . < xm (m > n).
Ent˜ao, queremos achar a aproxima¸c˜ao
p(x) =a0xn+a1xn−1+. . .+an
def pelo m´etodo dos m´ınimos quadrados baseada nos valores fi =f(xi), i= 1, . . . , m. Sejam{µi} alguns pesos dados. Ent˜ao, de acordo com o que foi dito, a0, a1, . . . , an s˜ao determinados de tal maneira que minimizem a express˜ao
Φ(a0, . . . , an) :=
m
X
i=1
µi
"
fi−
n
X
k=0
akxki
#2
.
Vˆe-se que Φ2(a0, . . . , an) ´e de fato a distˆancia entref epno espaco de Hilbert H△ das fun¸c˜oes definidas em x1, . . . , xme equipado com o produto interno
(f, g) :=
m
X
i=1
µif(xi)g(xi).
De fato, este produto interno gera a norma kfk:=nXm
i=1
µif2(xi)o1/2
, que, por outro lado, gera a distˆancia
ρ(f, g) = ( m
X
i=1
µi[f(xi)−g(xi)]2 )12
.
Nestes termos, a fun¸c˜ao Φ(a0, . . . , an) ´e igual `a distˆancia dentro de f ep. Con- sequentemente, o m´etodo dos m´ınimos quadrados leva ao problema de melhor aproxima¸c˜ao por polinˆomios alg´ebricos no espa¸co de HilbertH△. A teoria geral implica que a solu¸c˜aoa0, . . . , an´e determinada pelo sistema linear (4) que, neste caso, toma a forma
a0 m
X
i=1
xki +a1 m
X
i=1
xk+1i +· · ·+an m
X
i=1
xk+ni =
m
X
i=1
f(xi)xki, k= 0, . . . , n.
Para evitar a solu¸c˜ao deste sistema, podemos escolher, a priori, uma base apro- priada no espa¸co de polinˆomios alg´ebricos πn. Por exemplo, se procur´assemos um polinˆomiopda forma
p(x) =b0P0(x) +· · ·+bnPn(x),
onde os polinˆomios{Pk(x)}formam um sistema ortogonal no conjunto dos pon- tosx1, . . . xmcom pesos{µi}, o sistema acima reduzir-se-ia ao sistema diagonal
bk n
X
i=1
µiPk2(xi) =
n
X
i=1
µiPk(xi)f(xi), onde os coeficientesbk seriam determinados imediatamente.
Diferencia¸ c˜ ao e Integra¸ c˜ ao Num´ ericas
O c´alculo aproximado da derivada ou da integral definida de uma dada fun¸c˜ao s˜ao temas importantes no c´alculo num´erico. Conheceremos alguns m´eto- dos cl´assicos baseados na id´eia de que uma f´ormula de aproxima¸c˜ao ´e boa quando ela ´e exata para polinˆomios alg´ebricos de maior grau poss´ıvel. As f´ormulas s˜ao obtidas n˜ao da derivada ou da integral da fun¸c˜ao, mas sim da derivada e da integral do correspondente polinˆomio interpolador.
2.1 Diferencia¸ c˜ ao num´ erica
Discutiremos a quest˜ao de diferencia¸c˜ao num´erica, isto ´e, do c´alculo aproxi- mado da derivadaf′(x). Notemos que a diferencia¸c˜ao ´e uma opera¸c˜ao inst´avel no sentido de que pequenas altera¸c˜oes da fun¸c˜ao f podem causar grandes al- tera¸c˜oes da sua derivada. Isto exige uma abordagem muito cuidadosa quando diferenciamos numericamente e uma an´alise detalhada em cada caso particular.
Seja f(x) definida em [a, b] e x0, . . . , xn pontos distintos de [a, b]. Vamos supor que f(x) tem derivadas cont´ınuas de ordem suficientemente alta. Pela f´ormula de Newton
(1) f(x) =Ln(f;x) +f[x0, . . . , xn, x]ω(x), onde
ω(x) = (x−x0). . .(x−xn),
eLn(f;x) ´e o polinˆomio interpolador de f com n´os x0, . . . , xn. Provemos que a fun¸c˜aog(x) =f[x0, . . . , xn, x] ´e diferenci´avel no pontox. De fato, de acordo com a defini¸c˜ao de derivada,
g′(x) = lim
h→0
g(x+h)−g(x) h
= lim
h→0
f[x0, . . . , xn, x+h]−f[x0, . . . , xn, x]
x+h−x
= lim
h→0f[x0, . . . , xn, x+h, x]
= f[x0, . . . , xn, x, x],
pois, como j´a vimos (Teorema 6.5) a diferen¸ca dividida ´e uma fun¸c˜ao cont´ınua de seus argumentos sef ´e suficientemente suave. Ent˜ao,
d
dxf[x0, . . . , xn, x] =f[x0, . . . , xn, x, x].
Portanto, de (1), obtemos
f′(x) =L′n(f;x) +f[x0, . . . , xn, x, x]ω(x) +f[x0, . . . , xn, x]ω′(x).
Consequentemente, o erroE(f) da aproxima¸c˜ao f′(x)≈L′n(f;x) ´e dado pela express˜ao
E(f) =f[x0, . . . , xn, x, x]ω(x) +f[x0, . . . , xn, x]ω′(x).
Usando a rela¸c˜ao
f[y0, . . . , yk] = f(k)(ξ) k! , podemos escreverE(f) como
(2) E(f) = f(n+2)(ξ)
(n+ 2)! ω(x) +f(n+1)(η) (n+ 1)! ω′(x),
ondeξeηs˜ao pontos do intervalo(a, b). Geralmente conhecemosf(n+1)ef(n+2) e, sobreξ eη, sabemos somente que eles est˜ao em (a, b). Por isto, na pr´atica, usamos a seguinte estimativa
|E(f)| ≤ Mn+2
(n+ 2)!|ω(x)|+ Mn+1
(n+ 1)!|ω′(x)|, ondeMk ´e o limite superior de|f(k)(t)|em [a, b].
Em alguns casos, a express˜ao para o erro (2) pode ser simplificada significati- vamente, por exemplo quando o pontoxcoincide com algum dos n´osx0, . . . , xn, ou quandoω′(x) = 0. No primeiro caso parax=xk, temos ω(xk) = 0 e
ω′(xk) =
n
Y
i=0,i6=k
(xk−xi).
Ent˜ao, (2) toma a forma
(3) E(f) = f(n+1)(η)
(n+ 1)!
n
Y
i=0,i6=k
(xk−xi),
para algumη∈(a, b).
Analogamente, seω′(x) = 0, ent˜ao (2) toma a forma
(4) E(f) =f(n+2)(ξ)
(n+ 2)! ω(x).
Temos ω′(x) = 0 quando, por exemplo, os n´os s˜ao sim´etricos com rela¸c˜ao ao pontox, isto ´e, quando
x−xi=xn−i−x, i= 0, . . . ,n−1 2 . Ent˜ao, (t−xi)(t−xn−i) = (t−x)2−(x−xi)2 e, portanto,
ω(t) =
(n−1)/2
Y
i=0
h(t−x)2−(x−xi)2i . Desde que
d dt
h(t−x)2−(x−xi)2i ¯
¯
¯t=x= 2(t−x)¯
¯
¯t=x= 0,
temos ω′(x) = 0. Ent˜ao, se os n´os {xk} satisfazem `a condi¸c˜ao de simetria, a express˜ao para o erro (2) pode ser escrita como
E(f) =f(n+2)(ξ) (n+ 2)!
(n−1)/2
Y
i=0
[−(x−xi)2].
Consideraremos agora alguns casos particulares simples.
Sejan= 1. Escolhemos como n´os os pontos x0 =a ex1 =a+h. Vamos achar uma express˜ao para aproximar def′(x) emx=a. Temos
f′(a)≈L′1(f;a),
ondeL1(f;t) =f(a) +f[a, a+h](t−a). Consequentemente, (5) f′(a)≈f[a, a+h] = f(a+h)−f(a)
h .
Neste caso, o ponto a´e n´o e, por esta raz˜ao, aplicaremos a f´ormula (3) para achar a estimativa do erro. Obtemos
(6) E(f) = f′′(η)
2 h.
A f´ormula (5) tem interpreta¸c˜ao geom´etrica simples. A derivada f′(a), que
´e igual ao coeficiente angular da tangente a f(x) no ponto com abscissa a, ´e substituida pelo coeficiente angular da secante pelos pontos com abscissasa e a+h(veja Figura 8).
d
f
a a + h
Figura 8
Tomemos novamente n= 1 e os n´osx0 ex1 localizados sim´etricamente em rela¸c˜ao ao pontoa, onde aproximamos a derivada. Denotemos porx0=a−h ex1=a+h. Obviamente,
L1(f;t) =f(a−h) +f[a−h, a+h](t−a+h).
Consequentemente,f′(a)≈L′1(f;a) =f[a−h, a+h]. Assim, obtemos a f´ormula (7) f′(a)≈ f(a+h)−f(a−h)
2h .
A interpreta¸c˜ao geom´etrica de (7) ´e representada na Figura 9. O coeficiente angular da tangente a f(x) no ponto a´e aproximado pelo coeficiente angular da secante pelos pontosa−hea+h.
d
f
a a + h
a - h
Figura 9
Determinando o erro E(f) por (4), obtemos
(8) E(f) =nf′′′(ξ)
6 h2.
Observemos que o erro (8) ´e muito menor, parahpequeno, do que o erro (6), enquanto que as correspondentes f´ormulas (5) e (7) s˜ao “igualmente comple- xas”: as duas usam dois valores da fun¸c˜aof(x). Para caracterizar a ordem do erro, como de outras quantidades na an´alise num´erica, usaremos os s´ımbolosO (”o”mai´usculo) eo (”o”min´usculo). Dizemos queϕ(h) ´e O(ψ(h)) para h→0, se existe constante K, tal que ϕ(h)ψ(h) ≤ K quando h→0. Dizemos que ϕ(h) ´e o(ψ(h)) parah→0 se ϕ(h)ψ(h) →0 quandoh→0. Ent˜ao, de acordo com essas de- fini¸c˜oes, a f´ormula (5) tem erro de ordemO(h), enquanto o erro de (7) ´eO(h2).
Mais adiante, vamos perceber que a f´ormula (7) ´e usada frequentemente, especi- almente na an´alise de m´etodos num´ericos para solu¸c˜ao de equa¸c˜oes diferenciais.
Infelizmente, ela pode ser aplicada somente para aproxima¸c˜ao da derivada nos pontos internos, x1, . . . xn−1, de uma tabela de valores, f(x0), . . . , f(xn), da fun¸c˜ao f(x). Para os pontos limites, x0 e xn, podemos usar (5). Mas, esta
´
ultima tem erroO(h). O ideal seria uma f´ormula para o c´alculo aproximado de f′(x0) ef′(xn) com erro da ordemO(h2). Agora, vamos obter tal f´ormula. Para este fim, vamos utilizar mais um n´o para aumentar a precis˜ao da aproxima¸c˜ao.
Sejan= 2. Escolhemos os n´osx0 =a, x1=a+hex2=a+ 2h. Aproxi- memos a derivada def(x) parax=a. Neste caso, temos
L2(f;x) =f(a) +f[a, a+h](x−a) +f[a, a+h, a+ 2h](x−a)(x−a−h).
Daqu´ı obtemos
L′2(f;a) = f[a, a+h] +f[a, a+h, a+ 2h](−h)
= f(a)
−h +f(a+h)
h −h
½f(a)
2h2 +f(a+h)
−h2 +f(a+ 2h) 2h2
¾
= −3f(a) + 4f(a+h)−f(a+ 2h)
2h .
Consequentemente,
(9) f′(a)≈−3f(a) + 4f(a+h)−f(a+ 2h)
2h .
Desde que o pontoa´e n´o, para achar o limite para o erroE(f), aplicaremos a f´ormula (3). Obtemos
(10) E(f) =f′′′(η)
3 h2. O erro tem ordemO(h2).
Se construirmos uma f´ormula para aproximar f′(a) com n´os x0 = a−h, x1 = a e x2 = a+h, da maneira descrita acima, obteremos uma f´ormula idˆentica a (7), isto ´e, o coeficiente de f(a) na aproxima¸c˜ao ser´a igual a zero.
Isto revela a raz˜ao para a melhor precis˜ao de (7) em compara¸c˜ao com (5): a f´ormula (7) ´e constru´ıda com trˆes e n˜ao com dois valores da fun¸c˜ao f(x) em quest˜ao.
O polinˆomio interpolador de Lagrange Ln(f;x) com n´osx0, . . . , xn ´e usado tamb´em para o c´alculo aproximado de derivadas de ordem mais alta. O valor def(k)(x) ´e simplesmente substitu´ıdo pelo valor deL(k)n (f;x). Para determinar o limite do erro precisamos diferenciar a fun¸c˜aof[x0, . . . , xk, x]ω(x)k vezes, e assim obter as express˜oes da forma (2) comk+ 1 termos. N˜ao obteremos essas f´ormulas explicitamente. Finalmente, notemos que a rela¸c˜ao entre a derivada e a diferen¸ca dividida nos permite obter a seguinte f´ormula para a diferencia¸c˜ao num´erica: parax∈[x0, xn],
(11) f(n)(x)≈f[x0, . . . , xn]n!.
Podemos observar que a f´ormula (5) pode ser obtida por (11) para n = 1 e x=x0.
Pelas f´ormulas do erro para a diferencia¸c˜ao num´erica at´e agora obtidas, vˆe- se que o erro diminue quando o passo h diminue. Desta forma, poder´ıamos obter a derivada de f′(a) com qualquer precis˜ao se pud´essemos calcular f(x) em pontos x suficientemente perto do ponto a. Acontece que na pr´atica isto
n˜ao ´e verdade. Ou seja, durante o uso pr´atico de qualquer uma das f´ormulas obtidas, quando diminuimos h o erro tamb´em diminue no in´ıcio mas, depois, volta a crescer. A raz˜ao para este efeito ´e que as f´ormulas para diferencia¸c˜ao num´erica s˜ao “inst´aveis”. Expliquemos detalhadamente este fenˆomeno.
Vamos supor que aproximamosf′(a) pela f´ormula (7), f′(a)≈ f(a+h)−f(a−h)
2h ,
e que o computador que usamos representa os n´umeros com precisao 10−8. Portanto, ao inv´es dos valores exatos def(a+h) e def(a−h) trabalhamos com os n´umeros
f˜(a+h) = f(a+h) +ε1, f˜(a−h) = f(a−h) +ε2, onde
(12) |εi| ≤10−8, i= 1,2.
Ent˜ao, para o valor aproximado def′(a), obtemos o n´umero f˜(a+h)−f˜(a−h)
2h = f(a+h)−f(a−h)
2h +ε1−ε2
2h . De acordo com (8),
f(a+h)−f(a−h)
2h =f′(a) +E, onde
(13) |E| ≤M h2,
para alguma constante M. Consequentemente, a express˜ao f(a+h)˜ 2h−f(a˜ −h) ´e aproximada porf′(a) com erroE+ (ε1−ε2)/2h. Este erro tem ordemϕ(h) = M h2+ 2.102h−8, por(12) e (13). Comoϕ′(h) = 2M h−10h−82 , ϕ(h) atinge o seu m´ınimo parah=h0, ondeh0 ´e o zero deϕ′(h),
h0= 3 r 1
2.108M = 1 103
3
r 5 M.
Desta forma, ϕ(h) decresce quando hdecresce at´eh0 mas volta a crescer en- quanto o passohcontinua decrescendo. Por isto, a aplica¸c˜ao pr´atica exige, em cada caso particular, a determina¸c˜ao do valor cr´ıticoh0do passo e o uso somente de passoshpara os quais h > h0.
Agora, vamos obter uma f´ormula para aproximarf′′(a) baseada nos valores f(a−h), f(a) e f(a+h), supondo que f tem quarta derivada cont´ınua em [a−h, a+h].
M´etodo 1. Denotemos por L2(f;x) o polinˆomio interpolador de Lagrange da fun¸c˜aof(x) com n´osa−h,a,a+h. De acordo com a a f´ormula de Newton L2(f;x) =f(a−h) +f[a−h, a](x−a+h) +f[a−h, a, a+h](x−a+h)(x−a) e
f(x) =L2(f;x) +f[a−h, a, a+h, x](x−a+h)(x−a)(x−a−h).
Assim podemos obter uma aproxima¸c˜ao para f′′(a) da seguinte maneira:
f′′(a)≈L′′2(f;a) = 2f[a−h, a, a+h]
= f(a−h)−2f(a) +f(a+h)
h2 .
O erro desta aproxima¸c˜ao ser´aE(f), E(f) = f′′(a)−L′′2(f;a)
= {f[a−h, a, a+h, x](x−a+h)(x−a)(x−a−h)}′′|x=a
= 2f[a−h, a, a+h, a, a]ω′(a) +f[a−h, a, a+h, a]ω′′(a)
= −fIV(ξ)
12 h2 (porque ω′′(a) = 0).
M´etodo 2. Agora, oferecemos mais um m´etodo conhecido como “m´etodo dos coeficientes indefinidos”. Tal m´etodo permite a constru¸c˜ao de f´ormulas para a aproxima¸c˜ao de funcionais lineares.
Expandindo em s´erie de Taylor no pontoaos valoresf(a−h),f(a) ef(a+h), obtemos
f(a−h) = f(a)−f′(a)h+f′′(a)
2! h2−f′′′(a)
3! h3+fIV(ξ1) 4! h4 (14) f(a) = f(a)
f(a+h) = f(a) +f′(a)h+f′′(a)
2! h2+f′′′(a)
3! h3+fIV(ξ2) 4! h4, ondeξ1 eξ2 s˜ao pontos dos intervalos (a−h, a) e (a, a+h), respectivamente.
O objetivo ´e achar coeficientesα, β eγ, tais que a express˜ao αf(a−h) +βf(a) +γf(a+h)
seja igual a f′′(a) +O(hk), onde o erro O(hk) ´e o menor poss´ıvel, isto ´e, a potˆencia k ´e a maior poss´ıvel. Multiplicando as equa¸c˜oes (14) por α, β e γ, respectivamente, e somando-as, obtemos
αf(a−h) +βf(a) +γf(a+h) = (α+β+γ)f(a) + (−α+γ)f′(a)h +(α+γ)f′′(a)
2 h2+ (−α+γ)f′′′(a) 6 h3 +£
αfIV(ξ1) +γfIV(ξ2)¤h2 24 .
O objetivo ´e obter, do lado direito, o que queremos aproximar. Neste caso particularf′′(a), e depois tentar, com uma escolha especial dos parˆametrosα, β eγ, anular os coeficientes das potˆencias baixas deh, isto ´e, deh0, h1, h2, . . ., at´e onde for poss´ıvel. Isto significa que, neste caso particular, temos que escolher α, β eγ satisfazendo `as condi¸c˜oes
(α+γ)h2
2 = 1
(α+β+γ) = 0
−α+γ = 0.
Tomemos um sistema de trˆes equa¸c˜oes lineares com trˆes inc´ognitas. Resolvendo o sistema obtemos
α=γ= 1
h2, β =− 2 h2.
Imediatamente observamos que, para esta escolha dos parˆametros α, β e γ, o coeficiente deh3´e zero:
(−α+γ)f′′′(a) 6 . Consequentemente,
f′′(a) = 1
h2f(a−h)− 2
h2f(a) + 1
h2f(a+h) +E(f), onde
E(f) =−f(IV)(ξ1) +f(IV)(ξ2) 2
h2 12 .
Desde que f(IV)(t) ´e uma fun¸c˜ao cont´ınua e o n´umero f(IV)(ξ1)+f2 (IV)(ξ2) est´a entre o limite inferior e o limite superior de f(IV)(t), existe um ponto ξ ∈ (a−h, a+h), tal que f(IV)(ξ1)+f2 (IV)(ξ2) =f(IV)(ξ). Consequentemente,
E(f) =−f(IV)(ξ) 12 h2.