Ora, pelo teorema de Lagrange,
g(xk) = g(xk−1) + g0(ξk−1) (xk− xk−1), ξk−1 int(xk−1, xk).
Admitindo que g0 ´e cont´ınua numa vizinhan¸ca de z, e sendo xk−1 e xk valores
pr´oximos de z, tem-se g0(ξk−1) ' g0(xk). Assim, a express˜ao (2.51) pode ser
substitu´ıda pela estimativa de erro
ek = z − xk'
xk+1− xk
1 − xk+1− xk xk− xk−1
. (2.52)
Exemplo 2.23. Voltando ao Exemplo 2.17, p´ag. 63, seja
f (x) = cos(x) − 2 x ⇔ x = g(x) = cos(x)
2 , com z = 0.45018361129487357.
Usando como aproxima¸c˜ao inicial x0 = 0.4, efectuar trˆes itera¸c˜oes, respectiva-
mente pelo m´etodo de Newton aplicado `a fun¸c˜ao f , e pelo m´etodo de ponto fixo com fun¸c˜ao iteradora g. Comparar os respectivos erros exactos com os erros estimados segundo (2.50) e (2.52).
As respectivas estimativas realistas de erro s˜ao dadas nas tabelas2.1 e2.2.
2.5
Exerc´ıcios resolvidos
No exerc´ıcio a seguir ´e dada uma fam´ılia de processos iterativos de ponto fixo cuja ordem de convergˆencia ´e t˜ao grande quanto se queira. Os m´etodos num´ericos subjacentes s˜ao ´uteis para aproximar com alta precis˜ao n´umeros da forma 1/α, sem efectuar divis˜oes.
k gk0 g(2)k 1 −2 (α x − 1) −2 α 2 3 (α x − 1)2 6 α (α x − 1) 3 −4 (α x − 1)3 −12 α (α x − 1)2 4 5 (α x − 1)4 20 α (α x − 1)3 5 −6 (α x − 1)5 −30 α (α x − 1)4 6 7 (α x − 1)6 42 α, (α x − 1)5 7 −8 (α x − 1)7 −56 α (α x − 1)6
Tabela 2.3: Primeira e segunda derivadas das fun¸c˜oes iteradoras (2.53).
Exerc´ıcio 2.1. Dado o n´umero real positivo α 6= 1, pretende-se aproximar o n´umero z = 1
α, mediante um algoritmo sem interven¸c˜ao da opera¸c˜ao de divis˜ao. Para o efeito, considere a fam´ılia de processos iterativos gerados pelas fun¸c˜oes iteradoras g1, g2, g3, . . ., assim definidas:
g1(x) = x + x (1 − α x) g2(x) = x + x (1 − α x) + x (1 − α x)2 .. . gk(x) = gk−1(x) + x (1 − α x)k, k ≥ 2. (2.53)
Diga, justificando, se s˜ao verdadeiras ou falsas as seguintes afirma¸c˜oes (a)–(c): (a) Para qualquer inteiro k ≥ 1, os pontos 0 e 1/α s˜ao pontos fixos da fun¸c˜ao iteradora gk.
(b) Se k = 1, o ponto fixo z = 1/α ´e atractor. Leve em considera¸c˜ao a informa¸c˜ao contida na Tabela 2.3.
(c) Para k ≥ 2, o processo iterativo gerado pela fun¸c˜ao gk possui ordem de con-
vergˆencia k.
(d) Para α = π, desenhe os gr´aficos das fun¸c˜oes iteradoras gk, para 1 ≤ k ≤ 7,
no intervalo [0, 1].
Escolhido um valor inicial suficientemente pr´oximo do ponto fixo 1/π, por que raz˜ao podemos antecipar que a sucess˜ao gerada por g7 converge muito mais rapi-
damente para 1/π do que a sucess˜ao gerada por g1?
(e) Considere α = π. Fazendo x0 = 1/10, e usando precis˜ao adequada nos
c´alculos, aplique a fun¸c˜ao iteradora g7 de modo a obter uma aproxima¸c˜ao de
z = 1/π, com pelo menos 500 algarismos significativos.
(a) Os pontos fixos da fun¸c˜ao iteradora g1 s˜ao solu¸c˜ao da equa¸c˜ao g1(x) = x. Ou
seja,
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 k=1
Figura 2.20: Fun¸coes iteradoras (2.53), com 1 ≤ k ≤ 7 e α = π. A tra¸co cheio para k ´ımpar e a tracejado para k par.
Atendendo `as express˜oes (2.53), para qualquer inteiro k ≥ 1, os pontos fixos de gk s˜ao solu¸c˜ao da equa¸c˜ao
gk−1(x) + x (1 − α x)k = x.
Assim, se z ´e ponto fixo de gk−1, resulta da equa¸c˜ao anterior
z + z (1 − α z)k = z =⇒ z = 0 ∨ z = 1/α.
Como 0 e 1/α s˜ao pontos fixos da fun¸c˜ao g1, conclui-se que esses pontos fixos s˜ao
tamb´em pontos fixos de gk, para k ≥ 2.
(b) Dado que g1(1/α) = 1/α, g10(1/α) = 0 e g001(1/α) = −2 α 6= 0, ou seja, o ponto
fixo 1/α ´e superatractor para g1. Escolhido x0 suficientemente pr´oximo do ponto
fixo, o processo xk+1 = g1(xk) converge para 1/α. A convergˆencia ´e de ordem
p = 2 (ver Teorema2.8, p´ag. 58), e o coeficiente assimpt´otico de convergˆencia ´e
k∞ =
|g00 1(1/α)|
2 = α.
(c) A partir da informa¸c˜ao contida na tabela2.3, conclui-se que para 2 ≤ k ≤ 7, s˜ao v´alidas as igualdades
gk(j)(1/α) = 0, para 1 ≤ j ≤ k − 1 gk(k)(1/α) = (−1)kk! αk 6= 0.
0.31830988618379067153776752674502872406891929148091289749533468811779359 526845307018022760553250617191214568545351591607378582369222915730575593 482146339967845847993387481815514615549279385061537743478579243479532338 672478048344725802366476022844539951143188092378017380534791224097882187 387568817105744619989288680049734469547891922179664619356614981233397292 560939889730437576314957313392848207799174827869721996773619839992488575 11703423577168622350375343210930950739760194789207295186675361186050
Figura 2.21: Aproxima¸c˜ao de 1/π com 500 algarismos significativos.
Por conseguinte, o processo iterativo respectivo ´e de ordem k e o coeficiente assimpt´otico de convergˆencia ´e
k∞=
|gk(k)(1/α)| k! = α
k.
Sugere-se ao leitor que use indu¸c˜ao matem´atica para mostrar que o resultado anterior ´e v´alido para qualquer n´umero natural k, ou seja, que ´e arbitr´aria a ordem de convergˆencia do processo iterativo gerado pela fun¸c˜ao gk.
(d) Os gr´aficos de gk desenhados na Figura2.20 mostram que 0 e 1/α ' 0.32 s˜ao
pontos fixos comuns `a fun¸c˜oes gk, para 1 ≤ k ≤ 7.
No intervalo considerado, e para k = 2, 4 e 6, as respectivas fun¸c˜oes iteradoras intersectam a recta y = x num ponto fixo (repulsor) que ´e distinto dos anteriores. Um tal ponto fixo recebe a designa¸c˜ao de ponto fixo estranho (assim designado por n˜ao ser ponto fixo da fun¸c˜ao iteradora g1).
Na vizinhan¸ca do ponto fixo z = 1/α, o gr´afico de g7 ´e muito mais “achatado”do
que o gr´afico de g1. Isso explica a raz˜ao pela qual devemos esperar que as iteradas
produzidas usando a fun¸c˜ao iteradora g7 se aproximem muito mais rapidamente
de z do que no caso de efectuarmos itera¸c˜oes da fun¸c˜ao g1.
(e) Fazendo x0 = 1/10 e usando c´alculos com precis˜ao de pelo menos 500 d´ıgitos
decimais, a quarta e quinta iteradas do m´etodo gerado por g7 s˜ao coincidentes,
produzindo o n´umero mostrado na Figura2.21. Podemos por conseguinte garantir que todos os d´ıgitos do n´umero figurado s˜ao significativos. Os c´alculos foram
efectuados no sistema Mathematica.
2.6
Leituras aconselhadas
K. E. Atkinson, An Introduction to Numerical Analysis, John Wiley & sons, New York, 1978, Ch. 2.
M. M. Gra¸ca, Higher-order root distillers, arXiv:1503.03161v1, March 12, 2015. W. M. Kahan, Personal calculator has key to solve any equation f (x) = 0, He- wlett-Packard Journal, Vol. 30, 12, Dec. 1979, 20-26.
A. Knoebel, R. Laubenbacher, J. Lodder, D. Pengelley Mathematical Masterpie- ces, Further Chronicles by the Explorers, Springer, 2007, Ch. 2.
Z. Rached, Arbitrary Order Iterations, European Int. J. Science and Technology, Vol 2, 5, 191-195, 2013.
J. Stillwell, Elements of Algebra, Geometry, Numbers, Equations, Springer, New York, 2001.
J. Verbeke, R. Cools, The Newton-Raphson method, Int. J. Math. Educ. Sc. Tech. 26:2 (2006), 177-193.
M´etodos num´ericos para sistemas
de equa¸c˜oes
Neste cap´ıtulo trataremos de m´etodos computacionais para a resolu¸c˜ao de siste- mas de equa¸c˜oes (lineares e n˜ao lineares). Para a an´alise do erro destes m´etodos, necessitaremos frequentemente de recorrer a normas vectoriais e matriciais, pelo que come¸caremos por fazer uma breve introdu¸c˜ao sobre este tema.
3.0.1
Normas matriciais
Seja E um espa¸co linear. A grandeza de um elemento de E ´e traduzida nu- mericamente atrav´es da norma desse elemento. Tipicamente, nesta disciplina, teremos E = Rn (vectores de n componentes reais) ou E = Rn×n (matrizes reais
de n linhas e n colunas). Comecemos por relembrar a defini¸c˜ao de norma de um elemento de E.
Defini¸c˜ao 3.1. Uma aplica¸c˜ao φ de E em R+0 diz-se uma norma se satisfizer as seguintes condi¸c˜oes:
1. φ(x) ≥ 0, ∀x ∈ E, sendo φ(x) = 0 se e s´o se x = 0. 2. φ(λ x) = |λ |φ(x), ∀x ∈ E, λ ∈ R.
3. φ(x + y) ≤ φ(x) + φ(y), ∀x, y ∈ E.
Come¸camos por rever alguns exemplos de normas em Rn. Como habitualmente, representaremos qualquer elemento de Rn por x = (x
1, x2, . . . , xn), onde xi ∈ R. Norma do m´aximo: φ(x) = kxk∞ = max i=1,...,n|xi|. Norma 1: φ(x) = kxk1 = n X i=1 |xi|.
φ(x) = kxk2 = v u u t n X i |xi|2 = n X i=1 x2i !1/2 . Norma p: φ(x) = kxkp = n X i |xi|p !1/p , p ≥ 1.
Note-se que a norma 1 e a norma euclidiana s˜ao casos particulares das normas p, respectivamente para p = 1 e p = 2.
Pode provar-se que todos os exemplos anteriores definem normas, isto ´e, satisfa- zem as trˆes condi¸c˜oes da Defini¸c˜ao3.1. A norma ||x||∞ obt´em-se como limite da
norma ||x||p, quando p → ∞.
Passamos agora a considerar o caso de E = Rn×n. Os elementos de E s˜ao matrizes
reais, de n linhas e n colunas, isto ´e, matrizes do tipo n × n. Por exemplo, a matriz A = a11 a12 . . . a1n a21 a22 . . . a2n .. . ... . .. ... an1 an2 . . . ann .
Quando nos referirmos a uma matriz A ∈ Rn×n, designaremos as entradas de A por aij.
Represente-se por k · kv uma dada norma qualquer em Rn. A partir dessa norma
vectorial podemos definir uma norma k.kM em E, da seguinte forma.
Defini¸c˜ao 3.2. Seja A ∈ Rn×n e x ∈ Rn. kAkM = max x∈Rn, x6=0 kA xkv kxkv . (3.1)
Dizemos que a norma k · kM ´e a norma matricial induzida pela norma vectorial
k.kv.
A Defini¸c˜ao3.2permite-nos associar uma norma matricial a cada uma das normas vectoriais anteriormente introduzidas.
Propriedades da norma induzida
A norma matricial || · ||M goza de algumas propriedades essenciais, que passamos
(i) A norma k · kM ´e compat´ıvel com a norma k · kv, isto ´e,
kA xkv ≤ kAkMkxkv, ∀x ∈ Rn, ∀A ∈ Rn×n. (3.2)
Esta propriedade ´e uma consequˆencia imediata da f´ormula (3.1), e ´e por vezes referida como propriedade submultiplicativa das normas induzidas.
(ii) A norma k · kM ´e regular, isto ´e,
kA BkM ≤ kAkMkBkM, ∀A, B ∈ Rn×n. (3.3)
Esta propriedade decorre da propriedade submultiplicativa anterior.
(iii) A matriz identidade I ∈ R(n×n) possui norma induzida de valor unit´ario, ||I||M = 1.
Esta propriedade resulta imediatamente da defini¸c˜ao dada para norma induzida.
Note que uma generaliza¸c˜ao poss´ıvel da norma vectorial euclidiana a matrizes ´e
||A||F = ( n X i=1 n X j=1 a2i,j)1/2, (3.4)
A norma (3.4) ´e conhecida como norma de Frobenius1 ou de Schur.2
Note-se que para a norma || . ||F, se tem ||I||F =
√
n. Conclui-se, portanto, que a norma || · ||F, n˜ao ´e uma norma matricial induzida por uma norma vectorial,
visto que a norma da matriz identidade ´e ||I||F 6= 1.
Normas usuais
Mostra-se que as normas matriciais dadas a seguir s˜ao induzidas pelas normas vectoriais p mais correntes, ou seja, fazendo p = 1, p = 2 e p = ∞ (ver, por exemplo, [23], p. 34).
1. A norma matricial induzida pela norma do m´aximo, isto ´e, para p = ∞, chama-se norma por linha,
kAk∞= max i=1,...,n n X j=1 |aij|. (3.5)
1Ferdinand Georg Frobenius, 1849 -1917, matem´atico alem˜ao.
coluna. ´E definida pela f´ormula kAk1 = max j=1,...,n n X i=1 |aij|. (3.6)
3. Prova-se que a norma matricial induzida pela norma (vectorial) euclidiana (p = 2) ´e
kAk2 =
p
ρ(ATA), (3.7)
onde AT designa a matriz transposta de A e o s´ımbolo ρ(M ) representa o raio espectral da matriz M , que se define como o m´aximo dos m´odulos dos valores pr´oprios de M , ou seja,
Defini¸c˜ao 3.3. Sejam λ1, λ2, . . . , λn os valores pr´oprios da matriz A ∈ Rn×n.
Define-se raio espectral de A por
ρ(A) = max
i=1,...,n|λi|. (3.8)
Note-se que, se A for uma matriz sim´etrica, isto ´e, se AT = A, s˜ao v´alidas as
igualdades
kAk2 =
p
ρ(ATA) =pρ(A2) = ρ(A). (3.9)
Isto ´e, para matrizes sim´etricas A, a norma ||A||2 coincide com o seu raio espec-
tral. Retenha-se a este prop´osito a ideia de que o raio espectral de uma matriz est´a intimamente ligado ao seu “comprimento” ou grandeza. Como se ver´a mais adiante, matrizes cujo raio espectral seja inferior `a unidade revestem-se de inte- resse muito particular.
Exemplo 3.1. Pretende-se determinar as normas usuais da matriz
A = 2 1 −3 1 3 4 2 −1 3 .
As normas matriciais induzidas anteriormente referidas, d˜ao-nos
kAk∞ = max(6, 8, 6) = 8,
e
Para se calcular kAk2 ´e necess´ario come¸car por determinar a matriz (sim´etrica) B = AT A a seguir, B = AT A = 9 3 4 3 11 6 4 6 34 .
Os valores pr´oprios de B s˜ao, aproximadamente, λ1 = 6.8, λ2 = 10.9 e λ3 = 36.3.
Logo, ρ(AT A) = 36.3 e
||A||2 =
√
36.3 ' 6.02.
Interessa comparar o raio espectral da matriz A com a respectiva norma ||A||2. Os
valores pr´oprios de A s˜ao o n´umero real λ1 = 3.69, e os dois n´umeros complexos
conjugados λ2,3 = 2.15 ± i 3.07, donde |λ2| = |λ3| ' 3.75. Por conseguinte,
ρ(A) = 3.75, e
ρ(A) ≤ ||A||2.
Passamos a designar a norma matricial induzida pela norma vectorial || · ||p por
||A||p. No anterior Exemplo 3.1, qualquer das normas de A ´e maior que o raio
espectral da matriz. Tal n˜ao acontece por acaso, conforme ´e mostrado a seguir. Teorema 3.1. Seja A ∈ Rn×n. Qualquer que seja a norma matricial || · ||
M,
induzida pela norma vectorial || · ||V em Rn, ´e v´alida a desigualdade
ρ(A) ≤ kAkM, ∀A ∈ Rn×n (3.10)
Demonstra¸c˜ao. Seja x 6= 0 um vector pr´oprio de A associado ao valor pr´oprio λ, tal que |λ| = ρ(A). Logo,
kA xkV = kλ xkV = |λ| kxkV. (3.11) Assim, kAkM = max x∈Rn,x6=0 kA xkV kxkV ≥ |λ| = ρ(A), (3.12) donde resulta a afirma¸c˜ao do teorema.
Uma vez que geralmente ´e mais f´acil calcular a norma de uma matriz do que o seu raio espectral, a rela¸c˜ao (3.10) ser´a frequentemente invocada.