Exerc´ıcios resolvidos - Apontamentos de Matemática Computacional

Ora, pelo teorema de Lagrange,

g(xk) = g(xk−1) + g0(ξk−1) (xk− xk−1), ξk−1 int(xk−1, xk).

Admitindo que g0 ´e cont´ınua numa vizinhan¸ca de z, e sendo xk−1 e xk valores

pr´oximos de z, tem-se g0(ξk−1) ' g0(xk). Assim, a express˜ao (2.51) pode ser

substitu´ıda pela estimativa de erro

ek = z − xk'

xk+1− xk

1 − xk+1− xk xk− xk−1

. (2.52)

Exemplo 2.23. Voltando ao Exemplo 2.17, p´ag. 63, seja

f (x) = cos(x) − 2 x ⇔ x = g(x) = cos(x)

2 , com z = 0.45018361129487357.

Usando como aproxima¸cão inicial x0 = 0.4, efectuar três itera¸cões, respectiva-

mente pelo método de Newton aplicado à fun¸cão f , e pelo método de ponto fixo com fun¸cão iteradora g. Comparar os respectivos erros exactos com os erros estimados segundo (2.50) e (2.52).

As respectivas estimativas realistas de erro s˜ao dadas nas tabelas2.1 e2.2.

2.5 Exerc´ıcios resolvidos

No exerc´ıcio a seguir é dada uma fam´ılia de processos iterativos de ponto fixo cuja ordem de convergência é tão grande quanto se queira. Os métodos numéricos subjacentes são úteis para aproximar com alta precisão números da forma 1/α, sem efectuar divisões.

k g_k0 g(2)_k 1 −2 (α x − 1) −2 α 2 3 (α x − 1)2 _{6 α (α x − 1)} 3 −4 (α x − 1)3 _{−12 α (α x − 1)}2 4 5 (α x − 1)4 20 α (α x − 1)3 5 −6 (α x − 1)5 _{−30 α (α x − 1)}4 6 7 (α x − 1)6 42 α, (α x − 1)5 7 −8 (α x − 1)7 _{−56 α (α x − 1)}6

Tabela 2.3: Primeira e segunda derivadas das fun¸c˜oes iteradoras (2.53).

Exerc´ıcio 2.1. Dado o n´umero real positivo α 6= 1, pretende-se aproximar o n´umero z = 1

α, mediante um algoritmo sem interven¸cão da opera¸cão de divisão. Para o efeito, considere a fam´ılia de processos iterativos gerados pelas fun¸cões iteradoras g1, g2, g3, . . ., assim definidas:

g1(x) = x + x (1 − α x) g2(x) = x + x (1 − α x) + x (1 − α x)2 .. . gk(x) = gk−1(x) + x (1 − α x)k, k ≥ 2. (2.53)

Diga, justificando, se são verdadeiras ou falsas as seguintes afirma¸cões (a)–(c): (a) Para qualquer inteiro k ≥ 1, os pontos 0 e 1/α são pontos fixos da fun¸cão iteradora gk.

(b) Se k = 1, o ponto fixo z = 1/α é atractor. Leve em considera¸cão a informa¸cão contida na Tabela 2.3.

vergˆencia k.

(d) Para α = π, desenhe os gr´aficos das fun¸c˜oes iteradoras gk, para 1 ≤ k ≤ 7,

no intervalo [0, 1].

Escolhido um valor inicial suficientemente próximo do ponto fixo 1/π, por que razão podemos antecipar que a sucessão gerada por g7 converge muito mais rapi-

damente para 1/π do que a sucess˜ao gerada por g1?

(e) Considere α = π. Fazendo x0 = 1/10, e usando precis˜ao adequada nos

cálculos, aplique a fun¸cão iteradora g7 de modo a obter uma aproxima¸cão de

z = 1/π, com pelo menos 500 algarismos significativos.

(a) Os pontos fixos da fun¸cão iteradora g1 são solu¸cão da equa¸cão g1(x) = x. Ou

seja,

0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 k=1

Figura 2.20: Fun¸coes iteradoras (2.53), com 1 ≤ k ≤ 7 e α = π. A tra¸co cheio para k ´ımpar e a tracejado para k par.

Atendendo às expressões (2.53), para qualquer inteiro k ≥ 1, os pontos fixos de gk são solu¸cão da equa¸cão

gk−1(x) + x (1 − α x)k = x.

Assim, se z ´e ponto fixo de gk−1, resulta da equa¸c˜ao anterior

z + z (1 − α z)k = z =⇒ z = 0 ∨ z = 1/α.

Como 0 e 1/α são pontos fixos da fun¸cão g1, conclui-se que esses pontos fixos são

tamb´em pontos fixos de gk, para k ≥ 2.

(b) Dado que g1(1/α) = 1/α, g10(1/α) = 0 e g001(1/α) = −2 α 6= 0, ou seja, o ponto

fixo 1/α ´e superatractor para g1. Escolhido x0 suficientemente pr´oximo do ponto

fixo, o processo xk+1 = g1(xk) converge para 1/α. A convergˆencia ´e de ordem

p = 2 (ver Teorema2.8, pág. 58), e o coeficiente assimptótico de convergência é

k∞ =

|g00 1(1/α)|

2 = α.

g_k(j)(1/α) = 0, para 1 ≤ j ≤ k − 1 g_k(k)(1/α) = (−1)k_{k! α}k _{6= 0.}

0.31830988618379067153776752674502872406891929148091289749533468811779359 526845307018022760553250617191214568545351591607378582369222915730575593 482146339967845847993387481815514615549279385061537743478579243479532338 672478048344725802366476022844539951143188092378017380534791224097882187 387568817105744619989288680049734469547891922179664619356614981233397292 560939889730437576314957313392848207799174827869721996773619839992488575 11703423577168622350375343210930950739760194789207295186675361186050

Figura 2.21: Aproxima¸c˜ao de 1/π com 500 algarismos significativos.

Por conseguinte, o processo iterativo respectivo é de ordem k e o coeficiente assimptótico de convergência é

k∞=

|g_k(k)(1/α)| k! = α

k_.

Sugere-se ao leitor que use indu¸cão matemática para mostrar que o resultado anterior é válido para qualquer número natural k, ou seja, que é arbitrária a ordem de convergência do processo iterativo gerado pela fun¸cão gk.

(d) Os gr´aficos de gk desenhados na Figura2.20 mostram que 0 e 1/α ' 0.32 s˜ao

pontos fixos comuns `a fun¸c˜oes gk, para 1 ≤ k ≤ 7.

No intervalo considerado, e para k = 2, 4 e 6, as respectivas fun¸cões iteradoras intersectam a recta y = x num ponto fixo (repulsor) que é distinto dos anteriores. Um tal ponto fixo recebe a designa¸cão de ponto fixo estranho (assim designado por não ser ponto fixo da fun¸cão iteradora g1).

Na vizinhan¸ca do ponto fixo z = 1/α, o gr´afico de g7 ´e muito mais “achatado”do

que o gr´afico de g1. Isso explica a raz˜ao pela qual devemos esperar que as iteradas

produzidas usando a fun¸c˜ao iteradora g7 se aproximem muito mais rapidamente

de z do que no caso de efectuarmos itera¸c˜oes da fun¸c˜ao g1.

(e) Fazendo x0 = 1/10 e usando c´alculos com precis˜ao de pelo menos 500 d´ıgitos

decimais, a quarta e quinta iteradas do m´etodo gerado por g7 s˜ao coincidentes,

produzindo o número mostrado na Figura2.21. Podemos por conseguinte garantir que todos os d´ıgitos do número figurado são significativos. Os cálculos foram

efectuados no sistema Mathematica.

2.6 Leituras aconselhadas

K. E. Atkinson, An Introduction to Numerical Analysis, John Wiley & sons, New York, 1978, Ch. 2.

M. M. Gra¸ca, Higher-order root distillers, arXiv:1503.03161v1, March 12, 2015. W. M. Kahan, Personal calculator has key to solve any equation f (x) = 0, He- wlett-Packard Journal, Vol. 30, 12, Dec. 1979, 20-26.

A. Knoebel, R. Laubenbacher, J. Lodder, D. Pengelley Mathematical Masterpie- ces, Further Chronicles by the Explorers, Springer, 2007, Ch. 2.

Z. Rached, Arbitrary Order Iterations, European Int. J. Science and Technology, Vol 2, 5, 191-195, 2013.

J. Stillwell, Elements of Algebra, Geometry, Numbers, Equations, Springer, New York, 2001.

J. Verbeke, R. Cools, The Newton-Raphson method, Int. J. Math. Educ. Sc. Tech. 26:2 (2006), 177-193.

M´etodos num´ericos para sistemas

de equa¸c˜oes

Neste cap´ıtulo trataremos de métodos computacionais para a resolu¸cão de sistemas de equa¸cões (lineares e não lineares). Para a análise do erro destes métodos, necessitaremos frequentemente de recorrer a normas vectoriais e matriciais, pelo que come¸caremos por fazer uma breve introdu¸cão sobre este tema.

3.0.1 Normas matriciais

Seja E um espa¸co linear. A grandeza de um elemento de E ´e traduzida nu- mericamente atrav´es da norma desse elemento. Tipicamente, nesta disciplina, teremos E = Rn _{(vectores de n componentes reais) ou E = R}n×n _{(matrizes reais}

de n linhas e n colunas). Comecemos por relembrar a defini¸c˜ao de norma de um elemento de E.

Defini¸c˜ao 3.1. Uma aplica¸c˜_{ao φ de E em R}+₀ diz-se uma norma se satisfizer as seguintes condi¸c˜oes:

1. φ(x) ≥ 0, ∀x ∈ E, sendo φ(x) = 0 se e s´o se x = 0. 2. φ(λ x) = |λ |φ(x), _{∀x ∈ E, λ ∈ R.}

3. φ(x + y) ≤ φ(x) + φ(y), ∀x, y ∈ E.

Come¸camos por rever alguns exemplos de normas em Rn. Como habitualmente, representaremos qualquer elemento de Rn _{por x = (x}

1, x2, . . . , xn), onde xi ∈ R. Norma do m´aximo: φ(x) = kxk∞ = max i=1,...,n|xi|. Norma 1: φ(x) = kxk1 = n X i=1 |xi|.

φ(x) = kxk2 = v u u t n X i |xi|2 = n X i=1 x2_i !1/2 . Norma p: φ(x) = kxkp = n X i |xi|p !1/p , p ≥ 1.

Note-se que a norma 1 e a norma euclidiana s˜ao casos particulares das normas p, respectivamente para p = 1 e p = 2.

Pode provar-se que todos os exemplos anteriores definem normas, isto é, satisfa- zem as três condi¸cões da Defini¸cão3.1. A norma ||x||∞ obtém-se como limite da

norma ||x||p, quando p → ∞.

Passamos agora a considerar o caso de E = Rn×n_{. Os elementos de E s˜}_{ao matrizes}

reais, de n linhas e n colunas, isto ´e, matrizes do tipo n × n. Por exemplo, a matriz A =      a11 a12 . . . a1n a21 a22 . . . a2n .. . ... . .. ... an1 an2 . . . ann      .

Quando nos referirmos a uma matriz A ∈ Rn×n, designaremos as entradas de A por aij.

Represente-se por k · kv uma dada norma qualquer em Rn. A partir dessa norma

vectorial podemos definir uma norma k.kM em E, da seguinte forma.

Defini¸c˜_{ao 3.2. Seja A ∈ R}n×n _{e x ∈ R}n_. kAkM = max x∈Rn_{, x6=0} kA xkv kxkv . (3.1)

Dizemos que a norma k · kM ´e a norma matricial induzida pela norma vectorial

k.kv.

A Defini¸c˜ao3.2permite-nos associar uma norma matricial a cada uma das normas vectoriais anteriormente introduzidas.

Propriedades da norma induzida

A norma matricial || · ||M goza de algumas propriedades essenciais, que passamos

(i) A norma k · kM ´e compat´ıvel com a norma k · kv, isto ´e,

kA xkv ≤ kAkMkxkv, ∀x ∈ Rn, ∀A ∈ Rn×n. (3.2)

Esta propriedade é uma consequência imediata da fórmula (3.1), e é por vezes referida como propriedade submultiplicativa das normas induzidas.

(ii) A norma k · kM ´e regular, isto ´e,

kA BkM ≤ kAkMkBkM, ∀A, B ∈ Rn×n. (3.3)

Esta propriedade decorre da propriedade submultiplicativa anterior.

(iii) A matriz identidade I ∈ R(n×n) possui norma induzida de valor unit´ario, ||I||M = 1.

Esta propriedade resulta imediatamente da defini¸c˜ao dada para norma induzida.

Note que uma generaliza¸c˜ao poss´ıvel da norma vectorial euclidiana a matrizes ´e

||A||F = ( n X i=1 n X j=1 a2_i,j)1/2, (3.4)

A norma (3.4) ´e conhecida como norma de Frobenius1 _{ou de Schur.}2

Note-se que para a norma || . ||F, se tem ||I||F =

√

n. Conclui-se, portanto, que a norma || · ||F, n˜ao ´e uma norma matricial induzida por uma norma vectorial,

visto que a norma da matriz identidade ´e ||I||F 6= 1.

Normas usuais

Mostra-se que as normas matriciais dadas a seguir s˜ao induzidas pelas normas vectoriais p mais correntes, ou seja, fazendo p = 1, p = 2 e p = ∞ (ver, por exemplo, [23], p. 34).

1. A norma matricial induzida pela norma do m´aximo, isto ´e, para p = ∞, chama-se norma por linha,

kAk∞= max i=1,...,n n X j=1 |aij|. (3.5)

1_{Ferdinand Georg Frobenius, 1849 -1917, matem´}_{atico alem˜}_ao.

coluna. ´E definida pela f´ormula kAk1 = max j=1,...,n n X i=1 |aij|. (3.6)

3. Prova-se que a norma matricial induzida pela norma (vectorial) euclidiana (p = 2) ´e

kAk2 =

ρ(AT_A), _(3.7)

onde AT designa a matriz transposta de A e o s´ımbolo ρ(M ) representa o raio espectral da matriz M , que se define como o máximo dos módulos dos valores próprios de M , ou seja,

Defini¸c˜ao 3.3. Sejam λ1, λ2, . . . , λn os valores pr´oprios da matriz A ∈ Rn×n.

Define-se raio espectral de A por

ρ(A) = max

i=1,...,n|λi|. (3.8)

Note-se que, se A for uma matriz sim´etrica, isto ´e, se AT _{= A, s˜}_{ao v´}_{alidas as}

igualdades

kAk2 =

ρ(AT_{A) =}p_ρ(A2_{) = ρ(A).} _(3.9)

Isto ´e, para matrizes sim´etricas A, a norma ||A||2 coincide com o seu raio espec-

tral. Retenha-se a este propósito a ideia de que o raio espectral de uma matriz está intimamente ligado ao seu “comprimento” ou grandeza. Como se verá mais adiante, matrizes cujo raio espectral seja inferior à unidade revestem-se de inte- resse muito particular.

Exemplo 3.1. Pretende-se determinar as normas usuais da matriz

A =   2 1 −3 1 3 4 2 −1 3  .

As normas matriciais induzidas anteriormente referidas, d˜ao-nos

kAk∞ = max(6, 8, 6) = 8,

Para se calcular kAk2 é necessário come¸car por determinar a matriz (simétrica) B = AT _{A a seguir,} B = AT A =   9 3 4 3 11 6 4 6 34  .

Os valores pr´oprios de B s˜ao, aproximadamente, λ1 = 6.8, λ2 = 10.9 e λ3 = 36.3.

Logo, ρ(AT _{A) = 36.3 e}

||A||2 =

√

36.3 ' 6.02.

Interessa comparar o raio espectral da matriz A com a respectiva norma ||A||2. Os

valores próprios de A são o número real λ1 = 3.69, e os dois números complexos

conjugados λ2,3 = 2.15 ± i 3.07, donde |λ2| = |λ3| ' 3.75. Por conseguinte,

ρ(A) = 3.75, e

ρ(A) ≤ ||A||2.

Passamos a designar a norma matricial induzida pela norma vectorial || · ||p por

||A||p. No anterior Exemplo 3.1, qualquer das normas de A ´e maior que o raio

espectral da matriz. Tal n˜ao acontece por acaso, conforme ´e mostrado a seguir. Teorema 3.1. Seja A ∈ Rn×n_{. Qualquer que seja a norma matricial || · ||}

induzida pela norma vectorial || · ||V em Rn, ´e v´alida a desigualdade

ρ(A) ≤ kAkM, ∀A ∈ Rn×n (3.10)

Demonstra¸cão. Seja x 6= 0 um vector próprio de A associado ao valor próprio λ, tal que |λ| = ρ(A). Logo,

kA xkV = kλ xkV = |λ| kxkV. (3.11) Assim, kAkM = max x∈Rn_,x6=0 kA xkV kxkV ≥ |λ| = ρ(A), (3.12) donde resulta a afirma¸c˜ao do teorema.

Uma vez que geralmente é mais fácil calcular a norma de uma matriz do que o seu raio espectral, a rela¸cão (3.10) será frequentemente invocada.

No documento Apontamentos de Matemática Computacional (páginas 83-93)