UNIVERSIDADE FEDERAL DE SANTA CATARINA Centro de Ciˆencias F´ısicas e Matem´aticas
Curso de Licenciatura em Matem´atica
M ´ETODOS ITERATIVOS PARA SISTEMAS LINEARES
Autora: Ivandra Kremer
Orientador: Prof. Dr. Paulo Rafael B¨osing Florian´opolis
Fevereiro 2009
Ivandra Kremer
M´etodos Iterativos para Sistemas Lineares
Trabalho acadˆemico de graduac¸˜ao apresentado
`a disciplina Trabalho de Conclus˜ao de Curso II, do Curso de Matem´atica - Habilitac¸˜ao Licenciatura, do Centro Ciˆencias F´ısicas e Matem´aticas da Universidade Federal de Santa Catarina
Professora: Carmem Suzane Comitre Gimenez
Florian´opolis Fevereiro 2009
Agradecimentos
Nestes cinco anos de muitos aprendizados gostaria de agradecer a muitas pessoas que estiveram do meu lado: `A Deus, pela oportunidade de desfrutar das maravilhas do aprender e ter confiado a mim a tarefa de ensinar. Ao meu orientador Paulo, pelo incentivo, apoio, compreens˜ao e por acreditar e acompanhar cada passo do meu trabalho. Ao meus av´os, por me acolheram em sua casa, e me incentivaram nos momentos em que precisei. A minha fam´ılia, pelo incentivo dado em todos os momentos de minha vida.
Ao meu namorado Marcos, pelo companheirismo, incentivo e compreens˜ao. E aos meus amigos, que me incentivaram nas horas
mais dif´ıc´eis e tornaram estes cinco anos inesquec´ıveis.
Sum´ario
1 Noc¸˜oes B´asicas 8
2 M´etodos Iterativos 14
2.1 Processos Estacion´arios . . . 14
2.1.1 M´etodo de Jacobi . . . 17
2.1.2 M´etodo de Gauss-Seidel . . . 18
2.1.3 Convergˆencia dos M´etodos . . . 20
2.2 Processos de Relaxac¸˜ao . . . 23
2.2.1 Princ´ıpios B´asicos do Processo de Relaxac¸˜ao . . . 26
2.2.2 M´etodo dos Gradientes . . . 27
2.2.3 M´etodo dos Gradientes Conjugados . . . 28
3 Aplicac¸˜oes dos M´etodos Iterativos 33
Referˆencias Bibliogr´aficas 47
Introduc¸˜ao
Os m´etodos iterativos foram muito utilizados durante o s´eculoXX, por causa dos avanc¸os tecnol´ogicos. Estes m´etodos servem para resolver sistemas lineares que surgem em diversas ´areas como: engenharia e matem´atica.
Dentre os tipos de m´etodos para resoluc¸˜ao de sistemas lineares podemos desta- car os m´etodos diretos e os iterativos, sendo que no primeiro as soluc¸˜oes s˜ao obti- das sem a necessidade de qualquer tipo de aproximac¸˜ao (`a excec¸˜ao da precis˜ao da m´aquina) e no segundo a soluc¸˜ao aproximada do sistema ´e encontrada sob uma certa tolerˆancia previamente determinada.
Os m´etodos iterativos tem por finalidade o melhoramento cont´ınuo da soluc¸˜ao aproximada at´e que esta esteja precisa o “suficiente”. Sendo que, nestes m´etodos s˜ao utilizadas t´ecnicas para aproximac¸˜oes sucessivas chegando a soluc¸˜oes mais precisas a cada passo, para um dado sistema linear.
N˜ao se pode garantir a priori que os m´etodos iterativos resolvam qualquer tipo de sistema, ´e necess´ario analisar certos crit´erios estabelecidos em relac¸˜ao ao sistema. J´a os m´etodos diretos resolvem todos os tipos de sistema determinados, mas alguns de forma mais demorada.
Os m´etodos iterativos se dividem em estacion´arios e n˜ao-estacion´arios. Um m´etodo ´e estacion´ario quando cada aproximante da soluc¸˜ao ´e obtido do anterior sempre pelo mesmo processo. Entre os m´etodos iterativos estacion´arios temos o Jacobi, Gauss-Seidel, Gradiente, SOR e SSOR. E entre os n˜ao-estacion´arios temos o Gradiente Conjugado (GC).
O m´etodo de Jacobi ´e uma homenagem ao matem´atico Carl Gustav Jacob Ja- cobi(1804−1851), que teve uma grande influˆencia no renascimento da Matem´atica em universidades alem˜as no s´eculo XIX. O m´etodo consiste em dada uma aproximac¸˜ao inicial e uma tolerˆancia para a soluc¸˜ao, gera-se uma sequˆencia de vetores que converge para a soluc¸˜ao exata, efetuando o mesmo processo uma quantidade finita de vezes.
J´a o m´etodo de Gauss-Seidel ´e uma homenagem aos matem´aticos alem˜aes Carl Friedrich Gauss(1777−1855)e Philipp Ludwig von Seidel(1821−1896), este ´ultimo trabalhou como assistente de Jacobi resolvendo problemas que resul- taram do estudo de Gauss. Este m´etodo difere-se apenas do Jacobi por utilizar valores mais atualizados para algumas componentes, o que faz reduzir o n´umero de iterac¸˜oes at´e obter a tolerˆancia determinada.
Um dos m´etodos iterativos mais conhecidos ´e o Gradiente Conjugado. Ele foi introduzido nos anos 50 por: Magnus Hestenes(1906−1991) e Edward Stiefel (1875−1968). O m´etodo resolve sistemas lineares onde a matriz A ´e positiva definida e sim´etrica. Ele possui como base para o seu desenvolvimento o m´etodo dos Gradientes.
O Gradiente Conjugado ´e utilizado frequentemente quando se resolve nu- mericamente equac¸˜oes diferencias parciais. O m´etodo consiste em, dado uma aproximac¸˜ao inicial e uma tolerˆancia, calcula-se o res´ıduo e a direc¸˜ao de relaxac¸˜ao e em seguida gera-se uma sequˆencia de vetores, que a cada iterac¸˜ao se aproxima da soluc¸˜ao exata, em que o res´ıduo ´e ortogonal a direc¸˜ao de relaxac¸˜ao.
O objetivo principal deste trabalho ´e abordar trˆes m´etodos iterativos: Jacobi, Gauss-Seidel e Gradiente Conjugado. Tamb´em mostraremos alguns exemplos fazendo comparac¸˜oes entre as soluc¸˜oes obtidas atrav´es de cada m´etodo.
Para tanto, dividiremos o trabalho em trˆes cap´ıtulos.
No primeiro apresentaremos os conceitos b´asicos de ´algebra linear e c´alculo, necess´arios para alcanc¸ar nossos objetivos. No segundo, desenvolveremos os m´etodos iterativos e observaremos as condic¸˜oes de convergˆencia do sistema lin- ear. Para finalizar, no terceiro cap´ıtulo resolveremos alguns exemplos aplicando o que foi desenvolvido anteriormente.
Cap´ıtulo 1
Noc¸˜oes B´asicas
Neste cap´ıtulo, apresentaremos as ferramentas que ser˜ao utilizadas no decorrer do trabalho. Tais ferramentas, s˜ao resultados cl´assicos de ´algebra linear e c´alculo.
Primeiramente introduzimos conceitos b´asicos de ´algebra linear, tais como:
espac¸o vetorial real, produto interno, norma, autovalores, autovetores e raio es- pectral.
Definic¸˜ao 1.1. SejaV um conjunto n˜ao vazio.V ´e umespac¸o vetorial realse as operac¸˜oes de adic¸˜ao e multiplicac¸˜ao por escalar est˜ao definidas emV, isto ´e, a) seu, v ∈V, ent˜aou+v ∈V;
a1)u+v =v+u, ∀u, v ∈V;
a2)(u+v) +z =u+ (v+z), ∀u, v, z ∈V; a3)∃0(vetor nulo)∈V tal queu+ 0 =u, ∀u∈V; a4)∀u∈V, ∃ −u∈V, u+ (−u) = 0;
b) sek ∈Reu∈V, ent˜aoku∈V;
b1)a.(u+v) =a.u+a.v, ∀a∈R,∀u, v ∈V; b2)(a+b).u=a.u+b.u, ∀a, b∈R, ∀u∈V; b3)a(b.u) = (a.b)u, ∀a, b∈R, ∀u∈V; b4)1.u=u, ∀u∈V.
Definic¸˜ao 1.2. Seja V um espac¸o vetorial. Dizemos que um vetor v ´e uma combinac¸˜ao linear dos vetoresv1, v2, . . . , vn, sevpode ser escrito na forma:
v =α1v1+α2v2+. . .+αnvn=
n
X
i=1
αivi, em queα1, α2, . . . , αn∈R.
Definic¸˜ao 1.3. SejaV um espac¸o vetorial real. Sejamuevelementos deV. Um produto escalar (produto interno) ´e uma aplicac¸˜ao
h·,·i: V ×V −→ R (u, v) 7−→ hu, vi que satisfaz as seguintes propriedades:
i)hu, vi=hv, ui,∀u, v ∈V (simetria);
ii)hv, u+wi=hv, ui+hv, wi(linearidade);
iii)hα.v, ui=α.hv, ui,∀α∈R,∀v, u∈V (transitividade);
iv)hv, vi ≥0ehv, vi= 0⇔v = 0.
Um espac¸o vetorial realV no qual est´a definido um produto escalar ´e chamado espac¸o vetorial euclidiano real.
Exemplo 1.1. SejaV = Rn. Sejamuev ∈ V, dados poru = (u1, u2, ..., un)e v = (v1, v2, ..., vn), ent˜ao,
hu, vi=u1v1+u2v2+...+unvn =
n
X
i=1
uivi
´e um produto interno emV =Rn, que ´e oproduto interno usualnoRn.
Definic¸˜ao 1.4. SejaV um espac¸o vetorial euclidiano real. Sejamuev elementos deV. Dizemos queu ´e ortogonal av sehu, vi= 0.
Definic¸˜ao 1.5. SejaV um espac¸o vetorial euclidiano. Uma norma, denotada por k · k, ´e uma aplicac¸˜ao:
V −→ R
v 7−→ kvk Com as seguintes propriedades:
i)kvk ≥0para todov ∈V; ii)kvk= 0 ⇐⇒v = 0;
iii)kαvk=|α|kvkpara todoα ∈Rev ∈V; iv)kv+uk ≤ kvk +kukpara todov, u∈V.
Exemplo 1.2. Seja V = Rn e u = (u1, u2,· · · , un) ∈ Rn, ent˜ao, as seguintes aplicac¸˜oes s˜ao normas emRn:
a) kuk∞= max
1≤i≤n|ui|.
b) kuk1 =
n
X|ui|.
c) kuk2 =qhu, ui.
Definic¸˜ao 1.6. Diz-se que uma sequˆencia de vetores x(k) em Rn converge para x∈Rncom relac¸˜ao a uma normak · kse, dado qualquer >0, existir um inteiro N()tal que:
kxk−xk< , para todo k≥N().
Definic¸˜ao 1.7. Chama-se norma de uma matriz A qualquer func¸˜ao definida no espac¸o vetorial das matrizes, com valores em R, satisfazendo as seguintes pro- priedades:
i)kAk ≥0;
ii)kAk= 0, se e somente seAfor 0 ( matriz com todos os elementos 0);
iii)kαAk=|α|kAk;
iv)kA+Bk ≤ kAk+kBk;
v)kABk ≤ kAkkBk.
A distˆancia entre as matrizesAeBcom relac¸˜ao a esta norma de matriz ´ekA−Bk.
Exemplo 1.3. SejaAuma matrizn×n, ent˜ao as seguintes aplicac¸˜oes s˜ao normas no espac¸o vetorial das matrizesn×n, com valores emR:
a) kAk∞ = max
1≤i≤n n
X
j=1
|aij|(norma linha);
b) kAk1 = max
1≤j≤n n
X
i=1
|aij|(norma coluna);
c) kAk2 =
v u u t
n
X
i,j=1
a2ij (norma euclidiana).
Uma matrizn ×m pode ser considerada como uma func¸˜ao que utiliza mul- tiplicac¸˜ao de matrizes para transformar vetores mdimensionais em vetoresn di- mensionais. Uma matriz quadrada Aleva o conjunto de vetores n dimensionais em vetoresndimensionais. Neste caso, certos vetoresx, n˜ao nulos, s˜ao paralelos a Ax, o que significa que existe uma constante λ tal queAx = λx. Para esses vetores, temos(A−λI)x= 0.
Definic¸˜ao 1.8. SeAfor uma matriz quadrada, o polinˆomio caracter´ıstico deA ´e definido por
p(λ) =det(A−λI)
Definic¸˜ao 1.9. Sepfor o polinˆomio caracter´ıstico da matrizA, os zeros deps˜ao os autovalores, ou valores pr´oprios, da matriz A. Seλfor um autovalor deA e x6= 0satisfazer(A−λI)x= 0, ent˜aox ´e umautovetor, ou vetor pr´oprio, deA, correspondente ao autovalorλ.
Exemplo 1.4. Para a matriz
A=
2 0 0 1 1 2 1 −1 4
o polinˆomio caracter´ıstico ´e
p(λ) =det(A−λI) =det
2−λ 0 0
1 1−λ 2 1 −1 4−λ
=λ3−7λ2+ 16λ−12 = (λ−3)(λ−2)2.
Assim os autovalores deAs˜aoλ1 = 3eλ2 = 2. Um autovetorx = (w, k, u) correspondente ao autovalorλ1 = 3´e soluc¸˜ao da equac¸˜ao matriz-vetor
(A−3.I)x= 0, isto ´e:
0 0 0
=
−1 0 0
1 −2 2 1 −1 1
.
w k v
, o que implica w = 0 ek = v. Ent˜ao vλ1 = (0, y, y), y ∈Rn,y6= 0.
Agora para o autovalor λ2 = 2 um autovetor x = (w, k, u) ´e soluc¸˜ao do sistema(A−2.I)x= 0, isto ´e:
0 0 0
=
0 0 0 1 −1 2 1 −1 2
.
w k v
, o que implica quew−k+ 2.v = 0. Ent˜ao vλ2 = (−2z,2y, y+z), y, z∈Rn
Teorema 1.1. Sek · kfor norma de vetor emRn, ent˜ao kAk= max
kxk=1kAxk
´e uma norma de matriz.
Pode ser visto em[8]p´ag509.
Cada norma de vetor produz uma norma de matriz natural associada, e esta ´e denominada por norma de matriz natural.
Definic¸˜ao 1.10. O raio espectralρ(A)de uma matrizA ´e definido por ρ(A) = max(λi)
em queλi,i= 1,· · ·, ns˜ao autovalores deA.
Para a matriz do Exemplo 1.4 temos, ρ(A) = max
1≤i≤n{2,2,3}= 3.
O raio espectral esta intimamente ligado a norma da matriz, conforme veremos a seguir.
Teorema 1.2. SejaAuma matrizn×n, ent˜ao:
i)kAk2 = [ρ(ATA)]1/2,
ii)ρ(A)≤ kAk, para qualquer norma de matrizk · k.
Demonstrac¸˜ao. i) A demonstrac¸˜ao desta parte n˜ao ser´a feita, mas pode ser en- contrada em[7]p´ag. 21.
ii)Suponha que λi seja um autovalor qualquer de A com autovetor x e que kxk= 1. Comox´e um autovetor associado ao autovalorλitemos queAx=λix.
Ent˜ao,
|λi|=|λi|kxk=kλixk=kAxk ≤ kAkkxk=kAk Assimρ(A) = max
1≤i≤n|λi| ≤ kAk
Definic¸˜ao 1.11. Uma matrizA,n×n, ´e uma matriz convergente, se
k→∞lim akij = 0parai= 1,2,· · · , nej = 1,2,· · · , n.
Teorema 1.3. As seguintes afirmac¸˜oes s˜ao equivalentes:
i)A ´e uma matriz convergente;
ii) lim
n→∞kAnk= 0para alguma norma de matriz;
iii) lim
n→∞kAnk= 0para todas as normas de matrizes;
iv)ρ(A)<1;
v) lim
n→∞Anx= 0, para todox.
A demonstrac¸˜ao deste teorema pode ser encontrada em [3] p´ag. 14.
Agora vamos abordar alguns conceitos de c´alculo que s˜ao utilizados para anal- isar os pontos cr´ıticos de uma func¸˜ao. Primeiramente para uma vari´avel e em seguida para n vari´aveis. Mas antes vamos considerar algumas definic¸˜oes que ser˜ao necess´arias durante o processo.
Definic¸˜ao 1.12. SejaAuma matrizn×n ex∈Rn, ent˜ao uma forma quadr´atica f(x) =xtAx ´e classificada como uma das seguintes:
1)Positiva definida sef(x)>0para todox6= 0;
2)Positiva semidefinida sef(x)≥0para todox;
3)Negativa definida sef(x)<0para todox6= 0;
4)Negativa semidefinida sef(x)≤0para todox;
5)Indefinida sef(x)assume tanto valores positivos quanto negativos.
Uma matriz sim´etricaA´e chamada de positiva definida, positiva semidefinida, negativa definida, negativa semidefinida ou indefinida se a forma quadr´aticaf(x) = xtAxtem a propriedade correspondente.
Definic¸˜ao 1.13. Sejay =f(x)uma func¸˜ao de uma vari´avel, sex∈R, ent˜ao, um pontox0 ´e denominadoponto cr´ıticodef sef0(x) = 0.
Teorema 1.4. Suponha quef00seja cont´ınua na proximidadex.
a)Sef00(x0)>0, ent˜aox0 ´eponto de m´ınimo;
b)Sef00(x0)<0, ent˜aox0 ´eponto de m´aximo;
c)Sef00(x0) = 0, ent˜aox0 ´eponto de inflex˜ao.
Definic¸˜ao 1.14. Um ponto P = (x1, x2,· · · , xn)t tal que o grad f(P) = 0 ´e denominado ponto cr´ıtico def.
SejaAa matriz cujos elementos(aij) =∂x∂2f
i∂xj isto ´e:
A(P) =
∂2f
∂x12 ∂2f
∂x1∂x2 · · · ∂x∂12∂xf
∂2f n
∂x2∂x1
∂2f
∂x22 · · · ∂x∂2f
2∂xn
...
∂2f
∂xn∂x1
∂2f
∂xn∂x2 . . . ∂x∂2f
n2
.
Teorema 1.5. Suponha queA(P)seja cont´ınua na proximidade deP. Ent˜ao:
a)SeA(P):positiva definida, ent˜aoP ´eponto de m´ınimo; b)SeA(P):negativa definida, ent˜aoP ´eponto de m´aximo;
c)SeA(P): indefinida, ent˜aoP ´eponto de sela.
Cap´ıtulo 2
M´etodos Iterativos
O objetivo deste cap´ıtulo ´e inicialmente desenvolver a construc¸˜ao dos m´etodos iterativos de Jacobi, Gauss-Seidel, Gradiente e Gradiente Conjugado. Em seguida, apresentaremos resultados que garantem a convergˆencia dos m´etodos desenvolvi- dos.
2.1 Processos Estacion´arios
Umm´etodo iterativo ´e estacion´ariose cada aproximante da soluc¸˜ao ´e obtido do anterior sempre pelo mesmo processo. Como j´a afirmamos na introduc¸˜ao desse trabalho os m´etodos estacion´arios abordados nesse trabalho ser˜ao: o m´etodo de Jacobi, o m´etodo de Gauss-Seidel e o m´etodo de Gradiente.
Considere o sistema linearAx=b, em queA´e uma matriz quadrada de ordem n,x´e um vetorn×1eb ´e um vetorn×1.
Suponha que esse sistema seja transformado (de forma equivalente) em:
¯
x=Tx¯+c (2.1)
em queT =I −Aec=b.
A matrizT ´e uma matriz quadrada de ordemnec´e um vetorn×1, de maneira que a soluc¸˜aoxde (2.1) ´e, tamb´em, soluc¸˜ao deAx =b.
Partindo de uma aproximac¸˜aox(0), obtemos as aproximac¸˜oes sucessivasx(k) para a soluc¸˜ao desejadax, usando o processo iterativo estacion´ario definido por:
x(k) =T x(k−1)+c, k = 1,2,· · · . (2.2)
Se a sequˆencia x(k) converge para a soluc¸˜ao x ent˜ao esta coincide com a soluc¸˜ao x de Ax = b. Nesse caso passando-se o limite em (2.2) em ambos os membros temos que
x=T x+c.
Ent˜aoxtamb´em ´e soluc¸˜ao do sistemaAx=b.
O resultado a seguir ´e utilizado no pr´oximo teorema, que fornece a condic¸˜ao necess´aria e suficiente para a convergˆencia da sequˆenciax(k).
Lema 2.1. Se o raio espectralρ(T)satisfazρ(T)<1, ent˜ao(I −T)−1 existe e (I−T)−1 =I+T +T2+· · ·=
∞
X
j=0
Tj Esta demonstrac¸˜ao pode ser encontrada em[3]p´ag.422.
Teorema 2.1. Para qualquerx(0) ∈Rn, a sequˆenciax(k)definida por x(k) =T x(k−1)+c, para cada k ≥1,
converge para a soluc¸˜aox¯=Tx¯+cse e somente seρ(T)<1.
Demonstrac¸˜ao. (⇐)Suponhaρ(T)<1. Ent˜ao:
x(k) =T x(k−1)+c
=T(T x(k−2)+c) +c
=T2x(k−2)+ (T +I)c
=T2(T x(k−3)+c) + (T +I)c
=T3x(k−3)+ (T2+T +I)c.
x(k) =Tkx(0)+ (T(k−1)+· · ·+T +I)c.
Comoρ(T)<1, pelo Teorema 1.3, temos que:
k→∞lim Tkx(0) = 0 O Lema 2.1 implica que:
k→∞lim x(k) = lim
k→∞[T(k)x(0)+ (T(k−1)+· · ·+T + 1)c] =
= 0 +
∞
X
j=0
Tjc= (I−T)−1c.
Assim a sequˆenciax(k) converge para o vetorx¯= (I−T)−1cex¯=Tx¯+c.
(⇒) Considere z ∈ Rn, se lim
k→∞Tkz = 0, ent˜ao, pelo Teorema 1.3, isto ´e equivalente aρ(T)<1.
Sejaz um vetor arbitr´ario e x¯ a soluc¸˜ao ´unica dex¯ = Tx¯+c, pois se tiver mais de uma soluc¸˜ao n˜ao seria convergente. Definax(0) = ¯x−z e, parak ≥ 1, x(k) =T x(k−1)+c.
Ent˜aox(k)converge parax.¯
Al´em dissox¯−x(k) = (Tx¯−c)−(T x(k−1)+c) =T(¯x−x(k−1)), desta forma obtemos que:
¯
x−x(k)=T(¯x−x(k−1)) =T(T(¯x−x(k−2))) = T2(¯x−x(k−2)) =Tk(¯x−x(0)) =
=Tkz Logo lim
k→∞Tkz = lim
k→∞Tk(¯x−x(0)) = 0.
Comoz ∈Rnera arbitr´ario ent˜aoT ´e uma matriz convergente e segue queρ(T)<
1.
Essa demonstrac¸˜ao ´e apresentada em[3]p´ag. 423.
Em geral ´e dif´ıcil verificar o Teorema 2.1. Entretanto, podemos obter uma condic¸˜ao suficiente que a matriz T deve satisfazer para assegurar a convergˆencia do processo iterativo definido por (2.1). Enunciaremos a seguir tal condic¸˜ao em um corol´ario.
Corol´ario 2.1. O processo iterativo definido porx(k)=T x(k−1)+c´e convergente se, para qualquer norma de matrizes,kTk<1.
Demonstrac¸˜ao. Vamos introduzir o vetor erroe(k)para estudar a convergˆencia da sequˆenciax(k) para a soluc¸˜aoxdeAx =b, ent˜ao considere:
e(k) = ¯x−x(k) Subtraindo de (2.1) membro a membro (2.2) obtemos:
¯
x−x(k)=T(¯x−x(k−1)) +c−c
e(k)=T e(k−1) (2.3)
Donde podemos escrever quee(k−1) =T e(k−2)e substituindo em (2.3) temos:
e(k) =T(T e(k−2)) = T2e(k−2) e(k) =T2e(k−2)
e assim, por aplicac¸˜oes sucessivas, segue que:
e(k) =Tke(0) (2.4)
em quee(0) ´e o erro inicial. Tomando norma de matriz na express˜ao (2.4), segue que:
ke(k)k=kTk.e(0)k ≤ kTkk.ke(0)k Portantoke(k)k ≤ kTkk.ke(0)k.
SekTk<1, teremos que
ke(k)k=kx−x(k)k →0
se kTk < 1, para alguma norma de matriz, ent˜ao temos garantida a con- vergˆencia do processo iterativo definido inicialmente.
Demonstrac¸˜ao apresentada em[4]p´ag. 169.
2.1.1 M´etodo de Jacobi
Considere o sistema linear,Ax=bde ordemn, comaii6= 0,
a11x1 +a12x2+· · ·+a1nxn =b1
a21x1 +a22x2+· · ·+a2nxn =b2 ...
an1x1+an2x2+· · ·+annxn =bn
(2.5)
Isolandoxmediante a separac¸˜ao pela diagonal temos:
x1 = a1
11(b1−a12x2−a13x3− · · · −a1nxn) x2 = a1
22(b2−a21x1−a23x3− · · · −a2nxn) ...
xn= a1
nn(bn−an1x1−an2x2− · · · −an,n−1xn−1)
(2.6)
Para o sistema linear (2.5), o m´etodo de Jacobi consiste em dado uma aproximac¸˜ao inicial x(0) = (x(0)1 , x(0)2 ,· · · , x(0)n )t e uma tolerˆancia, gera-se uma sequˆencia de vetores
(x(k)1 , x(k)2 ,· · · , x(k)n )t, k = 1,2,3,· · · ,
que converge para a soluc¸˜ao exata, atrav´es do processo iterativo definido por:
x(k+1)1 = a1
11(b1−a12x(k)2 −a13x(k)3 − · · · −a1nx(k)n ) x(k+1)2 = a1
22(b2−a21x(k)1 −a23x(k)3 − · · · −a2nx(k)n ) ...
x(k+1)n = a1
nn(bn−an1x(k)1 −an2x(k)2 − · · · −an,n−1x(k)n−1)
(2.7)
Agora vamos escrever o m´etodo de outra maneira. Seja a matrizA=L+D+ U em que:
L=matriz triangular inferior formada pela parte inferior (abaixo da diagonal) da matrizA;
D=matriz diagonal formada pela diagonal da matrizA;
U =matriz triangular superior formada pela parte superior (acima da diagonal) da matrizA.
Ent˜ao escrevemos o sistema linearAx=bcomo (L+D+U)x=b Dx= (−L−U)x+b x=D−1(−L−U)x+D−1b
x=T x+c em queT =D−1(−L−U)ec=D−1b.
Determinando a seq¨uˆencia de aproximac¸˜oes(x(k)1 , x(k)2 ,· · · , x(k)n ),k = 1,2,3,· · · temos:
x(k+1) =T x(k)+c. (2.8)
Resumindo:
1)Escolhe-se uma aproximac¸˜ao inicialx(0)e dado >0eM, em queM ∈N∗
´e o n´umero m´aximo de iterac¸˜oes euma tolerˆancia.
2)Geram-se aproximac¸˜oes sucessivas dex(k) a partir do sistema (2.8).
3)Continua-se a gerar aproximac¸˜oes at´e que um dos crit´erios abaixo seja sat- isfeito:
a)kx(k+1)−x(k)k< ou b)k > M.
Observac¸˜ao 2.1. Na pr´atica n˜ao efetuamos as iterac¸˜oes com base em (2.8), mas sim em (2.7). A iterac¸˜ao definida por (2.8) tem fins puramente te´oricos para anal- isar a convergˆencia do m´etodo.
2.1.2 M´etodo de Gauss-Seidel
Seja o sistema linear Ax = b, isolando x mediante a separac¸˜ao da diagonal obtemos um sistema como (2.6). O m´etodo iterativo de Gauss-Seidel consiste no
seguinte fato: a partir de uma aproximac¸˜ao inicial x(0) = (x(0)1 , x(0)2 ,· · · , x(0)n )t, obter-se uma sequˆencia
(x(k)1 , x(k)2 ,· · · , x(k)n )t, k = 1,2,3,· · · , atrav´es do processo iterativo definido por:
x(k+1)1 = a1
11(b1−a12x(k)2 −a13x(k)3 − · · · −a1nx(k)n ) x(k+1)2 = a1
22(b2−a21x(k+1)1 −a23x(k)3 − · · · −a2nx(k)n ) ...
x(k+1)n = a1
nn(bn−an1x(k+1)1 −an2x(k+1)2 − · · · −an,n−1x(k+1)n−1 )
(2.9)
Aqui temos que na iterac¸˜aok+ 1j´a utilizamos os valores das coordenadas do vetorx(k+1) calculados.
Considere novamente o sistema linearAx=bcomo:
(L+D+U)x=b (L+D)x=−U x+b multiplicando porD−1temos
(L∗+I)x=−U∗x+b∗, em que,L∗ =D−1L,U∗ =D−1U,b∗ =D−1b.
Determinando a seq¨uˆencia de aproximac¸˜oes(x(k)1 , x(k)2 ,· · · , x(k)n )t, k= 1,2,3,· · · temos:
(L∗+I)x(k+1) =−U∗x(k)+b∗ x(k+1) =−(L∗+I)−1U∗x(k)+ (L∗+I)−1b∗ TomandoT =−(L∗+I)−1U∗ec= (L∗+I)−1b∗obtemos:
x(k+1) =T x(k)+c (2.10)
Resumindo temos:
1)Escolhe-se uma aproximac¸˜ao inicialx(0) e dado > 0eM ∈ N∗, em que M ´e o n´umero m´aximo de iterac¸˜oes euma tolerˆancia.
2)Geram-se aproximac¸˜oes sucessivas dex(k) a partir do sistema (??).
3)Continua-se a gerar aproximac¸˜oes at´e que um dos crit´erios abaixo seja sat- isfeito:
a)kx(k+1)−x(k)k< ou b)k > M.
Observac¸˜ao 2.2. Assim como no m´etodo de Jacobi, n˜ao efetuamos as iterac¸˜oes com base em (2.10), mas sim, usando (2.9). Desse modo n˜ao ´e necess´ario inverter a matriz(L∗+I).
2.1.3 Convergˆencia dos M´etodos
Considere o sistemaAx=bna sua forma
¯
x=Tx¯+c com a iterac¸˜ao definida por:
x(k+1) =T x(k)+c, k= 1,2,3,· · · (2.11) Sejae(k), o erro na k-´esima iterac¸˜ao, isto ´e,
e(k) =x(k)−x¯=⇒x(k) =e(k)+ ¯x parak+ 1temos:
x(k+1) =e(k+1)+ ¯x.
Substituindo em (2.11) segue:
e(k+1)+ ¯x=T(e(k)+ ¯x) +c, k = 1,2,· · · e(k+1) =T e(k)+Tx¯+c−x¯
comox¯=Tx¯+c, assim
e(k+1) =T e(k).
Teorema 2.2. ´E condic¸˜ao suficiente para que a iterac¸˜ao (2.11) convirja, que os elementostij deT satisfac¸am a desigualdade
n
X
i=1
|tij| ≤L <1,∀ j = 1,2,3,· · ·, n, qualquer que seja a aproximac¸˜ao inicialx(0).
Demonstrac¸˜ao. Escrevendoe(k+1) =T e(k)na sua forma expandida, tem-se:
e(k+1)1 =t11e(k)1 +t12e(k)2 +· · ·+t1ne(k)n e(k+1)2 =t21e(k)1 +t22e(k)2 +· · ·+t2ne(k)n ...
e(k+1)n =tn1e(k)1 +tn2e(k)2 +· · ·+tnne(k)n
Tomando os m´odulos em ambos os lados e aplicando a desigualdade triangu- lar, tem-se:
|e(k+1)1 | = |t11e(k)1 +t12e(k)2 +· · ·+t1ne(k)n | ≤ |t11||e(k)1 |+|t12||e(k)2 |+· · ·+
|t1n||e(k)n |
|e(k+1)2 | = |t21e(k)1 +t22e(k)2 +· · ·+t2ne(k)n | ≤ |t21||e(k)1 |+|t22||e(k)2 |+· · ·+
|t2n||e(k)n |
...
|e(k+1)n |=|tn1e(k)1 +tn2e(k)2 +· · ·+tnne(k)n | ≤ |tn1||e(k)1 |+|tn2||e(k)2 |+· · ·+
|tnn||e(k)n |.
Agora somando membro a membro, obt´em-se:
n
X
i=1
|e(k+1)i | ≤
n
X
i=1
|e(k)1 ||ti1|+|e(k)2 |
n
X
i=1
|ti2|+· · ·+|e(k)n |
n
X
i=1
|tin|.
Den
X
i=1
|tij| ≤L <1, paraj = 0,1,· · · , ntemos
n
X
i=1
|e(k+1)i | ≤ |e(k)1 |L+|e(k)2 |L+· · ·+|e(k)n |L Ou seja:
n
X
i=1
|e(k+1)i | ≤L
n
X
i=1
|e(k)i | (2.12)
Se k=0 em (2.12)
n
X
i=1
|e(1)i | ≤L
n
X
i=1
|e(0)i | (2.13)
Se k=1 em (2.12)
n
X
i=1
|e(2)i | ≤L
n
X
i=1
|e(1)i | Por (2.13)
n
X
i=1
|e(2)i | ≤L2
n
X
i=1
|e(0)i | (2.14)
Se k=2 em (2.12)
n
X
i=1
|e(3)i | ≤L
n
X
i=1
|e(2)i | Por (2.14)
n
X
i=1
|e(3)i | ≤L3
n
X
i=1
|e(0)i | De modo geral temos
n
X
i=1
|e(k+1)i | ≤L(k+1)
n
X
i=1
|e(0)i |
Como0< L <1, segue que
k→∞lim
n
X
i=1
|e(k+1)i | ≤ lim
k→∞L(k+1)
n
X
i=1
|e(0)i |=
n
X
i=1
|e(0)i | lim
k→∞L(k+1) = 0 Logo lim
k→∞
n
X
i=1
|e(k+1)i |= 0.
Demonstrac¸˜ao apresentada em[1]p´ag.66.
Corol´ario 2.2. (Crit´erio das Linhas): ´E condic¸˜ao suficiente para que a iterac¸˜ao x(k+1) =T x(k)+cconvirja, que
|tii|>
n
X
j = 1 i6=j
|tij|, parai= 1,2,· · · , n (2.15)
Demonstrac¸˜ao. •Para o m´etodo de Jacobi, temos que,
n
X
i=1
|tij|= (|t1j|+|t2j|+· · ·+|tj−1,j|+|tj+1,j|+· · ·+|tnj|)
|tjj| ,
paraj = 1,2,· · · , n.
De (2.15) obtemos que,
n
X
j= 1 i6=j
|tij|
|tii|<1.
Segue pelo Teorema 2.2 que a iterac¸˜aox(k+1) =T x(k)+cconverge.
•Para o m´etodo de Gauss-Seidel a prova encontra-se em[8]p´ag.240.
A matriz que satisfaz as hip´oteses do crit´erio das linhas ´e chamadadiagonal dominante estrita.
Teorema 2.3. ´E condic¸˜ao suficiente, para que a iterac¸˜ao definida por x(k+1) = T xk+cconvirja, que os elementostij deT satisfac¸am a desigualdade:
n
X
j=1
|tij| ≤L <1, parai= 1,2,3,· · ·, n, qualquer que seja a aproximac¸˜ao inicialx(0).
Corol´ario 2.3. (Crit´erio das Colunas) ´E condic¸˜ao suficiente para que a iterac¸˜ao x(k+1) =T x(k)+cconvirja, que
|ajj|> X j = 1
i6=j
|aij|, paraj = 1,2,· · · , n.
A demonstrac¸˜ao para o m´etodo de Jacobi ´e an´aloga ao Corol´ario 2.2 e para o m´etodo de Gauss-Seidel encontra-se em[8]p´ag. 240.
Na pr´atica s˜ao usados apenas os corol´arios para verificar a convergˆencia dos m´etodos. Note ainda que basta apenas um dos crit´erios ser satisfeito para garantir a convergˆencia.
2.2 Processos de Relaxac¸˜ao
Nesta sec¸˜ao introduziremos alguns m´etodos iterativos para resolver sistemas lineares conhecidos como processos de relaxac¸˜ao. Seja o sistema linearAx+b= 0em queA´e uma matriz sim´etrican×npositiva definida,xebs˜ao vetoresn×1.
Considere que o sistema possui uma ´unica soluc¸˜ao.
Sejav uma aproximac¸˜ao da soluc¸˜ao, ent˜ao, r=Av+b
r ´e o vetor res´ıduo que indica o quanto a aproximac¸˜ao da soluc¸˜ao ”falha”em sat- isfazer o sistema. O objetivo do processo de relaxac¸˜ao ´e que o res´ıduo se anule, ou seja, quevseja a soluc¸˜ao do sistema.
Para que isto ocorra considere a func¸˜ao quadr´atica:
F(v) = 1
2hAv, vi+hb, vi (2.16)
em queA= (aij)´e uma matriz sim´etrica,v = (v1, v2,· · · , vn)t,b = (b1, b2,· · · , bn)t. A id´eia ´e calcular as derivadas parciais deF(v)(em relac¸˜ao avi) e obtermos que gradF(v) = 0, assim vamos ter que o res´ıduo se anula, pois gradF(v) = Av+b =r, conforme vamos mostrar.
Calculando os produtos escalares da func¸˜ao quadr´atica, temos que, F(v) = 1
2
n
X
i,j=1
aijvivj +
n
X
i=1
bivi. Pois,
Av=
a11 a12 · · · a1n a21 a22 · · · a2n
...
v1 v2
...
=
a11v1+a12v2+· · ·+a1nvn a21v1+a22v2+· · ·+a2nvn
...
,
de onde segue que,
hAv, vi=a11v12+a12v1v2+· · ·+a1nv1vn+ a21v2v1+a22v22+· · ·+a2nv2vn+
...
an1vnv1+an2vnv2 +· · ·+annv2n=
=
n
X
i=1 n
X
j=1
aijvivj =
n
X
i,j=1
aijvivj. Al´em disso,
hb, vi=b1v1+b2v2+· · ·+bnvn =
n
X
i=1
bivi. Diferenciando cada um dos termos deF(v)temos,
∂
n
X
i,j=1
aijvivj
∂vi =
= 2a11v1+a12v2+· · ·+a1ivi+· · ·+a1nvn+ +ai1v1+ai2v2+· · ·+ 2aiivi+· · ·+a1nvn+
...
+an1v1+an2v2+· · ·+anivi+· · ·+ 2annvn=
= 2
n
X
j=1
aijvj poisA´e sim´etrica.
E temos tamb´em
∂
n
X
i=1
bivi
∂vi =b1+b2 +· · ·+bn =bi
Logo
∂F(v)
∂vi
= 1 22
n
X
j=1
aijvj+bi =
n
X
j=1
aijvj+bi, para i = 1,2,· · ·, n.
Portanto,
grad F(v) = 0 ⇔ ∂F(v)
∂vi = 0, i = 1,2,· · ·, n
⇔
n
X
j=1
aijvj+bi = 0, i= 1,2,· · · , n.
Desta forma, seguegrad F(v) = 0e temosAv+b = 0, poisXn
j=1
aijvj +bi = Av+b. Logo sev =x, ondex ´e a soluc¸˜ao, devemos ter ograd F(v) = 0. Note que nos vetores que n˜ao s˜ao soluc¸˜ao, o gradiente representa o res´ıduo, ou seja, grad F(v) =r.
Teorema 2.4. O problema de determinar a soluc¸˜ao do sistema linearAx+b= 0, em queA ´e sim´etrica positiva definida, ´e equivalente ao problema de determinar o ponto de m´ınimo deF(v) = 12hAv, vi+hb, vi.
Demonstrac¸˜ao. Evidentemente que P = (x1, x2,· · · , xn)t ´e ponto de m´ınimo de F se e somente se P ´e soluc¸˜ao do sistema Ax+b = 0, pois, seP ´e ponto estacion´ario de F, ent˜aograd F(v) = 0 ⇒r = 0assimP ´e soluc¸˜ao do sistema Ax+b= 0. Resta provar queF tem um ´unico ponto estacion´ario e que este ponto
´e de m´ınimo.
Temos quev ´e ponto de m´ınimo de F se e somente segrad F(v) = 0, isto ´e, se e somente se:
n
X
j=1
aijvj +bi = 0 , para i= 1,2,· · · , n.
Como o sistema admite uma ´unica soluc¸˜ao temos que o ponto estacion´ario ´e
´unico, assim
∂2F
∂vi2(v) =a11,· · ·, ∂2F
∂vi∂vj
(v) =aij
temos queA = (vij). Como por hip´oteseA ´e positiva definida, ent˜ao pelo resul- tado na p´ag.13no primeiro cap´ıtulo temos quev ´e ponto de m´ınimo.
Demonstrac¸˜ao apresentada em[4]p´ag.183.
Os m´etodos de relaxac¸˜ao s˜ao usados apenas para sistemas lineares onde a matriz dos coeficientes ´e positiva definida, caso isso n˜ao acontec¸a os m´etodos de relaxac¸˜ao n˜ao convergem.
2.2.1 Princ´ıpios B´asicos do Processo de Relaxac¸˜ao
A base do princ´ıpio geral de relaxac¸˜ao ´e determinar o ponto de m´ınimo da func¸˜ao quadr´atica F(v) = 12hAv, vi +hb, vi. Para isso comec¸amos com uma aproximac¸˜ao para a soluc¸˜aov, selecionamos uma direc¸˜ao pe corrigimosv nesta direc¸˜ao, com o objetivo de minimizarF(v), e continuamos o processo at´e atingir o ponto de m´ınimo. Desta forma anularemos o res´ıduo na direc¸˜aop.
Variandovna direc¸˜aoptomamos
v0 =v+tp,
assim temos que encontrar o parˆametro t de modo que a func¸˜aoF atinge o seu min´ımo nesta direc¸˜ao. Vamos determinar o min´ımo de F na direc¸˜ao p. Temos ent˜ao:
F(v0) = 1
2hAv0, v0i+hb, v0i
= 1
2hA(v+tp), v+tpi+hb, v+tpi
= 1
2[hAv, vi+hAv, tpi+hAtp, vi+hAtp, tpi] +hb, vi+hb, tpi
= 1
2[hAv, vi+ 2hb, vi+ 2thAv, pi+t2hAp, pi] +thb, vi
=F(v) + 1
2[t2hAp, pi+ 2thAv, pi+ 2thb, pi]
=F(v) + t2
2hAp, pi+ 1
2[2t(hAv, pi+hb, pi)]
=F(v) + t2
2hAp, pi+thAv+b, pi comor=Av+btemos
=F(v) + t2
2hAp, pi+thr, pi que ´e uma func¸˜ao quadr´atica do parˆametrot.
O parˆametrot ´e selecionado de tal forma queF ´e m´ınimo dentro do conjunto examinado, onde a condic¸˜ao para que isto acontec¸a ´e:
∂F
∂t(v0) = ∂
∂t[F(v) + t2
2hAp, pi+thr, pi] = 0
⇒thAp, pi+hr, pi= 0logo
t = −hr, pi hAp, pi.
Como ∂2F
∂t2 (v0) =hAp, pi>0,
pois A ´e positiva definida, temos que t ´e m´ınimo como foi visto na p´ag. 13do Cap´ıtulo 1.
Segue
tmin = −hr, pi hAp, pi.
Se a direc¸˜ao p da relaxac¸˜ao for ortogonal ao do res´ıduo r, ent˜ao ter´ıamos tmin = 0e assim n˜ao haver´a melhora na aproximac¸˜ao da soluc¸˜ao.
Teorema 2.5. Para o ponto de m´ınimov0, com t = tmin, o novo res´ıduo r0 = Av0+b ´e ortogonal `a direc¸˜aopda relaxac¸˜ao.
Demonstrac¸˜ao. Temos que
r0 =Av0+b=A(v+tp) +b=Av+b+Atp=r+tAp.
Portanto
hr0, pi=hr+tAp, pi=hr, pi+thAp, pi.
Parat=tmin
hr0, pi=hr, pi − hr, pi
hAp, pihAp, pi=hr, pi − hr, pi= 0.
Logor0 eps˜ao ortogonais.
Esta demonstrac¸˜ao esta apresentada em[4]p´ag.185.
2.2.2 M´etodo dos Gradientes
SejaAx =b, comAsim´etrica positiva definida. Vimos anteriormente que a soluc¸˜ao do sistema linear coincide com o ponto de m´ınimo da func¸˜ao quadr´atica F(v). Agora vamos definir a direc¸˜aop(k)por,
p(k) =−r(k−1), para k = 1,2,· · · , (2.17) de forma que esta direc¸˜ao ´e dirigida para este ponto de m´ınimo. Ent˜ao vamos reescrever otminutilizando a direc¸˜aop(k).
t = −hr, pi
= −hr(k−1), p(k)i
= hr(k−1), r(k−1)i
Assim temos que:
v(k) =v(k−1)+tp(k) v(k) =v(k−1)−tminr(k−1). e que
r(k)=Av(k)+b
r(k)=A(v(k−1)−tminr(k−1)) +b r(k)=Av(k−1)+b−tminAr(k−1)
r(k) =r(k−1)−tminAr(k−1).
Resumindo temos: dadov(0), uma tolerˆancia >0, e umM ∈ N∗, o m´etodo dos Gradientes consiste em:
a)r(0) =Av(0)+b b)parak = 1,2,· · · b1)tmin = hArhr(k−1)(k−1),r,r(k−1)(k−1)ii
b2)v(k) =v(k−1)−tminr(k−1) b3)r(k)=r(k−1)−tminAr(k−1)
b4)Sekv(k)−v(k−1)k< ou sek≥M, fim, sen˜aob)novamente.
2.2.3 M´etodo dos Gradientes Conjugados
Este ´e outro m´etodo de relaxac¸˜ao, que iremos apresentar agora, mas para isso precisamos considerar a seguinte definic¸˜ao:
Definic¸˜ao 2.1. Dada uma matriz positiva definida A, p(k)e p(k−1) s˜ao direc¸˜oes conjugadas se
hAp(k), p(k−1)i=hp(k), Ap(k−1)i= 0.
O primeiro passo deste m´etodo ´e igual ao primeiro passo do m´etodo dos Gra- dientes.
Agora escolhap(k), que ´e a direc¸˜ao de relaxac¸˜ao, como uma combinac¸˜ao linear der(k−1)ep(k−1), da seguinte forma:
p(k) =−r(k−1)+αk−1p(k−1), para k = 1,2,3,· · · . (2.18) Precisamos determinar o parˆametroαk−1 que ser´a obtido atrav´es das direc¸˜oes conjugadas. Como
hp(k), Ap(k−1)i= 0,
de (2.18) obtemos que
h−r(k−1)+αk−1p(k−1), Ap(k−1)i= 0
−hr(k−1), Ap(k−1)i+αk−1hp(k−1), Ap(k−1)i= 0, logo
αk−1 = hr(k−1), Ap(k−1)i hp(k−1), Ap(k−1)i.
Agora vamos determinar a sequˆencia de aproximac¸˜oes para a soluc¸˜ao:
v(k) =v(k−1)+qkp(k) (2.19)
em que
qk= −hr(k−1), p(k)i hAp(k), p(k)i .
Subtituimos (2.19) no res´ıduo, que ´e dado porr(k) =Av(k)+bobtemos, r(k) =A(v(k−1)+qkp(k)) +b
r(k) =r(k−1)+qkAp(k). (2.20)
Observac¸˜ao 2.3. O res´ıduo de cada passo, possui as seguintes propriedades:
a)hr(k), r(k−1)i= 0;
Temos que, substituindo emr(k−1)por (2.17) e pelo Teorema 2.5 segue que res´ıduos consecutivos s˜ao ortogonais:
hr(k), r(k−1)i=−hr(k), p(k)i= 0, k = 1,2,· · · . b)hr(k), p(k)i= 0;
Substituindo p(k) pela express˜ao (2.17) e pelo resultado da Observac¸˜ao 2.1 item a) temos:
hr(k), p(k)i=−hr(k), r(k−1)i= 0, k = 1,2,· · · .
Com estas propriedades obtemos algumas simplificac¸˜oes nas f´ormulas deqke αk−1.
Primeiramente temos
qk = −hr(k−1), p(k)i hAp(k), p(k)i substituindop(k), no numerador por (2.18) obtemos:
=hr(k−1), r(k−1)i −αk−1hr(k−1), p(k−1)i da Observac¸˜ao 2.1 item b) temos quehr(k−1), p(k−1)i= 0assim:
−hr(k−1), p(k)i=hr(k−1), r(k−1)i logo
qk= hr(k−1), r(k−1)i hAp(k), p(k)i . Agora vamos simplificar a express˜ao de
αk−1 = hr(k−1), Ap(k−1)i hp(k−1), Ap(k−1)i. primeiramente de (2.20) obtemos
Ap(k−1) = 1 qk−1
(r(k−1)−r(k−2)).
SubstituindoAp(k−1) no numerador deαk−1temos:
hr(k−1), Ap(k−1)i=hr(k−1), 1
qk−1(r(k−1)−r(k−2))i=
= 1 qk−1
hr(k−1), r(k−1)i − 1 qk−1
hr(k−1), r(k−2)i da Observac¸˜ao 2.1 item a) temos quehr(k−1), r(k−1)i= 0, segue:
hr(k−1), Ap(k−1)i= 1 qk−1
hr(k−1), r(k−1)i. (2.21)
Agora substituindoAp(k−1)no denominador deαk−1 temos:
hp(k−1), Ap(k−1)i=hp(k−1), 1 qk−1
(r(k−1)−r(k−2))i=
= 1 qk−1
hp(k−1), r(k−1)i − 1 qk−1
hp(k−1), r(k−2)i pela Observac¸˜ao 2.1 item b)hp(k−1), r(k−1)i= 0segue que:
hp(k−1), Ap(k−1)i=− 1 qk−1
hp(k−1), r(k−2)i. (2.22) Agora substituimosp(k−1) por(2.18)temos: