Desta forma,
ckx¯k−ξ¯k ≤ c2k¯xk−1−ξ¯k2
= [ckx¯k−1−ξ¯k]2
≤ [ckx¯k−2−ξ¯k]4≤. . .≤[ckx¯0−ξ¯k]2k.
Portanto,
kx¯k−ξ¯k ≤ 1
c[ckx¯0−ξ¯k]2k,
isto ´e, o m´etodo de Newton ´e convergente com velocidadeq2k, ondeq <1 para toda boa aproxima¸c˜ao inicial. O teorema est´a demonstrado.
Aqui, ∆ ´e uma matriz e ¯εe ¯δs˜ao vetores. Considerando queA¯x= ¯b, por (2), obtemos
A¯ε+ ∆¯x+ ∆¯ε= ¯δ e, assim,
¯
ε=A−1(¯δ−∆¯x−∆¯ε).
Portanto,
kε¯k ≤ kA−1k kδ¯k+kA−1k k∆k kx¯k+kA−1k k∆k kε¯k.
Supondo que kA−1k k∆k < 1, isto ´e, que os erros dos elementos de A s˜ao suficientemente pequenos, obtemos
kε¯k ≤ kA−1k kδ¯k+kA−1k k∆k kx¯k 1− kA−1k k∆k .
QuandoA´e dada precisamente ou, equivalentemente, quando ∆ = 0, temos (3) kε¯k ≤ kA−1k k¯δk.
Ent˜ao, o incremento ¯εda solu¸c˜ao ´e limitado pelas pertuba¸c˜oes ∆ e ¯δdos dados e depende essencialmente da norma da matriz inversa.
Aqui, ¯δ,∆ e ¯ε s˜ao os valores absolutos dos erros. Mas, eles n˜ao d˜ao uma no¸c˜ao clara da situa¸c˜ao. Por exemplo, sek∆k= 1, esta pertuba¸c˜ao ´e grande ou n˜ao? Depende da norma kAk. SekAk= 106, a pertuba¸c˜ao ´e desprez´ıvel, mas se kAk = 10−3, a pertuba¸c˜ao ´e catastr´ofica. Por isto, quando investigamos o erro consideramos os incrementos relativos
kε¯k
k¯xk, k∆k kAk, k¯δk
k¯bk.
Vamos obter limites para estes incrementos relativos. Para este prop´osito, pre- cisaremos da seguinte desigualdade.
Teorema 52 Seja a norma matricialk·kcompat´ıvel com a norma vetorialk·k. Ent˜ao, a desigualdade
kx¯k
kA−1k ≤ kA¯xk ≤ kAk kx¯k vale para toda matriz regularAe todo vetor x.¯
Demonstra¸c˜ao. A segunda desigualdade mostra que a norma matricial e a norma vetorial s˜ao compat´ıveis. A desigualdade `a esquerda ´e consequˆencia de
kx¯k=kA−1Ax¯k ≤ kA−1k · kA¯xk.
Vamos investigar agora a influˆencia das pertuba¸c˜oes dos dados sobre a solu¸c˜ao, em duas situa¸c˜oes t´ıpicas.
Seja a solu¸c˜ao ¯ξ do sistema A¯x = ¯b obtida por um m´etodo num´erico de aproxima¸c˜ao. Substituimos ¯xpor ¯ξno lado esquerdo do sistema. ObtemosAξ.¯ SejaAξ¯pr´oximo a ¯b. A pergunta ´e se ¯ξest´a pr´oximo a ¯x. Parece natural que se ¯δ:=Aξ¯−¯b´e pequeno, ¯ε:= ¯ξ−x¯ ser´a pequeno tamb´em. Vamos ver agora se temos raz˜ao para uma tal afirma¸c˜ao.
Temos
δ¯=Aξ¯−¯b=Aξ¯−A¯x=A( ¯ξ−x) =¯ Aε.¯
Logo, ¯ε=A−1δ. Desde que (A¯ −1)−1=A, ent˜ao Lema 1 implica na desigualdade
(4) kδ¯k
kAk ≤ kA−1δ¯k=kε¯k ≤ kA−1k kδ¯k. Analogamente,
(5) k¯bk
kAk ≤ kx¯k=kA−1¯bk ≤ kA−1k k¯bk.
Como consequˆencia de (4) e (5), obtemos o seguinte limite para o erro relativo:
(6) 1
kA−1k kAk kδ¯k k¯bk ≤ kε¯k
k¯xk ≤ kA−1k kAkkδ¯k k¯bk.
O n´umerokA−1k kAk´e chamadon´umero de condi¸c˜ao da matrizAe ´e denotado porcond (A) ou por ν(A). A desigualdade (6) implica que cond (A)≥1 pois, caso o cont´ario, chegar´ıamos em uma contradi¸c˜ao com (6) para kδ¯k 6= 0. Isto pode ser demonstrado tamb´em. De fato, pela igualdadeI=A−1Aobtemos
kIk ≤ kA−1k kAk=cond(A).
Desde que todos os autovalores da matriz identidade I s˜ao iguais a 1, pois o polinˆomio caracter´ıstico deI´e (1−t)n, e toda norma de uma matriz ´e maior do que o valor absoluto de qualquer autovalor (veja (24.5)), ent˜aocond(A)≥1.
A desigualdade (6) mostra que se o n´umero de condi¸c˜ao de A est´a perto de 1, o erro relativo da solu¸c˜ao est´a perto do erro relativo do vetor do lado direito. Ent˜ao, podemos afirmar que seAξ¯est´a pr´oximo a ¯b, ent˜ao ¯ξ´e uma boa aproxima¸c˜ao da solu¸c˜ao ¯xe at´e podemos fornecer um limite para o erro.
As matrizes cujos n´umero de condi¸c˜ao est˜ao pr´oximos a 1 s˜ao chamadasbem condicionadas. Aquelas com n´umeros de condi¸c˜ao , cond (A), muito grandes s˜ao chamadasmal condicionadas. As matrizes mal condicionadas podem causar problemas quando resolvemos o sistema numericamente.
Vamos fornecer um limite inferior melhor para cond (A) atrav´es dos auto- valores deA. Para este prop´osito, vamos denotar porλ1, . . . , λn os autovalores deA, arranjados em ordem crescente de seus m´odulos,
|λ1| ≤. . .≤ |λn|.
Assim, |λ1n|≤. . .≤ |λ11| s˜ao os m´odulos dos autovalores deA−1 e, portanto, (7) cond(A) =kA−1k kAk ≥ |λn|
|λ1|.
Em particular quandoA´e uma matriz sim´etrica, isto ´e, quandoA=AT, temos kAk2=|λn|ekA−1k2=|λ11|. Ent˜ao,
(8) cond (A) =|λn|
|λ1|.
Portanto, o condicionamento das matrizes sim´etricas depende da largura de seu spectrum, isto ´e, do quociente do maior e do menor autovalores.
Vamos considerar mais um caso particular onde aparece o n´umero de condi¸c˜ao da matrizA. Ao inv´ez de resolver o sistemaA¯x= ¯b, resolvemos ˆAξ¯= ¯b onde Aˆ=A+ ∆. Determinemos um limite para a diferen¸ca entre¯xe ¯ξ. Temos
¯
x=A−1¯b = A−1( ˆAξ) =¯ A−1(A+ ˆAnA) ¯ξ
= ξ¯+A−1( ˆA−A) ¯ξ= ¯ξ+A−1∆ ¯ξ.
Assim, obtemos
¯
x−ξ¯=A−1∆ ¯ξ e, desta forma,
kx¯−ξ¯k ≤ kA−1k k∆k kξ¯k=kA−1k kAk k∆k kAk kξ¯k. Finalmente, chegamos em
kx¯−ξ¯k
kξ¯k ≤cond(A) k∆k kAk.
Esta desigualdade mostra que, para matrizes bem condicionadas, pequenas per- tuba¸c˜oes relativas nos elementos da matriz levam a pequenos incrementos na solu¸c˜ao .
Esses exemplos mostram que o n´umero de condi¸c˜ao ´e uma caracter´ıstica importante deA. Para determinar este n´umero temos que saber os valores de kAke dekA−1k. Em geral, o c´alculo das ´ultimas normas n˜ao ´e problema f´acil.
Algumas vezes,cond (A) pode ser estimado atrav´es do seguinte teorema.
Teorema 53 A igualdade 1
cond (A) = min
½ kA−Bk
kAk : B ´e singular
¾
vale para qualquer norma e para toda matriz regularA.
O teorema mostra que o n´umero de condi¸c˜ao caracteriza a distˆancia deA at´e o espa¸co das matrizes singulares B, isto ´e, para as quais detB = 0. N˜ao vamos provar este teorema. Somente mostraremos que
1
cond(A) ≤ kA−Bk
kAk para toda matrizB com detB= 0.
De fato, esta desigualdade ´e equivalente a
(8) 1
kA−1k ≤ kA−Bk.
Desde que detB= 0, ent˜ao existe um vetor n˜ao nulo ¯xtal queBx¯= ¯o. Portanto, kA−Bk kx¯k ≥ kA¯x−Bx¯k=kA¯xk
≥ kx¯k
kA−1k ( pelo Lema 1).
Agora, (8) ´e consequˆencia da ´ultima desigualdade e dekx¯k>0.
A id´eia da maioria dos m´etodos num´ericos para solu¸c˜ao de sistemas lineares
´e a seguinte: transformar a matrizAem uma matrizCcom estrutura espec´ıfica (triangular, banda, sim´etrica) e depois resolver o sistema que corresponde aC.
Algumas vezes, essas transforma¸c˜oes podem levar em um aumento do n´umero de condi¸c˜ao deA. Assim, a matrizAde bem condicionada pode se tornar mal condicionada.
Vamos ver o que acontece, por exemplo, quando transfomamos uma matriz em matriz sim´etrica. Multipliquemos os dois lados da equa¸c˜ao
A¯x= ¯b
pela transposta de A. Obtemos ATA¯x = AT¯b. Este ´e um novo sistema que
´e equivalente ao sistema inicial e que tem matriz sim´etricaC =ATA. Sejam λ1, . . . , λn, com|λ1| ≤. . . ≤ |λn|, os autovalores de A. Vamos supor que A ´e positiva definida, isto ´e, que (A¯x,x)¯ >0 para todo ¯x6= ¯0. Assim, ATA=A2 e λ21, . . .,λ2n s˜ao os autovalores deA2. Consequentemente,
cond(C) = µ|λn|
|λ1|
¶2
= [cond (A)]2.
Mas, uma matriz tem n´umero de condi¸c˜ao 1 se, e somente se, ela ´e m´ultipla da matriz identidade. Portanto, em geral, quandoA 6=I, cond (A)>1 e (9) implica que quando transfomamos a matriz em sim´etrica, o n´umero de condi¸c˜ao de A cresce. Isto mostra que a simetriza¸c˜ao pode estragar o condicionamento deA.
C´ alculo de Autovalores de Matrizes
Autovaloresde uma matrizAs˜ao aqueles n´umerosλ, para os quais a equa¸c˜ao Ax¯=λ¯x
tem solu¸c˜ao n˜ao-nula ¯x. Essas solu¸c˜oes n˜ao-nulas s˜ao chamadasautovetores de A. ´E claro que toda matrizAde dimens˜aon×ntem exatamentenautovalores, que s˜ao as ra´ızes da equa¸c˜ao alg´ebrica
D(λ) := det (A−λI) = 0.
A equa¸c˜aoD(λ) = 0 ´e chamada equa¸c˜ao caracter´ıstica da matrizA. Podemos demonstrar que
D(λ) = (−1)n[λn−σ1λn−1+σ2λn−2− · · ·+ (−1)nσn], onde
σ1 =
n
X
k=1
akk,
σ2 = X
i<k
¯
¯
¯
¯
aii aik
aki akk
¯
¯
¯
¯,
σ3 = X
i<j<k
¯
¯
¯
¯
¯
¯
aii aij aik
aji ajj ajk
aki akj akk
¯
¯
¯
¯
¯
¯ ,
... ... ...
σn = detA.
Para se determinar os coeficientes de D(λ) ´e necess´ario calcular 2n −1 (=
¡n
1
¢+· · ·+¡n
n
¢) determinantes. Parangrande, ´e uma tarefa muito dif´ıcil. Existem outros m´etodos mais simples para a constru¸c˜ao do polinˆomio caracter´ıstico de uma matrizA. Depois de achar o polinˆomio, os seus zeros, que s˜ao os autovalores deA, s˜ao calculados por algum dos m´etodos num´ericos j´a conhecidos.
Agora vamos conhecer um antigo m´etodo universal para a constru¸c˜ao do polinˆomio caracter´ıstico de uma dada matriz.
5.1 M´ etodo de Danilevski
SejaA={aij}ni,j=1 uma matriz dada. Seja
P =
¯
¯
¯
¯
¯
¯
¯
¯
¯
p1 p2 . . . pn−1 pn
1 0 . . . 0 0
... ... · · · ... ...
0 0 . . . 1 0
¯
¯
¯
¯
¯
¯
¯
¯
¯ a correspondente matriz similar de Frobenius, isto ´e,
P =C−1AC,
ondeC´e uma matriz regular. Desde que as matrizes similhantes tˆem as mesmas equa¸c˜oes caracter´ısticas, ent˜ao
det (A−λI) = det (P−λI) =D(λ).
A id´eia do m´etodo de Danilevski ´e transformar a equa¸c˜ao caracter´ıstica det (A− λI) = 0 para a forma normal de Frobenius, isto ´e, da forma
D(λ) =
¯
¯
¯
¯
¯
¯
¯
¯
¯
¯
¯
p1−λ p2 p3 . . . pn
1 −λ 0 . . . 0
0 1 −λ . . . 0
... ... ... . .. ...
0 0 0 . . . −λ
¯
¯
¯
¯
¯
¯
¯
¯
¯
¯
¯ .
Se a equa¸c˜ao caracter´ıstica ´e escrita desta forma, expandindo o determinante com rela¸c˜ao `a primeira coluna, obtemos
D(λ) = (p1−λ)(−λ)n−1−p2(−λ)n−2+p3(−λ)n−3+· · ·+ (−1)n−1pn
= (−1)n[λn−p1λn−1−p2λn−2− · · · −pn].
No m´etodo de Danilevski a matrizA ´e transformada em uma matrizP, que ´e similhante aA, atrav´es de n−1 transforma¸c˜oes de semelhan¸ca que mudam as linhas deA, sucessivamente, come¸cando da ´ultima.
Vamos supor que depois den−ktransforma¸c˜oes de semelhan¸ca obtemos a seguinte matriz, que denotaremos porA tamb´em,
A=
a11 a12 . . . a1k−1 a1k . . . a1n−1 a1n
... ... · · · ... ... · · · ... ... ak1 ak2 . . . akk−1 akk . . . akn−1 akn
0 0 . . . 0 1 . . . 0 0
... ... · · · ... ... · · · ... ...
0 0 . . . 0 0 . . . 1 0
,
cujask+ 1, . . . , n-´esimas linhas coincidem com as deP. Queremos transformar ak-´esima linha (ak1. . . ak,k−1akk. . . akn) para a forma (0. . .1 0. . .0). Para este fim, executemos as seguintes transforma¸c˜oes:
1. Paraak,k−16= 0, dividimos todos os elementos da (k−1)-´esima coluna porak,k−1.
2. Subtraimos da i-´esima coluna a (k−1)-´esima multiplicada poraki, i6= n−1.
Fazendo comI as mesmas transforma¸c˜oes obtemos
Mk=
1 0 . . . 0
0 1 . . . 0
... ... · · · ... mk−1,1 mk−1,2 . . . mk−1,n
... ... · · · ...
0 0 . . . 1
,
onde
mk−1,k−1 = 1 ak,k−1
mk−1,i = − ak,i
ak,k−1, i6=k−1.
Vamos denotar a matriz obtida porB. De acordo com o que j´a foi dito, B = AMk e as k-´esima, . . ., n-´esima linhas de B coincidem com as de P. Para os elementosbij deB achamos
bij = aij−akjai,k−1
ak,k−1
= aij+mk−1,jai,k−1, i= 1, . . . , k, j= 1, . . . , k−2, k, . . . , n, bi,k−1 = ai,k−1
ak,k−1
=ai,k−1mk−1,k−1, i= 1, . . . , k.
A matriz B obtida n˜ao ´e similar a A. Para trasform´a-la em similar vamos multiplic´a-la `a esquerda porMk−1. ObtemosC=Mk−1B=Mk−1AMk.
Podemos mostrar que
Mk−1=
1 0 . . . 0
0 1 . . . 0
... ... · · · ... ak1 ak2 . . . akn
... ... · · · ...
0 0 . . . 0
0 0 . . . 1
→ k−1
De fato, pode-se verificar diretamente queMk−1Mk =I.
Pela f´ormulaC=Mk−1B achamos as express˜oes paracji, cji = bji, j 6=k−1
ck−1,i = ak1b1i+. . .+aknbni, i= 1, . . . , n.
E claro que´ C tem as mesmas linhas, da k-´esima at´e a n-´esima, que as de P. Continuamos a opera¸c˜ao na (k−1)-´esima, . . . , segunda linhas da mesma maneira.
Seak,k−1= 0 na matriz obtida depois den−kpassos, existem duas possi- bilidades:
a) aki6= 0 para algumi < k−1.
Neste caso, permutamos a (k−1)-´esima com ai-´esima linhas. Para manter a transforma¸c˜ao de semelhan¸ca permutamos ai-´esima com a (k−1)-´esima colunas.
Continuamos o processo descrito acima.
b) aki= 0, i= 1, . . . , k−1. Neste caso,Atem a forma
A =
a11 . . . a1,k−1 | a1k . . . a1n−1 a1n
... · · · ... | ... · · · ... ... ak−1,1 . . . ak−1,k−1 | ak−1,k . . . ak−1,n−1 ak−1,n
−− −− −− −− −− −− −− −−
0 . . . 0 | akk . . . ak,n−1 akn
0 . . . 0 | 1 . . . 0 0
... · · · ... | ... · · · ... ...
0 . . . 0 | 0 . . . 1 0
=
D1 | L
− − − | − − −
O | D2
,
ondeD2 eat´a na forma de Frobenius. Portanto,
det (A−λI) = det (D1−λI) det (D2−λI).
Aplicamos o m´etodo de Danilevski para a matrizD1, que tem dimens˜ao menor.
C´alculo dos autovetores pelo m´etodo de Danilevski. Sejaλum auto- valor deA. Ent˜ao,λ´e autovalor da matriz similarP. Determinemos o autovetor
¯
y= (y1, . . . , yn) deP correspondente aλ. TemosPy¯=λ¯y, isto ´e,
p1−λ p2 . . . pn
1 −λ . . . 0 ... ... . .. ...
0 0 . . . −λ
y1
... yn
= ¯0.
Portanto,
(p1−λ)y1+p2y2+. . .+pnyn = 0, y1−λy2 = 0, y2−λy3 = 0, ... ... . yn−1−λyn = 0.
Este sistema ´e homogˆenio e tem muitas solu¸c˜oes que s˜ao proporcionais. Colo- candoyn= 1, teremos
yn−1=λ, yn−2=λ2, . . . , y1=λn−1.
Seja ¯xo autovetor correspondente ao autovalorλdeA. Desde que Mn−−11. . . M1−1A M1. . . Mn−1y¯=λ¯y,
ent˜ao,
A M1. . . Mn−1y¯=λ M1. . . Mn−1y¯ e, consequentemente,
¯
x=M1. . . Mn−1y.¯