N´ umero de condi¸c˜ ao - 1.1 F´ ormula de interpola¸ c˜ ao de Lagrange

Desta forma,

ckx¯k−ξ¯k ≤ c²k¯xk−1−ξ¯k²

= [ckx¯k−1−ξ¯k]²

≤ [ckx¯k−2−ξ¯k]⁴≤. . .≤[ckx¯0−ξ¯k]²^k.

Portanto,

kx¯k−ξ¯k ≤ 1

c[ckx¯0−ξ¯k]²^k,

isto é, o método de Newton é convergente com velocidadeq²^k, ondeq <1 para toda boa aproxima¸cão inicial. O teorema está demonstrado.

Aqui, ∆ ´e uma matriz e ¯εe ¯δs˜ao vetores. Considerando queA¯x= ¯b, por (2), obtemos

A¯ε+ ∆¯x+ ∆¯ε= ¯δ e, assim,

ε=A⁻¹(¯δ−∆¯x−∆¯ε).

Portanto,

kε¯k ≤ kA⁻¹k kδ¯k+kA⁻¹k k∆k kx¯k+kA⁻¹k k∆k kε¯k.

Supondo que kA⁻¹k k∆k < 1, isto ´e, que os erros dos elementos de A s˜ao suficientemente pequenos, obtemos

kε¯k ≤ kA⁻¹k kδ¯k+kA⁻¹k k∆k kx¯k 1− kA⁻¹k k∆k .

QuandoA´e dada precisamente ou, equivalentemente, quando ∆ = 0, temos (3) kε¯k ≤ kA⁻¹k k¯δk.

Então, o incremento ¯εda solu¸cão é limitado pelas pertuba¸cões ∆ e ¯δdos dados e depende essencialmente da norma da matriz inversa.

Aqui, ¯δ,∆ e ¯ε são os valores absolutos dos erros. Mas, eles não dão uma no¸cão clara da situa¸cão. Por exemplo, sek∆k= 1, esta pertuba¸cão é grande ou não? Depende da norma kAk. SekAk= 10⁶, a pertuba¸cão é desprez´ıvel, mas se kAk = 10⁻³, a pertuba¸cão é catastrófica. Por isto, quando investigamos o erro consideramos os incrementos relativos

kε¯k

k¯xk, k∆k kAk, k¯δk

k¯bk.

Vamos obter limites para estes incrementos relativos. Para este prop´osito, pre- cisaremos da seguinte desigualdade.

Teorema 52 Seja a norma matricialk·kcompat´ıvel com a norma vetorialk·k. Ent˜ao, a desigualdade

kx¯k

kA⁻¹k ≤ kA¯xk ≤ kAk kx¯k vale para toda matriz regularAe todo vetor x.¯

Demonstra¸cão. A segunda desigualdade mostra que a norma matricial e a norma vetorial são compat´ıveis. A desigualdade à esquerda é consequência de

kx¯k=kA⁻¹Ax¯k ≤ kA⁻¹k · kA¯xk.

Vamos investigar agora a influência das pertuba¸cões dos dados sobre a solu¸cão, em duas situa¸cões t´ıpicas.

Seja a solu¸cão ¯ξ do sistema A¯x = ¯b obtida por um método numérico de aproxima¸cão. Substituimos ¯xpor ¯ξno lado esquerdo do sistema. ObtemosAξ.¯ SejaAξ¯próximo a ¯b. A pergunta é se ¯ξestá próximo a ¯x. Parece natural que se ¯δ:=Aξ¯−¯bé pequeno, ¯ε:= ¯ξ−x¯ será pequeno também. Vamos ver agora se temos razão para uma tal afirma¸cão.

Temos

δ¯=Aξ¯−¯b=Aξ¯−A¯x=A( ¯ξ−x) =¯ Aε.¯

Logo, ¯ε=A⁻¹δ. Desde que (A¯ ⁻¹)⁻¹=A, ent˜ao Lema 1 implica na desigualdade

(4) kδ¯k

kAk ≤ kA⁻¹δ¯k=kε¯k ≤ kA⁻¹k kδ¯k. Analogamente,

(5) k¯bk

kAk ≤ kx¯k=kA⁻¹¯bk ≤ kA⁻¹k k¯bk.

Como consequˆencia de (4) e (5), obtemos o seguinte limite para o erro relativo:

(6) 1

kA⁻¹k kAk kδ¯k k¯bk ≤ kε¯k

k¯xk ≤ kA⁻¹k kAkkδ¯k k¯bk.

O númerokA⁻¹k kAké chamadonúmero de condi¸cão da matrizAe é denotado porcond (A) ou por ν(A). A desigualdade (6) implica que cond (A)≥1 pois, caso o contário, chegar´ıamos em uma contradi¸cão com (6) para kδ¯k 6= 0. Isto pode ser demonstrado também. De fato, pela igualdadeI=A⁻¹Aobtemos

kIk ≤ kA⁻¹k kAk=cond(A).

Desde que todos os autovalores da matriz identidade I são iguais a 1, pois o polinômio caracter´ıstico deIé (1−t)ⁿ, e toda norma de uma matriz é maior do que o valor absoluto de qualquer autovalor (veja (24.5)), entãocond(A)≥1.

A desigualdade (6) mostra que se o número de condi¸cão de A está perto de 1, o erro relativo da solu¸cão está perto do erro relativo do vetor do lado direito. Então, podemos afirmar que seAξ¯está próximo a ¯b, então ¯ξé uma boa aproxima¸cão da solu¸cão ¯xe até podemos fornecer um limite para o erro.

As matrizes cujos número de condi¸cão estão próximos a 1 são chamadasbem condicionadas. Aquelas com números de condi¸cão , cond (A), muito grandes são chamadasmal condicionadas. As matrizes mal condicionadas podem causar problemas quando resolvemos o sistema numericamente.

Vamos fornecer um limite inferior melhor para cond (A) através dos autovalores deA. Para este propósito, vamos denotar porλ1, . . . , λn os autovalores deA, arranjados em ordem crescente de seus módulos,

|λ1| ≤. . .≤ |λn|.

Assim, _|_λ¹_n_|≤. . .≤ _|λ¹1| s˜ao os m´odulos dos autovalores deA⁻¹ e, portanto, (7) cond(A) =kA⁻¹k kAk ≥ |λn|

|λ1|.

Em particular quandoAé uma matriz simétrica, isto é, quandoA=A^T, temos kAk2=|λn|ekA⁻¹k2=_|_λ¹₁_|. Então,

(8) cond (A) =|λn|

|λ1|.

Portanto, o condicionamento das matrizes sim´etricas depende da largura de seu spectrum, isto ´e, do quociente do maior e do menor autovalores.

Vamos considerar mais um caso particular onde aparece o número de condi¸cão da matrizA. Ao invéz de resolver o sistemaA¯x= ¯b, resolvemos Âξ¯= ¯b onde Aˆ=A+ ∆. Determinemos um limite para a diferen¸ca entre¯xe ¯ξ. Temos

x=A⁻¹¯b = A⁻¹( ˆAξ) =¯ A⁻¹(A+ ˆAnA) ¯ξ

= ξ¯+A⁻¹( ˆA−A) ¯ξ= ¯ξ+A⁻¹∆ ¯ξ.

Assim, obtemos

x−ξ¯=A⁻¹∆ ¯ξ e, desta forma,

kx¯−ξ¯k ≤ kA⁻¹k k∆k kξ¯k=kA⁻¹k kAk k∆k kAk kξ¯k. Finalmente, chegamos em

kx¯−ξ¯k

kξ¯k ≤cond(A) k∆k kAk.

Esta desigualdade mostra que, para matrizes bem condicionadas, pequenas pertuba¸c˜oes relativas nos elementos da matriz levam a pequenos incrementos na solu¸c˜ao .

Esses exemplos mostram que o número de condi¸cão é uma caracter´ıstica importante deA. Para determinar este número temos que saber os valores de kAke dekA⁻¹k. Em geral, o cálculo das últimas normas não é problema fácil.

Algumas vezes,cond (A) pode ser estimado atrav´es do seguinte teorema.

Teorema 53 A igualdade 1

cond (A) = min

½ kA−Bk

kAk : B ´e singular

vale para qualquer norma e para toda matriz regularA.

O teorema mostra que o número de condi¸cão caracteriza a distância deA até o espa¸co das matrizes singulares B, isto é, para as quais detB = 0. Não vamos provar este teorema. Somente mostraremos que

cond(A) ≤ kA−Bk

kAk para toda matrizB com detB= 0.

De fato, esta desigualdade ´e equivalente a

(8) 1

kA⁻¹k ≤ kA−Bk.

Desde que detB= 0, ent˜ao existe um vetor n˜ao nulo ¯xtal queBx¯= ¯o. Portanto, kA−Bk kx¯k ≥ kA¯x−Bx¯k=kA¯xk

≥ kx¯k

kA⁻¹k ( pelo Lema 1).

Agora, (8) é consequência da última desigualdade e dekx¯k>0.

A idéia da maioria dos métodos numéricos para solu¸cão de sistemas lineares

´e a seguinte: transformar a matrizAem uma matrizCcom estrutura espec´ıfica (triangular, banda, sim´etrica) e depois resolver o sistema que corresponde aC.

Algumas vezes, essas transforma¸cões podem levar em um aumento do número de condi¸cão deA. Assim, a matrizAde bem condicionada pode se tornar mal condicionada.

Vamos ver o que acontece, por exemplo, quando transfomamos uma matriz em matriz sim´etrica. Multipliquemos os dois lados da equa¸c˜ao

A¯x= ¯b

pela transposta de A. Obtemos A^TA¯x = A^T¯b. Este ´e um novo sistema que

é equivalente ao sistema inicial e que tem matriz simétricaC =A^TA. Sejam λ1, . . . , λn, com|λ1| ≤. . . ≤ |λn|, os autovalores de A. Vamos supor que A é positiva definida, isto é, que (A¯x,x)¯ >0 para todo ¯x6= ¯0. Assim, A^TA=A² e λ²₁, . . .,λ²_n são os autovalores deA². Consequentemente,

cond(C) = µ|λn|

|λ1|

¶2

= [cond (A)]².

Mas, uma matriz tem número de condi¸cão 1 se, e somente se, ela é múltipla da matriz identidade. Portanto, em geral, quandoA 6=I, cond (A)>1 e (9) implica que quando transfomamos a matriz em simétrica, o número de condi¸cão de A cresce. Isto mostra que a simetriza¸cão pode estragar o condicionamento deA.

C´ alculo de Autovalores de Matrizes

Autovaloresde uma matrizAsão aqueles númerosλ, para os quais a equa¸cão Ax¯=λ¯x

tem solu¸cão não-nula ¯x. Essas solu¸cões não-nulas são chamadasautovetores de A. É claro que toda matrizAde dimensãon×ntem exatamentenautovalores, que são as ra´ızes da equa¸cão algébrica

D(λ) := det (A−λI) = 0.

A equa¸cãoD(λ) = 0 é chamada equa¸cão caracter´ıstica da matrizA. Podemos demonstrar que

D(λ) = (−1)ⁿ[λⁿ−σ1λⁿ⁻¹+σ2λⁿ⁻²− · · ·+ (−1)ⁿσn], onde

σ1 =

k=1

akk,

σ2 = X

i<k

aii aik

aki akk

¯,

σ3 = X

i<j<k

aii aij aik

aji ajj ajk

aki akj akk

¯ ,

... ... ...

σn = detA.

Para se determinar os coeficientes de D(λ) ´e necess´ario calcular 2ⁿ −1 (=

¡_n

¢+· · ·+¡_n

¢) determinantes. Parangrande, é uma tarefa muito dif´ıcil. Existem outros métodos mais simples para a constru¸cão do polinômio caracter´ıstico de uma matrizA. Depois de achar o polinômio, os seus zeros, que são os autovalores deA, são calculados por algum dos métodos numéricos já conhecidos.

Agora vamos conhecer um antigo método universal para a constru¸cão do polinômio caracter´ıstico de uma dada matriz.

5.1 M´ etodo de Danilevski

SejaA={aij}ⁿi,j=1 uma matriz dada. Seja

P =

p1 p2 . . . pn−1 pn

1 0 . . . 0 0

... ... · · · ... ...

0 0 . . . 1 0

¯ a correspondente matriz similar de Frobenius, isto ´e,

P =C⁻¹AC,

ondeCé uma matriz regular. Desde que as matrizes similhantes têm as mesmas equa¸cões caracter´ısticas, então

det (A−λI) = det (P−λI) =D(λ).

A idéia do método de Danilevski é transformar a equa¸cão caracter´ıstica det (A− λI) = 0 para a forma normal de Frobenius, isto é, da forma

D(λ) =

p1−λ p2 p3 . . . pn

1 −λ 0 . . . 0

0 1 −λ . . . 0

... ... ... . .. ...

0 0 0 . . . −λ

¯ .

Se a equa¸cão caracter´ıstica é escrita desta forma, expandindo o determinante com rela¸cão à primeira coluna, obtemos

D(λ) = (p1−λ)(−λ)ⁿ⁻¹−p2(−λ)ⁿ⁻²+p3(−λ)ⁿ⁻³+· · ·+ (−1)ⁿ⁻¹pn

= (−1)ⁿ[λⁿ−p1λⁿ⁻¹−p2λⁿ⁻²− · · · −pn].

No método de Danilevski a matrizA é transformada em uma matrizP, que é similhante aA, através de n−1 transforma¸cões de semelhan¸ca que mudam as linhas deA, sucessivamente, come¸cando da última.

Vamos supor que depois den−ktransforma¸c˜oes de semelhan¸ca obtemos a seguinte matriz, que denotaremos porA tamb´em,







a11 a12 . . . a1k−1 a1k . . . a1n−1 a1n

... ... · · · ... ... · · · ... ... ak1 ak2 . . . akk−1 akk . . . akn−1 akn

0 0 . . . 0 1 . . . 0 0

... ... · · · ... ... · · · ... ...

0 0 . . . 0 0 . . . 1 0





 ,

cujask+ 1, . . . , n-ésimas linhas coincidem com as deP. Queremos transformar ak-ésima linha (ak1. . . ak,k−1akk. . . akn) para a forma (0. . .1 0. . .0). Para este fim, executemos as seguintes transforma¸cões:

1. Paraak,k−16= 0, dividimos todos os elementos da (k−1)-´esima coluna porak,k−1.

2. Subtraimos da i-´esima coluna a (k−1)-´esima multiplicada poraki, i6= n−1.

Fazendo comI as mesmas transforma¸c˜oes obtemos

Mk=







1 0 . . . 0

0 1 . . . 0

... ... · · · ... mk−1,1 mk−1,2 . . . mk−1,n

... ... · · · ...

0 0 . . . 1





 ,

onde

mk−1,k−1 = 1 ak,k−1

mk−1,i = − ak,i

ak,k−1, i6=k−1.

Vamos denotar a matriz obtida porB. De acordo com o que já foi dito, B = AMk e as k-ésima, . . ., n-ésima linhas de B coincidem com as de P. Para os elementosbij deB achamos

bij = aij−akjai,k−1

ak,k−1

= aij+mk−1,jai,k−1, i= 1, . . . , k, j= 1, . . . , k−2, k, . . . , n, bi,k−1 = ai,k−1

ak,k−1

=ai,k−1mk−1,k−1, i= 1, . . . , k.

A matriz B obtida não é similar a A. Para trasformá-la em similar vamos multiplicá-la à esquerda porM_k⁻¹. ObtemosC=M_k⁻¹B=M_k⁻¹AMk.

Podemos mostrar que

M_k⁻¹=







1 0 . . . 0

0 1 . . . 0

... ... · · · ... ak1 ak2 . . . akn

... ... · · · ...

0 0 . . . 0

0 0 . . . 1







→ k−1

De fato, pode-se verificar diretamente queM_k⁻¹Mk =I.

Pela f´ormulaC=M_k⁻¹B achamos as express˜oes paracji, cji = bji, j 6=k−1

ck−1,i = ak1b1i+. . .+aknbni, i= 1, . . . , n.

E claro que´ C tem as mesmas linhas, da k-ésima até a n-ésima, que as de P. Continuamos a opera¸cão na (k−1)-ésima, . . . , segunda linhas da mesma maneira.

Seak,k−1= 0 na matriz obtida depois den−kpassos, existem duas possi- bilidades:

a) aki6= 0 para algumi < k−1.

Neste caso, permutamos a (k−1)-ésima com ai-ésima linhas. Para manter a transforma¸cão de semelhan¸ca permutamos ai-ésima com a (k−1)-ésima colunas.

Continuamos o processo descrito acima.

b) aki= 0, i= 1, . . . , k−1. Neste caso,Atem a forma

A =







a11 . . . a1,k−1 | a1k . . . a1n−1 a1n

... · · · ... | ... · · · ... ... ak−1,1 . . . ak−1,k−1 | ak−1,k . . . ak−1,n−1 ak−1,n

−− −− −− −− −− −− −− −−

0 . . . 0 | akk . . . ak,n−1 akn

0 . . . 0 | 1 . . . 0 0

... · · · ... | ... · · · ... ...

0 . . . 0 | 0 . . . 1 0











D1 | L

− − − | − − −

O | D2



,

ondeD2 eat´a na forma de Frobenius. Portanto,

det (A−λI) = det (D1−λI) det (D2−λI).

Aplicamos o m´etodo de Danilevski para a matrizD1, que tem dimens˜ao menor.

Cálculo dos autovetores pelo método de Danilevski. Sejaλum autovalor deA. Então,λé autovalor da matriz similarP. Determinemos o autovetor

y= (y1, . . . , yn) deP correspondente aλ. TemosPy¯=λ¯y, isto ´e,







p1−λ p2 . . . pn

1 −λ . . . 0 ... ... . .. ...

0 0 . . . −λ











 y1

... yn





= ¯0.

Portanto,

(p1−λ)y1+p2y2+. . .+pnyn = 0, y1−λy2 = 0, y2−λy3 = 0, ... ... . yn−1−λyn = 0.

Este sistema é homogênio e tem muitas solu¸cões que são proporcionais. Colo- candoyn= 1, teremos

yn−1=λ, yn−2=λ², . . . , y1=λⁿ⁻¹.

Seja ¯xo autovetor correspondente ao autovalorλdeA. Desde que M_n⁻₋¹₁. . . M₁⁻¹A M1. . . Mn−1y¯=λ¯y,

ent˜ao,

A M1. . . Mn−1y¯=λ M1. . . Mn−1y¯ e, consequentemente,

x=M1. . . Mn−1y.¯

No documento 1.1 F´ ormula de interpola¸ c˜ ao de Lagrange (páginas 188-199)