ISCTE/FCUL - Mestrado Matemática Financeira. Aula de Janeiro de 2009 Ano lectivo: 2008/2009. Diana Aldea Mendes

(1)

ISCTE/FCUL - Mestrado Matem´atica Financeira Aula 1

03 de Janeiro de 2009 Ano lectivo: 2008/2009 Diana Aldea Mendes

Departamento de M´etodos Quantitativos, IBS - ISCTE Business School Gab. 207 AA, diana.mendes@iscte.pt, http://iscte.pt/˜deam

(2)

1. Introdu¸cão e conceitos básicos de optimiza¸cão sem restri¸cões

2. Métodos numéricos de optimiza¸cão de fun¸cões de uma variável (a) Interpola¸cão polinomial

(b) Algoritmos de Newton, secante, bisec¸c˜ao e de Brent

3. Métodos numéricos de optimiza¸cão de fun¸cões de várias variáveis (a) Métodos iterativos directos e indirectos de 1a e 2a ordem

(3)

(b) M´etodo de Newton e quase-Newton (c) M´etodo de Powell

(d) M´etodo do gradiente conjugado (e) M´etodo dos m´ınimos quadrados

4. Introdu¸cão à Optimiza¸cão Global

(a) Arrefecimento simulado (Simulating Annealing) (b) Algoritmos Gen´eticos

(4)

Referˆ

encias

[1] Nocedal, J. and Wright, St, Numerical optimization, Springer Verlag (1999)

[2] Dennis, J. and Schnabel, R., Numerical methods for unconstrained optimiza-tion and nonlinear equaoptimiza-tions, SIAM (1996)

[3] Mathews, J. H. and Fink, K. D. (1999): Numerical Methods using Matlab, Prentice-Hall., Inc.

[4] Neumaier, A. (2001): Introduction to Numerical Analysis, Cambridge Uni-versity Press.

(5)

[5] Paolo Brandimarte, (2001): Numerical Methods in Finance: A MATLAB-Based Introduction, Wiley-Interscience.

[6] Lemos, C. e Pina, H. (2006), Métodos Numéricos: complementos e guia prático, IST Press.

Avalia¸cão: Os conceitos e algoritmos apresentados são ilustrados com proble-mas que são formulados e resolvidos usando o programa MATLAB. A avalia¸cão assenta na resolu¸cão de uma lista de problemas.

(6)

- http://www.compmacro.com/makoto/200409econ552/ - http://cm.bell-labs.com/netlib/opt/

- http://tomlab.biz/

- http://www.rpi.edu/˜bennek/class/compopt/ - http://www.ee.technion.ac.il/courses/046197/

(7)

Introdu¸

c˜

ao

• Optimiza¸cão não-linear (numérica): métodos que permitem resolver prob-lemas cient´ıficos usando o computador.

• Solu¸cões anal´ıticas: existem só para um pequeno subconjunto das equa¸cões existentes

— Problemas fáceis: polinómios até grau 4, fun¸cões em que a variável indepen-dente aprece apenas num termo

(8)

• Trˆes passos:

— expressar matematicamente o problema cient´ıfico

— escolher métodos numéricos que permitam obter, de forma robusta, efi-ciente e precissa, uma solu¸cão aproximada do problema

— implementa¸c˜ao do algoritmo no computador e estudo do erro de aprox-ima¸c˜ao

• Acumula¸c˜ao de Erros

— erros inerentes (modelo matem´atico n˜ao traduz exactamente a reali-dadae)

(9)

— erros do método (uso de fórmulas que dão valores aproximados: Taylor) — erros computacionais (erro de arredondamento)

- Seja ¯x o valor aproximado do valor exacto x. O erro de ¯x em rela¸c˜ao a x define-se por e_x _{= x − ¯}x.

|ex| = |x − ¯x| representa o erro absoluto de ¯x e se x 6= 0, ent˜ao

|δx| = ¯ ¯ ¯ ¯x − ¯ x x ¯ ¯ ¯ ¯

´e o erro relativo de ¯x. _{Ao produto 100 |δ}x|, expresso em percentagem, chama-se

percentagem de erro.

- Um problema diz-se bem condicionado se pequenos erros nos dados produzem pequenos erros nos resultados. Caso contr´ario o problema ´e mal condicionado.

(10)

Optimiza¸

c˜

ao num´

erica univariada

• Objectivo: Encontrar um zero (ra´ız) de uma fun¸cão real de uma variável real, isto é, um número x∗ tal que f (x∗) = 0.

• Este problema surge em diferentes contextos, como por exemplo — solu¸c˜oes de equa¸c˜oes de tipo: p (x) = q (x)

— extremos interiores de fun¸c˜oes de classe C1 — pontos singulares

(11)

— problemas com condi¸cões de fronteira (equa¸cões diferenciais, equa¸cões as derivadas parciais e equa¸cões integrais)

Defini¸c˜ao 1: Um ponto x∗ _{∈ D ⊂}

_R

_{diz-se minimizante local de f : D →}

_R

(fun¸c˜ao objectivo) se existe ε > 0 tal que f (x∗_{) ≤ f (x) , ∀x ∈ N}_ε (x∗_{) ∩ D.} Defini¸c˜ao 2: Um ponto x∗ _{∈ D ⊂}

_R

_{diz-se minimizante global de f : D →}

_R

se f (x∗_{) ≤ f (x) , ∀x ∈ D.} Observa¸c˜ao 1: max x∈D f (x) = − µ min x∈D (−f (x)) ¶

(12)

de optimiza¸cão são métodos iterativos e geralmente determinam um extremo local. Para obter um extremo global é necessário aplicar algum tipo de itera¸cão externa.

(b). Não existe nenhum critério para decidir se uma solu¸cão local é global ou não.

(c). Se f é convexa, então qualquer minimizante local de f é um minimizante global de f .

(d). Se a fun¸cão objectivo f é regular e o conjunto D é compacto, então a existência de um minimizante global é garantida pelo Teorema de Weierstrass.

(13)

(e). Muitas vezes a expressão (e regularidade) de f não é conhecida e o teorema anterior não se aplica.

(14)

Determine uma solu¸cão da seguinte equa¸cão não-linear cos x = x

- Ponto inicial: x₀ _{= 0 → x}₁ = cos x₀ _{= 1 → x}₂ = cos x₁ _{= 0.5403 →} ....x₂₀ _{= 0.738 → x}₂₁ _{= 0.739 → x}₂₂ _{= 0.739 → x}₂₃ = 0.739 (convergência) Portanto, x ' 0.739 é a solu¸cão aproximada da equa¸cão não-linear.

- Matlab:

>> fzero(’cosy’,0) >> ans =0.7391

(15)

-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 cos(x)=x

(16)

Determine uma solu¸cão da seguinte equa¸cão não-linear x2 = x

- Se escolhemos o ponto inicial x₀ = 1 ent˜_{ao → x = 1.Se x}₀ _{6= 1 → x → 0 ou} x → ∞.

(17)

-2 -1.5 -1 -0.5 0 0.5 1 1.5 2 -1 -0.5 0 0.5 1 1.5 2 x2=x

(18)

problem): p(x) = x5 _{− 10x}4 + 40x3 _{− 80x}2 _{+ 80x − 32 = (x − 2)}5

- polin´omio em Matlab: (comando roots - determina os zeros dos polin´omios) >> p=[1 -10 40 -80 80 -32]; >> x=roots(p)

x = 2.0020 + 0.0015i, 2.0020 - 0.0015i, 1.9992 + 0.0024i, 1.9992 - 0.0024i, 1.9975

- O algoritmo utilizado pelo comando roots envolve a computa¸cão dos valores próprios da matriz associada ao polinómio.

(19)

• Outro comando Matlab melhor ( fzero)

>> rt = fzero(’(x-2)ˆ5’,1.5) >> rt=2.0000

x = fzero(fun,x0) tenta encontrar um zero da fun¸c˜ao fun pr´oximo de x0.

- O algoritmo do m-file fzero (T.Dekker) utiliza uma combina¸cão entre os métodos de biseçcão, secante e interpola¸cão quadrática inversa

- Limita¸cões do fzero: quando a fun¸cãom objectivo é tangente (mas não cruza) ao eixo dos xx, o algoritmo pode não encontrar o m´ınimo.

(20)

• Outro comando Matlab ainda melhor (fminbnd):

>> x = fminbnd(fun,x1,x2) - encontra o minimo de uma fun¸c˜ao dentro de um intervalo fixado (x1,x2)

- O algoritmo está baseado no método da seçcão de ouro e na interpola¸cão parabólica.

- Limita¸cões do fminbnd: a fun¸cão objectivo precissa ser cont´ınua e real, o algoritmo só encontra solu¸cões locais e a convergência é lenta quando a solu¸cão é na fronteira

(21)

M´

etodos directos de optimiza¸

c˜

ao univariada

• Só requerem a evalua¸cão da fun¸cão objectivo f (não são necessárias as derivadas de f )

• N˜ao precisam hip´oteses de regularidade

• Faceis de implementar - m´etodos iterativos xn+1 = f (xn)

(22)

• Interpola¸c˜ao polinomial

• M´etodo da secante

• Método da biseçcão

(23)

Interpola¸

c˜

ao polinomial

(Vandermonde, Lagrange, Newton, m´ınimos quadrados)

A interpola¸cão consiste em determinar uma fun¸cão que assume valores conheci-dos em certos ponto discretos de tipo (x_i, f_i) . A classe de fun¸cões escolhida é a priori arbitrária, mas deve ser adequada às caracter´ısticas que pretendemos que a fun¸cão possua. Em geral os polinómios são a escolha mais frequente, pois são fáceis de avaliar, diferenciar e integrar (ao contrário das séries trigonométricas ou exponenciais).

Dados: f (x₀) = f₀, f (x₁) = f₁, ... f (x_n) = f_n Encontra : f _{(x) para x ∈ [x}₀, xn].

Utiliza-se para: calcular valores intermediários de fun¸cões, deriva¸cão numérica e integra¸cão numérica, optimiza¸cão

(24)

Seja um conjunto finito de pontos distintos x₀, ..., xn (n´os de interpola¸c˜ao) e os

valores associados de uma fun¸c˜ao f₀, ..., fn. Queremos encontrar um polin´omio

p (x) tal que

p (x_i) = f_i, i = 0, ..., n, ou seja, sendo o polin´omio p (x) definido por

p(x) = a₀ + a₁x + a₂x2 + ... + a_mxm, a₀, ..., am ∈

R

o nosso objectivo ´e determinar os coeficientes a₀, ..., a_m _∈

_R

a partir dos pontos dados (x_i, f_i) , i = 1, ..., n.

(25)

Substitu´ındo os nós (x_i, f_i) , i = 1, ..., n em p (x) obtemos o seguinte sistema linear com n equa¸cões e m incógnitas:

⎧ ⎪ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎪ ⎩ a₀ + a₁x₀ + a₂x2₀ + ... + amxm₀ = f₀ a₀ + a₁x₁ + a₂x2₁ + ... + a_mxm₁ = f₁ ... a₀ + a₁xn + a2x2n + ... + amxmn = fn . (1)

O sistema ´e poss´ıvel e determinado se m = n (caso que vamos considerar). Escrevemos o sistema em forma matricial, isto ´e,

AX _{= B ⇔} ⎡ ⎢ ⎢ ⎢ ⎣ 1 x₀ . . . xn₀ 1 x₁ . . . xn₁ ... ... ... ... 1 x_n . . . xn_n ⎤ ⎥ ⎥ ⎥ ⎦ ⎡ ⎢ ⎢ ⎢ ⎣ a₀ a₁ ... an ⎤ ⎥ ⎥ ⎥ ⎦ = ⎡ ⎢ ⎢ ⎢ ⎣ f₀ f₁ ... fn ⎤ ⎥ ⎥ ⎥ ⎦

onde a matriz A_(n×n) designa-se por matriz de Vandermonde. A existência e unicidade do polinómio interpolador é equivalente com o facto de o sistema ser

(26)

0 n

sendo r a caracter´ıstica da matriz A).

Teorema 1: Dados (n + 1) n´os, x₀, ..., xn e os respectivos valores f0, ..., fn,

existe um e um s´o polin´omio interpolador de grau menor ou igual que n, para esses valores.

Com outras palavras, se temos só um ponto (x₀, y₀) então o único polinómio de grau zero que interpola o ponto é a recta horinzontal p (x) = y₀. Se temos dois pontos (nós), então o único polinómio de grau (no máximo) 1 é a recta que une os dois nós. Analogamente, só podemos construir uma única parábola entre três pontos distintos.

- Interpola¸c˜ao linear p (x) = a₀ + a₁x = f₀ + (f₁ _{− f}₀) x−x0

(27)

- Interpola¸cão quadrática p (x) = a₀ + a₁x + a₂x2 - Interpola¸cão cúbica p (x) = a₀ + a₁x + a₂x2 + a₃x3

(28)

- A resolu¸c˜ao do sistema (1) pode ser demorada e usa muitos flops em termos computacionais.

- As matrizes de tipo Vandermonde geram solu¸c˜oes bastante imprecisas.

- Para evitar estes factos consideram-se polin´omios com propriedades especiais que permitem interpolar de forma mais eficiente.

(29)

F´ormula de Lagrange

• Muito mais econ´omico em termos computacionais (menos flops que o m´etodo de Vandermonde)

• A obten¸cão de p (x) não é muito eficiente

• Muito dif´ıcil na estima¸c˜ao dos erros

Polin´omio de Lagrange: Dados (n + 1) n´os, x₀, ..., xn e os respectivos valores

(30)

l_i (x) =

(

1 se i = j 0 se i 6= j .

Fixando i e variando j = 0, ..., n obtemos uma expressão explicita dos polinómios de Lagrange x_j é ra´ız de l_i _{se i 6= j ⇒ l}_i (x) = c_i n Y j_=0,j6=i ³ x − xj ´ , onde a constante c_i pode determinar-se, pois l_i(x_i) = 1, o que implica

c_i = _n 1 Y j_=0,j6=i ³ x_i _{− x}_j´ .

(31)

Obtem-se ent˜ao que l_i (x) = n Y j_=0,j6=i Ã x − xj x_i _{− x}_j ! = = (x − x0) (x − x1) ... (x − xi−1) (x − xi+1) ... (x − xn) (x_i _{− x}₀) (x_i _{− x}₁) ... (x_i _{− x}_i−1) (x_i _{− x}_i+1) ... (x_i _{− x}_n), i = 0, ..., n.

Considerando agora a formula interpoladora de Lagrange, isto ´e, p_n (x) = f₀l₀ (x) + f₁l₁ (x) + ... + f_nl_n (x) ,

obtem-se que pn (x_i) = f_i.

Para n = 1 e 2 obtem-se interpola¸c˜ao linear pn (x) = f0l0 (x) + f1l1 (x) e

(32)

• Exemplo: Dados os pontos −→x = (x₀, x₁, x₂) = (2, 6, 7) e as suas imagens f = (f₀, f₁, f₂_{) = (−1, 8, −3), determine um polin´omio interpolador de} grau dois que passe por estes pontos

x f 2 ₋₁ 6 8 7 ₋₃

(33)

l₀ (x) = (x − x1) (x − x2) (x₀ _{− x}₁) (x₀ _{− x}₂) = (x − 6) (x − 7) (2 − 6) (2 − 7) = (x − 6) (x − 7) 20 l₁ (x) = (x − x0) (x − x2) (x₁ _{− x}₀) (x₁ _{− x}₂) = (x − 2) (x − 7) (6 − 2) (6 − 7) = (x − 2) (x − 7) −4 l₂ (x) = (x − x0) (x − x1) (x₂ _{− x}₀) (x₂ _{− x}₁) = (x − 2) (x − 6) (7 − 2) (7 − 6) = (x − 2) (x − 6) 5 p₂ _{(x) = −1}(x − 6) (x − 7) 20 + 8 (x − 2) (x − 7) −4 − 3 (x − 2) (x − 6) 5 = −53 20x 2 ₊ 469 20 x − 373 10

(34)

1 2 3 4 5 6 7 8 -4 -2 0 2 4 6 8 10 12 14

(35)

• Erro de interpola¸c˜ao, num certo ponto x: en (x) = f (x) − pn (x)

• Teorema : Seja f uma fun¸c˜ao real de vari´avel real de classe Cn+1 no intervalo I_x_¯ = [¯x, x₀, x₁, ..., xn], (Ix¯ designa o menor intervalo fechado que

cont´em os pontos ¯x, x₀, x₁, ..., xn). Ent˜ao existe um ξ ∈ Ix¯ tal que

en (¯x) = f (¯x) − pn (¯x) = ψ (¯x)

(n + 1)!f

n+1 _(ξ)

(36)

• Muito eficiente quando os polin´omios s˜ao de grau baixo

• Estima¸c˜ao rigorosa do erro

• Fórmula interpoladora de Newton com diferen¸cas divididas (razões incre-mentais que constituem aproxima¸cões discretas de derivadas)

pn (x) = f [x0]+f [x0, x1] (x − x0)+...+f [x0, x1, ..., xn] (x − x0) ... (x − x_n−1) onde f[x_i, x_j] = ³ f_i _{− f}_j´ ³ x_i _{− x}_j´

(37)

´e a diferen¸ca dividida de 1a ordem e

f[x_i, ..., x_i+k] = f[xi+1, ..., x_¡i+k] − f[xi, ..., xi+k−1] x_i+k _{− x}_i¢

´e uma diferen¸ca dividida de ordem k.

Para n = 1 obtem-se interpola¸c˜ao linear

p₁ (x) = f (x₀) + f [x₀, x₁_{] (x − x}₀) ; f [x₀, x₁] = f (x1) − f (x0) x₁ _{− x}₀

(38)

(39)

Para n = 2 obtem-se interpola¸c˜ao quadr´atica

p₂ (x) = f (x₀) + f [x₀, x₁_{] (x − x}₀) + f [x₀, x₁, x₂_{] (x − x}₀_{) (x − x}₁) f[x₀, x₁, x₂] = f[x1, x2] − f[x0, x1]

(40)

(41)

Erro de interpola¸c˜ao

O erro de interpola¸cão, num certo ponto x é ε_n _{(x) = f (x) − p}_n (x) . Se con-sideremos x como um novo nó de interpola¸cão obtem-se

εn (x) = f [x0, ..., xn, x] (x − x0) ... (x − xn) .

Seja V um intervalo que contenha os nós x₀, ..., x_n, x. Se a fun¸cão f fôr de classe Cn+1(V ) então temos a seguinte fórmula para o erro de interpola¸cão:

∃η ∈ V : εn (x) = f (n+1) _(η) (n + 1)! n Y k=0 (x − xk) .

(42)

Uma barra de ferro é arrefecida desde 80 até -340o F. A tabela abaixo representa a temperatura vs. o coeficiente de expansão termal em vários momentos do processo de arrefecimento. Determine o coeficiente de expansão termal para a temperatura de -17o C, utilizando algum método de interpola¸cão:

2.45 x 10-6 -340 3.58 x 10-6 -260 4.72 x 10-6 -160 5.58 x 10-6 -60 6.00 x 10-6 0 6.47 x 10-6 80 Coeficiente de Expansão Termal (cm/o_F) Temperatura (o_F) 2.45 x 10-6 -340 3.58 x 10-6 -260 4.72 x 10-6 -160 5.58 x 10-6 -60 6.00 x 10-6 0 6.47 x 10-6 80 Coeficiente de Expansão Termal (cm/o_F) Temperatura (o_F)

Coef ficient of Therm al Expansion vs Tem epar ture

0 1 2 3 4 5 6 7 -400 -300 -200 -100 0 100 200

Tem pear ture (F)

C o e ffi ci e n t o f T h er m a l E x p a n s io n 1 0 ^ -6 ( in /in /F )

(43)

• M´etodo Directo: Interpola¸c˜ao linear α (t) = a₀ + a₁T ( α (0) = a₀ + a₁ _{(0) = 6.00 · 10}−6 α _{(−60) = a}₀ + a₁ _{(−60) = 5.58 · 10}−6 → ( a₀ _{= 6.00 · 10}−6 a₁ _{= 0.007 · 10}−6 → ( α_{(T ) = 6.00 · 10}−6 _{+ 0.007 · 10}−6_{T, −60 ≤ T ≤ 0} α _{(−14) = 6.00 · 10}−6 _{+ 0.007 · 10}−6_{(−14) = 5.902 · 10}−6

(44)

50 45 40 35 30 25 20 15 10 5.5 5.6 5.7 5.8 5.9 5.58 y_s f range( ) f x( _desired) x_s 1+10 x_s 0−10 xs,range,xdesired

(45)

Interpola¸c˜ao quadr´atica α (t) = a₀ + a₁T + a₂T2 ⎧ ⎪ ⎪ ⎨ ⎪ ⎪ ⎩ α (80) = a₀ + a₁ (80) + a₂ (80)2 _{= 6.47 · 10}−6 α(0) = a₀ + a₁ (0) + a₂ (0)2 _{= 6.00 · 10}−6 α _{(−60) = a}₀ + a₁ _{(−60) + a}₂ ₍₋₆₀₎2 _{= 5.58 · 10}−6 → ⎧ ⎪ ⎨ ⎪ ⎩ a₀ _{= 6.00 · 10}−6 a₁ _{= 6.517 · 10}−9 a₂ _{= −8.035 · 10}−12 → ⎧ ⎪ ⎨ ⎪ ⎩ α _{(T ) = 6.00 · 10}−6 _{+ 6.517 · 10}−9_{T − 8.035 · 10}−12T2_{, −60 ≤ T ≤} α _{(−14) = 6.00 · 10}−6 _{+ 6.517 · 10}−9_{(−14) − 8.035 · 10}−12 ₍₋₁₄₎ = 5.9072 · 10−6 |εa| = ¯ ¯ ¯ ¯ ¯ 5.9072 · 10−6 − 5.902 · 10−6 5.9072 · 10−6 ¯ ¯ ¯ ¯

(46)

60 40 20 0 20 40 60 80 5.4 5.6 5.8 6 6.2 6.4 5.58 y_s f range( ) f x( desire d) 80 60 − xs,range,xdesired

(47)

Tabela de compara¸c˜ao

Ordem do polin´omio 1 2 3

Coeficient de Exp. Termal _{5.902 · 10}−6 _{5.9072 · 10}−6 _{5.9077 · 10}−6

(48)

• F´ormula de Newton: Interpola¸c˜ao linear α(T ) = b₀ + b₁ _{(T − T}₀) T₀ = 0, α (T₀_{) = 6.00 · 10}−6, T₁ _{= −60, α (T}₁_{) = 5.58 · 10}−6 b₀ = α (T₀_{) = 6.00 · 10}−6, b₁ = α(T1) − α (T0) T₁ _{− T}₀ = = 5.58 · 10−6 − 6.00 · 10−6 −60 − 0 = 0.007 · 10 −6 α_{(T ) = 6.00 · 10}−6 _{+ 0.007 · 10}−6 _{(T − 0) , −60 ≤ T ≤ 0} α _{(−14) = 6.00 · 10}−6 _{+ 0.007 · 10}−6 _{(−14 − 0) = 5.902 · 10}−6 cm/cm/oF

(49)

Interpola¸c˜ao Quadr´atica α(T ) = b₀ + b₁ _{(T − T}₀) + b₂ _{(T − T}₀_{) (T − T}₁) T₀ = 80, α (T₀_{) = 6.47 · 10}−6, T₁ = 0, α (T₁_{) = 6.00 · 10}−6 T₂ _{= −60, α (T}₂_{) = 5.58 · 10}−6 b₀ = α (T₀_{) = 6.47 · 10}−6, b₁ = α (T1) − α (T0) T₁ _{− T}₀ = 6.00 · 10−6 − 6.47 · 10−6 0 − 80 = 5.875 · 10 −9 b₂ = α(T₂_)−α(T₁) T₂_−T₁ − α(T₁_)−α(T₀) T₁_−T₀ T₂ _{− T}₀ = 0.007 · 10−6 − 0.005875 · 10−6 −140 = −8.0357 · 10−12 α_{(T ) = 6.47 · 10}−6 _{+ 5.587 · 10}−9 _{(T − 80) − 8.0357 · 10}−12 _{(T − 80) (T − 0} −60 ≤ T ≤ 80 α _{(−14) = 6.47 · 10}−6 _{+ 5.587 · 10}−9 _{(−14 − 80) − 8.0357 · 10}−12 _{(−14 − 80) (} = 5.9072 · 10−6 cm/cm/oF

(50)

|εa| = ¯ ¯ ¯ ¯ ¯ 5.9072 · 10−6 − 5.902 · 10−6 5.9072 · 10−6 ¯ ¯ ¯ ¯ ¯ · 100 = 0.08761%,

Erro relativo absoluto

Tabela de compara¸c˜ao

Ordem do polin´omio 1 2 3

Coeficient de Exp. Termal _{5.902 · 10}−6 _{5.9072 · 10}−6 _{5.9077 · 10}−6

(51)

Aproxima¸c˜ao dos m´ınimos quadrados: Caso dos dados discretos

Seja {(x1, y1) , ..., (xm, ym)} um conjunto de pares de n´umeros reais, onde cada

y_i, i = 1, ..., m foi obtido de forma experimental e aproxima o valor de uma fun¸cão f no nó x_i, i = 1, ..., m, isto é y_i _{≈ f (x}_i) , i = 1, ..., m.

O objectivo ´e construir uma aproxima¸c˜ao para f usando como dados os pares de valores dados (x_i, y_i) , i = 1, ..., m.

Uma vez que os valores são obtidos experimentalmente, o seu erro é descon-hecido. O uso de interpola¸cão de Lagrange não é aconselhada nesta situa¸cão pois, o polinómio interpolador deveria passar pelos pontos (x_i, f (x_i)) , i = 1, ..., m, que não são conhecidos exactamente.

(52)

i i i i

mais sentido fazer passar a fun¸cão aproximadamente “perto” dos pontos (x_i, y_i). O que está em causa é encontrar a recta de regressão p₁ (x) = ax + b (para simplicidadde, ou outra curva), dependente dos parâmetros a e b, que melhor se ajusta (nalgum sentido) aos dados.

Por exemplo:

(i) Problema minimax: a e b s˜ao determinados por forma a minimizar max

(53)

(ii) Problema do desvio absoluto: a e b s˜ao determinados por forma a minimizar

m

X

i=1

|yi − (axi + b)|

(iii) Problema do erro quadrático total (método dos m´ınimos quadrados): a e b são determinados por forma a minimizar

m X i=1 [y_i _{− (ax}_i + b)]2 Portanto tem-se min a,b ⎛ ⎝_E _{(a, b) =} m X i=1 [y_i _{− (ax}_i + b)]2 ⎞ ⎠

(54)

ou seja, que a e b verifiquem o seguinte sistema linear (de equa¸c˜oes normais): ⎧ ⎪ ⎨ ⎪ ⎩

aPm_i=1 (x_i)2 + bP_i=1m (x_i) = Pm_i=1 (x_iy_i) aPm_i=1 (x_i) + bm = Pm_i=1(y_i)

O problema mais geral de aproximar um conjunto de pontos por um polinómio algébrico, pn (x) = Pn_k=0 a_kxk, de grau n ≤ m − 1, usando a aproxima¸cão

dos m´ınimos quadrados é concretizada usando um racioc´ınio idêntico ao atrás descrito para o caso linear e requer a determina¸cão dos parâmetros a₀, a₁, ..., an

que minimizam o erro quadr´atico total E (a₀, a₁, ..., a_n) =

m

X

i=1

(55)

Na prática uma grande parte dos problemas envolvem polinómios de baixo grau. Nas situa¸cões onde são necessários polinómios de grau mais elevado existem técnicas alternativas envolvendo a reformula¸cão do polinómio em termos de polinómios ortogonais, ou a utiliza¸cão de outras fun¸cões aproximantes (expo-nenciais, logaritmicas, etc).