Regress˜ ao Linear M´ ultipla
Anna Regina Corbo
CEFET/RJ - UnED NI
Aula Te´orica 6
Muitas aplica¸c˜oes da an´alise de regress˜ao envolvem situa¸c˜oes em que h´a mais de um regressor.
Um modelo de regress˜ao que contenha mais de um regressor ´e chamado de um modelo de regress˜ao m´ultipla e tem a forma
Y =β0+β1x1+β2x2+· · ·+βkxk+ε com k regressores.
Os parˆametros βj,j = 0,1,· · · ,k, s˜ao chamados de coeficientes de regress˜ao.
Anna Regina Corbo Regress˜ao Linear M´ultipla
Introdu¸c˜ ao
Modelos de regress˜ao linear m´ultipla s˜ao frequentemente usados como aproxima¸c˜oes de fun¸c˜oes. Isto ´e, a verdadeira rela¸c˜ao funcional entreY ex1,x2,· · · ,xk ´e desconhecida, por´em, em certas faixas das vari´aveis independentes, o modelo de regress˜ao linear ´e uma aproxima¸c˜ao adequada.
De modo similar ao modelo de regress˜ao linear simples, podemos utilizar o m´etodo dos m´ınimos quadrados para estimar os
coeficientes de regress˜ao no modelo de regress˜ao m´ultipla.
Suponha quen>k observa¸c˜oes estejam dispon´ıveis e fa¸caxij
denotar a i-´esima observa¸c˜ao da vari´avelxj. As observa¸c˜oes s˜ao:
y x1 x2 · · · xk
y1 x11 x12 · · · x1k
y2 x21 x22 · · · x2k
... ... ... ...
yn xn1 xn2 · · · xnk
Anna Regina Corbo Regress˜ao Linear M´ultipla
Estima¸c˜ ao dos parˆ ametros pelo m´ etodo dos m´ınimos quadrados
Cada observa¸c˜ao (yi,xi1,xi2,· · · ,xik) satisfaz o modelo
y1=β0+β1x11+β2x12+· · ·+βkx1k+ε1
y2=β0+β1x21+β2x22+· · ·+βkx2k+ε2 ...
yi =β0+β1xi1+β2xi2+· · ·+βkxik +εi ...
yn=β0+β1xn1+β2xn2+· · ·+βkxnk+εn
Ou seja,
yi =β0+
k
X
j=1
βjxij +εi, para todoi variando de 1 a n.
A fun¸c˜ao dos m´ınimos quadrados ´e
L=
n
X
i=1
ε2i =
n
X
i=1
yi−
k
X
j=1
βjxij
2
eL deve ser minimizada com rela¸c˜ao a β0, β1,· · · , βk.
Anna Regina Corbo Regress˜ao Linear M´ultipla
Estima¸c˜ ao dos parˆ ametros pelo m´ etodo dos m´ınimos quadrados
As estimativas de m´ınimos quadrados deβ0, β1,· · · , βk tˆem de satisfazer
∂L
∂β0
=−2
n
X
i=1
(yi −βˆ0−βˆjxij) = 0
∂L
∂βj
=−2
n
X
i=1
(yi −βˆ0−βˆjxij)·xij = 0 para j = 1, 2, ..., k.
Simplificando as equa¸c˜oes acima, obtemos as equa¸c˜oes normais de m´ınimos quadrados:
nβˆ0+ ˆβ1
n
X
i=1
xi1+ ˆβ2
n
X
i=1
xi2+· · ·+ ˆβk
n
X
i=1
xik =
n
X
i=1
yi
βˆ0 n
X
i=1
xi1+ ˆβ1 n
X
i=1
xi12 + ˆβ2 n
X
i=1
xi1xi2+· · ·+ ˆβk
n
X
i=1
xi1xik =
n
X
i=1
xi1yi
... ... ... ... ...
βˆ0 n
X
i=1
xik + ˆβ1 n
X
i=1
xikxi1+ ˆβ2 n
X
i=1
xikxi2+· · ·+ ˆβk
n
X
i=1
xik2 =
n
X
i=1
xikyi
H´ak+ 1 equa¸c˜oes normais, para cada um dos coeficientes desconhecidos de regress˜ao.
A solu¸c˜ao para as equa¸c˜oes normais ser˜ao os estimadores de m´ınimos quadrados dos coeficientes de regress˜ao
β0, β1,· · ·, βk.
As equa¸c˜oes normais podem ser resolvidas por qualquer m´etodo apropriado para resolver um sistema de equa¸c˜oes lineares.
Anna Regina Corbo Regress˜ao Linear M´ultipla
Estima¸c˜ ao dos parˆ ametros pelo m´ etodo dos m´ınimos quadrados
O modelo
Y =β0+β1x1+β2x2+· · ·+βkxk +ε expresso a cada observa¸c˜ao (yi,xi1,xi2,· · · ,xik) por
yi =β0+β1xi1+β2xi2+· · ·+βkxik+εi
´e sistema den equa¸c˜oes que pode ser expresso na nota¸c˜ao matricial como:
Y =XB+E
Y =XB+E, onde:
Y =
y1 y2
... yn
X =
1 x11 x12 · · · x1k
1 x21 x22 · · · x2k
... ... ... ... ...
1 xn1 xn2 · · · xnk
B =
β0 β1
... βk
E =
ε0 ε1
... εn
A solu¸c˜ao do sistema ser´a o vetor dos coeficientesβj.
Anna Regina Corbo Regress˜ao Linear M´ultipla
Regress˜ ao Linear M´ ultipla - Exemplo 1
Construir um modelo de regress˜ao linear para a resistˆencia ao puxamento de um fio utilizado na fabrica¸c˜ao de semicondutores.
Obs. Res. Comp. Alt.
(y) (x1) (x2)
1 9,95 2 50
2 24,45 8 110
3 31,75 11 120
4 35,00 10 550
5 25,02 8 295
6 16,86 4 200
7 14,38 2 375
8 9,60 2 52
9 24,35 9 100
10 27,50 8 300
11 17,08 4 412
Obs. Res. Comp. Alt.
(y) (x1) (x2)
14 11,66 2 360
15 21,65 4 205
16 17,89 4 400
17 69,00 20 600
18 10,30 1 585
19 34,93 10 540
20 46,59 15 250
21 44,88 15 290
22 54,12 16 510
23 56,63 17 590
24 22,13 6 100
Desejamos obter o modelo de regress˜ao linear m´ultipla:
Y =β0+β1x1+β2x2+ε em que
Y = resistˆencia ao puxamento;
x1 = comprimento do fio e x2 = altura da garra.
Anna Regina Corbo Regress˜ao Linear M´ultipla
Regress˜ ao Linear M´ ultipla - Exemplo 1
Com dados da tabela calculamos:
n = 25
25
X
i=1
yi = 725,82
25
X
i=1
xi1 = 206
25
X
i=1
xi21= 2396
25
X
i=1
xi2 = 8294
25
X
i=1
xi22 = 3.531.848
25
X
i=1
xi1xi2 = 77177
25
X
i=1
xi1yi = 8008,37
25
X
i=1
xi2yi = 274.811,33
Para o modeloY =β0+β1x1+β2x2+εas equa¸c˜oes normais s˜ao:
nβˆ0+ ˆβ1
n
X
i=1
xi1+ ˆβ2
n
X
i=1
xi2=
n
X
i=1
yi
βˆ0 n
X
i=1
xi1+ ˆβ1 n
X
i=1
xi12 + ˆβ2 n
X
i=1
xi1xi2 =
n
X
i=1
xi1yi
βˆ0
n
X
i=1
xi2+ ˆβ1
n
X
i=1
xi1xi2+ ˆβ2
n
X
i=1
xi22 =
n
X
i=1
xi2yi
Anna Regina Corbo Regress˜ao Linear M´ultipla
Regress˜ ao Linear M´ ultipla - Exemplo 1
Substituindo as somas calculadas nas equa¸c˜oes normais, obtemos:
25 ˆβ0 + 206 ˆβ1 + 8294 ˆβ2 = 725,82 206 ˆβ0 + 2396 ˆβ1 + 77.177 ˆβ2 = 8.008,37 8294 ˆβ0 + 77.177 ˆβ1 + 3.531.848 ˆβ2 = 274.811,31 A solu¸c˜ao desse sistema linear ´e ˆβ0 = 2,263, ˆβ1= 2,744, βˆ2= 0,0125. Logo, a equa¸c˜ao ajustada de regress˜ao ´e
ˆ
y = 2,263 + 2,744x1+ 0,0125x2
Anna Regina Corbo Regress˜ao Linear M´ultipla
Modelo de regress˜ ao polinomial
Modelos de regress˜ao polinomial s˜ao largamente usados quando a resposta for curvil´ınea, porque os princ´ıpios gerais da regress˜ao m´ultipla podem ser aplicados.
Y =β0+β1x+β11x2+ε
Os pain´eis laterais para o interior de um avi˜ao s˜ao formados em uma prensa de 1500 toneladas. O custo da unidade de fabrica¸c˜ao varia com o tamanho do lote de produ¸c˜ao. Os dados mostrados a seguir fornecem o custo m´edio por unidade (em centenas de reais) para este produto (y) e o tamanho do lote de produ¸c˜ao (x). Qual o modelo de regress˜ao ajustado para esta situa¸c˜ao?
Anna Regina Corbo Regress˜ao Linear M´ultipla
Modelo de regress˜ ao polinomial - Exemplo 2
Para o modelo quadr´atico, a tabela de entrada dos dados ser´a:
y x x2
1,81 20 400 1,70 25 625 1,65 30 900 1,55 35 1225 1,48 40 1600 1,40 50 2500
y x x2
1,30 60 3600 1,26 65 4225 1,24 70 4900 1,21 75 5625 1,20 80 6400 1,18 90 8100
Anna Regina Corbo Regress˜ao Linear M´ultipla
Modelo de regress˜ ao polinomial - Sa´ıda Computacional
O modelo ajustado ser´a ˆ
y = 2,1982−0,02252x+ 0,000125x2
Anna Regina Corbo Regress˜ao Linear M´ultipla
Decis˜ ao sobre o modelo de regress˜ ao polinomial
No ajuste polinomial, geralmente gostamos de usar o modelo de menor grau que seja consistente com os dados.
Investigar a possibilidade de retirar o termo quadr´atico do modelo: teste de hip´oteses ou correla¸c˜ao entre as vari´aveis.
Se Fsign =p-value< α= 0,05 ent˜ao rejeite H0.
Anna Regina Corbo Regress˜ao Linear M´ultipla
Decis˜ ao sobre o modelo de regress˜ ao polinomial Correla¸c˜ ao
Modelo quadr´atico: coeficiente de correla¸c˜ao r2 = 0,9974.
Modelo de regress˜ao simples: r=−0,9688 como consequencia r2 = 0,9385.
Devemos aceitar o modelo de melhor r2 como o de melhor ajuste para os dados.