• Nenhum resultado encontrado

Regressão Linear Múltipla

N/A
N/A
Protected

Academic year: 2021

Share "Regressão Linear Múltipla"

Copied!
26
0
0

Texto

(1)

Prof. Lorí Viali, Dr.

http://www.pucrs.br/famat/viali/

viali@pucrs.br

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

O modelo de regressão linear múltipla

O modelo de regressão linear múltipla

Introdução

Introdução

Definição e terminologia

Definição e terminologia

Interpretação

Interpretação

Estimação

Estimação

Interpretação revisitada

Interpretação revisitada

Qualidade do ajuste

Qualidade do ajuste

Propriedades estatísticas

Propriedades estatísticas

R

egressão

L

inear

M

últipla

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Definição

Definição

Maior

Maior desvantagem

desvantagem::

Não

Não éé muito

muito adequado

adequado para

para modelar

modelar

relações

relações Ceteris

Ceteris Paribus

Paribus entre

entre variáveis,

variáveis,

pois

pois dificilmente

dificilmente

u

+

x

β

+

β

=

y

0

1

0

=

)

u

E(

=

)

x

|

u

E(

M

M

odelo

odelo de

de

R

R

egressão

egressão

L

L

inear

inear

SS

imples

imples

Outros

fatores

relevantes

permanecem

fixos.

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Ajuda

Ajuda aa encontrar

encontrar relações

relações Ceteris

Paribus entre

entre variáveis

variáveis;;

Melhora

Melhora oo ajuste

ajuste ao

ao dados

dados;;

Maior

Maior flexibilidade

flexibilidade..

M

M

odelo

odelo de

de

R

R

egressão

egressão

L

L

inear

inear

M

M

últipla

últipla

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Sejam

Sejam Y

Y ee X

X

11

,,...

...,, X

X

kk

– ““kk +

+ 11”” variáveis

variáveis

popula

populacionais

cionais..

O

O objetivo

objetivo éé explicar

explicar Y

Y em

em função

função de

de

X

X

11

,,...

...,, X

X

kk

,, isto

isto éé,, como

como Y

Y se

se altera

altera se

se uma

uma

ou

ou todas

todas as

as variáveis

variáveis X

X

11

,, ...

...,, X

X

kk

se

se

alteram

alteram..

D

D

D

D

D

D

D

D

efinição

efinição

efinição

efinição

efinição

efinição

efinição e

efinição

e

e

e

e

e

e

e

T

T

T

T

T

T

T

T

erminologia

erminologia

erminologia

erminologia

erminologia

erminologia

erminologia

erminologia

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Como

Como não

não há

há uma

uma relação

relação precisa

precisa entre

entre Y

Y ee

X

X

11

,,...

...,, X

X

kk

,, como

como levar

levar em

em conta

conta outros

outros fatores

fatores

que

que afetam

afetam Y

Y??

Qual

Qual aa verdadeira

verdadeira relação

relação funcional

funcional entre

entre Y

Y ee

X

X

ii

,, ii =

= 11,, 22,, ...

...,, kk??

Como

Como capturar

capturar uma

uma relação

relação ceteris

ceteris paribus

paribus

entre

entre Y

Y ee X

X

ii

,, ii =

= 11,, 22,, ...

...,, kk (se

(se este

este for

for oo caso)?

caso)?

P

(2)

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

O

O (MLRM)

(MLRM) Modelo

Modelo Linear

Linear

de

de

Regressão

Regressão Múltipla

Múltipla éé dado

dado pela

pela seguinte

seguinte

equação

equação::

U

X

β

X

β

X

β

β

Y

=

0

+

1

1

+

2

2

+

L

+

k

k

+

O

O

O

O

O

O

O

O

M

M

M

M

M

M

M

M

odelo

odelo

odelo

odelo

odelo

odelo

odelo

odelo

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Y

Y

:: variável

variável dependente,

dependente, variável

variável explicada,

explicada,

variável

variável

de

de

resposta,

resposta,

variável

variável

prevista,

prevista,

regressando,

regressando, saída,

saída, efeito

efeito..

X

X

ii

::

variáveis

variáveis

independentes,

independentes,

variáveis

variáveis

explicativas,

explicativas, variáveis

variáveis de

de controle,

controle, preditores

preditores,,

regressores

regressores,, entradas,

entradas, causas

causas..

U

U:: erro,

erro, distúrbio

distúrbio ou

ou ruído

ruído..

T

T

T

T

T

T

T

T

erminologia

erminologia

erminologia

erminologia

erminologia

erminologia

erminologia

erminologia

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

erros de medida;

forma funcional inadequada;

variabilidade

inerente

das

variáveis

envolvidas;

outros fatores além de

X

1

,...,

X

k

que afetam

a variável

Y

.

O termo

O termo

U

U

U

U

U

U

U

U

representa:

representa:

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Média nula

Média nula

E(U) = 0

E(U) = 0

Média condicional

Média condicional nula

nula

E(U| X

E(U| X

1,

1,

X

X

2,

2,

...,

..., X

X

kk

) = E(U) = 0

) = E(U) = 0

H

H

ipóteses

ipóteses

A

A

dicionais

dicionais

SS

obre

obre

U

U

U

U

U

U

U

U

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Para

estimar

os

parâmetros

β

0

,

β

1

,...,

β

k

da equação de regressão

múltipla é necessário uma amostra da

população

!

(

)

{

x

1

i

,

x

2

i

,

K

,

x

ki

,

y

i

:

i

=

1

,

K

,

n

}

O M

étodo dos

M

ínimos

Q

uadrados

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Considere uma amostra aleatória de

tamanho

n

nn

n

da população.

Supondo que esta amostra satisfaça o

modelo pode-se escrever:

i

ki

k

i

2

2

i

1

1

0

i

β

β

X

β

X

β

X

U

Y

=

+

+

+

L

+

+

Onde a letra i refere-se a i-ésima

observação.

(3)

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

A descrição do modelo de regressão

múltipla é normalmente apresentado de

forma matricial.

A equação anterior pode ser escrita

como:

U

β

X

Y

=

+

Onde:

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

=

=

=

=

U

...

U

U

U

β

...

β

β

β

X

...

X

X

...

...

...

...

X

...

X

X

X

...

X

X

X

Y

...

Y

Y

Y

n

2

1

k

1

0

nk

2

n

1

n

k

2

22

21

k

1

12

11

n

2

1

(nx1)

U

kx1

β

(nxk)

X

)

1

nx

(

Y

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Note-se que cada linha da matriz X

representa um conjunto de valores das variações

independentes referentes a

uma

uma

uma

uma observação

observação

observação

observação

, ao

passo cada coluna representa um conjunto de

valores de

uma

uma

uma

uma variável

variável

variável

variável independente

independente

independente

independente

nas

n

nn

n

observações amostrais. A primeira coluna de X é

composta inteiramente de valores iguais a um.

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

As hipóteses vistas para a regressão linear

simples podem ser colocadas na forma

matricial da seguinte forma:

)

Σ

,

0

(

N

~

U

Onde “0” é um vetor-coluna de zeros e Σ é

uma matriz nxn.

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Onde I

n

é uma matriz-identidade

de ordem nxn, com unidades na

diagonal principal e zeros em todo o

resto.

I

σ

2

n

Σ =

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Os elementos da matriz X são não

estocásticos com valores fixados em

amostras

repetidas,

e

a

matriz

((((1111/n)(X’X)

/n)(X’X)

/n)(X’X)

/n)(X’X)

é não singular e tal que, para

qualquer

tamanho

amostral,

seus

(4)

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Da mesma forma que na regressão linear

simples os estimadores de mínimos quadrados

dos coeficientes de regressão podem ser

obtidos, minimizando a soma dos quadrados

dos resíduos, isto é:

=

=

=

=

n

1

i

2

ki

k

i

1

1

0

i

n

1

i

2

i

(

Y

β

β

X

β

X

)

U

Φ

L

E

stimação dos

P

arâmetros

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

=

=

=

=

=

=

n

1

i

ki

i

0

1

1

i

k

ki

k

n

1

i

1

i

i

0

1

1

i

k

ki

2

n

1

i

i

0

1

1

i

k

ki

1

)

X

β

X

β

β

Y

(

X

2

Φ

....

....

...

...

)

X

β

X

β

β

Y

(

X

2

Φ

)

X

β

X

β

β

Y

(

2

Φ

β

β

β

L

L

L

Diferenciando

Φ

em relação aos parâmetros de

regressão:

β

1

,

β

2

, ...,

β

k

, tem-se:

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

=

=

=

=

=

=

=

=

=

=

=

+

+

+

=

+

+

+

=

+

+

+

=

n

1

i

2

k

n

1

i

2

i

ki

1

n

1

i

ki

0

n

1

i

ki

i

n

1

i

2

i

ki

k

n

1

i

2

i

2

1

n

1

i

2

i

0

n

1

i

2

i

i

n

1

i

ki

k

n

1

i

i

1

1

0

n

1

i

i

X

Y

X

X

Y

X

Y

ki

β

ˆ

...

X

X

β

ˆ

X

β

ˆ

....

....

...

...

X

X

β

ˆ

...

β

ˆ

X

β

ˆ

X

β

ˆ

...

X

β

ˆ

β

ˆ

n

Igualando cada derivada a zero e

reagrupando os termos, tem-se:

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

X

X

β

ˆ

X

β

ˆ

k

k

2

2

1

1

0

β

ˆ

β

ˆ

Y

=

L

Para resolver as equações normais de

mínimos quadrados, escreve-se a primeira

equação da seguinte forma:

Onde:

X

n

1

X

e

Y

n

1

Y

n

1

i

ki

k

n

1

i

i

=

=

=

=

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

E

stimação dos

P

arâmetros

Substituindo a equação anterior nas demais

equações, obtém-se após algumas simplificações:

k

kk

2

k

2

1

k

1

Yk

k

3

k

2

23

1

13

3

Y

k

2

k

2

22

1

12

2

Y

β

ˆ

β

ˆ

β

ˆ

...

...

...

...

β

ˆ

β

ˆ

β

ˆ

β

ˆ

β

ˆ

β

ˆ

m

m

m

m

m

m

m

m

m

m

m

m

=

=

=

L

L

L

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Onde:

(

)

(

)

(

)

(

)

K

,..,

2

,

1

k

,

j

Y

n

1

i

ij

j

ik

k

jk

n

1

i

k

ki

i

Yk

X

X

X

X

m

X

X

Y

m

=

=

=

=

=

(5)

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

E

stimação dos

P

arâmetros

Estas equações podem ser resolvidas

para

. A solução é simples,

porém trabalhosa. Se K = 2, isto é, para o

caso de duas variáveis, tem-se:

k

2

1

,

β

ˆ

,

..,

β

ˆ

β

ˆ

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

E

stimação dos

P

arâmetros

m

m

m

m

m

m

m

m

m

m

m

m

m

m

m

m

m

m

m

m

m

m

m

m

m

m

m

m

m

m

m

m

12

12

22

11

12

1

Y

11

2

Y

22

12

12

11

2

Y

12

1

Y

11

2

12

12

22

11

2

Y

12

22

1

Y

22

12

12

11

22

2

Y

12

1

Y

1

β

ˆ

β

ˆ

=

=

=

=

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

E

E

xemplo

xemplo

U

U

m

m

Considere os dados como sendo das

variáveis: Y = Quantidade vendida de um

produto, X

1

= Preço do produto e X

2

= Gasto

com a divulgação do produto. Determinar a

equação de regressão de Y em função de X

1

e

de X

2

.

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Q (kg)

Preço (R$)

Investimento (R$ mil)

55

55

100

100

550

550

70

70

90

90

630

630

90

90

80

80

720

720

100

100

70

70

700

700

90

90

70

70

625

625

105

105

70

70

735

735

80

80

70

70

560

560

110

110

65

65

715

715

125

125

60

60

750

750

115

115

60

60

690

690

130

130

55

55

715

715

130

130

50

50

650

650

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Y

X

1

X

2

Y

2

Y X

1

YX

2

X

1

X

2

55

55

100

100

550

550

70

70

90

90

630

630

90

90

80

80

720

720

100

100

70

70

700

700

90

90

70

70

625

625

105

105

70

70

735

735

80

80

70

70

560

560

110

110

65

65

715

715

125

125

60

60

750

750

115

115

60

60

690

690

130

130

55

55

715

715

130

130

50

50

650

650

X

1

2

X

2

2

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Onde

:

6300

75

,

125

3550

m

m

m

YY

2

Y

Y1

=

=

=

670

70

100

Y

X

X

2

1

=

=

=

5400

49000

250

2

m

m

m

12

22

11

=

=

=

(6)

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Então:

1578

,

116

1125

,

0

70

).

3077

,

1

(

100

1125

,

0

)

(

49000

.

2250

)

3550

).(

5400

(

75

,

125

.

2250

3077

,

1

)

(

49000

.

2250

75

,

125

).

5400

(

49000

.

3550

βˆ

5400

βˆ

5400

βˆ

0

2

2

2

1

=

=

=

=

=

=

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Assim a equação procurada, será:

X

X

1

0

,

11

2

1,31

-116,16

=

+

Desta forma, uma redução de R$10 no preço

do produto, sem investimento em publicidade,

aumentaria as vendas em em aproximadamente 13

kg. Um aumento na publicidade de 100 mil, sem

alteração no preço, aumenta as vendas em 11 kg.

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

E

E

xercício

xercício

U

U

m (Gujarati

m (Gujarati –

– 7.18)

7.18)

A tabela apresenta dados sobre o produto bruto

real, trabalho e capital real no setor industrial de

Taiwan.

(a) Ajuste os seguintes modelos aos dados da

tabela:

U

X

ln

α

X

ln

α

α

Y

ln

'

t

t

2

2

t

1

1

0

t

=

+

+

+

U

Y

t

=

β

0

+

β

1

X

1

t

+

β

2

X

2

t

+

t

(b) Qual modelo oferece melhor ajuste e por

quê?

Ano

Y

X

1

X

2

1958

1958

8911,4

8911,4

281,5

281,5

120753

120753

1959

1959

10873,2

10873,2

284,4

284,4

122242

122242

1960

1960

11132,5

11132,5

289,0

289,0

125263

125263

1961

1961

12086,5

12086,5

375,8

375,8

128539

128539

1962

1962

12767,5

12767,5

375,2

375,2

131427

131427

1963

1963

16347,1

16347,1

402,5

402,5

134267

134267

1964

1964

19542,7

19542,7

478,0

478,0

139038

139038

1965

1965

21075,9

21075,9

553,4

553,4

146450

146450

1966

1966

23052,0

23052,0

616,7

616,7

153714

153714

1967

1967

26128,2

26128,2

695,7

695,7

164783

164783

1968

1968

29563,7

29563,7

790,3

790,3

176864

176864

1969

1969

33376,6

33376,6

816,0

816,0

188146

188146

1970

1970

38354,3

38354,3

848,4

848,4

205841

205841

1971

1971

46868,3

46868,3

873,1

873,1

221748

221748

1972

1972

54308,0

54308,0

999,2

999,2

239715

239715

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

E

E

xercício

xercício

U

U

m (Gujarati

m (Gujarati –

– 7.18)

7.18)

Onde

Y = Produto Bruto real (em milhões de NT $*)

X

1

= Trabalho (por mil pessoas)

X

2

= Capital Real (em milhões deNT $)

(*) Dólares Novos de Taiwan

Fonte: Thomas Pei-Fan Chen”, “Economic Growth and Structural

Change in Taiwan - 1952/1972, A Production Function Approach”, tese de

doutorado não-publicada, Departamento de Economia, Centro de

Graduação, City University of New York, Junho de 1976, Tabela II.

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

(7)

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

F

orma

M

atricial

As equações normais do método dos

mínimos quadrados podem (e devem) ser

apresentadas em notação matricial, da

seguinte forma:

β

ˆ

)

X

'

X

(

Y

'

X

=

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Onde:

βˆ

...

βˆ

βˆ

βˆ

X

X

...

X

X

X

...

...

...

...

X

X

...

X

X

X

X

...

X

n

X

X'

Y

X

...

Y

X

Y

Y

'

X

k

1

0

ik

ik

2

i

ik

ik

ik

2

i

2

i

2

i

1

i

ik

2

i

ik i

1

i

i

i

=

=

=

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

A

A SS

olução

olução

)

Y

'

X

(

β

ˆ

=

(

X

'

X

)

1

A solução para

β

ˆ

será, então:

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

E

E

xemplo

xemplo

D

D

ois

ois

Considere os dados como sendo de três

variáveis, sendo uma dependente Y e duas

independentes X

1

e X

2

. Determinar a

equação de regressão de Y em função de X

1

e de X

2

.

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Y

X

1

X

2

33

22

11

22

33

55

44

55

33

55

77

66

88

88

77

i

i

2

2

1

1

0

i

β

β

X

β

X

U

Y

=

+

+

+

O modelo para este caso será dado por:

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

E

Y

E

Y

E

Y

E

Y

E

Y

5

2

1

0

5

4

2

1

0

4

3

2

1

0

3

2

2

1

0

2

1

2

1

0

1

β

ˆ

7

β

ˆ

.

8

β

ˆ

.

1

8

β

ˆ

.

6

β

ˆ

.

7

β

ˆ

.

1

5

β

ˆ

.

3

β

ˆ

.

5

β

ˆ

.

1

4

β

ˆ

.

5

β

ˆ

.

3

β

ˆ

.

1

2

β

ˆ

.

1

β

ˆ

.

2

β

ˆ

.

1

3

+

+

+

=

=

+

+

+

=

=

+

+

+

=

=

+

+

+

=

=

+

+

+

=

=

(8)

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

As equações podem ser expressas de

forma matricial, fazendo:

=

8

5

4

2

3

Y

=

7

8

1

6

7

1

3

5

1

5

3

1

1

2

1

X

=

β

ˆ

β

ˆ

β

ˆ

2

1

0

β

ˆ

=

e

e

e

e

e

5

4

3

2

1

E

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Tem-se, então:

+

=

=

e

e

e

e

e

β

ˆ

β

ˆ

β

ˆ

5

4

3

2

1

2

1

0

7

8

1

6

7

1

3

5

1

5

3

1

1

2

1

8

5

4

2

3

y

A forma matricial é, então: y = βx + e

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

A solução é dada por:

β

ˆ

=

(

X

'

X

)

1

Xy

'

Assim, para os valores dados, tem-se:

=

8

5

4

2

3

7

6

3

5

1

8

7

5

3

2

1

1

1

1

1

β

ˆ

7

8

1

6

7

1

3

5

1

5

3

1

1

2

1

7

6

3

5

1

8

7

5

3

2

1

1

1

1

1

1

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Resolvendo por partes:

=

120

130

22

130

151

25

22

25

5

X

X

'

=

111

131

22

y

X

'

=

130

100

72

100

116

140

72

140

1220

1016

1

)

X

X

(

'

1

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Os coeficientes serão:

=

=

25

,

0

00

,

1

50

,

0

111

131

22

130

100

72

100

116

140

72

140

1220

1016

1

β

ˆ

A equação de regressão, será:

2

1

i

0

,

50

X

0

,

25

.

X

=

+

Y

E

i

=

i

i

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

)

Y

(

)

Y

Y

(

Y

i

i

=

i

i

Na ANOVA a variabilidade entorno da

média geral é decomposta em variabilidade

dentro e entre tratamentos. Na Análise de

Regressão a variabilidade total é decomposta

em variabilidade sobre a regressão (Explicada)

e variabilidade devido a regressão

(Não-Explicada). Para mostrar esta decomposição

vamos partir da seguinte identidade:

(9)

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

)]

Y

(

)

Y

Y

(

[

)

Y

(

i

i

2

i

i

2

=

Elevando os dois lados ao quadrado, tem-se:

=

=

=

=

+

n

1

i

i

2

n

1

i

i

i

2

n

1

i

i

2

)

Y

(

)

Y

(

)

Y

Y

(

Manipulando algebricamente, tem-se:

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

=

=

=

n

1

i

2

i

Y

)

Y

(

SQT

VT

SQT (Soma dos Quadrados Total )

(

TSS = Total Sum of Squares

)

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

=

=

=

n

1

i

2

i

Y

)

(

SQE

VE

SQE (

SS

S

S

oma dos

Q

Q

Q

Q

uadrados

E

E

E

E

xplicados ou

Ajustados)

(

ESS = Explained Sum of Squares

)

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

=

=

=

=

=

n

1

i

2

n

1

i

2

i

(

Y

)

E

SQR

VR

i

i

SSR (

S

SS

S

oma dos

Q

Q

Q

Q

uadrados dos

R

R

R

R

esíduos)

(

RSS = Residual Sum of Squares

)

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

=

=

=

=

+

n

1

i

i

2

n

1

i

i

i

2

n

1

i

i

2

)

Y

(

)

Y

(

)

Y

Y

(

Assim:

SQT

=

SQR

+

SQE

n -1

=

(n - k - 1) +

k

G.L.

Assim, a tabela da ANOVA para a

Análise de Regressão, fica:

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Fonte

Fonte

Soma dos

Soma dos

Quadrados

Quadrados

GL

GL

Média dos

Média dos

Quadrados

Quadrados

F

F

Regressão

Regressão

SQE

SQE

kk

MQE=SQE/k

MQE=SQE/k

Resíduo

Resíduo

(Erro)

(Erro)

SQR

SQR

n

n –

– k

k -- 11

MQS =

MQS =

SQR/

SQR/

(n

(n –

– k

k –

– 1)

1)

MQE/MQS

MQE/MQS

(10)

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

SQT

SQR

1

SQT

SQE

R

2

=

=

(

)

(

)

(

)

(

)

 ∑

 ∑

 ∑

=

=

=

=

n

1

i

2

i

n

1

i

2

i

2

n

1

i

i

i

2

Y

Y

Y

Y

Y

Y

R

Como

Como na

na regressão

regressão simples

simples pode

pode--se

se

definir

definir oo coeficiente

coeficiente de

de determinação

determinação ou

ou R

R

22

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

R

2

é uma função não decrescente do

número de regressores. Conforme aumenta o

número

de variáveis

explicativas

R

2

geralmente também aumenta. Para verificar

isto, basta lembrar que:

VT

VR

1

VT

VE

R

2

=

=

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Então

é

independente do número de variáveis X

no modelo.

(

)

(

)

(

)

=

=

=

=

=

=

n

1

i

2

i

n

1

i

2

i

n

1

i

2

i

n

1

i

2

2

Y

Y

E

1

Y

Y

Y

1

R

i

i

(

)

=

=

n

1

i

2

i

Y

Y

VT

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Mas

depende

do

número

de

variáveis

independentes existentes no modelo.

Assim, pelo menos intuitivamente, a

medida que aumenta o número de variáveis

X, VR deve diminuir ou não aumentar.

(

)

=

=

=

=

n

1

i

2

n

1

i

2

i

Y

i

i

E

VR

Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística

Assim

R

2

,

conforme

definido

irá

aumentar. Desta forma ao se comparar dois

modelos de regressão com a mesma variável

dependente mas diferente número de variáveis

independentes,

deve-se

ter

cautela

na

Referências

Documentos relacionados

situação atual Realizar diagnóstico do consumo de papel no campus, informando por exemplo qual tipo de papel utilizado, qual a fi nalidade da utilização, a existência de

Não-Conforme ou Defeito: A falha está em uma única unidade. Por exemplo, um item de vestuário pode apresentar descolorações indevidas, falta de botões ou imperfeições na

atender as suas necessidades e ainda garantir o seu bom funcionamento – aparece como o principal preditor do impacto da TI no desempenho organizacional, seguida pelas pressões

Usaremos o Gráfico Xbar para acessar a estabilidade da média do processo quando os dados são coletados em subgrupos racionais.. Acessaremos a estabilidade da variação do

No caso em análise, percebemos que a exigência do item 15.6.1 (autorização para aquisição de armas) não deveria constar das exigências de habilitação, uma

• O controle por modulação de largura de pulso utiliza frequências de chaveamento mais altas, concorrendo para a redução das dimensões dos equipamentos e

Regras gerais para as conexões de comunicação (consulte Fig. As portas de compartilhamento atuais devem ser ocupadas apenas para as unidades em que houver mais de uma unidade

Sem ater-se à distinção entre Física Clássica, Moderna e Contemporânea na listagem de Ostermann e Moreira (1998), é importante observar que, apesar do trabalho refletir o anseio