• Nenhum resultado encontrado

Regressão Linear

N/A
N/A
Protected

Academic year: 2021

Share "Regressão Linear"

Copied!
41
0
0

Texto

(1)

Regressão Linear

Tal como a análise de correlação, a regressão linear simples é uma técnica usada para explorar a natureza da relação entre duas variáveis aleatórias contínuas.

A regressão nos possibilita investigar a mudança em uma variável, chamada

resposta, correspondente à mudança na

(2)

Regressão Linear

A análise de correlação não faz essa distinção; as duas variáveis envolvidas são tratadas simetricamente.

O objetivo máximo da análise de regressão é prever ou estimar o valor da variável resposta associada com um valor fixo da variável explicativa.

(3)

Regressão Linear

Exemplo: Peso médio, em quilogramas, de indivíduos do sexo masculino, segundo a idade, no Distrito Federal.

Idade Peso médio

3 14,6 4 16,3 5 17,8 6 19,8 7 21,6 8 23,8 9 26,3 10 28,4 11 30,9 12 34,2 13 38,7 14 43,4 15 49,7 16 52,7 17 57,3 18 58,1 19 59,4 0 10 20 30 40 50 60 70 0 5 10 15 20 P e so (kg) Idade (anos)

(4)

Regressão Linear

Exemplo: Peso médio, em quilogramas, de indivíduos do sexo masculino, segundo a idade, no Distrito Federal.

0 10 20 30 40 50 60 70 0 5 10 15 20 P e so (kg) Idade (anos)

(5)

Regressão Linear

Observe que os pontos estão

praticamente sobre uma reta, logo a

variação do peso em função da idade pode ser descrita através de uma reta que, em estatística, recebe o nome de reta de regressão. Qual a equação de uma reta?

a

bx

(6)

Regressão Linear

Precisamos determinar o valor de b

(coeficiente angular) e o valor de a

(coeficiente linear). O valor de b da à

inclinação da reta, enquanto, a fornece o

ponto onde a reta corta o eixo das ordenada, ou seja, corta o eixo Y.

(7)

Regressão Linear

 

 

n

x

x

n

y

x

xy

b

2 2

a

y

b

x

Para traçar a reta de regressão é preciso dar valores arbitrários para X e depois calcular os valores de Y. Indicam-se

(8)

Regressão Linear

Idade (X) Peso médio (Y) XY X^2

3 14,6 43,80 9 4 16,3 65,20 16 5 17,8 89,00 25 6 19,8 118,80 36 7 21,6 151,20 49 8 23,8 190,40 64 9 26,3 236,70 81 10 28,4 284,00 100 11 30,9 339,90 121 12 34,2 410,40 144 13 38,7 503,10 169 14 43,4 607,60 196 15 49,7 745,50 225 16 52,7 843,20 256 17 57,3 974,10 289 18 58,1 1045,80 324 19 59,4 1128,60 361 187 593 7777,3 2465

(9)

Regressão Linear

          n x x n y x xy b 2 2

a

y

b

x

 

2465 2057 3,074 6523 3 , 7777 17 187 2465 17 593 187 3 , 7777 2         b

066

,

1

11

074

,

3

882

,

34

a

066

,

1

074

,

3

ˆ

x

y

(10)

Regressão Linear

Exemplo: Peso médio, em quilogramas, de indivíduos do sexo masculino, segundo a idade, no Distrito Federal.

y = 3,0743x + 1,0654 R² = 0,9703 0 10 20 30 40 50 60 70 0 5 10 15 20 P eso (kg) Idade (anos) Título do Gráfico

(11)

Regressão Linear

Coeficiente de determinação

O coeficiente de determinação R2, é o

quadrado do coeficiente de correlação de Pearson r.

Proporção da variabilidade entre os valores observados de Y, explicada pela reta de regressão linear de Y sobre X.

(12)

Porcentagem de crianças imunizadas contra DPT e taxa de mortalidade de cinco anos para 20 países, 1992.

Nação Porcentagem Imunizada Taxa de Mortalidade por 1.000 Nascidos Vivos

Bolívia 77 118 Brasil 69 65 Camboja 32 184 Canadá 85 8 China 94 43 República Tcheca 99 12 Egito 89 55 Etiópia 13 208 Finlândia 95 7 França 95 9 Grécia 54 9 Índia 89 124 Itália 95 10 Japão 87 6 México 91 33 Polônia 98 16 Federação Russa 73 32 Senegal 47 145 Turquia 76 87 Reino Unido 90 9

(13)

Regressão Linear

Porcentagem de crianças imunizadas contra DPT e taxa de mortalidade de cinco anos para 20 países, 1992.

0 50 100 150 200 250 0 20 40 60 80 100 Ta xa d e Mort alid ade Porcentagem

(14)

Nação Porcentagem Imunizada Taxa de Mortalidade por 1.000 Nascidos Vivos XY X^2 Y^2 Bolívia 77 118 9086 5929 13924 Brasil 69 65 4485 4761 4225 Camboja 32 184 5888 1024 33856 Canadá 85 8 680 7225 64 China 94 43 4042 8836 1849 República Tcheca 99 12 1188 9801 144 Egito 89 55 4895 7921 3025 Etiópia 13 208 2704 169 43264 Finlândia 95 7 665 9025 49 França 95 9 855 9025 81 Grécia 54 9 486 2916 81 Índia 89 124 11036 7921 15376 Itália 95 10 950 9025 100 Japão 87 6 522 7569 36 México 91 33 3003 8281 1089 Polônia 98 16 1568 9604 256 Federação Russa 73 32 2336 5329 1024 Senegal 47 145 6815 2209 21025 Turquia 76 87 6612 5776 7569 Reino Unido 90 9 810 8100 81 1548 1180 68626 130446 147118

(15)

Correlação

 

 

                   

 

n y y n x x n y x xy r 2 2 2 2

7911

,

0

r

R

2

0

,

6258

(16)

Regressão Linear

          n x x n y x xy b 2 2

a

y

b

x

130446 119815,2 2,1359 91332 68626 20 1548 130446 20 1180 1548 68626 2          b

3187

,

224

4

,

77

)

1359

,

2

(

59

a

3187

,

224

1359

,

2

ˆ

x

y

(17)

Regressão Linear

Porcentagem de crianças imunizadas contra DPT e taxa de mortalidade de cinco anos para 20 países, 1992.

y = -2,1359x + 224,32 R² = 0,6258 0 50 100 150 200 250 0 20 40 60 80 100 Ta xa d e Mort alid ade Porcentagem

(18)

Na próxima tabela é apresentado parte, dos resultados de um experimento de competição de híbridos de milho para região preferencial, com altitudes abaixo de 800 m – safra: 1987/1988.

(19)

Altura da Planta (cm) Altura da Espiga (cm) 242 103 258 134 240 104 243 108 257 128 241 108 242 114 240 103 253 123 250 117

Regressão Linear

(20)

Para a amostra de 10 indivíduos.

a) Construa um gráfico de dispersão

bidimensional para esses dados.

b) Há alguma evidência de uma relação linear entre a altura da planta e a altura da espiga?

c) Calcule r,o coeficiente de correlação de Pearson.

d) Calcule a reta de regressão e o coeficiente de determinação.

(21)

Regressão Linear

100 105 110 115 120 125 130 135 140 235 240 245 250 255 260 Altur a da Espig a Altura da Planta

(22)

Regressão Linear

Altura da Planta (cm)(X) Altura da Espiga (cm) (Y) XY X^2 Y^2 242 103 24926 58564 10609 258 134 34572 66564 17956 240 104 24960 57600 10816 243 108 26244 59049 11664 257 128 32896 66049 16384 241 108 26028 58081 11664 242 114 27588 58564 12996 240 103 24720 57600 10609 253 123 31119 64009 15129 250 117 29250 62500 13689 2466 1142 282303 608580 131516

(23)

Regressão Linear

y = 1,4767x - 249,97 R² = 0,921 100 105 110 115 120 125 130 135 140 235 240 245 250 255 260 Altur a da Espig a Altura da Planta

(24)

Regressão Linear

Escolha da variável Explanatória (Explicativa)

Em situações em que os valores de X são fixados a priori ajusta-se a regressão de Y contra X.

Nem sempre os valores de X são fixados a priori.

É razoável identificar a variável que deve ser prevista, conhecendo o valor da outra variável.

(25)

Regressão Linear

Valores de duas variáveis quaisquer X e Y

X Y 0,00 4,00 0,60 8,00 1,20 15,00 1,50 22,60 1,80 36,40 2,10 45,30 2,40 60,00

(26)

Regressão Linear

0,00 10,00 20,00 30,00 40,00 50,00 60,00 70,00 0,00 0,50 1,00 1,50 2,00 2,50 3,00 Y X

(27)

Regressão Linear

0,00 10,00 20,00 30,00 40,00 50,00 60,00 70,00 0,00 0,50 1,00 1,50 2,00 2,50 3,00 Y X

(28)

Regressão Linear

Transformações de variáveis

Existem situações em que os pares de valores das variáveis X e Y, apresentados em diagramas de dispersão, não se

distribuem em torno de uma reta.

Em termos práticos pode-se fazer um diagrama de dispersão com o logaritmo

decimal de Y em lugar de Y, ou com 1/X ao invés de X.

(29)

Regressão Linear

0,00 0,50 1,00 1,50 2,00 0,00 0,50 1,00 1,50 2,00 2,50 3,00 Lo g(Y) X

Valores de duas variáveis quaisquer X e Log(Y)

(30)

Regressão Linear

X Y Z=Log(Y) XZ X^2 Z^2 0,00 4,00 0,6021 0,0000 0,0000 0,3625 0,60 8,00 0,9031 0,5419 0,3600 0,8156 1,20 15,00 1,1761 1,4113 1,4400 1,3832 1,50 22,60 1,3541 2,0312 2,2500 1,8336 1,80 36,40 1,5611 2,8100 3,2400 2,4370 2,10 45,30 1,6561 3,4778 4,4100 2,7427 2,40 60,00 1,7782 4,2676 5,7600 3,1618 9,60 191,30 9,0307 14,5397 17,4600 12,7364

(31)

Regressão Linear

          n x x n y x xy b 2 2

x

b

y

a

          n x x n y x y x b 2 2 log log

x

b

y

a

log

          n x x n z x xz b 2 2

x

b

z

a

(32)

Regressão Linear

 

17,46 13,16571 0,50177 38496 , 12 5397 , 14 7 6 , 9 46 , 17 7 0307 , 9 6 , 9 5397 , 14 2         b 60196 , 0 37143 , 1 50177 , 0 2901 , 1     a

60196

,

0

50177

,

0

ˆ

log

y

x

60196

,

0

50177

,

0

ˆ

x

z

(33)

Regressão Linear

y = 0,5018x + 0,602 R² = 0,9957 0,00 0,50 1,00 1,50 2,00 0,00 0,50 1,00 1,50 2,00 2,50 3,00 Lo g(Y) X

(34)

Regressão Linear

0,00 10,00 20,00 30,00 40,00 50,00 60,00 0,00 100,00 200,00 300,00 400,00 500,00 600,00 700,00 800,00 Y X

Horas decorridas após a hepatectomia (remoção de parte do fígado) e tempo de sono, em minutos, induzido por injeção intraperitoneal de 40 mg de metohexital por quilo de peso vivo, em

(35)

Regressão Linear

0,00 10,00 20,00 30,00 40,00 50,00 60,00 0,00 100,00 200,00 300,00 400,00 500,00 600,00 700,00 800,00 Y X

Horas decorridas após a hepatectomia (remoção de parte do fígado) e tempo de sono, em minutos, induzido por injeção intraperitoneal de 40 mg de metohexital por quilo de peso vivo, em

(36)

Regressão Linear

0,00 10,00 20,00 30,00 40,00 50,00 60,00 0,000 0,010 0,020 0,030 0,040 0,050 y Z

Horas decorridas após a hepatectomia (remoção de parte do fígado) e tempo de sono, em minutos, induzido por injeção intraperitoneal de 40 mg de

(37)

Regressão Linear

Horas

Decorridas (X)

Tempo de

Sono (Y) Z=1/X Z*Y Z^2

24,00 51,57 0,04167 2,148750 0,0017361111 48,00 35,68 0,02083 0,743333 0,0004340278 120,00 28,05 0,00833 0,233750 0,0000694444 240,00 29,58 0,00417 0,123250 0,0000173611 480,00 21,87 0,00208 0,045563 0,0000043403 720,00 18,90 0,00139 0,026250 0,0000019290 1632,00 185,65 0,07847 3,320896 0,0022632137

(38)

Regressão Linear

          n x x n y x xy b 2 2

x

b

y

a

                    n x x n y x y x b 2 2 1 1 1 1 x b y a   1 aybz             n z z n y z zy b 2 2

(39)

Regressão Linear

8546

,

721

b

6 07847 , 0 0022632137 , 0 6 65 , 185 07847 , 0 320896 , 3 2     b

0010262568

,

0

0022632137

,

0

427993

,

2

320896

,

3

b

(40)

Regressão Linear

50103

,

21

0130783

,

0

8546

,

721

94167

,

30

a

50103

,

21

1

8546

,

721

ˆ

x

y

50103

,

21

8546

,

721

ˆ

z

y

(41)

Regressão Linear

y = 721,83x + 21,501 R² = 0,9402 0,00 10,00 20,00 30,00 40,00 50,00 60,00 0,000 0,010 0,020 0,030 0,040 0,050 y Z

Horas decorridas após a hepatectomia (remoção de parte do fígado) e tempo de sono, em minutos, induzido por injeção intraperitoneal de 40 mg de

Referências

Documentos relacionados

A estas variáveis incluiu-se ainda um efeito moderador de modo a estudar a influência de uma situação de insolvência sobre as variáveis que estão associadas

Na regressão simples apenas duas variáveis são consideradas: uma dependente (y) e outra independente (x).. O modelo dado

• Dados de Painel ou longitudinal: vários indivíduos ou unidades (os mesmos) observados ao longo do tempo.... Causalidade e a noção de Ceteris Paribus na

A importância da correlação e da regressão linear está associada em algumas decisões gerenciais, que são baseadas na relação entre duas ou mais variáveis, como a relação entre

Para lidar com o problema de regressão linear múltipla, é mais conveniente usar notação matricial, pois assim tem-se uma apresentação muito compacta dos dados, do modelo e dos

VI) Análise dos resíduos: Realizados os cálculos e análises anteriores, vamos avaliar os resíduos para avaliar a qualidade do ajuste.. (normalidade, igualdade de

Segundo Koenig, a medicina tem sido mais precisa e científica, mas também mais reducionista, pois as enfermidades têm sido compreendidas como um fenômeno localizado, afetando

COMUNITÁRIA DE DESENVOLVIMENTO RURAL VINTE E NOVE DE AGOSTO INFORMAÇÕES INCOMPLETAS NA FICHA DE CREDENCIAMENTO ASSOCIAÇÃO COMUNITÁRIA DE DESENVOLVIMENTO RURAL