Gabarito - Lista 2 Exerc´ıcio 1.
Seja X a vari´avel notas. Temos que var(X) = 3.44. var(X) = 1.67 · 6 + 2 · 5 + 5.23 · 7
18 = 3.15
R2= 1 − var(X)
var(X) = 0.084.
a) 70 75 80 85 90 95 100 95 100 105 110 115
Despesas com propaganda
Ve nd as 20 25 30 35 95 100 105 110 115 Temperatura Ve nd as Figura 1: b) corr(Y, Z) = 0.27 corr(Y, X) = 0.78
A vari´avel que explica melhor as vendas ´e a vari´avel temperatura, uma vez que o valor absoluto do coeficiente de correla¸c˜ao linear entre as vari´aveis vendas e temperatura ´e maior do que entre as vari´aveis vendas e despesas com propaganda.
c)
A reta de regress˜ao entre a vari´avel vendas (y) e temperatura (x) ´e dada por: y = 1.07x + 74.45
O coeficiente b = 1.07 representa o acr´escimo m´edio de 1.07 nas vendas do rem´edio para cada aumento de um grau Celsius na temperatura m´edia do trimestre.
Tabela 1: Frequˆencias relativas de gripe, considerando os dois grupos de pessoas: com ou sem asma. Gripe
Asma sim n˜ao total
sim 0.443 0.557 1
n˜ao 0.472 0.528 1 total 0.460 0.540 1 b)
Risco de gripe para o grupo com asma: Rasma = 0.443
Risco de gripe para o grupo sem asma: Rsem-asma = 0.472
O risco relativo de gripe ´e dado por RRgripe = Rsem-asmaRasma = 0.938
A partir do risco relativo de gripe podemos concluir que o risco de gripe no grupo de pessoas que tem asma ´e 0.938 vezes maior que o risco de gripe no grupo de pessoas que n˜ao tem asma. Como esse valor ´e pr´oximo de 1 dizemos que nesse caso n˜ao existe associa¸c˜ao entre as vari´aveis.
a)
Tabela 2: Valores esperados assumindo independˆencia entre as vari´aveis. Classifica¸c˜ao Material I Material II Material III Total
Destru´ıdo 20 90 80 190
Pequenos defeitos 40 70 70 180
Perfeito 40 40 50 130
Total 100 200 200 500
Nesse caso temos que χ2 = 22.26.
C = s χ2 χ2+ n = 0.21 T = s χ2/n (r − 1)(s − 1) = 0.11
b) Para obter o valor de referˆencia da distribui¸c˜ao χ2 com 4 graus de liberdade devemos obter o valor c tal que P (χ2(4) > c) = 0.05. Consultando a tabela χ2 obtemos que c = 9.488. Dessa forma, como o valor observado 22.26 ´e maior que o valor de referˆencia 9.488 conclu´ımos que existe dependˆencia entre as vari´aveis.
Tabela 3: Valores da variˆancia da vari´avel consumo de g´as per capita dentro de cada grupo (rede el´etrica). Rede de energia el´etrica n var
sim 48591 382.50
n˜ao 876 418.36
Dessa forma obtemos que var = 383.13 e R2 = 0.0035.
Temos que 0.35% da varia¸c˜ao total do consumo de g´as per capita ´e explicado pela existˆencia de rede de energia el´etrica.
b)
Tabela 4: Tabela de dupla entrada para as vari´aveis “Rede geral de energia el´etrica (sim, n˜ao)” e “Aqueci-mento de ´agua por g´as (sim, n˜ao)”.
aquecimento de ´agua por g´as
Rede de energia el´etrica sim n˜ao Total
sim 1390 47201 48591
n˜ao 23 853 876
Total 1413 48054 49467
Obtemos χ2= 0.17. c)
Tabela 5: Tabela de dupla entrada para as vari´aveis “Rede geral de energia el´etrica (sim, n˜ao)” e “Tipo de domic´ılio”.
Tipo de domicilio
Rede de energia el´etrica casa apartamento comodo Total
sim 45683 2563 345 48591
n˜ao 863 0 13 876
Total 46546 2563 358 49467
Obtermos: χ2 = 55.18.
d) Como o valor da estat´ıstica χ2 obtida para as vari´aveis rede de energia el´etrica e aquecimento por ´
agua est´a mais pr´oximo de zero temos um ind´ıcio de n˜ao associa¸c˜ao entre essas vari´aveis.
De fato, ao obter o valor de referˆencia da distribui¸c˜ao χ2 com 1 grau de liberdade obtemos c = 3.841 (P (χ2(1) > 1) = 0.05). Como o valor observado ´e menor que o valor de referˆencia temos que essas vari´aveis s˜ao independentes. Por outro lado, no item (c), o valor de referˆencia para a distribui¸c˜ao χ2 com 2 graus de liberdade ´e igual a c = 5.991. Assim, como o valor observado ´e maior que o valor de referˆencia temos a existˆencia de associa¸c˜ao entre a presen¸ca de rede de energia el´etrica na residˆencia e o tipo de domic´ılio.