ESTATÍSTICA MULTIVARIADA 2º SEMESTRE 2010 / 11
EXERCÍCIOS PRÁTICOS - CADERNO 3 Distribuição Normal Multivariada
3.1.
Considere três variáveis bidimensionais (X1 , X2) com distribuição normal e parâmetros
16 6
6 4 0
0
. A
A A
16 1
1 4 0
0
. B
B B
4 3
3 4 0
0
. C
C C
e três conjuntos de contours
a) Diga, justificando, qual a correspondência entre os parâmetros A, B e C e os contours I, II e III. (Note que só a justificação é pontuável, mas não desperdice nela o tempo que lhe pode fazer falta. Seja conciso.)
b) Vai agora desenhar o contour correspondente a f(X1 , X2) = 0.02 para cada uma das três distribuições.
3.2.
Considere a variável bidimensional (X1 , X2) com distribuição Normal. Desenhe o contour correspondente a f(X1, X2) = 0.06 quando:
a) 1 = 2 = 0 ; 1
2= 1 ; 2
2 = 1; = 0;
b) 1 = 2 = 0 ; 1
2= 1 ; 2
2 = 4; = 0;
c) 1 = 2 = 0 ; 12= 1 ; 22 = 1; = 0.2;
d) 1 = 2 = 0 ; 1
2= 1 ; 2
2 = 4; = 0.2;
I II III
3.3.
Admita uma amostra de 50 PME’s para as quais se mediram, em milhares de contos:
X1 (resultados em 98) e X2 (resultados em 99).
A partir desta amostra calcularam-se:
8 . 0
3 .
X 0 e
4 3 8 1
8 1 3 2
. .
. S .
Será de aceitar a possibilidade de serem zero os resultados das empresas nestes dois anos?
3.4.
Uma empresa procurou avaliar (numa escala de 0 a 10) o grau de satisfação dos seus clientes com dois produtos (P1 e P2), e em duas cidades A e B.
Foram inquiridos 15 clientes na cidade A e 11 clientes na cidade B aos quais se pediram:
X1 (satisfação com P1) e X2 (satisfação com P2).
A partir destas amostras calcularam-se:
6
XA 3 e
6 3 3
3 3 2
. .
SA
e
9
XB 2 e
9 7 2
7 2 4 1
. . .
SB
Será de aceitar a possibilidade de serem iguais as médias das distribuições dos níveis de satisfação nas duas cidades?
3.5. (do teste de Estatística Multivariada de 2.Maio.2000)
Considere um banco que está a caracterizar a sua rede de balcões nas áreas da Grande Lisboa e do Grande Porto. Para tentar comparar os balcões nas duas zonas recolheu informação sobre o número de clientes (C) e volume de depósitos (D) que se apresentam no Anexo I, com os quais foram calculadas as médias e variâncias e covariâncias, também apresentadas no mesmo Anexo.
Pode assumir-se que o centro da distribuição da dimensão dos balcões caracterizada por estas duas variáveis é o mesmo para as duas regiões? Justifique.
Anexo I
Grande Lisboa Grande Porto
Balcão Clientes
(milhares)
Depósitos
(milhões de contos) Balcão Clientes
(milhares)
Depósitos
(milhões de contos)
1 1.425 34.675 1 1.154 38.745
2 1.732 45.786 2 1.845 42.735
3 1.429 78.112 3 2.180 38.325
4 3.241 12.995 4 3.267 58.235
5 2.589 24.667 5 1.983 40.017
6 3.267 22.487 6 2.045 37.435
7 1.798 48.773 7 1.345 23.675
8 2.480 31.754 8 0.972 19.125
9 2.123 46.118
10 4.178 45.997
Médias
2.426 39.136 1.849 37.287
Variâncias
0.7434 299.6332 0.4604 124.2903
Covariâncias
-7.322 6.5245
3.6. (do teste de Estatística Multivariada de 25.Outubro.2004)
Uma empresa tem o seu mercado dividido em dezassete regiões, nas quais utiliza canais de distribuição muito diferentes e políticas de preço também muito diferentes. Com o intuito de perceber o impacto da política de preços nas suas vendas, construiu para cada uma das regiões um índice de preços (tendo em conta as diferenças de poder de compra) e um índice de vendas (tendo em conta diferentes indicadores de penetração de mercado). Os resultados apresentam-se no Quadro 1, onde
X1 é o índice de preços praticado;
X2 é índice de vendas.
Região X1 X2
1 101.0 99.2
2 100.1 120.0
3 100.0 110.0
4 90.6 111.6
5 76.5 122.2
6 89.7 117.6
7 95.6 121.1
8 82.8 136.0
9 70.1 154.2
10 65.4 153.6
11 61.3 158.5
12 62.5 140.6
13 63.6 136.2
14 77.6 148.0
15 79.7 134.3
16 59.5 149.0
17 91.3 135.5
Quadro 1
A partir do quadro podemos calcular:
X11 367.3
X2 2 247.6
X12113 472.8
X22302 032.4
X1X2177 323.0 com os quais se obteve:a) Com os agregados apresentados, complete a matriz de variâncias-covariâncias. (Está fora de questão ir inverter a matriz S1. Esta só é apresentada para que não a tenha de calcular mais à frente.)
b) Vai testar, em separado, a possibilidade da média do índice de preços ser 85 (H0 : X1 = 85) e a possibilidade da média do índice de vendas ser 140 (H0 : X2 = 140). Para este segundo teste apoie- se no seguinte output do SPSS que deverá completar, justificando o cálculo de A a E:
One-Sample Test
Test Value = 140
t df Sig. (2-tailed)
Mean Difference
95% Confidence Interval of the Difference Lower Upper
X2 - Indice Vendas A B ,084 C D E
c) Teste a hipótese nula
H :0 85 140
Como compara o resultado do teste agora efectuado com os testes anteriores? Parece-lhe haver contradição? Justifique.
d) Se assumir
80 135
, apresente a região centrada na média a que pode associar uma probabilidade de 95%.[ Nota: Para facilitar os cálculos que tem de fazer, saiba que um dos valores próprios de S é 481.57 .]
3.7. (do teste de Estatística Multivariada de 23.Março.2009)
Um consultor de investimentos está a ponderar publicar uma Nota de Research sobre a evolução do preço de quatro metais a partir de índices construídos nos respectivos três mercados de referência:
X1 – índice para o preço do cobre X2 – índice para o preço do alumínio X3 – índice para o preço da prata X4 – índice para o preço do ouro
Para tal reuniu os respectivos valores nos últimos 30 trimestres. Parte da amostra recolhida está apresentada no quadro que se segue:
X1 X2 X3 X4
108,77 107,00 81,61 92,08 109,23 107,60 89,27 102,82 110,18 108,40 88,62 104,52
… … … …
115,03 114,10 80,06 111,78 115,52 114,70 87,61 123,84 116,22 115,10 87,30 125,05
Tendo em consideração os cálculos efectuados pelo consultor que entretanto foram recuperados:
(X1 - X2)2 X3 X3
2 X4 (X4 - X4)2 X3 . X4 (X3 - X4)2
3,15 81,61 6660,83 92,08 2,27 7515,04 109,55
2,66 89,27 7969,98 102,82 150,06 9179,57 183,58
3,18 88,62 7852,77 104,52 194,37 9261,73 252,80
… … … … … … …
0,86 80,06 6410,06 111,78 449,59 8949,22 1005,81
0,68 87,61 7675,24 123,84 1106,45 10849,17 1312,51
1,26 87,30 7621,99 125,05 1188,36 10917,05 1424,49
∑ 30,30 2321,73 182801,94 2717,21 5674,99 212994,27 8596,82
Correlation Matrix
X1 X2 X3 X4
Correlation X1 1,000 ,995 -,320 ,497
X2 ,995 1,000 -,340 ,490
X3 -,320 -,340 1,000
X4 ,497 ,490 C 1,000
Sig. (1-tailed) Descriptive Statistics
108.3803 4.91823
107.5767 4.49894
X1 X2
Mean St d. Dev iation
enquanto que o do alumínio se terá ficado pelos 106. Assim, foi testar, em separado, essas duas hipóteses.
Parte do output do SPSS foi recuperado e está apresentado de seguida:
One-Sample Test
1.920 29 ? 1.57667 -.1033 3.2566
X2
t df Sig. (2-tailed)
Mean
Dif f erence Lower Upper 95% Conf idence
Interv al of the Dif f erence Test Value = 106
b) A que conclusão terá chegado o consultor? Sem efectuar cálculos, qual a sua estimativa para o p- value associado ao segundo teste? Justifique.
c) Teste a seguinte hipótese nula: H :0
110 106
. Comente o resultado obtido.Quer agora explorar mais a relação entre os preços destes quatro metais.
d) Foi representar as distribuições conjuntas de (X1 , X2) e (X3 , X4) tendo obtido o gráficos A e B (não necessariamente pela ordem correspondente às variáveis).
a. Estes contours terão sido obtidos a partir das variáveis originais ou padronizadas?
Justifique.
b. Qual a correspondência entre os dois gráficos e as variáveis? Justifique, não só fazendo corresponder os pares a cada gráfico, mais ainda os eixos às variáveis.
e) Volte a olhar para a matriz de correlações apresentada acima. Um dos níveis de significância que lá
A B
3.8. (do teste de Estatística Multivariada de 4.Abril.2010)
Um colega seu pretende aproveitar a recente polémica em torno da designação PIIGS1 para fazer um estudo sobre a situação económica de 10 países europeus.
Bélgica 0 -1.2 -13.5 ***
França 0 -0.4 *** 9.6
Alemanha 0 -0.3 -17.7 ***
Holanda 0 0.3 *** 3.6
Reino Unido 0 1.5 -10.8 7.8
Grécia 1 0.7 -9.5 9.7
Irlanda 1 *** -2.6 12.2
Itália 1 0.1 -15.9 7.8
Portugal 1 *** -7.0 9.9
Espanha 1 -1.1 -15.0 18.7
País PIIGS Inflação Produção
Industrial Desemprego
Fonte: Joint IMF-OECD Statistics, 2010
Note que todas as variáveis estão expressas em percentagem e se referem à evolução verificada no terceiro trimestre de 2009, à excepção da variável categórica PIIGS que assume o valor 1, caso o país pertença a esse grupo.
Como informação adicional, foram-lhe facultados os seguintes resultados:
Correlati ons
1. 0000 -. 5257 ***
.1186 .2528
38. 8000 *** -29.2900
*** -5.0944 ***
10. 0000 10. 0000 10. 0000
-. 5257 *** -. 0690
.1186 .8498
*** 196.0360 ***
-5.0944 *** -1.2636
10. 0000 10. 0000 10. 0000
*** -. 0690 1. 0000
.2528 .8498
-29.2900 *** 138.5890
*** -1.2636 ***
10. 0000 10. 0000 10. 0000 Pears on C orrelation
Sig. (2-t ailed) Sum of Squares and Cross-products Cov ariance N
Pears on C orrelation Sig. (2-t ailed) Sum of Squares and Cross-products Cov ariance N
Pears on C orrelation Sig. (2-t ailed) Sum of Squares and Cross-products Cov ariance N Inf laç ão
Produção Industrial
Des emprego
Inf laç ão
Produção
Indust rial Des emprego
Inflação 2,00
-2,00 0,00 -4,00
Produção Industrial
-5,00 -10,00 Holanda
Desemprego
20,00
15,00
10,00 Portugal Grécia
Reino Unido Irlanda
França Espanha
Bélgica Itália Alemanha
-15,00 5,00
-6,00
1.00 .00 PIIGS
Report
-. 0200 -12.0400 7. 3200
5 5 5
*** 3. 93103 2. 22531
*** 1. 75801 .99519
-. 3000 -11.2000 7. 8000 -1.5800 -10.0000 11. 6600 Mean
N
Std. Dev iation Std. Error of Mean Median Mean PIIGS .00
1. 00
Inf laç ão
Produção
Indust rial Des emprego
...
...
2.5390
...
...
11.0950
2.5390 11.0950
...
PIIGS
S
a) Considera a inflação um problema significativo na Europa? Realize o teste apropriado, explicitando a hipótese nula e apresentado o respectivo intervalo de confiança.
De seguida, irá encontrar um conjunto de testes que o seu colega realizou com a ajuda do SPSS.
Independent Samples Test
*** .231 1. 220 *** .257 *** *** *** 4. 50934
1. 220 5. 102 .276 1. 56000 *** *** ***
*** .367 -. 670 *** *** *** *** *** ***
-. 670 7. 197 *** *** *** *** ***
1. 383 .273 *** *** *** -4.34000 *** *** .59237
*** 6. 054 .088 *** *** -9.56255 ***
Equal v ariances ass umed Equal v ariances not as sumed Equal v ariances ass umed Equal v ariances not as sumed Equal v ariances ass umed Equal v ariances not as sumed Inf laç ão
Produção Industrial
Des emprego
F Sig.
Lev ene's Test f or Equality of Varianc es
t df
Sig.
(2-tailed)
Mean Dif f erence
Std. Error
Dif f erence Lower Upper 95% Conf idence
Interv al of the Dif f erence t-test f or Equality of Means
b) Qual terá sido a intenção do seu colega ao fazer estes testes?
c) A que conclusão terá chegado o seu colega? Justifique cuidadosamente com todos os cálculos que tiver que efectuar.
d) Caso tivesse considerado a correlação entre as variáveis, teria o seu colega chegado a uma conclusão distinta?
e) Apresente um intervalo de confiança a 95% para o centro da distribuição conjunta da produção industrial e do desemprego nos países do grupo PIIGS.