INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO
Estatística II - Licenciatura em Gestão – Época de Recurso – 25/01/2010 Parte prática (questões de escolha múltipla) – (6 valores)
Nome: _____________________________________________________________ Nº _____________
Espaço reservado para a classificação (não escrever aqui)
Grupo I (Cotação: 0 a 3 valores: uma resposta certa vale 1,5 valores e uma errada – 0,50 valores) a) Admite-se que o número de golos por jogo de futebol seja uma variável aleatória com distribuição de Poisson. Sabendo que numa amostra de 306 jogos se registaram 758 golos e pretendendo-se estimar um intervalo de confiança a 90% (aproximado) para o número médio de golos por jogo, qual das alternativas abaixo indicadas é a correcta?
1. (2,301 ; 2,653) 2. (2,329 ; 2,625) 3. (2,477 ± 0,05)
4. Os dados fornecidos são insuficientes para calcular o intervalo de confiança pretendido.
b) Num inquérito a empresas industrais pedia-se-lhes que dissessem qual a importância atribuída ao facto de possuirem marcas próprias. As respostas eram dadas numa escala qualitativa de 1 (pouca importância), 2 e 3 (muita importância). Os resultados obtidos na resposta a esta questão foram relacionados com a origem do capital da empresa de forma a analisar a possível associação ou independência entre a origem do capital e a importância atribuída às marcas. No quadro abaixo apresentam-se, entre outros, os resultados brutos obtidos no inquérito. Tendo por base esses resultados, e testando a hipótese de independência, qual das seguintes afirmações está correcta?
1. Rejeita-se a hipótese de independência num teste de dimensão 1%.
2. O valor-p do teste é superior a 10%.
3. Rejeita-se a hipótese de independência num teste de dimensão 5%.
4. Nada se pode concluir pois não se verificam alguns dos pressupostos que garantem a validade do teste.
a) Com dados relativos a 41 anos consecutivos estimou-se um modelo de regressão linear u
t
linvest=β1 +β2 +β3Pr+ , em que se procurou relacionar o (logaritmo) do investimento anual em habitação (linvest) com um termo de tendência (variável t = 1,2,...,41) e o valor do índice de preços da habitação no ano (variável Pr). Apresentam-se abaixo alguns resultados obtidos com o EXCEL:
SUMMARY OUTPUT ANOVA
df SS MS F Significance F
Regression 2 2,58924 1,29462 85,76368 8,17173E-15
Residual 38 0,57362 0,01510
Total 40 3,16285
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 12,92847 0,50258 25,72401 0,00000 11,91104 13,94589
t 0,02967 0,00300 9,90285 0,00000 0,02361 0,03574
Pr -0,02253 0,00611 -3,68800 0,00070 -0,03489 -0,01016
Qual das seguintes afirmações é correcta?
1. A variável explicativa Pr não é estatisticamente relevante pois o seu coeficiente é negativo.
2. Neste ajustamento, o coeficiente de determinação ajustado é superior ao coeficiente de determinação.
3. Neste modelo, os regressores explicam 81,86% da variação total de linvest.
4. O valor do erro padrão da regressão é de 0,01501.
5. A taxa de crescimento anual do investimento em habitação é de cerca de 0,3%.
b) Com os resíduos obtidos na estimação anterior, uˆt, estimou-se a regressão uˆt =δ0+δ1t+δ2Pr+αuˆt−1+εt, tendo-se obtido os seguintes resultados com o EXCEL:
Regression Statistics
Multiple R 0,50814
R Square 0,25821
Adjusted R Square 0,19639
Standard Error 0,10831
Observations 40
Atendendo à regressão estimada e aos resultados apresentados, qual das seguintes afirmações é verdadeira?
1. Rejeita-se a hipótese (a 5%) de existir heterocedasticidade no modelo uˆt =δ0+δ1t+δ2Pr+αuˆt−1+εt.
2. Rejeita-se a hipótese (a 5%) de ausência de autocorrelação de ordem 1 no modelo u
t
linvest =β1 +β2 +β3Pr+ .
3. Não se rejeita a hipótese (a 5%) de existir heterocedasticidade no modelo linvest =β1 +β2t+β3Pr+u. 4. Não se rejeita a hipótese (a 5%) de autocorrelação de ordem 1 no modelo uˆt =δ0+δ1t+δ2Pr+αuˆt−1+εt. 5. A regressão estimada não faz sentido para o tipo de dados que estão a ser analisados.
INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO
Estatística II - Licenciatura em Gestão – Época de Recurso – 25/01/2010 Parte prática (questões de desenvolvimento) – (8 valores)
Nome: _____________________________________________________________ Nº ____________
Grupo III (As questões deste grupo são respondidas no espaço para as mesmas reservado. A cotação máxima de cada uma é de 2,0 valores)
1.
a) Pretende-se uma estimativa por intervalos, com 95% de confiança, para o desvio padrão do peso de embalagens de 1000 gramas obtidas por empacotamento mecânico. Admitindo normalidade, e sabendo que numa amostra de 81 pacotes se obteve 81 ( ) 1725
1
2 =
∑ −
=
i xi x , qual a estimativa para o desvio padrão do peso das embalagens?
b) Na universidade A, numa amostra aleatória de 425 alunos encontraram-se 105 fumadores. Na universidade B, encontrou-se uma frequência relativa de 0,20 fumadores numa amostra aleatória de 275 alunos. Com estes dados, existirá evidência estatística suficiente para concluir que a percentagem de fumadores é diferente nas duas universidades? Justifique com um teste adequado de dimensão 5%.
2 - Estimou-se um modelo de regressão com o objectivo de analisar o salário anual dos presidentes executivos das empresas cotadas na Bolsa. A variável dependente é o logaritmo dos salários, as variáveis explicativas são: o logaritmo das vendas (lnvendas), o rendimento dos capitais próprios (rcp, em %), e três variáveis artificiais que indicam o sector de actuação das empresas (ind=industrial; fin=financeiro; spub=prestação de serviços públicos). O sector não referenciado é o dos bens de consumo. Os resultados da estimação com o EXCEL foram os seguintes:
Regression 5 22,6379 4,5276 29,0984 Residual 201 31,2747 0,1556
Total 206 53,9125
lnvendas 0,26115 0,02753
rcp 0,01195 0,00369
ind -0,09594 0,07339
fin 0,06448 0,08368
spub -0,37303 0,09400
a) – Analise a significância estatística do coeficiente da variável lnvendas e interprete o valor obtido.
b) Existindo dúvidas sobre a relevância estatística das variáveis ind, fin e spub, estimou-se um modelo sem essas variáveis (mas mantendo as restantes) que proporcionou o seguinte quadro:
ANOVA
df SS MS F Significance F
Regression 2 18,55799 9,27899 53,54089 0,00000
Residual 204 35,35456 0,17331
Total 206 53,91254
Essas variáveis devem ser mantidas no modelo? Justifique a sua opção e tire conclusões (use 5% como dimensão do teste).
INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO
Estatística II - Licenciatura em Gestão – Época de Recurso – 25/01/2010 Parte teórica – (6 valores)
Nome: ____________________________________________________________ Nº ____________
1. Questões de Verdadeiro/Falso (2 valores). Para cada afirmação, assinale se esta é verdadeira (V) ou falsa (F). Uma resposta certa vale 0,25 e uma resposta errada penaliza em idêntico valor.
V F Com a mesma amostra, a amplitude de um intervalo de confiança a 95% é menor que
a amplitude de um intervalo de confiança a 90%.
O estimador da variância,
n X X T
n
i i
n
∑=
−
= 1
)2
(
, é não enviesado.
No teste de uma hipótese estatística, o valor-p não depende da dimensão, α, do teste.
Num teste de independência, a frequência observada,nij, de qualquer célula não deve ser inferior a 5.
No modelo de regressão linear com termo independente a soma dos resíduos é nula.
No modelo yt =β1+β2 xt2 +β3xt3+ut, seE(ut |X)≠0 os estimadores dos mínimos quadrados dos coeficientes de regressão são enviesados.
Num modelo de regressão linear, com dados temporais, não pode existir heterocedasticidade.
No modelo yt =β1+β2xt2+β3xt3+ut, a verificar as hipóteses básicas, se xt3 é uma variável artificial, entãoE(yt |X,xt3 =1)=β3 +β2xt2.
2. Questões de resposta múltipla (2 valores). Escolha a alternativa correcta com um X. Uma resposta certa vale 0,5 valores e uma resposta errada penaliza em 0,25 valores.
a) Sejam Tnie Tniidois estimadores diferentes para θ, a verificar E(Tni)=θ e E(Tnii)=θ, respectivamente. Nestas condições, pode concluir-se que:
[ ] Tnié relativamente mais eficiente queTniise Var(Tni)>Var(Tnii), ∀n.
[ ] Tniie Tni são estimadores mais eficientes se limn→∞Var(Tni)=0 e limn→∞Var(Tnii)=0. [ ] Tnié menos eficiente queTniise Var(Tni)>Var(Tnii), ∀n.
b) Num teste de hipótese simples contra alternativa simples, qual das seguintes afirmações é verdadeira ?
[ ] Quanto menor a probabilidade de erro de 2ª espécie, menor é a potência do teste.
[ ] Quanto menor a probabilidade de erro de 1ª espécie, maior é a potência do teste.
[ ] Quanto menor a probabilidade de erro de 1ª espécie, menor é a potência do teste.
c) Seja o modelo de regressão linear ln(y )=β1+β2ln(x2)+β3x3 +u . Neste caso, ceteris paribus:
[ ] β2 representa a variação percentual aproximada dey quando ∆x2 =1.
[ ] β3 representa a variação linear aproximada dey quando 1∆x3 = .
[ ] β3 representa a variação relativa aproximada dey quando 1∆x3 = .
) ,..., 2 , 1
(t = n e se verificam as restantes. Então,
[ ] Os estimadores MQ dos coeficientes de regressão deixam de ser não enviesados.
[ ] Os testes t e F usuais deixam de ser válidos.
[ ] Existirá autocorrelação nos termos residuais do modelo.
3. Perguntas de desenvolvimento (2 valores) – Cada resposta certa vale 1 valor.
a) Admita que, numa população normal de variância conhecida, pretende testar H0:µ =µ0contra
0 1:µ >µ
H e que, recolhida a amostra, obteve x<µ0. Mostre que, nesse caso, não rejeitaria a hipótese nula, para as dimensões de teste usuais, pois o valor-p do teste é maior que 0.50.
b) Mostre que o modelo de regressão ln(yt)=β1+β2ln(xt2)+β3ln(xt22)+ut, está mal definido e não pode ser estimado pelo método dos mínimos quadrados.