respostas gujarati.pdf

(1)

CAPÍTULO 1

A NATUREZA DA ANÁLISE DE REGRESSÃO

1.1 (a) A seguir temos a tabela com as taxas de inflação (%) calculadas ano sobre ano

com início em 1974, pois não há dados anteriores a 1973.

CANADÁ FRANÇA ALEMANHA ITÁLIA JAPÃO REINO UNIDO Estados Unidos 10,78431 13,58382 6,847134 19,41748 23,17328 0,157706 0,110360 10,84071 11,70483 5,961252 17,07317 11,69492 0,244582 0,091278 7,584830 9,567198 4,360056 16,66667 9,559939 0,164179 0,057621 7,792208 9,563410 3,638814 19,34524 8,171745 0,158120 0,065026 8,950086 9,108159 2,730819 12,46883 4,225352 0,083026 0,075908 9,320695 10,60870 4,050633 15,52106 3,685504 0,134583 0,113497 9,971098 13,67925 5,474453 21,30518 7,701422 0,178679 0,134986 12,48357 13,27801 6,343714 19,30380 4,840484 0,119745 0,103155 10,86449 11,96581 5,314534 16,31300 2,938090 0,085324 0,061606 5,795574 9,487459 3,295572 14,93729 1,732926 0,046122 0,032124 4,282869 7,669323 2,392822 10,61508 2,304609 0,050100 0,043173 4,106972 5,827937 2,044791 8,609865 1,958864 0,060115 0,035611 4,128440 2,534965 –0,095420 6,110652 0,672430 0,034203 0,018587 4,317181 3,239557 0,191022 4,591440 0,000000 0,041775 0,036496 4,054054 2,725021 1,334604 4,985119 0,763359 0,049290 0,041373 4,951299 3,456592 2,728128 6,591070 2,367424 0,077229 0,048183 4,795050 3,341103 2,747253 6,117021 3,052729 0,095344 0,054032 5,608856 3,157895 3,654189 6,390977 3,231589 0,058704 0,042081 1,537386 2,405248 4,987102 5,300353 1,652174 0,036966 0,030103 1,789401 2,135231 4,504505 4,250559 1,283148 0,015980 0,029936 0,202840 1,602787 2,742947 3,916309 0,760135 0,024803 0,025606 2,159244 1,783265 1,830664 5,369128 –0,167645 0,033648 0,028340 1,585205 2,021563 1,498127 3,870652 0,167926 0,024557 0,029528 1,625488 1,188904 1,697417 1,745283 1,676446 0,031215 0,022945 (b)

(2)

Legenda: PC = Canadá PF = França PG = Alemanha PI = Itália PJ = Japão

PUK = Reino Unido PUS = Estados Unidos

(c) Pelo gráfico, pode–se ver que, com o passar dos anos, houve, em geral, diminuição da taxa de inflação de todos os países.

(d) Pode–se usar o desvio-padrão como medida de flutuação das taxas. Para Canadá, França, Alemanha, Itália, Japão, Reino Unido e Estados Unidos os valores do desvio-padrão são respectivamente 0,036, 0,044, 0,018, 0,062, 0,051 e 0,032. Encontramos, assim, a maior flutuação nas taxas da Itália, e a menor, nas da Alemanha.

1.2 (a) A seguir está o gráfico com a representação das taxas de inflação dos seis países

em relação à dos Estados Unidos.

(b) O gráfico mostra que há correlação positiva entre as taxas de inflação dos seis países e a dos Estados Unidos.

(c) Lembre–se de que correlação não implica causalidade. Talvez seja necessário consultar um livro de macroeconomia internacional para saber se há uma relação causal entre a taxa de inflação dos Estados Unidos e as dos outros países.

(3)

1.3 (a) Para melhor visualização do gráfico, representamos o logaritmo da taxa de câmbio

no eixo vertical e o tempo no eixo horizontal.

Como se vê, as taxas de câmbio apresentam considerável flutuação. Em 1977, por exemplo, um dólar americano valia 268 ienes, mas somente 94 ienes em 1995.

(b) O cenário é, novamente, variado. Entre 1977 e 1995, por exemplo, o dólar americano se depreciou em relação ao iene, e daí começou a se apreciar. O panorama é semelhante em relação às outras moedas.

1.4 O gráfico da oferta de moeda M1, nos Estados Unidos, de janeiro de 1951 a setembro

de 1999, é o seguinte:

À medida que o PIB cresce ao longo do tempo, faz–se naturalmente necessário ampliar a oferta de moeda para financiar o aumento da produção.

(4)

1.5 Algumas das variáveis pertinentes seriam: (1) salários ou ganhos nas atividades

criminosas; (2) salários ou ganhos por hora em atividades lícitas; (3) probabilidade de ser apanhado; (4) probabilidade de condenação; (5) sentença esperada após a condenação. Repare que não deve ser fácil conseguir dados sobre ganhos em atividades ilegais. Mesmo assim, consulte o artigo de Gary Becker citado no livro-texto.

1.6 Um fator essencial nessa análise seria a taxa de participação na força de trabalho

(TPFT) de pessoas na faixa etária dos 65 aos 69 anos. Um aumento dessa taxa, se constatado após a entrada em vigência da nova lei, seria forte indício de que a lei anterior restringira artificialmente a participação desses cidadãos no mercado. Também seria interessante descobrir que tipos de empregos esses trabalhadores conseguem e quanto ganham. Os dados sobre PFT são coletados pelo Departamento do Trabalho (Estados Unidos).

1.7 (a), (b) & (c) De acordo com o gráfico, parece haver uma relação positiva, embora não

muito forte, entre as duas variáveis, indicando que pode valer a pena anunciar. Do contrário, más notícias para a indústria da publicidade.

Vertical = Impressões Horizontal = Desppub

(5)

CAPÍTULO 2

ANÁLISE DE REGRESSÃO COM DUAS VARIÁVEIS: ALGUMAS IDÉIAS BÁSICAS

2.1 A função informa como varia a resposta média das subpopulações de Y com os

valores dados da(s) variável(is) explanatória(s).

2.2 A distinção entre as funções de regressão amostral e populacional é importante,

pois aquela é um estimador desta. Na maioria dos casos, o que temos é uma amostra de observações da qual tentamos extrair informações sobre a população a que ela se refere.

2.3 Um modelo de regressão não é, de forma alguma, uma descrição absolutamente

fiel da realidade. Assim, é certo que haverá diferenças entre o valor real do regressando e seus valores estimados pelo modelo escolhido. Tal diferença é simplesmente o termo de erro estocástico, cujas diversas formas são discutidas no texto. O resíduo é a contrapartida amostral do termo de erro estocástico.

2.4 Embora seja certo que podemos usar o valor médio, o desvio-padrão e outras

medidas sumárias para descrever o comportamento do regressando, estamos em geral interessados em saber se há alguma força causal que o afeta. Se houver, poderemos fazer um melhor prognóstico do seu valor médio com a análise de regressão. Também não podemos esquecer que os modelos econométricos são quase sempre desenvolvidos para testar uma ou mais teorias econômicas.

2.5 É um modelo linear nos parâmetros, mas que pode ou não ser linear nas variáveis.

2.6 Os modelos (a), (b), (c) e (e) são modelos de regressão lineares (nos

parâmetros). O modelo (d) também será linear se fizermos α = lnβ1.

2.7 (a) Aplicando o logaritmo natural, obtemos lnYi = β1+β2 Xi + ui, que assim é um

modelo de regressão linear.

(b) A seguinte transformação, conhecida como logit, faz deste um modelo de regressão linear: ln[(1-Yi)/Yi] = β1+β2 Xi + ui.

(c) Modelo de regressão linear. (d) Modelo de regressão não-linear.

(6)

2.8 Um modelo de regressão intrinsecamente linear é aquele que se pode fazer linear

nos parâmetros, como o modelo em 2.7 (a). Se β2 na Questão 2.7 (d) fosse 0,8, esse

seria um modelo de regressão linear, já que 0,8(X_i 2)

e

− − pode ser facilmente calculado.

2.9 Todos são modelos de regressão intrinsecamente lineares, como demonstramos a

seguir:

(a) A transformação (1/Yi) = β1+β2 Xi converte o modelo em linear.

(b) Escrever o modelo como (Xi/Yi) = β1+β2 Xi converte-o em linear.

(c) A transformação ln[(1-Yi)/Yi] = –β1–β2 Xi converte o modelo em linear.

2.10 O gráfico de dispersão indica que, em média, os salários nos países que

exportam mais exibem maior crescimento real do que naqueles que exportam menos. É por isso que muitos países em desenvolvimento seguem uma política de crescimento voltada para a exportação. A linha de regressão traçada no gráfico é amostral, pois se baseia numa amostra de 50 países em desenvolvimento.

2.11 De acordo com o conhecidíssimo modelo de comércio de Heckscher-Ohlin, os

países têm tendência a exportar mercadorias que, para serem produzidas, utilizem intensivamente seus fatores de produção mais abundantes. Em outras palavras, este modelo enfatiza a relação entre dotação de fatores e vantagem comparativa.

2.12 O gráfico de dispersão mostra que quanto mais alto o salário mínimo, mais baixo

é o PNB per capita, indicando, portanto, que a legislação relativa à remuneração mínima pode não ser boa para os países em desenvolvimento, mas há controvérsia quanto a esse assunto. O resultado desse tipo de legislação pode depender do efeito que causa nos empregos, da natureza da indústria do local onde é imposta e da intensidade com que o governo a impõe.

2.13 É uma FRA porque se baseia numa amostra de 15 anos de observações. Os

pontos dispersos em torno da linha de regressão são de dados reais. A diferença entre as despesas em consumo reais e as estimadas pela linha representa o resíduo (amostral). Além do PIB, fatores como riqueza, taxa de juros etc. podem afetar as despesas em consumo.

(7)

2.14 (a) O gráfico de dispersão é o seguinte:

Vertical = TPFTCH Horizontal = TDCH

A relação positiva entre as duas variáveis parece surpreendente porque se esperaria, a

priori, que fossem negativamente relacionadas. Mas a hipótese do efeito do

trabalhador adicional da Economia do Trabalho sugere que quando o desemprego

aumenta, a força de trabalho secundária pode ingressar no mercado de trabalho para garantir alguma renda familiar.

(8)

HORIZONTAL = TDCM

Parece que temos aqui em ação a hipótese do efeito desalento da Economia do Trabalho: o desemprego desestimula as mulheres a participarem da força de trabalho por não acreditarem que haja oportunidades de emprego.

(c) A representação gráfica da TPFTCH em relação aos GHM82 mostra o seguinte:

VERTICAL = TPFTCH HORIZONTAL = GHM82

E representação gráfica correspondente para as mulheres é:

VERTICAL = TPFTCM HORIZONTAL = GHM82

(9)

Há uma relação assimétrica entre as duas variáveis para homens e mulheres. Os homens respondem positivamente a salários maiores, ao passo que as mulheres respondem negativamente, o que parece desconcertante. Pode ser que ganhos maiores resultantes de salários mais altos para os homens induzam as mulheres a se retirarem da força de trabalho, algo que pode acontecer com os casais. Mas é preciso ter cuidado, pois aqui estamos trabalhando com regressões simples de apenas duas variáveis. As conclusões anteriores podem mudar quando estudarmos análise de regressão múltipla.

2.15 (a) O gráfico de dispersão e a linha de regressão ficam assim:

Vertical = DESPALIM Horizontal = DESPTOT

(b) Na média, à medida que crescem as despesas totais também crescem as despesas com alimentação. Mas há uma flutuação maior entre as duas depois que as despesas totais passam de Rs. 2000.

(c) Não esperaríamos que as despesas com alimentação crescessem indefinidamente de forma linear (isto é, como uma linha reta). Satisfeitas as necessidades básicas das pessoas, elas gastarão menos em alimentação à medida que sua renda aumentar. Quer dizer, consumidores com renda mais alta fazem despesas mais discricionárias. Há sinais disso no gráfico de dispersão mostrado em (a): as despesas com alimentação mostram mais flutuação no nível de renda acima de Rs. 2000.

(10)

2.16 (a) A representação gráfica da pontuação de homens e mulheres em aptidão

verbal é a seguinte:

MALEVERB =VERBH FEMVERB = VERBM

E a representação correspondente da pontuação de homens e mulheres em matemática é a seguinte:

MALEMATH = MATH FEMMATH = MATM

(b) Ao longo dos anos, a pontuação de homens e mulheres em aptidão verbal mostra uma tendência descendente, enquanto depois de atingir o nível mais baixo em 1980, os cálculos mostram uma tendência ascendente, com variações ano a ano, é claro. (c) Pode-se elaborar um modelo de regressão simples, fazendo a regressão da pontuação em matemática contra a de aptidão verbal para ambos os sexos.

(11)

(d) O gráfico é o seguinte:

VERTICAL = VERBM HORIZONTAL = VERBH

O gráfico mostra que as duas pontuações evoluíram na mesma direção ao longo do tempo.

(12)

CAPÍTULO 3

MODELO DE REGRESSÃO DE DUAS VARIÁVEIS: O PROBLEMA DA ESTIMAÇÃO

3.1 (1) Yi = β1+β2Xi + ui, logo, E(Yi|Xi) = E[(β1+β2Xi + ui)|Xi]

E(Yi|Xi) = β1+β2Xi + E(ui|Xi), visto que β1eβ2 são constantes e X é não-estocástico. E(Yi|Xi) = β1+β2Xi, já que E(ui|Xi) = 0, por premissa.

(2) Dado que cov(uiuj)=0 para todo i,j (i≠j), então cov(YiYj) = E{[Yi - E(Yi)] [Yj - E(Yj)]}

cov(YiYj) = E(uiuj), dos resultados em (1)

cov(YiYj) = E(ui)E(uj), porque é premissa que os termos de erro não estão

correlacionados,

cov(YiYj) = 0, já que o valor médio de ui é zero, por premissa.

(3) Dado que var(ui|Xi) = σ2, var(Yi|Xi) = E[Yi - E(Yi)]2 = E(ui2) = var(ui|Xi) = σ2, por

premissa. 3.2 Yi Xi yi xi x_yi i xi 2 4 1 –3 –3 9 9 5 4 –2 0 0 0 7 5 0 1 0 1 12 6 5 2 10 4 soma 28 16 0 0 19 14 Nota:

Y

= 7 e

X

= 4. Logo,

ˆ

₂ ₂

19

14

i i i

x y

x

β

=

∑

=

∑

= 1,357;

β

ˆ

1

= −

Y

β

ˆ

2

X

= 1,572.

(13)

)

⎤ =

3.3 A FRP é: Yi = β1+β2Xi + ui.

Situação 1: β1 = 0, β2 = 1, e E(ui) = 0, resultando E(Yi|Xi) = Xi

Situação 2: β1 = 1, β2 = 0, e E(ui) = (Xi –1), o que dá E(Yi|Xi) = Xi, o mesmo resultado

da situação 1.

Logo, sem a premissa E(ui) = 0, não se pode estimar os parâmetros porque, como

acabamos de demonstrar, a mesma distribuição condicional de Y é obtida, embora os valores presumidos dos parâmetros sejam bem diferentes nas duas situações.

3.4 Impondo a primeira restrição, obtemos:

(

ˆ

1

ˆ

2

ˆ

i i i

0 u

=

Y

−

β β

−

X

=

∑

, equação que, simplificada, dá a primeira equação normal.

Impondo a segunda restrição, obtemos:

(

ˆ

1

ˆ

2

)

ˆ

_i _i _i _i _i

0 u X

=

⎡

_⎣

Y

−

β β

−

X

_⎦

∑

, equação que, simplificada, dá a segunda equação normal.

A primeira restrição corresponde à premissa de que E(ui|Xi) = 0. A segunda restrição

corresponde à premissa de que não há correlação entre o termo de erro populacional e a variável explanatória Xi, isto é, cov(uiXi)=0.

3.5 Da desigualdade de Cauchy-Schwarz temos que

2 2 2

(

)

1 (

) (

)

E XY

E X

E Y

≤

. Ora, 2 2 2 2

(

)

1

i i i i

x y

r

x

y

=

∑

∑ ∑

≤

2

, por analogia com a desigualdade de Cauchy–Schwarz, o que também é verdadeiro para

ρ

, o coeficiente de correlação populacional elevado ao quadrado. 3.6 Observe que i₂i yx i

x y

x

β

=

∑

e que 2 i i xy i

x y

y

β

=

∑

. Multiplicando as duas equações, obtemos a expressão para r2_{, o coeficiente de correlação amostral elevado ao}

(14)

ˆ

3.7 Mesmo que , ainda faria diferença (pela causalidade e teoria) se fosse feita a regressão de Y contra X ou de X contra Y, pois o que é igual a um é somente o produto das duas, e isso não implica que

ˆ

₁

yx xy

β β

⋅

=

yx xy

β

=

β

.

3.8 As médias das duas variáveis são iguais a:

1

2 n

Y

=

X

=

+

,

e a correlação entre os dois rankings é:

2 2 i i i i

x y

r

x

y

=

∑

∑ ∑

, (1)

em que as letras minúsculas, como sempre, indicam desvio dos valores médios. Como os rankings são permutações dos n primeiros números naturais, então:

2 2 2 2 2

(

)

(

1)(2

1)

(

1)

(

1

6

4

i i i

X

n n

n

n n

x

X

n

+

−

=

−

∑

=

−

=

∑

)

12

e, analogamente, 2 2

(

1

12

i

n n

y

=

−

∑

)

, então 2 2 2 2

2 (

1)(2

1)

(

)

(

2 )

2

6

i i i i i i i i

n n

n

d

=

X

−

Y

=

X

+

Y

−

X Y

=

+

−

X Y

∑

, logo 2

(

1)(2

1)

6

2

i i

d

n n

n

X Y

=

+

−

∑

. (2) Como i i i i i i

X

Y

x y

X Y

n

=

−

∑ ∑

∑

, usando (2), obtemos: 2 2 2 2

(

1)(2

1)

(

1)

(

1)

3

2

4

12 d

d

n n

+

n

+

n n

+

n n

−

∑

−

=

−

∑

2

. (3)

(15)

3.9 (a)

ˆ

₁

ˆ

₂ i

Y

X

β

= −

β

e

_ˆ

₁

_Y

ˆ

2

x

α

= −

β

[Observação:

x

i

=

(

X

i

−

X

)

]. 1

ˆ

Y

α

=

, já que

∑

x

_i

=

0

. var 2 2 1 2

ˆ

(

)

i i

X

n

x

β

=

∑

σ

∑

e var 2 2 2 1 2

ˆ

(

)

i i

x

n

x

n

σ

α

=

∑

σ

=

∑

.

Logo, nem as estimativas nem as variâncias dos estimadores são iguais.

(b)

ˆ

₂ i₂i i

x y

x

β

=

∑

e

ˆ

1 2 i i i

x y

x

α

=

∑

, já que

x

i

=

(

X

i

−

X

)

É fácil verificar que var

(

β

ˆ

₂

)

=

var

2 2 2

ˆ

(

)

i

x

σ

α

=

∑

.

Ou seja, as estimativas e as variâncias dos dois estimadores são idênticas.

(c) Pode ser mais fácil usar o modelo II com números X grandes, embora com os rápidos computadores atuais isso não seja mais um problema.

3.10 Como , ou seja, a soma dos desvios em relação ao valor médio é sempre zero,

0

i i

x

=

y

=

∑

x

e

y

também são iguais a zero (

x

= =

y

0

). Assim,

β

ˆ

₁

= −

y

β

ˆ

₂

x

=

0

. O

fato relevante aqui é que se tanto Y quanto X forem expressas como desvios em relação às respectivas médias, a linha de regressão passará pela origem.

2 2

(

)(

)

ˆ

(

)

i i i i i 2 i

x

x y

y

x y

x

β

=

−

∑

=

, já que as médias das duas variáveis são iguais a zero. Esta é a Equação (3.1.6) do livro-texto.

3.11 Sejam

Z

_i

=

aX

_i

+

b

e

W

_i

=

cY

_i

+

d

, que, em formato de desvios, tornam–se

e . Por definição, i i

z

=

ax

w

_i

=

cy

_i ₂ ₁ 2 2 2 2 i i i i i i i

z w

ac

x yi

r

z

w

ac

x

y

=

∑

=

∑

=

∑ ∑

na Equação (3.5.13) do texto.

3.12 (a) Verdadeira. Na Questão 3.11, façamos a e c iguais a -1 e b e d iguais a 0.

(16)

(c) Verdadeira. Como

r

xy

=

r

yx

>

0

,

S

xe (os desvios-padrão de X e Y

respectivamente) são ambos positivos, e

y

S

x yx yx y

S

r

S

β

=

e y xy xy x

S

r

S

β

=

, então

β

_xye

β

_yx têm de ser positivos.

3.13 Sejam Z=X1+X2 e W=X2+X3. Em formato de desvios, podemos escrevê–las como z=x1+x2 e w=x2+x3. Por definição, a correlação entre Z e W é:

2 1 2 2 3 2 2 2 2 2 2 2 2 2 1 2 2 3 1 2 2 3

(

)(

)

(

)

(

)

(

)(

i i zw i i

z w

x

r

z

w

x

+

=

+

∑

∑ ∑

∑

∑ ∑

∑

, porque

X1, X2 e X3 não são correlacionadas. (Nota: por conveniência, omitimos o subscrito de

observação). 2 2 2

1

2 (2

2

zw

r

σ

=

+

, em que 2

σ

é a variância comum.

O coeficiente não é zero porque os pares combinados são correlacionados, ainda que as variáveis X1, X2 e X3 não sejam individualmente correlacionadas.

Como acabamos de demonstrar, 2

zw

=

σ

∑

, denotando que a covariância entre z e w é uma constante diferente de zero.

3.14 Os resíduos e os valores ajustados de Y não mudarão. Sejam

Y

_i

=

β β

₁

+

₂

X

_i

+

u

_i e

1 2

i

Y

=

α α

+

Z

_i

+

u

_i, em que Z=2X. Empregando o formato de desvios, sabemos que

2 2

ˆ

xy

x

β

=

∑

, omitido o subscrito de observação.

2 2 2 2

2 _{1 ˆ}

ˆ

4

2

i i i i i i

z y

x y

z

x

α

=

∑

=

∑

=

β

∑

1 2

ˆ

_Y

ˆ

_X

β

= −

β

;

_ˆ

₁

_Y

_ˆ

₂

_Z

ˆ

1

α

= −

α

=

β

(Nota:

Z

=

2 X

)

Ou seja, o intercepto não é afetado. Em conseqüência, os valores ajustados de Y e os resíduos mantêm–se os mesmos ainda que Xi seja multiplicado por 2. A análise é

(17)

3.15 Por definição, 2 2 2 2 ˆ 2 2 2 2 2

ˆ

(

)

[

(

)( )]

ˆ

(

)(

)

(

)(

)

i i i i i i yy i i i i i

y y

y

u

y

r

y

+

=

∑

=

∑

=

∑

∑ ∑

∑

, já que

∑

y u

ˆ ˆ

i i

=

0

. 2 2 2 2 2 2 ˆ 2 2

ˆ

(

_i

)

_i yy i i

x

r

y

β

=

∑

=

∑

=

r

2 i

, aplicando a Equação (3.5.6) do texto.

3.16 (a) Falsa. A covariância pode assumir qualquer valor, e este depende das

unidades de medida. O coeficiente de correlação, por outro lado, não tem unidades, é uma grandeza adimensional.

(b) Falsa. Veja a Figura 3.11(h) no texto. Lembre–se de que o coeficiente de correlação é uma medida de relação linear entre duas variáveis. Daí, como mostra a Figura 3.11(h), há uma relação perfeita entre Y e X, mas ela não é linear.

(c) Verdadeira. Em formato de desvios, temos

y

_i

= +

y

ˆ

_i

u

ˆ

. Então é óbvio que se fizermos uma regressão de

y

_i contra

y

ˆ

_i, o coeficiente angular será 1, e o intercepto será 0. Mas uma prova formal pode ser feita como segue: se fizermos uma regressão de

y

_i contra

y

ˆ

_i, obteremos o coeficiente angular, digamos,

α

ˆ

, sob a forma

2 2 2 2 2

ˆ

1 ˆ

ˆ

i i i i i

y y

x y

y

x

β

α

β

=

∑

=

∑

=

∑

=

, porque

y

ˆ

i

=

β

ˆ

x

i e 2

ˆ

i i i

x y

=

β

x

∑

para o modelo de duas variáveis. O intercepto nesta regressão é zero.

3.17 Escreva a regressão amostral assim:

ˆ

₁

_ˆ

i

Y

=

β

+

u

i. Pelo princípio dos mínimos

quadrados, temos de minimizar: 2

_{ˆ )}

2 1

ˆ

_i

(

_i

u

=

Y

−

β

∑

. Derive essa equação em relação ao único parâmetro conhecido e iguale o resultado a zero para obter:

2

=

1 1

ˆ

(

)

_ˆ

2 (

)( 1)

0

i i

d u

Y

d

β

=

∑

−

β

−

, que simplificada dá 1

ˆ

_Y

β

=

, ou seja, a média amostral. E

sabemos que a variância da média amostral é 2

y

n

σ

, em que n é o tamanho da amostra

e

σ

2_{a variância de Y. A SQR é} 2 2

(

Y

i

−

Y

)

=

y

i

∑

e 2

)

2

ˆ

(

1)

(

1

i

y

SQR

n

σ

=

−

∑

−

. Vale a pena acrescentar a variável X ao modelo se ela reduzir 2

ˆ

σ

significativamente, o que acontecerá se ela tiver qualquer influência sobre Y. Resumindo, o que pretendemos nos modelos de regressão é que as variáveis explanatórias possam dar um prognóstico

(18)

2 2 2

_ˆ

2 2

i

formalmente. Recorde que para o modelo de duas variáveis obtido da Equação (3.5.2):SQR=STQ–SQE =

∑

y

_i

−

∑

y

ˆ

_i

=

∑

y

_i

−

β

₂

∑

x

. Logo, se

β

ˆ

₂ for diferente de

zero, a SQR do modelo que tenha no mínimo um regressor será menor do que a do modelo sem regressor. É claro que se houver mais regressores no modelo e seus coeficientes angulares forem diferentes de zero, a SQR será muito menor do que no modelo sem regressor.

Problemas

3.18 Tirando a diferença entre os dois rankings, obtemos:

d –2 1 –1 3 0 –1 –1 –2 1 2

d2_{4 1 1 9 0 1 1 4}₁₄

∑d2_{=26. Assim, o coeficiente de correlação de rankings de Spearman é} 2 2 2

6 6(26)

1

1 0,842

(

1)

10(10

1)

s

d

r

n n

= −

=

−

∑

_{. Há, portanto, um alto grau de correlação entre}

as posições dos estudantes nas provas de meio e de final de período: quanto mais alta ela for na primeira, mais alta será na segunda.

3.19 (a) O valor de –4,318 para o coeficiente angular indica que durante o período

1980–1994 a taxa de câmbio (marco/US$) baixou cerca de 4,32 unidades para cada unidade de aumento no preço relativo, em média. Isto é, o dólar americano depreciou, porque 1 dólar comprava menos marcos alemães. O valor de 6,682 para o intercepto, interpretado literalmente, significa que se a relação de preços relativos fosse zero, um dólar valeria 6,682 marcos alemães. Essa interpretação, é claro, não é economicamente significativa.

(b) O valor negativo do coeficiente angular faz muito sentido econômico porque se os preços nos Estados Unidos subirem mais rapidamente do que os da Alemanha, os consumidores internos passarão a comprar mercadorias alemãs, aumentando assim a demanda pelo marco alemão, o que levará à sua apreciação. Esta é a essência da teoria da paridade do poder de compra (PPC), ou lei do preço único.

(c) Acreditamos que, nesse caso, o coeficiente angular seria positivo, pois quanto maior fosse o IPC alemão em relação ao IPC americano, maior seria a taxa de inflação relativa na Alemanha, o que levaria à apreciação do dólar americano. Temos, outra vez, a essência da PPC.

(19)

3.20 (a) Os gráficos de dispersão são os seguintes:

VERTICAL = REMSEMP HORIZONTAL = PRODSEMP

Vertical = REMSENA Horizontal = PRODSENA

(20)

(b) Os dois gráficos mostram que há uma relação positiva entre remuneração e produção, o que não é surpresa, considerando a teoria da produtividade marginal da Economia do Trabalho.

(c) Os gráficos anteriores demonstram que a relação entre remuneração e produção, embora seja positiva, não é linear. É possível, portanto, que não se consiga um bom ajuste entre os dados e um modelo de regressão linear. Mas se, como de praxe, fizermos esse ajuste, teremos os seguintes resultados, nos quais SEMP é setor empresarial; SENA, setor empresarial não-agrícola; PROD, produção por hora; e REM, remuneração real por hora.

REMSEMP = –109,3833 + 2,0039 PRODSEMP

ep = (9,7119) (0,1176) r2_{= 0,8868} REMSENA = –123,6000 + 2,1386 PRODSENA

ep = (11,0198) (0,1312) r2_{= 0,8777}

Como esperado, a relação entre as duas é positiva. Surpreendentemente, o valor de r2

é bem alto. 3.21 ∑ Yi ∑ Xi ∑ Xi Yi ∑ Xi2 ∑ Yi2 Dados originais: 1110 1700 205500 322000 132100 Dados revisados: 1110 1680 204200 315400 133300 Portanto, o coeficiente de correlação corrigido é 0,9688.

3.22 (a) Se representarmos estas variáveis em relação ao tempo, veremos que, em

geral, subiram. Há, no caso do ouro, considerável volatilidade de preço. (b) Se a hipótese fosse verdadeira, seria de se esperar que

β

₂

≥

1

. (c) Preço do ourot = –186,183 + 1,842 IPCt

ep = (125,403) (1,125) r2_{= 0,150}

NYSEt = –102,060 + 2,129 IPCt

ep = (23,767) (0,230) r2_{= 0,868}

Parece que o mercado de ações é melhor garantia contra a inflação do que o ouro. Como veremos no Capítulo 5, o coeficiente angular da equação do preço do ouro não é estatisticamente significativo.

(21)

3.23 (a) Segue o gráfico, em que PIBN e PIBR são, respectivamente, PIB nominal e PIB real. NGDP = PIBN RGDP = PIBR (b) PIBNt = –986,3317 + 201,9772 tempo ep = (1907,715) + 128,7820 r2_{= 0,9277} PIBRt = 1907,715 + 128,7820 tempo ep = (45,1329) (1,9666) r2_{= 0,9914}

(c) Nesse caso, o coeficiente angular informa a taxa de variação do PIB por intervalo de tempo.

(d) A diferença entre os dois representa a inflação ao longo do tempo.

(e) Como indicam o gráfico e os resultados da regressão, o PIB nominal tem crescido mais rápido que o PIB real, sugerindo que a inflação tem subido com o passar do tempo.

3.24 Este é simples e direto.

3.25 (a) Veja o gráfico do Exercício 2.16(d).

(b) Seguem os resultados da regressão, em que Y é a pontuação das mulheres em aptidão verbal e X, a dos homens:

ˆ

t

Y

= -198,126 + 1,436

X

_t

(22)

(c) Como ressaltamos no texto, uma relação estatística, por mais forte que seja, não determina causalidade, a qual tem de ser estabelecida a priori. Neste caso, não há razão para suspeitar de relação causal entre as duas variáveis.

3.26 Os resultados da regressão são:

ˆ

t

Y

= -189,057 + 1,285

X

_t

ep = (40,927) (0,082) r2_{= 0,918.}

(23)

CAPÍTULO 4

A PREMISSA DA NORMALIDADE: MODELO NORMAL DE REGRESSÃO LINEAR CLÁSSICO (MNRLC)

Exercícios do Apêndice 4A.

4.1 Dado que o coeficiente de correlação entre Y1 e Y2, ρ, é igual a zero, a função de

densidade de probabilidade normal bivariada (de duas variáveis) fica reduzida a:

2 2 1 1 2 2 1 2 1 2 1 2

1

1 ( ,

)

exp

2

2 Y

Y

f Y Y

μ

πσ σ

σ

⎡

_⎛

₋

_⎞

_⎛

₋

_⎞

⎤

⎢

⎥

=

−

_⎜

_⎟

−

_⎜

_⎟

⎢

⎝

⎠

⎝

⎠

⎥

⎣

⎦

= 2 2 1 1 2 2 1 2 1 2

1

1 exp

exp

2

2 Y

μ

Y

μ

σ

π

σ

π

⎧

⎫⎧

_⎤⎪

⎫

⎥⎬

⎥⎪

⎦⎭

1 2

( ) ( )

⎡

_⎛

₋

_⎞

⎤

⎡

_⎛

₋

_⎞

⎪

_⎢

₋

_⎥

⎪⎪

_⎢

₋

⎨

⎜

⎟

⎬⎨

⎜

⎟

⎢

⎝

⎠

⎥

⎢

⎝

⎠

⎪

_⎣

_⎦

⎪⎪

_⎣

⎩

⎭⎩

f Y f Y

=

, em que 1

( )

f Y

e

f Y

( )

₂ são as funções de densidade de probabilidade normal univariadas (de uma variável). Então, quando ρ for zero,

f Y Y

( ,

₁ ₂

)

=

f Y f Y

( ) ( )

₁ ₂ , o que é a condição para independência estatística. Portanto, no caso normal bivariado, a correlação zero implica independência estatística.

4.2 Para assegurar que os estimadores de máxima verossimilhança maximizem a

função de verossimilhança, as derivadas segundas da Equação (5) do Apêndice 4A têm de ser menores que zero, o que garantirá que a SQR seja minimizada.

2 2 2 1

ln

0 LF

n

β

σ

∂

= −

<

∂

. 2 2 2 2 2

ln

0

i

X

LF

β

σ

∂

_{= −}

_<

∂

∑

. 2 2 2 1 2 2 2 2 2 2 3 2 2 2 2

ln

1

1 ˆ

(

)

(

)

2(

)

(

)

i i

2 (

)

LF

n

Y

β β

X

σ

⎛

⎞

∂

=

−

− −

=

_⎜

−

_⎟

∂

∑

_⎝

∑

u

i

_⎠

. Como 2 2 2 1 2 2 2 2 2 2

1

1 ˆ

ˆ

_ˆ

(

)

2(

)

(

)

i i i i

u

Y

β β

X

u

σ

⎛

⎞

=

− −

=

_⎜

−

_⎟

⎝

⎠

∑

_ˆ

2 i , da Equação (11), 2 2 2 3

1

1 ˆ

1

0 (

)

2

i î

u

σ

⎛

⎞

=

_⎜

−

_⎟

⎝

⎠

∑

<

.

Uma vez que todas as segundas derivadas são negativas, os estimadores maximizam a função de verossimilhança.

4.3 Como X segue a distribuição exponencial, sua função de densidade de

(24)

1 ( )

(

_i

)

f x

f X

e

θ

−

⎛ ⎞

=

_{= ⎜ ⎟}

⎝ ⎠

. Portanto, a função de verossimilhança será: 1

1 (

, )

exp

i n X i

FV X

θ

−

∑

⎛ ⎞

= ⎜ ⎟

_{⎝ ⎠}

. E log FV será:

ln

FV

n

ln

θ

X

i

θ

= −

−

∑

.

Derivando essa função em relação a θ, obtemos:

2

ln

1 X

i

d

FV

n

d

θ

⎛ ⎞

= −

_{⎜ ⎟}

+

⎝ ⎠

∑

θ

. Igualando essa equação a zero:

i

X

n

(25)

CAPÍTULO 5

A REGRESSÃO DE DUAS VARIÁVEIS: ESTIMAÇÃO DE INTERVALO E TESTE DE HIPÓTESES

Perguntas

5.1 (a) Verdadeira. O teste t baseia–se em variáveis com uma distribuição normal. Os

estimadores β1 e β2 seguem tal distribuição, pois são combinações lineares do erro ui, o

qual presumimos ser normalmente distribuído no MRLC.

(b) Verdadeira. Uma vez que E(ui)=0, os estimadores de MQO não são tendenciosos.

Não é preciso nenhuma premissa probabilística para determinar a não-tendenciosidade.

(c) Verdadeira. Nesse caso, a Equação (1) da Seção 3.A.1 do Apêndice 3A não será usada. Esse tópico será tratado com mais detalhes no Capítulo 6, Seção 6.1.

(d) Verdadeira. O valor p é o menor nível de significância em que se pode rejeitar a hipótese nula. Os termos nível de significância e tamanho do teste são sinônimos. (e) Verdadeira. Isso resulta da Equação (1) do Apêndice 3A, Seção 3A.1.

(f) Falsa. Tudo o que podemos dizer é que os dados disponíveis não nos permitem rejeitar a hipótese nula.

(g) Falsa. Um valor mais alto de σ2_{deve ser contrabalançado por um valor mais alto}

de 2

i

x

∑

. Somente se este for mantido constante, a afirmação pode ser verdadeira. (h) Falsa. A média condicional de uma variável aleatória depende dos valores tomados por outra variável (condicionante). As médias condicional e não-condicional só podem ser iguais se as duas variáveis forem independentes.

(i) Verdadeira. Isso fica óbvio pela Equação (3.17).

(j) Verdadeira. Consulte a Equação (3.5.2). Se X não tem influência sobre Y,

β

ˆ

₂será zero, e nesse caso 2

_ˆ

2

i i

y

=

u

∑

.

5.2 Tabela ANOVA para despesas com alimentos na Índia:

Fonte da variação SQ gl MSQ Devido à regressão

(SQE) 139023 1 139023

Devido aos resíduos

(SQR) 236894 53 4470

(26)

139023

4470

F

=

31,1013 com gl igual a 1 e 53, respectivamente.

Na hipótese de não haver relação entre despesas com alimentos e despesas totais, o

valor p (valor da probabilidade) de se obter tal valor F é quase zero, sugerindo

enfaticamente que se pode rejeitar a hipótese nula.

5.3 (a) O ep do coeficiente angular é

0, 6417

0, 0664

9, 6536

=

. O valor t sob H0 : β1 = 0, é

0, 7347

0,8797

0,8351

=

.

(b) O salário médio por hora aumenta em aproximadamente 64 centavos para um ano adicional de escolaridade, em média.

(c) Aqui temos n = 13, então gl =11. Se a hipótese nula for verdadeira, o valor t estimado é 9,6536. A probabilidade de se obter tal t é extremamente pequena, o valor

p é praticamente zero. Pode–se, portanto, rejeitar a hipótese nula de que o nível de

escolaridade não afeta os ganhos por hora.

(d) SQE = 74,9389; SQR = 8,8454; gl numerador = 1; gl denominador = 11; F = 93,1929. O valor p de tal F sob a hipótese nula de que não há relação entre as duas variáveis é 0,000001, que é extremamente baixo. Pode–se, assim, rejeitar com grande segurança a hipótese nula.

Observe que o valor F é aproximadamente o quadrado do valor t sob a mesma hipótese nula.

(e) No caso bivariado, dado que H0 : β2 = 0, existe a seguinte relação entre o valor t e r2_: 2 2 2

[

(

2)

t

r

t

n

=

+ − ]

. Como o t dado é 9,6536, obtemos:

2 2 2

9, 6536

0,8944

[9, 6536

11]

r

=

≈

−

.

5.4 Literalmente, a hipótese afirma que não há correlação entre as duas variáveis. Por

conseguinte, se pudermos provar que a covariância entre elas é zero, então a correlação terá de ser zero.

5.5 (a) Para testar a hipótese de que o coeficiente angular verdadeiro é um, use o

teste t. 2 2

ˆ

₁

_{1, 0598 1}

0,821

ˆ

_{0, 0728}

(

)

t

ep

β

−

=

Para gl = 238, esse valor t não é significativo nem para α = 10%. Conclui–se, portanto, que durante o período estudado as ações da IBM não foram voláteis.

(27)

(b) Uma vez que

0, 7264

2, 4205

0, 3001

t

=

, é significativo no nível dos 2%, mas,

economicamente, isso tem pouco significado prático. Interpretado literalmente, o valor de 0,73 para o intercepto implica que mesmo que o retorno do portfólio de mercado seja zero, o do título é de 0,73%.

5.6 Sob a premissa da normalidade,

β

ˆ

₂é normalmente distribuída. Mas como uma variável normalmente distribuída é contínua, e como pela teoria das probabilidades sabemos que a probabilidade de uma variável aleatória contínua assumir um valor específico é zero, não faz, portanto, nenhuma diferença o fato de a desigualdade ser forte ou fraca.

5.7 Sob a hipótese de que β2 = 0, obtemos:

2 2 2 2 2 2 2 2

ˆ

_ˆ

(

)

₍₁

₎

(

2)

i i i

x

t

ep

y

r

n

β

σ

β

=

−

∑

. Porque 2 2 2

ˆ

(1

)

ˆ

(

2)

(

2)

i i

u

y

n

σ

=

−

∑

2

r

, da Equação (3.5.10), 2 2 2 ₂ ₂

ˆ

₍

₂₎

ˆ

(1

)

i i

x

n

y

r

β

σ

=

−

∑

, mas como 2 2 2 2 2

ˆ

i i

x

r

y

β

=

∑

, então 2 2 2

ˆ

i i

x

r

y

β

=

∑

, da Equação (3.5.6). Assim, 2 2 2

ˆ

(

2)

ˆ

(1

)

i

x

r

n

t

r

β

σ

−

=

−

, e 2 2 2 2 2

(

2)

_ˆ

ˆ

1

i 2

x

r n

t

F

r

β

σ

−

= =

=

−

∑

, da Equação (5.9.1). Problemas

5.8 (a) Existe associação positiva na TPFT em 1972 e 1968, o que não é de

surpreender, tendo em vista que desde a Segunda Guerra Mundial a TPFT das mulheres tem crescido regularmente.

(b) Use o teste t unicaudal ou unilateral:

0.6560 1

1, 7542

0,1961

t

=

−

= −

. Para gl = 17, o valor

t unicaudal com α = 5% é 1,740. Como o t estimado é significativo, podemos, nesse

nível de significância, rejeitar a hipótese de que o coeficiente angular verdadeiro é igual ou maior que 1.

(c) A TPFT média é: 0,2033+0,6560(0,58)≈0,5838. Para estabelecer um intervalo de confiança de 95% para essa previsão, use a fórmula: 0,5838

±

2,11 (ep do valor médio da previsão), em que 2,11 é valor t crítico a 5% para gl = 17. Para obter o erro-padrão do valor da previsão, empregue a Equação (5.10.2). Mas repare que, como os

(28)

calcular esse erro-padrão.

(d) Não poderemos responder essa pergunta sem os dados reais porque precisamos dos valores dos resíduos para representá–los graficamente e obter o gráfico de probabilidade normal ou calcular o valor do teste Jarque-Bera.

5.9 (a) Segue o gráfico:

VERTICAL = REM HORIZONTAL = GAS

(b) Remi =12129,37+3,3076 Gas

ep = (1197,351) (0,3117) r2 _{= 0,6968 SQR = 2,65E+08}

(c) Se a despesa por aluno aumentar um dólar, o salário médio aumentará 3,31 dólares. O intercepto não tem significado econômico viável.

(d) O intervalo de confiança de 95% para β2 é: 3,3076

±

2(0,3117) = (2,6842 ,

3,931). Baseados neste IC, não rejeitaremos a hipótese nula de que o verdadeiro coeficiente angular é 3.

(e) Os valores previstos médio e individual são os mesmos, a saber: 12129,37 + 3,3076(5000) ≈ 28,667. O erro-padrão do valor médio previsto, usando a Equação (5.10.2), é 520,5117 (dólares) e o erro-padrão da previsão individual, usando a Equação (5.10.2), é 2382,337. Os intervalos de confiança são:

1) previsão média: 28,667

±

2(520,5117), isto é, ($27.626 , $29.708); 2) previsão individual: 28,667 2(2382,337), isto é, ($23.902 , $33.432).

±

Como era de se esperar, o segundo intervalo é maior do que o primeiro.

(f) O histograma dos resíduos pode ser aproximado a uma curva normal. A estatística Jarque-Bera é 2,1927, e seu valor p é de aproximadamente 0,33. Assim, baseados

(29)

neste teste, não rejeitamos a premissa da normalidade, presumindo que o tamanho da amostra (51 observações) seja razoavelmente grande.

Série: Resíduos Amostra 1 51 Observações 51 Média 9,13E-12 Mediana -_217,5192 Máximo 5529,342 Mínimo -_3847,976 Desvio-padrão 2301,414 Assimetria 0,499126 Curtose 2,807557 Jarque-Bera 2,196273 Probabilidade 0,333492

5.10 A tabela ANOVA para o setor de empresas é a seguinte:

Fonte da variação SQ gl MSQ

Devido à regressão

(SQE) 38685,997 1 38685,997

(SQR) 4934,138 37 133,355

STQ 43620,135

O valor F é

38685

290, 0978

133,355

=

.

(30)

Sob a hipótese nula de que não existe relação entre salários reais e produtividade no setor de empresas, este valor F segue distribuição F com gl 1 e 37 no numerador e denominador, respectivamente. A probabilidade de obter tal F é 0,0000, ou seja, praticamente zero. Podemos, portanto, rejeitar a hipótese nula, o que não deve ser nenhuma surpresa.

(b) A tabela ANOVA para o setor de empresas não-agrícolas é a seguinte:

Fonte da variação SQ gl MSQ

Devido à regressão (SQE)

37887,455 1 37887,455 Devido aos resíduos

(SQR) 5221,585 37 141,129

STQ 43109,04 STQ = 43109,04; SQR = 5221,585; SQE = 37887,455.

Sob a hipótese nula de que o coeficiente angular verdadeiro é zero, o valor F calculado é:

37887, 455

268, 459

141,129

F

=

≈

.

A probabilidade de obter tal F seria praticamente zero, caso a hipótese nula fosse verdadeira, o que leva à sua rejeição.

5.11 (a) O gráfico a seguir indica que a relação entre as duas variáveis não é linear.

Inicialmente, à medida que aumentam as despesas com publicidade, o número de impressões também aumenta, mas depois decresce gradualmente.

VERTICAL = IMPRESSÕES

HORIZONTAL = GASTOS COM PUBLICIDADE

(b) Em conseqüência de (a), não seria adequado ajustar um modelo de regressão bivariada a esses dados. Não temos, no momento, as ferramentas necessárias para

(31)

i

u

i

fazê-lo. Mais adiante mostraremos que um modelo do tipo 2

1 2 2 3 2

i i

Y

=

β β

+

X

+

β

X

+

,

em que Y são as impressões retidas e X2 as despesas com publicidade, pode ser

apropriado. Este é um exemplo de modelo de regressão quadrático. Mas repare que ainda é um modelo linear nos parâmetros.

(c) Os resultados obtidos usando um modelo linear às cegas são os seguintes:

Yi = 22,163 + 0,3631 Xi

ep = (7,089) (0,0971) r2_=0,424.

5.12 (a) O gráfico a seguir mostra que as taxas de inflação dos dois países evoluem

juntas.

VERTICAL = IPCEUA HORIZONTAL = IPCCAN

(b) & (c) Segue tabela conforme entregue pelo pacote de software estatístico Eviews

3: Amostra: 1973 1997 Observações incluídas: 25

Variável Coeficiente Erro-padrão Estatística-t Probabilidade

C 6,251664 1,956380 3,195526 0,0040

ICAN 0,940932 0,017570 53,55261 0,0000

(32)

ajustado 0,991698 dependente 36,56767 E.P. da regressão 3,331867 Critério info Akaike 5,321561 Soma quad resíduos 255,3308 Critério Schwarz 5,419071 Verossimilhança

Log –64,51951 Estatística-F 2867,882

Estat

Durbin-Watson 0,264558 Probabilidade (Estatística-F) 0,000000

Esses resultados mostram que a relação entre as duas variáveis é positiva. Pode–se facilmente rejeitar a hipótese nula de que não há relação entre as duas variáveis, uma vez que o valor t obtido sob essa hipótese é 53,55, e é praticamente zero o valor p (probabilidade) de se obter tal t.

Embora as duas taxas de inflação sejam positivamente relacionadas, não se pode disso deduzir causalidade, pois esta tem de ser inferida de alguma teoria econômica que a sustente. Lembre–se de que regressão não implica causalidade.

5.13 (a) As duas regressões são as seguintes:

Preço do ourot = 186,183 + 1,842 IPCt

ep = (125,403) (1,215) r2_{= 0,150}

t = (1,484) (1,515) NYSEt = 102,060 + 2,129 IPCt

ep = (23,767) (0,230) r2_{= 0,868}

t = (–4,294) (9,247)

(b) A estatística Jarque-Bera para a equação do preço do ouro é 4,751, com valor p de 0,093. A estatística JB para o índice NYSE é 1,218 com valor p de 0,544. No nível de significância de 5%, não se pode rejeitar a premissa de normalidade em nenhum dos dois casos.

(c) Como o coeficiente angular na regressão do preço do ouro não é estatisticamente diferente de zero, não faz nenhum sentido tentar saber se é diferente de um.

(d) & (e) Com o procedimento habitual do teste t, obtemos:

2,129 1

4, 91

0, 230

t

=

−

=

. Como

esse valor excede o t crítico de 2,160, rejeitamos a hipótese nula. O coeficiente estimado é realmente maior que um. Para o período estudado, o investimento no mercado de ações foi provavelmente uma garantia contra a inflação. Foi, certamente, um hedge muito melhor que o investimento em ouro.

5.14 (a) Não parece haver uma melhor que as outras, todos os resultados estatísticos

são muito parecidos. Todos os coeficientes angulares são estatisticamente significativos no nível de confiança de 99%.

(b) Não podemos usar os r2_{consistentemente elevados para decidir qual é a melhor}

definição de moeda. Isso, entretanto, não quer dizer que o tipo de equação usada não faça diferença.

(33)

(c) Não se pode dizer isso a partir dos resultados da regressão. Mas, recentemente, o FED parece estar visando a M2.

5.15 Escreva assim o modelo da curva de indiferença: _i ₁

1

₂ _i

i

Y

u

X

β

⎛

⎞

β

=

_⎜

_⎟

+

⎝

⎠

. Repare

que agora β1 passou a ser o coeficiente angular e β2 o intercepto. Mas este é, ainda,

um modelo de regressão linear, pois os parâmetros são lineares (veja o Capítulo 6). Os resultados da regressão são os seguintes:

1 3, 2827

1,1009

i i

Y

X

⎛

⎞

=

_⎜

_⎟

+

⎝

⎠

ep = (1,2599) (0,6817) r2_{= 0,6935.}

O coeficiente angular é estatisticamente significativo no nível de confiança de 92%. A taxa marginal de substituição (TMS) de Y por X é:

0, 3287(

1

₂

)

i

Y

X

∂

_{= −}

∂

.

5.16 (a) Seja o modelo: , em que Y é a taxa de câmbio vigente e X a PPC implícita. Caso a PPC esteja certa, espera–se, a priori, que o intercepto seja zero e o coeficiente angular, um.

1 2 2

ˆ

i

Y

=

β β

+

X

_i

+

u

_i

(b) Os resultados da regressão são os seguintes:

Yi = 24,6338 + 0,5405 Xi ep = (19,5071) (0,0094)

t = (1,2628) (57,1016) r2_=0,9917.

Para testar a hipótese de que β2 = 1, aplicamos teste:

0, 5405 1

48,88

0, 0094

t

=

−

= −

. Esse

valor é muito significativo e leva à rejeição da hipótese nula. O coeficiente angular é, na verdade, menor que um. A partir da regressão dada, o leitor pode facilmente verificar que o coeficiente do intercepto não é diferente de zero, pois o valor t, sob a hipótese de que o intercepto verdadeiro é zero, é somente 1,2628.

[N] Nota: Deveríamos, na verdade, testar simultaneamente as hipóteses (conjuntas) de que o intercepto é zero e o coeficiente angular, 1. No Capítulo 8, veremos como isso é feito.

(c) Em primeiro lugar, como o índice Big Max é “tosco e engraçado”, não tem a menor importância. Mesmo assim, para os dados da amostra, os resultados não apóiam a teoria.

5.17 Se Y for a representação da pontuação em matemática dos homens e X a das

mulheres, obtemos a seguinte regressão:

ˆ

i

(34)

t = (8,528) (15,706) r2_{= 0,918.}

(b) A estatística Jarque-Bera é 1,0317 com um valor p de 0,5970. Assintoticamente, portanto, não podemos rejeitar a premissa de normalidade.

(c)

0, 714 1

6, 36

0, 045

t

=

−

=

. Logo, podemos rejeitar a hipótese de que β2 = 1 com 99% de

confiança.

(d) A tabela ANOVA é:

Fonte da variação SQ gl MSQ Devido à regressão

(SQE) 948,193 1 948,193

(SQR) 87,782 22 3,990

STQ 1071,975 23

Sob a hipótese nula de que β2 = 0, o valor F é 264,665. O valor p de se obter tal F é

quase zero, o que leva à rejeição da hipótese nula.

5.18 (a) Os resultados da regressão são os seguintes:

ˆ

i

Y

= 148,135 + 0,673 Xi ep = (11,653) (0,027)

t = (12,713) (25,102) r2_{= 0,966.}

(b) A estatística de Jarque-Bera é 1,243 com um valor p de 0,5372. Podemos, portanto, rejeitar a hipótese nula de não-normalidade.

(c) Sob a hipótese nula, obtemos:

0, 673 1

12,11

0, 027

t

=

−

=

. O valor t crítico no nível de 5%

é 2,074. Assim, podemos rejeitar a hipótese nula de que o coeficiente angular verdadeiro é 1.

(d) Os valores de SQE, SQR e STQ são, respectivamente, 3157,586 (gl 1), 110,247 (gl 22) e 32367,833 (gl 23). Sob a hipótese nula habitual, o valor F é 630,131. O valor p de se conseguir tal F é quase zero. Podemos, portanto, rejeitar a hipótese nula de que não há relação entre as duas variáveis.

(35)

VERTICAL = IPC HORIZONTAL = IPP

(b) Use o IPC, que representa os preços pagos pelos consumidores, como regressando, e o IPP, que representa os preços pagos pelos produtores, como regressor, porque o primeiro é o segundo com acréscimos.

(c) & (d) A tabela a seguir, apresentada conforme entregue pelo pacote de software estatístico Eviews 3, fornece os dados necessários:

Variável dependente: IPC Método: mínimos quadrados Data: 23/06/00 Hora: 16:50 Amostra: 1960 1999 Observações incluídas: 40

Variável Coeficiente Erro-padrão Estatística-t Probabilidade

C –13,77536 3,710747 –3,712286 0,0007

IPP 1,269994 0,042763 29,69864 0,0000

R-quadrado 0,958696 Variável dependente média 86,17000 R-quadrado ajustado 0,957609 Desvio–padrão da variável

dependente 48,02523

E.P. da regressão 9,887937 Critério info Akaike 7,469215 Soma quad resíduos 3715,309 Critério Schwarz 7,553659

Verossimilhança Log –147,3843 Estatística-F 882,0093

Estat Durbin-Watson 0,093326 Probabilidade (Estatística-F) 0,000000 O valor t estimado do coeficiente angular é 29,6986 sob a hipótese nula de que não há relação entre os dois índices. O valor p (probabilidade) de se obter tal valor t é quase zero, o que indica a rejeição da hipótese nula.

A seguir estão o histograma e o teste Jarque-Bera baseados nos resíduos da regressão anterior.

(36)

Série: Resíduos Amostra 1960 1999 Observações 40 Média 7,11E-15 Mediana 3,781548 Máximo 21,84709 Mínimo –_19,05008 Desvio-padrão 9,760345 Assimetria –_0,119726 Curtose 2,620663 Jarque-Bera 0,335390 Probabilidade 0,845612

A estatística Jarque-Bera é 0,3335 com um valor p de 0,8456. Não podemos, portanto, rejeitar a premissa de normalidade. O histograma também mostra que os resíduos têm distribuição razoavelmente simétrica.

(37)

CAPÍTULO 6

EXTENSÕES DO MODELO DE REGRESSÃO LINEAR DE DUAS VARIÁVEIS

6.1 (a) Verdadeiro. Repare que a fórmula MQO padrão para estimar o intercepto é:

1

ˆ

β

= (média do regressando –

β

ˆ

₂média do regressor).

Mas quando X e Y estão em formato de desvio, seus valores são sempre zero. Daí o intercepto estimado também ser zero nesse caso.

6.2 (a) & (b) Está incluído na primeira equação um termo de intercepto que, por não

ser estatisticamente significativo no nível de, digamos, 5%, pode ser retirado do modelo.

(c) Para os dois modelos, o aumento de um ponto percentual na taxa de retorno mensal do mercado leva a um aumento médio de cerca de 0,76 ponto percentual na taxa de retorno mensal das ações ordinárias da Texaco ao longo do período estudado. (d) Conforme tratamos no Capítulo 6 do livro-texto, esse modelo representa a linha

característica da teoria do portfólio. O modelo relaciona, no caso em tela, o retorno

mensal de ações da Texaco ao retorno mensal do mercado, como representado por um amplo índice de mercado.

(e) Não, os r2_{não são comparáveis. O do modelo sem intercepto é o r}2 _bruto.

(f) Como a amostra é relativamente grande, podemos usar o teste de normalidade de Jarque-Bera. A estatística JB é quase a mesma para os dois modelos, isto é, 1,12, e o

valor p de se obter tal valor JB é de aproximadamente 0,57. Portanto, não se pode

rejeitar a hipótese de que os termos de erro seguem uma distribuição normal.

(g) De acordo com o comentário de Theil visto no capítulo, se o termo do intercepto estiver ausente do modelo, então passar a regressão pela origem pode resultar em estimativa muito melhor do coeficiente angular, como ocorre nesse caso.

6.3 (a) É um modelo de regressão linear, pois é linear nos parâmetros.

(b) Defina Y* = (1/Y) e X* = (1/X) e faça uma regressão MQO de Y* contra X*. (c) Quando X tende ao infinito, Y tende a (1/ β1).

(d) Pode ser que este modelo seja adequado para explicar o baixo consumo de um produto, como um bem inferior, quando a renda aumenta.

(38)

6.4

SLOPE = 1 - INCLINAÇÃO = 1; SLOPE > 1 INCLINAÇÃO > 1; SLOPE < 1 INCLINAÇÃO

< 1

6.5 Para o modelo I, sabemos que ₂

2

ˆ

i i i

x y

x

β

=

∑

, em que X e Y estão em formato de

desvio.

De forma semelhante, obtemos para o modelo II: * * 2 *2 2 2 2 2 2

(

/

)(

/

)

(

) /

ˆ

(

/

)

/

i x i y i i x y i i x i i x i i x i x y i

x S

y S

x y

S S

x y

S

x y

S

x

x S

x

S

x

S

_y

α

=

∑

=

∑

=

∑

=

∑

=

β

∑

, o que demonstra

que os coeficientes angulares não são independentes da mudança de escala.

6.6 (a) Pode–se escrever o primeiro modelo como: *

1 1 2 2

ln(

w Y

i

)

=

α α

+

ln(

w X

i

)

+

u

i , ou seja, * 1 1 2 2 2

ln

w

+

ln

Y

_i

=

α α

+

ln

w

+

α

ln

X

_i

+

u

_i * i

u

i

)

w

, aplicando propriedades dos logaritmos. Como os w são fatores de escala constantes, podemos simplificar esse modelo assim:

* 1 2 2 1 2 2

ln

Y

i

=

(

α α

+

ln

w

−

ln

w

)

+

α

X

i

+

u

i

= +

A

α

ln

X

+

, em que 1 2 2 1

(

ln

A

=

α α

+

w

−

.