Regi˜ ao de confian¸ ca para um subconjunto de coeficientes

A constru¸cão de um intervalo de confian¸ca para um coeficiente foi vista na se¸cão anterior. Veremos nesta se¸cão como obter um intervalo de confian¸ca no caso multidimensional. Suponha que estejamos interessados em construir um intervalo de confian¸ca para o vetor de coeficientes

β3

β4

Os estimadores de MQO deste subvetor encontram-se representados no centro do retˆangulo da figura 11.2.

Os valores em (A,B) representam o intervalo de confian¸ca individual para β3 com n´ıvel de

significˆancia de 5%. Analogamente, (C,D) representa o intervalo de confian¸ca individual para β3 com o mesmo n´ıvel de siognificˆancia.

O intervalo de confian¸ca para o subvetor

β3 β4

0 ´

e a regi˜ao que, quando constru´ıda em repetidas amostras, cobre o verdadeiro valor (β3, β4) em, digamos, 95% dos casos. Para uma

11.3. REGI ˜AO DE CONFIAN ¸CA PARA UM SUBCONJUNTO DE COEFICIENTES 85

Figura 11.2: Representa¸c˜ao dos intervalos de confian¸ca individuais de β3 e β4

estima¸cão eficiente, esta região deve ser a menor poss´ıvel. Uma região natural a ser escolhida seria o retângulo formado pelos intervalos de confian¸ca individuais para β3 e β4. Se bβ3 e bβ4

tiverem covariância nula, então em amostragem repetida, retângulos calculados desta maneira irão conter o ponto (β3, β4) em 0, 95x0, 95 = 90, 25% das vezes1.

Evidentemente, este retângulo não é suficientemente grande para garantir um n´ıvel de confian¸ca de 95%. Como a região deve ser a menor poss´ıvel, o aumento deve ocorrer nas partes que apresentam maiores chances de cobrir (β3, β4) em amostras repetidas. No caso de covariância

zero entre bβ3 e bβ4, as áreas próximas aos pontos A, B, C e D irão cobrir (β3, β4) em amostragem

repetida com maior probabilidade, relativamente aos extremos do retângulo, de modo que o retângulo deve ser aumentado nas áreas próximas aos pontos mencionados.

Como se sabe que a região deve ser a menor poss´ıvel, ao mesmo tempo em que se amplia a região próxima aos pontos A, B, C e D, se diminui a área próxima aos extremos, de modo que a área de confian¸ca se aproxima de uma elipse, como mostra a figura 11.3. Deve-se notar que o gráfico apresentado na referida figura foi constru´ıdo para o caso de covariância zero entre bβ3

e bβ4. Caso bβ3 e bβ4 tenham covariˆancia positiva, por exemplo, sempre que bβ3 subestimar β3, o

mesmo dever´a acontecer com bβ4 em rela¸c˜ao a bβ4.

O caso de sobre estimativa é análogo. Isto significa que as áreas próximas ao extremo superior direito e ao extremo inferior esquerdo deveriam ser alongadas. A covariância positiva sugere ainda que as áreas próximas aos extremos superior esquerdo e inferior direito sejam reduzidas, por motivo óbvio. Conclu´ımos assim que, no caso de covariância positiva, a área de confian¸ca para o subconjunto de coeficientes (β3, β4) é uma elipse com inclina¸cão positiva,

conforme mostra a figura 11.4.

No caso de covariância negativa entre bβ3 e bβ4, a elipse terá inclina¸cão negativa. Em ambos

os casos a elipse permanece centrada no ponto (β3, β4).

Em amostragem repetida, temos a probabilidade de 95% de que o intervalo calculado contenha β3. A interpre-

ta¸cão para o intervalo de confian¸ca de β4 é análoga. Desse modo, a probabilidade de que os intervalos calculados

86CAPÍTULO 11. UTILIZA ¸C ÃO DE VETORES NO ARMAZENAMENTO DE INFORMA ¸C ÕES

Figura 11.3: Representa¸c˜ao dos intervalos de confian¸ca individuais de β3 e β4 e da regi˜ao de

confian¸ca para β3 e β4 no caso de covariˆancia zero entre bβ3 e bβ4

EXEMPLO 11.1: Suponha que estejamos interessados em testar a hip´otese de que β3= 0

e β4 = 0, e suponha ainda que o ponto (0, 0) se encontre pr´oximo ao extremo superior esquerdo

do retângulo da figura anterior, e assim fora da elipse. Sabemos que os testes de significância individual para β3e β4nos levarão a não rejei¸cão da hipótese nula de que o coeficiente em questão

e estatisticamente igual a zero, entretanto, ao testarmos a significˆancia conjunta β3 β4 = 0 0

com base no teste F, conclu´ımos que

β3

β4

é significativamente diferente de zero, uma vez que o ponto (0, 0) encontra-se fora da elipse. Neste tipo de situa¸cão, pode-se afirmar que ao menos uma das variáveis apresenta influência significante na variável dependente, mas não se pode afirmar ao certo qual delas. Este é um caso t´ıpico de ocorrência de multicolinearidade (ver cap´ıtulo 16), no qual a rela¸cão entre as variáveis explicativas dificulta qualquer tentativa de separar o efeito de um regressor como fator explicativo da variável dependente.

No caso tridimensional, a região de confian¸ca passa a ser um volume e é representada grafi- camente por um elipsóide. Em dimensões superiores, a representa¸cão gráfica é imposs´ıvel, mas a hiper superf´ıcie correspondente passa a ser chamada de elipsóide multidimensional.

Um intervalo de confian¸ca individual para um coeficiente é baseado em um conjunto de valores para os quais a razão t (ou estat´ıstica t calculada) é inferior ao valor t cr´ıtico. Este é um conjunto espec´ıfico de valores para os quais, a um dado n´ıvel de significância, não se rejeita a hipótese de que o βi em questão é igual. No caso de um modelo de regressão múltipla, uma região de

confian¸ca conjunta para um subconjunto de coeficientes é representada pelo conjunto de valores para os quais a hipótese de que o subconjunto de coeficientes populacionais é simultaneamente igual não pode ser rejeitada. Usa-se neste caso o teste F . Para o caso bidimensional temos:

F (2, n − k) = 1

2[ bβ − β]

11.3. REGI ˜AO DE CONFIAN ¸CA PARA UM SUBCONJUNTO DE COEFICIENTES 87

Figura 11.4: Representa¸c˜ao dos intervalos de confian¸ca individuais de β3 e β4 e da regi˜ao de

confian¸ca para β3 e β4 no caso de covariˆancia positiva entre bβ3 e bβ4

onde SubM V C( bβ) é a por¸cão da matriz de variância e covariância estimada que apresenta termos comuns apenas aos coeficientes que estão sendo testados.

Na verdade temos acima uma forma quadrática, que obviamente gera como resposta um escalar. Este escalar deve ser comparado com o valor tabelado de F para um dado n´ıvel de significância e com 2 gl no numerador e (n − k) gl no denominador. O conjunto de valores de, digamos β3e β4 para os quais esta forma quadrática tem valor menor ou igual ao valor F cr´ıtico

forma a regi˜ao de confian¸ca de β3 e β4.

EXEMPLO 11.2: Com base nos dados para a economia americana2, construa a regi˜ao de confian¸ca para o subconjunto de coeficientes

β2 β3 0 do modelo ln Yt= β1+ β2ln Lt+ β3ln Kt+ εt onde: Y = Produto; L = Trabalho; K = Capital.

Em seguida teste a hipótese de que a elasticidade do produto em rela¸cão ao trabalho é 2/3 e em rela¸cão ao capital é 1/3. No cap´ıtulo 14, exemplo 14.8, o teste de hipóteses é conduzido diretamente. No presente exemplo estamos mais interessados em saber o motivo pelo qual rejeitamos ou não rejeitamos a hipótese sob teste. Apresenta-se na figura 11.5 o resultado da estima¸cão do modelo no EViews.

Figura 11.5: Resultados da estima¸c˜ao do exemplo 11.2

88CAPÍTULO 11. UTILIZA ¸C ÃO DE VETORES NO ARMAZENAMENTO DE INFORMA ¸C ÕES A matriz de variância e covariância estimada da equa¸cão EQ01 é obtida seguindo os pro- cedimentos descritos na se¸cão 10.1 ou simplesmente digitando na janela de comandos a seguinte instru¸cão:

matrix MVC = EQ01.@cov

Figura 11.6: Matriz de variância e covariância estimada dos coeficientes estimados da EQ01 Conclu´ımos que a região de confian¸ca para o subconjunto de coeficientes β2e β3é uma elipse

com inclina¸cão negativa, visto que bβ2 e bβ3 têm covariância negativa (= −0, 003802). Deste

modo, a região de confian¸ca é a elipse determinada pelo conjunto de valores para os quais a forma quadrática

1 2 1.450786 − β2 0.383808 − β3 0 0.006927 −0.003802 −0.003802 0.002306 −1 1.450786 − β2 0.383808 − β3 ´

e menor ou igual ao valor cr´ıtico de F (2, 36). Os intervalos de confian¸ca individuais para os coeficientes são mostrados nos eixos. Os valores são facilmente obtidos seguindo as instru¸cões da se¸cão 11.2. Note que para construirmos a matriz de variância e covariância estimada que aparece na parte central da forma quadrática, fazemos uso apenas das informa¸cões que dizem respeito aos coeficientes que estão sendo testados. A figura 11.7 apresenta a região de confian¸ca para o subvetor

β2 β3

0 .

Figura 11.7: Representa¸c˜ao dos intervalos de confian¸ca individuais de β2 e β3 e da regi˜ao de

confian¸ca β2 e β3.

Percebe-se claramente que o ponto (2/3, 1/3) encontra-se fora da elipse3, de modo que o teste

3_{Um fato importante a ser notado ´}_{e que, conforme os intervalos de confian¸}_{ca constru´ıdos, n˜}_{ao rejeitamos a}

hipótese β2 = 1.30 nem a hipótese β3 = 0.30, individualmente, mas a hipótese conjunta

β2 β3 = 1.30 0.30 ´

e rejeitada, uma vez que o ponto (1.30, 0.30) encontra-se fora da região de confian¸ca determinada pela elipse. Conclu´ımos que a não rejei¸cão de hipóteses individuais não implica na não rejei¸cão de hipóteses conjuntas.

11.3. REGI ˜AO DE CONFIAN ¸CA PARA UM SUBCONJUNTO DE COEFICIENTES 89

de hipóteses irá fatalmente rejeitar a hipótese de que β2 β3 = 2/3 1/3 .

O nosso teste consiste simplesmente em construir a forma quadr´atica anterior substituindo β2 por 2/3 e β3 por 1/3. Desse modo, temos:

1 2 1.450786 − 2/3 0.383808 − 1/3 0 0.006927 −0.003802 −0.003802 0.002306 −1 1.450786 − 2/3 0.383808 − 1/3 = a0(subMVC)−1a Construiremos inicialmente o vetor a.

vector(2) a

a(1)=EQ01.@coefs(2) - (2/3) a(2)=EQ01.@coefs(3) - (1/3)

O vetor a assim gerado ´e apresentado na figura 11.8. Figura 11.8: Vetor a

A matriz SubMVC é na verdade uma submatriz de MVC. Dessa forma, faremos uso da fun¸cão @subextract (ver se¸cão 9.2):

Matrix SubMVC = @subextract(MVC,2,2)

A matriz SubMVC assim gerada ´e apresentada abaixo: Figura 11.9: Matriz SubMVC

Resta-nos, portanto calcular a forma quadr´atica e em seguida multiplicar o valor obtido por 1/2. Para isto fazemos uso dos comandos

vector FQ=@transpose(A)*@inverse(SubMVC)*A vector F=FQ(1)*(1/2)

O vetor F ´e apresentado a seguir:

Figura 11.10: Vetor F O valor-p para este teste ´e gerado por

vector valorp = @fdist(F(1), 2, 36)

O vetor valorp descrito acima retorna a probabilidade de uma estat´ıstica F com 2 graus de liberdade no numerador e 36 graus de liberdade no denominador exceder 572, 3982. O valor apresentado ´e virtualmente zero, de modo que rejeitamos fortemente a hip´otese nula de que β2 β3 = 2/3 1/3

conforme j´a era previsto pela abordagem do intervalo de confian¸ca. Note que o valor da estat´ıstica F calculada neste exemplo ´e exatamente o mesmo daquele gerado no cap´ıtulo 14, exemplo 14.8.

90CAPÍTULO 11. UTILIZA ¸C ÃO DE VETORES NO ARMAZENAMENTO DE INFORMA ¸C ÕES

No documento Econometria Aplicada Com o Uso Do Eviews_Ivan Castelar (1) (páginas 96-102)