A constru¸c˜ao de um intervalo de confian¸ca para um coeficiente foi vista na se¸c˜ao anterior. Veremos nesta se¸c˜ao como obter um intervalo de confian¸ca no caso multidimensional. Suponha que estejamos interessados em construir um intervalo de confian¸ca para o vetor de coeficientes
β3
β4
Os estimadores de MQO deste subvetor encontram-se representados no centro do retˆangulo da figura 11.2.
Os valores em (A,B) representam o intervalo de confian¸ca individual para β3 com n´ıvel de
significˆancia de 5%. Analogamente, (C,D) representa o intervalo de confian¸ca individual para β3 com o mesmo n´ıvel de siognificˆancia.
O intervalo de confian¸ca para o subvetor
β3 β4
0 ´
e a regi˜ao que, quando constru´ıda em repetidas amostras, cobre o verdadeiro valor (β3, β4) em, digamos, 95% dos casos. Para uma
11.3. REGI ˜AO DE CONFIAN ¸CA PARA UM SUBCONJUNTO DE COEFICIENTES 85
Figura 11.2: Representa¸c˜ao dos intervalos de confian¸ca individuais de β3 e β4
estima¸c˜ao eficiente, esta regi˜ao deve ser a menor poss´ıvel. Uma regi˜ao natural a ser escolhida seria o retˆangulo formado pelos intervalos de confian¸ca individuais para β3 e β4. Se bβ3 e bβ4
tiverem covariˆancia nula, ent˜ao em amostragem repetida, retˆangulos calculados desta maneira ir˜ao conter o ponto (β3, β4) em 0, 95x0, 95 = 90, 25% das vezes1.
Evidentemente, este retˆangulo n˜ao ´e suficientemente grande para garantir um n´ıvel de confi- an¸ca de 95%. Como a regi˜ao deve ser a menor poss´ıvel, o aumento deve ocorrer nas partes que apresentam maiores chances de cobrir (β3, β4) em amostras repetidas. No caso de covariˆancia
zero entre bβ3 e bβ4, as ´areas pr´oximas aos pontos A, B, C e D ir˜ao cobrir (β3, β4) em amostragem
repetida com maior probabilidade, relativamente aos extremos do retˆangulo, de modo que o retˆangulo deve ser aumentado nas ´areas pr´oximas aos pontos mencionados.
Como se sabe que a regi˜ao deve ser a menor poss´ıvel, ao mesmo tempo em que se amplia a regi˜ao pr´oxima aos pontos A, B, C e D, se diminui a ´area pr´oxima aos extremos, de modo que a ´area de confian¸ca se aproxima de uma elipse, como mostra a figura 11.3. Deve-se notar que o gr´afico apresentado na referida figura foi constru´ıdo para o caso de covariˆancia zero entre bβ3
e bβ4. Caso bβ3 e bβ4 tenham covariˆancia positiva, por exemplo, sempre que bβ3 subestimar β3, o
mesmo dever´a acontecer com bβ4 em rela¸c˜ao a bβ4.
O caso de sobre estimativa ´e an´alogo. Isto significa que as ´areas pr´oximas ao extremo superior direito e ao extremo inferior esquerdo deveriam ser alongadas. A covariˆancia positiva sugere ainda que as ´areas pr´oximas aos extremos superior esquerdo e inferior direito sejam reduzidas, por motivo ´obvio. Conclu´ımos assim que, no caso de covariˆancia positiva, a ´area de confian¸ca para o subconjunto de coeficientes (β3, β4) ´e uma elipse com inclina¸c˜ao positiva,
conforme mostra a figura 11.4.
No caso de covariˆancia negativa entre bβ3 e bβ4, a elipse ter´a inclina¸c˜ao negativa. Em ambos
os casos a elipse permanece centrada no ponto (β3, β4).
1
Em amostragem repetida, temos a probabilidade de 95% de que o intervalo calculado contenha β3. A interpre-
ta¸c˜ao para o intervalo de confian¸ca de β4 ´e an´aloga. Desse modo, a probabilidade de que os intervalos calculados
86CAP´ITULO 11. UTILIZA ¸C ˜AO DE VETORES NO ARMAZENAMENTO DE INFORMA ¸C ˜OES
Figura 11.3: Representa¸c˜ao dos intervalos de confian¸ca individuais de β3 e β4 e da regi˜ao de
confian¸ca para β3 e β4 no caso de covariˆancia zero entre bβ3 e bβ4
EXEMPLO 11.1: Suponha que estejamos interessados em testar a hip´otese de que β3= 0
e β4 = 0, e suponha ainda que o ponto (0, 0) se encontre pr´oximo ao extremo superior esquerdo
do retˆangulo da figura anterior, e assim fora da elipse. Sabemos que os testes de significˆancia individual para β3e β4nos levar˜ao a n˜ao rejei¸c˜ao da hip´otese nula de que o coeficiente em quest˜ao
´
e estatisticamente igual a zero, entretanto, ao testarmos a significˆancia conjunta β3 β4 = 0 0
com base no teste F, conclu´ımos que
β3
β4
´e significativamente diferente de zero, uma vez que o ponto (0, 0) encontra-se fora da elipse. Neste tipo de situa¸c˜ao, pode-se afirmar que ao menos uma das vari´aveis apresenta influˆencia significante na vari´avel dependente, mas n˜ao se pode afirmar ao certo qual delas. Este ´e um caso t´ıpico de ocorrˆencia de multicolinearidade (ver cap´ıtulo 16), no qual a rela¸c˜ao entre as vari´aveis explicativas dificulta qualquer tentativa de separar o efeito de um regressor como fator explicativo da vari´avel dependente.
No caso tridimensional, a regi˜ao de confian¸ca passa a ser um volume e ´e representada grafi- camente por um elips´oide. Em dimens˜oes superiores, a representa¸c˜ao gr´afica ´e imposs´ıvel, mas a hiper superf´ıcie correspondente passa a ser chamada de elips´oide multidimensional.
Um intervalo de confian¸ca individual para um coeficiente ´e baseado em um conjunto de valores para os quais a raz˜ao t (ou estat´ıstica t calculada) ´e inferior ao valor t cr´ıtico. Este ´e um conjunto espec´ıfico de valores para os quais, a um dado n´ıvel de significˆancia, n˜ao se rejeita a hip´otese de que o βi em quest˜ao ´e igual. No caso de um modelo de regress˜ao m´ultipla, uma regi˜ao de
confian¸ca conjunta para um subconjunto de coeficientes ´e representada pelo conjunto de valores para os quais a hip´otese de que o subconjunto de coeficientes populacionais ´e simultaneamente igual n˜ao pode ser rejeitada. Usa-se neste caso o teste F . Para o caso bidimensional temos:
F (2, n − k) = 1
2[ bβ − β]
11.3. REGI ˜AO DE CONFIAN ¸CA PARA UM SUBCONJUNTO DE COEFICIENTES 87
Figura 11.4: Representa¸c˜ao dos intervalos de confian¸ca individuais de β3 e β4 e da regi˜ao de
confian¸ca para β3 e β4 no caso de covariˆancia positiva entre bβ3 e bβ4
onde SubM V C( bβ) ´e a por¸c˜ao da matriz de variˆancia e covariˆancia estimada que apresenta termos comuns apenas aos coeficientes que est˜ao sendo testados.
Na verdade temos acima uma forma quadr´atica, que obviamente gera como resposta um escalar. Este escalar deve ser comparado com o valor tabelado de F para um dado n´ıvel de significˆancia e com 2 gl no numerador e (n − k) gl no denominador. O conjunto de valores de, digamos β3e β4 para os quais esta forma quadr´atica tem valor menor ou igual ao valor F cr´ıtico
forma a regi˜ao de confian¸ca de β3 e β4.
EXEMPLO 11.2: Com base nos dados para a economia americana2, construa a regi˜ao de confian¸ca para o subconjunto de coeficientes
β2 β3 0 do modelo ln Yt= β1+ β2ln Lt+ β3ln Kt+ εt onde: Y = Produto; L = Trabalho; K = Capital.
Em seguida teste a hip´otese de que a elasticidade do produto em rela¸c˜ao ao trabalho ´e 2/3 e em rela¸c˜ao ao capital ´e 1/3. No cap´ıtulo 14, exemplo 14.8, o teste de hip´oteses ´e conduzido diretamente. No presente exemplo estamos mais interessados em saber o motivo pelo qual rejeitamos ou n˜ao rejeitamos a hip´otese sob teste. Apresenta-se na figura 11.5 o resultado da estima¸c˜ao do modelo no EViews.
Figura 11.5: Resultados da estima¸c˜ao do exemplo 11.2
88CAP´ITULO 11. UTILIZA ¸C ˜AO DE VETORES NO ARMAZENAMENTO DE INFORMA ¸C ˜OES A matriz de variˆancia e covariˆancia estimada da equa¸c˜ao EQ01 ´e obtida seguindo os pro- cedimentos descritos na se¸c˜ao 10.1 ou simplesmente digitando na janela de comandos a seguinte instru¸c˜ao:
matrix MVC = EQ01.@cov
Figura 11.6: Matriz de variˆancia e covariˆancia estimada dos coeficientes estimados da EQ01 Conclu´ımos que a regi˜ao de confian¸ca para o subconjunto de coeficientes β2e β3´e uma elipse
com inclina¸c˜ao negativa, visto que bβ2 e bβ3 tˆem covariˆancia negativa (= −0, 003802). Deste
modo, a regi˜ao de confian¸ca ´e a elipse determinada pelo conjunto de valores para os quais a forma quadr´atica
1 2 1.450786 − β2 0.383808 − β3 0 0.006927 −0.003802 −0.003802 0.002306 −1 1.450786 − β2 0.383808 − β3 ´
e menor ou igual ao valor cr´ıtico de F (2, 36). Os intervalos de confian¸ca individuais para os coeficientes s˜ao mostrados nos eixos. Os valores s˜ao facilmente obtidos seguindo as instru¸c˜oes da se¸c˜ao 11.2. Note que para construirmos a matriz de variˆancia e covariˆancia estimada que aparece na parte central da forma quadr´atica, fazemos uso apenas das informa¸c˜oes que dizem respeito aos coeficientes que est˜ao sendo testados. A figura 11.7 apresenta a regi˜ao de confian¸ca para o subvetor
β2 β3
0 .
Figura 11.7: Representa¸c˜ao dos intervalos de confian¸ca individuais de β2 e β3 e da regi˜ao de
confian¸ca β2 e β3.
Percebe-se claramente que o ponto (2/3, 1/3) encontra-se fora da elipse3, de modo que o teste
3Um fato importante a ser notado ´e que, conforme os intervalos de confian¸ca constru´ıdos, n˜ao rejeitamos a
hip´otese β2 = 1.30 nem a hip´otese β3 = 0.30, individualmente, mas a hip´otese conjunta
β2 β3 = 1.30 0.30 ´
e rejeitada, uma vez que o ponto (1.30, 0.30) encontra-se fora da regi˜ao de confian¸ca determinada pela elipse. Conclu´ımos que a n˜ao rejei¸c˜ao de hip´oteses individuais n˜ao implica na n˜ao rejei¸c˜ao de hip´oteses conjuntas.
11.3. REGI ˜AO DE CONFIAN ¸CA PARA UM SUBCONJUNTO DE COEFICIENTES 89
de hip´oteses ir´a fatalmente rejeitar a hip´otese de que β2 β3 = 2/3 1/3 .
O nosso teste consiste simplesmente em construir a forma quadr´atica anterior substituindo β2 por 2/3 e β3 por 1/3. Desse modo, temos:
1 2 1.450786 − 2/3 0.383808 − 1/3 0 0.006927 −0.003802 −0.003802 0.002306 −1 1.450786 − 2/3 0.383808 − 1/3 = a0(subMVC)−1a Construiremos inicialmente o vetor a.
vector(2) a
a(1)=EQ01.@coefs(2) - (2/3) a(2)=EQ01.@coefs(3) - (1/3)
O vetor a assim gerado ´e apresentado na figura 11.8. Figura 11.8: Vetor a
A matriz SubMVC ´e na verdade uma submatriz de MVC. Dessa forma, faremos uso da fun¸c˜ao @subextract (ver se¸c˜ao 9.2):
Matrix SubMVC = @subextract(MVC,2,2)
A matriz SubMVC assim gerada ´e apresentada abaixo: Figura 11.9: Matriz SubMVC
Resta-nos, portanto calcular a forma quadr´atica e em seguida multiplicar o valor obtido por 1/2. Para isto fazemos uso dos comandos
vector FQ=@transpose(A)*@inverse(SubMVC)*A vector F=FQ(1)*(1/2)
O vetor F ´e apresentado a seguir:
Figura 11.10: Vetor F O valor-p para este teste ´e gerado por
vector valorp = @fdist(F(1), 2, 36)
O vetor valorp descrito acima retorna a probabilidade de uma estat´ıstica F com 2 graus de liberdade no numerador e 36 graus de liberdade no denominador exceder 572, 3982. O valor apresentado ´e virtualmente zero, de modo que rejeitamos fortemente a hip´otese nula de que β2 β3 = 2/3 1/3
conforme j´a era previsto pela abordagem do intervalo de confian¸ca. Note que o valor da estat´ıstica F calculada neste exemplo ´e exatamente o mesmo daquele gerado no cap´ıtulo 14, exemplo 14.8.
90CAP´ITULO 11. UTILIZA ¸C ˜AO DE VETORES NO ARMAZENAMENTO DE INFORMA ¸C ˜OES