• Nenhum resultado encontrado

CAPÍTULO 12 AUTOCORRELAÇÃO

N/A
N/A
Protected

Academic year: 2021

Share "CAPÍTULO 12 AUTOCORRELAÇÃO"

Copied!
27
0
0

Texto

(1)

C

APÍTULO 

12 ‐ A

UTOCORRELAÇÃO

 

12.1. A NATUREZA DO PROBLEMA 

O  objetivo  deste  capítulo  é  examinar  as  conseqüências  da  violação  de  uma  das  hipóteses  fundamentais  do  modelo  linear  clássico,  a  hipótese  de  que  os  erros  do  modelo  não  são  correlacionados. 

 

Este  tipo  de  problema  ocorre  na  prática  quando  fazemos  regressão  de  séries  temporais,  e  no  restante do capítulo usaremos o subscrito t (ao invés de i) para explicitar a dependência dos dados  no  tempo.  Também,  por  razões  que  deverão  ficar  claras  ao  longo  do  texto,  os  erros  (correlacionados)  serão  denotados  por  u,  enquanto  os  erros  não  correlacionados  continuarão,  como nos capítulos anteriores, a ser denotados por ε. 

 

Em primeiro lugar, é preciso definir o que entendemos por autocorrelação (ou correlação serial).  A  autocorrelação  é  a  correlação  que existe entre valores de uma série temporal observados em  diferentes  instantes  de  tempo.  A  autocorrelação  pode  também  se  referir  a  observações  em  diferentes  pontos  no  espaço  (correlação  espacial),  e  o  tratamento  dado  ao  problema  é  basicamente  o  mesmo  apresentado  aqui,  por  isso  nosso  foco  será  apresentar  o  problema  no  contexto de séries temporais. 

 

No modelo clássico, uma das premissas é a inexistência de correlação entre os erros em instantes  distintos. Isto é, supõe‐se que: E(ui.uj) = 0 para i ≠ j. Note que esta hipótese implica em Cov(ui, uj) = 

0 para  i ≠ j pois a média do erro é zero por hipótese.   

Em que situação esta premissa costuma ser violada? Considere, por exemplo, um modelo para a  venda mensal de TVs no varejo. No passado recente, houve a redução de imposto sobre produtos  industrializados para combater a recessão, e isso incrementou as vendas. Também, em 2009, as 

(2)

taxas  de  juros  ao  consumidor  caíram.  Agora,  em  2010,  estamos  a  um  passo  da  Copa  do  Mundo  que,  sabidamente,  tem  um  impacto  positivo  sobre  as  vendas  de  TVs.  E  os  erros  de  um  modelo,  como  ficam?  Muito  provavelmente,  o  erro  do  modelo  num  mês  terá  uma  expressiva  correlação  com  o  erro  do  modelo  em  meses  adjacentes.  Ou  seja,  a  hipótese  de  que  erros  em  instantes  diferentes  são  descorrelatados  é  falsa,  ou  seja,  existe  autocorrelação  entre  os  erros.  Isso  quer  dizer que as perturbações que ocorrem num instante de tempo afetam as que ocorrem em outro  instante. 

 

Antes de descobrir por que existe autocorrelação, é essencial esclarecer algumas questões sobre  nomenclatura. É prática comum tratar a autocorrelação e a correlação serial como sinônimos, mas  alguns  autores  preferem  distinguir  os  dois  termos.  Nós  não  faremos  isso  aqui  –  para  nós,  autocorrelação e correlação serial significam a mesma coisa. 

 

A  Figura  12.1.  a  seguir  exibe  alguns  padrões  plausíveis  para  a  presença  e  ausência  de  autocorrelação. Nela são plotados os erros (ou, na prática, os resíduos) contra o eixo dos tempos.  A  Figura  12.1a  mostra  um  padrão  cíclico.  A  Figura  12.1b  sugere  uma  tendência  ascendente  nos  erros, enquanto a Figura 12.1.c mostra um padrão linear descendente linear nos distúrbios. 12.1d  mostra termos de tendência linear e quadrática nos distúrbios. Apenas a Figura 12.1.e não exibe  um padrão sistemático, apoiando a hipótese de autocorrelação nula dos erros, que é a premissa  do modelo clássico de regressão.  FIGURA 12.1   

(3)

      A pergunta natural é: Por que a correlação serial ocorre? Há diversas razões, algumas mostradas a  seguir.   Inércia  Séries temporais econômicas apresentam inércia ou lentidão. O PIB, índices de preços, produção,  emprego e desemprego apresentam ciclos. A partir do fundo da recessão, começa a recuperação  econômica e a maioria destas séries começar a se mover para cima. Neste movimento, o valor de  uma série num ponto no tempo é maior do que seu valor anterior. Assim, há uma dinâmica que  continua  até  que  algo  aconteça  (por  exemplo,  o  aumento  na  taxa  de  juros  ou  os  impostos,  ou  ambos)  para  atrasá‐los.  Por  isso,  nas  regressões  envolvendo  séries  temporais,  observações   sucessivas tendem a ser interdependentes. 

Viés de Especificação – variáveis excluídas 

(4)

para  descobrir  se  eles  estão  de  acordo  com  as  expectativas  a  priori  e  as  premissas  básicas  dos  modelos  de  mínimos  quadrados.  Por  exemplo,  o  pesquisador  pode  plotar  os  resíduos  obtidos  a  partir  da  regressão  ajustada  e  observar  padrões  como  os  mostrados  na  Figura  12.1a  a  d.  Esses  resíduos  podem  sugerir  que  algumas  variáveis  que  foram  originalmente  candidatas,  mas  não  foram incluídas no modelo, devem ser incluídas. Este é o caso do viés de especificação da variável  excluída. Muitas vezes, a inclusão dessas variáveis remove o padrão de correlação observado nos  resíduos. Por exemplo, suponha que temos o modelo de demanda: 

 

Onde  Y  =  quantidade  demandada  de  carne  de  boi,  X2  =  preço  da  carne  de  boi,  X3  =  renda  do  consumidor, X4 = preço da carne de porco e t = tempo. No entanto, por alguma razão, ajustamos a  regressão que se segue: 

 

Agora, se (12.1.2) é o modelo verdadeiro, mas ajustamos (12.1.3), isso equivale a fazer vt = β4.X4t + 

ut.  E  na  medida  que  o  preço  da  carne  suína  afeta  o  consumo  de  carne,  o  termo  de  erro  ou 

distúrbio v irá refletir um padrão sistemático, criando assim uma (falsa) autocorrelação. Um teste  simples disso seria executar os dois modelos (12.1.2) e (12.1.3) e ver se autocorrelação, observada  no  modelo  (12.1.3)  desaparece  quando  (12.1.2)  é  ajustado.  A  mecânica  de  detecção  de  autocorrelação será discutida na seção 12.6.  

Viés de Especificação – Forma Funcional Incorreta

Suponha que o modelo verdadeiro é:

  Mas em vez deste, ajustamos o seguinte modelo: 

 

Ou  seja,  ajustamos  uma  forma  funcional  errada  para  a  função  custo  marginal,  que  é  a  variável  dependente no modelo. As curvas de custo marginal correspondentes ao modelo "verdadeiro'' e “ 

(5)

FIGURA 12.2. 

 

Como a Figura 12.2 mostra, entre os pontos A e B a curva de custo marginal linear estará sempre  acima  do  verdadeiro  custo  marginal,  enquanto  que  fora  deste  intervalo  o  oposto  ocorre.  Este  resultado  é  esperado,  pois  o  termo  de  erro  vi   em  (12.1.5,  o  modelo  errado)  é,  de  fato,  igual  a 

Output2 + ui  e, portanto, vai pegar o efeito sistemático do termo Output2 no custo marginal. Neste 

caso, vi exibirá autocorrelação por causa da utilização de uma forma funcional errada. No capítulo 

13, vamos considerar vários métodos para detectar o viés de especificação.   

Fenômeno Cobweb (Teia de Aranha)  

O fornecimento de muitos produtos agrícolas reflete o fenômeno chamado “teia de aranha”, onde  a  oferta  reage  ao  preço  com  uma  defasagem  de  um  período  de  tempo,  porque  as  decisões  de  oferta levam um certo tempo para serem implementadas (o período de gestação). Assim, no início  do plantio da safra deste ano, os agricultores são influenciados pelo preço vigente no ano passado,  e sua função de oferta é: 

 

Suponha que no final do período t, o preço Pt é inferior ao preço do amo passado, Pt‐1. No período 

t + 1 os agricultores podem decidir produzir menos do que eles fizeram no período t. Obviamente,  nesta situação os distúrbios não  deverão ser aleatórios, pois se os agricultores produzem demais  no ano t, devem reduzir sua produção em t + 1, e assim por diante, levando a um padrão de teia 

(6)

Defasagens 

Em  uma  regressão  de  séries  temporais  das  despesas  de  consumo  sobre  a  renda,  é  comum  observar que a despesa de consumo do período atual período depende, entre outras coisas, das  despesas de consumo dos períodos anteriores.  Por exemplo: 

 

Um  modelo  de  regressão  como  (12.1.7)  é  conhecido  como  auto‐regressivo  porque  uma  das  variáveis explicativas é o valor defasado da variável dependente. (Estes modelos serão novamente  estudados  no  capítulo  17.)  A  justificativa  para  um  modelo  como  (12.1.7)  é  simples.  Os  consumidores  não  mudam  seus  hábitos  de  consumo  facilmente  por  motivos  psicológicos,  tecnológicos  ou  institucionais.  Agora,  se  nós  negligenciarmos  o  termo  defasado  em  (12.1.7),  o  termo  de  erro  resultante  refletirá  um  padrão  sistemático  devido  à  influência  do  consumo  defasado sobre o consumo atual.  

 

Manipulação de dados 

Na  análise  empírica,  os  dados  brutos  são  frequentemente  "Manipulados''.  Por  exemplo,  em  regressões envolvendo séries trimestrais, os dados são às vezes obtidos a partir dos dados mensais  simplesmente adicionando três observações mensais e dividindo a soma por 3. Esta média suaviza  as flutuações do dados mensais, e o gráfico dos dados trimestrais parece muito mais suave do que  o dos dados mensais, e essa mesma regularidade pode gerar um padrão sistemático nos termos  de erro, introduzindo assim autocorrelação.   Outra fonte de manipulação é interpolação ou extrapolação de dados. Por exemplo, o Censo de  População é realizado a cada 10 anos. Se existe uma necessidade de obter dados para alguns anos  no período intercensitários 1990‐2000 ou 2000‐2010, a prática comum é a interpolação com base  em  algum  pressuposto  “ad‐hoc”.  Estas  técnicas  de  “massagem”  dos  dados  podem  impor  aos  dados um padrão sistemático que pode não existir nos dados originais. 

(7)

Transformação de dados 

Considere o seguinte modelo: 

 

Onde,  por  exemplo,  Y  =  despesa  de  consumo  e  X  =  renda.  Como  (12.1.8)  é  válido  em  todos  os  períodos  de  tempo,  ele  é  válido  também  no  período  anterior  (t  ‐  1).  Assim,  podemos  escrever  (12.1.8) como:    Yt‐1, Xt‐1, e ut‐1 são conhecidos como os valores defasados de Y, X, e U respectivamente. Neste caso  a defasagem é de um período. Subtraindo (12.1.9) de (12.1.8), obtemos:    Onde Δ é conhecido como o operador de primeira diferença.  

Assim, ΔYt = (Yt ‐ Yt‐1), ΔXt = (Xt ‐ Xt‐1) e  ΔUt = (Ut ‐ Ut‐1). Podemos escrever (12.1.10) como: 

  A equação (12.1.9) é conhecida como forma de nível e a equação (12.1.10) é conhecida como a 

forma  de  primeira  diferença.  Ambas  as  formas  são  frequentemente  utilizadas  em  pesquisas 

empíricas. Por exemplo, se em (12.1.9) Y e X representam os logaritmos das despesas de consumo  e  renda,  então  em  (12.1.10)  ΔY  e  ΔX  representam  variações  nos  logaritmos  das  despesas  de  consumo e renda. Mas, uma variação no logaritmo é uma mudança relativa (percentual), se ela for  multiplicada  por  100.  Assim,  em  vez  de  estudar  relações  entre  as  variáveis  na  forma  de  nível,  podemos estar interessados em suas relações na forma de crescimento.  

Se  o  termo  de  erro  em  (12.1.8)  satisfaz as hipóteses‐padrão MQO, especialmente a hipótese de  não autocorrelação, pode‐se mostrar que o erro vt em (12.1.11) é autocorrelacionado. (A prova é 

(8)

Modelos como (12.1.11) são conhecidos como modelos de regressão dinâmica, ou seja, modelos  que envolvem regressandos defasados. Eles serão estudados em profundidade no Capítulo 17. O  que  interessa  no  exemplo  anterior  é  que  às  vezes  a  autocorrelação  pode  ser  induzida  como  resultado da transformação do modelo original. 

 

Não‐estacionariedade 

Lembre‐se  que  uma  série  temporal  é  estacionária  se  suas  características  (por  exemplo,  média,  variância e covariância) são invariantes no tempo, ou seja, eles não mudam ao longo do tempo. Se  isso  não  acontecer,  a  série  temporal  é  dita  não  estacionária.  Como  veremos  na Parte V, em um  modelo  de  regressão  na  forma  do  nível  como  (12.1.8)  é  possível  que  tanto  Y  e  X  sejam  não‐ estacionárias e, portanto, o erro u também seja não‐estacionário, e irá exibir autocorrelação.   

Em  resumo,  existem  diversas  razões  pelas  quais  o  termo  de  erro  em  um  modelo  de  regressão  pode ser autocorrelacionado. No restante do capítulo, investigamos os problemas decorrentes da  autocorrelação e que pode ser feito sobre isso.  

A  autocorrelação  pode  ser  positiva  (Figura  12.3a)  ou  negativa,  embora  a  maioria  das  séries  temporais  econômica  geralmente  apresente  autocorrelação  positiva.  Isso  acontece  porque  a  maioria  delas  move‐se  para  cima  ou  para  baixo  durante  longos  períodos  de  tempo  e  não  apresenta um movimento constante para cima e para baixo como o mostrado na Figura 12.3b. 

FIGURA 12.3. – AUTOCORRELAÇÃO POSITIVA (a) E NEGATIVA (b) 

(9)

    12.2. ESTIMATIVA MQO NA PRESENÇA DE  AUTOCORRELAÇÃO    O que acontece com os estimadores de MQO e suas variâncias se os erros do modelo apresentam  autocorrelação?  Suponha agora que E (ut.ut  +  s) ≠ 0 para s ≠ 0 e que todas as outras hipóteses do modelo clássico  são mantidas.  Considere o modelo de regressão com duas variáveis: Yt = β1 + β2.Xt + ut.   Suponha que os ruídos deste modelo têm agora a seguinte estrutura:    Onde ρ  (a letra grega rô) é o coeficiente de autocorrelação e εt é o erro estocástico que satisfaz as  hipóteses usuais do modelo de mínimos quadrados, a saber:   

(10)

Na literatura de engenharia, um termo de erro com as propriedades (12.2.2) é chamado de “ruído 

branco”. O que (12.2.1) postula é que a valor do termo de erro no período t é igual a ρ vezes o seu 

valor no período anterior, acrescido de um termo de erro puramente aleatório.  

O esquema (12.2.1) é conhecido como esquema autoregressivo de primeira ordem de Markov, ou  simplesmente  regime  auto‐regressivo  de  primeira  ordem,  geralmente  denotado  como  AR  (1).  O  nome autoregressivo é apropriado porque (12.2.1) pode ser interpretado como a regressão de ut  em sim mesmo defasado em um período. Diz‐se que é de primeira ordem porque ut e seu valor  imediatamente anterior estão envolvidos, ou seja, o máximo atraso é 1. Se o modelo for ut = ρ1ut‐1  + ρ2 ut‐2  + εt, seria um AR (2), um modelo autoregressivo de segunda ordem.     Pode‐se provar que, na situação de ruídos AR(1):   

Onde    cov(ut,ut  +  s)  indica  a  covariância  entre  os  termos  de  erro  separados  por  s  instantes  e 

cor(ut,ut + s) a correlação entre estes mesmos termos de erro. Note que cor(ut,ut) = 1 sempre, pois 

a correlação de uma variável com si mesma é sempre um. Por causa da propriedade de simetria de  covariâncias e correlações,  cov(ut,ut + s) = cov(ut,ut ‐ s) e o mesmo ocorre com as correlações. 

O coeficiente ρ é uma constante entre ‐1 e +1 e então (12.2.3) mostra que, sob o esquema AR (1),  a variância de ut  é ainda constante (ut é  homocedástico), mas ut está correlacionado não só com 

o  seu  valor  imediatamente  anterior,  mas  também  com  seus  valores  em  outros  instantes  do  passado.  

É fundamental observar que |ρ|< 1, ou seja, o valor absoluto de ρ é menor que um. Se ρ = 1, as  variâncias  e  covariâncias  acima  não  estão  definidas.  Se  |ρ|  <1,  dizemos  que  o  processo  AR  (1)  dado em (12.2.1) é estacionário, ou seja, sua média, variância e covariância não mudam ao longo  do  tempo.  Se  |ρ|  é  menor  que  um,  então  a  covariância  diminuirá  à  medida  que  avançamos  no  passado distante, ou seja, à medida que a diferença entre as defasagens (“lags”) aumenta.  Se |ρ| 

(11)

é  MAIOR  que  um,  o  processo  é  não  estacionário  e  tem  um  comportamento  claramente  “explosivo”. Gere uma sequência de erros iid {et} no Excel e ajuste o modelo ut = 1,2ut‐1 + et para 

verificar que isso acontece. Utilize qualquer valor inicial para u0. Se ρ = 1, o processo é descrito por 

ut = ut‐1 + et, e é um processo NÃO ESTACIONÁRIO bastante importante na prática, chamado de 

“random walk”, ou passeio aleatório. O fato interessante é que a primeira diferença de um passeio  aleatório é um processo estacionário, pois ut ‐ ut‐1 = et, ou seja, Δut = et onde Δ é o operador 1a. 

diferença. 

Uma razão para usar o modelo AR (1) não é apenas por sua simplicidade em relação aos modelos  AR de ordem superior, mas também porque, mostrou ser útil em aplicações práticas. 

 Considere novamente o modelo de regressão de duas variáveis: Yt = β1 + β2.Xt + ut.  No capítulo 3 

vimos que o estimador MQO do coeficiente angular é:    Cuja variância é dada por:    Onde a letra minúscula indica que a variável é calculada como um desvio em relação à média.  Sob a hipótese AR(1), pode‐se mostrar que a variância deste estimador é:   

Onde Var(β^2)AR1  indica a variância do estimador sob a hipótese de erros AR(1). 

A comparação de (12.2.8) e (12.2.7) mostra que a variância sob o esquema AR(1) tem uma coleção  de termos adicionais (em relação à variância sob a hipótese de erros não correlacionados). Estes  termos adicionais dependem de ρ e também das autocorrelações amostrais da variável explicativa  X em vários períodos anteriores. 

(12)

Além disso, em geral não podemos prever se a variância dada por (12.2.7) será maior ou menor 

que a dada por (12.2.8). É claro que se ρ = 0, as duas fórmulas coincidirão. Mas, como princípio 

geral, as duas variâncias não serão iguais. 

Para dar uma idéia da diferença entre as variâncias (12.2.7) e (12.2.8), suponha que o regressor X  também  siga  um  processo  AR(1)  com  um  coeficiente  de  autocorrelação  r.  Pode‐se  mostrar  que  (12.2.8) se reduz a: 

 

Se, por exemplo, r = 0,6 e ρ = 0,8, utilizando (12.2.9) segue que Var(β^2)AR1 = 2,8461 Var(β^2)MQO. 

Dito de outra forma, Var(β^2)MQO = (1/ 2,8461) Var(β^2)AR1 = 0,3513 Var(β^2)AR1. Ou seja, a fórmula 

usual de MQO [(12.2.7)] subestimará a variância de β2 sob o esquema AR(1) por cerca de 65%.  

Em  resumo:  uma  aplicação  cega  das  fórmulas  MQO  usuais  para  calcular  os  desvios  e  os  erros  padrão dos estimadores MQO estimadores pode levar a resultados totalmente enganosos.    

Suponha  que  a  gente  insista  em  continuar  usando  o  estimador  MQO  de  β2  e  que  corrigimos  a 

variância  levando  em  conta  a  estrutura  AR(1)  para  o  erro.  Quais  as  propriedades  de  β^2 ?  Ele  é 

ainda linear e não tendencioso, mas não é BLUE (ou seja, não é eficiente). Já tínhamos chegado a  conclusões  semelhantes  quanto  estudamos  o  problema  da  heterocedasticidade,  e  vimos  que  naquelas condições era possível encontrar um estimador eficiente através de mínimos quadrados  generalizados. Na próxima seção veremos quais os passos necessários para encontrar estimadores  BLUE sob a hipótese de erros AR(1).    12.3. O ESTIMADOR BLUE NA PRESENÇA DE AUTOCORRELAÇÃO  Considere ainda o modelo de regressão com duas variáveis e suponha a existência de erros AR(1)  como na seção anterior. Pode‐se mostrar que o estimador BLUE do coeficiente angular é dado por: 

(13)

  Onde C é um fator de correção que pode ser ignorado na prática. Note que em (12.3.1) o subscrito  t vai de 2 até n (pois o estimador depende de y e x defasados em um instante). A variância deste  estimador é dada por:    Onde D é um outro fator de correção, que também pode ser ignorado na prática. 

O  estimador  β^2GLS  ,  como  o  expoente  sugere,  é  obtido  pelo  método  de  mínimos  quadrados  generalizados.  Como  observado  no  Capítulo  11,  o  método  de  mínimos  quadrados  generalizados 

quer  incorporar  quaisquer  informações  adicionais  disponíveis  (por  exemplo,  a  natureza  da  heterocedasticidade  ou  a  autocorrelação)  diretamente  no  processo  de  estimação  através  da  transformação das variáveis, enquanto que os mínimos quadrados ordinários esta informação não  é diretamente levada em consideração.  

 

A  fórmula  do  estimador  de  mínimos  quadrados  generalizados  dado  em  (12.3.1)  depende  explicitamente do parâmetro de autocorrelação ρ enquanto o estimador MQO dado por (12.2.6)  ignora esta informação.    Intuitivamente, essa é a razão pela qual o estimador de mínimos quadrados generalizados é BLUE  e não o estimador MQO. O estimador de mínimos quadrados generalizados usa toda a informação  disponível, o que não ocorre com o estimador MQO.  Se ρ = 0, não existem informações adicionais  a  serem  consideradas,  e,  portanto,  os  estimadores  por  mínimos  quadrados  generalizados  e  mínimos quadrados ordinários são idênticos. 

(14)

Em  resumo,  sob  autocorrelação,  é  o  estimador de mínimos quadrados generalizados dado em  (12.3.1) que é BLUE e a variância mínima é agora dada por (12.3.2) e não por (12.2.8) ou (12.2.7). 

Você  pode  reescrever  o  estimador  de  mínimos  quadrados  generalizados  de  uma  forma  mais  parecida com o estimador usual MQO. Sejam:  1 * 1 * . . − − − = − = t t t t t t y y y x x x ρ ρ   Então, a equação (12.3.1) torna‐se:  C x y x t t t GLS = +

2 * * * 2 ˆ β , que tem praticamente a mesma forma que a do estimador MQO, mas agora  aplicado  às  variáveis  * * e t t y

x .  Também  é  importante  notar  que  em  (12.3.1)  e  em  (12.2.6)  os  estimadores  estão  expressos  como  funções  das  variáveis  centradas  em  torno  das  suas  médias  (expressas por letras minúsculas).  Nota técnica  O Teorema de Markov fornece apenas uma condição suficiente para o estimador MQO ser BLUE.  As condições necessárias e suficientes para que este estimador seja BLUE são dadas pelo teorema  de Krushkal, mencionado no capítulo anterior. Logo, em alguns casos o estimador MQO pode se  BLUE apesar da autocorrelação. Mas, estes casos não são comuns na prática.    12.4 O QUE ACONTECE SE USAMOS MQO E EXISTE AUTOCORRELAÇÃO? 

Lembre‐se:  mesmo  quando  existe  autocorrelação,  os  estimadores  MQO  são  ainda  não  tendenciosos e lineares, além de consistentes e assintoticamente Normais. Mas, eles não são mais  estimadores de variância mínima (ou seja, não são BLUE)! 

Suponha que continuamos a usar os estimadores MQO. Levaremos em conta duas situações. 

1) Estimação MQO levando em conta a autocorrelação 

(15)

 

Mas, agora decidimos empregar sua variância corrigida para a autocorrelação, isto é: 

 

Se empregarmos esta variância (12.2.8) na construção de intervalos de confiança, os IC tendem a  ser mais largos que os obtidos a partir dos estimadores de mínimos quadrados generalizados, e  isto  ocorre  mesmo  se  aumentarmos  indefinidamente  o  tamanho  da  amostra.  Ou  seja,  na 

situação de autocorrelação dos erros, o estimador MQO não é assintoticamente eficiente. 

Em resumo: não use estimadores MQO na presença de autocorrelação, pois você estará tirando  conclusões erradas, e aumentar o tamanho da amostra não melhorará a situação. 

 

2) Estimação MQO sem levar em conta a autocorrelação 

A  situação  torna‐se  ainda  pior  se,  além  de  usarmos  o  estimador  MQO  na  presença  de  autocorrelação,  deixarmos  de  corrigir  sua  variância,  isto  é,  continuamos  a  usar: 

  Quais os problemas decorrentes desta decisão?  A variância dos resíduos, dada por:  2 2 ˆ ˆ 2 2 − = − =

n RSS n ut

σ   será  provavelmente  menor  que  a  variância real  σ2. Isso nos leva a superestimar R2 e as estatísticas t. 

Mesmo que σ2

  não  seja  subestimado,  Var(β^2)  poderá  subestimar  Var(β^2)AR1   dada pela 

equação  (12.2.8),  a  variância  do  estimador  MQO  sob  a  premissa  de  autocorrelação  dos  resíduos  de  lag  1.  Assim,  os  testes  t  e  F  construídos  a  partir  de  Var(β^2)  levarão  a 

(16)

Sob  a  premissa  do  modelo  clássico  (inexistência  de  autocorrelação  dos  resíduos),  o  estimador da variância  2 2 ˆ ˆ 2 2 − = − =

n RSS n ut σ  é não tendencioso para σ2, isto é: 

( )

2 2 ˆ σ σ = E

Se  a  hipótese  de  inexistência  de  autocorrelação  for  violada  e  supormos  que  os  erros  seguem uma estrutura AR(1) então pode‐se mostrar que: 

 

Onde  r  é  o  coeficiente  de  correlação  amostral  entre  valores  sucessivos  da  variável 

explicativa X, dado por:     Suponha que ambos ρ e r são positivos, o que é usual no caso de séries econômicas. Então,  de (12.4.1) segue que 

( )

2 2 ˆ σ σ < E  , ou seja, o estimador usual da variância subestimará a  variância verdadeira. 

Além disso, Var(β^2) é um estimador tendencioso de Var(β^2)AR1, o que pode ser observado 

comparando‐se  (12.2.7)  e  (12.2.8).    Se  ambos  ρ  e  r  são  positivos  segue  que  Var(β^2)  < 

Var(β^2)AR1 e então a variância do estimador MQO subestima sua variância sob a premissa 

de erros AR(1). Então, ao usar o estimador MQO β^2 estamos supondo que ele tem uma 

precisão  maior  que  a  real  (isto  é,  estamos  subestimando  seu  erro  padrão).  Assim,  ao  calcular a estatística t para β2 estaremos “inflando” o valor desta estatística, que parecerá 

maior  do  que  é,  na  verdade.  Isso  nos  leva  a  acreditar  que  o  parâmetro  β2  é  significante, 

quando, não verdade, não o é.   

Exemplo – simulação de Monte Carlo 

O  objetivo  deste  exemplo  é  mostrar  como  o  uso  do  estimador  MQO  na  situação  de  erros  AR(1)   tende a subestimar σ2 e Var(β^2). Suponha que o modelo real é conhecido e dado por: 

t t t t t t u u u X Y ε + = + + = −1 7 , 0 8 , 0 1       (12.4.3  e 12.4.5)  Onde os ε são um ruído branco com média zero e variância 1. 

(17)

Os  εt  ´s  serão  gerados  aleatoriamente  da  distribuição  N(0,1)  (usando  o  Excel),  e  usamos  como 

valor inicial ε0 = 0. Note que, a partir da geração dos εt ´s e de um valor inicial para u, por exemplo 

u0  =5,  podemos  usar  a  equação  (12.4.5)  para  gerar  uma  sequência  de  ut  que  apresentam 

correlação serial de lag 1. 

Na tabela abaixo estão os εt ´s gerados aleatoriamente da distribuição N(0,1). 

instante (t) e(t) instante (t) e(t) instante (t) e(t) instante (t) e(t) instante (t) e(t) 0 0 11 -0,690 22 -0,370 33 0,539 44 -0,363 1 -0,300 12 -1,690 23 1,343 34 0,902 45 -0,032 2 -1,278 13 -1,847 24 -0,085 35 1,919 46 0,028 3 0,244 14 -0,978 25 -0,186 36 -0,085 47 -0,323 4 1,276 15 -0,774 26 -0,513 37 -0,524 48 2,195 5 1,198 16 -2,118 27 1,972 38 0,675 49 -1,742 6 1,733 17 -0,568 28 0,866 39 -0,381 50 -0,736 7 -2,184 18 -0,404 29 2,376 40 0,758 8 -0,234 19 0,135 30 -0,655 41 -1,444 9 1,095 20 -0,365 31 1,661 42 -0,847 10 -1,087 21 -0,327 32 -1,612 43 -1,522   A partir desta tabela podemos gerar os ut de acordo com a equação (12.4.5) e a condição inicial u0  = 5. Por exemplo:  u1 = 0,7.u0 +ε1 = 0,7(5) + (‐0,300) = 3,200  u2 = 0,7.u1 +ε2 = 0,7(3,200) + (‐1,278) = 0,962  etc...  A próxima figura mostra a evolução dos ut´s ao longo do tempo.  u(t) = 0,7*u(t-1)+e(t) -6 -4 -2 0 2 4 6 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50  

(18)

Suponha  agora  que  os  valores  de  X  são  1,  2,  ...,  50.  A  partir  deles  e  dos  u´s  gerados  acima  podemos, a partir da equação (12.4.3), obter os Yt. Então, Yt = 1 + 0,8.Xt + ut para t = 1,2, ..., 50.  

Específicamente,  

Y1 = 1 + 0,8 + u1 = 1,8 + u1 = 1,8 + 3,2 = 5 

Y2 = 1 + 0,8(2) + u2 = 2,6 + u2 = 2,6 + 0,962 = 3,562, etc... 

A próxima tabela fornece os valores de  ut e Yt para t = 1,2,...10. 

instante (t) e(t) u(t) = 0,7*u(t-1)+e(t) Y(t) = 1 + 0,8*t +u(t)

0 0 5 1 -0,300 3,200 5,000 2 -1,278 0,962 3,562 3 0,244 0,918 4,318 4 1,276 1,919 6,119 5 1,198 2,542 7,542 6 1,733 3,512 9,312 7 -2,184 0,275 6,875 8 -0,234 -0,042 7,358 9 1,095 1,066 9,266 10 -1,087 -0,341 8,659  O gráfico de Yt  é mostrado a seguir (para t =1, 2,..., 50):  Y(t) = 1 + 0,8*t +u(t) 0 5 10 15 20 25 30 35 40 45 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50  

No  próximo  passo  ajustamos  uma  regressão  aos  primeiros  25  pares  (Xt,Yt).  Veremos  que  o 

(19)

O resultado da regressão linear no Excel é:  ANOVA gl SQ MQ F F de significação Regressão 1 521,03 521,03 148,91 0,00 Resíduo 23 80,48 3,50 Total 24 601,50  

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores

Interseção 2,5160 0,7712 3,2623 0,0034 0,9206 4,1115 X 0,6331 0,0519 12,2029 0,0000 0,5258 0,7404 

O  R2  desta  regressão  é  86,6%.    Note  que  a  variância  estimada  2

ˆ

σ é  3,50  (igual  à  RSS/(n‐2)  =  80,48/23 =3,50), um valor MUITO diferente do real. 

Da  tabela  acima  nota‐se  que  a  equação  estimada  usando  os  primeiros  25  pares  é: 

t

t X

Yˆ =2,516+0,633*   e ambos os coeficientes angular e linear são significantes, de acordo com  as estatísticas t correspondentes. 

A  próxima  figura  mostra  os  valores  de  Yt  e  as  retas  real  (1  +  0,8Xt)  e  ajustada  pelo  modelo  de 

regressão nos 25 primeiros pontos (2,516 + 0,633Xt). 

Valor Real de Y, reta estimada por MQO e reta verdadeira

0 4 8 12 16 20 24 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

Y real Reta verdadeira (1 +0,8*X) Y Previsto MQO

 

A figura anterior justifica porque o procedimento de MQO tende a subestimar a variância se existe  autocorrelação dos resíduos. Note que os resíduos computados em relação à reta vermelha (reta  MQO) tendem a ser menores que os resíduos calculados em relação à reta real (reta azul). Para  verificar  isso,  basta  selecionar  um  ponto  Y  qualquer  e  traçar  a  linha  vertical  entre  Y  e  a  reta 

(20)

ajustada  MQO  (ou  entre  Y  e  a  linha  verdadeira  –  linha  azul).  Assim,  os  resíduos  MQO  não  fornecem uma boa estimativa dos erros ui. 

Considere  um  outro  experimento  de  Monte  Carlo,  usando  os  mesmos  dados  que  antes,  mas  suponha  que  ρ =  0  na  equação  (12.4.5),  e  não  mais  0,7  como  suposto  na  experiência  anterior.  Então os ut são agora descorrelatados, u1 = ε1 = ‐0,300, u2 = ε2 = ‐1,278, etc... 

Daí: 

Y1 = 1 + 0,8 + u1 = 1,8 + u1 = 1,8 – 0,3 = 1,5 

Y2 = 1 + 0,8(2) + u2 = 2,6 + u2 = 2,6 – 1,278 = 1,322  etc... 

A seguir ajustamos a reta por MQO para os primeiros 25 pares (Xt,Yt). Note que agora a hipótese  de erros descorrelatados é válida e assim a reta ajustada deve se aproximar da reta verdadeira 1 +  0,8Xt. Os 25 valores de X e Y são mostrados na próxima tabela:  X Y X Y 1 1,50 14 11,22 2 1,32 15 12,23 3 3,64 16 11,68 4 5,48 17 14,03 5 6,20 18 15,00 6 7,53 19 16,33 7 4,42 20 16,63 8 7,17 21 17,47 9 9,30 22 18,23 10 7,91 23 20,74 11 9,11 24 20,11 12 8,91 25 20,81 13 9,55   A equação estimada usando os primeiros 25 pares é: Yˆt =0,785+0,790*Xt    Note que o coeficiente linear da regressão não é significante (a 5%). O R2 desta regressão é 96,7%   (no  caso  anterior  era  86,6%).  A  variância  estimada  2

ˆ

σ é  1,20  (vide  tabela  ANOVA),  bem  mais  próxima do valor verdadeiro (1). 

(21)

Modelo Simulado SEM Autocorrelação dos Resíduos - valores reais, reta teórica e reta ajustada por MQO

0 5 10 15 20 25 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

Y Reta verdadeira (1 +0,8*X) Y Previsto MQO

RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,9834 R-Quadrado 0,9672 R-quadrado ajustad 0,9657 Erro padrão 1,0951 Observações 25 ANOVA gl SQ MQ F F de significação Regressão 1 812,31 812,31 677,31 0,00 Resíduo 23 27,58 1,20 Total 24 839,89

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Interseção 0,785 0,452 1,739 0,095 -0,149 1,719 X 0,790 0,030 26,025 0,000 0,728 0,853 

O gráfico a seguir apresenta os pares (X, Y) e as retas real e ajustada por MQO.   

12.5. EXEMPLO ‐ RELAÇÃO ENTRE SALÁRIOS E PRODUTIVIDADE NOS EUA 

Os  dados  da  tabela  12.4  apresentam  índices  de  remuneração  real  por  hora  (Y)  e  produção  por  hora (X) em empresas dos EUA no período entre 1959 e 1998. 

A figura a seguir mostra estes dados. 

(22)

  Gujarati ajusta dois modelos, um linear e outro log‐linear, com os resultados mostrados a seguir.  1) Modelo linear    Ode d é a estatística de Durbin‐Watson, que será discutida a seguir e  se(.) indica o erro padrão do  estimador.  2) Modelo log‐linear    As questões que se colocam na prática são:  Os modelos exibem resultados parecidos.   Os coeficientes estimados, avaliados pelas estatísticas t, parecem altamente significantes.  Mas, até que ponto os resultados das regressões (12.5.1) e (12.5.2) são confiáveis?   A autocorrelação deve ser um problema aqui, pois ambas as séries evoluem no tempo, e  nesta situação não podemos confiar nos erros padrão (e assim as estatísticas t produzidas  também não são confiáveis). 

(23)

Então a questão principal é: COMO DETECTAR A AUTOCORRELAÇÃO?  12.6. DETECTANDO A AUTOCORRELAÇÃO 

 

Lembre‐se que a ausência de autocorrelação é uma premissa feita sobre os erros do modelo, que  não  são  observáveis  –  o  melhor  que  temos  para  “inferir”  sobre  os  erros  são  os  resíduos  do  modelo,  que  podem  ser  calculados.  Então  o  melhor  que  podemos  fazer  é  usar  os  resíduos  para  verificar  se  a  premissa  de  correlação  zero  dos  erros  está  sendo  violada  (usamos  este  mesmo  raciocínio para inferir sobre a heterocedasticidade, lembra‐se?).  1) Método Gráfico  O gráfico dos resíduos (ou do quadrado dos resíduos) pode revelar a existência de autocorrelação.  SE NÃO EXISTE AUTOCORRELAÇÃO, o gráfico dos resíduos ao longo do tempo deve ser puramente  aleatório, com o seguinte aspecto:   

Volte  ao  exemplo  da  seção  12.5. e considere o modelo linear (12.5.1). O gráfico dos resíduos (e  dos resíduos padronizados, i.e., divididos pelo erro padrão da regressão σˆ) é mostrado a seguir: 

(24)

Note que ambos os resíduos (“puro” e padronizado) exibem um padrão parecido com o da figura  abaixo: 

 

Ou  seja,  os  resíduos  parecem  seguir  o  padrão:  uma  sequência  de  valores  negativos,  uma  sequência de valores positivos e uma sequência de valores negativos. Este padrão sugere que os  resíduos não são puramente aleatórios, ou seja, há uma indicação de correlação entre os resíduos  de diferentes instantes. 

Uma forma de tentar verificar isso é fazer o gráfico do resíduo no instante t contra o resíduo no  instante anterior. Se este gráfico apresenta um padrão claramente não aleatório, há evidência de  que  o  resíduo  no  instante  t  dependa  do  resíduo  no  instante  anterior,  ou  seja,  há  evidência  de  autocorrelação de lag 1. O gráfico a seguir mostra os resíduos nos instantes t e t‐1 da regressão  linear (12.5.1). 

 

O  gráfico  mostra  um  padrão  linear  bastante  claro  entre  u^(t)  e  u^(t‐1).  Isso  indica  uma  forte  correlação  positiva  entre  os  resíduos,  e  portanto  há  evidência  de  autocorrelação  nos  erros  (não 

(25)

2) O teste das carreiras (“runs test”) 

Nas  páginas  anteriores  mostramos  algumas  maneiras  de  tentar  detectar  a  autocorrelação    nos  erros  a  partir  de  gráficos  dos  resíduos.  O  problema  é  que  estas  análises,  embora  muito  importantes,  são  bastante  empíricas  e  subjetivas,  não  há  uma  “receita”  infalível  para  dizer  inequivocamente que a autocorrelação existe ou não.  O teste das carreiras (também conhecido com teste de Geary ou teste de Wald‐Wolfowitz) é um  teste de aleatoriedade, e será aplicado aos resíduos do modelo. Ele se baseia no sinal dos resíduos  da regressão. Lembre‐se que os resíduos têm média zero, e assim o que o teste verifica é se os  padrões de resíduos acima e abaixo da média (zero) são aleatórios.  O teste pode ser estendido a  séries com médias diferentes de zero, basta aplicar o teste à série com a média subtraída.  No caso da regressão (12.5.1) existem 40 resíduos, que apresentam o seguinte padrão:  9 resíduos negativos  21 resíduos positivos  10 resíduos negativos  Definição (“carreira”)  Uma carreira (“run”) é uma sequência ininterrupta de resultados com o mesmo sinal. A extensão  da carreira é o número de elementos que a compõem. No caso dos resíduos da regressão (12.5.1)  existem 3 carreiras, a primeira de extensão (comprimento) 9, a segunda de comprimento 21 e a  terceira de comprimento 10. Será que estas 3 carreiras se comportam mais ou menos da mesma  forma que uma sequência de 3 carreiras de 40 observações aleatórias?  Sejam:  N = número total de observações = N1 + N2  N1 = número de sinais positivos  N2 = número de sinais negativos  R = número de carreiras 

(26)

Considere  a  hipótese  nula  de  que  os  resultados  sucessivos  são  independentes.  Suponha  que  AMBOS N1  e N2 > 10. Nestas condições, o número de carreiras ® é assintoticamente Normal com 

média e variância: 

 

 Sob a hipótese nula de aleatoriedade e usando um intervalo de confiança 95% então: 

{

( ) 1,96. ( ) 1,96.

}

0,95

Pr E R − σRRE R + σR =       (12.6.3) 

Ou  seja,  R  está  no  intervalo  descrito  acima  com  95%  de  probabilidade.  Logo,  REJEITA‐SE    A  HIPÓTESE DE ALEATORIEDADE DAS CARREIRAS (COM NÍVEL 5%) SE O INTERVALO DESCRITO EM  (12.6.3) NÃO CONTÉM R.    No s resíduos da regressão (12.5.1), N1 = 21, N2 = 19, N = 21  19 = 40 e R = 3. Então:  95 , 20 1 40 ) 19 )( 21 ( 2 ) ( = + = =E R μ   (ATENÇÃO – CORRIGIR O VALOR NO GUJARATI) 

( )( )(

)

( ) ( )

2

(

)

2 2 3,1134 9,6936 62400 604884 39 40 40 ) 19 )( 21 ( 2 19 21 2 = = = − = r σ   Logo, o IC 95% para R é:  (20,95 – 1,96*3,11,  20,95 + 1,96*3,11)  = (14,85,  27,05)  que obviamente não inclui R = 3.  Logo, rejeitamos a hipótese de que os resíduos da regressão (12.5.1) são aleatórios, ou sejam, eles  apresentam algum tipo de comportamento sistemático.  Nota 

O teste apresentado é válido quando ambos N1  e N2 > 10.  Swed e Eisenhart elaboraram tabelas 

para valores menores que estes. As tabelas estão no apêndice D.6 de Gujarati e são reproduzidas a  seguir. As tabelas D.6A e D.6B fornecem o número crítico n de carreiras. Se n é menor que o valor 

(27)

em  D.6A  ou  maior  que  o  valor  em  D.6B,  rejeita‐se  a  hipótese  de  aleatoriedade  ao  nível  5%.

 

 

Por  exemplo,  suponha  que  existem  N  =  30  observações,  das  quais  N1=20  são  positivas  e  N2=10  são  negativas.  Então,  se  olharmos  para  as  tabelas  anteriores,  rejeita‐se  a  hipótese  de  aleatoriedade se R <= 9 (tabela D.6A) ou R => 20 (tabela D.6B). 

Referências

Documentos relacionados

Um, em específico, automatiza o projeto de instalações de ar condicionado por ser totalmente integrado com o projeto arquitetônico, conforme se demonstra na Figura 2,

As resistências desses grupos se encontram não apenas na performatividade de seus corpos ao ocuparem as ruas e se manifestarem, mas na articulação micropolítica com outros

A Lei nº 2/2007 de 15 de janeiro, na alínea c) do Artigo 10º e Artigo 15º consagram que constitui receita do Município o produto da cobrança das taxas

10/11/2017 DIVULGAÇÃO DOS RESULTADOS DE RECURSOS CONTRA INDEFERIMENTO DE INSCRIÇÕES E COMPOSIÇÃO FINAL DA COMISSÃO DO EXAME DE SELEÇÃO 20/11/2017 PROVA TEÓRICA DE

No caso dos dispositivos para testes de rastreio do sangue (à excepção dos testes de HBsAg e anti-HBc), todas as amostras verdadeiras positivas devem ser identificadas como

Os candidatos reclassificados deverão cumprir os mesmos procedimentos estabelecidos nos subitens 5.1.1, 5.1.1.1, e 5.1.2 deste Edital, no período de 15 e 16 de junho de 2021,

evento, contudo, as meninas tendem a aumentar a quantidade de gordura corporal de forma mais acentuada que os meninos. Estes, por outro lado, aumentam de

Disto decorre que cada entidade sindical minimamente representativa deverá, num futuro próximo, escolher, em primeiro lugar, um dado mix de serviços,sejam de de natureza