• Nenhum resultado encontrado

2.3 Revisão das melhores técnicas, conforme literatura científica

2.3.3 O caso de séries temporais

Series temporais diferem um pouco de análises com dados transversais, uma vez que não podemos nos referir, exatamente, a uma “população” de dados. A ideia aqui é que, ao invés de extrairmos amostras independentes da mesma população, na verdade temos um processo de geração de dados para um mesmo indivíduo no tempo. Ou seja, quando “amostramos” em séries temporais, na verdade, estamos amostrando o mesmo indivíduo em diferentes pontos no tempo. Ou seja, a população nesse caso se referiria a todos os intervalos de tempo possíveis.

Em termos práticos, sempre consideramos, ou temos acesso, a apenas uma amostra temporal. Nesse sentido, se referir a “população” parece inadequado, quando tratamos de series de dados temporais.

Uma diferença importante de se fazer aqui é que, por se tratar do mesmo indivíduo no tempo, não podemos assumir, a priori, que a amostra seria independente. Ou seja, temos de ter um maior zelo com as condições de Gauss-Markov para séries temporais, verificando, por exemplo, a presença, ou não, de autocorrelação.

Outra preocupação com séries temporais, principalmente séries econômicas, é que, tipicamente, elas são dominadas por suaves tendências de longo prazo. Essa característica resulta em correlações altas (R²), mas com presença ou indício de autocorrelação. Portanto, fica a dúvida; a correlação entres as séries seria espúria?

Estacionariedade

A estacionariedade dos dados é importante, pois só se pode estabelecer uma relação linear entre Y e X se Y e X forem estacionários. Adicionalmente, a estacionariedade da série simplifica a aplicação da Lei do Grandes Números e nos permite fazer inferências estatísticas, decorrentes do Teorema do Limite Central. Caso as séries não forem estacionárias, essas inferências não seriam tão simples.

Para ser considerada estacionária, a série precisaria atender três condições básicas: 1. Que a expectativa do processo de geração de dados seja igual a uma constante, ou

seja, que o processo possua um valor médio estacionário: o 𝐸(𝑋𝑡) = μ

2. Que a série possua uma variância constante, ou seja, o processo precisaria estar controlado, não com oscilações crescentes ou decrescentes:

o 𝑉𝑎𝑟(𝑋𝑡) = 𝜎2

3. Que a covariância seja constante (estacionariedade de 2ª ordem), ou seja, que a covariância entre 𝑋𝑡 e 𝑋𝑡+ℎ seja em função de h e não de t:

o 𝐶𝑜𝑣(𝑋𝑡|𝑋𝑡+ℎ) = f(ℎ) ≠ g(𝑡)

Quando falamos de dados de demanda aeroportuária, a questão da estacionariedade da série seria particularmente relevante, uma vez que tanto a demanda de passageiros, assim como os indicadores macroeconômicos (PIB) e específicos (yield) também não seriam estacionários – em virtude da presença de tendência.

Contornando a questão da não-estacionariedade

Existem algumas técnicas para tentar transformar séries não estacionárias em estacionárias. Uma técnica muito utilizada, preconizada por Box et al. (2016), seria a de diferenciação, ou seja, analisaríamos o crescimento relativo, ano-a-ano, e não o crescimento absoluto. Ou seja, se a série tiver uma mesma tendência de crescimento, conseguiríamos expurgar a tendência através desse método. Dito isso, haveria críticas sobre esse método, por “desprezar efeitos de longo prazo” nos dados, portanto, a estimativa seria compatível apenas com modelos de curto prazo. (DAVIDSON et al., 1978)

Por outro lado, as vezes não seria necessário aplicar essas técnicas, caso a regressão de séries não estacionárias não apresente autocorrelação. O pressuposto implícito nessa configuração seria de que a tendência de crescimento de ambas as séries é tal que elas estariam “estacionárias” entre si.

Agora, conforme exposto por Greene (2010), a presença de autocorrelação em séries temporais pode ser resultante de um efeito “inercial” entre os dados. Ou seja, a variável de resposta demoraria um tempo até absorver, plenamente, o efeito da variável explicativa. Essa situação seria acentuada caso a desagregação temporal da série de dados fosse maior, ou seja, teríamos dados mais “lisos” (GREENE, 2010, p.22).

Cointegração

No caso da presença de autocorrelação de resíduos, haveria testes de especificação que ainda poderiam ser feitos. A hipótese postulada nos trabalhos do Granger e Weiss (1983)é de que se fosse possível atingir a estacionariedade de uma série através da diferenciação, deveria haver uma combinação linear onde as séries seriam estacionárias, sem diferenciação. Ou seja, se pudéssemos estimar um coeficiente, de modo a “transformar” uma das séries de forma que a diferença resultante entre elas fique relativamente constante, podemos dizer que essa diferença seria “estacionária” – propriedade de séries cointegradas. Engle e Granger (1987) formularam um procedimento para testar se haveria essa relação de equilíbrio em termos da cointegração entre séries.

Para que duas ou mais séries possam ser cointegradas, é necessário estabelecer, se para alguma ordem, essas series seriam estacionárias. Portanto, o teste original de cointegração de Engle-Granger utiliza o teste de raiz unitária de Dicky-Fuller, para verificar a presença de raiz unitária nos resíduos – ou não estacionareidade – e, em caso positivo, propõe um modelo vetorial para correção de erros (VECM – Vector Error Correction Model). Testes mais avançados, como o Teste de Johansen, permitem analisar relações de cointegração para múltiplas variáveis, assim como considerar séries que seriam estacionárias para ordens superiores a 1 – que seria uma limitação do Engle-Granger. Em contraponto, o Teste de Johansen se baseia numa grande quantidade de premissas assintóticas, portanto, se o tamanho da amostra for pequeno, o resultado do teste pode ser difícil de interpretar.

Cabe ressaltar que caso duas séries forem integradas de primeira ordem – não estacionárias podendo ser transformada em estacionária, tirando as primeiras diferenças – e cointegradas, não seria necessário tirar as primeiras diferenças da série, podendo, simplesmente, aplicar o método de MQO sobre a equação de ordem zero. Portanto, poderíamos seguir com a formulação original do modelo.

Como mencionado, existem diversos testes de cointegração, entre eles, o Teste de Engle-Granger, o Teste de Durbin-Watson, Teste de Phillips-Ouliaris e o Teste de Johansen – utilizado de forma principal nessa pesquisa.