4. AVALIAÇÃO EMPÍRICA
4.3 APLICAÇÃO DA MODELAGEM ARIMA
4.3.1.2 Identificação dos Componentes – AR(p), MA(q), SAR(P) e SMA(Q)
A partir da análise das funções de autocorrelação amostral (FAC) e autocorrelação parcial (FACP) da série GFIP em primeira diferença (d=1), conforme o correlograma constante na figura 12 anterior, identificou-se os modelos formados pelos componentes a seguir:
i) AR(1) e SAR(12)...[SARIMA(1,1,0)(1,0,0)12];
iii) AR(1), SAR(12) e SMA(12) ...[SARIMA(1,1,0)(1,0,1)12];
iv) AR(1), MA(1), SAR(12) e SMA(12) ...[SARIMA(1,1,1)(1,0,1)12];
v) AR(1), MA(5) e SAR(12) ... [SARIMA(1,1,5)(1,0,0)12];
vi) AR(1), MA(5), SAR(12) e SMA(12).... ...[SARIMA(1,1,5)(1,0,1)12].
A justificativa para inclusão dos componentes AR(1) deve-se ao comportamento da FACP na defasagem um (apresenta-se cortada). A inclusão do termo MA(1) deve-se à FAC no lag 1 (um) também está truncada, enquanto o MA(5) deve-se à mudança brusca de valor da FAC nesta defasagem, pois até o lag 4 (quatro) a mesma apresenta-se negativa e no 5 (cinco) passa a ser positiva. Os componentes SAR(12) e SMA(12) devem-se às fortes correlações existentes nesses lags, decorrentes de sazonalidade. No mais estes modelos se aproximam dos comportamentos padrões demonstrados anteriormente.
A estimação destes modelos foi feita no Eviews, salientando-se que não foi considerado o termo intercepto (constante) em razão de tratar-se de uma série diferenciada (feita a subtração das variáveis da série original o termo constante desaparece)35. Os resultados das estimações estão expostos nas figuras 13 a 18 a seguir, que demonstram o output do Eviews, de onde foram coletados os valores das estatísticas de Akaike e Scharz, constantes na tabela 08 a seguir, utilizados para seleção de único modelo para previsão.
Tabela 08 – Critérios de Akaike e Scharz para os modelos “i” ao “vi” da série GFIP
35
De acordo com Maddala (2003: p. 125) é comum, porém, constar um termo constante na equação de regressão estimada em diferenças, desde que a equação original apresente um termo de tendência. Outrossim, Fava (2000: p. 219) afirma que a inclusão de uma constante no modelo ARIMA não acarreta nenhuma implicação. Neste sentido, foram feitas estimações adicionais dos modelos acima com a inclusão de um termo constante, pelo que se verificou que em todos estes modelos o termo constante ficou estatisticamente não significativo, razão porque optamos por excluí-lo.
Modelo Critério de Akaike Critério de Scharz
i 23,00558 23,07663 ii 23,03990 23,14647 iii 22,63860 22,74518 iv 22,64914 22,79124 v 22,98116 23,08773 vi 22,64175 22,78385
Analisando-se os valores dos critérios de Akaike e Scharz, da tabela 08 anterior, verifica-se que o modelo “iii” é o que tem o menor critério de Akaike, assim como o de Scharz, pelo que decidiu-se por utilizá-lo para previsão da série GFIP.
Figura 13 – Output do Eviews do Modelo “i” (Série GFIP)
Dependent Variable: D(GFIP) Method: Least Squares Date: 03/27/04 Time: 19:27 Sample(adjusted): 1998:03 2002:12
Included observations: 58 after adjusting endpoints Convergence achieved after 5 iterations
Variable Coefficient Std. Error t-Statistic Prob. AR(1) -0.437581 0.122487 -3.572482 0.0007
SAR(12) 1.060779 0.022622 46.89167 0.0000 R-squared 0.972574 Mean dependent var 12772.06 Adjusted R-squared 0.972084 S.D. dependent var 140955.3 S.E. of regression 23550.74 Akaike info criterion 23.00558 Sum squared resid 3.11E+10 Schwarz criterion 23.07663 Log likelihood -665.1617 Durbin-Watson stat 2.001213 Inverted AR Roots 1.00 .87 -.50i .87+.50i .50 -.87i
.50+.87i .00 -1.00i -.00+1.00i -.44 -.50+.87i -.50 -.87i -.87+.50i -.87 -.50i -1.00
Estimated AR process is nonstationary
Figura 14 – Output do Eviews do Modelo “ii” (Série GFIP)
Dependent Variable: D(GFIP) Method: Least Squares Date: 03/27/04 Time: 19:39 Sample(adjusted): 1998:03 2002:12
Included observations: 58 after adjusting endpoints Convergence achieved after 10 iterations
Backcast: 1998:02
Variable Coefficient Std. Error t-Statistic Prob. AR(1) -0.410485 0.286533 -1.432596 0.1576
SAR(12) 1.060881 0.022922 46.28201 0.0000 MA(1) -0.033165 0.311450 -0.106485 0.9156 R-squared 0.972579 Mean dependent var 12772.06 Adjusted R-squared 0.971581 S.D. dependent var 140955.3 S.E. of regression 23761.97 Akaike info criterion 23.03990 Sum squared resid 3.11E+10 Schwarz criterion 23.14647 Log likelihood -665.1571 Durbin-Watson stat 1.990319 Inverted AR Roots 1.00 .87 -.50i .87+.50i .50+.87i
.50 -.87i .00+1.00i -.00 -1.00i -.41 -.50+.87i -.50 -.87i -.87 -.50i -.87+.50i -1.00
Estimated AR process is nonstationary Inverted MA Roots .03
Figura 15 – Output do Eviews do Modelo “iii” (Série GFIP)
Dependent Variable: D(GFIP) Method: Least Squares Date: 03/27/04 Time: 19:41 Sample(adjusted): 1998:03 2002:12
Included observations: 58 after adjusting endpoints Convergence achieved after 12 iterations
Backcast: 1997:03 1998:02
Variable Coefficient Std. Error t-Statistic Prob. AR(1) -0.401422 0.114313 -3.511613 0.0009
SAR(12) 1.096498 0.014007 78.28058 0.0000 MA(12) -0.856315 0.040515 -21.13579 0.0000 R-squared 0.981643 Mean dependent var 12772.06 Adjusted R-squared 0.980975 S.D. dependent var 140955.3 S.E. of regression 19442.03 Akaike info criterion 22.63860 Sum squared resid 2.08E+10 Schwarz criterion 22.74518 Log likelihood -653.5194 Durbin-Watson stat 2.131737 Inverted AR Roots 1.01 .87 -.50i .87+.50i .50 -.87i
.50+.87i .00 -1.01i -.00+1.01i -.40 -.50+.87i -.50 -.87i -.87+.50i -.87 -.50i -1.01
Estimated AR process is nonstationary
Inverted MA Roots .99 .85+.49i .85 -.49i .49+.85i .49 -.85i .00 -.99i -.00+.99i -.49 -.85i -.49+.85i -.85 -.49i -.85+.49i -.99
Figura 16 – Output do Eviews do Modelo “iv” (Série GFIP)
Dependent Variable: D(GFIP) Method: Least Squares Date: 03/27/04 Time: 19:43 Sample(adjusted): 1998:03 2002:12
Included observations: 58 after adjusting endpoints Convergence achieved after 18 iterations
Backcast: 1997:02 1998:02
Variable Coefficient Std. Error t-Statistic Prob. AR(1) -0.275622 0.232811 -1.183886 0.2416
SAR(12) 1.098492 0.014031 78.29314 0.0000 MA(1) -0.175451 0.240689 -0.728952 0.4692 SMA(12) -0.853658 0.040503 -21.07631 0.0000 R-squared 0.982077 Mean dependent var 12772.06 Adjusted R-squared 0.981081 S.D. dependent var 140955.3 S.E. of regression 19387.73 Akaike info criterion 22.64914 Sum squared resid 2.03E+10 Schwarz criterion 22.79124 Log likelihood -652.8251 Durbin-Watson stat 2.023700 Inverted AR Roots 1.01 .87+.50i .87 -.50i .50 -.87i
.50+.87i .00+1.01i -.00 -1.01i -.28 -.50+.87i -.50 -.87i -.87 -.50i -.87+.50i -1.01
Estimated AR process is nonstationary
Inverted MA Roots .99 .85+.49i .85 -.49i .49+.85i .49 -.85i .18 -.00 -.99i -.00+.99i -.49 -.85i -.49+.85i -.85+.49i -.85 -.49i -.99
Figura 17 – Output do Eviews do Modelo “v” (Série GFIP)
Dependent Variable: D(GFIP) Method: Least Squares Date: 05/11/04 Time: 23:32 Sample(adjusted): 1998:03 2002:12
Included observations: 58 after adjusting endpoints Convergence achieved after 12 iterations
Backcast: 1997:10 1998:02
Variable Coefficient Std. Error t-Statistic Prob. AR(1) -0.490769 0.120368 -4.077250 0.0001
SAR(12) 1.069870 0.022083 48.44746 0.0000 MA(5) 0.337152 0.137488 2.452236 0.0174 R-squared 0.974143 Mean dependent var 12772.06 Adjusted R-squared 0.973203 S.D. dependent var 140955.3 S.E. of regression 23074.20 Akaike info criterion 22.98116 Sum squared resid 2.93E+10 Schwarz criterion 23.08773 Log likelihood -663.4535 Durbin-Watson stat 1.968132 Inverted AR Roots 1.01 .87+.50i .87 -.50i .50 -.87i
.50+.87i .00+1.01i -.00 -1.01i -.49 -.50 -.87i -.50+.87i -.87 -.50i -.87+.50i -1.01
Estimated AR process is nonstationary
Inverted MA Roots .65 -.47i .65+.47i -.25+.77i -.25 -.77i -.80
Figura 18 – Output do Eviews do Modelo “vi” (Série GFIP)
Dependent Variable: D(GFIP) Method: Least Squares Date: 05/11/04 Time: 23:35 Sample(adjusted): 1998:03 2002:12
Included observations: 58 after adjusting endpoints Convergence achieved after 19 iterations
Backcast: 1996:10 1998:02
Variable Coefficient Std. Error t-Statistic Prob. AR(1) -0.449373 0.110764 -4.057024 0.0002
SAR(12) 1.103423 0.013821 79.83478 0.0000 MA(5) 0.211087 0.121555 1.736563 0.0882 SMA(12) -0.866920 0.038364 -22.59746 0.0000 R-squared 0.982209 Mean dependent var 12772.06 Adjusted R-squared 0.981221 S.D. dependent var 140955.3 S.E. of regression 19316.23 Akaike info criterion 22.64175 Sum squared resid 2.01E+10 Schwarz criterion 22.78385 Log likelihood -652.6108 Durbin-Watson stat 2.137900 Inverted AR Roots 1.01 .87+.50i .87 -.50i .50+.87i
.50 -.87i .00+1.01i -.00 -1.01i -.45 -.50 -.87i -.50+.87i -.87 -.50i -.87+.50i -1.01
Estimated AR process is nonstationary
Inverted MA Roots .99 .86 -.49i .86+.49i .59 -.43i .59+.43i .49 -.86i .49+.86i .00+.99i -.00 -.99i -.23+.70i -.23 -.70i -.49 -.86i -.49+.86i -.73 -.86+.49i -.86 -.49i -.99
O resultado da estimação do modelo “iii” (Série GFIP), no Eviews, constante na figura 15 anterior, demonstra que os parâmetros dos componentes ARIMA são todos, estatisticamente, significativos, salientando-se a existência de termos sazonais, pelo que o modelo é especificado como um SARIMA(1,1,0)(1,0,1)12,
descrito pela fórmula:
t
GFIP = – 0,401422GFIPt−1 + 1,096498GFIPt−12 + 0,856315εt−12 + εt
ou t t L GFIP L L)(1 1,096498 ) (1 0,856315 )ε 401422 , 0 1 ( + − 12 = +
As previsões mensais da série GFIP, para o período de JAN a DEZ/2003, feitas a partir deste modelo, estão demonstradas na tabela 09 abaixo, onde os valores previstos são comparados com os efetivamente arrecadados.
Tabela 09 – Comparação de valores previstos (GFIP) pelo Modelo “iii” (em R$ Mil)
Uma verificação do correlograma dos resíduos da regressão do modelo “iii”, demonstrado na figura 19 seguinte, evidencia a existência de, apenas, uma correlação fora das bandas do intervalo de confiança, no lag 9 (nove), o que sugere uma aproximação do ruído branco e uma adequada especificação do modelo de previsão. A figura 15 anterior demonstra o output do Eviews da regressão do modelo “iii”, onde verifica-se que os parâmetros estimados são todos estatisticamente significativos, a um nível de confiança inferior a 1% (um por cento).
MÊS / ANO
GFIP PREVISTO GFIP ARRECADADO ERRO EM R$ MIL ERRO EM % EQM jan-03 2.000.472,87 2.044.332,20 -43.859,33 -2,14541% 0,05% fev-03 1.429.801,59 1.584.977,77 -155.176,18 -9,79043% 0,96% mar-03 1.393.028,33 1.513.631,56 -120.603,23 -7,96781% 0,63% abr-03 1.426.371,64 1.508.975,53 -82.603,90 -5,47417% 0,30% mai-03 1.439.000,86 1.552.439,17 -113.438,31 -7,30710% 0,53% jun-03 1.453.414,06 1.601.968,53 -148.554,47 -9,27325% 0,86% jul-03 1.477.173,10 1.613.475,47 -136.302,37 -8,44775% 0,71% ago-03 1.506.407,16 1.640.082,35 -133.675,19 -8,15052% 0,66% set-03 1.486.402,50 1.648.156,91 -161.754,41 -9,81426% 0,96% out-03 1.479.191,80 1.662.368,62 -183.176,82 -11,01903% 1,21% nov-03 1.485.775,72 1.674.198,52 -188.422,81 -11,25451% 1,27% dez-03 1.833.927,69 2.128.144,81 -294.217,12 -13,82505% 1,91% Total 18.410.967,33 20.172.751,46 -1.761.784,14 -8,73348% 0,84%
Figura 19 – Correlograma dos resíduos da regressão do modelo “iii” da série GFIP Date: 03/31/04 Time: 13:16 Sample: 1998:03 2002:12 Included observations: 58 Q-statistic probabilities adjusted for 3 ARMA term(s)
Autocorrelation Partial Correlation AC PAC Q-Stat Prob .*| . | .*| . | 1 -0.069 -0.069 0.2939 . | . | . | . | 2 0.026 0.022 0.3372 . |*. | . |*. | 3 0.131 0.135 1.4271 . |*. | . |*. | 4 0.119 0.140 2.3325 0.127 . | . | . |*. | 5 0.060 0.076 2.5697 0.277 . | . | . | . | 6 0.060 0.049 2.8099 0.422 .*| . | .*| . | 7 -0.143 -0.180 4.2012 0.379 . | . | . | . | 8 0.045 -0.026 4.3449 0.501 . |*** | . |*** | 9 0.386 0.394 14.915 0.021 .*| . | . | . | 10 -0.107 -0.011 15.747 0.028 . | . | . | . | 11 0.039 0.021 15.858 0.044 . | . | . | . | 12 0.065 -0.028 16.175 0.063 . | . | .*| . | 13 -0.055 -0.174 16.410 0.088 . | . | .*| . | 14 0.021 -0.065 16.445 0.125 . | . | . | . | 15 -0.040 -0.050 16.572 0.166 **| . | .*| . | 16 -0.189 -0.063 19.544 0.107 . | . | . | . | 17 0.017 -0.007 19.568 0.144 . | . | .*| . | 18 -0.041 -0.179 19.713 0.183 .*| . | .*| . | 19 -0.125 -0.063 21.106 0.174 . | . | . | . | 20 0.058 0.058 21.418 0.208 .*| . | . | . | 21 -0.071 -0.037 21.899 0.237 . | . | . |*. | 22 -0.024 0.107 21.954 0.287 . | . | . | . | 23 0.022 0.023 22.004 0.340 . | . | . | . | 24 -0.037 0.008 22.148 0.391 .*| . | . | . | 25 -0.124 -0.053 23.766 0.360 . | . | . | . | 26 0.029 -0.025 23.856 0.412 .*| . | . | . | 27 -0.140 -0.028 26.066 0.350 . | . | . |*. | 28 0.017 0.087 26.098 0.402 . | . | . | . | 29 0.040 0.044 26.289 0.447 .*| . | .*| . | 30 -0.179 -0.142 30.291 0.301 . |*. | . | . | 31 0.100 0.037 31.572 0.292 . | . | . | . | 32 0.036 -0.024 31.749 0.331 . |*. | . |*. | 33 0.100 0.188 33.149 0.316 .*| . | .*| . | 34 -0.113 -0.086 34.994 0.284 . | . | . | . | 35 0.027 -0.055 35.103 0.323 .*| . | .*| . | 36 -0.094 -0.080 36.509 0.309
4.3.2 Série GRFP
4.3.2.1 Identificação da Ordem de Integração (I)
A análise gráfica desta série, feita no subitem 4.1.3 anterior, não apresenta indícios fortes de que a mesma seja não-estacionária ou que tenha sazonalidade. Assim, foi conduzido um teste formal de raízes unitárias, o de Dickey e Fuller (ADF Aumentado), conforme figura 20 seguinte (output do Eviews), cujo resultado demonstra que não se pode rejeitar a hipótese nula de que a série seja não estacionária, considerando um nível de significância de 1%. Adicionalmente, procedeu-se a análise da FAC amostral de seu correlograma (figura 21 seguinte), pelo que verificou-se um comportamento característico de uma série não- estacionária: a FAC amostral apresenta valores iniciais altos com declínio lento até a defasagem cinco, com uma queda brusca na defasagem seis, seguida de oscilações com picos de sazonalidade nos lags 1,2 e 24, o que indica a necessidade de componentes sazonais.
Figura 20 – Teste ADF Aumentado da série GRFIP em nível
ADF Test Statistic -3.473337 1% Critical Value* -3.5501 5% Critical Value -2.9137 10% Critical Value -2.5942 *MacKinnon critical values for rejection of hypothesis of a unit root.
Augmented Dickey-Fuller Test Equation Dependent Variable: D(GRFP)
Method: Least Squares Date: 03/27/04 Time: 20:32 Sample(adjusted): 1998:05 2002:12
Included observations: 56 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob. GRFP(-1) -0.533281 0.153536 -3.473337 0.0010
D(GRFP(-1)) -0.129064 0.138959 -0.928790 0.3572 C 189845.0 54364.62 3.492069 0.0010 R-squared 0.309273 Mean dependent var 1911.006 Adjusted R-squared 0.283207 S.D. dependent var 47485.58 S.E. of regression 40203.01 Akaike info criterion 24.09335 Sum squared resid 8.57E+10 Schwarz criterion 24.20186 Log likelihood -671.6139 F-statistic 11.86535 Durbin-Watson stat 2.011497 Prob(F-statistic) 0.000055
Figura 21 – Correlograma da série GRFP em nível
Date: 03/27/04 Time: 20:10 Sample: 1998:03 2002:12 Included observations: 58
Autocorrelation Partial Correlation AC PAC Q-Stat Prob . |*** | . |*** | 1 0.372 0.372 8.4309 0.004 . |** | . |*. | 2 0.248 0.128 12.256 0.002 . |** | . |*. | 3 0.260 0.156 16.530 0.001 . |** | . |*. | 4 0.241 0.102 20.266 0.000 . |** | . |*. | 5 0.230 0.090 23.732 0.000 .*| . | ***| . | 6 -0.112 -0.336 24.564 0.000 . | . | . | . | 7 0.005 0.051 24.566 0.001 . | . | .*| . | 8 -0.052 -0.111 24.754 0.002 . | . | . |*. | 9 0.056 0.185 24.976 0.003 . | . | . | . | 10 0.005 -0.008 24.978 0.005 . | . | . |*. | 11 -0.035 0.089 25.071 0.009 . |** | . |** | 12 0.301 0.315 31.920 0.001 . | . | **| . | 13 -0.001 -0.281 31.920 0.002 . |*. | . |*. | 14 0.136 0.132 33.378 0.003 . |*. | . | . | 15 0.126 -0.039 34.669 0.003 . |*. | .*| . | 16 0.067 -0.087 35.043 0.004 . |*. | .*| . | 17 0.067 -0.067 35.429 0.005 .*| . | .*| . | 18 -0.159 -0.080 37.634 0.004 . | . | .*| . | 19 -0.054 -0.075 37.895 0.006 .*| . | . | . | 20 -0.134 0.032 39.544 0.006 .*| . | .*| . | 21 -0.104 -0.063 40.562 0.006 **| . | .*| . | 22 -0.236 -0.105 45.945 0.002 **| . | .*| . | 23 -0.281 -0.066 53.798 0.000 . | . | . |*. | 24 0.049 0.129 54.039 0.000 . | . | . |*. | 25 -0.035 0.165 54.172 0.001 . | . | .*| . | 26 -0.041 -0.177 54.356 0.001 .*| . | .*| . | 27 -0.125 -0.067 56.096 0.001 . | . | . | . | 28 0.007 0.063 56.101 0.001 . |*. | .*| . | 29 0.109 -0.068 57.525 0.001 . | . | . |*. | 30 0.002 0.139 57.525 0.002 . | . | . | . | 31 -0.022 -0.039 57.587 0.003 .*| . | . | . | 32 -0.075 0.042 58.331 0.003 . | . | .*| . | 33 -0.001 -0.064 58.331 0.004 .*| . | . | . | 34 -0.062 0.012 58.880 0.005 .*| . | . | . | 35 -0.135 -0.017 61.652 0.004 . | . | .*| . | 36 -0.055 -0.081 62.133 0.004
Verificado que a série GFIP é não estacionária em nível e considerando as indicações de sazonalidade, procedeu-se a análise da 1ª diferença desta série, conforme teste ADF Aumentado (figura 22), em que se rejeita a hipótese de não estacionariedade a um nível de significância de 1%. Por outro lado, a análise do correlograma (figura 23) evidencia características de estacionariedade da 1ª diferença desta série. Verificou-se ainda, na análise do correlograma, a permanência de correlações sazonais relevantes entre os lags 12, 24 e 36, indicando a necessidade de componentes AR(p) e/ou MA(p) sazonais.
Assim, observando o princípio da parcimônia, optou-se pela modelagem do componente I (integração) com a seguinte especificação: d = 1 e D = 0 (correlograma da figura 23), onde “d” representa a diferenciação regular no nível da série e “D”, a diferenciação sazonal de ordem 12. Ressalte-se que a adoção desta especificação resulta na perda da primeira observação da série, reduzindo-a de 58 para 57 dados.
Figura 22 – Teste ADF Aumentado da 1ª diferença da série GRFP
ADF Test Statistic -8.587049 1% Critical Value* -3.5523 5% Critical Value -2.9146 10% Critical Value -2.5947 *MacKinnon critical values for rejection of hypothesis of a unit root.
Augmented Dickey-Fuller Test Equation Dependent Variable: D(D1GRFP) Method: Least Squares
Date: 03/27/04 Time: 20:45 Sample(adjusted): 1998:06 2002:12
Included observations: 55 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob. D1GRFP(-1) -1.877349 0.218626 -8.587049 0.0000
D(D1GRFP(-1)) 0.341755 0.131598 2.596959 0.0122 C 2921.060 5671.459 0.515046 0.6087 R-squared 0.729364 Mean dependent var 1643.493 Adjusted R-squared 0.718955 S.D. dependent var 79311.87 S.E. of regression 42046.11 Akaike info criterion 24.18392 Sum squared resid 9.19E+10 Schwarz criterion 24.29341 Log likelihood -662.0579 F-statistic 70.07017 Durbin-Watson stat 2.104266 Prob(F-statistic) 0.000000
Figura 23 – Correlograma da 1ª diferença da série GRFP
Date: 03/27/04 Time: 20:43 Sample: 1998:03 2002:12 Included observations: 57
Autocorrelation Partial Correlation AC PAC Q-Stat Prob ***| . | ***| . | 1 -0.381 -0.381 8.7159 0.003 .*| . | ***| . | 2 -0.132 -0.324 9.7802 0.008 . | . | **| . | 3 0.042 -0.193 9.8910 0.020 . | . | .*| . | 4 -0.024 -0.175 9.9272 0.042 . |** | . |** | 5 0.274 0.246 14.794 0.011 ***| . | .*| . | 6 -0.358 -0.176 23.237 0.001 . |*. | . | . | 7 0.128 0.020 24.332 0.001 .*| . | **| . | 8 -0.138 -0.301 25.635 0.001 . |*. | . | . | 9 0.128 -0.028 26.787 0.002 . | . | .*| . | 10 0.009 -0.160 26.794 0.003 **| . | ***| . | 11 -0.318 -0.321 34.185 0.000 . |**** | . |** | 12 0.500 0.249 52.876 0.000 ***| . | **| . | 13 -0.341 -0.205 61.783 0.000 . |*. | . | . | 14 0.098 -0.001 62.526 0.000 . |*. | . | . | 15 0.066 0.009 62.874 0.000 .*| . | . | . | 16 -0.079 0.001 63.388 0.000 . |** | . | . | 17 0.200 0.012 66.763 0.000 **| . | . | . | 18 -0.264 0.002 72.793 0.000 . |*. | .*| . | 19 0.117 -0.159 74.009 0.000 .*| . | . | . | 20 -0.058 0.001 74.315 0.000 . |*. | . | . | 21 0.131 0.021 75.909 0.000 . | . | . | . | 22 -0.044 -0.004 76.093 0.000 **| . | .*| . | 23 -0.316 -0.154 85.958 0.000 . |** | **| . | 24 0.293 -0.247 94.733 0.000 . | . | . |** | 25 0.003 0.210 94.734 0.000 . |*. | . | . | 26 0.072 0.063 95.289 0.000 .*| . | .*| . | 27 -0.173 -0.060 98.629 0.000 . | . | . |*. | 28 -0.014 0.112 98.652 0.000 . |*. | .*| . | 29 0.187 -0.130 102.84 0.000 .*| . | . | . | 30 -0.081 -0.001 103.65 0.000 . | . | . | . | 31 0.018 -0.039 103.69 0.000 .*| . | . | . | 32 -0.081 0.049 104.57 0.000 . |*. | . | . | 33 0.078 0.024 105.42 0.000 . | . | . | . | 34 0.019 0.017 105.47 0.000 .*| . | . |*. | 35 -0.110 0.073 107.31 0.000 . |*. | . |*. | 36 0.088 0.074 108.55 0.000
4.3.2.2 Identificação dos Componentes – AR(p), MA(q), SAR(P) e SMA(Q)
A partir da análise das funções de autocorrelação amostral (FAC) e autocorrelação parcial (FACP) da série GRFP em primeira diferença (d=1), conforme o correlograma constante na figura 23 anterior, identificou-se os modelos formados pelos componentes a seguir:
vii) AR(1) e SAR(12) ...[SARIMA(1,1,0)(1,0,0)12];
ix) AR(1), MA(5) e SAR(12) ... [SARIMA(1,1,5)(1,0,0)12];
x) AR(5), MA(5) e SAR(12) ... [SARIMA(5,1,5)(1,0,0)12];
xi) AR(2), MA(1) e SAR(12) ... [SARIMA(2,1,1)(1,0,0)12];
xii) AR(2), MA(5) e SAR(12) ... [SARIMA(2,1,5)(1,0,0)12];
A justificativa para inclusão dos componentes AR(1) deve-se ao comportamento da FACP na defasagem um, apresenta-se com o maior valor negativo. O MA(2) deve-se FAC no lag dois também apresentar uma queda brusca (truncada), enquanto o MA(5) deve-se à mudança brusca de valor da FAC, pois até o lag quatro vinha com um crescimento gradual e na defasagem cinco aumenta bruscamente. Os termos MA(1) e AR(2) devem-se ao fato das FAC e FACP, respectivamente, serem significativas nessas defasagens (estão fora do intervalo das bandas de confiança). O componente SAR(12) deve-se às fortes correlações existentes nesses lags, decorrentes de sazonalidade. No mais, estes modelos se aproximam dos comportamentos padrões demonstrados anteriormente.
A estimação destes modelos foi feita no Eviews, salientando-se que não foi considerado o termo intercepto (constante) em razão de tratar-se de uma série diferenciada (as variáveis são diferenças da série original). Os resultados das estimações estão expostos nas figuras 24 a 29 seguintes, que demonstram o output do Eviews, de onde foram coletados os valores das estatísticas de Akaike e Scharz constantes na tabela 10 a seguir:
Tabela 10 – Critérios de Akaike e Scharz para os modelos “vii” ao “x” da série GRFP
Pela tabela 10 acima, verifica-se que o modelo “x” é o que apresenta os menores valores para os critérios de Akaike e de Scharz, pelo que foi escolhido para realizar
Modelo Critério de Akaike Critério de Scharz
vii 23,72831 23,80941 viii 23,66118 23,78283 ix 23,63176 23,75341 x 23,60643 23,73310 xi 23,65634 23,77921 xii 23,77117 23,89404
previsões da série GRFP no ano de 2003.
Figura 24 – Output do Eviews da regressão do modelo “vii” da série GRFP
Dependent Variable: D(GRFP) Method: Least Squares Date: 05/12/04 Time: 00:13 Sample(adjusted): 1999:05 2002:12
Included observations: 44 after adjusting endpoints Convergence achieved after 7 iterations
Variable Coefficient Std. Error t-Statistic Prob. AR(1) -0.349890 0.142412 -2.456883 0.0182
SAR(12) 0.431103 0.111040 3.882423 0.0004 R-squared 0.445407 Mean dependent var 2076.752 Adjusted R-squared 0.432202 S.D. dependent var 44623.53 S.E. of regression 33624.88 Akaike info criterion 23.72831 Sum squared resid 4.75E+10 Schwarz criterion 23.80941 Log likelihood -520.0228 Durbin-Watson stat 2.171022 Inverted AR Roots .93 .81 -.47i .81+.47i .47 -.81i
.47+.81i .00+.93i .00 -.93i -.35 -.47 -.81i -.47+.81i -.81+.47i -.81 -.47i -.93
Figura 25 – Output do Eviews da regressão do modelo “viii” da série GRFP
Dependent Variable: D(GRFP) Method: Least Squares Date: 05/12/04 Time: 00:12 Sample(adjusted): 1999:05 2002:12
Included observations: 44 after adjusting endpoints Convergence achieved after 10 iterations
Backcast: 1999:03 1999:04
Variable Coefficient Std. Error t-Statistic Prob. AR(1) -0.486315 0.156081 -3.115787 0.0033
SAR(12) 0.446204 0.120122 3.714579 0.0006 MA(2) -0.410661 0.166210 -2.470730 0.0177 R-squared 0.504456 Mean dependent var 2076.752 Adjusted R-squared 0.480283 S.D. dependent var 44623.53 S.E. of regression 32169.71 Akaike info criterion 23.66118 Sum squared resid 4.24E+10 Schwarz criterion 23.78283 Log likelihood -517.5461 Durbin-Watson stat 2.040607 Inverted AR Roots .93 .81 -.47i .81+.47i .47 -.81i .47+.81i .00+.93i .00 -.93i -.47 -.81i -.47+.81i -.49 -.81+.47i -.81 -.47i -.93
Figura 26 – Output do Eviews da regressão do modelo “ix” da série GRFP
Dependent Variable: D(GRFP) Method: Least Squares Date: 05/12/04 Time: 00:10 Sample(adjusted): 1999:05 2002:12
Included observations: 44 after adjusting endpoints Convergence achieved after 10 iterations
Backcast: 1998:12 1999:04
Variable Coefficient Std. Error t-Statistic Prob. AR(1) -0.381414 0.146499 -2.603515 0.0128
SAR(12) 0.385193 0.106687 3.610503 0.0008 MA(5) 0.416986 0.143629 2.903223 0.0059 R-squared 0.518827 Mean dependent var 2076.752 Adjusted R-squared 0.495355 S.D. dependent var 44623.53 S.E. of regression 31699.83 Akaike info criterion 23.63176 Sum squared resid 4.12E+10 Schwarz criterion 23.75341 Log likelihood -516.8986 Durbin-Watson stat 2.221767 Inverted AR Roots .92 .80+.46i .80 -.46i .46 -.80i
.46+.80i .00+.92i -.00 -.92i -.38 -.46 -.80i -.46+.80i -.80 -.46i -.80+.46i -.92
Inverted MA Roots .68 -.49i .68+.49i -.26+.80i -.26 -.80i -.84
Figura 27 – Output do Eviews da regressão do modelo “x” da série GRFP
Dependent Variable: D(GRFP) Method: Least Squares Date: 03/31/04 Time: 13:41 Sample(adjusted): 1999:09 2002:12
Included observations: 40 after adjusting endpoints Convergence achieved after 13 iterations
Backcast: 1999:04 1999:08
Variable Coefficient Std. Error t-Statistic Prob. AR(5) -0.400685 0.133197 -3.008215 0.0047
SAR(12) 0.568964 0.110408 5.153297 0.0000 MA(5) 0.936056 0.033396 28.02931 0.0000 R-squared 0.577759 Mean dependent var 2706.003 Adjusted R-squared 0.554936 S.D. dependent var 46771.37 S.E. of regression 31202.65 Akaike info criterion 23.60643 Sum squared resid 3.60E+10 Schwarz criterion 23.73310 Log likelihood -469.1286 Durbin-Watson stat 2.302203 Inverted AR Roots .95 .83+.48i .83 -.48i .67+.49i
.67 -.49i .48 -.83i .48+.83i .00+.95i -.00 -.95i -.26 -.79i -.26+.79i -.48+.83i -.48 -.83i -.83+.48i -.83 -.48i -.83 -.95
Inverted MA Roots .80 -.58i .80+.58i -.30+.94i -.30 -.94i -.99
Figura 28 – Output do Eviews da regressão do modelo “xi” da série GRFP
Dependent Variable: D(GRFP) Method: Least Squares Date: 05/11/04 Time: 23:57 Sample(adjusted): 1999:06 2002:12
Included observations: 43 after adjusting endpoints Convergence achieved after 11 iterations
Backcast: 1999:05
Variable Coefficient Std. Error t-Statistic Prob. AR(2) -0.051713 0.173733 -0.297660 0.7675
SAR(12) 0.386661 0.119749 3.228929 0.0025 MA(1) -0.624691 0.143656 -4.348528 0.0001 R-squared 0.519473 Mean dependent var 2180.689 Adjusted R-squared 0.495446 S.D. dependent var 45146.25 S.E. of regression 32068.26 Akaike info criterion 23.65634 Sum squared resid 4.11E+10 Schwarz criterion 23.77921 Log likelihood -505.6112 Durbin-Watson stat 1.917617 Inverted AR Roots .92 .80+.46i .80 -.46i .46+.80i
.46 -.80i .00 -.92i Inverted MA Roots .62
Figura 29 – Output do Eviews da regressão do modelo “xii” da série GRFP
Dependent Variable: D(GRFP) Method: Least Squares Date: 05/12/04 Time: 00:08 Sample(adjusted): 1999:06 2002:12
Included observations: 43 after adjusting endpoints Convergence achieved after 10 iterations
Backcast: 1999:01 1999:05
Variable Coefficient Std. Error t-Statistic Prob. AR(2) -0.159730 0.154484 -1.033958 0.3074
SAR(12) 0.542870 0.111465 4.870336 0.0000 MA(5) 0.326320 0.151183 2.158444 0.0369 R-squared 0.460999 Mean dependent var 2180.689 Adjusted R-squared 0.434049 S.D. dependent var 45146.25 S.E. of regression 33963.38 Akaike info criterion 23.77117 Sum squared resid 4.61E+10 Schwarz criterion 23.89404 Log likelihood -508.0801 Durbin-Watson stat 2.694156 Inverted AR Roots .95 .82 -.48i .82+.48i .48+.82i
.48 -.82i .00+.95i
Inverted MA Roots .65+.47i .65 -.47i -.25 -.76i -.25+.76i -.80
O resultado da estimação do modelo “x” (Série GRFP), no Eviews, constante na figura 27 anterior, demonstra que os parâmetros dos componentes ARIMA são todos, estatisticamente, significativos, salientando-se a existência de termos sazonais, pelo que o modelo é especificado como um SARIMA(5,1,5)(1,0,0)12,
descrito pela fórmula:
t GRFP = – 0,400685GRFPt−5 + 0,568964GFIPt−12 – 0,936056εt−5 + εt ou t t L GRFP L L )(1 0,568964 ) (1 0,936056 )ε 400685 , 0 1 ( + 5 − 12 = − 5
As previsões mensais da série GRFP, para o período de JAN a DEZ/2003, feitas a partir deste modelo, estão demonstradas na Tabela 11 abaixo, onde os valores previstos são comparados com os efetivamente arrecadados.
Tabela 11 – Comparação de valores previstos (GRFP) pelo Modelo “x” (valores em R$ Mil)
Uma verificação do correlograma dos resíduos da regressão do modelo “x”, demonstrado na figura 30 abaixo, evidencia a existência de, apenas, duas ocorrências de correlação fora das bandas do intervalo de confiança, nos lags 2 e 13, de baixa intensidade, o que sugere uma aproximação do ruído branco e a adequada especificação do modelo.
MÊS / ANO GRFP PREVISTO GRFP ARRECADO ERRO EM R$ MIL ERRO EM % EQM jan-03 376.331,70 378.248,54 -1.916,84 -0,50677% 0,00% fev-03 373.322,58 408.536,57 -35.213,98 -8,61954% 0,74% mar-03 381.961,65 386.380,45 -4.418,81 -1,14364% 0,01% abr-03 372.551,18 380.814,84 -8.263,65 -2,16999% 0,05% mai-03 372.350,41 376.622,48 -4.272,07 -1,13431% 0,01% jun-03 372.744,40 386.313,93 -13.569,54 -3,51257% 0,12% jul-03 372.782,62 429.179,97 -56.397,35 -13,14072% 1,73% ago-03 371.502,98 392.316,63 -20.813,66 -5,30532% 0,28% set-03 373.815,63 378.153,09 -4.337,45 -1,14701% 0,01% out-03 375.977,26 391.599,08 -15.621,82 -3,98924% 0,16% nov-03 382.803,02 362.222,27 20.580,76 5,68180% 0,32% dez-03 382.967,31 513.212,94 -130.245,63 -25,37848% 6,44% Total 4.509.110,74 4.783.600,78 -274.490,04 -5,73815% 0,82%
Figura 30 – Correlograma dos resíduos da regressão do modelo “x” da série GRFP Date: 03/31/04 Time: 13:41 Sample: 1999:09 2002:12 Included observations: 40 Q-statistic probabilities adjusted for 3 ARMA term(s)
Autocorrelation Partial Correlation AC PAC Q-Stat Prob **| . | **| . | 1 -0.191 -0.191 1.5671 ***| . | ***| . | 2 -0.389 -0.441 8.2565 . |*. | .*| . | 3 0.117 -0.096 8.8743 . | . | .*| . | 4 0.052 -0.145 8.9994 0.003 . |*. | . |*. | 5 0.085 0.109 9.3473 0.009 .*| . | .*| . | 6 -0.139 -0.131 10.305 0.016 . | . | . |*. | 7 0.047 0.106 10.417 0.034 .*| . | **| . | 8 -0.091 -0.236 10.850 0.054 .*| . | .*| . | 9 -0.115 -0.161 11.561 0.073 . |*. | .*| . | 10 0.184 -0.075 13.465 0.062 . |*. | . |** | 11 0.185 0.249 15.443 0.051 .*| . | . |*. | 12 -0.095 0.104 15.985 0.067 ***| . | **| . | 13 -0.396 -0.289 25.759 0.004 . |*. | **| . | 14 0.103 -0.233 26.442 0.006 . |** | **| . | 15 0.226 -0.208 29.889 0.003 .*| . | . | . | 16 -0.071 -0.055 30.241 0.004 . | . | . |*. | 17 -0.030 0.074 30.306 0.007 .*| . | . | . | 18 -0.108 -0.031 31.200 0.008 . |*. | . | . | 19 0.104 0.041 32.073 0.010 . |*. | . | . | 20 0.121 0.052 33.301 0.010 . | . | .*| . | 21 -0.037 -0.086 33.422 0.015 . | . | . | . | 22 0.041 -0.038 33.582 0.021 .*| . | .*| . | 23 -0.163 -0.092 36.200 0.015 . | . | . | . | 24 -0.052 0.032 36.489 0.019 . |*. | . |*. | 25 0.186 0.138 40.372 0.010 . | . | .*| . | 26 -0.016 -0.122 40.402 0.014 .*| . | **| . | 27 -0.109 -0.228 41.941 0.013 . | . | . | . | 28 0.056 0.024 42.381 0.016 . | . | . | . | 29 -0.019 -0.045 42.438 0.022 . | . | .*| . | 30 -0.050 -0.080 42.850 0.027 . |*. | . | . | 31 0.138 0.003 46.384 0.016 .*| . | .*| . | 32 -0.061 -0.063 47.177 0.018 .*| . | . |*. | 33 -0.079 0.086 48.682 0.017 . | . | . | . | 34 0.038 0.037 49.082 0.021 . | . | . | . | 35 0.034 -0.010 49.465 0.025 . | . | .*| . | 36 0.019 -0.153 49.614 0.032 4.3.3 Séries Consolidadas
A consolidação das previsões feitas para as duas séries nos subitens anteriores, para efeito de comparação com os valores efetivamente arrecadados pode ser vista na Tabela 12 exposta a seguir. A Tabela 13 seguinte demonstra a comparação das previsões realizadas pelo Orçamento do FGTS de 2003 com os valores efetivamente
arrecadados durante este ano. O exame dos dados contidos nestas duas tabelas evidencia a superioridade de previsão dos Modelos ARIMA, em comparação às previsões contidas no Orçamento do FGTS para o ano de 2003.
Tabela 12 – Comparação dos valores previstos (GFIP + GRFP) por modelos ARIMA (valores em R$ Mil)
Tabela 13 – Comparação dos valores previstos (GFIP + GRFP) no Orçamento Anual do FGTS de 2003 (valores em R$ Mil) MÊS / ANO GFIP E GRP PREVISTOS VR. TOTAL ARRECADADO ERRO EM R$ MIL ERRO EM % EQM jan-03 2.376.804,58 2.422.580,75 -45.776,17 -1,88956% 0,04% fev-03 1.803.124,18 1.993.514,34 -190.390,16 -9,55048% 0,91% mar-03 1.774.989,98 1.900.012,02 -125.022,04 -6,58007% 0,43% abr-03 1.798.922,82 1.889.790,37 -90.867,55 -4,80834% 0,23% mai-03 1.811.351,27 1.929.061,65 -117.710,38 -6,10195% 0,37% jun-03 1.826.158,45 1.988.282,46 -162.124,00 -8,15397% 0,66% jul-03 1.849.955,72 2.042.655,44 -192.699,73 -9,43379% 0,89% ago-03 1.877.910,14 2.032.398,98 -154.488,85 -7,60131% 0,58% set-03 1.860.218,13 2.026.310,00 -166.091,87 -8,19676% 0,67% out-03 1.855.169,06 2.053.967,70 -198.798,64 -9,67876% 0,94% nov-03 1.868.578,74 2.036.420,79 -167.842,05 -8,24201% 0,68% dez-03 2.216.895,00 2.641.357,75 -424.462,74 -16,06987% 2,58% Total 22.920.078,06 24.956.352,24 -2.036.274,18 -8,15934% 0,75% MÊS / ANO PREVISÃO DO ORÇAMENTO VALOR ARRECADADO ERRO EM R$
MIL ERRO EM % EQM jan-03 2.164.966,00 2.422.580,75 -257.614,75 -10,63390% 1,13% fev-03 1.552.909,00 1.993.514,34 -440.605,34 -22,10194% 4,88% mar-03 1.615.458,00 1.900.012,02 -284.554,02 -14,97643% 2,24% abr-03 1.610.010,00 1.889.790,37 -279.780,37 -14,80484% 2,19% mai-03 1.657.979,00 1.929.061,65 -271.082,65 -14,05257% 1,97% jun-03 1.649.752,00 1.988.282,46 -338.530,46 -17,02628% 2,90% jul-03 1.801.083,00 2.042.655,44 -241.572,44 -11,82639% 1,40% ago-03 1.670.780,00 2.032.398,98 -361.618,98 -17,79272% 3,17% set-03 1.649.025,00 2.026.310,00 -377.285,00 -18,61931% 3,47% out-03 1.591.739,00 2.053.967,70 -462.228,70 -22,50419% 5,06% nov-03 1.639.088,00 2.036.420,79 -397.332,79 -19,51133% 3,81% dez-03 2.560.286,00 2.641.357,75 -81.071,75 -3,06932% 0,09% Total 21.163.075,00 24.956.352,24 -3.793.277,24 -15,19965% 2,31%