Verificação da validade do modelo - MODELAGEM DA SÉRIE TEMPORAL

4 ANÁLISE E DISCUSSÃO DOS RESULTADOS

4.2 MODELAGEM DA SÉRIE TEMPORAL

4.2.4 Verificação da validade do modelo

Com a finalidade de verificar a estabilidade do modelo, realizou-se um teste de diagnóstico. Essa verificação de estabilidade é possível analisando-se as raízes inversas dos polinômios, que devem estar dentro do círculo unitário (ROSA et al., 2016), conforme Figura 28.

Figura 28 – Raiz inversa de polinômios do modelo ARIMA

(0, 2, 1)

Fonte: Elaborado pela autora com base na saída do programa R Studio (2017).

Para que o modelo seja considerado estável, todas as raízes inversas dos polinômios devem estar dentro do círculo (ROSA et al., 2016). Observa-se, na Figura 28, que a raiz do polinômio MA (q) encontra-se dentro do círculo unitário, confirmando a estabilidade do modelo encontrado. Na Figura 29, observa-se a distribuição dos resíduos do modelo.

Figura 29 – Resíduos do modelo ARIMA (0, 2, 1) do crédito consignado

Fonte: Elaborado pela autora com base na saída do programa R Studio (2017).

Observa-se, na Figura 29, que os dados aparentam estar simetricamente distribuídos em torno da média zero, o que pode indicar uma distribuição normal ou próxima à normalidade. A variância não é constante, apresentando picos nos anos de 2013 e 2016. Já a média observada segue uma tendência linear constante próxima a zero. Na Figura 30 são expostas as autocorrelaçãoes dos resíduos do modelo.

Figura 30 – Autocorrelações dos resíduos do modelo ARIMA (0, 2, 1) do crédito consignado

Fonte: Elaborado pela autora com base na saída do programa R Studio (2017).

Não há presença de autocorrelação linear nos resíduos, conforme Figura 30, exceto para o primeiro lag. Essa primeira autocorrelação, de acordo com a qualidade de ajuste Portmanteau, pode indicar que o modelo foi subidentificado. Então, testaram-se os modelos ARIMA (1,2,1), alterando o AR (0) para AR (1), e o modelo ARIMA (0, 2, 2), alterando o MA (1) para MA (2). Ambos os testes apresentaram o mesmo comportamento de autocorrelações para os resíduos, com a primeira lag significante. Então, manteve-se o modelo ARIMA (0, 2, 1), que seguiu o critério de escolha exposto pelo ciclo iterarivo de Box & Jenkins. As autocorrelações, além da verificação gráfica, podem ser medidas pelo Teste Ljung-Box, apresentado na Figura 31.

Figura 31 – Valores de p para o Teste Ljung-Box

Fonte: Elaborado pela autora com base na saída do programa R Studio (2017).

O Teste Ljung-Box verifica se existe autocorrelação entre os resíduos. A hipótese nula do teste é que os resíduos não apresentam autocorrelação, considerando-se a significância de p<0,05. O teste Ljung-Box resultou em um valor de p=0,992 e, conforme Figura 31, todas as defasagens apresentam valores não significativos. Com o resultado encontrado não é possível

rejeitar a hipótese nula da não existência de autocorrelação, ou seja, não há dependência serial para todas as defasagens até o lag 20. Luo et al. (2017) explicam que, de acordo com a análise residual, quando o valor de p das estatísticas de teste de Ljung-Box em todos as defasagens é superior a 0,05, é confirmada a confiabilidade do modelo de projeto.

Após verificar que não há autocorrelação nos resíduos, testar-se-á a normalidade, verificando se os mesmos são normalmente distribuídos e possuem probabilidade de variável aleatória. Para tanto, utilizou-se o método estatístico Jarque-Bera, caracterizado por ser um teste assintótico por calcular, inicialmente, as medidas de assimetria e a curtose (BERTOTTI; MASSUQUETTI; LELIS, 2013). O teste apresenta uma distribuição de qui-quadrado assintótica com dois graus de liberdade, com a finalidade de verificar se a assimetria e a curtose da série temporal são diferentes da distribuição normal esperada (NARANY, 2017). A hipótese nula do teste é que existe normalidade, com uma significância considerada de p<0,05. O teste está rejeitando a hipótese nula de normalidade, com p<0,001.

Foi realizado o teste Shapiro Wilk, que mede o nível de significância para as diferenças em relação a uma distribuição normal (HAIR et al., 2009). A hipótese nula é que a série analisada é normalmente distribuída, considerando-se a significância de p<0,05. O resultado com p<0,001 rejeita a hipótese nula. Porém, supõem-se que a distribuição dos resíduos segue uma distribuição próxima à normalidade. O diagnóstico consiste em analisar se os resíduos do modelo têm um comportamento semelhante aos distúrbios do modelo analisado, ou seja, se pode afirmar que eles são semelhantes a um ruído branco (CHAVEZA; BERNATA; COALLAB, 1999).

Para a escolha do modelo mais adequado, pode-se utilizar o critério de informação de Akaike (AIC) e o critério de informação bayesiano (BIC). Persio, Cecchin e Cordoni (2017) elucidam que, para diferentes valores dos parâmetros p e q, o critério AIC pode ser utilizado para escolher o melhor modelo. Estima-se que um AIC inferior significa um ajuste melhor (NARANY, 2017; PERSIO; CECCHIN; CORDONI, 2017). Luo et al. (2017) informam que assim que o modelo inicial é determinado, a dificuldade reside na estimativa específica dos outros parâmetros do modelo, que podem ser estimados por um procedimento de otimização de acordo com o critério de informação bayesiano. O melhor modelo será o que apresentar um menor valor para o BIC (LUO et al., 2017). Também foi utilizado o critério de raiz do erro médio quadrático (RMSE), queé caracterizado como a medida da magnitude média dos erros estimados, cujo valor é positivo e, quanto mais próximo de zero, maior a qualidade dos valores medidos ou estimados (ALVES; VECCHIA, 2011). Como quarto critério, utilizou-se o método de erro percentual médio absoluto (MAPE), conforme sugerido por Camargo (1992),

demonstrados na Tabela 13. Quanto menor for o critério de informação, melhor será o poder de explicação do modelo.

Tabela 13 – Validade do modelo ARIMA do crédito consignado de acordo com os critérios AIC, BIC, RMSE e MAPE

Ordem do Modelo ARIMA

AIC BIC RMSE MAPE

(0, 2, 1) 3.449,19 3.454,28 21.761.266,00 0,36732680 (1, 2, 1) 3.446,02 3.453,65 20.837.653,00 0,35342100 (0, 2, 2) 3.450,43 3.458,06 21.663.059,00 0,35622119 (0, 2, 0) 3.451,48 3.454,03 22.274.310,00 0,39372930 (0, 1, 1) 3.546,77 3.551,88 30.067.034,00 0,64540970

Fonte: Elaborado pela autora com base na saída do programa R Studio (2017).

De acordo com a Tabela 13, verifica-se que o modelo mais adequado é o ARIMA (1, 2, 1), porém com critérios próximos do modelo ARIMA (0, 2, 1), encontrado seguindo o ciclo iterativo de Box & Jenkins. De acordo com a função de autocorrelação parcial, o modelo não apresenta valor para o parâmetro autorregressivo. Por isso, a ordem (p, d, q) para o modelo escolhido é (0, 2, 1), que representa um modelo mais parcimonioso, pois envolve o número mínimo de parâmetros possíveis.

No documento Evolução do crédito consignado no estado do Rio Grande do Sul : aplicação da metodologia de Box & Jenkins (páginas 94-98)