Escola de Administração Fazendária – ESAF
Tema: Ajuste Fiscal e Dívida Pública
SubTema: Ajuste Fiscal e Equilíbrio Macroeconômico
SUMÁRIO
1 - INTRODUÇÃO 1 2 - REVISÃO BIBLIOGRÁFICA 6 2.1 - SÉRIES TEMPORAIS 6 2.1.1 - Estacionariedade 7 2.1.2 - Função de autocorrelação 82.1.3 - Operador de diferença e operador de defasagem 10
2.1.4 - O modelo auto-regressivo (AR) 11
2.1.4.1 - A função de autocorrelação parcial (PACF) 13
2.1.5 - O modelo de médias móveis (MA) 15
2.1.6 - O modelo auto-regressivo de médias móveis (ARMA) 16
2.1.7 - O modelo auto-regressivo integrado de médias móveis (ARIMA) 17
2.1.8 - O modelo sazonal auto-regressivo integrado de médias móveis (SARIMA)
17 2.2- MÉTODOS DE PREVISÃO 19 2.2.1 - Alisamento exponencial 20 2.2.2 - Método de Box-Jenkins 24 2.2.2.1 - Identificação 25 2.2.2.2 - Estimação 29 2.2.2.3 - Verificação de diagnóstico 30
2.3 - Métodos de comparação de previsão 31
2.4 - Softwares estatísticos 33
2.4.1 - O programa R 33
2.4.2 - O programa ITSM2000 33
3 - ANÁLISE DO MÉTODO DE PREVISÃO UTILIZADO PELA SECRETARIA DA
RECEITA FEDERAL (SRF) 35
3.1 - Descrição do método de indicadores 35
3.2 - Resultados 37
3.3 - Análise econométrica 41
4 - ANÁLISE E PREVISÃO DA SÉRIE TEMPORAL DO IMPOSTO SOBRE A
RENDA (IR) 43
4.2 - Análise exploratória 44
4.3 - Modelagem e previsão 50
4.3.1 - Alisamento exponencial 50
4.3.2 - Método Box-Jenkins 52
5 - DISCUSSÃO DOS RESULTADOS 71
5.1 - Comparação de resultados 71
5.2 - Escolha do método de previsão 77
5.3 - Escolha de um modelo SARIMA 79
5.4 - Resultados da previsão para outros impostos 80
5.5 - Previsões com horizonte reduzido 84
6 - CONCLUSÃO 88
7 - REFERÊNCIAS BIBLIOGRÁFICAS 91
APÊNDICE A 93
1 - INTRODUÇÃO
Uma das finalidades da Secretaria da Receita Federal (SRF), estabelecida em
seu Regimento Interno pela Portaria nº 227, de 03 de março de 1998, é a “de
realizar a previsão, o acompanhamento, a análise e o controle das receitas sob sua
administração, assim como a de coordenar e consolidar as previsões das demais
receitas federais, para subsidiar a proposta orçamentária da União”. Além de
expresso no Regimento Interno, a atividade de previsão de receitas públicas é um
dos requisitos essenciais da Responsabilidade na Gestão Fiscal, instituída pela
denominada Lei de Responsabilidade Fiscal (Lei Complementar nº 101, de 04 de
maio de 2000, artigo 11).
Dentro desse contexto institucional, a atividade de previsão consiste em
produzir estimativas da arrecadação de todos os tributos e contribuições
administrados pela SRF e demais receitas federais para o exercício seguinte. Então,
pode-se ter como objetivos básicos da atividade de previsão da arrecadação
tributária federal a de constituir-se em um instrumento gerencial aos administradores
e a de subsidiar a elaboração da proposta do Orçamento Geral da União.
Dessa maneira, a previsão da arrecadação dos tributos federais é uma
atividade que exerce influência na atividade econômica do país e não pode ser
relegada a uma atividade meramente cumpridora de exigências legais. Por isso, a
atividade de previsão dos tributos deve possuir características que façam dela uma
como planos de investimentos governamentais e planejamento de políticas públicas
de longo prazo. Assim, as previsões devem caracterizar-se pela precisão ou
acurácia de seus resultados, pela simplicidade dos métodos empregados e,
sobretudo, pela confiabilidade estatística dos modelos empregados para gerar as
previsões.
Em vista disso, o presente trabalho tem por objetivo principal desenvolver um
método de previsão baseado em modelos estatísticos e econométricos para a
previsão das receitas tributárias federais. Secundariamente, o trabalho mostrará que
o método de previsão utilizado atualmente no âmbito da Secretaria, denominado
método de indicadores, trata-se de uma prática, embora intuitiva,
econometricamente limitada.
Para cumprir os objetivos, analisou-se o poder preditivo do método de
indicadores e comparou-o a alguns métodos de previsão existentes, como
alisamento exponencial e modelos ARIMA (metodologia Box-Jenkins). A análise
detalhada dos procedimentos foi efetuada para a série temporal da arrecadação
agregada do Imposto sobre a Renda (IR) de julho de 1994 a junho de 1999, com os
meses do ano de 2000 servindo como parâmetros de comparação para as previsões
geradas. Foram estimadas também as previsões para os Impostos de Renda das
Pessoas Físicas e Jurídicas e o Imposto de Renda Retido na Fonte - Rendimentos
do Trabalho.
Esta dissertação encontra-se organizada em três partes principais: uma
softwares utilizados nos cálculos; a apresentação dos resultados obtidos para a
previsão dos valores futuros da série do IR para o ano de 2000 pelos métodos dos
indicadores, pelo método de alisamento exponencial e pelo método de Box-Jenkins;
e a discussão sobre os resultados obtidos.
A revisão bibliográfica compreende o estudo dos conceitos básicos de séries
temporais, buscando apresentá-los de forma simples e didática, para que esses
conceitos pudessem ser aplicados no embasamento teórico das metodologias de
previsão. Além disso, os softwares, R para Windows e ITSM2000 para Windows,
também foram objeto de abordagem detalhada.
Os resultados são apresentados por meio de gráficos e tabelas. A
comparação dos resultados se dá na parte da discussão, onde os resultados para os
três métodos são analisados detidamente e seus desempenhos preditivos colocados
à prova. Nessa parte, uma metodologia de previsão é indicada como satisfatória
para gerar as previsões dos tributos federais administrados pela Receita Federal.
A continuação desta dissertação está organizada em mais 5 capítulos: revisão
bibliográfica, análise do método dos indicadores, análise e previsão do IR, discussão
dos resultados e conclusão.
No capítulo 2 é realizado um resumo dos principais conceitos sobre séries
temporais, que envolvem a caracterização da estacionariedade de uma série,
funções de autocorrelação e autocorrelação parcial, modelos auto-regressivos, de
seguida, faz-se uma apresentação do método de previsão por alisamento
exponencial, mostrando-se os algoritmo de Holt-Winters sazonal aditivo e
multiplicativo, e da metodologia de Box-Jenkins, apresentando-se as três etapas do
ciclo iterativo que a compõe. A seguir, mostram-se os métodos mais utilizados para
a comparação dos resultados de previsão, os chamados índices de acurácia ou
precisão, e uma medida de acurácia, o MSE, é escolhida. Conclui-se o capítulo com
uma apresentação dos programas estatísticos empregados nesta dissertação, o R
para Windows e o ITSM2000 para Windows.
No capítulo 3 é feita uma análise dos métodos dos indicadores com a
descrição do método, a apresentação dos resultados das previsões geradas para 12
meses do ano de 2000 para os impostos de Renda agregado, o imposto de renda
sobre Pessoas Físicas e Jurídicas e o imposto de Renda Retido na Fonte
-Rendimentos sobre o Trabalho. A seguir, uma análise econométrica é empregada no
método para se determinar a confiança estatística das previsões geradas pelo
método utilizado pela Receita Federal.
No capítulo 4 é efetuada uma análise exploratória da série do IR agregado e
possíveis valores outliers são considerados. Ressalta-se que por causa dos outliers
6 diferentes séries do IR serão analisadas. Em seguida, são geradas previsões para
a série do IR pelos métodos de alisamento exponencial e Box-Jenkins. Todas as
etapas da metodologia de Box-Jenkins são explicadas e possíveis modelos são
escolhidos por meio de um critério de seleção de modelos, o BIC. Os modelos
No capítulo 5 os resultados obtidos nos capítulos 3 e 4 são comparados
utilizando os valores do BIC e do MSE. A seguir, faz-se uma escolha do método com
melhores capacidades preditivas que servirá como sugestão para a utilização pela
Secretaria da Receita Federal. Em seguida, são apresentadas as previsões para as
séries desagregadadas do IR, ou seja, as séries do IRPF, IRPJ e IRRF (rendimentos
do trabalho) e comparadas com as previsões obtidas pelo método dos indicadores.
Conclui-se apresentando previsões para horizontes reduzidos, com 1 passo e 3
passos à frente, de maneira que tal procedimento possa servir como uma espécie de
ajuste de previsões já realizadas.
O capítulo final faz uma conclusão sobre os métodos empregados na
dissertação, sugere mudanças na forma de produção de previsões e indica
2 - REVISÃO BIBLIOGRÁFICA
Neste capítulo serão apresentados os conceitos básicos de séries temporais para
subsidiar a explicação dos métodos de previsão por alisamento exponencial e
metodologia Box-Jenkins. Além disso, os softwares estatísticos utilizados neste
trabalho são analisados e seu funcionamento é apresentado.
2.1 - SÉRIES TEMPORAIS
Uma série temporal caracteriza-se como um conjunto de observações que
representa uma variável observada ao longo do tempo. Quando as observações são
obtidas continuamente, isto é, a todo instante ao longo do tempo, diz-se que a série
temporal é contínua, cuja representação é X(t). Contrariamente, uma série temporal
discreta é aquela em que as observações são tomadas em um conjunto discreto, ou
seja, em intervalos fixos de tempo, cuja representação é dada por Xt.
Uma série temporal {xt} é a realização de uma família de variáveis aleatórias
{Xt}. De outra maneira, um modelo de série temporal para dados observados {xt} é
uma especificação das distribuições de uma seqüência de variáveis aleatórias {Xt}
da qual {xt} é denominada uma realização [Brockwell & Davis, 1996]. São
necessários para a caracterização da seqüência de variáveis aleatórias somente os
momentos de primeira e segunda ordem da distribuição conjunta [Granger &
Newbold, 1986]. O momento de primeira ordem é definido como o valor esperado ou
( )
t . t =E X µO momento de segunda ordem é definido como o produto esperado ou a covariância
entre Xt e Xs:
(
,)
[
(
)(
)
]
. cov ,s t s t t s s t X X E X µ X µ γ = = − −Define-se também a variância de Xt como
(
,)
var( )
[
(
)(
)
]
[
(
)
]
. cov 2 ,t t t t t t t t t t t X X X E X µ X µ E X µ γ = = = − − = − 2.1.1 - EstacionariedadeUma série temporal {Xt} é dita ser (fracamente) estacionária se
( )
Xt =µ ; E (i) ; 2 ,t = x <∞ t (ii)γ σ . ,s t s t (iii)γ =γ −Então, um processo estacionário apresenta média (condição (i)) e
variância (condição (ii)) constantes ao longo do tempo t e a covariância (condição
(iii)) entre os dois pontos dependente da distância entre esses pontos e
independente do tempo t [Granger & Newbold, 1986].
Em vista da condição (iii), tem-se que
0
2 γ
σx =
e a covariância é usualmente escrita como
(
,)
. cov t h t h = X + X γ (1.4) (1.5) (1.2) (1.3) (1.1)2.1.2 - Função de autocorrelação
Define-se a função de autocovariância de uma série temporal
estacionária {Xt} como
( )
cov(
t h, t)
.x h = X + X γ
A função de autocorrelação (ACF) de uma série temporal estacionária
{Xt} é definida como
( )
( )
( )
(
,)
. 0 t h t x x x cor X X h h = = + γ γ ρAs funções de autocovariância e de autocorrelação fornecem uma
medida útil do grau de dependência entre os valores de uma série temporal em
diferentes períodos. As autocorrelações medem ainda o tamanho e a força da
“memória” do processo.
O gráfico das autocorrelações amostrais versus h é chamado de
correlograma. Tal gráfico apresenta valores que serão utilizados para caracterizar as
propriedades lineares ou não do mecanismo gerador do processo [Granger &
Newbold, 1986]. Porém, não é simples examinar um correlograma e extrair dele as
correspondentes propriedades populacionais. O que se faz necessário é averiguar
alguns modelos plausíveis que provejam correlogramas de formas reconhecidas.
As funções de autocovariância e autocorrelação amostrais podem ser (1.6)
calculadas para qualquer conjunto de dados e não estão restritas a observações de
séries temporais estacionárias [Brockwell & Davis, 1996]. Para dados contendo
tendência, a ACF exibirá um decaimento lento na medida que t aumenta, conforme
mostra a Figura 1.1. Para dados com um componente periódico determinístico,
como sazonalidade, a ACF exibirá um comportamento similar ao período, conforme
a Figura 1.2. -1.00 -.80 -.60 -.40 -.20 .00 .20 .40 .60 .80 1.00 0 5 10 15 20 25 30 35 40 Sample ACF
Figura 1.1 - Correlograma para um série com tendência
-1.00 -.80 -.60 -.40 -.20 .00 .20 .40 .60 .80 1.00 0 5 10 15 20 25 30 35 40 ACF amostral
Figura 1.2 - Correlograma para um série com sazonalidade
Assim, o correlograma pode ser utilizado como um indicador de
não-estacionariedade da série temporal [Brockwell & Davis, 1996]. Deve-se notar que as
linhas tracejadas nas Figuras 1.1 e 1.2 representam limites de significância
estatística, acima dos quais as autocorrelações são consideradas significativamente
diferentes de zero.
2.1.3 - Operador de diferença e operador de defasagem
Considere a série temporal {Xt}, com t = 0,..., n. A primeira diferença da
série é definida como
,... 3 , 2 , 1 , 1 = − = ∆xt xt xt− t
O operador ∆ é denominado operador de diferença. Generalizando (1.8), a n-ésima diferença da série é dada por
( )
(
)
. ! ! ! , 1 . 0 1 1 1 r n r n r n onde x r n x x x t r r n r t n t n t n − = − = ∆ − ∆ = ∆ − = − − −∑
Deve-se notar que n observações são perdidas ao se calcular a n-ésima diferença.
O operador de defasagem B é definido como
. 1 − = t t x Bx Generalizando (1.10), ,... 2 , 1 , 0 , = =x− n x Bn t t n
O operador B pode ser utilizado na forma polinomial, de maneira que
(1.8)
(1.9)
t n t n t t t d x d x d x k x + 1 −1 + 2 −2 +L+ − = pode ser escrito como
(
)
t t n nB x k d B d B d + + + = + 2 L 2 1 1 ou( )
B xt kt, d = onde( )
B(
1 d1B dnBn)
. d = + +L+2.1.4 - O modelo auto-regressivo (AR)
Um modelo auto-regressivo é definido de maneira que os valores da
série no tempo t dependem dos valores passados. Mais especificamente o modelo
autoregressivo de orem p AR(p) é
, 1 1 2 1 1
∑
= − − − − + + + = + + = p j t j t j t p t p t t t c X X X X X φ φ L φ ε φ εonde a série {εt} é ruído branco1 com média zero e E[Xtεt+s] = 0, para s>0. Escrevendo a equação (1.12) em termos do polinômio do operador de defasagem B
tem-se que
( )
B Xt c εt .φ = +
O polinômio φ(B) de ordem p é chamado de polinômio AR e tem-se que
( )
1 2 . 2 1 p pB B B B φ φ φ φ = − − −L−Para que a condição de estacionariedade para modelos AR(p) seja (1.11)
(1.12)
satisfeita é necessário que as raízes do polinômio φ(B) estejam foram do círculo unitário (no plano complexo). Para um modelo AR(1),
,
1
1 t t
t c X
X = +φ − +ε
a condição de estacionariedade é satisfeita quando |φ |<1.
Assumindo que a condição de estacionariedade está satisfeita, a média
do processo AR(p) é obtida tomando os valores esperados em (1.12),
, ... 2 1µ φ µ φ µ φ µ =c+ + + + p ou ainda,
(
p)
c φ φ φ µ − − − − = L 2 1 1As autocovariâncias são calculadas multiplicando-se ambos os lados de (1.14) por
(Xt-j - µ) e tomando os valores esperados,
. 0 , , 2 , 1 , 2 1 1 1 1
{
++ ++ + = = = − − h h p p p h p h h φ γ φ γ σ γ φ γ φ γ L L LA autocorrelação é obtida dividindo-se a equação (1.15) por γ0,
L L , 1,2, 1 1 + + = = h− p h−p h h φ ρ φ ρ ρ
As p equações obtidas de (1.16) são denominadas de equações de Yule-Walker e
podem ser escritas na forma matricial como
, ñ=Pö onde
(
)
′ =(
)
′ = 1 ö 1 2 p ñ ρ ,ρ2,L,ρp , φ ,φ ,L,φ (1.15) (1.16) . (1.14)e = − − − − − 1 1 1 3 2 1 2 1 1 1 2 1 K M M M K K p p p p p ρ ρ ρ ρ ρ ρ ρ ρ ρ P . Então, ñ, P ö = −1
de forma que os parâmetros auto-regressivos podem ser expressos como uma
função das p autocorrelações [Mills, 1990].
O comportamento da função de autocorrelação de um processo
auto-regressivo é uma mistura de decaimento exponencial e/ou decaimento senoidal. Se
as raízes da equação auto-regressiva forem reais, então as autocorrelações
decairão exponencialmente. Caso as raízes sejam complexas, o decaimento será na
forma senoidal [Granger & Newbold, 1986].
2.1.4.1 - A função de autocorrelação parcial (PACF)
Em um processo AR(1), Xt e Xt-2 são correlacionados, mesmo que Xt-2
não apareça diretamente no modelo. O valor da correlação entre Xt e Xt-2 (i.e., ρ2) é igual à correlação entre Xt e Xt-1 (ρ1) multiplicada pela correlação entre Xt-1 e Xt-2 (ρ1), de forma que ρ2 = ρ12. Assim, toda essa correlação “indireta” está presente na ACF
(PACF) como a seqüência de correlações entre (Xt e Xt-1), (Xt e Xt-2), (Xt e Xt-3) e assim por diante, desde que os efeitos de defasagens anteriores sobre Xt
permaneçam constantes [Hill, Griffiths & Judge, 1999]. A PACF é calculada como o valor do coeficiente φkk na equação
. 2 2 1 1 t k t kk t k t k t X X X e X =φ − +φ − +L+φ − +
O coeficiente φkk é obtido das equações de Yule-Walker aplicadas a (1.17). Tais equações são dadas por (1.16) e, substituindo p = k e φi = φii, tem-se
[Mills, 1990] . 1 1 1 1 1 1 2 1 2 3 1 1 2 1 1 2 1 2 3 1 1 2 1 ρ ρ ρ ρ ρ ρ ρ ρ ρ ρ ρ ρ ρ ρ ρ ρ ρ ρ ρ φ L M M L M M L L L M M L M M L L − − − − − − − − − − = k k k k k k k k k k k kk
Assim, para um processo AR(p) não há correlação entre Xt e Xt-k para
k > p [Mills, 1990]. Então, todos os valores de φkk para k > p são zero e a PACF para
um processo AR(p) puro apresenta um “corte” para zero para defasagens maiores
que p [Enders, 1995].
Assim, pode-se resumir que um processo AR(p) é descrito por:
- possuir uma função de autocorrelação, ACF, que é uma
combinação de decaimentos exponenciais e senoidais e tamanho (1.17)
infinito; e
- possuir uma função de autocorrelação, PACF, que é zero para
defasagens maiores que p.
2.1.5 - O modelo de médias móveis (MA)
O modelo de médias móveis de ordem q, MA(q), é dado pela forma
, 1 , 0 0 2 2 1 1
∑
= − − − − + + + = + ≡ + + = q j j t j q t q t t t t X µ ε θ ε θ ε L θ ε µ θ ε θonde {εt} é ruído branco com média zero. Alternativamente,
( )
t ,( )
1 1 q q,t B B B B
X =θ ε θ = +θ +L+θ
onde θ(B) é o polinômio do operador de defasagem B. Um processo MA(q) é dito ser invertível se as raízes de 0 1 2 2 1 + + + = + q qz z z θ θ θ L
se encontrarem fora do círculo unitário.
As autocovariâncias de ordem superior são
(
t)
(
t j) (
t t q t q)(
t j t j q t j q)
j = E X −µ X − −µ =E ε +θε− + +θ ε− ε− +θε − − + +θ ε− −
γ 1 1 L 1 1 L
e, como os termos envolvendo produtos de ε´s em diferentes instantes de tempo têm valor esperado zero, para j > q, γj = 0, seguindo que
(
)
2 , 1,2, , , 1 1 1 j q q j j q j = θ +θ +θ +L+θ θ − σ = L γ . , 0 j q j = > γDessa feita, para um processo MA(q) a ACF apresenta um “corte” para zero para (1.18)
defasagens maiores que q [Mills, 1990]. A função de autocorrelação parcial de um
processo MA(q) possui tamanho infinito [Mills, 1990].
Pode-se resumir que um processo MA(q) é descrito por:
- possuir uma ACF que é zero para defasagens maiores que q; e
- possuir uma PACF que é uma combinação de decaimentos
exponenciais e senoidais e tamanho infinito.
2.1.6 - O modelo auto-regressivo de médias móveis (ARMA)
Um processo ARMA(p,q) é uma generalização dos modelos AR(p) e
MA(q), sendo definido como
q t q t t t p t p t t t c X X X X = +φ1 −1 +φ2 −2 +L+φ − +ε +θ1ε −1 +θ2ε −2 +L+θ ε − ou ainda na forma polinomial
( )
B Xt c θ( )
Bεt.φ = +
A série temporal {Xt} é estacionária se e somente se as raízes de φ(z) estiverem fora do círculo unitário. A série temporal {Xt} é invertível se e somente se as raízes de θ(z) estiverem fora do círculo unitário. Para os modelos ARMA, as funções de autocorrelação (ACF) e autocorrelação parciais (PACF) decaem até o
infinito em vez de apresentarem um “corte” em alguma defasagem particular, como
ocorre com os processos AR e MA puros [Mills, 1990]. Assim, para um processo
ARMA(p,q), a ACF decairá, seja diretamente ou oscilando ao redor de zero, a partir (1.20)
da defasagem q. Por sua vez, a PACF decairá, seja diretamente ou oscilando ao
redor de zero, a partir da defasagem p [Enders, 1995].
2.1.7 - O modelo auto-regressivo integrado de médias móveis (ARIMA)
Se d for um número inteiro não-negativo, então uma série temporal {Xt}
é dita ser um processo ARIMA(p,d,q) ou um processo integrado de ordem d se
(
)
t d t d t B X X Y = 1− =∆for um processo ARMA(p,q) causal [Brockwell & Davis, 1996]. Um processo
integrado é utilizado para séries não-estacionárias.
Assim, um modelo ARMA(p,q) é um modelo ARIMA(p,0,q).
Alternativamente, {Xt} deve satisfazer
( ) (
[1)
t ]( )
t, d B X B B µ θ ε φ − − =onde {εt} é ruído branco com média zero, φ(B) e θ(B) são polinômios de ordem p e q, respectivamente, φ(B) é um operador estacionário, µ é a média de ∆d
Xt e d é a ordem de diferenciação. A ordem de diferenciação será 0 ou 1 para a maioria dos
processos e raramente d = 2 [Granger & Newbold, 1986].
2.1.8 - O modelo sazonal auto-regressivo integrado de médias móveis (SARIMA)
Suponha uma série temporal sazonal não-estacionária {Xt} observada s (1.21)
períodos por ano, de maneira que s = 4 para séries trimestrais e s = 12 para séries
mensais. Uma forma de remover a sazonalidade da série e transformá-la em uma
série estacionária {Zt}, para que um modelo ARIMA possa ser empregado, é efetuar
uma diferenciação sazonal, nos moldes da diferenciação vista anteriormente. Assim,
(
1 s)
t t.s t
t X B X Z
X − − = − =
Contudo, em muitos casos é necessário adicionar ao modelo uma modelagem de Zt
determinada por seu padrão sazonal, então
( )(
1)
( )
t, s t D s s Z B X B B − =Θ Φ onde( ) (
Bs = 1−Φ1sBs − −ΦPsBPs)
, Φ L( ) (
1 1)
. Qs Qs s s s B B B = +Θ + +Θ Θ LPela equação (1.22), nota-se que o padrão sazonal é aleatório entre os ciclos s
[Brockwell & Davis, 1996].
Se a sazonalidade da série Zt tiver sido filtrada, um modelo
ARIMA(p,d,q) regular pode representar Zt, assim
( )(
B 1 B)
d Xt θ( )
Bεt, φ − = onde( )
B(
1 φ1B φpBp)
, φ = − −L−( )
(
1 1)
, q qB B B θ θ θ = + +L+e {εt} é ruído branco com média zero.
Combinando (1.22) e (1.23), chega-se a classe de modelos sazonais (1.22)
multiplicativos ARIMA(p,d,q)x(P,D,Q) ou SARIMA,
( )
B( )
Bs(
1 B)
d(
1 Bs)
DXt θ( )
B( )
Bs εt,φ Φ − − = Θ
onde {εt} é ruído branco com média zero. Nessa classe de modelos permite-se tanto a diferenciação regular quanto a diferenciação sazonal. Nota-se que a série
diferenciada pode ser representada usando tanto componentes auto-regressivos e
de médias móveis regulares quanto sazonais. Em geral, o valor para D é raramente
maior que um e os valores de P e Q não ultrapassam 2 [Brockwell & Davis, 1996].
O processo representado por (1.24) é causal se e somente se φ(B) ≠ 0 e Φ (B) ≠ 0, para | z | ≤ 1, ou seja, se as raízes do polinômios auto-regressivos se encontrarem fora do círculo unitário [Brockwell & Davis, 1996]. Um modelo particular
dessa classe de modelos é o chamado modelo “airline”, um modelo
SARIMA(0,1,1)(0,1,1).
A seguir, os modelos teóricos apresentados nessa seção serão
aplicados nas metodologias de previsão de alisamento exponencial e Box-Jenkins.
Tais metodologias utilizam conceitos e procedimentos diferentes para produzir
prognósticos de séries univariadas, que são séries que possuem somente um
conjunto de dados.
2.2- MÉTODOS DE PREVISÃO
Nesta seção, serão apresentados dois métodos de previsão. O primeiro
método, denominado de alisamento exponencial (exponential smoothing), é (1.24)
considerado um método automático de previsão e seu procedimento é bem simples.
O segundo método, denominado de metodologia Box-Jenkins, é um método de
utilização mais complexa que o anterior e emprega a classe de modelos
ARIMA/SARIMA em sua concepção.
2.2.1 - Alisamento exponencial
O alisamento exponencial é um procedimento geral para obtenção de
algoritmos de previsão automática que produz resultados relativamente acurados, de
maneira rápida e barata [Granger & Newbold, 1986].
A forma mais simples de alisamento exponencial é aquela para séries
temporais que não possuem sazonalidade nem tendência crescente ou decrescente.
O objetivo é estimar o “nível” (ou a “média”) presente da série e usar esse nível
como previsão de valores futuros. O nível da série no tempo t é estimado como
(
1−)
1+(
1−)
2 2+L,+
= t t− t−
t x x x
x α α α α α
com 0 < α < 1. Uma forma mais simples de cálculo é obtida substituindo t por t-1 e multiplicando os dois lados de (1.46) por (1-α), o que leva a
(
1−)
−1.+
= t t
t x x
x α α
A previsão de todos os valores futuros (fn,h), com h = 1, 2,. . ., é obtida utilizando-se a equação (1.26), i.e.,
.
,h n
n x
f =
Para se iniciar o algoritmo é necessário especificar um valor inicial, que usualmente
é [Granger & Newbold, 1986]
. x x =
(1.25)
O peso de cada termo é determinado pelo valor de α, a constante de suavização. A escolha dessa constante é feita de maneira que seu valor minimize a
soma dos erros quadrados [Janacek, 2001]. O erro de previsão é definido como
, 1 , 1 − − = t t t x f e
para t = 3, 4, ... , n. Então, a soma dos erros quadrados é dada por
(
)
. 3 2 1 , 1 3 2∑
∑
= − = − = = n t t t n t t x f e SCaso a série temporal apresente tendência, a equação (1.26) não é
capaz de fazer previsões de movimentos crescentes ou decrescentes futuros. O
algoritmo de alisamento exponencial de Holt-Winters leva em consideração esses
movimentos e permite estimar também a inclinação atual da série.
O nível e a inclinação da série são dados, respectivamente, por
(
)(
)
(
) (
1)
, , 1 1 1 1 1 − − − − − + − = + − + = t t t t t t t t T x x T T x x x β β α αcom 0 < α < 1 e 0 < β < 1, constantes de suavização. As previsões são obtidas supondo um acréscimo ou decréscimo continuado dado pela última estimativa de
inclinação; assim, . , , 4 , 3 , , x hT h n fnh = n + n = K Os possíveis valores iniciais do algoritmo são
. , 1 2 2 2 2 x x T x x − = =
Os valores para as constantes de suavização são obtidos como anteriormente, de
forma que seus valores minimizem a soma dos quadrados dos erros de previsão um (1.27)
passo à frente. O erro de previsão é dado por
(
1 1)
, 4,5, , . 1 , 1 x x T t n f x et = t − t− = t − t− + t− = K Então, a soma dos erros quadrados é(
)
. 4 2 1 , 1 4 2∑
∑
= − = − = = n t t t n t t x f e SSe a série temporal contiver movimentos sazonais de período s, o
algoritmo de Holt-Winters precisa ser modificado para que a sazonalidade seja
estimada. Assim, o algoritmo de Holt-Winters sazonal é definido de modo que para
cada período seja necessário estimar um fator de sazonalidade, Ft. No instante t, a
última estimativa do fator de sazonalidade para o período é Ft-s (obtido do mesmo
período do ano anterior) [Cribari-Neto, 2000]. As equações para o nível, a inclinação
e para o fator de sazonalidade são, considerando que a sazonalidade seja aditiva,
(
) (
)(
)
(
) (
)
(
) (
1)( )
, , 1 , 1 1 1 1 1 s t t t t t t t t t t s t t t F x x F T x x T T x F x x − − − − − − − + − = − + − = + − + − = γ γ β β α αcom 0 < α < 1 , 0 < β < 1 e 0 < γ < 1, constantes de suavização. As previsões são dadas por M K K , 2 , , 2 , 1 , , , , 2 , 1 , 2 , s s s h F hT x s h F hT x f s h t n n s h t n n h n + + = + + = = + + = − + − +
Considerando a sazonalidade multiplicativa, as equações para o nível,
a inclinação e para o fator de sazonalidade são, respectivamente,
(
)(
)
(
) (
)
(
1)( )
, , 1 , 1 1 1 1 1 s t t t t t t t t t t s t t t F x x F T x x T T x F x x − − − − − − − + = − + − = + − + = γ γ β β α αcom 0 < α < 1 , 0 < β < 1 e 0 < γ < 1, constantes de suavização. As previsões são dadas por
(
)
(
)
. , 2 , , 2 , 1 , , , , 2 , 1 , 2 , M K K s s s h F hT x s h F hT x f s h t n n s h t n n h n + + = + = = + = − + − +Os possíveis valores iniciais do algoritmo podem ser [Brockwell & Davis, 1996]
(
)
( )
(
1)
, 1, , . , , 1 1 1 1 1 1 s i i T x x F s x x T x x s i i i s s s s K = − + − = − = = + + + + +Tanto para a sazonalidade aditiva quanto para a sazonalidade
multiplicativa, os valores das constantes de suavização são calculados de forma a
minimizar a soma dos quadrados dos erros de previsão um passo à frente. O erro de
previsão é
(
1 1)
, 14,15, , . 1 , 1 x x T F t n f x et = t − t− = t − t− + t− + t−s = K Então, a soma dos erros quadrados é(
)
. 14 2 1 , 1 14 2∑
∑
= − = − = = n t t t n t t x f e SAs formas aditivas e multiplicativas do algoritmo de Holt-Winters
sazonal podem fornecer previsões bem diferentes. Se a série apresentar oscilações (1.29)
sazonais aproximadamente constantes, o modelo aditivo é mais indicado. Porém, se
as oscilações sazonais forem proporcionais ao nível da série, o modelo multiplicativo
é mais indicado. Alternativamente, pode-se utilizar os dois procedimentos e escolher
aquele que fornece a menor soma dos erros de previsão um passo à frente ao
quadrado [Cribari-Neto, 2000].
2.2.2 - Método de Box-Jenkins
Dada uma série temporal não-sazonal não-estacionária {Xt}, considere
que ela possa ser representada por um modelo da classe ARIMA(p,d,q),
( )(
B 1 B)
dXt θ( )
Bεt, φ − = onde( )
(
1 1)
, p pB B B φ φ φ = − −L−( )
(
1 1)
. q qB B B θ θ θ = + +L+O objetivo da metodologia de Box-Jenkins [Box & Jenkins, 1970] é
encontrar um modelo estocástico linear da classe ARIMA que possa ter gerado {Xt} e
que esse modelo possa ser utilizado para fornecer previsões de valores futuros da
série [Granger & Newbold, 1986]. Caso a série temporal {Xt} apresente
sazonalidade, {Xt} pode ser representada por um modelo da classe
SARIMA(p,d,q) (P,D,Q), conforme a equação (1.24).
A estratégia de modelagem, tanto para modelos sazonais quanto para
(i) identificação do modelo;
(ii) estimação do modelo; e
(iii) verificação de diagnóstico.
A etapa de identificação consiste em selecionar valores para p, d, q e
P, D, Q (no caso de modelos sazonais). Essa etapa envolve subjetividade e
julgamento pessoal. Na etapa de estimação, os coeficientes identificados na etapa
anterior são estimados usando técnicas estatísticas. A última etapa indica se o
modelo identificado e estimado descreve adequadamente o comportamento dos
dados da série {Xt}. Caso o modelo não seja adequado, o ciclo deve começar
novamente [Cribari-Neto, 2000].
Um conceito importante nessa metodologia é o princípio da parcimônia
[Enders, 1995]. Tal princípio sugere que modelos mais simples, com poucos
parâmetros, produzem melhores previsões que modelos superparametrizados. Um
modelo parcimonioso ajusta bem os dados sem incorporar coeficientes inúteis. O
objetivo é se aproximar do processo gerador original dos dados e não descrevê-lo
exatamente [Enders, 1995].
2.2.2.1 - Identificação
Essa etapa é considerada a mais difícil e delicada, e não há consenso
sobre qual a melhor estratégia a ser seguida [Granger & Newbold, 1986]. Dentre as
autocorrelação e autocorrelação parcial amostrais, e o uso de um critério de seleção
de modelos.
Para utilizar a primeira estratégia é necessário reconhecer modelos
AR, MA e ARMA por meio das características da ACF e da PACF. A Tabela 2.1
resume as propriedades da ACF e da PACF para diversos modelos ARIMA [Mills,
1990]. Para modelos sazonais, o comportamento da ACF e da PACF deve ser
analisado também próximo da defasagem sazonal, por exemplo, defasagem 12 para
dados mensais e defasagem 4 para dados trimestrais. A Tabela 2.2 resume as
propriedades da ACF e da PACF para modelos SARIMA [Bowerman & O’Connell,
1987].
Tabela 2.1 - Propriedades da ACF e da PACF para vários modelos ARIMA
Modelo ACF PACF
(1,d,0) Decaimento exponencial ou oscilatório
φkk=0 para k > 1
(2,d,0) Decaimento exponencial ousenoidal φkk=0 para k > 2 (p,d,0) Decaimento exponencial e/ousenoidal φkk=0 para k > p
(0,d,1) ρk = 0 para k > 1 Dominado por decaimentoexponencial (0,d,2) ρk = 0 para k > 2 Dominado por decaimentoexponencial ou senoidal
(0,d,q)
ρk = 0 para k > q Dominado pela combinação
linear de decaimento exponencial e/ou senoidal
(1,d,1)
Decaimento exponencial a partir da defasagem 1
Dominado por decaimento exponencial a partir da defasagem 1
(p,d,q)
Decaimento exponencial e/ou senoidal depois da defasagem q-p
Dominado por decaimento exponencial ou senoidal depois da defasagem q-p
Tabela 2.2 - Propriedades da ACF e da PACF para modelos SARIMA
Modelo ACF PACF
(P,D,0) Decaimento Picos nas defasagens s, 2s, ...Ps e corte após Ps
(0,D,Q) Picos nas defasagens s, 2s, ...Qs e corte após Qs
Decaimento
(P,D,0) ou (0,D,Q)
Picos nas defasagens s, 2s, ...Qs e corte após Qs
Picos nas defasagens s, 2s, ...Ps e corte após Ps (P,D,0) e (0,D,Q) Decaimento rápido na defasagem sazonal Decaimento rápido na defasagem sazonal Nenhum operador sazonal
Valores pequenos em todas as defasagens sazonais (não há picos)
Valores pequenos em todas as defasagens sazonais (não há picos)
Além de identificar os valores para p e q (e os valores de P e Q para
modelos SARIMA), o grau de diferenciação da série (valor d e valor D para modelos
sazonais) precisa ser conhecido. Para tanto, utiliza-se também a inspeção da ACF e
da PACF amostrais. Para um modelo não-sazonal, um comportamento suave
persistente nas autocorrelações amostrais em defasagens altas indica
não-estacionariedade, i.e., necessidade de diferenciação. Assim, deve-se diferenciar a série para sucessivos valores positivos de d e examinar o correlograma de {∆d
Xt} [Cribari-Neto, 2000].
A segunda estratégia para identificar os valores de p, d, q é utilizar um
critério de informação que selecione os modelos por meio de um conjunto de
“regras” [Mills, 1990]. Os critérios de seleção para modelos ARIMA mais utilizados
são o AIC (Akaike information criterion), o AICC (Akaike information criterion
corrected) e o BIC (Bayesian information criterion). Esses critérios incorporam um termo de penalidade para o aumento do número de parâmetros (p e q) no modelo,
de forma que modelos mais “parcimoniosos”, ou seja, com o menor número de
parâmetros, sejam escolhidos. As equações para esses critérios, sendo T o número
de observações, são [Cribari-Neto, 2000]
(
)
(
)
(
)
log , ˆ log 2 , 1 2 ˆ log 2 , 2 ˆ log 2 T q p L BIC q p T T q p L AICC q p L AIC + + − = − − − + + − = + + − =onde L representa a verossimilhança maximizada.
O critério AIC superestima assintoticamente a ordem verdadeira do
modelo [Granger & Newbold, 1986] apresentando tendência a escolher modelos
superparametrizados [Cribari-Neto, 2000]. O AICC é uma versão corrigida do AIC
que incorpora uma correção de viés para amostras finitas, possuindo uma
penalidade mais forte para modelos de ordem elevada [Brockwell & Davis, 1996].
O BIC é um critério consistente, de forma que ele fornece estimativas
de p e q que convergem em probabilidade para os valores verdadeiros à medida que
T tende a infinito [Brockwell & Davis, 1996]. Já os critérios AIC e AICC não são consistentes. Por outro lado, o AIC é assintoticamente eficiente para modelos
puramente auto-regressivos.
Na prática, a seleção de modelos é feita calculando o valor do critério
(o BIC, por exemplo) para todos os modelos ARIMA associados aos valores de p, d
e q de forma que p,q =0,1,2,3,4,5 e d =0,1. Assim, seleciona-se o modelo que
apresenta o menor valor do BIC e modelos alternativos cuja diferença para o valor ^
mínimo do BIC seja inferior a 2 [Brockwell & Davis, 1996]. Para a modelagem
SARIMA, a quantidade de modelos investigados é maior, pois além dos valores de
p, d e q, deve-se incluir ainda os valores para P,Q = 0,1,2 e D = 0,1. Porém, os
modelos são selecionados pelos mesmos critérios que os utilizados para os modelos
ARIMA.
2.2.2.2 - Estimação
Assumindo que um modelo ARIMA da forma
(
)
(
)
(
)
t q q t d p pB B X B B B φ θ θ ε φ − − − = + + + − 1 L 1 1 1 L 1seja escolhido conforme a etapa anterior, o objetivo agora é estimar, utilizando o
método de máxima verossimilhança (ML)2, os parâmetros φφ = (φ1,...,φp)´, θθ = (θ1,...,θq)´ e σ2, a variância de εt.
A estimação da ML é difícil e geralmente requer muito tempo de
processamento computacional. Desta forma, existem alternativas que aproximam a
função de máxima verossimilhança. Duas dessas alternativas são o MQE (mínimos
quadrados exatos) e o MQC (mínimos quadrados condicional). Contudo, alguns
estudos têm sugerido [Ansley & Newbold, 1980] que o método de máxima
verossimilhança é superior aos demais.
Para a modelagem SARIMA o procedimento é idêntico ao mostrado
para a modelagem ARIMA, com a superioridade da estimação por máxima
verossimilhança sendo ainda mais pronunciada para modelos sazonais [Ansley &
Newbold, 1980].
2.2.2.3 - Verificação de diagnóstico
A correta especificação de um modelo ARIMA ou SARIMA é verificada no termo εt, pois ele deve constituir um processo ruído branco [Granger & Newbold, 1986]. Assim, a verificação da adequabilidade do modelo é efetuada nas autocorrelações amostrais dos erros (εt), as quais seguem assintoticamente uma distribuição normal, com média zero e desvio padrão n- ½, se forem provenientes de um ruído branco. Como os erros verdadeiros (εt) não são conhecidos, a inferência baseia-se nas estimativas dos erros, os resíduos εt.
Dessa forma, se o modelo estiver corretamente especificado, os
resíduos não devem apresentar correlação serial, pois toda a dinâmica dos dados já
foi capturada pelo modelo [Cribari-Neto, 2000]. A autocorrelação amostral dos
resíduos de ordem j é calculada como [Granger & Newbold, 1986]
( )
. ˆ ˆ ˆ ˆ 1 2 1∑
∑
= + = − = T t t T j t j t t j r ε ε ε εEntão, os valores das autocorrelações residuais devem estar contidos no intervalo
de confiança assintótico de 95% que é [Cribari-Neto, 2000]
− T T 2 , 2 ,
onde T indica o número de observações da série.
Em adição ao exame das autocorrelações individuais dos resíduos um
teste conjunto das primeiras m autocorrelações pode ser utilizado, que é conhecido
por teste Ljung-Box. Tal teste “portmanteau” compara o valor de
(
) (
)
j( )
j m j r j T T T Q 2 2 εˆ 1 1∑
= − − + =com valores tabulados da distribuição do χ2 (qui-quadrado) com (m - p - q) graus de liberdade e com a rejeição da hipótese nula (de que o modelo é adequado) para
valores de Q maiores que o valor crítico assintótico [Granger & Newbold, 1986]. O
valor de m deve ser pelo menos igual a √T [Cribari-Neto, 2000].
2.3 - Métodos de comparação de previsão
Um dos métodos de escolha do melhor mecanismo de previsão é a
comparação dos valores previstos (Xt) com os valores observados da série (Xt), o
que caracteriza a acurácia ou a capacidade preditiva do mecanismo utilizado. Os
três métodos mais populares de medição da acurácia utilizam os resíduos em seus
cálculos [Kvanli et al.,1996]. Esses métodos são o desvio absoluto médio (MAD), o
erro quadrático médio (MSE) e o erro percentual absoluto médio (MAPE). Assim, os
resíduos são definidos como
. ˆ t t t X X e = −
O desvio absoluto médio (MAD) é definido como a média dos valores ^
absolutos de cada resíduo e é representado por
, n
e MAD=
∑
tonde n é o número de valores previstos obtidos dos dados passados.
O erro quadrático médio (MSE) é a média dos valores quadráticos de cada
resíduo, assim . 2 n e MSE=
∑
tO erro percentual absoluto médio (MAPE) considera o erro relativo de cada
previsão. O erro relativo em cada período t é definido como et /Xt. Então,
. n X e MAPE t t
∑
=Não há consenso entre os estatísticos sobre qual método é preferível. Assim,
se erros elevados de previsão são inaceitáveis, então o uso do MSE faz-se
necessário. Entretanto, se é possível ignorar alguns erros elevados, o MAD funciona
melhor. E o MAPE é utilizado para comparar a acurácia (precisão) de duas séries
temporais diferentes [Kvanli, et al., 1996]. Dessa forma, o MSE será utilizado como
critério de acurácia para as comparações dos métodos de previsão apresentados
2.4 -
Softwares estatísticos
2.4.1 - O programa R
O programa R é um sistema para computação estatística e gráfica. Ele
provê, dentre outras coisas, uma linguagem de programação, ferramentas gráficas
de alto nível, interface com outras linguagens de programação e ferramentas para
depuração. O R é uma versão gratuita do programa S-PLUS comercializado pela
MathSoft, Inc. Essa plataforma possui várias qualidades. A primeira é ser um
programa gratuito e de livre distribuição. A segunda é permitir a criação de novas
funções e a possibilidade de modificação das funções internas. O R pode ser obtido
via Internet no endereço www.r-project.org e possui versões para os sistemas
operacionais Windows, Unix e Macintosh.
2.4.2 - O programa ITSM2000
O programa ITSM2000, diferentemente do R, é um programa
proprietário. Não há a possibilidade de alteração de suas funções, nem a
possibilidade de distribuição gratuita. O programa (versão Windows) acompanha o
livro “Introducion to Time Series and Forecasting” de Peter Brockwell & Richard
Davis. Trata-se de um programa simples e bastante intuitivo, baseado em escolhas
de menu e botões, seguindo o padrão dos programas para o sistema operacional
Windows.
completo, permitindo estimação de modelos ARIMA por máxima verossimilhança
exata [Cribari-Neto, 2000]. O critério de seleção de modelos utilizado no programa é
o AICC.
No próximo capítulo, o método de previsão utilizado no âmbito da
Secretaria da Receita Federal será descrito e detalhado. A descrição envolve a
formulação teórica do método, bem como os resultados obtidos na sua aplicação.
Os resultados mostrados neste capítulo restringem-se ao Imposto sobre a Renda e
3 - Análise do método de previsão utilizado
pela Secretaria da Receita Federal (SRF)
Este capítulo descreve sucintamente o método de previsão utilizado pela SRF,
mostra as previsões geradas por tal método e faz uma análise econométrica,
mostrando sua inadequabilidade como instrumento estatisticamente confiável de
previsão.
3.1 - Descrição do método de indicadores
O método utilizado no âmbito da SRF, denominado de indicadores, consiste
na multiplicação da arrecadação do período anterior por:
- um índice de preço que represente a variação inflacionária a que
está sujeito o fato econômico gerador da arrecadação;
- um índice de quantidade que represente a variação real desse fato
gerador;
- um índice que represente o efeito causado na arrecadação por
modificações na legislação tributária;
- outros índices que representem quaisquer influências na
arrecadação tributária.
(
1)(
1)(
1)(
1)
,1 P Q L U
X
Xt = t− +∆ +∆ +∆ +∆ onde
Xt = arrecadação prevista para determinado período do ano t; Xt-1 = arrecadação efetiva do mesmo período do ano t-1; ∆P = variação percentual do indicador de preços;
∆Q = variação percentual do indicador de quantidades;
∆L = variação percentual decorrente de alterações da legislação; normalmente significa variação de alíquotas;
∆U = variação percentual de qualquer outro indicador que tenha influência na arrecadação e não possa ser enquadrado nos indicadores básicos (preço,
quantidade e legislação).
Os termos (1+∆P), (1+∆Q) e (1+∆L) são denominados, respectivamente, Efeito-Preço, Efeito-Quantidade e Efeito-Legislação. O termo (1+∆U) representa o Efeito-Residual. A qualidade da previsão com a utilização desse método depende da
obtenção de bons indicadores de preço e quantidade específicos para cada caso
(tributo, setor econômico ou item de receita).
Os órgãos de pesquisa de preços e acompanhamento da conjuntura
econômica (IBGE, FGV, IPEA) são fontes importantes para se identificar quais os
índices de preço e quantidade melhor se adequam aos vários tributos. Na Tabela 3.1
estão relacionados alguns tributos e seus principais indicadores de preço e
quantidade.
A SRF mantém registro de séries históricas dos principais indicadores de
preços e algumas séries de quantidade. As projeções dos parâmetros
macroeconômicos (inflação, PIB, taxa de câmbio e taxa de juros) que influenciam os
diversos indicadores são elaboradas pela Secretaria de Política Econômica do
Ministério da Fazenda (SPE).
Tabela 3.1 - Tributos e seus indicadores de preço e quantidade INDICADORES ESPECÍFICOS TRIBUTO/CONTRIBUIÇÃO
PREÇO QUANTIDADE
Imposto de Importação Taxa de câmbio Volume de importações tributadas, em dólar IPI - Bebidas Índice de preços de bebidas Volume de vendas de bebidas ao
mercado interno IPI - Automóveis Índice de preços da indústria
automobilística
Volume de vendas de automóveis ao mercado interno Imposto de Renda Pessoa
Física - IRPF IGP - Índice Geral de Preços Número de contribuintes Imposto de Renda Pessoa
Jurídica - IRPFJ IGP - Índice Geral de Preços PIB Imposto de Renda Retido na
Fonte - IRRF - Trabalho Variação nominal de salários Nível de emprego Imposto de Renda Retido na
Fonte - IRRF - Capital Taxa de juros
Volume em R$ de aplicações financeiras
IOF - Imposto sobre operações financeiras
Variação nominal do volume de credito e prêmios de seguro (em R$)
COFINS IGP - Índice Geral de Preços PIB
3.2 - Resultados
Os resultados obtidos pela SRF com a utilização do método dos indicadores
para os componentes mais significativos da série do Imposto de Renda estão
mostrados na Tabela 3.2, juntamente com os valores reais da arrecadação, a
de acurácia MSE.
Tabela 3.2 - Previsão gerada pelo método dos indicadores
Série Imposto sobre a Renda - Agregado
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Total
previsão 5.042 3.619 5.641 4.079 4.777 3.820 3.952 4.486 3.666 3.854 4.154 4.847 51.937
Real 5.156 4.206 5.718 4.713 4.113 4.261 4.937 4.619 4.375 4.825 4.705 6.546 58.174
∆∆% -2,22 -13,97 -1,35 -13,46 16,13 -10,34 -19,96 -2,88 -16,20 -20,12 -11,70 -25,95 -10,72
∆∆% média -10,17
MSE 585.247
Série Imposto de Renda Pessoa Física - IRPF
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Total
previsão 136 106 124 819 424 401 405 383 381 138 124 136 3.578
Real 209 159 173 829 407 334 371 336 334 182 226 194 3.754
∆∆% -35,09 -33,33 -28,14 -1,20 4,30 20,09 9,05 13,97 14,19 -23,96 -45,14 -30,04 -4,70
∆∆% média -11,28
MSE 3.062
Série Imposto de Renda Pessoa Jurídica - IRPJ
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Total
previsão 1.305 1.029 2.338 1.180 1.019 871 1.195 1.014 857 1.177 854 937 13.777
Real 1.519 1.629 2.652 1.501 963 1.013 1.866 1.285 1.111 1.901 1.159 1.592 18.191
∆∆% -14,11 -36,84 -11,82 -21,37 5,83 -13,99 -35,97 -21,07 -22,84 -38,09 -26,34 -41,12 -24,26
∆∆% média -23,14
MSE 188.725
Série Imposto de Renda Retido na Fonte - Rendimentos do Trabalho
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Total
previsão 1.370 1.302 1.454 1.052 1.557 1.219 1.222 1.528 1.236 1.246 1.723 2.072 16.980
Real 1.462 1.306 1.625 1.227 1.494 1.333 1.350 1.547 1.476 1.435 1.755 2.870 18.880
∆∆% -6,31 -0,32 -10,53 -14,29 4,20 -8,53 -9,49 -1,24 -16,24 -13,17 -1,80 -27,82 -10,06
∆∆% média -8,80
MSE 69.494
As Figuras 3.1, 3.2, 3.3 e 3.4 mostram o gráfico da série temporal do imposto,
somente para o ano de 1999, em preto, o valor da arrecadação real no ano de 2000
em azul e o valor da previsão para o ano de 2000 em vermelho pontilhado, para
cada um dos impostos constantes na Tabela 3.2. Todos os valores da arrecadação
Figura 3.1 - Gráfico do valor real e da previsão gerada
Figura 3.3 - Gráfico do valor real e da previsão gerada
3.3 - Análise econométrica
Considere novamente a equação que descreve o método dos indicadores
(
1)(
1)(
1)(
1)
.1 P Q L U
X
Xt = t− +∆ +∆ +∆ +∆
Substituindo o resultado da multiplicação dos índices entre parênteses por uma
constante ct, a equação (3.2) fica
. 1 − = t t t c X X
Caso ∆P, ∆Q, ∆L e ∆U sejam simultaneamente zero, ou seja, não ocorram alterações percentuais em nenhum dos índices, o valor de ct em (3.3) será igual a 1
e a previsão será igual ao último valor observado. Caso um dos índices apresente
variação percentual positiva, por exemplo ∆P = 10%, ceteris paribus, o valor de ct em (3.3) será igual a 1,1. Caso a variação percentual seja negativa, por exemplo ∆P = -10%, ceteris paribus, o valor de ct em (3.3) será igual a 0,9. Assim, ct pode assumir, dependendo do sinal da variação percentual, valores maiores ou menores que 1.
Generalizando, caso haja variações positivas e negativas simultâneas em todos os
índices, o valor de ct na equação (3.3) pode assumir valores maiores ou menores
que zero.
A equação (3.3) assemelha-se a uma estrutura AR(1), conforme mostra a
equação (1.12), a menos do termo de erro εt e do fato que em (3.3) ct varia com t. Assim, o método dos indicadores deve ser considerado como uma representação de
um modelo auto-regressivo de ordem 1 uma vez que Xt-1 representa a arrecadação
efetiva no período anterior.
(3.3) (3.2)
Contudo, além de não conter um termo residual, o método dos indicadores
falha em reproduzir um AR(1) ao possibilitar que o valor de ct possa assumir
qualquer valor diferente de zero. E, como já foi visto, todo processo auto-regressivo
de ordem 1 que apresenta o valor absoluto de sua raiz como maior que 1 não pode
representar um processo estacionário. Então, não há perda alguma em se desconsiderar processos AR(1) com |φ1 | > 1 [Brockwell & Davis, 1996].
Desta maneira, o método dos indicadores utilizado pela Secretaria da Receita
Federal não está reproduzindo um processo auto-regressivo causal, estacionário.
Suas previsões não são confiáveis, uma vez que as condições básicas de
estacionariedade não são satisfeitas. Por isso, tal método deveria ser abandonado
em prol de alguma outra metodologia mais adequada.
Tal metodologia pode ser alguma das que serão mostradas no próximo
capítulo, que inicia-se com uma análise exploratória da série agregada do Imposto
sobre a Renda. Depois, as metodologias de previsão por alisamento exponencial e
modelagem SARIMA serão empregadas para essa série e os resultados das
4 - Análise e previsão da série temporal do
Imposto sobre a Renda (IR)
Este capítulo começa com considerações gerais sobre a série temporal do IR e suas
especificidades na utilização desse trabalho. A seguir, são empregadas as
metodologias de previsão de Holt-Winters sazonal e Box-Jenkins para a obtenção de
valores futuros para a série do IR.
4.1 - Considerações gerais
O Imposto sobre a Renda foi escolhido para a análise nesse trabalho devido a
sua importância na arrecadação federal. De acordo com a Tabela 4.1, verifica-se
que esse imposto correspondeu a mais de 30% tanto das receitas administradas
pela SRF quanto do total arrecadado pela União Federal no ano de 2000 (em
valores nominais).
Existem dados mensais da série histórica do Imposto de Renda, assim como
de todos os tributos federais, desde janeiro de 1986. Dessa forma, há mais de 180
observações na série temporal. Apesar de ser um número razoável de observações,
deve-se considerar as inúmeras mudanças econômicas ocorridas no Brasil desde
então para se utilizar todos esses dados em uma análise econométrica. Assim,
neste trabalho optou-se por utilizar os dados disponíveis após a implementação do
Tabela 4.1 - Participação do Imposto sobre a Renda na arrecadação total da SRF - 2000
Imposto R$ - milhões % - administradas % - arrecadação
Imposto sobre a Importação 8.510,1 5,12 4,83
Imposto sobre a Exportação 2,5 0,00 0,00
Imposto sobre Produtos Industrializados 18.839,1 11,33 10,70
Imposto sobre a Renda 56.396,6 33,92 32,04
I.O.F. - Imposto s/ Operações Financeiras 3.126,7 1,88 1,78 I.T.R. - Imposto Territorial Rural 267,0 0,16 0,15 CPMF - Contrib. Movimentação Financeira 14.544,6 8,75 8,26 Cofins - Contribuição Seguridade Social 39.903,2 24,00 22,67 Contribuição para o Pis/Pasep 10.043,0 6,04 5,71 CSLL - Contribuição Social s/ Lucro 9.278,0 5,58 5,27 Contrib. p/ Plano Seg. Social Servidores 3.626,6 2,18 2,06
Contribuição para o Fundaf 372,4 0,22 0,21
Outras Receitas Administradas 1.350,3 0,81 0,77
Receitas de Loterias 951,6 0,57 0,54
Demais 398,7 0,24 0,23
Receitas Administradas pela SRF 166.260,10 100,00 94,45
Total da Arrecadação Federal 176.020,60 100,00
Fonte: Secretaria da Receita Federal - MF
Desta maneira, os dados analisados foram divididos em duas partes. A
primeira parte corresponde aos valores observados a partir de julho de 1994 até o
mês de dezembro de 1999. Esses dados serão utilizados pelos métodos de
alisamento exponencial e de Box-Jenkins para prever os dados conhecidos da
segunda parte, os valores da arrecadação do ano de 2000. A medida de acurácia de
previsão empregada será o MSE. A seguir, será feita uma análise exploratória sobre
a série do Imposto de Renda.
4.2 - Análise exploratória
O Imposto de Renda possui a seguinte classificação: IRPF - Pessoa Física,
IRPJ - Pessoa Jurídica, IRRF - Retido na Fonte. O IRRF apresenta ainda quatro
para o Exterior e Outros Rendimentos
Desta maneira, oito séries distintas de dados precisam ser analisadas. Para
simplificação e para evitar repetição de procedimentos, somente a série agrupada do
imposto será descrita e analisada detalhadamente. Para as séries do IRPF , do IRPJ
e do IRRF - Rendimentos do Trabalho, somente os resultados serão apresentados.
A série do imposto de renda {IR} analisada possui 66 observações e seu
gráfico é apresentado na Figura 4.1 em milhões de reais. Os dados foram ajustados
pelo índice de preços IGP-DI divulgado pela Fundação Getúlio Vargas em janeiro de
2000, com base em junho de 2000. Assim, os dados são expressos em reais de
junho de 2000 e podem ser interpretados como a preços constantes, sem centavos.
A Tabela 4.2 mostra os valores em milhões de reais das observações da série {IR}.