Escola de Administração Fazendária ESAF. Título: MODELO DE PREVISÃO PARA ARRECADAÇÃO TRIBUTÁRIA

(1)

Escola de Administração Fazendária – ESAF

Tema: Ajuste Fiscal e Dívida Pública

SubTema: Ajuste Fiscal e Equilíbrio Macroeconômico

(2)

SUMÁRIO

1 - INTRODUÇÃO 1 2 - REVISÃO BIBLIOGRÁFICA 6 2.1 - SÉRIES TEMPORAIS 6 2.1.1 - Estacionariedade 7 2.1.2 - Função de autocorrelação 8

2.1.3 - Operador de diferença e operador de defasagem 10

2.1.4 - O modelo auto-regressivo (AR) 11

2.1.4.1 - A função de autocorrelação parcial (PACF) 13

2.1.5 - O modelo de médias móveis (MA) 15

2.1.6 - O modelo auto-regressivo de médias móveis (ARMA) 16

2.1.7 - O modelo auto-regressivo integrado de médias móveis (ARIMA) 17

2.1.8 - O modelo sazonal auto-regressivo integrado de médias móveis (SARIMA)

17 2.2- MÉTODOS DE PREVISÃO 19 2.2.1 - Alisamento exponencial 20 2.2.2 - Método de Box-Jenkins 24 2.2.2.1 - Identificação 25 2.2.2.2 - Estimação 29 2.2.2.3 - Verificação de diagnóstico 30

2.3 - Métodos de comparação de previsão 31

2.4 - Softwares estatísticos 33

2.4.1 - O programa R 33

2.4.2 - O programa ITSM2000 33

3 - ANÁLISE DO MÉTODO DE PREVISÃO UTILIZADO PELA SECRETARIA DA

RECEITA FEDERAL (SRF) 35

3.1 - Descrição do método de indicadores 35

3.2 - Resultados 37

3.3 - Análise econométrica 41

4 - ANÁLISE E PREVISÃO DA SÉRIE TEMPORAL DO IMPOSTO SOBRE A

RENDA (IR) 43

(3)

4.2 - Análise exploratória 44

4.3 - Modelagem e previsão 50

4.3.1 - Alisamento exponencial 50

4.3.2 - Método Box-Jenkins 52

5 - DISCUSSÃO DOS RESULTADOS 71

5.1 - Comparação de resultados 71

5.2 - Escolha do método de previsão 77

5.3 - Escolha de um modelo SARIMA 79

5.4 - Resultados da previsão para outros impostos 80

5.5 - Previsões com horizonte reduzido 84

6 - CONCLUSÃO 88

7 - REFERÊNCIAS BIBLIOGRÁFICAS 91

APÊNDICE A 93

(4)

1 - INTRODUÇÃO

Uma das finalidades da Secretaria da Receita Federal (SRF), estabelecida em

seu Regimento Interno pela Portaria nº 227, de 03 de março de 1998, é a “de

realizar a previsão, o acompanhamento, a análise e o controle das receitas sob sua

administração, assim como a de coordenar e consolidar as previsões das demais

receitas federais, para subsidiar a proposta orçamentária da União”. Além de

expresso no Regimento Interno, a atividade de previsão de receitas públicas é um

dos requisitos essenciais da Responsabilidade na Gestão Fiscal, instituída pela

denominada Lei de Responsabilidade Fiscal (Lei Complementar nº 101, de 04 de

maio de 2000, artigo 11).

Dentro desse contexto institucional, a atividade de previsão consiste em

produzir estimativas da arrecadação de todos os tributos e contribuições

administrados pela SRF e demais receitas federais para o exercício seguinte. Então,

pode-se ter como objetivos básicos da atividade de previsão da arrecadação

tributária federal a de constituir-se em um instrumento gerencial aos administradores

e a de subsidiar a elaboração da proposta do Orçamento Geral da União.

Dessa maneira, a previsão da arrecadação dos tributos federais é uma

atividade que exerce influência na atividade econômica do país e não pode ser

relegada a uma atividade meramente cumpridora de exigências legais. Por isso, a

atividade de previsão dos tributos deve possuir características que façam dela uma

(5)

como planos de investimentos governamentais e planejamento de políticas públicas

de longo prazo. Assim, as previsões devem caracterizar-se pela precisão ou

acurácia de seus resultados, pela simplicidade dos métodos empregados e,

sobretudo, pela confiabilidade estatística dos modelos empregados para gerar as

previsões.

Em vista disso, o presente trabalho tem por objetivo principal desenvolver um

método de previsão baseado em modelos estatísticos e econométricos para a

previsão das receitas tributárias federais. Secundariamente, o trabalho mostrará que

o método de previsão utilizado atualmente no âmbito da Secretaria, denominado

método de indicadores, trata-se de uma prática, embora intuitiva,

econometricamente limitada.

Para cumprir os objetivos, analisou-se o poder preditivo do método de

indicadores e comparou-o a alguns métodos de previsão existentes, como

alisamento exponencial e modelos ARIMA (metodologia Box-Jenkins). A análise

detalhada dos procedimentos foi efetuada para a série temporal da arrecadação

agregada do Imposto sobre a Renda (IR) de julho de 1994 a junho de 1999, com os

meses do ano de 2000 servindo como parâmetros de comparação para as previsões

geradas. Foram estimadas também as previsões para os Impostos de Renda das

Pessoas Físicas e Jurídicas e o Imposto de Renda Retido na Fonte - Rendimentos

do Trabalho.

Esta dissertação encontra-se organizada em três partes principais: uma

(6)

softwares utilizados nos cálculos; a apresentação dos resultados obtidos para a

previsão dos valores futuros da série do IR para o ano de 2000 pelos métodos dos

indicadores, pelo método de alisamento exponencial e pelo método de Box-Jenkins;

e a discussão sobre os resultados obtidos.

A revisão bibliográfica compreende o estudo dos conceitos básicos de séries

temporais, buscando apresentá-los de forma simples e didática, para que esses

conceitos pudessem ser aplicados no embasamento teórico das metodologias de

previsão. Além disso, os softwares, R para Windows e ITSM2000 para Windows,

também foram objeto de abordagem detalhada.

Os resultados são apresentados por meio de gráficos e tabelas. A

comparação dos resultados se dá na parte da discussão, onde os resultados para os

três métodos são analisados detidamente e seus desempenhos preditivos colocados

à prova. Nessa parte, uma metodologia de previsão é indicada como satisfatória

para gerar as previsões dos tributos federais administrados pela Receita Federal.

A continuação desta dissertação está organizada em mais 5 capítulos: revisão

bibliográfica, análise do método dos indicadores, análise e previsão do IR, discussão

dos resultados e conclusão.

No capítulo 2 é realizado um resumo dos principais conceitos sobre séries

temporais, que envolvem a caracterização da estacionariedade de uma série,

funções de autocorrelação e autocorrelação parcial, modelos auto-regressivos, de

(7)

seguida, faz-se uma apresentação do método de previsão por alisamento

exponencial, mostrando-se os algoritmo de Holt-Winters sazonal aditivo e

multiplicativo, e da metodologia de Box-Jenkins, apresentando-se as três etapas do

ciclo iterativo que a compõe. A seguir, mostram-se os métodos mais utilizados para

a comparação dos resultados de previsão, os chamados índices de acurácia ou

precisão, e uma medida de acurácia, o MSE, é escolhida. Conclui-se o capítulo com

uma apresentação dos programas estatísticos empregados nesta dissertação, o R

para Windows e o ITSM2000 para Windows.

No capítulo 3 é feita uma análise dos métodos dos indicadores com a

descrição do método, a apresentação dos resultados das previsões geradas para 12

meses do ano de 2000 para os impostos de Renda agregado, o imposto de renda

sobre Pessoas Físicas e Jurídicas e o imposto de Renda Retido na Fonte

-Rendimentos sobre o Trabalho. A seguir, uma análise econométrica é empregada no

método para se determinar a confiança estatística das previsões geradas pelo

método utilizado pela Receita Federal.

No capítulo 4 é efetuada uma análise exploratória da série do IR agregado e

possíveis valores outliers são considerados. Ressalta-se que por causa dos outliers

6 diferentes séries do IR serão analisadas. Em seguida, são geradas previsões para

a série do IR pelos métodos de alisamento exponencial e Box-Jenkins. Todas as

etapas da metodologia de Box-Jenkins são explicadas e possíveis modelos são

escolhidos por meio de um critério de seleção de modelos, o BIC. Os modelos

(8)

No capítulo 5 os resultados obtidos nos capítulos 3 e 4 são comparados

utilizando os valores do BIC e do MSE. A seguir, faz-se uma escolha do método com

melhores capacidades preditivas que servirá como sugestão para a utilização pela

Secretaria da Receita Federal. Em seguida, são apresentadas as previsões para as

séries desagregadadas do IR, ou seja, as séries do IRPF, IRPJ e IRRF (rendimentos

do trabalho) e comparadas com as previsões obtidas pelo método dos indicadores.

Conclui-se apresentando previsões para horizontes reduzidos, com 1 passo e 3

passos à frente, de maneira que tal procedimento possa servir como uma espécie de

ajuste de previsões já realizadas.

O capítulo final faz uma conclusão sobre os métodos empregados na

dissertação, sugere mudanças na forma de produção de previsões e indica

(9)

2 - REVISÃO BIBLIOGRÁFICA

Neste capítulo serão apresentados os conceitos básicos de séries temporais para

subsidiar a explicação dos métodos de previsão por alisamento exponencial e

metodologia Box-Jenkins. Além disso, os softwares estatísticos utilizados neste

trabalho são analisados e seu funcionamento é apresentado.

2.1 - SÉRIES TEMPORAIS

Uma série temporal caracteriza-se como um conjunto de observações que

representa uma variável observada ao longo do tempo. Quando as observações são

obtidas continuamente, isto é, a todo instante ao longo do tempo, diz-se que a série

temporal é contínua, cuja representação é X(t). Contrariamente, uma série temporal

discreta é aquela em que as observações são tomadas em um conjunto discreto, ou

seja, em intervalos fixos de tempo, cuja representação é dada por Xt.

Uma série temporal {xt} é a realização de uma família de variáveis aleatórias

{Xt}. De outra maneira, um modelo de série temporal para dados observados {xt} é

uma especificação das distribuições de uma seqüência de variáveis aleatórias {Xt}

da qual {xt} é denominada uma realização [Brockwell & Davis, 1996]. São

necessários para a caracterização da seqüência de variáveis aleatórias somente os

momentos de primeira e segunda ordem da distribuição conjunta [Granger &

Newbold, 1986]. O momento de primeira ordem é definido como o valor esperado ou

(10)

( )

_t . t =E X µ

O momento de segunda ordem é definido como o produto esperado ou a covariância

entre Xt e Xs:

(

,

)

[

(

)(

)

]

. cov ,s t s t t s s t X X E X µ X µ γ = = − −

Define-se também a variância de Xt como

(

,

)

var

( )

[

(

)(

)

]

[

(

)

]

. cov 2 ,t t t t t t t t t t t X X X E X µ X µ E X µ γ = = = − − = − 2.1.1 - Estacionariedade

Uma série temporal {Xt} é dita ser (fracamente) estacionária se

( )

X_t =µ ; E (i) ; 2 ,t = x <∞ t (ii)γ σ . ,s t s t (iii)γ =γ ₋

Então, um processo estacionário apresenta média (condição (i)) e

variância (condição (ii)) constantes ao longo do tempo t e a covariância (condição

(iii)) entre os dois pontos dependente da distância entre esses pontos e

independente do tempo t [Granger & Newbold, 1986].

Em vista da condição (iii), tem-se que

0

2 γ

σx =

e a covariância é usualmente escrita como

(

,

)

. cov _t _h _t h = X + X γ (1.4) (1.5) (1.2) (1.3) (1.1)

(11)

2.1.2 - Função de autocorrelação

Define-se a função de autocovariância de uma série temporal

estacionária {Xt} como

( )

cov

(

_t _h, _t

)

.

x h = X + X γ

A função de autocorrelação (ACF) de uma série temporal estacionária

{Xt} é definida como

( )

_{( )}

(

,

)

. 0 t h t x x x cor X X h h = = ₊ γ γ ρ

As funções de autocovariância e de autocorrelação fornecem uma

medida útil do grau de dependência entre os valores de uma série temporal em

diferentes períodos. As autocorrelações medem ainda o tamanho e a força da

“memória” do processo.

O gráfico das autocorrelações amostrais versus h é chamado de

correlograma. Tal gráfico apresenta valores que serão utilizados para caracterizar as

propriedades lineares ou não do mecanismo gerador do processo [Granger &

Newbold, 1986]. Porém, não é simples examinar um correlograma e extrair dele as

correspondentes propriedades populacionais. O que se faz necessário é averiguar

alguns modelos plausíveis que provejam correlogramas de formas reconhecidas.

As funções de autocovariância e autocorrelação amostrais podem ser (1.6)

(12)

calculadas para qualquer conjunto de dados e não estão restritas a observações de

séries temporais estacionárias [Brockwell & Davis, 1996]. Para dados contendo

tendência, a ACF exibirá um decaimento lento na medida que t aumenta, conforme

mostra a Figura 1.1. Para dados com um componente periódico determinístico,

como sazonalidade, a ACF exibirá um comportamento similar ao período, conforme

a Figura 1.2. -1.00 -.80 -.60 -.40 -.20 .00 .20 .40 .60 .80 1.00 0 5 10 15 20 25 30 35 40 Sample ACF

Figura 1.1 - Correlograma para um série com tendência

-1.00 -.80 -.60 -.40 -.20 .00 .20 .40 .60 .80 1.00 0 5 10 15 20 25 30 35 40 ACF amostral

(13)

Figura 1.2 - Correlograma para um série com sazonalidade

Assim, o correlograma pode ser utilizado como um indicador de

não-estacionariedade da série temporal [Brockwell & Davis, 1996]. Deve-se notar que as

linhas tracejadas nas Figuras 1.1 e 1.2 representam limites de significância

estatística, acima dos quais as autocorrelações são consideradas significativamente

diferentes de zero.

2.1.3 - Operador de diferença e operador de defasagem

Considere a série temporal {Xt}, com t = 0,..., n. A primeira diferença da

série é definida como

,... 3 , 2 , 1 , 1 = − = ∆x_t x_t x_t₋ t

O operador ∆ é denominado operador de diferença. Generalizando (1.8), a n-ésima diferença da série é dada por

( )

₍

₎

. ! ! ! , 1 . 0 1 1 1 r n r n r n onde x r n x x x _t _r r n r t n t n t n − =         − = ∆ − ∆ = ∆ ₋ = − − −

∑

Deve-se notar que n observações são perdidas ao se calcular a n-ésima diferença.

O operador de defasagem B é definido como

. 1 − = t t x Bx Generalizando (1.10), ,... 2 , 1 , 0 , = =x₋ n x Bn _t _t _n

O operador B pode ser utilizado na forma polinomial, de maneira que

(1.8)

(1.9)

(14)

t n t n t t t d x d x d x k x + ₁ ₋₁ + ₂ ₋₂ +L+ ₋ = pode ser escrito como

(

)

t t n nB x k d B d B d + + + = + 2 L 2 1 1 ou

( )

B x_t k_t, d = onde

( )

B

(

1 d₁B d_nBn

)

. d = + +L+

2.1.4 - O modelo auto-regressivo (AR)

Um modelo auto-regressivo é definido de maneira que os valores da

série no tempo t dependem dos valores passados. Mais especificamente o modelo

autoregressivo de orem p AR(p) é

, 1 1 2 1 1

∑

= − − − − + + + = + + = p j t j t j t p t p t t t c X X X X X φ φ L φ ε φ ε

onde a série {εt} é ruído branco1 com média zero e E[Xtεt+s] = 0, para s>0. Escrevendo a equação (1.12) em termos do polinômio do operador de defasagem B

tem-se que

( )

B X_t c ε_t .

φ = +

O polinômio φ(B) de ordem p é chamado de polinômio AR e tem-se que

( )

1 2 . 2 1 p pB B B B φ φ φ φ = − − −L−

Para que a condição de estacionariedade para modelos AR(p) seja (1.11)

(1.12)

(15)

satisfeita é necessário que as raízes do polinômio φ(B) estejam foram do círculo unitário (no plano complexo). Para um modelo AR(1),

,

1

1 t t

t c X

X = +φ ₋ +ε

a condição de estacionariedade é satisfeita quando |φ |<1.

Assumindo que a condição de estacionariedade está satisfeita, a média

do processo AR(p) é obtida tomando os valores esperados em (1.12),

, ... 2 1µ φ µ φ µ φ µ =c+ + + + p ou ainda,

(

p

)

c φ φ φ µ − − − − = L 2 1 1

As autocovariâncias são calculadas multiplicando-se ambos os lados de (1.14) por

(Xt-j - µ) e tomando os valores esperados,

. 0 , , 2 , 1 , 2 1 1 1 1

{

₊+ ₊+ ₊ = ₌ = − − h h p p p h p h h φ γ φ γ σ γ φ γ φ γ L L L

A autocorrelação é obtida dividindo-se a equação (1.15) por γ0,

L L , 1,2, 1 1 + + = = h₋ p h₋p h h φ ρ φ ρ ρ

As p equações obtidas de (1.16) são denominadas de equações de Yule-Walker e

podem ser escritas na forma matricial como

, ñ=Pö onde

(

)

′ ₌

(

)

′ = 1 ö 1 2 p ñ ρ ,ρ₂,L,ρ_p , φ ,φ ,L,φ (1.15) (1.16) . (1.14)

(16)

e               = − − − − − 1 1 1 3 2 1 2 1 1 1 2 1 K M M M K K p p p p p ρ ρ ρ ρ ρ ρ ρ ρ ρ P . Então, ñ, P ö = −1

de forma que os parâmetros auto-regressivos podem ser expressos como uma

função das p autocorrelações [Mills, 1990].

O comportamento da função de autocorrelação de um processo

auto-regressivo é uma mistura de decaimento exponencial e/ou decaimento senoidal. Se

as raízes da equação auto-regressiva forem reais, então as autocorrelações

decairão exponencialmente. Caso as raízes sejam complexas, o decaimento será na

forma senoidal [Granger & Newbold, 1986].

2.1.4.1 - A função de autocorrelação parcial (PACF)

Em um processo AR(1), Xt e Xt-2 são correlacionados, mesmo que Xt-2

não apareça diretamente no modelo. O valor da correlação entre Xt e Xt-2 (i.e., ρ2) é igual à correlação entre Xt e Xt-1 (ρ1) multiplicada pela correlação entre Xt-1 e Xt-2 (ρ1), de forma que ρ2 = ρ12. Assim, toda essa correlação “indireta” está presente na ACF

(17)

(PACF) como a seqüência de correlações entre (Xt e Xt-1), (Xt e Xt-2), (Xt e Xt-3) e assim por diante, desde que os efeitos de defasagens anteriores sobre Xt

permaneçam constantes [Hill, Griffiths & Judge, 1999]. A PACF é calculada como o valor do coeficiente φkk na equação

. 2 2 1 1 t k t kk t k t k t X X X e X =φ ₋ +φ ₋ +L+φ ₋ +

O coeficiente φkk é obtido das equações de Yule-Walker aplicadas a (1.17). Tais equações são dadas por (1.16) e, substituindo p = k e φi = φii, tem-se

[Mills, 1990] . 1 1 1 1 1 1 2 1 2 3 1 1 2 1 1 2 1 2 3 1 1 2 1 ρ ρ ρ ρ ρ ρ ρ ρ ρ ρ ρ ρ ρ ρ ρ ρ ρ ρ ρ φ L M M L M M L L L M M L M M L L − − − − − − − − − − = k k k k k k k k k k k kk

Assim, para um processo AR(p) não há correlação entre Xt e Xt-k para

k > p [Mills, 1990]. Então, todos os valores de φkk para k > p são zero e a PACF para

um processo AR(p) puro apresenta um “corte” para zero para defasagens maiores

que p [Enders, 1995].

Assim, pode-se resumir que um processo AR(p) é descrito por:

- possuir uma função de autocorrelação, ACF, que é uma

combinação de decaimentos exponenciais e senoidais e tamanho (1.17)

(18)

infinito; e

- possuir uma função de autocorrelação, PACF, que é zero para

defasagens maiores que p.

2.1.5 - O modelo de médias móveis (MA)

O modelo de médias móveis de ordem q, MA(q), é dado pela forma

, 1 , 0 0 2 2 1 1

∑

= − − − − + + + = + ≡ + + = q j j t j q t q t t t t X µ ε θ ε θ ε L θ ε µ θ ε θ

onde {εt} é ruído branco com média zero. Alternativamente,

( )

_t ,

( )

1 ₁ _q q,

t B B B B

X =θ ε θ = +θ +L+θ

onde θ(B) é o polinômio do operador de defasagem B. Um processo MA(q) é dito ser invertível se as raízes de 0 1 2 2 1 + + + = + q qz z z θ θ θ L

se encontrarem fora do círculo unitário.

As autocovariâncias de ordem superior são

(

t

)

(

t j

) (

t t q t q

)(

t j t j q t j q

)

j = E X −µ X − −µ =E ε +θε− + +θ ε− ε− +θε − − + +θ ε− −

γ ₁ ₁ L ₁ ₁ L

e, como os termos envolvendo produtos de ε´s em diferentes instantes de tempo têm valor esperado zero, para j > q, γj = 0, seguindo que

(

)

2 , 1,2, , , 1 1 1 j q q j j q j = θ +θ +θ +L+θ θ − σ = L γ . , 0 j q j = > γ

Dessa feita, para um processo MA(q) a ACF apresenta um “corte” para zero para (1.18)

(19)

defasagens maiores que q [Mills, 1990]. A função de autocorrelação parcial de um

processo MA(q) possui tamanho infinito [Mills, 1990].

Pode-se resumir que um processo MA(q) é descrito por:

- possuir uma ACF que é zero para defasagens maiores que q; e

- possuir uma PACF que é uma combinação de decaimentos

exponenciais e senoidais e tamanho infinito.

2.1.6 - O modelo auto-regressivo de médias móveis (ARMA)

Um processo ARMA(p,q) é uma generalização dos modelos AR(p) e

MA(q), sendo definido como

q t q t t t p t p t t t c X X X X = +φ₁ ₋₁ +φ₂ ₋₂ +L+φ ₋ +ε +θ₁ε ₋₁ +θ₂ε ₋₂ +L+θ ε ₋ ou ainda na forma polinomial

( )

B X_t c θ

( )

Bε_t.

φ = +

A série temporal {Xt} é estacionária se e somente se as raízes de φ(z) estiverem fora do círculo unitário. A série temporal {Xt} é invertível se e somente se as raízes de θ(z) estiverem fora do círculo unitário. Para os modelos ARMA, as funções de autocorrelação (ACF) e autocorrelação parciais (PACF) decaem até o

infinito em vez de apresentarem um “corte” em alguma defasagem particular, como

ocorre com os processos AR e MA puros [Mills, 1990]. Assim, para um processo

ARMA(p,q), a ACF decairá, seja diretamente ou oscilando ao redor de zero, a partir (1.20)

(20)

da defasagem q. Por sua vez, a PACF decairá, seja diretamente ou oscilando ao

redor de zero, a partir da defasagem p [Enders, 1995].

2.1.7 - O modelo auto-regressivo integrado de médias móveis (ARIMA)

Se d for um número inteiro não-negativo, então uma série temporal {Xt}

é dita ser um processo ARIMA(p,d,q) ou um processo integrado de ordem d se

(

)

t d t d t B X X Y = 1− =∆

for um processo ARMA(p,q) causal [Brockwell & Davis, 1996]. Um processo

integrado é utilizado para séries não-estacionárias.

Assim, um modelo ARMA(p,q) é um modelo ARIMA(p,0,q).

Alternativamente, {Xt} deve satisfazer

( ) (

[1

)

t ]

( )

t, d B X B B µ θ ε φ − − =

onde {εt} é ruído branco com média zero, φ(B) e θ(B) são polinômios de ordem p e q, respectivamente, φ(B) é um operador estacionário, µ é a média de ∆d

Xt e d é a ordem de diferenciação. A ordem de diferenciação será 0 ou 1 para a maioria dos

processos e raramente d = 2 [Granger & Newbold, 1986].

2.1.8 - O modelo sazonal auto-regressivo integrado de médias móveis (SARIMA)

Suponha uma série temporal sazonal não-estacionária {Xt} observada s (1.21)

(21)

períodos por ano, de maneira que s = 4 para séries trimestrais e s = 12 para séries

mensais. Uma forma de remover a sazonalidade da série e transformá-la em uma

série estacionária {Zt}, para que um modelo ARIMA possa ser empregado, é efetuar

uma diferenciação sazonal, nos moldes da diferenciação vista anteriormente. Assim,

(

1 s

)

_t _t.

s t

t X B X Z

X − ₋ = − =

Contudo, em muitos casos é necessário adicionar ao modelo uma modelagem de Zt

determinada por seu padrão sazonal, então

( )(

1

)

( )

t, s t D s s Z B X B B − =Θ Φ onde

( ) (

Bs = 1−Φ₁_sBs − −Φ_PsBPs

)

, Φ L

( ) (

1 1

)

. Qs Qs s s s B B B = +Θ + +Θ Θ L

Pela equação (1.22), nota-se que o padrão sazonal é aleatório entre os ciclos s

[Brockwell & Davis, 1996].

Se a sazonalidade da série Zt tiver sido filtrada, um modelo

ARIMA(p,d,q) regular pode representar Zt, assim

( )(

B 1 B

)

d X_t θ

( )

Bε_t, φ − = onde

( )

B

(

1 φ₁B φ_pBp

)

, φ = − −L−

( )

(

1 1

)

, q qB B B θ θ θ = + +L+

e {εt} é ruído branco com média zero.

Combinando (1.22) e (1.23), chega-se a classe de modelos sazonais (1.22)

(22)

multiplicativos ARIMA(p,d,q)x(P,D,Q) ou SARIMA,

( )

B

( )

Bs

(

1 B

)

d

(

1 Bs

)

DX_t θ

( )

B

( )

Bs ε_t,

φ Φ − − = Θ

onde {εt} é ruído branco com média zero. Nessa classe de modelos permite-se tanto a diferenciação regular quanto a diferenciação sazonal. Nota-se que a série

diferenciada pode ser representada usando tanto componentes auto-regressivos e

de médias móveis regulares quanto sazonais. Em geral, o valor para D é raramente

maior que um e os valores de P e Q não ultrapassam 2 [Brockwell & Davis, 1996].

O processo representado por (1.24) é causal se e somente se φ(B) ≠ 0 e Φ (B) ≠ 0, para | z | ≤ 1, ou seja, se as raízes do polinômios auto-regressivos se encontrarem fora do círculo unitário [Brockwell & Davis, 1996]. Um modelo particular

dessa classe de modelos é o chamado modelo “airline”, um modelo

SARIMA(0,1,1)(0,1,1).

A seguir, os modelos teóricos apresentados nessa seção serão

aplicados nas metodologias de previsão de alisamento exponencial e Box-Jenkins.

Tais metodologias utilizam conceitos e procedimentos diferentes para produzir

prognósticos de séries univariadas, que são séries que possuem somente um

conjunto de dados.

2.2- MÉTODOS DE PREVISÃO

Nesta seção, serão apresentados dois métodos de previsão. O primeiro

método, denominado de alisamento exponencial (exponential smoothing), é (1.24)

(23)

considerado um método automático de previsão e seu procedimento é bem simples.

O segundo método, denominado de metodologia Box-Jenkins, é um método de

utilização mais complexa que o anterior e emprega a classe de modelos

ARIMA/SARIMA em sua concepção.

2.2.1 - Alisamento exponencial

O alisamento exponencial é um procedimento geral para obtenção de

algoritmos de previsão automática que produz resultados relativamente acurados, de

maneira rápida e barata [Granger & Newbold, 1986].

A forma mais simples de alisamento exponencial é aquela para séries

temporais que não possuem sazonalidade nem tendência crescente ou decrescente.

O objetivo é estimar o “nível” (ou a “média”) presente da série e usar esse nível

como previsão de valores futuros. O nível da série no tempo t é estimado como

(

1−

)

₁+

(

1−

)

2 ₂+L,

+

= t t₋ t₋

t x x x

x α α α α α

com 0 < α < 1. Uma forma mais simples de cálculo é obtida substituindo t por t-1 e multiplicando os dois lados de (1.46) por (1-α), o que leva a

(

1−

)

₋₁.

+

= t t

t x x

x α α

A previsão de todos os valores futuros (fn,h), com h = 1, 2,. . ., é obtida utilizando-se a equação (1.26), i.e.,

.

,h n

n x

f =

Para se iniciar o algoritmo é necessário especificar um valor inicial, que usualmente

é [Granger & Newbold, 1986]

. x x =

(1.25)

(24)

O peso de cada termo é determinado pelo valor de α, a constante de suavização. A escolha dessa constante é feita de maneira que seu valor minimize a

soma dos erros quadrados [Janacek, 2001]. O erro de previsão é definido como

, 1 , 1 − − = t t t x f e

para t = 3, 4, ... , n. Então, a soma dos erros quadrados é dada por

(

)

. 3 2 1 , 1 3 2

∑

= − = − = = n t t t n t t x f e S

Caso a série temporal apresente tendência, a equação (1.26) não é

capaz de fazer previsões de movimentos crescentes ou decrescentes futuros. O

algoritmo de alisamento exponencial de Holt-Winters leva em consideração esses

movimentos e permite estimar também a inclinação atual da série.

O nível e a inclinação da série são dados, respectivamente, por

(

)(

)

(

) (

1

)

, , 1 1 1 1 1 − − − − − + − = + − + = t t t t t t t t T x x T T x x x β β α α

com 0 < α < 1 e 0 < β < 1, constantes de suavização. As previsões são obtidas supondo um acréscimo ou decréscimo continuado dado pela última estimativa de

inclinação; assim, . , , 4 , 3 , , x hT h n fnh = n + n = K Os possíveis valores iniciais do algoritmo são

. , 1 2 2 2 2 x x T x x − = =

Os valores para as constantes de suavização são obtidos como anteriormente, de

forma que seus valores minimizem a soma dos quadrados dos erros de previsão um (1.27)

(25)

passo à frente. O erro de previsão é dado por

(

₁ ₁

)

, 4,5, , . 1 , 1 x x T t n f x e_t = _t − _t₋ = _t − _t₋ + _t₋ = K Então, a soma dos erros quadrados é

(

)

. 4 2 1 , 1 4 2

∑

= − = − = = n t t t n t t x f e S

Se a série temporal contiver movimentos sazonais de período s, o

algoritmo de Holt-Winters precisa ser modificado para que a sazonalidade seja

estimada. Assim, o algoritmo de Holt-Winters sazonal é definido de modo que para

cada período seja necessário estimar um fator de sazonalidade, Ft. No instante t, a

última estimativa do fator de sazonalidade para o período é Ft-s (obtido do mesmo

período do ano anterior) [Cribari-Neto, 2000]. As equações para o nível, a inclinação

e para o fator de sazonalidade são, considerando que a sazonalidade seja aditiva,

(

) (

)(

)

(

) (

)

(

) (

1

)( )

, , 1 , 1 1 1 1 1 s t t t t t t t t t t s t t t F x x F T x x T T x F x x − − − − − − − + − = − + − = + − + − = γ γ β β α α

com 0 < α < 1 , 0 < β < 1 e 0 < γ < 1, constantes de suavização. As previsões são dadas por M K K , 2 , , 2 , 1 , , , , 2 , 1 , 2 , s s s h F hT x s h F hT x f s h t n n s h t n n h n + + = + + = = + + = − + − +

Considerando a sazonalidade multiplicativa, as equações para o nível,

a inclinação e para o fator de sazonalidade são, respectivamente,

(26)

(

)(

)

(

) (

)

(

1

)( )

, , 1 , 1 1 1 1 1 s t t t t t t t t t t s t t t F x x F T x x T T x F x x − − − − − − − +     = − + − = + − +     = γ γ β β α α

com 0 < α < 1 , 0 < β < 1 e 0 < γ < 1, constantes de suavização. As previsões são dadas por

(

)

(

)

. , 2 , , 2 , 1 , , , , 2 , 1 , 2 , M K K s s s h F hT x s h F hT x f s h t n n s h t n n h n + + = + = = + = − + − +

Os possíveis valores iniciais do algoritmo podem ser [Brockwell & Davis, 1996]

(

)

( )

(

1

)

, 1, , . , , 1 1 1 1 1 1 s i i T x x F s x x T x x s i i i s s s s K = − + − = − = = + + + + +

Tanto para a sazonalidade aditiva quanto para a sazonalidade

multiplicativa, os valores das constantes de suavização são calculados de forma a

minimizar a soma dos quadrados dos erros de previsão um passo à frente. O erro de

previsão é

(

1 1

)

, 14,15, , . 1 , 1 x x T F t n f x et = t − t− = t − t− + t− + t−s = K Então, a soma dos erros quadrados é

(

)

. 14 2 1 , 1 14 2

∑

= − = − = = n t t t n t t x f e S

As formas aditivas e multiplicativas do algoritmo de Holt-Winters

sazonal podem fornecer previsões bem diferentes. Se a série apresentar oscilações (1.29)

(27)

sazonais aproximadamente constantes, o modelo aditivo é mais indicado. Porém, se

as oscilações sazonais forem proporcionais ao nível da série, o modelo multiplicativo

é mais indicado. Alternativamente, pode-se utilizar os dois procedimentos e escolher

aquele que fornece a menor soma dos erros de previsão um passo à frente ao

quadrado [Cribari-Neto, 2000].

2.2.2 - Método de Box-Jenkins

Dada uma série temporal não-sazonal não-estacionária {Xt}, considere

que ela possa ser representada por um modelo da classe ARIMA(p,d,q),

( )(

B 1 B

)

dX_t θ

( )

Bε_t, φ − = onde

( )

(

1 1

)

, p pB B B φ φ φ = − −L−

( )

(

1 1

)

. q qB B B θ θ θ = + +L+

O objetivo da metodologia de Box-Jenkins [Box & Jenkins, 1970] é

encontrar um modelo estocástico linear da classe ARIMA que possa ter gerado {Xt} e

que esse modelo possa ser utilizado para fornecer previsões de valores futuros da

série [Granger & Newbold, 1986]. Caso a série temporal {Xt} apresente

sazonalidade, {Xt} pode ser representada por um modelo da classe

SARIMA(p,d,q) (P,D,Q), conforme a equação (1.24).

A estratégia de modelagem, tanto para modelos sazonais quanto para

(28)

(i) identificação do modelo;

(ii) estimação do modelo; e

(iii) verificação de diagnóstico.

A etapa de identificação consiste em selecionar valores para p, d, q e

P, D, Q (no caso de modelos sazonais). Essa etapa envolve subjetividade e

julgamento pessoal. Na etapa de estimação, os coeficientes identificados na etapa

anterior são estimados usando técnicas estatísticas. A última etapa indica se o

modelo identificado e estimado descreve adequadamente o comportamento dos

dados da série {Xt}. Caso o modelo não seja adequado, o ciclo deve começar

novamente [Cribari-Neto, 2000].

Um conceito importante nessa metodologia é o princípio da parcimônia

[Enders, 1995]. Tal princípio sugere que modelos mais simples, com poucos

parâmetros, produzem melhores previsões que modelos superparametrizados. Um

modelo parcimonioso ajusta bem os dados sem incorporar coeficientes inúteis. O

objetivo é se aproximar do processo gerador original dos dados e não descrevê-lo

exatamente [Enders, 1995].

2.2.2.1 - Identificação

Essa etapa é considerada a mais difícil e delicada, e não há consenso

sobre qual a melhor estratégia a ser seguida [Granger & Newbold, 1986]. Dentre as

(29)

autocorrelação e autocorrelação parcial amostrais, e o uso de um critério de seleção

de modelos.

Para utilizar a primeira estratégia é necessário reconhecer modelos

AR, MA e ARMA por meio das características da ACF e da PACF. A Tabela 2.1

resume as propriedades da ACF e da PACF para diversos modelos ARIMA [Mills,

1990]. Para modelos sazonais, o comportamento da ACF e da PACF deve ser

analisado também próximo da defasagem sazonal, por exemplo, defasagem 12 para

dados mensais e defasagem 4 para dados trimestrais. A Tabela 2.2 resume as

propriedades da ACF e da PACF para modelos SARIMA [Bowerman & O’Connell,

1987].

Tabela 2.1 - Propriedades da ACF e da PACF para vários modelos ARIMA

Modelo ACF PACF

(1,d,0) Decaimento exponencial ou oscilatório

φkk=0 para k > 1

(2,d,0) Decaimento exponencial ou_senoidal φkk=0 para k > 2 (p,d,0) Decaimento exponencial e/ou_senoidal φkk=0 para k > p

(0,d,1) ρk = 0 para k > 1 Dominado por decaimento_exponencial (0,d,2) ρk = 0 para k > 2 Dominado por decaimento_{exponencial ou senoidal}

(0,d,q)

ρk = 0 para k > q Dominado pela combinação

linear de decaimento exponencial e/ou senoidal

(1,d,1)

Decaimento exponencial a partir da defasagem 1

Dominado por decaimento exponencial a partir da defasagem 1

(p,d,q)

Decaimento exponencial e/ou senoidal depois da defasagem q-p

Dominado por decaimento exponencial ou senoidal depois da defasagem q-p

(30)

Tabela 2.2 - Propriedades da ACF e da PACF para modelos SARIMA

Modelo ACF PACF

(P,D,0) Decaimento Picos nas defasagens s, 2s, ...Ps e corte após Ps

(0,D,Q) Picos nas defasagens s, 2s, ...Qs e corte após Qs

Decaimento

(P,D,0) ou (0,D,Q)

Picos nas defasagens s, 2s, ...Qs e corte após Qs

Picos nas defasagens s, 2s, ...Ps e corte após Ps (P,D,0) e (0,D,Q) Decaimento rápido na defasagem sazonal Decaimento rápido na defasagem sazonal Nenhum operador sazonal

Valores pequenos em todas as defasagens sazonais (não há picos)

Além de identificar os valores para p e q (e os valores de P e Q para

modelos SARIMA), o grau de diferenciação da série (valor d e valor D para modelos

sazonais) precisa ser conhecido. Para tanto, utiliza-se também a inspeção da ACF e

da PACF amostrais. Para um modelo não-sazonal, um comportamento suave

persistente nas autocorrelações amostrais em defasagens altas indica

não-estacionariedade, i.e., necessidade de diferenciação. Assim, deve-se diferenciar a série para sucessivos valores positivos de d e examinar o correlograma de {∆d

Xt} [Cribari-Neto, 2000].

A segunda estratégia para identificar os valores de p, d, q é utilizar um

critério de informação que selecione os modelos por meio de um conjunto de

“regras” [Mills, 1990]. Os critérios de seleção para modelos ARIMA mais utilizados

são o AIC (Akaike information criterion), o AICC (Akaike information criterion

corrected) e o BIC (Bayesian information criterion). Esses critérios incorporam um termo de penalidade para o aumento do número de parâmetros (p e q) no modelo,

(31)

de forma que modelos mais “parcimoniosos”, ou seja, com o menor número de

parâmetros, sejam escolhidos. As equações para esses critérios, sendo T o número

de observações, são [Cribari-Neto, 2000]

(

)

(

)

(

)

log , ˆ log 2 , 1 2 ˆ log 2 , 2 ˆ log 2 T q p L BIC q p T T q p L AICC q p L AIC + + − = − − − + + − = + + − =

onde L representa a verossimilhança maximizada.

O critério AIC superestima assintoticamente a ordem verdadeira do

modelo [Granger & Newbold, 1986] apresentando tendência a escolher modelos

superparametrizados [Cribari-Neto, 2000]. O AICC é uma versão corrigida do AIC

que incorpora uma correção de viés para amostras finitas, possuindo uma

penalidade mais forte para modelos de ordem elevada [Brockwell & Davis, 1996].

O BIC é um critério consistente, de forma que ele fornece estimativas

de p e q que convergem em probabilidade para os valores verdadeiros à medida que

T tende a infinito [Brockwell & Davis, 1996]. Já os critérios AIC e AICC não são consistentes. Por outro lado, o AIC é assintoticamente eficiente para modelos

puramente auto-regressivos.

Na prática, a seleção de modelos é feita calculando o valor do critério

(o BIC, por exemplo) para todos os modelos ARIMA associados aos valores de p, d

e q de forma que p,q =0,1,2,3,4,5 e d =0,1. Assim, seleciona-se o modelo que

apresenta o menor valor do BIC e modelos alternativos cuja diferença para o valor ^

(32)

mínimo do BIC seja inferior a 2 [Brockwell & Davis, 1996]. Para a modelagem

SARIMA, a quantidade de modelos investigados é maior, pois além dos valores de

p, d e q, deve-se incluir ainda os valores para P,Q = 0,1,2 e D = 0,1. Porém, os

modelos são selecionados pelos mesmos critérios que os utilizados para os modelos

ARIMA.

2.2.2.2 - Estimação

Assumindo que um modelo ARIMA da forma

(

)

(

)

(

)

t q q t d p pB B X B B B φ θ θ ε φ − − − = + + + − ₁ L 1 1 ₁ L 1

seja escolhido conforme a etapa anterior, o objetivo agora é estimar, utilizando o

método de máxima verossimilhança (ML)2, os parâmetros φφ = (φ1,...,φp)´, θθ = (θ1,...,θq)´ e σ2, a variância de εt.

A estimação da ML é difícil e geralmente requer muito tempo de

processamento computacional. Desta forma, existem alternativas que aproximam a

função de máxima verossimilhança. Duas dessas alternativas são o MQE (mínimos

quadrados exatos) e o MQC (mínimos quadrados condicional). Contudo, alguns

estudos têm sugerido [Ansley & Newbold, 1980] que o método de máxima

verossimilhança é superior aos demais.

Para a modelagem SARIMA o procedimento é idêntico ao mostrado

para a modelagem ARIMA, com a superioridade da estimação por máxima

(33)

verossimilhança sendo ainda mais pronunciada para modelos sazonais [Ansley &

Newbold, 1980].

2.2.2.3 - Verificação de diagnóstico

A correta especificação de um modelo ARIMA ou SARIMA é verificada no termo εt, pois ele deve constituir um processo ruído branco [Granger & Newbold, 1986]. Assim, a verificação da adequabilidade do modelo é efetuada nas autocorrelações amostrais dos erros (εt), as quais seguem assintoticamente uma distribuição normal, com média zero e desvio padrão n- ½, se forem provenientes de um ruído branco. Como os erros verdadeiros (εt) não são conhecidos, a inferência baseia-se nas estimativas dos erros, os resíduos εt.

Dessa forma, se o modelo estiver corretamente especificado, os

resíduos não devem apresentar correlação serial, pois toda a dinâmica dos dados já

foi capturada pelo modelo [Cribari-Neto, 2000]. A autocorrelação amostral dos

resíduos de ordem j é calculada como [Granger & Newbold, 1986]

( )

. ˆ ˆ ˆ ˆ 1 2 1

∑

= + = − = _T t t T j t j t t j r ε ε ε ε

Então, os valores das autocorrelações residuais devem estar contidos no intervalo

de confiança assintótico de 95% que é [Cribari-Neto, 2000]

     ₋ T T 2 , 2 ,

(34)

onde T indica o número de observações da série.

Em adição ao exame das autocorrelações individuais dos resíduos um

teste conjunto das primeiras m autocorrelações pode ser utilizado, que é conhecido

por teste Ljung-Box. Tal teste “portmanteau” compara o valor de

(

) (

)

j

( )

j m j r j T T T Q 2 2 εˆ 1 1

∑

= − − + =

com valores tabulados da distribuição do χ2_{(qui-quadrado) com (m - p - q) graus de} liberdade e com a rejeição da hipótese nula (de que o modelo é adequado) para

valores de Q maiores que o valor crítico assintótico [Granger & Newbold, 1986]. O

valor de m deve ser pelo menos igual a √T [Cribari-Neto, 2000].

2.3 - Métodos de comparação de previsão

Um dos métodos de escolha do melhor mecanismo de previsão é a

comparação dos valores previstos (Xt) com os valores observados da série (Xt), o

que caracteriza a acurácia ou a capacidade preditiva do mecanismo utilizado. Os

três métodos mais populares de medição da acurácia utilizam os resíduos em seus

cálculos [Kvanli et al.,1996]. Esses métodos são o desvio absoluto médio (MAD), o

erro quadrático médio (MSE) e o erro percentual absoluto médio (MAPE). Assim, os

resíduos são definidos como

. ˆ t t t X X e = −

O desvio absoluto médio (MAD) é definido como a média dos valores ^

(35)

absolutos de cada resíduo e é representado por

, n

e MAD=

∑

t

onde n é o número de valores previstos obtidos dos dados passados.

O erro quadrático médio (MSE) é a média dos valores quadráticos de cada

resíduo, assim . 2 n e MSE=

∑

t

O erro percentual absoluto médio (MAPE) considera o erro relativo de cada

previsão. O erro relativo em cada período t é definido como et /Xt. Então,

. n X e MAPE t t

∑

=

Não há consenso entre os estatísticos sobre qual método é preferível. Assim,

se erros elevados de previsão são inaceitáveis, então o uso do MSE faz-se

necessário. Entretanto, se é possível ignorar alguns erros elevados, o MAD funciona

melhor. E o MAPE é utilizado para comparar a acurácia (precisão) de duas séries

temporais diferentes [Kvanli, et al., 1996]. Dessa forma, o MSE será utilizado como

critério de acurácia para as comparações dos métodos de previsão apresentados

(36)

2.4 -

Softwares estatísticos

2.4.1 - O programa R

O programa R é um sistema para computação estatística e gráfica. Ele

provê, dentre outras coisas, uma linguagem de programação, ferramentas gráficas

de alto nível, interface com outras linguagens de programação e ferramentas para

depuração. O R é uma versão gratuita do programa S-PLUS comercializado pela

MathSoft, Inc. Essa plataforma possui várias qualidades. A primeira é ser um

programa gratuito e de livre distribuição. A segunda é permitir a criação de novas

funções e a possibilidade de modificação das funções internas. O R pode ser obtido

via Internet no endereço www.r-project.org e possui versões para os sistemas

operacionais Windows, Unix e Macintosh.

2.4.2 - O programa ITSM2000

O programa ITSM2000, diferentemente do R, é um programa

proprietário. Não há a possibilidade de alteração de suas funções, nem a

possibilidade de distribuição gratuita. O programa (versão Windows) acompanha o

livro “Introducion to Time Series and Forecasting” de Peter Brockwell & Richard

Davis. Trata-se de um programa simples e bastante intuitivo, baseado em escolhas

de menu e botões, seguindo o padrão dos programas para o sistema operacional

Windows.

(37)

completo, permitindo estimação de modelos ARIMA por máxima verossimilhança

exata [Cribari-Neto, 2000]. O critério de seleção de modelos utilizado no programa é

o AICC.

No próximo capítulo, o método de previsão utilizado no âmbito da

Secretaria da Receita Federal será descrito e detalhado. A descrição envolve a

formulação teórica do método, bem como os resultados obtidos na sua aplicação.

Os resultados mostrados neste capítulo restringem-se ao Imposto sobre a Renda e

(38)

3 - Análise do método de previsão utilizado

pela Secretaria da Receita Federal (SRF)

Este capítulo descreve sucintamente o método de previsão utilizado pela SRF,

mostra as previsões geradas por tal método e faz uma análise econométrica,

mostrando sua inadequabilidade como instrumento estatisticamente confiável de

previsão.

3.1 - Descrição do método de indicadores

O método utilizado no âmbito da SRF, denominado de indicadores, consiste

na multiplicação da arrecadação do período anterior por:

- um índice de preço que represente a variação inflacionária a que

está sujeito o fato econômico gerador da arrecadação;

- um índice de quantidade que represente a variação real desse fato

gerador;

- um índice que represente o efeito causado na arrecadação por

modificações na legislação tributária;

- outros índices que representem quaisquer influências na

arrecadação tributária.

(39)

(

1

)(

1

)(

1

)(

1

)

,

1 P Q L U

X

X_t = _t₋ +∆ +∆ +∆ +∆ onde

Xt = arrecadação prevista para determinado período do ano t; Xt-1 = arrecadação efetiva do mesmo período do ano t-1; ∆P = variação percentual do indicador de preços;

∆Q = variação percentual do indicador de quantidades;

∆L = variação percentual decorrente de alterações da legislação; normalmente significa variação de alíquotas;

∆U = variação percentual de qualquer outro indicador que tenha influência na arrecadação e não possa ser enquadrado nos indicadores básicos (preço,

quantidade e legislação).

Os termos (1+∆P), (1+∆Q) e (1+∆L) são denominados, respectivamente, Efeito-Preço, Efeito-Quantidade e Efeito-Legislação. O termo (1+∆U) representa o Efeito-Residual. A qualidade da previsão com a utilização desse método depende da

obtenção de bons indicadores de preço e quantidade específicos para cada caso

(tributo, setor econômico ou item de receita).

Os órgãos de pesquisa de preços e acompanhamento da conjuntura

econômica (IBGE, FGV, IPEA) são fontes importantes para se identificar quais os

índices de preço e quantidade melhor se adequam aos vários tributos. Na Tabela 3.1

estão relacionados alguns tributos e seus principais indicadores de preço e

quantidade.

(40)

A SRF mantém registro de séries históricas dos principais indicadores de

preços e algumas séries de quantidade. As projeções dos parâmetros

macroeconômicos (inflação, PIB, taxa de câmbio e taxa de juros) que influenciam os

diversos indicadores são elaboradas pela Secretaria de Política Econômica do

Ministério da Fazenda (SPE).

Tabela 3.1 - Tributos e seus indicadores de preço e quantidade INDICADORES ESPECÍFICOS TRIBUTO/CONTRIBUIÇÃO

PREÇO QUANTIDADE

Imposto de Importação Taxa de câmbio Volume de importações tributadas, em dólar IPI - Bebidas Índice de preços de bebidas Volume de vendas de bebidas ao

mercado interno IPI - Automóveis Índice de preços da indústria

automobilística

Volume de vendas de automóveis ao mercado interno Imposto de Renda Pessoa

Física - IRPF IGP - Índice Geral de Preços Número de contribuintes Imposto de Renda Pessoa

Jurídica - IRPFJ IGP - Índice Geral de Preços PIB Imposto de Renda Retido na

Fonte - IRRF - Trabalho Variação nominal de salários Nível de emprego Imposto de Renda Retido na

Fonte - IRRF - Capital Taxa de juros

Volume em R$ de aplicações financeiras

IOF - Imposto sobre operações financeiras

Variação nominal do volume de credito e prêmios de seguro (em R$)

COFINS IGP - Índice Geral de Preços PIB

3.2 - Resultados

Os resultados obtidos pela SRF com a utilização do método dos indicadores

para os componentes mais significativos da série do Imposto de Renda estão

mostrados na Tabela 3.2, juntamente com os valores reais da arrecadação, a

(41)

de acurácia MSE.

Tabela 3.2 - Previsão gerada pelo método dos indicadores

Série Imposto sobre a Renda - Agregado

Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Total

previsão 5.042 3.619 5.641 4.079 4.777 3.820 3.952 4.486 3.666 3.854 4.154 4.847 51.937

Real 5.156 4.206 5.718 4.713 4.113 4.261 4.937 4.619 4.375 4.825 4.705 6.546 58.174

∆∆% -2,22 -13,97 -1,35 -13,46 16,13 -10,34 -19,96 -2,88 -16,20 -20,12 -11,70 -25,95 -10,72

∆∆% média -10,17

MSE 585.247

Série Imposto de Renda Pessoa Física - IRPF

previsão 136 106 124 819 424 401 405 383 381 138 124 136 3.578

Real 209 159 173 829 407 334 371 336 334 182 226 194 3.754

∆∆% -35,09 -33,33 -28,14 -1,20 4,30 20,09 9,05 13,97 14,19 -23,96 -45,14 -30,04 -4,70

∆∆% média -11,28

MSE 3.062

Série Imposto de Renda Pessoa Jurídica - IRPJ

previsão 1.305 1.029 2.338 1.180 1.019 871 1.195 1.014 857 1.177 854 937 13.777

Real 1.519 1.629 2.652 1.501 963 1.013 1.866 1.285 1.111 1.901 1.159 1.592 18.191

∆∆% -14,11 -36,84 -11,82 -21,37 5,83 -13,99 -35,97 -21,07 -22,84 -38,09 -26,34 -41,12 -24,26

∆∆% média -23,14

MSE 188.725

Série Imposto de Renda Retido na Fonte - Rendimentos do Trabalho

previsão 1.370 1.302 1.454 1.052 1.557 1.219 1.222 1.528 1.236 1.246 1.723 2.072 16.980

Real 1.462 1.306 1.625 1.227 1.494 1.333 1.350 1.547 1.476 1.435 1.755 2.870 18.880

∆∆% -6,31 -0,32 -10,53 -14,29 4,20 -8,53 -9,49 -1,24 -16,24 -13,17 -1,80 -27,82 -10,06

∆∆% média -8,80

MSE 69.494

As Figuras 3.1, 3.2, 3.3 e 3.4 mostram o gráfico da série temporal do imposto,

somente para o ano de 1999, em preto, o valor da arrecadação real no ano de 2000

em azul e o valor da previsão para o ano de 2000 em vermelho pontilhado, para

cada um dos impostos constantes na Tabela 3.2. Todos os valores da arrecadação

(42)

Figura 3.1 - Gráfico do valor real e da previsão gerada

(43)

Figura 3.3 - Gráfico do valor real e da previsão gerada

(44)

3.3 - Análise econométrica

Considere novamente a equação que descreve o método dos indicadores

(

1

)(

1

)(

1

)(

1

)

.

1 P Q L U

X

X_t = _t₋ +∆ +∆ +∆ +∆

Substituindo o resultado da multiplicação dos índices entre parênteses por uma

constante ct, a equação (3.2) fica

. 1 − = t t t c X X

Caso ∆P, ∆Q, ∆L e ∆U sejam simultaneamente zero, ou seja, não ocorram alterações percentuais em nenhum dos índices, o valor de ct em (3.3) será igual a 1

e a previsão será igual ao último valor observado. Caso um dos índices apresente

variação percentual positiva, por exemplo ∆P = 10%, ceteris paribus, o valor de ct em (3.3) será igual a 1,1. Caso a variação percentual seja negativa, por exemplo ∆P = -10%, ceteris paribus, o valor de ct em (3.3) será igual a 0,9. Assim, ct pode assumir, dependendo do sinal da variação percentual, valores maiores ou menores que 1.

Generalizando, caso haja variações positivas e negativas simultâneas em todos os

índices, o valor de ct na equação (3.3) pode assumir valores maiores ou menores

que zero.

A equação (3.3) assemelha-se a uma estrutura AR(1), conforme mostra a

equação (1.12), a menos do termo de erro εt e do fato que em (3.3) ct varia com t. Assim, o método dos indicadores deve ser considerado como uma representação de

um modelo auto-regressivo de ordem 1 uma vez que Xt-1 representa a arrecadação

efetiva no período anterior.

(3.3) (3.2)

(45)

Contudo, além de não conter um termo residual, o método dos indicadores

falha em reproduzir um AR(1) ao possibilitar que o valor de ct possa assumir

qualquer valor diferente de zero. E, como já foi visto, todo processo auto-regressivo

de ordem 1 que apresenta o valor absoluto de sua raiz como maior que 1 não pode

representar um processo estacionário. Então, não há perda alguma em se desconsiderar processos AR(1) com |φ1 | > 1 [Brockwell & Davis, 1996].

Desta maneira, o método dos indicadores utilizado pela Secretaria da Receita

Federal não está reproduzindo um processo auto-regressivo causal, estacionário.

Suas previsões não são confiáveis, uma vez que as condições básicas de

estacionariedade não são satisfeitas. Por isso, tal método deveria ser abandonado

em prol de alguma outra metodologia mais adequada.

Tal metodologia pode ser alguma das que serão mostradas no próximo

capítulo, que inicia-se com uma análise exploratória da série agregada do Imposto

sobre a Renda. Depois, as metodologias de previsão por alisamento exponencial e

modelagem SARIMA serão empregadas para essa série e os resultados das

(46)

4 - Análise e previsão da série temporal do

Imposto sobre a Renda (IR)

Este capítulo começa com considerações gerais sobre a série temporal do IR e suas

especificidades na utilização desse trabalho. A seguir, são empregadas as

metodologias de previsão de Holt-Winters sazonal e Box-Jenkins para a obtenção de

valores futuros para a série do IR.

4.1 - Considerações gerais

O Imposto sobre a Renda foi escolhido para a análise nesse trabalho devido a

sua importância na arrecadação federal. De acordo com a Tabela 4.1, verifica-se

que esse imposto correspondeu a mais de 30% tanto das receitas administradas

pela SRF quanto do total arrecadado pela União Federal no ano de 2000 (em

valores nominais).

Existem dados mensais da série histórica do Imposto de Renda, assim como

de todos os tributos federais, desde janeiro de 1986. Dessa forma, há mais de 180

observações na série temporal. Apesar de ser um número razoável de observações,

deve-se considerar as inúmeras mudanças econômicas ocorridas no Brasil desde

então para se utilizar todos esses dados em uma análise econométrica. Assim,

neste trabalho optou-se por utilizar os dados disponíveis após a implementação do

(47)

Tabela 4.1 - Participação do Imposto sobre a Renda na arrecadação total da SRF - 2000

Imposto R$ - milhões % - administradas % - arrecadação

Imposto sobre a Importação 8.510,1 5,12 4,83

Imposto sobre a Exportação 2,5 0,00 0,00

Imposto sobre Produtos Industrializados 18.839,1 11,33 10,70

Imposto sobre a Renda 56.396,6 33,92 32,04

I.O.F. - Imposto s/ Operações Financeiras 3.126,7 1,88 1,78 I.T.R. - Imposto Territorial Rural 267,0 0,16 0,15 CPMF - Contrib. Movimentação Financeira 14.544,6 8,75 8,26 Cofins - Contribuição Seguridade Social 39.903,2 24,00 22,67 Contribuição para o Pis/Pasep 10.043,0 6,04 5,71 CSLL - Contribuição Social s/ Lucro 9.278,0 5,58 5,27 Contrib. p/ Plano Seg. Social Servidores 3.626,6 2,18 2,06

Contribuição para o Fundaf 372,4 0,22 0,21

Outras Receitas Administradas 1.350,3 0,81 0,77

Receitas de Loterias 951,6 0,57 0,54

Demais 398,7 0,24 0,23

Receitas Administradas pela SRF 166.260,10 100,00 94,45

Total da Arrecadação Federal 176.020,60 100,00

Fonte: Secretaria da Receita Federal - MF

Desta maneira, os dados analisados foram divididos em duas partes. A

primeira parte corresponde aos valores observados a partir de julho de 1994 até o

mês de dezembro de 1999. Esses dados serão utilizados pelos métodos de

alisamento exponencial e de Box-Jenkins para prever os dados conhecidos da

segunda parte, os valores da arrecadação do ano de 2000. A medida de acurácia de

previsão empregada será o MSE. A seguir, será feita uma análise exploratória sobre

a série do Imposto de Renda.

4.2 - Análise exploratória

O Imposto de Renda possui a seguinte classificação: IRPF - Pessoa Física,

IRPJ - Pessoa Jurídica, IRRF - Retido na Fonte. O IRRF apresenta ainda quatro

(48)

para o Exterior e Outros Rendimentos

Desta maneira, oito séries distintas de dados precisam ser analisadas. Para

simplificação e para evitar repetição de procedimentos, somente a série agrupada do

imposto será descrita e analisada detalhadamente. Para as séries do IRPF , do IRPJ

e do IRRF - Rendimentos do Trabalho, somente os resultados serão apresentados.

A série do imposto de renda {IR} analisada possui 66 observações e seu

gráfico é apresentado na Figura 4.1 em milhões de reais. Os dados foram ajustados

pelo índice de preços IGP-DI divulgado pela Fundação Getúlio Vargas em janeiro de

2000, com base em junho de 2000. Assim, os dados são expressos em reais de

junho de 2000 e podem ser interpretados como a preços constantes, sem centavos.

A Tabela 4.2 mostra os valores em milhões de reais das observações da série {IR}.