• Nenhum resultado encontrado

Análise comportamental de consumidores brasileiros: fatos estilizados por estratificação social e aplicações em modelos de projeção macro

N/A
N/A
Protected

Academic year: 2020

Share "Análise comportamental de consumidores brasileiros: fatos estilizados por estratificação social e aplicações em modelos de projeção macro"

Copied!
56
0
0

Texto

(1)

Escola de Pós-Graduação em Economia

Mestrado em Finanças e Economia Empresarial

Análise comportamental de consumidores brasileiros: fatos

estilizados por estratificação social e aplicações em modelos de

projeção macro

Vitor Vidal Velho

Rio de Janeiro

2016

(2)

Análise comportamental de consumidores brasileiros: fatos

estilizados por estratificação social e aplicações em modelos de

projeção macro

Dissertação apresentada à Escola de Pós-Graduação em Economia da Fundação Getulio Vargas, como requisito parcial para obtenção do grau de Mestre em Finanças e Economia

Empresarial.

Campo de conhecimento: Macroeconomia

(3)

Velho, Vitor Vidal Costa

Análise comportamental de consumidores brasileiros: fatos estilizados por estratificação social e aplicações em modelos de projeção macro / Vitor Vidal Costa Velho. – 2016.

55 f.

Dissertação (mestrado) - Fundação Getulio Vargas, Escola de Pós-Graduação em Economia.

Orientadora: Silvia Maria Matos. Inclui bibliografia.

1. Indicadores econômicos. 2. Previsão econômica. 3. Confiança do consumidor. 4. Incerteza. 5. Análise de componentes principais. I. Matos, Silvia Maria. II. Fundação Getulio Vargas. Escola de Pós- Graduação em Economia. III. Título.

(4)
(5)

Indicadores de sondagens produzidas pela FGV são informações econômicas divulgadas de forma relativamente rápida e utilizadas como “termômetro” do nível de atividade brasileira no curto prazo. A utilização do ICC (Índice de Confiança do Consumidor), assim como outros indicadores por dentro da sondagem, são tidas como antecedente ou coincidente em modelos de previsão do consumo das famílias e para as demais variáveis quantitativas oficiais. No entanto, o trabalho procura mostrar evidências de que nem sempre as informações ao nível agregado, possuem o melhor poder preditivo. O trabalho busca analisar o comportamento dos consumidores sob uma ótica mais desagregada da pesquisa a fim de obter maior correlação e robustez com as variáveis target. Existem evidências de que alguns grupos de consumidores conseguem fornecer melhores avaliações sobre determinado tema do que outros. Utilizando a técnica de componentes principais, extraímos o núcleo destes melhores indicadores desagregados para obter robustez nos cenários de previsão. Para complementar estas previsões, utilizaremos o indicador de dispersão das respostas como uma proxy de incerteza, na tentativa de compreender o lado subjetivo intrínseco às pesquisas de sondagem. A conclusão do artigo se dá através da análise dos fatos estilizados do comportamento destes grupos selecionados para cada caso.

(6)

Abstract

Survey indicators produced by FGV are economic information published relatively quickly and used as a "thermometer" of the Brazilian level of activity in the short term. The use of the Consumer Confidence Index (CCI), as well as other indicators within the survey, are taken as a antecedent or coincident in household consumption forecasting models and other official quantitative variables. However, the work seeks to show evidence that information at the aggregate level has not always the best predictive power. The work seeks to analyze the behavior of consumers under a more disaggregated view of the research in order to obtain greater correlation and robustness with the target variables. There is evidence that some consumer groups are able to provide better assessments on one topic than others. Using the Principal Component Analysis (PCA), we reduce the dimensionality of these better indicators to obtain robustness in the forecasting scenarios. To complement these predictions, we will use the indicator of dispersion of responses as an uncertainty proxy, in an attempt to understand subjectivity of survey data. The conclusion of the article is given through the analysis of the stylized facts of the behavior of these groups selected for each case.

(7)

Sumário

Capítulo I ... 7

1.1 Introdução ... 7

1.2 Relação entre indicadores em nível e incerteza ... 11

Capítulo II ... 13

2.1 Desenvolvimento da base ... 13

2.1.1 Descrição de Sondagem ... 13

2.1.2 Base de dados ... 15

2.2 Tratamentos das séries ... 16

2.2.1 Imputação de valores ... 16

2.2.2 Volatilidade dos indicadores ... 17

2.3 Construção dos indicadores ... 17

2.3.1 Processo de PCA (Principal Components Analysis) ... 18

2.3.2 Procedimento de pré-seleção das series temporais ... 20

2.3.3 Indicadores em nível de atividade ... 21

2.3.4 Indicadores de Incerteza ... 22

2.3.5 Sazonalidade dos indicadores ... 23

Capítulo III ... 24

3.1 Utilização de índice de confiança em modelos de previsão ... 24

3.2 Resultados ... 25

3.2.1 Vendas no Varejo Ampliado (PMC/IBGE) ... 25

3.2.2 Consumo das Famílias (Monitor do PIB/FGV) ... 29

3.2.3 Inadimplência de pessoa física – (BACEN) ... 33

Capítulo IX ... 38

4.1 Conclusões ... 38

Apêndice ... 39

(8)

Capítulo I

1.1 Introdução

Em economias de mercado cada vez mais dinâmicas, dados econômicos ganham relevância crescente na mídia, junto à população e principalmente entre os agentes econômicos. Hoje o PIB, soma de toda a riqueza do país, é o principal indicador do Brasil e divulgado trimestralmente pelo IBGE com cerca de 2 a 3 meses de defasagem para o trimestre de referência. Pela ótica da demanda, o Consumo das Famílias atualmente representa cerca de 60% do PIB brasileiro, maior participação entre os componentes do indicador-síntese.

A relevância de dispor de dados que consigam antecipar estas informações oficiais se dá em duas frentes. A primeira, na divulgação de dados mensais do IBGE, e a segunda em acesso a informações com maior rapidez de outras fontes econômicas. Indicadores como produção industrial e vendas no varejo, se comprometem com a primeira solicitação, tratam-se de dados mensais de grande importância, porém com defasagem um pouco grande, de cerca de 1 a 2 meses. Neste contexto, indicadores qualitativos relacionados à percepção das famílias, que mensuram a confiança dos consumidores, surgem como fortes candidatos a ocupar espaço cada vez maior na previsão do consumo das famílias, na segunda frente. Para esta temática, a Sondagem do Consumidor produzida pela FGV/IBRE é elencada como um dos termômetros da visão da população brasileira sobre o andamento da economia.

O intuito deste trabalho é apresentar o “primeiro sinal” do movimento ainda no mês corrente do que a variável target irá divulgar dentro de um período aproximado de 60 a 90 dias. Por exemplo; a divulgação do resultado do mês t da PMC Ampliada gira em torno do dia 14 do mês

t+2, enquanto as estatísticas de sondagem do mês t já estão disponíveis neste próprio mês t, e

são divulgadas geralmente em torno do dia 25. Os modelos benchmarks de variáveis mais correlacionadas, como a FENABRAVE e ABRAS, com a target PMC Ampliada, serão incorporadas num “segundo sinal” de previsão, porém com uma antecedência menor, como ilustra o exemplo abaixo. Portanto, o uso da tempestividade do uso de dados de sondagem é um trunfo para se cerca de informações com uma relevante antecedência em uma economia cada mais dinâmica e que demanda por informações mais precisas

(9)

Cronologia 1 - Tempestividade entre divulgação de séries para previsão

Exemplo: PMC Ampliada

Atualmente estes indicadores vem ganhando atenção da sociedade brasileira, seja na profusão dos dados na imprensa, ou nas contínuas citações em atas do Comitê de Política Monetária (COPOM), e até mesmo em debates políticos. Atualmente no Brasil, a literatura acerca de índices de confiança ainda é pequena, principalmente pelo pequeno número de observações trimestrais destes quando analisando contra o Consumo das Famílias. O ICC (Índice de Confiança do Consumidor) apresenta forte poder preditivo ao Consumo das Famílias (ver gráfico 1), segundo Graminho (2015), e quando inserido em modelos que são controladas por outras variáveis reais como renda, inflação ou taxa de juros apresenta significativo aumento da previsibilidade dentro da amostra.

Este trabalho tem por objetivo demonstrar que indicadores de sondagem através de perguntas qualitativas podem ter informações por especificidades da amostra da pesquisa passíveis de melhorar a previsão para o cenário macroeconômico do país a partir de determinadas perguntas. Seguindo uma análise de informações desagregadas, Malgarini et al. (2004) afirma que indicadores de determinados grupos sociais possuem características de consumo mais antecedentes. Desta forma, é possível construir indicadores-síntese seguindo o raciocino de Stock and Watson (2002) pelo método de componentes principais, haja vista que as possibilidades de se abrir os resultados da sondagem trazem um número elevado de séries que devem ser submetidas a um processo de redução. As aberturas são feitas a partir das perguntas nos questionários e dos subgrupos sociais com o fim de se obter uma previsão com menos ruídos que o usualmente utilizado ICC.

(10)

Gráfico 1 – Relação entre ICC e o Consumo das Famílias

Fonte: FGV e IBGE

O ICC é um índice composto de uma média aritmética de cinco perguntas do questionário da Sondagem do Consumidor, mas não apresenta necessariamente a melhor forma de previsão para qualquer variável macroeconômica da ótica da despesa. Seu índice tem o objetivo de mensurar apenas o conceito de confiança da população. A utilização de perguntas mais correlacionadas com variáveis de referência (target) é um dos trunfos para diminuir erros implícitos nos índices de confiança, ou de situação atual, ou de expectativas. Além disso uma maior estratificação social, aqui chamada de subgrupos, também considera as aberturas que acertam mais as suas avaliações, elencando assim os melhores indicadores para cada variável que se deseja prever. Por último, a necessidade de controle da subjetividade contida em pesquisas de sondagem se dá através da dispersão das respostas dos informantes, aqui denominadas de incerteza, que acrescentam informações aos modelos. A construção de indicadores em nível e a dos indicadores de incerteza, são realizadas a partir de uma pré-seleção dos melhores subgrupos que são agrupadas a partir de um processo de Componentes Principais afim de se extrair o núcleo comum a este conjunto de informações.

Os resultados mostram que a forma de analisar informações de sondagem sob o modo desagregado apresenta resultados melhores que as oficialmente divulgadas com todas as estratificações sociais da pesquisa. A outra abordagem do trabalho, baseado em Acemoglu et

(11)

tratar pelas dispersões nas respostas, utilizando a metodologia de Bachmann (2013) e denominando como incerteza econômica. Quanto maior a dispersão das respostas (mais incerteza) a atividade econômica se retrai. Os três exercícios propostos são fundamentais para o entendimento das percepções das famílias quanto ao ímpeto para os gastos.

A grande motivação deste trabalho é elaborar uma análise mais ampla acerca de variáveis econômicas da ótica das famílias, não só para consumo, mas também desemprego, vendas no varejo ou inadimplência. A utilização da percepção da população brasileira para prever o comportamento da atividade econômica é um tema cuja literatura vem ganhando fôlego nas últimas décadas. A utilização propriamente da Sondagem do Consumidor da FGV, é justificada por dois motivos, já que no Brasil há outros índices semelhantes: o primeiro é a sua ampla divulgação na mídia e aceitação no meio econômico (Atas do COPOM), e o segundo e mais importante é a utilização de todos os microdados de respostas de 2006 a 2015, permitindo assim um grau de abertura grande para explorações desta natureza.

(12)

1.2 Relação entre indicadores em nível e incerteza

Pesquisas econômicas têm mostrado a importância dos efeitos da incerteza para a atividade econômica. Para os Estados Unidos, as pesquisas associam a demora na recuperação da economia americana após a crise de 2007-2008 ao elevado nível de incerteza sobre a política econômica entre 2008 e 2011 segundo Baker et al. (2015), e como choques de incerteza afetam negativamente variáveis macroeconômicas como taxas de investimentos, desemprego e produção física. No Brasil, tornou-se comum atribuir resultados econômicos negativos a partir de 2010, representados pelo aumento da inflação e redução do crescimento, ao aumento da incerteza, seja com origem nas políticas econômicas adotadas ou de origem externa. Apesar dos argumentos confluírem para uma correlação negativa entre incerteza e atividade econômica, essa associação carece de suporte empírico, lacuna que esta pesquisa pretende colaborar em suprir.

A incerteza se diferencia do risco por não poder ser definida estatisticamente. Diante da incerteza, os agentes simplesmente não sabem o que vai acontecer — a distribuição de probabilidades é desconhecida —, ao passo que diante do risco as chances de diferentes resultados podem ser quantificadas, ou seja, a distribuição de probabilidades dos eventos é conhecida segundo Guerro-Quintana (2012). Apesar desta distinção nos conceitos, muitas vezes se assume que a volatilidade (risco) é uma boa aproximação da incerteza. A pesquisa de Bloom (2009) enfatizou a importância de se estudar os efeitos de choques nos segundos momentos (variâncias), em adição aos tradicionais choques nos primeiros momentos (médias). Haddow et al. (2013) apresenta os possíveis canais de transmissão da incerteza para a atividade econômica. Do lado da demanda, choques de incerteza podem resultar em aumento da poupança e redução do consumo, particularmente dos bens duráveis, mais sensíveis à confiança do consumidor. O investimento também pode ser afetado ou postergado em períodos de maior incerteza, assim como as decisões relativas à contratação de mão de obra por parte das firmas. O gráfico 2 é um primeiro exemplo entre a relação do nível de atividade econômica com a incerteza, e nota-se uma evidência de correlação claramente negativa entre as duas variáveis e sugere que, em tempos de crise, as famílias e as empresas tendem a revisar para baixo sua expectativa central do panorama econômico e ao mesmo tempo, anexar uma maior probabilidade de eventos extremos frente à tendência central. No exemplo citado a correlação fica mais fortemente negativa a partir de meados de 2014, quando a crise econômica se iniciou no Brasil. Bachmann (2013) reagiu a este fenômeno com a hipótese de "subproduto", segundo

(13)

a qual uma elevada incerteza pode ser uma consequência do fraco desempenho econômico, ao invés de sua força motriz.

Dado que a incerteza ou choque de “segundo momento” não é susceptível de ocorrer independentemente de choques para outros momentos, o choque de incerteza pode coincidir com choques no primeiro momento da distribuição (isto é, mudanças no nível de "confiança").

Gráfico 2 –Relação entre indicadores de Nível e de Incerteza

(Em médias móveis trimestrais)

Fonte: FGV

O gráfico acima ilustra a relação entre a confiança dos consumidores e a incerteza. Neste caso, a incerteza é calculada através da dispersão das respostas favoráveis e desfavoráveis. Para o exercício foi utilizado a média das respostas dos cinco quesitos que compõem o ICC. A correlação negativa (-0,56) evidencia que quanto maior a incerteza nas avaliações, menor o nível de confiança e vice-versa.

O trabalho é divido em quatro capítulos, o primeiro é esta introdução que contextualiza a motivação e em qual cenário se desenha a necessidade deste trabalho, e como será abordado; no segundo capítulo trata da base de dados e descrição da sondagem, o que existe, de como foi organizada a base, o terceiro apresenta os resultados e análise sobre os três exercícios propostos; vendas no varejo, consumo das famílias e inadimplência embasando o último capítulo de conclusão.

(14)

Capítulo II

Neste capítulo, será apresentada as principais informações dos dados da Sondagem do Consumidor, e está dividida basicamente em três grandes partes: a primeira sobre a descrição geral da metodologia da pesquisa, segundo como foram tratadas as séries para o trabalho; como a imputação de respostas e o nível de estratificação de séries desagregadas e por último a elaboração e construção dos indicadores utilizados.

2.1 Desenvolvimento da base

A Sondagem de Expectativas do Consumidor da FGV é uma pesquisa iniciada em setembro de 2005, mas para este trabalho serão utilizados dados a partir de janeiro de 2006. Além deste, há no Brasil mais dois indicadores de percepções dos consumidores conhecidos no Brasil; o INEC da CNI e o ICC da Fecomércio, de frequência trimestral até 2010 e com amostra apenas para a cidade de São Paulo, respectivamente. Abaixo há duas divisões de como foi trabalhada a base deste trabalho.

2.1.1 Descrição de Sondagem

A Fundação Getulio Vargas, através do Instituto Brasileiro de Economia (IBRE), produz sondagens de tendência econômica desde a década de 60, inicialmente com o setor da indústria e mais tarde com os setores de serviços, comércio e construção. Desde 2005, passou a divulgar mensalmente a Sondagem do Consumidor; pesquisa realizada com cerca de 2.000 consumidores das sete maiores capitais do Brasil. Sondagens de tendência são levantamentos estatísticos que geram informações de monitoramento do curto-prazo, devido à sua rápida

divulgação de resultados, que geralmente ocorrem na última semana do mês de coleta.

Além da rapidez com que as informações estatísticas são processadas e divulgadas, as

sondagens são reconhecidas pela versatilidade de seus questionários,

compostos majoritariamente por opções de resposta de natureza qualitativa. Por suas características, essas pesquisas podem ser moldadas de forma personalizada de acordo com o interesse de estudo.

O consumo em uma economia é determinado tanto pela capacidade quanto pela pré-disposição das pessoas para o gasto. Já a disposição de consumo é determinada pelas perspectivas futuras

(15)

da economia, sobretudo em relação a seus reflexos sobre o mercado de trabalho e a sua situação financeira. Quando o consumidor está satisfeito e otimista em relação ao futuro tende a gastar mais; quando está insatisfeito, pessimista, gasta menos. Desta forma, a confiança do consumidor atua como fator redutor ou indutor do crescimento econômico. O monitoramento do sentimento do consumidor tem o objetivo de produzir sinalizações de suas decisões de gastos e poupança futuras, constituindo indicadores relevantes na antecipação dos rumos da economia. Da Sondagem do Consumidor são extraídas cinco perguntas do questionário para calcular o conhecido ICC (Índice de Confiança do Consumidor), amplamente difundido como termômetro para o sentimento da população brasileira. Os cinco quesitos que compõem o ICC são:

a) Avaliação atual da economia

b) Expectativas para os próximos seis meses da economia c) Avaliação atual das finanças familiar

d) Expectativas para os próximos seis meses das finanças familiar e) Expectativas para compra de bens duráveis

Particularmente, este trabalho irá considerar as respostas (microdados) dos informantes desde janeiro de 2006 de mais seis quesitos, além dos citados acima, para assim ter uma visão mais ampla das perspectivas nos últimos dez anos.

f) Avaliação atual do Emprego

g) Expectativas para os próximos seis meses do Emprego h) Avaliação atual da Poupança

i) Intenção de compras de duráveis j) Intenção de Viagem

k) Expectativas para os próximos doze meses da Taxa de Juros

A amostra da Sondagem do Consumidor reproduz o perfil de consumo da população brasileira, e foi baseada na Pesquisa de Orçamentos Familiares (POF) do IBGE de 2002, e procura gerar informações gerais sobre hábitos de consumo, entre outros temas nos domicílios brasileiros. Desta forma, é possível obter informações quantitativas sobre a renda e o consumo das famílias (despesas) nas capitais brasileiras possibilitando definir, sobre a população alvo, uma amostra estratificada por faixas de renda e capitais de interesse, proporcionalizada pela participação do consumo das famílias em cada estrato. A amostra é composta por 2.045 consumidores, distribuídos em sete capitais (São Paulo, Rio de Janeiro, Belo Horizonte, Brasília, Porto Alegre e Salvador e Recife) e por quatro faixas de renda domiciliar. Estas faixas foram estimadas a

(16)

partir da POF 2002/2003 para se obter os quatro quartis de renda domiciliar da população destas sete capitais. O primeiro quartil que define o consumo dos primeiros 25% do consumo das famílias brasileiras é de renda até R$ 2.100,00, o segundo quartil que define a faixa de renda 2, compreende o intervalo entre R$ 2.100,01 e R$ 4.800,00; a renda 3 fica entre R$ 4.800,01 e R$ 9.600,00, e valores acima de R$ 9.600,00 definem famílias pertencentes à faixa de renda 4. (Apêndice - tabela 1)

O controle da pesquisa é feito por estes dois estratos, renda e capital. Porém, no questionário há classificação do respondente por idade, escolaridade, e sexo apesar destas categorias não serem obrigatórias. A dissertação apresenta resultados a partir de 2006, período a partir do qual começa a classificação de gênero.

2.1.2 Base de dados

A tratativa deste trabalho é se valer das desagregações da Sondagem do Consumidor a partir da utilização dos microdados da pesquisa, criando a possibilidade de estratificar ainda mais o perfil do consumidor brasileiro. O controle de informantes sugere cinco classificações:

a) Por capital

b) Faixa de renda domiciliar c) Escolaridade

d) Faixa etária e) Gênero

Das cinco características listadas, apenas três são obrigatórias a serem informadas para participar da sondagem (local, renda domiciliar e gênero), tornando possível criar 56 subgrupos socioeconômicos, que provêm da combinação das sete capitais, quatro faixas de renda e os dois gêneros. Como o desenho amostral é feito para calcular o poder de consumo dos brasileiros nas sete maiores capitais, pelos critérios de controle as características dos informantes não são parecidas com a população como um todo. A escolaridade é dividida em seis faixas, e o número de informantes com menor escolaridade é baixo. Já para faixa etária, observa-se um número relativamente maior de informantes com mais de 60 anos de idade. (Apêndice - tabela 2) A amostra de informante para os 56 estratos socioeconômicos é suficiente para os propósitos do trabalho. Alguns destes subgrupos contêm um número de informantes maior que outros, como por exemplo; um informante de São Paulo, de renda domiciliar 4 e homem é mais comum

(17)

do que um informante de Pernambuco de renda domiciliar 1 do sexo feminino. A heterogeneidade entre os subgrupos se dá através do desenho amostral das capitais, e não propriamente por renda ou gênero; dado que este são distribuídos em aproximadamente 25% para cada faixa de renda e 50% para gênero. A lista com os subgrupos socioeconômicos criados para este trabalho está no Apêndice - tabela 3.

A segunda etapa consiste na análise das onze perguntas elencadas para este trabalho. Todas são iniciadas em janeiro de 2006, e de natureza qualitativa, onde existe a possibilidade de mensuração das respostas qualitativas. Portanto para cada uma das onze perguntas há 56 séries temporais com os resultados de indicadores em nível, totalizando um painel de 616 resultados

de nível. Para cada um dos 6161 em nível (saldo respostas mais 100) há o seu par de incerteza

(dispersão das respostas), portanto além destes são somados mais 616 indicadores de incerteza totalizando uma base com 1.232 séries temporais.

Como os resultados são de janeiro de 2006 até dezembro de 2015 (10 anos de pesquisa), ou seja, 120 meses há, portanto, 147.840 séries. Metade de indicadores em nível e outra metade com os indicadores incerteza. Para a tabulação de quase 3 milhões de microdados, foi utilizado o software Stata13.

2.2 Tratamentos das séries

Como o número de séries se torna muito grande, existe a necessidade de algumas precauções para a consistência dos resultados. A seguir é listado todos os procedimentos adotados.

2.2.1 Imputação de valores

A análise de todo o painel de dados - por subgrupos, perguntas e periodicidade – resulta em 73.920 observações de indicadores em nível tabulados. Desde total, apenas 196 observações, ou seja, menos de 0,2% do total apresenta “não-respostas”, caso em que não houve nenhum informante de determinado estrato social para uma pergunta em determinado mês. Dado o pequeno volume deste problema, a solução matematicamente sugerida é mais simples. Trata-se da utilização da média aritmética dos resultados dos outros 55 subgrupos para aquela pergunta, naquele mês. Caso haja mais de uma imputação para ser feita no mesmo período, o cálculo é feito com o mesmo critério, se forem 2 imputações, estas se valem da média dos outros 54

(18)

subgrupos e assim por diante2. Desta forma, evita-se que respostas imputadas sejam discrepantes dos resultados dos seus pares, cabendo ressaltar que o modelo de imputação em que se utiliza a informação da própria série foi descartado devido à alta volatilidade que alguns indicadores apresentam, o que poderia agravar um problema de imputação de um dado espúrio. A mesma prática é realizada para imputar os resultados de incerteza como seus pares estratificados.

A vantagem de utilização da Sondagem do Consumidor produzida pela FGV é o acesso aos microdados para tratativas acadêmicas, que são ainda pouco exploradas no país.

2.2.2 Volatilidade dos indicadores

Indicadores em nível desagregado, apresentam volatilidade maior, possivelmente em função de uma amostra de respondentes menor. A opção de suavização por médias móveis surge como alternativa para diminuir a volatilidade, porém a proposta do trabalho é de obter a partir desses indicadores desagregados as melhores correlações com variáveis da economia real (target), para poder captar melhor os momentos de pontos de virada. Os indicadores da pergunta com as maiores correlações contra variável quanti, são selecionados para sofrerem o processo de PCA com intuito de se extrair o núcleo comum destes. Para cada uma das onze perguntas da base dados, existem 56 indicadores, e o número de séries pré-selecionadas é de 14, o que representa o primeiro quarto de indicadores mais bem correlacionados. A pretensão de obter este número de indicadores é que a amostra de respostas seja satisfatória. No apêndice há tabelas que mostram os coeficientes de variações das aberturas por perguntas, rendas, UF’s, gênero deste trabalho, amortizados por médias móveis de 12 meses. (Apêndice – tabelas 7, 8, 9, 10)

2.3 Construção dos indicadores

Os três indicadores criados para explicação das três variáveis quanti: vendas no varejo, consumo das famílias e taxa de inadimplência, sofreram, em linhas gerias, quatro transformações. Após a criação de séries em nível e de incerteza, houve uma pré-seleção com as melhores desagregações, uma extração de núcleo por PCA. Os procedimentos estão listados abaixo.

(19)

2.3.1 Processo de PCA (Principal Components Analysis)

Este trabalho foca em analisar as aberturas da sondagem, permitindo assim a possibilidade da criação de um grande número de indicadores as quais para uma interpretação mais robusta

necessitam ser reduzidas. O PCA3 (Principal Components Analysis) pretende estimar um

indicador composto que nos permita acessar o comportamento comum de vários grupos sociais. Baseado no método utilizado por Abberger (2014), o PCA é a principal ferramenta estatística para construção dos indicadores, baseado sempre na pré-seleção das séries a serem tratadas. O PCA substitui as variáveis originais por um número menor de variáveis que são função das variáveis originais. O PCA consiste na determinação de uma transformação ortogonal dos originais para um novo conjunto de variáveis não correlacionadas que são obtidas em ordem decrescente de importância. As novas variáveis, chamadas de componentes, são combinações lineares das variáveis originais. Em geral, as primeiras componentes chamadas componentes principais (em número menor do que o de variáveis originais) compreendem a maior parte da variação total no conjunto de dados original tal que a dimensionalidade efetiva dos dados pode ser reduzida.

O raciocínio geométrico da PCA é representado por uma nuvem de n pontos em um espaço multidimensional, com um eixo para cada um dos p vetores: o centroide dos pontos é definido pela média de cada vetor, e a variância de cada vetor é a média dos quadrados da diferença dos n pontos com relação à média de cada um.

𝑉𝑎𝑟𝑖â𝑛𝑐𝑖𝑎𝑖 = 1

𝑛 − 1∑ (𝑥𝑖𝑚− 𝑥̅𝑖)²

𝑛

𝑚=1

Onde o grau com que cada variável é linearmente correlacionada é representado pela sua covariância. 𝐶𝑖𝑗 = 1 𝑛 − 1 ∑ (𝑥𝑖𝑚− 𝑥̅𝑖)(𝑥𝑗𝑚− 𝑥̅𝑗) 𝑛 𝑚=1 Onde,

𝐶

𝑖𝑗

,

é a covariância das variáveis i e j.

(20)

𝑛

𝑚=1 , é o somatório de todos os objetos.

𝑥

𝑖𝑚, valor da variável i no objeto m.

𝑥̅

𝑖, média da variável i.

𝑥

𝑗𝑚, valor da variável j no objeto m.

𝑥̅

𝑗, média da variável j.

Cada variável sofre um ajuste para que sua média seja igual a zero. A construção da primeira componente principal, PC1, apresenta a maior variância possível, e o PC2, a segunda maior assim por diante. A covariância entre PC1 e PC2 é zero.

Cada eixo principal de um PC calculado é uma combinação linear das variáveis originais

𝑃𝐶𝑗 = 𝑎𝑖1𝑌1+ 𝑎𝑖2𝑌2+ ⋯ + 𝑎𝑖𝑛𝑌𝑛, onde 𝑎𝑖𝑗 , são os coeficientes para o fator i, multiplicado

pela variável j.

Gráfico 3- Ilustração das duas primeiras Componentes Principais (PC1 e PC2)

O indicador antecedente é obtido a partir da extração do primeiro componente principal da matriz de correlação do conjunto de variáveis pré-selecionadas. Espera-se que esse componente capture o núcleo comum compartilhado pelas variáveis pré-selecionadas. Por construção, o primeiro componente principal tem media zero e desvio padrão igual a raiz quadrada do maior autovalor da matriz de correlação.

(21)

Em suma, a extração de um núcleo comum faz-se necessária quando há um número consideravelmente elevado de indicadores, como os indicadores da sondagem por subgrupos sociais, para obtenção de um único indicador sintético. Para tal, é utilizada a primeira componente (PC1) por esta responder pela maior variância no conjunto de indicadores pré-selecionados.

2.3.2 Procedimento de pré-seleção das series temporais

A pré-seleção das séries ocorre em duas partes; a primeira na escolha da pergunta mais correlacionada com a target e após isso, a escolha dos melhores subgrupos socioeconômicos.

2.3.2.1 Do quesito ótimo:

O primeiro filtro para construção de um indicador mais correlacionado com qualquer variável de referência é a escolha da pergunta a ser utilizada. Dentre as onze perguntas do questionário da Sondagem do Consumidor, existem diferenças que são intrínsecas a cada tema relacionado. A pergunta sobre a percepção atual e futura de emprego possui um desenho cíclico diferente de uma pergunta sobre a intenção de compra de duráveis, criando a necessidade de separar as perguntas e não utilizar o conjunto delas para cada referencial. O índice de confiança do consumidor é a média aritmética de cinco perguntas com naturezas e horizontes temporais diferentes, e uma das justificativas para a desagregação do ICC vem desta combinação que por vezes pode conter erros implícitos para previsões. Neste trabalho, a desagregação das onze perguntas é realizada através das estratificações sociais, ou seja, os denominados 56 subgrupos. Para cada pergunta, há 56 indicadores em nível, e cada um dos 616 indicadores construídos apresentam uma correlação diferente com a variável target que se deseja prever. O primeiro filtro é eleger a pergunta mais bem correlacionada com a variável de referência, tirando uma média dos 56 indicadores relacionadas para a pergunta p.

2.3.2.2 Dos subgrupos ótimos:

Após este primeiro passo, o trabalho se compromete a considerar dentro da pergunta pré-selecionada apenas os subgrupos sociais que apresentem as maiores correlações com a variável

target, a fim de se diminuir os erros nas previsões com a variável de referência. A segunda

(22)

as 27 maiores com as maiores correlações. Este valor, provém do critério de se considerar apenas as séries com a correlação superior ao da mediana total. A terceira e última etapa é a adoção do procedimento de PCA nas 27 séries selecionadas, no intuito de extrair o núcleo comum destas e gerar um único indicador-síntese. Vale ressaltar que este procedimento também é realizado para os 27 indicadores de incerteza dos mesmos subgrupos sociais. Ao fim, a construção de dois indicadores-sintéticos, um em nível e outro de incerteza, torna possível criar um modelo melhor de previsão para a nossa variável target. Este tratamento é altamente aceito no meio acadêmico e utilizado em indicadores antecedentes como Barômetro, como os produzidos na Suíça pelo KOF, respaldados pela literatura de Stock and Watson (2002). Processo de pré-seleção:

𝐶𝑜𝑟𝑟𝑒𝑙𝑠𝑒𝑙𝑒𝑐𝑖𝑜𝑛𝑎𝑑𝑎 > 𝑀𝑒𝑑𝑖𝑎𝑛𝑎𝑐𝑜𝑟𝑟𝑒𝑙 𝑑𝑜𝑠 56 𝑠𝑢𝑏𝑔𝑟𝑢𝑝𝑜𝑠

2.3.3 Indicadores em nível de atividade

Usualmente, agentes econômicos se utilizam do ICC (Índice de Confiança do Consumidor) como termômetro da economia e previsor de consumo das famílias. Acontece que o ICC é uma média dos resultados de apenas cinco perguntas no questionário aplicado mensalmente a mais de 2.000 mil de consumidores. A utilização da percepção do indicador de emprego atual, por

exemplo, é reconhecidamente4 vista como antecessor da taxa de desemprego oficial do IBGE.

A análise desagregada por quesitos por si só já é valiosa para projeções do cenário macro do país. Além disso, a possiblidade de desagregar ao nível de estratos (renda e cidade), torna as projeções com resultados ainda mais promissores.

Exemplo: o Indicador de Situação Financeira Futura da Mulher de renda 2 do Recife, é um dos 616 resultados de indicador em nível. Esta construção é amplamente utilizada na comunidade internacional para pesquisas de sondagem, em que uma vez obtidas as frequências relativas de cada opção de resposta, calcula-se a diferença, em pontos percentuais, entre as opções extremas, respostas favoráveis menos desfavoráveis (boa versus ruim; melhor menos pior) e soma-se 100, como forma de se evitar números negativos.

(23)

 Do indicador em nível:

𝐼𝑛𝑑𝑖𝑐𝑎𝑑𝑜𝑟

𝑞

= 100 + ( 𝛽

𝑓

− 𝛽

𝑑

)

𝐼𝑛𝑑𝑖𝑐𝑎𝑑𝑜𝑟𝑞 É o saldo (100 + respostas favoráveis – respostas desfavoráveis), obtido para

qualquer quesito “q”

𝛽

𝑓É a parcela em % de informantes que optaram por uma resposta favorável no quesito “q”;

𝛽

𝑑 É a parcela em % de informantes que optaram por uma resposta desfavorável no quesito

“q”;

2.3.4 Indicadores de Incerteza

A literatura econômica vem destacando cada vez mais a importância da relação da incerteza com a atividade econômica. Desde o início do século XX, Knight (1921) afirmava que a incerteza é traduzida na baixa probabilidade da previsão da ocorrência de eventos, ou seja, em períodos de certeza, os analistas empresariais conseguem se valer de informações mais concretas para sua tomada de decisões. Dito isto, a incerteza econômica se traduz numa importante variável correlacionada negativamente com a atividade econômica sob qualquer ótica.

A mensuração do grau de incerteza nos últimos anos vem se tornando um dos principais desafios para melhorar a capacidade de entendimento sobre a evolução do ciclo econômico. Para este trabalho iremos utilizar o cálculo segundo Bachmann (2013), uma forma de cálculo de incerteza que está nas dispersões das respostas dos informantes da sondagem, por exemplo: se todos as pessoas estivessem dando respostas positivas, não haveria incerteza, pois 100% das pessoas apostam num otimismo e segue a mesma lógica para respostas neutras ou pessimistas. Já pelo outro lado, caso metade dos informantes, afirmassem respostas positivas e outra metade negativas, consequentemente não haveria um consenso entre o que está por acontecer, resultando numa incerteza máxima. Há outras formas de mensurar incerteza, como analisar a quantidade de notícias relacionadas às crises na imprensa ou analisar variáveis financeiras de risco como os CDS, mas se valendo da base de dados criada aqui a melhor forma de mensuração da incerteza se dá através do uso da dispersão de respostas de cada uma das 616 séries temporais.

(24)

O cálculo do índice de incerteza composto por informações de sondagens baseado no artigo desenvolvido por Bachmann é o seguinte:

 Indicador de incerteza:

𝐼𝑛𝑐𝑒𝑟𝑡𝑒𝑧𝑎

𝑞

= √𝛽

𝑓

+ 𝛽

𝑑

− (𝛽

𝑓

− 𝛽

𝑑

)² ,

em que:

𝛽

𝑓É a parcela em % de informantes que optaram por uma resposta favorável no quesito “q”;

𝛽

𝑑 É a parcela em % de informantes que optaram por uma resposta desfavorável no quesito

“q”;

O indicador de incerteza, varia entre 0 e 1, onde 0 representa nenhuma incerteza, e 1 o máximo de incerteza relativa ao questionamento realizado. Portanto o indicador é aplicado para o % de respostas dos 616 subgrupos econômicos citados anteriormente. Com isso, além do tradicional indicador em nível dos quesitos da sondagem, há a incorporação do seu par de incerteza para os modelos de previsão apresentado no capítulo adiante.

Acemoglu et al. 1994 e Katona et al. 1975 confirmam que flutuações de respostas de consumidores podem estar diretamente ligadas à uma questão subjetiva que é intrínseca às pesquisas de sondagens. A inclusão de uma proxy desta subjetividade controla melhor possíveis erros de avaliações.

2.3.5 Sazonalidade dos indicadores

Após a construção dos três indicadores realizados neste trabalho, foi feita o teste para extração de sazonalidades no método X-13 ARIMA-SEATS. Desenvolvido e mantido pelo US Census Bureau, este programa permite o tratamento de efeitos de calendário e retorna diversos diagnósticos sobre a qualidade de um ajuste sazonal. Para a extração da sazonalidade, utiliza-se a metodologia de TRAMO-SEATS. As séries que não apreutiliza-sentam padrão sazonal não são

ajustadas. Neste trabalho, não há identificação de sazonalidades para estas séries5.

(25)

Capítulo III

Neste capítulo será explorada a análise dos melhores indicadores construídos para previsão/explicação de três importantes variáveis de economia real que sustentam os gastos das famílias brasileiras; as vendas do varejo ampliada, o consumo das famílias e a inadimplência.

3.1 Utilização de índice de confiança em modelos de previsão

A evidência empírica internacional acerca dos índices de confiança é vasta. A relação entre o sentimento do consumidor e o consumo das famílias inicialmente foi investigada por Carroll et

al. (1994) que concluiu que valores defasados do índice de confiança do consumidor (Michigan)

possuem poder preditivo sobre os gastos de consumo. Nos últimos anos a literatura sobre informações desagregadas vem se desenvolvendo rapidamente, sob a perspectiva de que apresentem resultados melhores na comparação com indicadores reais. Por exemplo, a previsão do PIB é costumeiramente utilizada a partir de informações de suas partes: agropecuária, indústria e serviços. A mesma lógica é atribuída para determinadas variáveis econômicas, e neste trabalho iremos tratar três variáveis como target’s; o indicador de vendas no comércio ampliado, o consumo das famílias e a taxa de inadimplência.

A utilização de indicadores de sondagem para previsão da atividade econômica vem ganhando espaço na academia. Fuhrer (1993), verificou que os primeiros sinais de recessão vieram por parte dos consumidores norte-americanos pelas expectativas fornecidas às sondagens de Michigan e TCB, devido à eminência da primeira guerra do Iraque. Foi o primeiro sinal macroeconômico de que uma recessão estaria por vir, enquanto nenhuma outra variável econômica apresentava declínio, praticamente tornando-se uma profecia auto-realizável. A capacidade de captar o sentimento dos consumidores torna o indicador de confiança uma proxy de subjetividade de relação com fatores não-econômicos e até então não havia crença no poder preditivo deles. Naquele momento, a taxa de desemprego, o nível de renda, e a taxa de juros, estavam praticamente inalterados, portanto uma previsão do que aconteceria mais à frente não estaria correta nos modelos. Os resultados a seguir mostram que a utilização de modelos com dados de sondagem melhora a previsão e que suas próprias dispersões de respostas (incerteza) trazem mais robustez, porém o trabalho não tem o objetivo de criar modelos econométricos com variáveis externas à sondagem, o intuito é utilizar apenas as percepções dos informantes sobre seus gastos, consumo e inadimplência.

(26)

As três séries de suma importância para a ótica das despesas serão utilizadas como target para o trabalho; variação percentual interanual do consumo das famílias publicado pelo Monitor do PIB (FGV), variação percentual interanual das vendas no varejo ampliado (PMC) divulgada pelo IBGE, e a taxa de inadimplência da pessoa física divulgada pelo BACEN. Todas as séries são mensais e com disponibilidade de série maior que a própria sondagem, maior que 10 anos.

3.2 Resultados

As três variáveis do lado da demanda apresentadas a seguir, são três exemplos possíveis de se construir indicadores de previsão e antecedência da percepção das famílias sobre algum tema. Além das três, há outras possibilidades de construção de indicadores, por exemplo sobre as expectativas de desemprego. Vendas no varejo, inadimplência e o próprio consumo das famílias são três fortes séries para se compreender as decisões tomadas pelas famílias brasileiras.

3.2.1 Vendas no Varejo Ampliado (PMC/IBGE)

A série do volume de vendas no varejo ampliado é o conceito utilizado pelo IBGE que abrange o tradicional varejo do comércio mais os grupamentos de veículos, motos; e material de construção. Este índice, que inclui praticamente todos os tipos de bens que são consumidos por pessoas físicas, é um importante sinalizador de como está evoluindo a propensão aos gastos do brasileiro. A série é apresentada na forma de número-índice de base fixa, mas a transformação usual para previsão é a variação percentual interanual mensal do dado sem ajuste sazonal. A relevância deste indicador para a conjuntura econômica é grande pois é uma das explicações para realização do consumo das famílias visto pelo lado da oferta partindo da ideia de “comércio varejista”, que engloba atividades do setor de comércio que atendem basicamente à procura de bens por parte das famílias.

No questionário da Sondagem do Consumidor há perguntas de diversas naturezas, e intuitivamente a analogia das vendas no varejo é feita com quesitos como a intenção de compras

de duráveis para os próximos seis meses, ou como na comparação dos gastos com duráveis dos últimos seis meses contra os próximos seis meses e também a pergunta sobre a taxa de juros para os próximos seis meses; e estas surgem como fortes candidatas a serem antecedentes com

(27)

a nossa target. Entretanto, pelo critério de correlação6, a pergunta sobre Situação da economia

nos próximos seis meses é o quesito que passa pelo primeiro critério de pré-seleção.

Tabela 1- Média das correlações das perguntas x var. % da PMC Ampliada

Este resultado evidencia que as percepções dos brasileiros com a situação da economia são fundamentais para a realização de compras no mercado varejista. O interessante nesta abordagem é que o indicador de Compra de duráveis que é usualmente utilizado como uma

proxy pelo mercado para prever a PMC Ampliada, evidenciando a necessidade de uma análise

mais desagregada já que este quesito é um dos cinco que compõem o ICC.

O novo indicador agregado por componentes principais (PCA_SIT_ECO_FUT7) aponta que há

causalidade no teste de Granger com um mês de defasagem para a PMC Ampliada, constatação não vista quando o teste é utilizado com a pergunta sobre Compra de duráveis para os próximos

seis meses, considerando um nível de significância de 1%. Para a antecedência do quesito de

compras há uma dupla causalidade com a série da PMC, não observada quando é utilizada a série com os melhores indicadores da pergunta de Situação Econômica Atual.

6A média da correlação dos 56 indicadores com a variável de vendas no vareja, se mostra maior para a pergunta sobre economia futura.

Não necessariamente, este indicador agregado tem a maior correlação. O trabalho se preocupa em analisar as séries desagregadas.

7Ver subgrupos sociais pré-selecionados, na tabela 4 do apêndice.

Pergunta Média das correlações Sit. Financeira Atual 0.2254 Sit. Financeira Futura 0.2532 Compra de Duráveis 0.2146

Poupança 0.0309

Sit. Economia Atual 0.4472 Sit. Economia Futura 0.4682*

Emprego Atual 0.0359

Emprego Futura 0.3105

Taxa de Juros -0.3666

Viagem 0.1427

(28)

Tabela 2 – Causalidade de Granger (Lag de 1 mês)

Como foi enunciado anteriormente, uma hipótese que não deve ser violada é verificar se há multicolinearidade entre a variáveis independentes. Para tanto, é realizado o teste VIF (Variance Inflation Factors) em que a estatística acima de 10 resultado neste problema. Mas neste exercício não é observada multicolinearidade entre a série de situação econômica futura (PCA_SIT_ECO_FUT) e o indicador de incerteza (pca_incerteza) apresentam o teste VIF menores que 10, portanto sem multicolinearidade. (Apêndice – tabela 12)

Com a hipótese de causalidade entre a série construída, a última conclusão é sobre as informações em modelos OLS para a previsão da variável target. Na tabela 6 é possível ver as possibilidades de modelos para previsão das vendas no varejo. O modelo inicial (1) ARMA determina um R² ajustado mínimo para os modelos seguintes após inclusão de mais variáveis explicativas. A inclusão da incerteza (2) sendo significativa traz o respaldo para o arcabouço teórico citado no capítulo 3. O ganho de R² ajustado na comparação entre os modelos (3) e (4) evidencia que o uso do indicador composto pelas partes desagregadas da pergunta sobre a expectativa da economia, é melhor do que utilizar o conceito agregado de confiança (ICC), hipótese ressaltada no modelo (5) em que apenas as duas variáveis são regressas contra a PMC-A, e não mostrando significância a 10% para a explicativa ICC. O melhor modelo (6) se utiliza das duas melhores variáveis explicativas, PCA_SIT_ECO_FUT e PCA_INCERTEZA, esta última com coeficiente negativo confirmando a hipótese de Bachmann. O critério de Akaike do modelo 6 apresenta o menor valor, sugerindo que entre a escolha dos modelos este é o mais parcimonioso, ou seja, é o modelo que envolve o mínimo de parâmetros possíveis a serem estimados e que explica bem o comportamento da variável target.

A conclusão final destes resultados corrobora as duas principais hipóteses discutidas no trabalho; a primeira é que a utilização de um híbrido (PCA_SIT_ECO_FUT) com as avaliações de determinados grupos socioeconômicos do quesito sobre o futuro da economia é mais

Null Hypothesis: Obs F-Statistic Prob.

PCA_SIT_ECO_FUT does not Granger Cause PMC_AMPLIADA 119 52.6374 0.00 PMC_AMPLIADA does not Granger CausePCA_SIT_ECO_FUT 0.81901 0.37

PMC_AMPLIADA does not Granger Cause COMPRA_DURAVEIS 119 9.78157 0.00 COMPRA_DURAVEIS does not Granger Cause PMC_AMPLIADA 7.86951 0.02

COMPRA_DURAVEIS does not Granger Cause PCA_SIT_ECO_FUT 119 0.02077 0.89 PCA_SIT_ECO_FUT does not Granger Cause COMPRA_DURAVEIS 15.6106 0.00

(29)

correlacionada com o nível de vendas no varejo brasileiro e é mais precisa que a que resulta da utilização do amplo conceito de confiança; e a segunda, que por se tratar da utilização de indicadores de sondagem a inclusão de uma proxy de subjetividade destes mesmos subgrupos sociais o qual é denominada por incerteza é significativa e de sinal negativo, o que implica que quanto maior a incerteza menor a atividade econômica.

Tabela 3 – Modelo OLS

A modelagem realizada teve o cuidado de não ferir pressupostos econométricos fundamentais, como a presença de auto correlação serial e heterocedasticidade. Como a hipótese nula de homocedasticidade é rejeitada, vide tabela 4, os seis modelos apresentados na tabela 3 sofreram correção de Newey-West para os seus estimadores. Já na tabela 5, o teste White mostra que não há heterocedasticidade nos modelos.

Tabela 4 – Teste BG de correlação serial

Modelo 1 Modelo 2 Modelo 3 Modelo 4 Modelo 5 Modelo 6

Constante 15.59*** -6.35** -20.4*** -36.7*** -9.79** pmc_ampliada (-1) 0.46*** 0.34*** 0.40*** 0.20** 0.18*** pmc_ampliada (-2) 0.44*** 0.35*** 0.37*** 0.22*** 0.21*** pca_sit_eco_fut 0.22*** 0.19*** pca_sit_eco_fut (-1) 0.34*** compra_duraveis 0.07** compra_duraveis(-1) 0.06 pca_incerteza*100 -0.23*** -0.12***

Akaike info criterion 6.010 5.923 6.007 5.771 5.866 5.755

R² 0.615 0.659 0.629 0.707 0.669 0.716

R² ajustado 0.612 0.650 0.619 0.699 0.664 0.706

*p<0.1; **p<0.05; ***p<0.01 Dependente: PMC_Ampliada, corrigido por HAC (Newey-West)

Breusch-Godfrey Serial Correlation LM Test: Test Equation:

Dependent Variable: RESID Method: Least Squares

F-statistic 7.145384 Prob. F(2,111) 0 0.0012

(30)

Tabela 5 – Teste White de heterocedasticidade

3.2.2 Consumo das Famílias (Monitor do PIB/FGV)

A variável de demanda mais importante para a economia brasileira é o Consumo das Famílias divulgado trimestralmente pelo IBGE, no sistema de Contas Nacionais. O consumo privado é o primeiro fator de influência para as variações do PIB, já que a compõe em aproximadamente 60% e representa os gastos das famílias em aquisições de bens e serviços. O consumo está diretamente ligado a fatores, como a renda real, taxa de juros e à própria inflação.

Destacada a relevância do indicador, para este trabalho optaremos por utilizar uma frequência mensal desta série a partir dos dados do Monitor do PIB produzido pela FGV-IBRE. A escolha por este indicador se dá em duas frentes; na primeira, porque a mudança de dados trimestrais para dados mensais leva a um aumento considerável em sua frequência de 80 pontos de observação no período de 2006 a 2015, e segundo porque a metodologia de cálculo do Monitor/FGV é idêntica à das Contas Trimestrais do IBGE, o que não traz distorções dos

resultados oficiais trimestrais para este dado mensal8. A forma de análise da série é a variação

% do mês contra o mesmo mês do ano anterior.

De acordo com alguns estudos como em Graminho (2015), o Índice de Confiança do Consumidor (ICC) na frequência trimestral apresenta uma antecedência temporal com a variável de Consumo das Famílias. Entretanto, seguindo com a proposta deste trabalho a variável que melhore esta antecedência é aquela no nível mais desagregado que utilize apenas uma pergunta, e que se inclui o conjunto de respondentes que tenham mais correlações com a variável target. Esta análise desagregada é confirmada em artigos como Malgarini et al. (2006). O quesito sobre a Situação financeira da família para os próximos seis meses, apresenta na média dos seus indicadores desagregados a maior correlação com a variação percentual interanual do consumo das famílias. Empiricamente, este quesito procura avaliar como estão as

8 Para maior entendimento acessar: http://portalibre.fgv.br/main.jsp?lumChannelId=402880811D8E34B9011D92E5C726666F

Heteroskedasticity Test: White Test Equation:

Dependent Variable: RESID^2 Method: Least Squares

F-statistic 1.393899 Prob. F(13,104) 0 0.1747

Obs*R-squared 17.50925 Prob. Chi-Square(13) 0 0.1771

(31)

finanças domésticas. Intuitivamente, se as condições respondidas pelos informantes são favoráveis, o ímpeto ao consumo será maior, e vice-versa no caso de uma condição mais desfavorável.

Novamente a utilização do conceito de confiança amplo para prever a variável de consumo apresenta maiores ruídos do que a pergunta única. As avaliações sobre a economia e sobre compras exclusivamente de bens duráveis (itens que compõem o ICC) podem gerar ruídos que na previsão do consumo amplo gerem erros implícitos.

Tabela 6- Média das correlações das perguntas x var. % da Consumo das famílias

Apresentando o mesmo resultado que em alguns trabalhos como Graminho (2015) e Bentes (2006) o teste de causalidade de Granger aponta para antecedência significativa do ICC para o

Consumo das Famílias com um lag de defasagem9. O poder preditivo do novo indicador

composto com os subgrupos socioeconômicos da pergunta sobre Situação Financeira Futura da Família também é significativo.

Portanto, a utilização do ICC como antecedente ao consumo é correta, mas sujeita a erros implícitos por avaliações que não apresentam correlação com o ciclo de consumo, seja pela utilização de perguntas que não conseguem captar este ímpeto, seja pela utilização de todos os estratos sociais que por sua vez apresentem alguns subgrupos menos correlacionados com a

target.

9A antecedência é significativa para até 5 lag’s.

Pergunta Média das correlações

SFA 0.5377 SFF 0.5493* COM 0.4605 POP 0.3224 SEA 0.4647 SEF 0.4539 EPA 0.5088 EPF 0.4597 TXJ -0.4054 VIA 0.2576 INT 0.3521

(32)

Tabela 7 – Causalidade de Granger

Novamente o pressuposto que não pode ser violado é se há multicolinearidade entre a séries em nível e o seu indicador-par de incerteza. Para tanto, é realizado o teste VIF (Variance Inflation Factors) em que a estatística acima de 10 resultado neste problema. Assim como para o exercício anterior não é observado multicolinearidade entre a série de situação financeira futura

(PCA_SIT_FIN_FUT10) e o indicador de incerteza (PCA_INCERTEZA), ver apêndice tabela

13.

O modelo (6) que apresenta R² ajustado de 0,91 contra 0,72 do melhor modelo do varejo ampliado, sugerindo que o modelo do consumo das famílias se apresenta com uma inércia com o seu passado maior que a modelagem da variável de vendas, a qual é mais volátil. As avalições sobre a situação financeira familiar são mais relacionadas ao conceito de consumo das famílias divulgadas pelo IBGE, do que as avaliações sobre a economia brasileira são relacionadas para explicar as vendas no mercado varejista. Em um todo, o indicador de situação financeira é considerado como predito por ter na sua formulação o cunho mais pessoal, e menos subjetivo do que quando indagamos sobre as avaliações relativas à economia do país, ou sobre a percepção quanto a conseguir um emprego. A pergunta da situação financeira fica restrita ao que se passa dentro do domicílio do respondente e uma evidência é a própria volatilidade da série histórica deste quesito, tanto para percepção atual quanto expectativas futuras. A sua consequência, quando há um aumento nas expectativas de melhora na situação financeira, é uma aceleração do consumo, via renda domiciliar, taxa de juros ou até possivelmente uma inflação de alimentos menor. Apesar do pouco ganho entre o modelo 1 e o 6, em que apenas o

10Ver subgrupos sociais pré-selecionados, na tabela 5 do apêndice.

Null Hypothesis: Obs F-Statistic Prob.

PCA_SIT_FIN_FUT does not Granger Cause CONSUMO_FAMILIAS 119 23.3035 0.00 CONSUMO_FAMILIAS does not Granger Cause PCA_SIT_FIN_FUT 2.98762 0.09

ICC does not Granger Cause CONSUMO_FAMILIAS 119 6.09715 0.02

CONSUMO_FAMILIAS does not Granger Cause ICC 2.18743 0.14

ICC does not Granger Cause PCA_SIT_FIN_FUT 119 0.88363 0.35

(33)

consumo defasado está explicado o consumo atual, o ganho se dá também através da não violação de outra hipótese, como não ter erros correlacionados e heterocedasticidade.

Novamente o papel da incerteza é significativo para modelagem com dados de sondagem, que após mensurada mostra o sinal negativo indicando que quanto maior a incerteza, menor o consumo. Outra análise vista no modelo (5) traz à tona a constatação de que a aplicabilidade do ICC defasado não é significativa quando controlada apenas pela variável PCA_SIT_FIN_FUT também defasada. O critério de Akaike do modelo 6 apresenta o menor valor, sugerindo que entre a escolha dos modelos este é o mais parcimonioso, ou seja, é o modelo que envolve o mínimo de parâmetros possíveis a serem estimados e que explica bem o comportamento da variável do consumo das famílias.

Tabela 8 – Modelo OLS

Nesta modelagem realizada as tabelas 9 e 10, mostram que não há correlação serial nos resíduos e nem evidência de heterocedasticidade, respectivamente. Após a realização destes testes, não é necessário a nenhuma correção dos estimadores.

Tabela 9 – Teste Breusch de correlação serial

Modelo 1 Modelo 2 Modelo 3 Modelo 4 Modelo 5 Modelo 6

Constante -0.13 2.30*** -2.50*** -33.58*** consumo_familias(-1) 1.01*** 0.95*** 0.94*** 1.06*** 0.88*** pca_sit_fin_fut -0.07 0.02*** pca_sit_fin_fut (-1) 0.27*** icc 0.02*** icc(-1) 0.02 pca_incerteza*100 -0.04*** -0.05***

Akaike info criterion 2.558 2.509 2.510 2.564 3.688 2.426

R² 0.924 0.929 0.929 0.924 0.773 0.935

R² ajustado 0.924 0.928 0.928 0.923 0.769 0.934

*p<0.1; **p<0.05; ***p<0.01 Dependente: CONSUMO_FAMILIAS, sem correção de estimador

Breusch-Godfrey Serial Correlation LM Test: Test Equation:

Dependent Variable: RESID Method: Least Squares

F-statistic 2.121426 Prob. F(2,115) 0 0.1245

(34)

Tabela 10 – Teste White de Heterocedasticidade

3.2.3 Inadimplência de pessoa física – (BACEN)

A concessão de crédito é um instrumento de venda que facilita a aquisição de bens por empresas e consumidores de forma geral. O crédito dinamiza a economia permitindo aumentar a oferta dos bens e serviços, facilitando o processo de compra pelos consumidores.

As políticas de crédito habilitam o mercado consumidor a sincronizar suas fontes e aplicações, expandindo os níveis de emprego e de renda. Por outro lado, o não pagamento dos créditos concedidos traz a inadimplência. É importante minimizar tanto quanto possível a inadimplência, para que os retornos financeiros sejam máximos, provocando a geração de benefícios em cadeia para credores e devedores. Esse indicador tem forte influência nas decisões e na capacidade de consumo das famílias, mas também nas decisões de instituições financeiras sobre sua política de crédito.

Adotaremos como variável target de inadimplência, a série oficial de inadimplência do

BACEN11 divulgada mensalmente. Este indicador é relativamente recente, com seu início em

março de 2011, sendo necessário fazer uma interpolação desta com a série desativada12 (de

junho de 2000 até dezembro de 2012). As duas séries contemplam o % do total de pessoas físicas com atrasos de pagamentos superiores a três meses, e nos 22 meses em que as duas séries são divulgadas, a correlação entre elas é superior a 0,98. O encadeamento da série atual com a antiga é feito com base nas variações de fevereiro de 2011 para trás.

11 Código 21112 - Inadimplência da carteira de crédito com recursos livres - Pessoas físicas - Total - %

12 7938 - Operações de crédito com recursos livres referenciais para taxa de juros - Inadimplência acima de 90 dias em

relação ao total da modalidade - Total pessoa física - % Heteroskedasticity Test: White

Test Equation:

Dependent Variable: RESID^2 Method: Least Squares

F-statistic 0.591631 Prob. F(6,113) 0 0.7364

Obs*R-squared 3.65487 Prob. Chi-Square(6) 0 0.7233

(35)

Gráfico 4 – Taxa de inadimplência - BACEN

Fonte: BACEN

A análise de como está/estará a taxa de inadimplência é uma importante ferramenta para política monetária de longo prazo. A percepção dos consumidores sobre a taxa de juros, traz uma forte aderência ao nível de endividamento das famílias. O questionamento acerca deste tema é o seguinte: “Na sua opinião, a taxa de juros nos próximos seis meses irá: subir / manter-se /

cair”, portanto o indicador em nível para a Taxa de Juros é 100 + % de respostas que afirmam

que a taxa de juros irá cair (avaliação favorável) - % de respostas que afirmam que a taxa de juros irá subir (avaliação desfavorável). A intuição deste indicador é igual à dos demais da sondagem, o aspecto favorável é somado ao 100 e o aspecto desfavorável é subtraído. A correlação positiva entre inadimplência superior a 90 dias e o indicador de percepção da taxa de juros, sugere que quanto mais consumidores avaliam que os juros irão cair eles aumentam a sua probabilidade d vir a ser inadimplente.

(36)

Tabela 11- Média das correlações das perguntas x Taxa de inadimplência BACEN

A causalidade no teste de Granger aponta que há causalidade entre as expectativas futuras da taxa de juros com a taxa de inadimplência do BACEN. O teste também indica que a causalidade do indicador de taxa de juros agregada (sem o processo de escolha dos melhores subgrupos e que é oficialmente divulgado) não é tão evidente nos atrasos de pagamentos. Considerando lag de três meses, a utilização do TX_JUROS_AGREGADA não obtém uma causalidade perante a inadimplência tão forte quanto à aquela que se utiliza dos melhores estratos sociais

(PCA_TAXA_JUROS13).

Tabela 12– Causalidade de Granger

Como nos exercícios anteriores o pressuposto que não pode ser violado é se há multicolinearidade entre a séries em nível e o seu indicador-par de incerteza. Para tanto, é realizado novamente o teste VIF e não há multicolinearidade entre a série em do indicador em

13Ver subgrupos sociais pré-selecionados, na tabela 6 do apêndice.

Pergunta Média das correlações

SFA -0.0010 SFF 0.0957 COM 0.0852 POP -0.0630 SEA 0.0753 SEF 0.2787 EPA -0.2060 EPF 0.1100 TXJ 0.5722* VIA -0.0240 INT 0.0248

Null Hypothesis: Obs F-Statistic Prob.

PCA_TAXA_JUROS does not Granger Cause INADIMPLENCIA 117 2.98488 0.03 INADIMPLENCIA does not Granger Cause PCA_TAXA_JUROS 5.05435 0.00

TX_JUROS_AGREGADA does not Granger Cause INADIMPLENCIA 117 1.80605 0.15 INADIMPLENCIA does not Granger Cause TX_JUROS_AGREGADA 3.87009 0.01

TX_JUROS_AGREGADA does not Granger Cause PCA_TAXA_JUROS 117 0.26191 0.85 PCA_TAXA_JUROS does not Granger Cause TX_JUROS_AGREGADA 0.65111 0.58

(37)

nível da taxa de juros (PCA_TAXA_JUROS) e a sua incerteza (PCA_INCERTEZA), ambos apresentam valores VIF inferiores a 10, vide tabela do apêndice 14.

Os resultados do modelo de número 6 mostram que, em linha com os anteriores, o indicador composto com as melhores correlações dos subgrupos sociais (PCA_TAXA_JUROS) apresenta um coeficiente positivo com a inadimplência. Em outros termos, quando há a expectativa do consumidor brasileiro por juros mais baixos, isto impacta positivamente na inadimplência. A

hipótese neste caso é de que alguns consumidores14 se valem de uma concessão de crédito maior

para financiarem novas compras e assim acabam ficando inadimplentes. O modelo 5, explica a inadimplência por duas independentes, uma na ótica agregada (divulgada) e outra desagregada e depois agregada por PCA se mostra mais significativa.

O grau de obtenção de crédito, seja ele por consignado ou empréstimo, torna-se mais custoso vindo a ser um dos fatores para uma alta na taxa de atrasos de pagamentos. Outra variável de controle utilizada, a incerteza (PCA_INCERTEZA), prova a teoria que quanto mais ela cresce, maior a inadimplência, tornando a relação entre as variáveis positiva, caso diferente das duas

vistas anteriormente. O critério de Akaike do modelo 6 apresenta o menor valor15, sugerindo

que entre a escolha dos modelos este é o mais parcimonioso, ou seja, é o modelo que envolve o mínimo de parâmetros possíveis a serem estimados e que explica bem o comportamento da variável target.

Tabela 13 – Modelo OLS

14Ver subgrupos sociais pré-selecionados, na tabela 6 do apêndice.

15Conforme definido, AIC é estritamente positivo. No entanto, durante uma análise, é comum omitir os termos matemáticos que são

constantes em todos os modelos e tais atalhos podem resultar em valores negativos de AIC. Isso cria nenhum problema, apenas se identifica o modelo com o menor valor de AIC e declara que é o modelo estimado para ser o melhor. Este modelo ajustado é estimado para ser "mais próximo" realidade completa e é uma boa aproximação para a informação em Os dados, em relação aos outros modelos considerados. Anderson's textbook, 'Model-Based Inference in the Life Sciences' (2008).

Modelo 1 Modelo 2 Modelo 3 Modelo 4 Modelo 5 Modelo 6

Constante 0.10 -0.07 0.17 5.18*** inadimplência(-1) 0.98*** 0.94*** 0.96*** 0.99*** 0.95*** pca_taxa_juros/100 -0.00 0.24* pca_taxa_juros(-1)/100 2.01** -0.28** tx_juros_agregada 0.05 tx_juros_agregada(-1)/100 -0.28 pca_incerteza 0.69** 0.51**

Akaike info criterion -1.005 -1.063 -0.988 -0.997 1.427 -1.097

R² 0.964 0.967 0.964 0.964 0.607 0.964

R² ajustado 0.964 0.966 0.964 0.964 0.599 0.963

*p<0.1; **p<0.05; ***p<0.01 Dependente: INADIMPLÊNCIA BACEN, corrigido por HAC (Newey-West)

(38)

O exercício de modelagem de previsão da variável da taxa de inadimplência do BACEN, apresenta características diferentes dos dois anteriores. O teste Breusch-Godfrey (tabela 14) apresenta evidência de correlação serial, portanto é utilizado a correção dos estimadores Newey-West para as modelagens seguintes. Apesar de apresentar heterocedasticidade (tabela 15), o estimador NW, já corrige este problema.

Tabela 14 – Teste Breusch de correlação serial

Tabela 15 – Teste White de Heterocedasticidade Breusch-Godfrey Serial Correlation LM Test:

Test Equation:

Dependent Variable: RESID Method: Least Squares

F-statistic 2.710768 Prob. F(2,109) 0 0.05

Obs*R-squared 5.448945 Prob. Chi-Square(2) 0 0.05

Heteroskedasticity Test: White

Test Equation:

Dependent Variable: RESID^2 Method: Least Squares

F-statistic 2.665793 Prob. F(10,108) 0 0.01

Obs*R-squared 23.55816 Prob. Chi-Square(10) 0 0.01

Imagem

Gráfico 1 – Relação entre ICC e o Consumo das Famílias
Gráfico 2 –Relação entre indicadores de Nível e de Incerteza  (Em médias móveis trimestrais)
Gráfico 3- Ilustração das duas primeiras Componentes Principais (PC1 e PC2)
Tabela 1- Média das correlações das perguntas x var. % da PMC Ampliada
+7

Referências

Documentos relacionados

(2008), o cuidado está intimamente ligado ao conforto e este não está apenas ligado ao ambiente externo, mas também ao interior das pessoas envolvidas, seus

Mas existe grande incerteza sobre quem detém esses direitos em certas áreas do Brasil rural.. Esta é a posição do Brasil em relação à segurança de direitos de propriedade de

This infographic is part of a project that analyzes property rights in rural areas of Brazil and maps out public policy pathways in order to guarantee them for the benefit of

Reduzir desmatamento, implementar o novo Código Florestal, criar uma economia da restauração, dar escala às práticas de baixo carbono na agricultura, fomentar energias renováveis

Reducing illegal deforestation, implementing the Forest Code, creating a restoration economy and enhancing renewable energies, such as biofuels and biomass, as well as creating

Tendo este trabalho como objectivo, ilustrar os vários aspectos da relação de Simone de Beauvoir com o nosso país, abordámos, com esse intuito, as visitas efectuadas por esta

Este trabalho teve por objetivo testar a hipótese do uso de cavernas como estratégia para termorregulação em uma população selvagem de macacos-prego (Sapajus libidinosus), em uma

4.5 Conclusões: Este trabalho mostrou um modelo criado para representar uma linha de transmissão monofásica através de uma cascata de circuitos π, cujos parâmetros longitudinais