Modelos Dinâmicos Bayesianos para Dados de Painel usando Distâncias Econômicas

(1)

Modelos dinˆ

amicos Bayesianos para dados

de painel usando distˆ

ancias econˆ

omicas

Larissa de Carvalho Alves

Universidade Federal do Rio de Janeiro

Instituto de Matem´

atica

Departamento de M´etodos Estat´ısticos

2010

(2)

Modelos dinˆ

amicos Bayesianos para dados

de painel usando distˆ

ancias econˆ

omicas

Larissa de Carvalho Alves

Disserta¸cão submetida ao Corpo Docente do Instituto de Matemática - Departamento de Métodos Estat´ısticos da Universidade Federal do Rio de Janeiro - UFRJ, como parte dos requisitos necessários à obten¸cão do grau de Mestre em Estat´ıstica.

Aprovada por:

Prof. H´elio S. Migon. PhD - UFRJ - Orientador.

Esther Salazar.

D.Sc. - SAMSI - Co-orientadora.

Prof. Alexandra M. Schmidt PhD - UFRJ.

Prof. Juliano J. Assun¸c˜ao D.Sc. - Puc-Rio.

Rio de Janeiro, RJ - Brasil 2010

(3)

FICHA CATALOGR ´AFICA

Alves, Larissa de Carvalho.

Modelos dinâmicos Bayesianos para dados de painel usando distâncias econômicas Larissa de Carvalho Alves.

Rio de Janeiro: UFRJ, IM, DME, 2010.

Disserta¸cão - Universidade Federal do Rio de Janeiro, IM, DME. 1. Introdu¸cão. 2. Distâncias Econômicas.

3. Modelos Espa¸co Temporais com Distâncias Econômicas. 4. Aplica¸cões.

5. Conclus˜oes e Trabalhos Futuros.

(Mestrado-UFRJ/IM/DME) I. Migon, H´elio S.

(4)

`

A Deus, autor e consumador da minha f´e. `

A minha fam´ılia. `

(5)

Eu te agrade¸co, Deus

Por se lembrar de mim, e pelo teu favor E o que me faz crescer;

Eu vivo pela fé, e não vacilo; Eu não paro, eu não desisto, Eu sou de Deus, eu sou de Cristo. Você mudou a minha história

E fez o que ninguém podia imaginar Você acreditou e isso é tudo

Só vivo pra você Não sou do mundo, não. A honra, a glória, a for¸ca

O louvor a Deus

E o levantar das minhas m˜aos ´

E pra dizer que te perten¸co, Deus. (. . .)

Eu te agrade¸co, Deus

Que no deserto n˜ao me deixou morrer E nem desanimar

E como aquela mãe, que não desiste você não se esqueceu, você insiste... Você mudou a minha história

E fez o que ninguém podia imaginar Você acreditou e isso é tudo

Só vivo pra você Não sou do mundo, não. A honra, a glória, a for¸ca

O louvor a Deus

E o levantar das minhas m˜aos ´

E pra dizer que te perten¸co, Deus.

(6)

Agradecimentos

Primeiramente, agrade¸co a Deus por sua imensa miseric´ordia e gra¸ca, pelo socorro bem presente nas tribula¸c˜oes.

`

A minha fam´ılia, a base de tudo. Aos meus pais, pelo amor incondicional, dedica¸cão e ora¸cões. Pelo financiamento dos meus estudos e por sempre acreditarem que eu era capaz. A minha irm˜` a, pela amizade, pelos conselhos e por tantas dúvidas tiradas. Apesar de neste momento estar tão longe, foi uma irmã e tanto quando se trata das noites viradas para estudar e do compartilhamento do computador. Às minhas tias, tios, primas e primos pela for¸ca passada mesmo por telefone e por sempre torcerem pelo meu sucesso. À minha avó Georgeta (in memorian), que apesar de ter partido ano passado e estar deixando enormes saudades, tal acontecimento tem me dado for¸cas para prosseguir. Obrigada vó por ter cedido parte da sua vida para cuidar de mim, por ter deixado todos os filhos em Salvador e vindo para o Rio por mim e pela minha irmã, serei eternamente grata à senhora.

Ao César pelo amor, compreensão e amizade. Por me apoiar em cada decisão tomada e por me fazer a cada dia mais feliz.

Aos meus amigos e companheiros do DME que compartilharam comigo experiências, momentos de dificuldade e de alegria e fizeram esta caminhada menos sofrida e mais divertida. Em especial, agrade¸co a minha turma João, Kelly, Nassif, Targino e Thiago vocês são a turma que qualquer um gostaria de fazer parte, muito obrigada, vocês são muito especiais. Em mais que especial, à Panela (Camilinha, João e Kelly) que unida jamais será vencida, que crise mundial não afeta, nem uma marolinha, rs. Não tenho

(7)

Aos meus velhos amigos capianos por quase sempre compreenderem minha ausência nos eventos, aniversários, Chá das 5, despedidas e recep¸cões. Vocês são inesquec´ıveis. Aos meus velhos amigos de gradua¸cão por passarem comigo uma importante fase da minha vida e marcarem cada uma delas de forma especial. Aos meus irmãos em Cristo, Geisa, Romário, Ana Paula e Fernando, pelas ora¸cões e conselhos.

`

A todos os meus professores de gradua¸cão que me passaram com grande sabedoria seus conhecimentos matemáticos. Em particular, obrigada Rubinho, Jair, Mônica, Luziane e Ivo. À todos os professores do programa de pós-gradua¸cão do DME-UFRJ, pelo valioso conhecimento transmitido, pelas maravilhosas aulas e toda a disponibilidade para ajudar. Em especial, à Alexandra pelos conselhos e ajuda nos momentos de dificuldade.

Ao meu orientador, professor H´elio Migon, pela experiˆencia passada e pela ajuda no desenvolvimento deste trabalho.

`

A minha co-orientadora Esther Salazar, por toda a experiência computacional que hoje possuo, pela paciência infinita ao longo deste ano, pelas muitas horas de dedica¸cão, pela ajuda e organiza¸cão na resposta aos e-mails depois da sua viagem.

Por fim, agrade¸co aos professores Alexandra Schmidt e Juliano Assun¸cão por aceitarem participar da banca, ao Conley, por fonecer os dados de uma das aplica¸cões deste trabalho e à Capes por ter financiado este estudo.

(8)

Resumo

Neste trabalho apresentamos um modelo econométrico espa¸co-temporal para dados de painel, onde os elementos correspondem a agentes econômicos. A dependência espacial entre agentes é caracterizada por fun¸cões de distâncias econômicas que são incorporadas tanto na estrutura de média como na estrutura de covariância do modelo.

Partimos de modelos de regressão simples e motivamos a utiliza¸cão de modelos econométricos espaciais, distâncias entre agentes e adicionalmente, para acomodar poss´ıveis outliers, introduzimos um modelo de regressão t-Student. Temos como objetivo incorporar rela¸cões entre setores da economia que são dadas por suas similaridades e além disso fazer a estima¸cão dos modelos lan¸cando mão de uma abordagem completamente Bayesiana. Vamos utilizar o modelo proposto e suas varia¸cões, para modelar dois conjuntos de dados. Na primeira aplica¸cão estudamos a produ¸cão mensal dos movimentos comuns entre vinte setores industriais dos EUA. A segunda aplica¸cão refere-se à setores da economia brasileira, na qual as observa¸cões são dadas por ´ındices de crescimento do Produto Interno Bruto.

Palavras-chave: Econometria espacial; Distâncias econômicas; Inferência bayesiana; Modelos dinâmicos; Métodos MCMC

(9)

Abstract

In this work we present an econometric spatio-temporal models for panel data, where the elements correspond to economic agents. The spatial dependence between agents is characterized by functions of economic distances that are incorporated into both the mean structure as the covariance structure of the model.

We start with a simple regression model and motivate the use of spatial econometric models, distances between agents and, additionally, we introduce a Student-t model to accommodate possible outliers. Our goal is to incorporate relationships between economic sectors that are given by their similarities and also to estimate the models using a fully Bayesian approach. We use the proposed model and its variations, to analyze two datasets. In the first application, we study the monthly production of twenty industries in the U.S.. The second application refers to sectors of the Brazilian economy where the observations are growth rates of Gross Domestic Product.

Keywords: Spacial econometrics; Economic distances; Bayesian inference; Dynamic models; MCMC methods

(10)

Sum´

ario

1 Introdu¸c˜ao 2

1.1 Modelos Dinˆamicos . . . 4

1.2 Modelos Espaciais. . . 5

1.3 Modelos Espa¸co-Temporais. . . 7

1.4 Sele¸c˜ao de Modelos . . . 8

1.5 Organiza¸c˜ao da Disserta¸c˜ao . . . 9

2 Distâncias Econômicas 11 2.1 Introdu¸cão . . . 11

2.2 Constru¸cão de Distâncias Econômicas . . . 13

2.2.1 Aplica¸c˜ao a matrizes de insumo-produto norte-americanas . . . . 14

2.2.2 Aplica¸c˜ao a matrizes brasileiras de insumo-produto . . . 24

3 Modelos Espa¸co-Temporais com Distâncias Econômicas 31 3.1 Introdu¸cão . . . 31

3.2 Modelo Proposto . . . 34

3.2.1 Especifica¸c˜oes para G(Dt) e Σ(Dt) . . . 35

3.2.2 N˜ao separabilidade . . . 37

3.2.3 Acomoda¸c˜ao de outliers . . . 39

3.2.4 Fun¸c˜ao de verossimilhan¸ca . . . 41

3.3 Procedimento de Inferˆencia. . . 42

3.4 Modelando Séries Temporais Não Estacionárias . . . 43

(11)

3.5.1 Variˆancia explicada . . . 50

3.5.2 Algoritmo para o c´alculo da variˆancia de zt e βt . . . 51

3.5.3 Resultados da variˆancia explicada . . . 52

3.5.4 Compara¸c˜ao entre modelos . . . 54

3.5.5 Resultados a posteriori . . . 55

3.6 Estudo Num´erico Baseado em Dados Artificiais t-Student . . . 60

3.6.1 Regress˜ao t-Student . . . 61

3.6.2 Contamina¸c˜ao dos dados . . . 64

4 Aplica¸c˜oes 67 4.1 Atividades da Economia Norte-Americana . . . 68

4.1.1 An´alise descritiva dos dados . . . 68

4.1.2 Modelos propostos . . . 73

4.1.3 Principais resultados . . . 75

4.2 Setores da Economia Brasileira . . . 85

4.2.1 An´alise descritiva dos dados . . . 85

4.2.2 Modelos propostos . . . 88

4.2.3 Principais resultados . . . 94

5 Conclusões e Trabalhos Futuros 101 A Métodos de Simula¸cão Estocástica 104 A.1 Algoritmo de Metropolis-Hastings . . . 104

A.2 Amostrador de Gibbs . . . 105

A.3 Filtro de Kalman e FFBS . . . 106

A.4 Distribui¸c˜oes condicionais completas . . . 107

B Cadeias dos Parˆametros a Posteriori 110 B.1 Para Aplica¸c˜ao dos Dados Norte-Americanos . . . 110

(12)

Lista de Tabelas

2.1 Setores norte-americanos manufaturados indexados por dois d´ıgitos do

c´odigo SIC. . . 17

2.2 Atividades da economia brasileira . . . 26

3.1 Probabilidade de ρ 6= 1 a posteriori para diferentes valores de ρ. . . 45

3.2 Probabilidade de ρi 6= 1 a posteriori para diferentes setores . . . 46

3.3 Compara¸c˜ao de modelos pelo EMQ e EMA . . . 55

3.4 Estat´ısticas dos valores das amostras de φ, τ2_{, σ}2_{, ρ e β.} _{. . . .} ₆₀

3.5 Estat´ısticas das amostras dos parâmetros para diferentes prioris para ν . 62 3.6 Estat´ısticas das amostras dos parâmetros para diferentes prioris para ν . 62 3.7 Estat´ısticas das amostras dos parâmetros para diferentes prioris para ν . 62 4.1 Análise exploratória dos dados transformados . . . 72

4.2 Crit´erios de compara¸c˜ao de modelos . . . 76

4.3 Estat´ısticas dos valores das amostras dos parˆametros. . . 80

4.4 An´alise explorat´oria dos dados tranformados . . . 88

4.5 Crit´erios de compara¸c˜ao dos modelos simples . . . 90

4.6 Critérios de compara¸cão dos modelos intermediários . . . 93

4.7 Crit´erios de compara¸c˜ao de modelos completos . . . 95

(13)

Lista de Figuras

1.1 Ciclo de inferˆencia. . . 5

2.1 Gráfico CMDS das distâncias econômicas do insumo entre setores norte-americanos, para o ano de 1987.. . . 18

2.2 Gráfico CMDS das distâncias econômicas do produto entre setores norte-americanos, para o ano de 1987.. . . 18

2.3 Imagem e representa¸cão CMDS dos setores norte-americanos relativo as distâncias econômicas sob a ótica do produto, ao longo dos anos. . . 20

2.4 Imagem e representa¸cão CMDS dos setores norte-americanos relativo as distâncias econômicas sob a ótica do insumo, ao longo dos anos. . . 21

2.5 Imagem das distâncias econômicas de insumo entre setores norte-americanos interpoladas por spline cúbico. . . 23

2.6 Imagem das distâncias econômicas de produto entre setores norte-americanos interpoladas por spline cúbico. . . 24

2.7 Imagem das distˆancias econˆomicas de produto entre setores brasileiros ao longo dos anos. . . 28

2.8 Imagem das distˆancias econˆomicas de insumo entre setores brasileiros ao longo dos anos. . . 29

2.9 Imagem das distâncias econômicas de produto entre setores brasileiros interpoladas por spline cúbico. . . 30

3.1 Rela¸c˜ao graus de liberdade e curtose . . . 40

3.2 Plot das posi¸c˜oes dos 20 agentes . . . 48

(14)

3.4 S´erie dos agentes . . . 49

3.5 Porcentagem da variˆancia explicada para os agentes 2, 10 e 15 ao longo do tempo. . . 53

3.6 Porcentagem da variˆancia explicada para os tempos 50 e 100 ao longo dos locais. . . 54

3.7 Tra¸cos das cadeias a posteriori dos parˆametros. . . 58

3.8 S´erie dos agentes 9 e 15 e seus intervalos de credibilidade. . . 59

3.9 Verifica¸c˜ao de Outliers. (Acima) S´erie temporal do agente 3. (Abaixo) Box-plots das amostras a posteriori de γ_3t−1 (t = 1, . . . , 100). . . 63

3.10 S´eries dos agentes contaminados. . . 64

4.1 S´eries temporais dos ´ındices mensais de crescimento da produ¸c˜ao industrial de seis setores. . . 69

4.2 Séries temporais das taxas mensais de crescimento da produ¸cão industrial de seis setores - séries tranformadas e padronizadas.. . . 70

4.3 S´erie de zt para os SIC22 e SIC37 com seu intervalo de credibilidade de

95% modelado pela classe t-Student. . . 78

4.4 S´erie de zt para os SIC22 e SIC37 com seu intervalo de credibilidade de

95% modelado pela classe Normal. . . 79

4.5 Compara¸c˜ao das s´eries temporais yt e zt correspondentes aos agentes 3

-SIC22- (Acima) e 18 -SIC37- (Abaixo), considerando o modelo normal (iii). . . 82

4.6 (Acima) Compara¸c˜ao das s´eries temporais de yt e zt correspondente

ao agente 3 -SIC22- considerando o modelo t-Student (ii). (Abaixo) Verifica¸c˜ao de outliers: box-plots das amostras a posteriori de γ_3t−1. . . 83

(15)

4.7 (Acima) Compara¸c˜ao das s´eries temporais de yt e zt correspondente

ao agente 18 -SIC37- considerando o modelo t-Student (ii). (Abaixo) Verifica¸c˜ao de outliers: box-plots das amostras a posteriori de γ_18t−1. . . 84

4.8 S´eries temporais do crescimento dos ´ındices trimestrais do PIB de seis setores.. . . 86

4.9 S´eries temporais das taxas trimestrais de crescimento do PIB de seis setores - s´eries tranformadas e padronizadas. . . 87

4.10 Porcentagem da variˆancia explicada pelo latente e pelo erro considerando o setor 04 para o modelo t-Student simples.. . . 91

4.11 Porcentagem da variˆancia explicada pelo latente e pelo erro considerando o setor 09 para o modelo t-Student simples.. . . 91

4.12 (Acima) Compara¸c˜ao das s´eries temporais de yt e zt correspondente ao

setor 4 considerando o modelo 1. (Abaixo) Verifica¸c˜ao de outliers: box-plots das amostras a posteriori de γ_4t−1. . . 97

(16)

Cap´ıtulo 1

Introdu¸

c˜

ao

Econometria espacial é uma área de estudo, ramo da econometria, que lida com intera¸cões de estruturas espaciais em modelos de regressão linear com dados transversais e de painel. Por painel entende-se observa¸cões repetidas no tempo para um número fixo de agentes. Ultimamente, estudos sobre a econometria espacial têm crescido muito, uma vez que são consideradas rela¸cões entre agentes. Essas rela¸cões são descritas por medidas observáveis de distâncias econômicas, por exemplo quando consideramos firmas ou setores da economia como unidades observacionais e a distância entre agentes como o volume de comércio exterior. Anselin (1988) afirma que antigamente modelos que incorporavam o espa¸co eram especializados em poucas e espec´ıficas áreas, porém a idéia de intera¸cão espacial vem crescendo rapidamente tanto do ponto de vista aplicado como teórico.

O pre¸co da venda de casas em um determinado local, por exemplo, pode ser influenciada por externalidades espaciais. Nesse caso as covariáveis do modelo explicariam o pre¸co de cada casa a partir das suas caracter´ısticas e a dependência espacial ocorreria pois, pre¸cos de casas vizinhas, ou até mesmo sua localiza¸cão, influenciariam o valor da casa a ser vendida. Variáveis não observáveis ainda podem ser consideradas, como a urbaniza¸cão e o desenvolvimento de uma determinada cidade, que levariam ao aumento dos pre¸cos das casas nessa região e em regiões próximas. Para mais exemplos ver LeSage e Pace (1991), Conley e Dupor(2003) e Conley e Topa (2002).

O desenvolvimento de métodos na literatura econométrica para especificar, estimar e testar modelos que incorporam intera¸cões espaciais motivam ainda mais estudos nessa

(17)

´

area. Neste sentido Chen e Conley (2001) propõem um modelo semiparamétrico para dados de painel incorporando distâncias econômicas na sua estrutura. Por outro lado,

Conley e Dupor(2003) definem distâncias econômicas para esse tipo de modelagem. Eles constroem diferentes medidas a partir da rela¸cão de insumo e produto entre diferentes setores, utilizando tabelas de insumo produto, onde os elementos (i, j) são os valores das mercadorias do setor i utilizadas no setor j.

O presente trabalho propõe um modelo econométrico baseado em um modelo dinâmico espacial para lidar com esse tipo de problema, cujos elementos correspondem a agentes econômicos. Partimos de modelos de regressão simples e motivamos a utiliza¸cão de modelos econométricos espaciais e distâncias econômicas entre agentes, onde estas ´

ultimas tem influência tanto na estrutura de médias como na estrutura de covariância. Adicionalmente, para acomodar a presen¸ca de poss´ıveis outliers, um modelo de regressão t-Student é apresentado. Os modelos propostos podem ser vistos com uma extensão do modelo apresentado emChen e Conley (2001).

Uma forma simples de obter matrizes de distâncias econômicas é associá-las a matrizes de distâncias Euclidianas onde, quanto maior a medida Euclidiana entre dois agentes menor é o peso relacionado. Nos baseamos nas métricas propostas por Conley e Dupor

(2003), que são fun¸cões de distâncias Euclidianas, para a constru¸cão das distâncias econômicas. Diversas interpreta¸cões para as métricas econômicas podem ser sugeridas dependendo do agente considerado. Por exemplo, se os agentes correspondem a setores, pode-se dizer que os agentes estão próximos se usam insumos nas mesmas propor¸cões e longe se utilizam insumos em propor¸cões diferentes. Se os agentes correspondem a empresas, as medidas de sobreposi¸cão em seus mercados podem ser medidas de distâncias econômicas.

Dois conjuntos de dados são modelados utilizando os modelos propostos. Na primeira aplica¸cão os agentes correspondem a vinte setores industriais norte-americanos, as distâncias econômicas são baseadas em tabelas de insumo-produto e as observa¸cões são dadas pelo ´ındice de crescimento da produ¸cão industrial mensal entre os agentes. A segunda aplica¸cão refere-se à doze setores da economia brasileira, na qual as observa¸cões são dadas por ´ındices de crescimento do Produto Interno Bruto (PIB) e as distâncias

(18)

econˆomicas s˜ao constru´ıdas segundo tabelas do Instituto Brasileiro de Geografia e Estat´ıstica (IBGE).

´

E de suma importância introduzir a estrutura e a ideia geral de três tipos de modelagens: modelos dinâmicos, modelos espaciais e modelos espa¸co-temporais. Em

Migon et al. (2008) tais modelos são incorporados a estruturas hierárquicas. Nas se¸cões que seguem apresentaremos de forma resumida uma ideia geral desses modelos. Além disso, são expostos critérios para sele¸cão de modelos, dado que varia¸cões do modelo proposto são apresentadas ao longo do trabalho.

1.1 Modelos Dinˆ

amicos

Os modelos lineares dinâmicos são caracterizados pela modelagem de processos indexados ao longo do tempo e são representados por um par de equa¸cões, denominadas de equa¸cão de observa¸cões e equa¸cão de evolu¸cão dos parâmetros, que podem ser vistas abaixo:

yt = Ft0θt+ t, ∼ N (0, Vt) (1.1a)

θt = Gtθt−1+ ωt, ωt ∼ N (0, Wt) t = 1, . . . , T. (1.1b)

onde yt é uma sequência de observa¸cões ao longo do tempo condicionalmente

independentes, Ft ´e uma matriz conhecida k- dimensional que acomoda vari´aveis

explicativas, n´ıvel, tendência, sazonalidade, etc, θt é o vetor de parâmetros, Gt é uma

matriz conhecida que descreve a evolu¸c˜ao dos parˆametros e Vt e Wt representam as

matrizes de covariância dos erros associados à observa¸cão e ao vetor de parâmetros, respectivamente. Pode-se também definir o modelo através da quádrupla {Ft, Gt, Vt, Wt}.

Encontramos casos particulares da modelagem de processos indexados ao longo do tempo em West e Harrison (1997). Por exemplo, o modelo mais simples de s´eries temporais ´e o modelo polinomial de primeira ordem, no qual F_t0 = 1 e Gt = 1, logo

este modelo fica caracterizado pela qu´adrupla {1, 1, Vt, Wt}.

Do ponto de vista Bayesiano o processo de inferência funciona de forma sequencial, intercalando passos de evolu¸cão, que são feitos através da equa¸cão do sistema, e passos

(19)

de atualiza¸cão, feitos através da incorpora¸cão da informa¸cão obtida em yt usando o

Teorema de Bayes. Tal ciclo pode ser visto na Figura 1.1. O processo ocorre de forma que quando chegamos ao tempo t, nossa informa¸cão está resumida em Dt e é baseado

nesse conjunto que faremos inferência. É de grande interesse, nessa classe de modelos, predizer o comportamento futuro da série, portanto, tem-se particular interesse nas distribui¸cões preditivas, que possibilitam fazer planos a longo, médio e curto prazos e tomar decisões apropriadas.

θt−1|Dt−1

−−−−−−−−−→

EV OLU C¸ AO θt|Dt−1

−−−−−−−−−−−−−→

AT U ALIZAC¸ AO θt|Dt

posteriori priori posteriori

↓ yt|Dt−1

previs˜ao

Figura 1.1: Ciclo de inferˆencia.

1.2 Modelos Espaciais

A classe de modelos espaciais está associada a observa¸cões tomadas em vários locais identificados em algum dom´ınio espacial. Estamos tratando, portanto, de observa¸cões que variam no espa¸co.

De acordo com a natureza das observa¸cões associadas ao espa¸co em que são observadas a estat´ıstica espacial é dividida em três áreas:

(i) Geoestat´ıstica: lidam com observa¸cões pontuais de uma quantidade cont´ınua variando sobre uma região e podem ser encontradas em diferentes áreas da ciência tais como meio ambiente, mercado imobiliário, geologia, processamento de imagens, dentre outras.

(ii) Dados de área: são baseados em observa¸cões avaliadas em regiões, obtidas a partir de um número finito de localiza¸cões que compreendem toda a região sob estudo.

(20)

Exemplos relacionados aos dados de área são a presen¸ca de espécies de uma planta num quadrado, o número de casos de dengue nos bairros de uma cidade, dentre outros.

(iii) Processos pontuais são observa¸cões discretas de pontos espec´ıficos em um mapa. Exemplos relacionados a processos pontuais são localiza¸cões dos ninhos de aves em um habitat adequado ou ainda a explica¸cão de localiza¸cões de crateras lunares através de meteoros ou vulcanismo.

Essa divisão da estat´ıstica espacial está especificada em Cressie (1993), porém, nos será útil aspectos da modelagem de dados provenientes da área de geoestat´ıstica.

De modo geral, quando consideramos estrutura espacial esperamos que para localiza¸cões próximas, o processo se comporte de forma semelhante. Diferentemente, quando ocorre o aumento das distâncias entre as localiza¸cões as observa¸cões se tornam menos relacionadas. Neste contexto, os objetivos em modelos espaciais são a estima¸cão dos parâmetros do modelo e a previsão para localiza¸cões ou conjunto de localiza¸cões não observadas.

No contexo de geoestat´ıstica tem-se que {y(e) : e ∈ G} é uma realiza¸cão parcial do processo aleatório {Y (e) : e ∈ G}, na qual s varia continuamente ao longo da região G ⊂ <p, p = 1, 2 ou 3. Usualmente assume-se que o processo aleatório segue um processo Gaussiano. Então, considerando observa¸cões em N localiza¸cões temos que Y (e)|µ, Σ ∼ N (µ, Σ), no qual Y = (Y (e1), . . . , Y (eN))0, µ é um vetor de dimensão N representando

a média do processo e Σ é uma matriz N × N representando a estrutura de covariância. O processo é estacionário se µ é o mesmo para todo e e se a estrutura de covariância depende somente de e−e0, para e0 qualquer outra localiza¸cão pertencente a G. É também considerado isotrópico e, portanto, homogêneo, se essa correla¸cão só depende da distância euclidiana entre os pontos, mas não da dire¸cão.

Quando o processo é homogêneo, sua variância é constante ao longo de G. Dessa forma a fun¸cão de covariância pode ser escrita como Σ = σ2_{ρ(k e − e}0 _{k; φ), para ρ(·)}

uma fun¸cão de correla¸cão que fa¸ca a matriz de covariância uma matriz positiva definida. Os dois principais tipos de Fam´ılia de fun¸cão de correla¸cão existentes na literatura são:

(21)

• Fam´ılia Exponencial Potˆencia:

ρ(d; φ) = exp{−(d/φ)κ}

onde φ > 0 é parâmetro de escala, d é a distância euclidiana entre dois pontos quaisquer em G e 0 < κ ≤ 2. Quando κ = 1 obtém-se o caso particular da fun¸cão de correla¸cão exponencial e κ = 2 obtém-se a fun¸cão de correla¸cão exponencial potência quadrática.

• Fam´ılia Mat´ern: ρ(d; φ; λ) = 1 2λ−1_Γ(λ)(2φ √ λd)κλ(2φ √ λd),

onde φ > 0 é o parâmetro de escala e λ é o parâmetro de forma. A fun¸cão Γ(·) é a fun¸cão Gama usual e κλ é a fun¸cão modificada de Bessel do terceiro tipo de ordem λ.

Futuramente lan¸caremos mão de alguns conceitos geoestat´ısticos adaptando-os de forma apropriada às idéias principais da econometria. Do ponto de vista econométrico espacial ei representa um vetor l dimensional de quantidades econômicas associadas ao

agente econômico i. Como as medidas econômicas podem variar no tempo, é natural indexar o vetor de quantidades econômicas no tempo, {ei,t}Ni=1.

1.3 Modelos Espa¸

co-Temporais

Ainda podemos modelar processos que variam tanto no tempo como no espa¸co, para isso é preciso considerar modelos que capturem a estrutura de covariância existente nas observa¸cões. Considerar a modelagem de um processo também ao longo de diferentes instantes de tempo, além da varia¸cão no espa¸co, torna a estrutura de covariância mais complexa. As equa¸cões do sistema em (1.1) já nos fornecem uma dinâmica temporal. Resta-nos então incorporar a estrutura espacial que normalmente é inserida na matriz de covariância da equa¸cão de evolu¸cão dos parâmetros.

Uma importante questão em modelos espa¸co-temporais é a no¸cão de separabilidade ou não separabilidade da estrutura de covariância. Especificar uma fun¸cão de covariância separável é uma das formas mais simples de se obter uma covariância válida para processos que variam no espa¸co e no tempo, porém, a hipótese de separabilidade induz

(22)

limita¸cões na estrutura de correla¸cão, já que muitas áreas de aplica¸cão apresentam correla¸cões espaciais que variam temporalmente. Schmidt e Sansó (2006) discutem a modelagem Bayesiana da estrutura de covariância em processos espa¸co-temporais.

´

E muito comum denotar as localiza¸cões onde as medidas são feitas por e e os tempos de medi¸cão por t. Utilizaremos futuramente uma modelagem espa¸co-temporal, porém, as localiza¸cões serão tratadas como agentes econômicos e as observa¸cões são realizadas nesses agentes a cada instante de tempo, que será medido discretamente. Além disso, mais detalhes com rela¸cão a estrutura de covariância do modelo proposto estão especificados na Subse¸cão 3.2.2.

1.4 Sele¸

c˜

ao de Modelos

No Cap´ıtulo 3, modelos serão propostos para dois conjuntos de dados reais. Assim, surge a necessidade de métodos que possibilitem selecionar qual dos modelos propostos melhor se ajusta aos dados. Os principais critérios utilizados são: Deviance Information Criterion (DIC), deSpiegelhalter et al. (2002) e regras escore, de Gneiting et al.(2007).

Spiegelhalter et al. (2002) propõem um critério Bayesiano para escolha entre modelos hierárquicos que considera tanto o ajuste do modelo como a sua complexidade. Para um modelo de probabilidade p(y|θ) com dados observados y = (y1, . . . , yn), temos:

DIC = E[D(θ|y)] + pD (1.2)

no qual D(θ) ´e a forma geral da deviance Bayesiana que ´e dada por:

D(θ) = −2log[p(y|θ)] + 2log[f (y)] (1.3)

onde f (y) é um fator de padroniza¸cão. Segundo Spiegelhalter et al. (2002), para compara¸cão de modelos, é suficiente assumir f (y) = 1. A bondade de ajuste é medida pelo termo E[D(θ|y)] da equa¸cão (1.2), já a complexidade do modelo é medida pelo número de parâmetros, definido por:

(23)

Gneiting et al. (2007) propõem um critério cujo objetivo é verificar a bondade de ajuste. Regras escore, em um contexto Bayesiano, são consideradas como medidas de compara¸cão de modelos nesse caso. O escore médio é definido por:

S(θ) = 1 N T T X t=1 N X i=1 S(Pθ, yit) (1.5)

onde Pθ = p(y|θ) é o modelo paramétrico e S alguma regra escore própria.

Gneiting et al. (2007) discutem uma série de regras escore, em particular vamos considerar o escore logar´ıtmico(LS) e o escore probabil´ıstico de posto cont´ınuo (CRPS). Ambos escores são orientados positivamente, ou seja, o modelo com maior S(θ) é considerado melhor.

O LS ´e dado por:

LS(Pθ, yit) = log p(yrep = yit|y) (1.6)

onde yrep é denotado por uma réplica do vetor de observa¸cões. Em palavras, LS é o

logaritmo da densidade preditiva e Gschl¨oßl e Czado (2005) aproximam essa medida por uma amostra a posteriori do algoritmo MCMC.

O CRPS pode ser expresso como:

CRP S(Pθ, yit) =

1

2E|yrep,it−yerep,it| − E|yrep,it− yit| (1.7)

onde yrep,it e eyrep,it são réplicas independentes da distribui¸cão preditiva a posteriori, p(·|y). Gschlößl e Czado (2005) também estimam o CRPS de forma simples utilizando as sa´ıdas do MCMC.

1.5 Organiza¸

c˜

ao da Disserta¸

c˜

ao

A presente disserta¸cão está organizada como descrito a seguir. O Cap´ıtulo 2introduz distâncias econômicas por meio de exemplos e apresenta uma forma simples de obter essas medidas. Basicamente, é feita a descri¸cão de métricas econômicas para a constru¸cão de matrizes de distâncias econômicas para dois conjuntos de dados. O Cap´ıtulo3tem como objetivo apresentar o modelo proposto que incorpora as matrizes exógenas de distâncias

(24)

econômicas, constru´ıdas no cap´ıtulo anterior, em sua estrutura. Caracter´ısticas relevantes e interpreta¸cões do modelo são exibidas, além de varia¸cões que consideram um modelo mais geral e modelos mais simples. O procedimento de inferência, sob o paradigma Bayesiano é apresentado. Dados artificiais são gerados e estudos simulados são feitos onde métodos de Monte Carlo via cadeias de Markov (MCMC) são usados para fazer inferência. No Cap´ıtulo 4 duas aplica¸cões são apresentadas para modelar, primeiramente, ´ındices de crescimento mensal da produ¸cão industrial norte-americana e em seguida ´ındices de crescimento trimestral do PIB brasileiro. Finalmente, concluiremos a disserta¸cão com uma breve descri¸cão das poss´ıveis propostas de extensões para o presente trabalho.

(25)

Cap´ıtulo 2

Distˆ

ancias Econˆ

omicas

Este cap´ıtulo trata principalmente da descri¸cão de métodos para a constru¸cão de matrizes de distâncias econômicas. Foram constru´ıdas matrizes de distâncias para dois conjuntos de dados. Primeiro, para dados norte-americanos usados por Chen e Conley

(2001) e depois para dados brasileiros obtidos no Sistema de Contas Nacionais do Instituto Brasileiro de Geografia e Estat´ıstica - IBGE. É usado um método de interpola¸cão cúbica para que tais matrizes se tornem temporalmente compat´ıveis com as séries de dados que futuramente serão descritos. Além disso, são citados exemplos que abrangem áreas distintas para motivar e introduzir a utiliza¸cão dessas matrizes.

2.1 Introdu¸

c˜

ao

Econometria espacial é o ramo da econometria que lida com intera¸cões de estruturas espaciais em modelos de regressão linear com dados transversais e de painel. Ultimamente, estudos sobre a econometria espacial têm crescido muito, uma vez que são consideradas rela¸cões entre agentes. Essas rela¸cões são descritas por medidas observáveis de distâncias econômicas que podem ser associadas à pesos econométricos.

Uma forma simples de obter matrizes de distâncias econômicas é associá-las a matrizes de distâncias Euclidianas, onde quanto maior a medida Euclidiana entre dois agentes, mais afastados estão um do outro, menor é o peso relacionado e, consequentemente, menor a correla¸cão existente entre eles.

(26)

LeSage e Pace (1991) fornecem exemplos com respeito a diversas matrizes de distâncias econômicas, entre eles o que descreveremos a seguir, em que os elementos da matriz de distâncias econômicas são fun¸cões de distâncias Euclidianas. Considere um conjunto de sete regiões, três delas à direita do centro comercial e três delas à esquerda, além disso, existe uma única rodovia que une todas as sete regiões. Pode-se analisar o tempo de viagem para o centro comercial considerando como variáveis explicativas a distância das regiões ao centro e a densidade da popula¸cão de cada local, ou seja, há dependência espacial entre as sete regiões baseada, principalmente, na distância euclidiana entre elas.

Outro exemplo onde observa-se inclusão de externalidades espaciais, agora baseada em distâncias econômicas, é o caso de vendas de casas em um determinado local. Nesse caso, as covariáveis explicam o pre¸co de cada casa a partir das suas caracter´ısticas, e há dependência espacial, pois pre¸cos de casas vizinhas ou, até mesmo sua localiza¸cão, influenciam no valor da casa a ser vendida.

Ainda pode-se falar de firmas ou setores da economia como unidades observacionais (agentes) e a distância entre agentes como o volume de comércio exterior. Se os agentes correspondem a empresas, as medidas de sobreposi¸cão em seus mercados de varejo podem ser medidas de distâncias econômicas. Se os agentes são pa´ıses, as medidas dos volumes do comércio ou o custo de transporte entre os pa´ıses pode ser uma métrica de distância econômica apropriada.

O desenvolvimento de métodos na literatura econométrica para especificar, estimar e testar modelos que incorporam intera¸cões espaciais motivam ainda mais estudos nessa ´

area. Neste sentido Chen e Conley (2001) propõem um modelo semiparamétrico para dados de painel incorporando distâncias econômicas na sua estrutura. Por outro lado,

Conley e Dupor (2003) definem distâncias econômicas para esse tipo de modelagem. Além disso,Kakamu e Polasek(2007) abordam problemas da análise de ciclos de negócios regionais na União Européia a partir de uma nova perspectiva econométrica, utilizando uma classe de modelos espa¸co-temporais com conceito de vizinhos mais próximos. Para tanto, são constru´ıdas e analisadas diferentes tipos de matrizes de pesos.

(27)

Com o interesse de comparar matrizes de distâncias econômicas, ressaltando semelhan¸cas e diferen¸cas entre elas, lan¸camos mão, neste cap´ıtulo, de análises gráficas. Uma delas é utilizada porConley e Topa (2002) e por Conley e Dupor(2003), e consiste em representar visualmente as métricas econômicas por meio de uma configura¸cão de pontos no plano. Para isso é usado um método chamado escala multidimensional clássica (do inglês CMDS). Esses gráficos facilitam a identifica¸cão de clusters de agentes e permite a visualiza¸cão de objetos multidimensionais no plano. Um outro artif´ıcio gráfico apresentado utiliza intensidade de cores para quantificar a distância entre os agentes, permitindo, então, a análise dos pesos econométricos entre os agentes.

2.2 Constru¸

c˜

ao de Distˆ

ancias Econˆ

omicas

Nesta se¸cão descrevemos métricas para a constru¸cão de matrizes de pesos econômicos, uma delas sugerida por Conley e Dupor (2003). Para o primeiro conjunto de dados, as matrizes de distâncias são baseadas no grau de similaridade de rela¸cões de insumo-produto dos setores da economia dos EUA, caracterizando assim as intera¸cões existentes entre eles. Para os dados brasileiros a mesma métrica é utilizada, a partir da matriz brasileira de insumo-produto obtidas no IBGE. Conceitualmente, insumo-produto é a combina¸cão de fatores de produ¸cão, diretos (matérias-primas) e indiretos (mão-de-obra, energia, tributos), que entram e saem na elabora¸cão de certa quantidade de bens ou servi¸cos. Portanto, as rela¸cões de insumo-produto e as matrizes utilizadas nas aplica¸cões apresentam os bens e servi¸cos utilizados por cada setor.

Desde o trabalho de Anselin (1988), intera¸cões espaciais tornaram-se uma das preocupa¸cões na economia. Uma forma de representar essas intera¸cões é por meio da constru¸cão de matrizes de distâncias econômicas, e para isso métricas de constru¸cão devem ser sugeridas.

Independente da área de aplica¸cão, os componentes utilizados para o estudo de intera¸cões espaciais e, consequentemente, para a constru¸cão de distâncias econômicas serão denominados agentes. Torna-se cada vez mais raro análises que reflitam a estrutura

(28)

de agentes únicos, pois modelos de agentes únicos podem fornecer uma estrutura pobre para analisar os dados em questão.

Conley e Topa (2002) analisam padrões espaciais de desemprego em Chicago e as diferentes métricas de distâncias social e econômica refletem a estrutura das redes de agentes sociais, que levam em conta agentes de natureza geográfica, ocupacional, étnica, sociológica, etc. Nesse caso cada matriz é constru´ıda baseada em um agente, e em seguida combina¸cões entre as matrizes de distâncias econômicas são propostas. Um outro exemplo pode ser visto em Conley e Dupor (2003), em que um método econométrico espacial para caracterizar movimentos comuns da produtividade da economia norte-americana ´

e apresentado. Eles usam rela¸cões de input-output para obterem medidas de distância econômica, que são usadas para caracterizar intera¸cões entre setores.

Para a constru¸cão de distâncias econômicas os agentes, que agregam informa¸cões relevantes, são associados a vetores. Então N agentes nos reporta a uma estrutura N -dimensional.

Como já foi dito, uma métrica simples para a constru¸cão das matrizes de distâncias econômicas é a distância Euclidiana ou fun¸cões dela. Dessa forma, seja DEij a distância

Eucludiana entre o vetor ei referente ao agente i de dimens˜ao l e o vetor ej de dimens˜ao

l referente ao agente j, onde i, j = 1, . . . , N :

DEij = v u u t l X p=1 (eip− ejp)2

Então, quanto menor o valor de DEij mais próximo o agente i estará do agente j.

Nota-se que Dij = Dji e Dij = 0 se i = j.

2.2.1 Aplica¸

c˜

ao

a

matrizes

de

insumo-produto

norte-americanas

Conley e Dupor (2003) constroem diferentes medidas de distância econômica utilizando dados de tabelas de insumo-produto, onde os elementos (i, j) são os valores das mercadorias do setor i utilizadas no setor j. Nos EUA, essas tabelas, retratando

(29)

a econômia americana, são preparadas e divulgadas pelo Departamento de Análise Econômica a cada cinco anos. A partir da rela¸cão entre diferentes setores é definida a distância econômica pelo grau de similaridade na estrutura insumo-produto. Seja Γt

a tabela de insumo-produto observada no ano t. São nessas tabelas e nas matrizes de distância econômica, contru´ıdas a partir delas, que será baseada a caracteriza¸cão da produtividade de setores com movimentos comuns na aplica¸cão desenvolvida no Cap´ıtulo

4.

A primeira medida definida nesse artigo diz que dois setores são próximos se seus produtos são utilizados pelos mesmos setores e uma outra medida é baseada na tecnologia de cada setor, ou seja, setores com tecnologias similares utilizam insumos semelhantes e nas mesmas propor¸cões. Em suma, as duas medidas de distâncias econômicas sustentam que duas atividades econômicas são próximas se compram ou vendem bens em propor¸cões similares.

Além disso, setores são indexados segundo seus vetores de insumo e produto, e assim, suas posi¸cões correspondem a esses vetores. Portanto, setores com estruturas vetoriais similares são próximos e aqueles com estruturas distintas estão distantes. Conley e Dupor

(2003) ainda consideram a covariância entre diferentes setores modelada como fun¸cão desses ´ındices e devido ao grande número de setores eles modelam a covariância como fun¸cão da distância Euclidiana. Dessa forma, tratamos uma tabela que possui N setores como N -dimensional.

Neste artigo são definidas duas métricas, distâncias pela ótica do insumo e do produto entre os setores i e j no tempo t com elementos DI

t(i, j) e DPt (i, j), respectivamente. Para

a distância segundo os insumos, é feita a padroniza¸cão Bt(i, j) = Γt(i, j)/[

PN

p=1Γt(p, j)]

que é invariante, alterando somente a escala dos valores na matriz de distâncias econômicas final. Assim é definido:

D_tI(i, j) = ( _N X p=1 [Bt(p, i) − Bt(p, j)]2 )1/2 (2.1)

(30)

De forma análoga para a distância pela ótica do produto, considere a padroniza¸cão Ψt(i, j) = Γt(i, j)/[PN_p=1Γt(i, p)], também invariante. Então, os elementos da matriz

de distˆancia s˜ao definidos por:

DP_t (i, j) = ( _N X p=1 [Ψt(i, p) − Ψt(j, p)]2 )1/2 (2.2)

Ambas as matrizes contru´ıdas são simétricas e não-negativas.

Os N = 20 setores presentes nas tabelas de insumo-produto dos anos de 1972, 1977, 1982, 1987 e 1992 s˜ao os setores de manufaturados indexados por dois d´ıgitos do c´odigo SIC1 _{e podem ser vistos na Tabela} _2.1_.

A métrica descrita acima é adotada e aplicada às tabelas de insumo-produto da economia norte-americana composta pelos 20 setores da Tabela 2.1. Dessa forma, obtemos matrizes de distância econômica do ponto de vista do insumo e do produto. Adicionalmente, uma outra matriz de distância (Dm

t ) pode ser considerada como uma

mistura das distâncias insumo e produto a partir da inclusão de um parâmetro de mistura α, que varia entre 0 e 1. Logo,

Dm_t (i, j) = αDI_t(i, j) + (1 − α)DP_t (i, j) (2.3)

O parâmetro α poderia ser estimado e neste ponto ter´ıamos como objetivo encontrar o valor de α que nos retornasse a combina¸cão ótima das matrizes de insumo e produto. Porém, as matrizes de distância econômica calculadas serão utilizadas como exógenas no modelo que será proposto. Portanto, iremos assumir α = 0 quando o interesse estiver voltado para a matriz baseada no produto e α = 1 quando desejarmos Dm

t (i, j) = DIt(i, j).

As Figuras 2.1 e 2.2 apresentam a configura¸cão do gráfico CMDS para as distâncias econômicas, sob a ótica do insumo e do produto no ano de 1972, respectivamente. A localiza¸cão de cada setor pode ser vista a partir do seu código SIC. É notável nas Figuras

1_{Standard Industrial Classification Codes (SIC Code) ´}_{e a tentativa de classificar as ind´}_{ustrias de}

acordo com semelhan¸cas de produtos, servi¸cos e sistemas de produ¸c˜ao e entrega. SIC Codes organiza

indústrias em um crescente n´ıvel de detalhes que vão desde setores econômicos gerais até segmentos

espec´ıficos da indústria. Os dois d´ıgitos do código SIC são subunidades dos principais setores industriais

(31)

Tabela 2.1: Setores norte-americanos manufaturados indexados por dois d´ıgitos do c´odigo SIC.

SIC Code Setores

SIC 20 Alimento

SIC 21 Tabaco

SIC 22 Textil

SIC 23 Vestu´ario

SIC 24 Madeira

SIC 25 M´oveis

SIC 26 Papel

SIC 27 Imprensa

SIC 28 Produtos Qu´ımicos

SIC 29 Petr´oleo

SIC 30 Pl´astico e borracha

SIC 31 Couro

SIC 32 Pedra, vidro e argila

SIC 33 Metais Prim´arios

SIC 34 Metal´urgico

SIC 35 Máquinas não elétricas

SIC 36 M´aquinas el´etricas

SIC 37 Transporte

SIC 38 Instrumentos

SIC 39 Diversos

2.1 e 2.2 a presen¸ca de alguns clusters. Por exemplo, os setores de bens duráveis estão próximos segundo a distância constru´ıda sob a ótica do insumo. Ainda nessa métrica, metais primários (SIC 33) e metalúrgico (SIC 34) estão relativamente afastados dos demais setores e próximos um do outro. Na distância baseada no produto o setor de couro (SIC 31) está próximo dos setores de textil (SIC 22) e diversos (SIC 39). Algumas distâncias relativas ao mesmo setor variam sobre as duas métricas. Considere a localiza¸cão relativa de dois bens duráveis, como tansporte (SIC 37) e instrumentos (SIC 38). Esses setores estão próximos sob a ótica do insumo, porém suas sa´ıdas se

(32)

encaminham para diferentes clientes. Então, eles estão relativamente afastados sob o ponto de vista do produto. Transporte, na verdade, está afastado da maioria dos setores, quando falamos de distância baseada no produto, pois grande parte da produ¸cão deste setor é destinado a ele mesmo.

−0.2 0.0 0.2 0.4 0.6 −0.2 0.0 0.2 0.4 0.6 CMDS coordenada 1 coordenada 2 S20 S21 S22 S23 S24 S25 S26S27 S28 S29 S30 S31S32 S33 S34 S35 S36 S37 S38 S39

Figura 2.1: Gráfico CMDS das distâncias econômicas do insumo entre setores norte-americanos, para o ano de 1987.

−0.2 0.0 0.2 0.4 0.6 −0.6 −0.4 −0.2 0.0 0.2 0.4 0.6 CMDS coordenada 1 coordenada 2 S20 S21 S22 S23 S24 S25 S26 S27 S28 S29 S30 S31 S32 S33 S34 S35S36 S37 S38 S39

Figura 2.2: Gráfico CMDS das distâncias econômicas do produto entre setores norte-americanos, para o ano de 1987.

(33)

Além da configura¸cão CMDS, imagens das distâncias econômicas entre os setores considerando o ponto de vista do produto e do insumo para os anos de 1972, 1977, 1982, 1987, 1992 podem ser vistas nas Figuras 2.3 e 2.4, respectivamente. Quanto mais fortes as cores, menores são as distâncias econômicas entre os setores e maior é o peso associado. Nota-se que há uma grande disparidade entre a matriz do ano de 1982 e as matrizes dos demais anos tanto para o produto como para o insumo. Isso se dá pois ao longo da década de 1980, os EUA sofreram um per´ıodo de instabilidade econômica, principalmente, por sua ineficácia em responder a novos concorrentes que surgiam no mercado internacional. A economia norte-americana passou a perder espa¸co para concorrentes como pa´ıses da Europa Ocidental e Ásia, como Alemanha e Japão, nos mercados interno e externo. Essa recessão norte-americana de 79/82, é considerada a mais grave desde a Grande Depressão de 1930. Apesar da crise influenciar um aumento na correla¸cão entre os setores pode-se ver que o setor de tabaco (SIC 21), não segue os demais. Além disso, pode-se notar, nas imagens bapode-seadas no produto, que os pode-setores de comida (SIC20), tabaco (SIC21), textil (SIC22) e vestuário (SIC23) estão mais afastados (pouco correlacionados) dos demais setores. O mesmo pode ser visto para as matrizes baseadas no insumo, com mais intensidade.

A divulga¸cão das tabelas de insumo-produto a cada cinco anos nos leva a obter matrizes de distâncias econômicas que variam no tempo. Isso é, a diferen¸ca estrutural entre as matrizes obtidas, notada pela análise da matriz de 1982, nos motiva a incluir na modelagem futura diferentes matrizes para cada instante de tempo. Porém, a série temporal dos setores utilizados tem varia¸cão mensal, e dado que as matrizes constru´ıdas não são compat´ıveis na escala temporal com os dados, um método de interpola¸cão foi utilizado.

(34)

0 5 10 15 20 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 1.2 −0.4 −0.2 0.0 0.2 0.4 0.6 −0.6 −0.4 −0.2 0.0 0.2 0.4 0.6 0.8 CMDS coordenada 1 coordenada 2 S20 S21 S22S23 S24 S25 S26 S27 S28S29 S30 S31 S32 S33 S34 S35S36 S37 S38 S39 imagem − 1977 CM DS − 1977 0 5 10 15 20 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 −1.0 −0.8 −0.6 −0.4 −0.2 0.0 −0.4 −0.3 −0.2 −0.1 0.0 0.1 0.2 CMDS coordenada 1 coordenada 2 S20 S21 S22 S23 S24 S25 S26 S27 S28 S29 S30 S31 S32 S33 S34 S35 S36 S37 S38S39 imagem − 1982 CM DS − 1982 0 5 10 15 20 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 1.2 −0.4 −0.2 0.0 0.2 0.4 0.6 −0.6 −0.4 −0.2 0.0 0.2 0.4 0.6 CMDS coordenada 1 coordenada 2 S20 S21 S22 S23 S24 S25_S26 S27 S28 S29 S30 S31 S32 S33 S34 S35 S36 S37 S38 S39 imagem − 1987 CM DS − 1987

Figura 2.3: Imagem e representa¸cão CMDS dos setores norte-americanos relativo as distâncias econômicas sob a ótica do produto, ao longo dos anos.

(35)

0 5 10 15 20 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 −0.2 0.0 0.2 0.4 0.6 −0.2 0.0 0.2 0.4 CMDS coordenada 1 coordenada 2 S20 S21 S22 S23 S24 S25 S26S27 S28 S29 S30 S31 S32 S33 S34 S35 S36 S37 S38S39 imagem − 1977 CM DS − 1977 0 5 10 15 20 5 10 15 20 X Coord Y Coord 0.1 0.2 0.3 0.4 0.5 0.6 −0.1 0.0 0.1 0.2 0.3 0.4 −0.2 −0.1 0.0 0.1 0.2 CMDS coordenada 1 coordenada 2 S20 S21 S22 S23 S24 S25 S26 S27 S28 S29 S30 S31 S32 S33 S34 S35 S36 S37 S38 S39 imagem − 1982 CM DS − 1982 0 5 10 15 20 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 −0.2 0.0 0.2 0.4 −0.4 −0.2 0.0 0.2 0.4 CMDS coordenada 1 coordenada 2 S20 S21 S22 S23 S24 S25S26 S27 S28 S29 S30 S31 S32 S33 S34 S35 S36 S37 S38 S39 imagem − 1987 CM DS − 1987

Figura 2.4: Imagem e representa¸cão CMDS dos setores norte-americanos relativo as distâncias econômicas sob a ótica do insumo, ao longo dos anos.

Para obtermos matrizes de distâncias econômicas mensalmente vamos utilizar métodos de interpola¸cão por spline. O método de interpola¸cão por spline cúbico foi

(36)

escolhido porque fornece valores interpolados mais suaves ao longo do tempo com rela¸cão ao spline linear e quadrático. Então, para p = 3 considere a fun¸cão f (x) tabelada nos pontos x0, x1, . . . , xl. Uma fun¸cão Sp(x) é denominada spline de grau p com nós nos

pontos xi, i = 0, 1, . . . , l se satisfaz as seguintes condi¸c˜oes:

(i) em cada subintervalo [xi, xi+1], i = 0, 1, . . . , (l − 1), Sp(x) ´e um polinˆomio de grau

p,

(ii) Sp(x) ´e cont´ınua e tem derivada cont´ınua at´e ordem (p − 1) em [a, b].

Se além disso, Sp(x) também satisfaz a condi¸cão:

(iii) Sp(xi) = f (xi), i = 0, 1, . . . , l ent˜ao ser´a denominada spline interpolante.

Portanto, S3(x), ´e uma fun¸c˜ao polinomial por partes, cont´ınua, onde cada parte,

sk(x) = ak(x − xk)3+ bk(x − xk)2+ dk, ´e um polinˆomio de grau 3 no intervalo [xk−1, xk],

k = 1, 2, . . . , l.

Segundo a teoria de interpola¸cão por spline, vamos assumir os anos 1972, 1977, 1982, 1987 e 1992 como nós. Então, consideramos as matrizes de distâncias econômicas, obtidas por meio das tabelas, como as matrizes dos meses de janeiro de cada ano, ou seja, a matriz constru´ıda pela tabela do ano de 1972 é identificada como uma matriz de distâncias econômicas do mês de janeiro do ano de 1972. Dessa forma as demais matrizes, dos meses faltantes, entre os nós serão estimadas por interpola¸cão via spline cúbico. As Figuras 2.5 e2.6 mostram as imagens de algumas das matrizes de distâncias econômicas estimadas por spline cúbico tanto para a métrica de insumo como de produto. Mais uma vez cores mais fortes indicam menores distâncias e, consequentemente, maiores pesos. Embora as imagens se pare¸cam, os valores variam suavemente e algumas similaridades se conservam ao longo do tempo.

(37)

0 5 10 15 20 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 0 5 10 15 20 0 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 1.2 0 5 10 15 20 0 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 1.2

janeiro1972 janeiro1973 janeiro1974

0 5 10 15 20 0 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 1.2 0 5 10 15 20 0 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 1.2 0 5 10 15 20 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1

janeiro1975 janeiro1976 janeiro1977

Figura 2.5: Imagem das distâncias econômicas de insumo entre setores norte-americanos interpoladas por spline cúbico.

(38)

0 5 10 15 20 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 1.2 0 5 10 15 20 0 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 1.2 1.4 0 5 10 15 20 0 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 1.2 1.4

janeiro1972 abril1972 julho1972

0 5 10 15 20 0 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 1.2 1.4 0 5 10 15 20 0 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 0 5 10 15 20 0 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6

janeiro1973 julho1973 janeiro1974

Figura 2.6: Imagem das distâncias econômicas de produto entre setores norte-americanos interpoladas por spline cúbico.

2.2.2 Aplica¸

c˜

ao a matrizes brasileiras de insumo-produto

Matrizes insumo-produto são instrumentos da contabilidade social que permitem conhecer fluxos de bens e servi¸cos produzidos em cada setor da economia, destinados a servir de insumos a outros setores e para atender a demanda final. Essas matrizes, produzidas pelo IBGE desde a década de 1970, são elaboradas a partir dos dados das Contas Nacionais do Brasil. Seus objetivos iniciais eram a cria¸cão de um marco estrutural para o Sistema de Contas Nacionais e de uma ferramenta que ajudasse o desenvolvimento das estat´ısticas econômicas necessárias à constru¸cão de tabelas macroeconômicas.

(39)

O uso de matrizes de insumo-produto difundiu-se muito nos ´ultimos anos, e hoje ´

e considerada um instrumento de grande utilidade para analisar os efeitos estruturais de choques na economia, bem como para fazer proje¸c˜oes sobre o comportamento de atividades.

Uma matriz de insumo-produto é entendida normalmente como uma matriz de coeficientes técnicos diretos que apresenta o quanto determinado setor econômico necessita consumir dos demais setores para que possa produzir uma unidade monetária adicional. O cálculo da matriz de coeficientes técnicos diretos é baseado nas tabelas de produ¸cão e consumo intermediário das Tabelas de Recursos e Usos - TRU. Estas tabelas devem sofrer altera¸cões para se adequarem às caracter´ısticas de um modelo de insumo-produto.

A partir do cálculo dos coeficientes técnicos diretos e das matrizes de insumo-produto, modelos são propostos e diversas matrizes podem ser extra´ıdas, uma delas é a matriz dos coeficientes técnicos intersetoriais. Pelo fato desta matriz nos fornecer a dependência direta, atividade por atividade, a selecionamos para, a partir dela, obtermos uma matriz de distâncias econômicas. Detalhes de modelos e cálculos para obten¸cão de matrizes podem ser vistos no endere¸co http://www.ipeadata.gov.br.

As atividades econômicas utilizadas nas matrizes calculadas pelo IBGE, inclusive nas matrizes dos coeficientes técnicos que utilizaremos, podem ser descritas segundo diferentes n´ıveis. As desigualdades nas descri¸cões das atividades, baseada nos n´ıveis, leva-nos à atividades mais agregadas ou menos agregadas, dependendo do n´ıvel. Na Se¸cão 4.2 do Cap´ıtulo 4 definimos os dados com os quais utilizaremos as matrizes dos coeficientes técnicos intersetoriais e vale ressaltar que deve haver compatibilidade entre os setores que compõem as matrizes e os setores analisados nos dados. Para atingir essa compatibilidade a CNAE (Classifica¸cão Nacional de Atividades Econômicas) apresenta a padroniza¸cão nacional dos códigos de atividades econômicas. A partir disso, agregamos os setores desagregados das matrizes de coeficientes técnicos intersetoriais, somando atividades pertencentes à mesma descri¸cão, para atingir a igualdade desejada. A Tabela

(40)

Tabela 2.2: Atividades da economia brasileira

C´odigo da Atividade n´ıvel 12 Descri¸c˜ao da Atividade n´ıvel 12

01 Agropecu´aria

02 Ind´ustria extrativa mineral

03 Ind´ustria de transforma¸c˜ao

04 Produ¸cão e distribui¸cão de eletricidade, gás e água

05 Constru¸c˜ao

06 Com´ercio

07 Transporte armazenagem e correio

08 Servi¸cos de informa¸c˜ao

09 Intermedia¸c˜ao financeira, seguros e previdˆencia complementar

10 Atividades imobili´arias e aluguel

11 Outros servi¸cos

12 Administra¸cão, saúde e educa¸cão públicas

As matrizes de coeficientes técnicos intersetoriais referentes aos anos 1992, 1993, 1994, 1995, 1996, 2000, 2005 e contendo os 12 setores apresentados, foram obtidas. A partir delas as matrizes de distâncias econômicas foram constru´ıdas baseadas nas métricas de insumo e produto propostas por Conley e Dupor (2003) pelas equa¸cões em (2.1) e (2.2). As matrizes de distâncias econômicas nos fornecem as rela¸cões existentes entre os 12 setores da economia brasileira considerados, ou seja, se o elemento Dt(i, j) for pequeno

temos que a distância econômica entre o setor i e o setor j é pequena, e portanto a rela¸cão entre eles é forte. Podemos observar essas rela¸cões de forma gráfica por meio das Figuras 2.7 e 2.8. A primeira delas nos mostra as imagens e os gráficos CMDS das matrizes de distâncias econômicas sob a ótica do produto nos anos de 1993, 1996, 2005. A segunda figura, com a mesma varia¸cão temporal que a primeira, apresenta as distâncias

(41)

econômicas baseadas na métrica do insumo. Em ambas as figuras temos que as cores mais fortes representam menores distâncias e, portanto, maiores pesos econométricos.

Observe que independente da ótica sob a qual as matrizes de distâncias econômicas estão baseadas, o setor de produ¸cão e distribui¸cão de eletricidade e água (setor 04) se matém afastado dos demais ao longo dos anos. No gráfico das imagens é poss´ıvel notar tal afastamento devido a faixa mais clara presente ao longo do setor 04, e no gráfico CMDS notamos pela grande distância f´ısica de ”S4”dos demais setores. Além disso, pode-se notar que o setor de atividades imobiliárias e aluguel (setor 10) está distante dos outros setores, sob a ótica do insumo. Já sob a ótica do produto esse setor está inserido em um cluster formado pelos setores de intermedia¸cão financeira, seguros e previdência complementar (setor 09) e outros servi¸cos (setor 11).

As matrizes aqui calculadas serão utilizadas como matrizes de distância exógenas na aplica¸cão desenvolvida no Cap´ıtulo 4. Vale ressaltar que é necessário haver compatibilidade temporal entre as matrizes calculadas e a série temporal dos dados, que são trimestrais. Portanto, o método de interpola¸cão por spline será utilizado para encontrarmos matrizes intermediárias e dessa forma transformá-las em matrizes trimestrais.

O método de interpola¸cão por spline cúbico, que já foi descrito anteriormente, tem como ponto de partida os nós da interpola¸cão. Dessa forma, vamos assumir as matrizes dos anos de 1992, 1993, 1994, 1995, 1996, 2000, 2005 como nós referentes ao primeiro trimestre de cada um deses anos. As matrizes referentes aos trimestres entre os nós serão estimadas por interpola¸cão via spline cúbico. A Figura2.9mostra as imagens de algumas matrizes de distâncias econômicas estimadas segundo a métrica de produto.

(42)

0 2 4 6 8 10 12 14 0 2 4 6 8 10 12 X Coord Y Coord 0.2 0.4 0.6 0.8 −0.2 0.0 0.2 0.4 −0.4 −0.3 −0.2 −0.1 0.0 CMDS coordenada 1 coordenada 2 S1 S2 S3 S4 S5 S6_{S7 S8} S9S10 S11 S12 1993 CM DS − 1993 0 2 4 6 8 10 12 14 0 2 4 6 8 10 12 X Coord Y Coord 0.2 0.4 0.6 −0.3 −0.2 −0.1 0.0 0.1 0.2 0.3 −0.1 0.0 0.1 0.2 CMDS coordenada 1 coordenada 2 S1 S2 S3 S4 S5 S6 S7 S8 S9 _S10S11 S12 1996 CM DS − 1996 0 2 4 6 8 10 12 14 0 2 4 6 8 10 12 X Coord Y Coord 0.2 0.4 0.6 0.8 −0.2 0.0 0.2 0.4 −0.2 −0.1 0.0 0.1 0.2 0.3 0.4 CMDS coordenada 1 coordenada 2 S1 S2 S3 S4 S5 S6 S7 S8S10S9 S11 S12 2005 CM DS − 2005

Figura 2.7: Imagem das distˆancias econˆomicas de produto entre setores brasileiros ao longo dos anos.

(43)

0 2 4 6 8 10 12 14 0 2 4 6 8 10 12 X Coord Y Coord 0.2 0.4 0.6 0.8 1 −0.2 0.0 0.2 0.4 0.6 −0.2 0.0 0.2 0.4 0.6 CMDS coordenada 1 coordenada 2 S1 S2 S3 S4 S5 S6 S7 S8 S9 S10 S11 S12 1992 CM DS − 1993 0 2 4 6 8 10 12 14 0 2 4 6 8 10 12 X Coord Y Coord 0.2 0.4 0.6 0.8 1 −0.2 0.0 0.2 0.4 0.6 0.8 −0.2 0.0 0.2 0.4 CMDS coordenada 1 coordenada 2 S1 S2 S3 S4 S5 S6 S7 S8 S9 S10 S11 S12 1995 CM DS − 1996 0 2 4 6 8 10 12 14 0 2 4 6 8 10 12 X Coord Y Coord 0.2 0.4 0.6 −0.2 −0.1 0.0 0.1 0.2 0.3 0.4 −0.2 −0.1 0.0 0.1 0.2 0.3 0.4 0.5 CMDS coordenada 1 coordenada 2 S1 S2 S3 S4 S5 S6 S7 S8 S9 S10 S11 S12 2005 CM DS − 2005

Figura 2.8: Imagem das distˆancias econˆomicas de insumo entre setores brasileiros ao longo dos anos.

(44)

0 5 10 15 0 2 4 6 8 10 12 14 X Coord Y Coord 0.2 0.4 0.6 0.8 0 5 10 15 0 2 4 6 8 10 12 14 X Coord Y Coord 0.2 0.4 0.6 0.8 0 5 10 15 0 2 4 6 8 10 12 14 X Coord Y Coord 0.2 0.4 0.6 0.8

1otrimestre1992 3otrimestre1992 1otrimestre1993

0 5 10 15 0 2 4 6 8 10 12 14 X Coord Y Coord 0.2 0.4 0.6 0.8 0 5 10 15 0 2 4 6 8 10 12 14 X Coord Y Coord 0.2 0.4 0.6 0.8 0 5 10 15 0 2 4 6 8 10 12 14 X Coord Y Coord 0.2 0.4 0.6 0.8

2otrimestre1993 4otrimestre1993 1otrimestre1994 Figura 2.9: Imagem das distâncias econômicas de produto entre setores brasileiros interpoladas por spline cúbico.

(45)

Cap´ıtulo 3

Modelos Espa¸

co-Temporais com

Distˆ

ancias Econˆ

omicas

Neste cap´ıtulo um modelo econométrico espacial dinâmico é proposto. Esse modelo trata da dependência econométrica espacial através da intera¸cão entre unidades observacionais e da dependência temporal atribuindo a cada unidade uma série temporal. Além disso, foi incoporado ao modelo a idéia, já tratada no Cap´ıtulo 2, de distâncias econômicas, que irão influenciar tanto na estrutura de médias como na estrutura de covariância.

3.1 Introdu¸

c˜

ao

Neste cap´ıtulo serão desenvolvidos modelos econométricos espa¸co-temporais para dados de painel, cujos elementos correspondem a agentes econômicos. Por painel entende-se obentende-serva¸cões repetidas no tempo para um número fixo de agentes. Exemplos com este tipo de dados incluem observa¸cões trimestrais sobre variáveis de setores espec´ıficos ou ainda dados de pre¸cos semanais para empresas em uma região. Dados de painel para modelos espaciais e econométricos espaciais tem sido amplamente utilizados na literatura.

Baltagi et al. (2003), Case (1991) e Kapoor et al. (2004) utilizam modelos, para dados de painel, com correla¸c˜ao espacial no erro. Baltagi et al. (2003) abordam modelos de regress˜ao com essas caracter´ısticas e fazem testes de multiplicadores de Lagrange para

(46)

permitir correla¸cão espacial do erro bem como efeitos aleatórios. Já Case (1991) discute processos econômicos que dão origem a padrões espaciais nos dados. Kelejian e Prucha

(1999) e Bell e Bockstael (2000) sugerem respectivamente, um estimador de momentos generalizados, computacionalmente simples e independente do tamanho da amostra, para o parâmetro autorregressivo de um modelo espacial, e a primeira aplica¸cão em econometria espacial para as técnicas desenvolvidas por Kelejian e Prucha (1999) para dados de painel de grandes dimensões.

Muitos modelos tradicionais em econometria não consideram intera¸cões entre agentes econômicos. Nesses casos, frequentemente, é assumido que o resultado de um agente não é afetado pelo resultado dos demais. No entanto, as decisões econômicas são caracterizadas por um significativo grau de interdependência. Portanto, sob a forma de dependência espacial, modelos econométricos incorporam similaridades entre agentes ou especialidades geográficas, como medidas que são incorporadas na estrutura de covariância ou ainda na média do processo. Exemplos seguindo essa abordagem podem ser vistos principalmente em Anselin (1988), que trata de modelos e métodos da econometria espacial. Anselin

(1988) motivou uma s´erie de estudos mais aprofundados na ´area como: Anselin et al.

(2004), que apresentam importantes avan¸cos na área econométrica espacial, LeSage e Pace(2004), que tratam também de econometria espa¸co-temporal eGamerman e Moreira

(2004), que descrevem procedimentos para realizar inferência Bayesiana em modelos multivariados econométricos com componente espacial, entre outros. Baltagi et al.(2007) reune uma série de estudos que se relacionam tanto para o desenvolvimento teórico de modelos espaciais na economia para a análise de dados espacialmente dependentes, como para aplica¸cões às diferentes questões econômicas.

Agentes que se encontram em um espa¸co Euclidiano foram modelados. As distâncias entre eles, inicialmente, são determinadas simplesmente pela distância Euclidiana e mais tarde por uma métrica econômica. A métrica atribu´ıda pode, por exemplo, mostrar que os agentes estão próximos, se eles usam insumos nas mesmas propor¸cões, e longe, se utilizam insumos em propor¸cões diferentes, caso os agentes correspondam a setores econômicos.

(47)

Nosso modelo de gera¸cão de dados é dinâmico com um parâmetro de estados autorregressivo onde média e matriz de variância são fun¸cões de distâncias econômicas entre agentes. Portanto, levaremos em considera¸cão a dependência espacial entre os agentes por meio de distâncias econômicas que serão incorporadas tanto na média como na estrutura de variância do modelo. Além disso, ambos os termos são influenciados por fun¸cões de distâncias econômicas entre agentes que variam ao longo do tempo. A estrutura incorporada na média é padronizada e, devido a isso, carrega uma interpreta¸cão de interdependência temporal e entre agentes com pesos atribu´ıdos. Já a distância incorporada na variância é dotada de princ´ıpios espaciais para a estrutura de covariância, ou seja, usamos representa¸cões de estruturas estat´ısticas da literatura para particularizar as fun¸cões de distâncias econômicas presentes no modelo. As distâncias econômicas foram calculadas segundo a métrica econômica descrita no Cap´ıtulo 2 e serão exogenamente incorporadas ao modelo.

A principal contribui¸c˜ao deste trabalho consiste na abordagem de Chen e Conley

(2001) com algumas altera¸cões na modelagem. Adicionalmente, a fim de acomodar a ocasional presen¸ca de outliers um modelo de regressão t-Student também é apresentado. A estima¸cão dos modelos será feita lan¸cando mão de uma abordagem completamente Bayesiana. É avaliada a sensibilidade para a especifica¸cão de distribui¸cões a priori para os hiperparâmetros e, finalmente, exemplos utilizando dados artificiais são apresentados. Neste caso a métrica econômica utilizada se resume a distância Euclidiana.

O restante do cap´ıtulo está organizado da seguinte forma. A Se¸cão 3.2 descreve o modelo proposto, algumas das suas caracter´ısticas, apresenta especifica¸cões para as fun¸cões de distâncias econômicas e interpreta¸cões para elas. A Se¸cão3.3 apresenta nossa estratégia de estima¸cão, ou seja, apresenta o procedimento de inferência, todo sob o enfoque Bayesiano. A Se¸cão 3.4 discute a possibilidade de modelagem de séries não estacionárias e apresenta um exemplo simulado para verifica¸cão da proposta. As Se¸cões

3.5e3.6apresentam estudos simulados com dados artificiais tanto para o modelo proposto como para sua extens˜ao, que trata da acomoda¸c˜ao de poss´ıveis outliers.