Modelos dinˆ
amicos Bayesianos para dados
de painel usando distˆ
ancias econˆ
omicas
Larissa de Carvalho Alves
Universidade Federal do Rio de Janeiro
Instituto de Matem´
atica
Departamento de M´etodos Estat´ısticos
2010
Modelos dinˆ
amicos Bayesianos para dados
de painel usando distˆ
ancias econˆ
omicas
Larissa de Carvalho Alves
Disserta¸c˜ao submetida ao Corpo Docente do Instituto de Matem´atica - Departamento de M´etodos Estat´ısticos da Universidade Federal do Rio de Janeiro - UFRJ, como parte dos requisitos necess´arios `a obten¸c˜ao do grau de Mestre em Estat´ıstica.
Aprovada por:
Prof. H´elio S. Migon. PhD - UFRJ - Orientador.
Esther Salazar.
D.Sc. - SAMSI - Co-orientadora.
Prof. Alexandra M. Schmidt PhD - UFRJ.
Prof. Juliano J. Assun¸c˜ao D.Sc. - Puc-Rio.
Rio de Janeiro, RJ - Brasil 2010
FICHA CATALOGR ´AFICA
Alves, Larissa de Carvalho.
Modelos dinˆamicos Bayesianos para dados de painel usando distˆancias econˆomicas Larissa de Carvalho Alves.
Rio de Janeiro: UFRJ, IM, DME, 2010.
Disserta¸c˜ao - Universidade Federal do Rio de Janeiro, IM, DME. 1. Introdu¸c˜ao. 2. Distˆancias Econˆomicas.
3. Modelos Espa¸co Temporais com Distˆancias Econˆomicas. 4. Aplica¸c˜oes.
5. Conclus˜oes e Trabalhos Futuros.
(Mestrado-UFRJ/IM/DME) I. Migon, H´elio S.
`
A Deus, autor e consumador da minha f´e. `
A minha fam´ılia. `
Eu te agrade¸co, Deus
Por se lembrar de mim, e pelo teu favor E o que me faz crescer;
Eu vivo pela f´e, e n˜ao vacilo; Eu n˜ao paro, eu n˜ao desisto, Eu sou de Deus, eu sou de Cristo. Vocˆe mudou a minha hist´oria
E fez o que ningu´em podia imaginar Vocˆe acreditou e isso ´e tudo
S´o vivo pra vocˆe N˜ao sou do mundo, n˜ao. A honra, a gl´oria, a for¸ca
O louvor a Deus
E o levantar das minhas m˜aos ´
E pra dizer que te perten¸co, Deus. (. . .)
Eu te agrade¸co, Deus
Que no deserto n˜ao me deixou morrer E nem desanimar
E como aquela m˜ae, que n˜ao desiste vocˆe n˜ao se esqueceu, vocˆe insiste... Vocˆe mudou a minha hist´oria
E fez o que ningu´em podia imaginar Vocˆe acreditou e isso ´e tudo
S´o vivo pra vocˆe N˜ao sou do mundo, n˜ao. A honra, a gl´oria, a for¸ca
O louvor a Deus
E o levantar das minhas m˜aos ´
E pra dizer que te perten¸co, Deus.
Agradecimentos
Primeiramente, agrade¸co a Deus por sua imensa miseric´ordia e gra¸ca, pelo socorro bem presente nas tribula¸c˜oes.
`
A minha fam´ılia, a base de tudo. Aos meus pais, pelo amor incondicional, dedica¸c˜ao e ora¸c˜oes. Pelo financiamento dos meus estudos e por sempre acreditarem que eu era capaz. A minha irm˜` a, pela amizade, pelos conselhos e por tantas d´uvidas tiradas. Apesar de neste momento estar t˜ao longe, foi uma irm˜a e tanto quando se trata das noites viradas para estudar e do compartilhamento do computador. `As minhas tias, tios, primas e primos pela for¸ca passada mesmo por telefone e por sempre torcerem pelo meu sucesso. `A minha av´o Georgeta (in memorian), que apesar de ter partido ano passado e estar deixando enormes saudades, tal acontecimento tem me dado for¸cas para prosseguir. Obrigada v´o por ter cedido parte da sua vida para cuidar de mim, por ter deixado todos os filhos em Salvador e vindo para o Rio por mim e pela minha irm˜a, serei eternamente grata `a senhora.
Ao C´esar pelo amor, compreens˜ao e amizade. Por me apoiar em cada decis˜ao tomada e por me fazer a cada dia mais feliz.
Aos meus amigos e companheiros do DME que compartilharam comigo experiˆencias, momentos de dificuldade e de alegria e fizeram esta caminhada menos sofrida e mais divertida. Em especial, agrade¸co a minha turma Jo˜ao, Kelly, Nassif, Targino e Thiago vocˆes s˜ao a turma que qualquer um gostaria de fazer parte, muito obrigada, vocˆes s˜ao muito especiais. Em mais que especial, `a Panela (Camilinha, Jo˜ao e Kelly) que unida jamais ser´a vencida, que crise mundial n˜ao afeta, nem uma marolinha, rs. N˜ao tenho
Aos meus velhos amigos capianos por quase sempre compreenderem minha ausˆencia nos eventos, anivers´arios, Ch´a das 5, despedidas e recep¸c˜oes. Vocˆes s˜ao inesquec´ıveis. Aos meus velhos amigos de gradua¸c˜ao por passarem comigo uma importante fase da minha vida e marcarem cada uma delas de forma especial. Aos meus irm˜aos em Cristo, Geisa, Rom´ario, Ana Paula e Fernando, pelas ora¸c˜oes e conselhos.
`
A todos os meus professores de gradua¸c˜ao que me passaram com grande sabedoria seus conhecimentos matem´aticos. Em particular, obrigada Rubinho, Jair, Mˆonica, Luziane e Ivo. `A todos os professores do programa de p´os-gradua¸c˜ao do DME-UFRJ, pelo valioso conhecimento transmitido, pelas maravilhosas aulas e toda a disponibilidade para ajudar. Em especial, `a Alexandra pelos conselhos e ajuda nos momentos de dificuldade.
Ao meu orientador, professor H´elio Migon, pela experiˆencia passada e pela ajuda no desenvolvimento deste trabalho.
`
A minha co-orientadora Esther Salazar, por toda a experiˆencia computacional que hoje possuo, pela paciˆencia infinita ao longo deste ano, pelas muitas horas de dedica¸c˜ao, pela ajuda e organiza¸c˜ao na resposta aos e-mails depois da sua viagem.
Por fim, agrade¸co aos professores Alexandra Schmidt e Juliano Assun¸c˜ao por aceitarem participar da banca, ao Conley, por fonecer os dados de uma das aplica¸c˜oes deste trabalho e `a Capes por ter financiado este estudo.
Resumo
Neste trabalho apresentamos um modelo econom´etrico espa¸co-temporal para dados de painel, onde os elementos correspondem a agentes econˆomicos. A dependˆencia espacial entre agentes ´e caracterizada por fun¸c˜oes de distˆancias econˆomicas que s˜ao incorporadas tanto na estrutura de m´edia como na estrutura de covariˆancia do modelo.
Partimos de modelos de regress˜ao simples e motivamos a utiliza¸c˜ao de modelos econom´etricos espaciais, distˆancias entre agentes e adicionalmente, para acomodar poss´ıveis outliers, introduzimos um modelo de regress˜ao t-Student. Temos como objetivo incorporar rela¸c˜oes entre setores da economia que s˜ao dadas por suas similaridades e al´em disso fazer a estima¸c˜ao dos modelos lan¸cando m˜ao de uma abordagem completamente Bayesiana. Vamos utilizar o modelo proposto e suas varia¸c˜oes, para modelar dois conjuntos de dados. Na primeira aplica¸c˜ao estudamos a produ¸c˜ao mensal dos movimentos comuns entre vinte setores industriais dos EUA. A segunda aplica¸c˜ao refere-se `a setores da economia brasileira, na qual as observa¸c˜oes s˜ao dadas por ´ındices de crescimento do Produto Interno Bruto.
Palavras-chave: Econometria espacial; Distˆancias econˆomicas; Inferˆencia bayesiana; Modelos dinˆamicos; M´etodos MCMC
Abstract
In this work we present an econometric spatio-temporal models for panel data, where the elements correspond to economic agents. The spatial dependence between agents is characterized by functions of economic distances that are incorporated into both the mean structure as the covariance structure of the model.
We start with a simple regression model and motivate the use of spatial econometric models, distances between agents and, additionally, we introduce a Student-t model to accommodate possible outliers. Our goal is to incorporate relationships between economic sectors that are given by their similarities and also to estimate the models using a fully Bayesian approach. We use the proposed model and its variations, to analyze two datasets. In the first application, we study the monthly production of twenty industries in the U.S.. The second application refers to sectors of the Brazilian economy where the observations are growth rates of Gross Domestic Product.
Keywords: Spacial econometrics; Economic distances; Bayesian inference; Dynamic models; MCMC methods
Sum´
ario
1 Introdu¸c˜ao 2
1.1 Modelos Dinˆamicos . . . 4
1.2 Modelos Espaciais. . . 5
1.3 Modelos Espa¸co-Temporais. . . 7
1.4 Sele¸c˜ao de Modelos . . . 8
1.5 Organiza¸c˜ao da Disserta¸c˜ao . . . 9
2 Distˆancias Econˆomicas 11 2.1 Introdu¸c˜ao . . . 11
2.2 Constru¸c˜ao de Distˆancias Econˆomicas . . . 13
2.2.1 Aplica¸c˜ao a matrizes de insumo-produto norte-americanas . . . . 14
2.2.2 Aplica¸c˜ao a matrizes brasileiras de insumo-produto . . . 24
3 Modelos Espa¸co-Temporais com Distˆancias Econˆomicas 31 3.1 Introdu¸c˜ao . . . 31
3.2 Modelo Proposto . . . 34
3.2.1 Especifica¸c˜oes para G(Dt) e Σ(Dt) . . . 35
3.2.2 N˜ao separabilidade . . . 37
3.2.3 Acomoda¸c˜ao de outliers . . . 39
3.2.4 Fun¸c˜ao de verossimilhan¸ca . . . 41
3.3 Procedimento de Inferˆencia. . . 42
3.4 Modelando S´eries Temporais N˜ao Estacion´arias . . . 43
3.5.1 Variˆancia explicada . . . 50
3.5.2 Algoritmo para o c´alculo da variˆancia de zt e βt . . . 51
3.5.3 Resultados da variˆancia explicada . . . 52
3.5.4 Compara¸c˜ao entre modelos . . . 54
3.5.5 Resultados a posteriori . . . 55
3.6 Estudo Num´erico Baseado em Dados Artificiais t-Student . . . 60
3.6.1 Regress˜ao t-Student . . . 61
3.6.2 Contamina¸c˜ao dos dados . . . 64
4 Aplica¸c˜oes 67 4.1 Atividades da Economia Norte-Americana . . . 68
4.1.1 An´alise descritiva dos dados . . . 68
4.1.2 Modelos propostos . . . 73
4.1.3 Principais resultados . . . 75
4.2 Setores da Economia Brasileira . . . 85
4.2.1 An´alise descritiva dos dados . . . 85
4.2.2 Modelos propostos . . . 88
4.2.3 Principais resultados . . . 94
5 Conclus˜oes e Trabalhos Futuros 101 A M´etodos de Simula¸c˜ao Estoc´astica 104 A.1 Algoritmo de Metropolis-Hastings . . . 104
A.2 Amostrador de Gibbs . . . 105
A.3 Filtro de Kalman e FFBS . . . 106
A.4 Distribui¸c˜oes condicionais completas . . . 107
B Cadeias dos Parˆametros a Posteriori 110 B.1 Para Aplica¸c˜ao dos Dados Norte-Americanos . . . 110
Lista de Tabelas
2.1 Setores norte-americanos manufaturados indexados por dois d´ıgitos do
c´odigo SIC. . . 17
2.2 Atividades da economia brasileira . . . 26
3.1 Probabilidade de ρ 6= 1 a posteriori para diferentes valores de ρ. . . 45
3.2 Probabilidade de ρi 6= 1 a posteriori para diferentes setores . . . 46
3.3 Compara¸c˜ao de modelos pelo EMQ e EMA . . . 55
3.4 Estat´ısticas dos valores das amostras de φ, τ2, σ2, ρ e β. . . . . 60
3.5 Estat´ısticas das amostras dos parˆametros para diferentes prioris para ν . 62 3.6 Estat´ısticas das amostras dos parˆametros para diferentes prioris para ν . 62 3.7 Estat´ısticas das amostras dos parˆametros para diferentes prioris para ν . 62 4.1 An´alise explorat´oria dos dados transformados . . . 72
4.2 Crit´erios de compara¸c˜ao de modelos . . . 76
4.3 Estat´ısticas dos valores das amostras dos parˆametros. . . 80
4.4 An´alise explorat´oria dos dados tranformados . . . 88
4.5 Crit´erios de compara¸c˜ao dos modelos simples . . . 90
4.6 Crit´erios de compara¸c˜ao dos modelos intermedi´arios . . . 93
4.7 Crit´erios de compara¸c˜ao de modelos completos . . . 95
Lista de Figuras
1.1 Ciclo de inferˆencia. . . 5
2.1 Gr´afico CMDS das distˆancias econˆomicas do insumo entre setores norte-americanos, para o ano de 1987.. . . 18
2.2 Gr´afico CMDS das distˆancias econˆomicas do produto entre setores norte-americanos, para o ano de 1987.. . . 18
2.3 Imagem e representa¸c˜ao CMDS dos setores norte-americanos relativo as distˆancias econˆomicas sob a ´otica do produto, ao longo dos anos. . . 20
2.4 Imagem e representa¸c˜ao CMDS dos setores norte-americanos relativo as distˆancias econˆomicas sob a ´otica do insumo, ao longo dos anos. . . 21
2.5 Imagem das distˆancias econˆomicas de insumo entre setores norte-americanos interpoladas por spline c´ubico. . . 23
2.6 Imagem das distˆancias econˆomicas de produto entre setores norte-americanos interpoladas por spline c´ubico. . . 24
2.7 Imagem das distˆancias econˆomicas de produto entre setores brasileiros ao longo dos anos. . . 28
2.8 Imagem das distˆancias econˆomicas de insumo entre setores brasileiros ao longo dos anos. . . 29
2.9 Imagem das distˆancias econˆomicas de produto entre setores brasileiros interpoladas por spline c´ubico. . . 30
3.1 Rela¸c˜ao graus de liberdade e curtose . . . 40
3.2 Plot das posi¸c˜oes dos 20 agentes . . . 48
3.4 S´erie dos agentes . . . 49
3.5 Porcentagem da variˆancia explicada para os agentes 2, 10 e 15 ao longo do tempo. . . 53
3.6 Porcentagem da variˆancia explicada para os tempos 50 e 100 ao longo dos locais. . . 54
3.7 Tra¸cos das cadeias a posteriori dos parˆametros. . . 58
3.8 S´erie dos agentes 9 e 15 e seus intervalos de credibilidade. . . 59
3.9 Verifica¸c˜ao de Outliers. (Acima) S´erie temporal do agente 3. (Abaixo) Box-plots das amostras a posteriori de γ3t−1 (t = 1, . . . , 100). . . 63
3.10 S´eries dos agentes contaminados. . . 64
3.11 Verifica¸c˜ao de Outliers. (Acima) S´erie temporal do agente 5. (Abaixo) Box-plots das amostras a posteriori de γ5t−1 (t = 1, . . . , 100). . . 65
3.12 Verifica¸c˜ao de Outliers. (Acima) S´erie temporal do agente 12. (Abaixo) Box-plots das amostras a posteriori de γ12t−1 (t = 1, . . . , 100). . . 66
4.1 S´eries temporais dos ´ındices mensais de crescimento da produ¸c˜ao industrial de seis setores. . . 69
4.2 S´eries temporais das taxas mensais de crescimento da produ¸c˜ao industrial de seis setores - s´eries tranformadas e padronizadas.. . . 70
4.3 S´erie de zt para os SIC22 e SIC37 com seu intervalo de credibilidade de
95% modelado pela classe t-Student. . . 78
4.4 S´erie de zt para os SIC22 e SIC37 com seu intervalo de credibilidade de
95% modelado pela classe Normal. . . 79
4.5 Compara¸c˜ao das s´eries temporais yt e zt correspondentes aos agentes 3
-SIC22- (Acima) e 18 -SIC37- (Abaixo), considerando o modelo normal (iii). . . 82
4.6 (Acima) Compara¸c˜ao das s´eries temporais de yt e zt correspondente
ao agente 3 -SIC22- considerando o modelo t-Student (ii). (Abaixo) Verifica¸c˜ao de outliers: box-plots das amostras a posteriori de γ3t−1. . . 83
4.7 (Acima) Compara¸c˜ao das s´eries temporais de yt e zt correspondente
ao agente 18 -SIC37- considerando o modelo t-Student (ii). (Abaixo) Verifica¸c˜ao de outliers: box-plots das amostras a posteriori de γ18t−1. . . 84
4.8 S´eries temporais do crescimento dos ´ındices trimestrais do PIB de seis setores.. . . 86
4.9 S´eries temporais das taxas trimestrais de crescimento do PIB de seis setores - s´eries tranformadas e padronizadas. . . 87
4.10 Porcentagem da variˆancia explicada pelo latente e pelo erro considerando o setor 04 para o modelo t-Student simples.. . . 91
4.11 Porcentagem da variˆancia explicada pelo latente e pelo erro considerando o setor 09 para o modelo t-Student simples.. . . 91
4.12 (Acima) Compara¸c˜ao das s´eries temporais de yt e zt correspondente ao
setor 4 considerando o modelo 1. (Abaixo) Verifica¸c˜ao de outliers: box-plots das amostras a posteriori de γ4t−1. . . 97
4.13 (Acima) Compara¸c˜ao das s´eries temporais de yt e zt correspondente ao
setor 4 considerando o modelo 2. (Abaixo) Verifica¸c˜ao de outliers: box-plots das amostras a posteriori de γ4t−1. . . 98
4.14 (Acima) Compara¸c˜ao das s´eries temporais de yt e zt correspondente ao
setor 9 considerando o modelo 1. (Abaixo) Verifica¸c˜ao de outliers: box-plots das amostras a posteriori de γ9t−1. . . 99
4.15 (Acima) Compara¸c˜ao das s´eries temporais de yt e zt correspondente ao
setor 9 considerando o modelo 2. (Abaixo) Verifica¸c˜ao de outliers: box-plots das amostras a posteriori de γ9t−1. . . 100
Cap´ıtulo 1
Introdu¸
c˜
ao
Econometria espacial ´e uma ´area de estudo, ramo da econometria, que lida com intera¸c˜oes de estruturas espaciais em modelos de regress˜ao linear com dados transversais e de painel. Por painel entende-se observa¸c˜oes repetidas no tempo para um n´umero fixo de agentes. Ultimamente, estudos sobre a econometria espacial tˆem crescido muito, uma vez que s˜ao consideradas rela¸c˜oes entre agentes. Essas rela¸c˜oes s˜ao descritas por medidas observ´aveis de distˆancias econˆomicas, por exemplo quando consideramos firmas ou setores da economia como unidades observacionais e a distˆancia entre agentes como o volume de com´ercio exterior. Anselin (1988) afirma que antigamente modelos que incorporavam o espa¸co eram especializados em poucas e espec´ıficas ´areas, por´em a id´eia de intera¸c˜ao espacial vem crescendo rapidamente tanto do ponto de vista aplicado como te´orico.
O pre¸co da venda de casas em um determinado local, por exemplo, pode ser influenciada por externalidades espaciais. Nesse caso as covari´aveis do modelo explicariam o pre¸co de cada casa a partir das suas caracter´ısticas e a dependˆencia espacial ocorreria pois, pre¸cos de casas vizinhas, ou at´e mesmo sua localiza¸c˜ao, influenciariam o valor da casa a ser vendida. Vari´aveis n˜ao observ´aveis ainda podem ser consideradas, como a urbaniza¸c˜ao e o desenvolvimento de uma determinada cidade, que levariam ao aumento dos pre¸cos das casas nessa regi˜ao e em regi˜oes pr´oximas. Para mais exemplos ver LeSage e Pace (1991), Conley e Dupor(2003) e Conley e Topa (2002).
O desenvolvimento de m´etodos na literatura econom´etrica para especificar, estimar e testar modelos que incorporam intera¸c˜oes espaciais motivam ainda mais estudos nessa
´
area. Neste sentido Chen e Conley (2001) prop˜oem um modelo semiparam´etrico para dados de painel incorporando distˆancias econˆomicas na sua estrutura. Por outro lado,
Conley e Dupor(2003) definem distˆancias econˆomicas para esse tipo de modelagem. Eles constroem diferentes medidas a partir da rela¸c˜ao de insumo e produto entre diferentes setores, utilizando tabelas de insumo produto, onde os elementos (i, j) s˜ao os valores das mercadorias do setor i utilizadas no setor j.
O presente trabalho prop˜oe um modelo econom´etrico baseado em um modelo dinˆamico espacial para lidar com esse tipo de problema, cujos elementos correspondem a agentes econˆomicos. Partimos de modelos de regress˜ao simples e motivamos a utiliza¸c˜ao de modelos econom´etricos espaciais e distˆancias econˆomicas entre agentes, onde estas ´
ultimas tem influˆencia tanto na estrutura de m´edias como na estrutura de covariˆancia. Adicionalmente, para acomodar a presen¸ca de poss´ıveis outliers, um modelo de regress˜ao t-Student ´e apresentado. Os modelos propostos podem ser vistos com uma extens˜ao do modelo apresentado emChen e Conley (2001).
Uma forma simples de obter matrizes de distˆancias econˆomicas ´e associ´a-las a matrizes de distˆancias Euclidianas onde, quanto maior a medida Euclidiana entre dois agentes menor ´e o peso relacionado. Nos baseamos nas m´etricas propostas por Conley e Dupor
(2003), que s˜ao fun¸c˜oes de distˆancias Euclidianas, para a constru¸c˜ao das distˆancias econˆomicas. Diversas interpreta¸c˜oes para as m´etricas econˆomicas podem ser sugeridas dependendo do agente considerado. Por exemplo, se os agentes correspondem a setores, pode-se dizer que os agentes est˜ao pr´oximos se usam insumos nas mesmas propor¸c˜oes e longe se utilizam insumos em propor¸c˜oes diferentes. Se os agentes correspondem a empresas, as medidas de sobreposi¸c˜ao em seus mercados podem ser medidas de distˆancias econˆomicas.
Dois conjuntos de dados s˜ao modelados utilizando os modelos propostos. Na primeira aplica¸c˜ao os agentes correspondem a vinte setores industriais norte-americanos, as distˆancias econˆomicas s˜ao baseadas em tabelas de insumo-produto e as observa¸c˜oes s˜ao dadas pelo ´ındice de crescimento da produ¸c˜ao industrial mensal entre os agentes. A segunda aplica¸c˜ao refere-se `a doze setores da economia brasileira, na qual as observa¸c˜oes s˜ao dadas por ´ındices de crescimento do Produto Interno Bruto (PIB) e as distˆancias
econˆomicas s˜ao constru´ıdas segundo tabelas do Instituto Brasileiro de Geografia e Estat´ıstica (IBGE).
´
E de suma importˆancia introduzir a estrutura e a ideia geral de trˆes tipos de modelagens: modelos dinˆamicos, modelos espaciais e modelos espa¸co-temporais. Em
Migon et al. (2008) tais modelos s˜ao incorporados a estruturas hier´arquicas. Nas se¸c˜oes que seguem apresentaremos de forma resumida uma ideia geral desses modelos. Al´em disso, s˜ao expostos crit´erios para sele¸c˜ao de modelos, dado que varia¸c˜oes do modelo proposto s˜ao apresentadas ao longo do trabalho.
1.1
Modelos Dinˆ
amicos
Os modelos lineares dinˆamicos s˜ao caracterizados pela modelagem de processos indexados ao longo do tempo e s˜ao representados por um par de equa¸c˜oes, denominadas de equa¸c˜ao de observa¸c˜oes e equa¸c˜ao de evolu¸c˜ao dos parˆametros, que podem ser vistas abaixo:
yt = Ft0θt+ t, ∼ N (0, Vt) (1.1a)
θt = Gtθt−1+ ωt, ωt ∼ N (0, Wt) t = 1, . . . , T. (1.1b)
onde yt ´e uma sequˆencia de observa¸c˜oes ao longo do tempo condicionalmente
independentes, Ft ´e uma matriz conhecida k- dimensional que acomoda vari´aveis
explicativas, n´ıvel, tendˆencia, sazonalidade, etc, θt ´e o vetor de parˆametros, Gt ´e uma
matriz conhecida que descreve a evolu¸c˜ao dos parˆametros e Vt e Wt representam as
matrizes de covariˆancia dos erros associados `a observa¸c˜ao e ao vetor de parˆametros, respectivamente. Pode-se tamb´em definir o modelo atrav´es da qu´adrupla {Ft, Gt, Vt, Wt}.
Encontramos casos particulares da modelagem de processos indexados ao longo do tempo em West e Harrison (1997). Por exemplo, o modelo mais simples de s´eries temporais ´e o modelo polinomial de primeira ordem, no qual Ft0 = 1 e Gt = 1, logo
este modelo fica caracterizado pela qu´adrupla {1, 1, Vt, Wt}.
Do ponto de vista Bayesiano o processo de inferˆencia funciona de forma sequencial, intercalando passos de evolu¸c˜ao, que s˜ao feitos atrav´es da equa¸c˜ao do sistema, e passos
de atualiza¸c˜ao, feitos atrav´es da incorpora¸c˜ao da informa¸c˜ao obtida em yt usando o
Teorema de Bayes. Tal ciclo pode ser visto na Figura 1.1. O processo ocorre de forma que quando chegamos ao tempo t, nossa informa¸c˜ao est´a resumida em Dt e ´e baseado
nesse conjunto que faremos inferˆencia. ´E de grande interesse, nessa classe de modelos, predizer o comportamento futuro da s´erie, portanto, tem-se particular interesse nas distribui¸c˜oes preditivas, que possibilitam fazer planos a longo, m´edio e curto prazos e tomar decis˜oes apropriadas.
θt−1|Dt−1
−−−−−−−−−→
EV OLU C¸ AO θt|Dt−1
−−−−−−−−−−−−−→
AT U ALIZAC¸ AO θt|Dt
posteriori priori posteriori
↓ yt|Dt−1
previs˜ao
Figura 1.1: Ciclo de inferˆencia.
1.2
Modelos Espaciais
A classe de modelos espaciais est´a associada a observa¸c˜oes tomadas em v´arios locais identificados em algum dom´ınio espacial. Estamos tratando, portanto, de observa¸c˜oes que variam no espa¸co.
De acordo com a natureza das observa¸c˜oes associadas ao espa¸co em que s˜ao observadas a estat´ıstica espacial ´e dividida em trˆes ´areas:
(i) Geoestat´ıstica: lidam com observa¸c˜oes pontuais de uma quantidade cont´ınua variando sobre uma regi˜ao e podem ser encontradas em diferentes ´areas da ciˆencia tais como meio ambiente, mercado imobili´ario, geologia, processamento de imagens, dentre outras.
(ii) Dados de ´area: s˜ao baseados em observa¸c˜oes avaliadas em regi˜oes, obtidas a partir de um n´umero finito de localiza¸c˜oes que compreendem toda a regi˜ao sob estudo.
Exemplos relacionados aos dados de ´area s˜ao a presen¸ca de esp´ecies de uma planta num quadrado, o n´umero de casos de dengue nos bairros de uma cidade, dentre outros.
(iii) Processos pontuais s˜ao observa¸c˜oes discretas de pontos espec´ıficos em um mapa. Exemplos relacionados a processos pontuais s˜ao localiza¸c˜oes dos ninhos de aves em um habitat adequado ou ainda a explica¸c˜ao de localiza¸c˜oes de crateras lunares atrav´es de meteoros ou vulcanismo.
Essa divis˜ao da estat´ıstica espacial est´a especificada em Cressie (1993), por´em, nos ser´a ´util aspectos da modelagem de dados provenientes da ´area de geoestat´ıstica.
De modo geral, quando consideramos estrutura espacial esperamos que para localiza¸c˜oes pr´oximas, o processo se comporte de forma semelhante. Diferentemente, quando ocorre o aumento das distˆancias entre as localiza¸c˜oes as observa¸c˜oes se tornam menos relacionadas. Neste contexto, os objetivos em modelos espaciais s˜ao a estima¸c˜ao dos parˆametros do modelo e a previs˜ao para localiza¸c˜oes ou conjunto de localiza¸c˜oes n˜ao observadas.
No contexo de geoestat´ıstica tem-se que {y(e) : e ∈ G} ´e uma realiza¸c˜ao parcial do processo aleat´orio {Y (e) : e ∈ G}, na qual s varia continuamente ao longo da regi˜ao G ⊂ <p, p = 1, 2 ou 3. Usualmente assume-se que o processo aleat´orio segue um processo Gaussiano. Ent˜ao, considerando observa¸c˜oes em N localiza¸c˜oes temos que Y (e)|µ, Σ ∼ N (µ, Σ), no qual Y = (Y (e1), . . . , Y (eN))0, µ ´e um vetor de dimens˜ao N representando
a m´edia do processo e Σ ´e uma matriz N × N representando a estrutura de covariˆancia. O processo ´e estacion´ario se µ ´e o mesmo para todo e e se a estrutura de covariˆancia depende somente de e−e0, para e0 qualquer outra localiza¸c˜ao pertencente a G. ´E tamb´em considerado isotr´opico e, portanto, homogˆeneo, se essa correla¸c˜ao s´o depende da distˆancia euclidiana entre os pontos, mas n˜ao da dire¸c˜ao.
Quando o processo ´e homogˆeneo, sua variˆancia ´e constante ao longo de G. Dessa forma a fun¸c˜ao de covariˆancia pode ser escrita como Σ = σ2ρ(k e − e0 k; φ), para ρ(·)
uma fun¸c˜ao de correla¸c˜ao que fa¸ca a matriz de covariˆancia uma matriz positiva definida. Os dois principais tipos de Fam´ılia de fun¸c˜ao de correla¸c˜ao existentes na literatura s˜ao:
• Fam´ılia Exponencial Potˆencia:
ρ(d; φ) = exp{−(d/φ)κ}
onde φ > 0 ´e parˆametro de escala, d ´e a distˆancia euclidiana entre dois pontos quaisquer em G e 0 < κ ≤ 2. Quando κ = 1 obt´em-se o caso particular da fun¸c˜ao de correla¸c˜ao exponencial e κ = 2 obt´em-se a fun¸c˜ao de correla¸c˜ao exponencial potˆencia quadr´atica.
• Fam´ılia Mat´ern: ρ(d; φ; λ) = 1 2λ−1Γ(λ)(2φ √ λd)κλ(2φ √ λd),
onde φ > 0 ´e o parˆametro de escala e λ ´e o parˆametro de forma. A fun¸c˜ao Γ(·) ´e a fun¸c˜ao Gama usual e κλ ´e a fun¸c˜ao modificada de Bessel do terceiro tipo de ordem λ.
Futuramente lan¸caremos m˜ao de alguns conceitos geoestat´ısticos adaptando-os de forma apropriada `as id´eias principais da econometria. Do ponto de vista econom´etrico espacial ei representa um vetor l dimensional de quantidades econˆomicas associadas ao
agente econˆomico i. Como as medidas econˆomicas podem variar no tempo, ´e natural indexar o vetor de quantidades econˆomicas no tempo, {ei,t}Ni=1.
1.3
Modelos Espa¸
co-Temporais
Ainda podemos modelar processos que variam tanto no tempo como no espa¸co, para isso ´e preciso considerar modelos que capturem a estrutura de covariˆancia existente nas observa¸c˜oes. Considerar a modelagem de um processo tamb´em ao longo de diferentes instantes de tempo, al´em da varia¸c˜ao no espa¸co, torna a estrutura de covariˆancia mais complexa. As equa¸c˜oes do sistema em (1.1) j´a nos fornecem uma dinˆamica temporal. Resta-nos ent˜ao incorporar a estrutura espacial que normalmente ´e inserida na matriz de covariˆancia da equa¸c˜ao de evolu¸c˜ao dos parˆametros.
Uma importante quest˜ao em modelos espa¸co-temporais ´e a no¸c˜ao de separabilidade ou n˜ao separabilidade da estrutura de covariˆancia. Especificar uma fun¸c˜ao de covariˆancia separ´avel ´e uma das formas mais simples de se obter uma covariˆancia v´alida para processos que variam no espa¸co e no tempo, por´em, a hip´otese de separabilidade induz
limita¸c˜oes na estrutura de correla¸c˜ao, j´a que muitas ´areas de aplica¸c˜ao apresentam correla¸c˜oes espaciais que variam temporalmente. Schmidt e Sans´o (2006) discutem a modelagem Bayesiana da estrutura de covariˆancia em processos espa¸co-temporais.
´
E muito comum denotar as localiza¸c˜oes onde as medidas s˜ao feitas por e e os tempos de medi¸c˜ao por t. Utilizaremos futuramente uma modelagem espa¸co-temporal, por´em, as localiza¸c˜oes ser˜ao tratadas como agentes econˆomicos e as observa¸c˜oes s˜ao realizadas nesses agentes a cada instante de tempo, que ser´a medido discretamente. Al´em disso, mais detalhes com rela¸c˜ao a estrutura de covariˆancia do modelo proposto est˜ao especificados na Subse¸c˜ao 3.2.2.
1.4
Sele¸
c˜
ao de Modelos
No Cap´ıtulo 3, modelos ser˜ao propostos para dois conjuntos de dados reais. Assim, surge a necessidade de m´etodos que possibilitem selecionar qual dos modelos propostos melhor se ajusta aos dados. Os principais crit´erios utilizados s˜ao: Deviance Information Criterion (DIC), deSpiegelhalter et al. (2002) e regras escore, de Gneiting et al.(2007).
Spiegelhalter et al. (2002) prop˜oem um crit´erio Bayesiano para escolha entre modelos hier´arquicos que considera tanto o ajuste do modelo como a sua complexidade. Para um modelo de probabilidade p(y|θ) com dados observados y = (y1, . . . , yn), temos:
DIC = E[D(θ|y)] + pD (1.2)
no qual D(θ) ´e a forma geral da deviance Bayesiana que ´e dada por:
D(θ) = −2log[p(y|θ)] + 2log[f (y)] (1.3)
onde f (y) ´e um fator de padroniza¸c˜ao. Segundo Spiegelhalter et al. (2002), para compara¸c˜ao de modelos, ´e suficiente assumir f (y) = 1. A bondade de ajuste ´e medida pelo termo E[D(θ|y)] da equa¸c˜ao (1.2), j´a a complexidade do modelo ´e medida pelo n´umero de parˆametros, definido por:
Gneiting et al. (2007) prop˜oem um crit´erio cujo objetivo ´e verificar a bondade de ajuste. Regras escore, em um contexto Bayesiano, s˜ao consideradas como medidas de compara¸c˜ao de modelos nesse caso. O escore m´edio ´e definido por:
S(θ) = 1 N T T X t=1 N X i=1 S(Pθ, yit) (1.5)
onde Pθ = p(y|θ) ´e o modelo param´etrico e S alguma regra escore pr´opria.
Gneiting et al. (2007) discutem uma s´erie de regras escore, em particular vamos considerar o escore logar´ıtmico(LS) e o escore probabil´ıstico de posto cont´ınuo (CRPS). Ambos escores s˜ao orientados positivamente, ou seja, o modelo com maior S(θ) ´e considerado melhor.
O LS ´e dado por:
LS(Pθ, yit) = log p(yrep = yit|y) (1.6)
onde yrep ´e denotado por uma r´eplica do vetor de observa¸c˜oes. Em palavras, LS ´e o
logaritmo da densidade preditiva e Gschl¨oßl e Czado (2005) aproximam essa medida por uma amostra a posteriori do algoritmo MCMC.
O CRPS pode ser expresso como:
CRP S(Pθ, yit) =
1
2E|yrep,it−yerep,it| − E|yrep,it− yit| (1.7)
onde yrep,it e eyrep,it s˜ao r´eplicas independentes da distribui¸c˜ao preditiva a posteriori, p(·|y). Gschl¨oßl e Czado (2005) tamb´em estimam o CRPS de forma simples utilizando as sa´ıdas do MCMC.
1.5
Organiza¸
c˜
ao da Disserta¸
c˜
ao
A presente disserta¸c˜ao est´a organizada como descrito a seguir. O Cap´ıtulo 2introduz distˆancias econˆomicas por meio de exemplos e apresenta uma forma simples de obter essas medidas. Basicamente, ´e feita a descri¸c˜ao de m´etricas econˆomicas para a constru¸c˜ao de matrizes de distˆancias econˆomicas para dois conjuntos de dados. O Cap´ıtulo3tem como objetivo apresentar o modelo proposto que incorpora as matrizes ex´ogenas de distˆancias
econˆomicas, constru´ıdas no cap´ıtulo anterior, em sua estrutura. Caracter´ısticas relevantes e interpreta¸c˜oes do modelo s˜ao exibidas, al´em de varia¸c˜oes que consideram um modelo mais geral e modelos mais simples. O procedimento de inferˆencia, sob o paradigma Bayesiano ´e apresentado. Dados artificiais s˜ao gerados e estudos simulados s˜ao feitos onde m´etodos de Monte Carlo via cadeias de Markov (MCMC) s˜ao usados para fazer inferˆencia. No Cap´ıtulo 4 duas aplica¸c˜oes s˜ao apresentadas para modelar, primeiramente, ´ındices de crescimento mensal da produ¸c˜ao industrial norte-americana e em seguida ´ındices de crescimento trimestral do PIB brasileiro. Finalmente, concluiremos a disserta¸c˜ao com uma breve descri¸c˜ao das poss´ıveis propostas de extens˜oes para o presente trabalho.
Cap´ıtulo 2
Distˆ
ancias Econˆ
omicas
Este cap´ıtulo trata principalmente da descri¸c˜ao de m´etodos para a constru¸c˜ao de matrizes de distˆancias econˆomicas. Foram constru´ıdas matrizes de distˆancias para dois conjuntos de dados. Primeiro, para dados norte-americanos usados por Chen e Conley
(2001) e depois para dados brasileiros obtidos no Sistema de Contas Nacionais do Instituto Brasileiro de Geografia e Estat´ıstica - IBGE. ´E usado um m´etodo de interpola¸c˜ao c´ubica para que tais matrizes se tornem temporalmente compat´ıveis com as s´eries de dados que futuramente ser˜ao descritos. Al´em disso, s˜ao citados exemplos que abrangem ´areas distintas para motivar e introduzir a utiliza¸c˜ao dessas matrizes.
2.1
Introdu¸
c˜
ao
Econometria espacial ´e o ramo da econometria que lida com intera¸c˜oes de estruturas espaciais em modelos de regress˜ao linear com dados transversais e de painel. Ultimamente, estudos sobre a econometria espacial tˆem crescido muito, uma vez que s˜ao consideradas rela¸c˜oes entre agentes. Essas rela¸c˜oes s˜ao descritas por medidas observ´aveis de distˆancias econˆomicas que podem ser associadas `a pesos econom´etricos.
Uma forma simples de obter matrizes de distˆancias econˆomicas ´e associ´a-las a matrizes de distˆancias Euclidianas, onde quanto maior a medida Euclidiana entre dois agentes, mais afastados est˜ao um do outro, menor ´e o peso relacionado e, consequentemente, menor a correla¸c˜ao existente entre eles.
LeSage e Pace (1991) fornecem exemplos com respeito a diversas matrizes de distˆancias econˆomicas, entre eles o que descreveremos a seguir, em que os elementos da matriz de distˆancias econˆomicas s˜ao fun¸c˜oes de distˆancias Euclidianas. Considere um conjunto de sete regi˜oes, trˆes delas `a direita do centro comercial e trˆes delas `a esquerda, al´em disso, existe uma ´unica rodovia que une todas as sete regi˜oes. Pode-se analisar o tempo de viagem para o centro comercial considerando como vari´aveis explicativas a distˆancia das regi˜oes ao centro e a densidade da popula¸c˜ao de cada local, ou seja, h´a dependˆencia espacial entre as sete regi˜oes baseada, principalmente, na distˆancia euclidiana entre elas.
Outro exemplo onde observa-se inclus˜ao de externalidades espaciais, agora baseada em distˆancias econˆomicas, ´e o caso de vendas de casas em um determinado local. Nesse caso, as covari´aveis explicam o pre¸co de cada casa a partir das suas caracter´ısticas, e h´a dependˆencia espacial, pois pre¸cos de casas vizinhas ou, at´e mesmo sua localiza¸c˜ao, influenciam no valor da casa a ser vendida.
Ainda pode-se falar de firmas ou setores da economia como unidades observacionais (agentes) e a distˆancia entre agentes como o volume de com´ercio exterior. Se os agentes correspondem a empresas, as medidas de sobreposi¸c˜ao em seus mercados de varejo podem ser medidas de distˆancias econˆomicas. Se os agentes s˜ao pa´ıses, as medidas dos volumes do com´ercio ou o custo de transporte entre os pa´ıses pode ser uma m´etrica de distˆancia econˆomica apropriada.
O desenvolvimento de m´etodos na literatura econom´etrica para especificar, estimar e testar modelos que incorporam intera¸c˜oes espaciais motivam ainda mais estudos nessa ´
area. Neste sentido Chen e Conley (2001) prop˜oem um modelo semiparam´etrico para dados de painel incorporando distˆancias econˆomicas na sua estrutura. Por outro lado,
Conley e Dupor (2003) definem distˆancias econˆomicas para esse tipo de modelagem. Al´em disso,Kakamu e Polasek(2007) abordam problemas da an´alise de ciclos de neg´ocios regionais na Uni˜ao Europ´eia a partir de uma nova perspectiva econom´etrica, utilizando uma classe de modelos espa¸co-temporais com conceito de vizinhos mais pr´oximos. Para tanto, s˜ao constru´ıdas e analisadas diferentes tipos de matrizes de pesos.
Com o interesse de comparar matrizes de distˆancias econˆomicas, ressaltando semelhan¸cas e diferen¸cas entre elas, lan¸camos m˜ao, neste cap´ıtulo, de an´alises gr´aficas. Uma delas ´e utilizada porConley e Topa (2002) e por Conley e Dupor(2003), e consiste em representar visualmente as m´etricas econˆomicas por meio de uma configura¸c˜ao de pontos no plano. Para isso ´e usado um m´etodo chamado escala multidimensional cl´assica (do inglˆes CMDS). Esses gr´aficos facilitam a identifica¸c˜ao de clusters de agentes e permite a visualiza¸c˜ao de objetos multidimensionais no plano. Um outro artif´ıcio gr´afico apresentado utiliza intensidade de cores para quantificar a distˆancia entre os agentes, permitindo, ent˜ao, a an´alise dos pesos econom´etricos entre os agentes.
2.2
Constru¸
c˜
ao de Distˆ
ancias Econˆ
omicas
Nesta se¸c˜ao descrevemos m´etricas para a constru¸c˜ao de matrizes de pesos econˆomicos, uma delas sugerida por Conley e Dupor (2003). Para o primeiro conjunto de dados, as matrizes de distˆancias s˜ao baseadas no grau de similaridade de rela¸c˜oes de insumo-produto dos setores da economia dos EUA, caracterizando assim as intera¸c˜oes existentes entre eles. Para os dados brasileiros a mesma m´etrica ´e utilizada, a partir da matriz brasileira de insumo-produto obtidas no IBGE. Conceitualmente, insumo-produto ´e a combina¸c˜ao de fatores de produ¸c˜ao, diretos (mat´erias-primas) e indiretos (m˜ao-de-obra, energia, tributos), que entram e saem na elabora¸c˜ao de certa quantidade de bens ou servi¸cos. Portanto, as rela¸c˜oes de insumo-produto e as matrizes utilizadas nas aplica¸c˜oes apresentam os bens e servi¸cos utilizados por cada setor.
Desde o trabalho de Anselin (1988), intera¸c˜oes espaciais tornaram-se uma das preocupa¸c˜oes na economia. Uma forma de representar essas intera¸c˜oes ´e por meio da constru¸c˜ao de matrizes de distˆancias econˆomicas, e para isso m´etricas de constru¸c˜ao devem ser sugeridas.
Independente da ´area de aplica¸c˜ao, os componentes utilizados para o estudo de intera¸c˜oes espaciais e, consequentemente, para a constru¸c˜ao de distˆancias econˆomicas ser˜ao denominados agentes. Torna-se cada vez mais raro an´alises que reflitam a estrutura
de agentes ´unicos, pois modelos de agentes ´unicos podem fornecer uma estrutura pobre para analisar os dados em quest˜ao.
Conley e Topa (2002) analisam padr˜oes espaciais de desemprego em Chicago e as diferentes m´etricas de distˆancias social e econˆomica refletem a estrutura das redes de agentes sociais, que levam em conta agentes de natureza geogr´afica, ocupacional, ´etnica, sociol´ogica, etc. Nesse caso cada matriz ´e constru´ıda baseada em um agente, e em seguida combina¸c˜oes entre as matrizes de distˆancias econˆomicas s˜ao propostas. Um outro exemplo pode ser visto em Conley e Dupor (2003), em que um m´etodo econom´etrico espacial para caracterizar movimentos comuns da produtividade da economia norte-americana ´
e apresentado. Eles usam rela¸c˜oes de input-output para obterem medidas de distˆancia econˆomica, que s˜ao usadas para caracterizar intera¸c˜oes entre setores.
Para a constru¸c˜ao de distˆancias econˆomicas os agentes, que agregam informa¸c˜oes relevantes, s˜ao associados a vetores. Ent˜ao N agentes nos reporta a uma estrutura N -dimensional.
Como j´a foi dito, uma m´etrica simples para a constru¸c˜ao das matrizes de distˆancias econˆomicas ´e a distˆancia Euclidiana ou fun¸c˜oes dela. Dessa forma, seja DEij a distˆancia
Eucludiana entre o vetor ei referente ao agente i de dimens˜ao l e o vetor ej de dimens˜ao
l referente ao agente j, onde i, j = 1, . . . , N :
DEij = v u u t l X p=1 (eip− ejp)2
Ent˜ao, quanto menor o valor de DEij mais pr´oximo o agente i estar´a do agente j.
Nota-se que Dij = Dji e Dij = 0 se i = j.
2.2.1
Aplica¸
c˜
ao
a
matrizes
de
insumo-produto
norte-americanas
Conley e Dupor (2003) constroem diferentes medidas de distˆancia econˆomica utilizando dados de tabelas de insumo-produto, onde os elementos (i, j) s˜ao os valores das mercadorias do setor i utilizadas no setor j. Nos EUA, essas tabelas, retratando
a econˆomia americana, s˜ao preparadas e divulgadas pelo Departamento de An´alise Econˆomica a cada cinco anos. A partir da rela¸c˜ao entre diferentes setores ´e definida a distˆancia econˆomica pelo grau de similaridade na estrutura insumo-produto. Seja Γt
a tabela de insumo-produto observada no ano t. S˜ao nessas tabelas e nas matrizes de distˆancia econˆomica, contru´ıdas a partir delas, que ser´a baseada a caracteriza¸c˜ao da produtividade de setores com movimentos comuns na aplica¸c˜ao desenvolvida no Cap´ıtulo
4.
A primeira medida definida nesse artigo diz que dois setores s˜ao pr´oximos se seus produtos s˜ao utilizados pelos mesmos setores e uma outra medida ´e baseada na tecnologia de cada setor, ou seja, setores com tecnologias similares utilizam insumos semelhantes e nas mesmas propor¸c˜oes. Em suma, as duas medidas de distˆancias econˆomicas sustentam que duas atividades econˆomicas s˜ao pr´oximas se compram ou vendem bens em propor¸c˜oes similares.
Al´em disso, setores s˜ao indexados segundo seus vetores de insumo e produto, e assim, suas posi¸c˜oes correspondem a esses vetores. Portanto, setores com estruturas vetoriais similares s˜ao pr´oximos e aqueles com estruturas distintas est˜ao distantes. Conley e Dupor
(2003) ainda consideram a covariˆancia entre diferentes setores modelada como fun¸c˜ao desses ´ındices e devido ao grande n´umero de setores eles modelam a covariˆancia como fun¸c˜ao da distˆancia Euclidiana. Dessa forma, tratamos uma tabela que possui N setores como N -dimensional.
Neste artigo s˜ao definidas duas m´etricas, distˆancias pela ´otica do insumo e do produto entre os setores i e j no tempo t com elementos DI
t(i, j) e DPt (i, j), respectivamente. Para
a distˆancia segundo os insumos, ´e feita a padroniza¸c˜ao Bt(i, j) = Γt(i, j)/[
PN
p=1Γt(p, j)]
que ´e invariante, alterando somente a escala dos valores na matriz de distˆancias econˆomicas final. Assim ´e definido:
DtI(i, j) = ( N X p=1 [Bt(p, i) − Bt(p, j)]2 )1/2 (2.1)
De forma an´aloga para a distˆancia pela ´otica do produto, considere a padroniza¸c˜ao Ψt(i, j) = Γt(i, j)/[PNp=1Γt(i, p)], tamb´em invariante. Ent˜ao, os elementos da matriz
de distˆancia s˜ao definidos por:
DPt (i, j) = ( N X p=1 [Ψt(i, p) − Ψt(j, p)]2 )1/2 (2.2)
Ambas as matrizes contru´ıdas s˜ao sim´etricas e n˜ao-negativas.
Os N = 20 setores presentes nas tabelas de insumo-produto dos anos de 1972, 1977, 1982, 1987 e 1992 s˜ao os setores de manufaturados indexados por dois d´ıgitos do c´odigo SIC1 e podem ser vistos na Tabela 2.1.
A m´etrica descrita acima ´e adotada e aplicada `as tabelas de insumo-produto da economia norte-americana composta pelos 20 setores da Tabela 2.1. Dessa forma, obtemos matrizes de distˆancia econˆomica do ponto de vista do insumo e do produto. Adicionalmente, uma outra matriz de distˆancia (Dm
t ) pode ser considerada como uma
mistura das distˆancias insumo e produto a partir da inclus˜ao de um parˆametro de mistura α, que varia entre 0 e 1. Logo,
Dmt (i, j) = αDIt(i, j) + (1 − α)DPt (i, j) (2.3)
O parˆametro α poderia ser estimado e neste ponto ter´ıamos como objetivo encontrar o valor de α que nos retornasse a combina¸c˜ao ´otima das matrizes de insumo e produto. Por´em, as matrizes de distˆancia econˆomica calculadas ser˜ao utilizadas como ex´ogenas no modelo que ser´a proposto. Portanto, iremos assumir α = 0 quando o interesse estiver voltado para a matriz baseada no produto e α = 1 quando desejarmos Dm
t (i, j) = DIt(i, j).
As Figuras 2.1 e 2.2 apresentam a configura¸c˜ao do gr´afico CMDS para as distˆancias econˆomicas, sob a ´otica do insumo e do produto no ano de 1972, respectivamente. A localiza¸c˜ao de cada setor pode ser vista a partir do seu c´odigo SIC. ´E not´avel nas Figuras
1Standard Industrial Classification Codes (SIC Code) ´e a tentativa de classificar as ind´ustrias de
acordo com semelhan¸cas de produtos, servi¸cos e sistemas de produ¸c˜ao e entrega. SIC Codes organiza
ind´ustrias em um crescente n´ıvel de detalhes que v˜ao desde setores econˆomicos gerais at´e segmentos
espec´ıficos da ind´ustria. Os dois d´ıgitos do c´odigo SIC s˜ao subunidades dos principais setores industriais
Tabela 2.1: Setores norte-americanos manufaturados indexados por dois d´ıgitos do c´odigo SIC.
SIC Code Setores
SIC 20 Alimento
SIC 21 Tabaco
SIC 22 Textil
SIC 23 Vestu´ario
SIC 24 Madeira
SIC 25 M´oveis
SIC 26 Papel
SIC 27 Imprensa
SIC 28 Produtos Qu´ımicos
SIC 29 Petr´oleo
SIC 30 Pl´astico e borracha
SIC 31 Couro
SIC 32 Pedra, vidro e argila
SIC 33 Metais Prim´arios
SIC 34 Metal´urgico
SIC 35 M´aquinas n˜ao el´etricas
SIC 36 M´aquinas el´etricas
SIC 37 Transporte
SIC 38 Instrumentos
SIC 39 Diversos
2.1 e 2.2 a presen¸ca de alguns clusters. Por exemplo, os setores de bens dur´aveis est˜ao pr´oximos segundo a distˆancia constru´ıda sob a ´otica do insumo. Ainda nessa m´etrica, metais prim´arios (SIC 33) e metal´urgico (SIC 34) est˜ao relativamente afastados dos demais setores e pr´oximos um do outro. Na distˆancia baseada no produto o setor de couro (SIC 31) est´a pr´oximo dos setores de textil (SIC 22) e diversos (SIC 39). Algumas distˆancias relativas ao mesmo setor variam sobre as duas m´etricas. Considere a localiza¸c˜ao relativa de dois bens dur´aveis, como tansporte (SIC 37) e instrumentos (SIC 38). Esses setores est˜ao pr´oximos sob a ´otica do insumo, por´em suas sa´ıdas se
encaminham para diferentes clientes. Ent˜ao, eles est˜ao relativamente afastados sob o ponto de vista do produto. Transporte, na verdade, est´a afastado da maioria dos setores, quando falamos de distˆancia baseada no produto, pois grande parte da produ¸c˜ao deste setor ´e destinado a ele mesmo.
−0.2 0.0 0.2 0.4 0.6 −0.2 0.0 0.2 0.4 0.6 CMDS coordenada 1 coordenada 2 S20 S21 S22 S23 S24 S25 S26S27 S28 S29 S30 S31S32 S33 S34 S35 S36 S37 S38 S39
Figura 2.1: Gr´afico CMDS das distˆancias econˆomicas do insumo entre setores norte-americanos, para o ano de 1987.
−0.2 0.0 0.2 0.4 0.6 −0.6 −0.4 −0.2 0.0 0.2 0.4 0.6 CMDS coordenada 1 coordenada 2 S20 S21 S22 S23 S24 S25 S26 S27 S28 S29 S30 S31 S32 S33 S34 S35S36 S37 S38 S39
Figura 2.2: Gr´afico CMDS das distˆancias econˆomicas do produto entre setores norte-americanos, para o ano de 1987.
Al´em da configura¸c˜ao CMDS, imagens das distˆancias econˆomicas entre os setores considerando o ponto de vista do produto e do insumo para os anos de 1972, 1977, 1982, 1987, 1992 podem ser vistas nas Figuras 2.3 e 2.4, respectivamente. Quanto mais fortes as cores, menores s˜ao as distˆancias econˆomicas entre os setores e maior ´e o peso associado. Nota-se que h´a uma grande disparidade entre a matriz do ano de 1982 e as matrizes dos demais anos tanto para o produto como para o insumo. Isso se d´a pois ao longo da d´ecada de 1980, os EUA sofreram um per´ıodo de instabilidade econˆomica, principalmente, por sua inefic´acia em responder a novos concorrentes que surgiam no mercado internacional. A economia norte-americana passou a perder espa¸co para concorrentes como pa´ıses da Europa Ocidental e ´Asia, como Alemanha e Jap˜ao, nos mercados interno e externo. Essa recess˜ao norte-americana de 79/82, ´e considerada a mais grave desde a Grande Depress˜ao de 1930. Apesar da crise influenciar um aumento na correla¸c˜ao entre os setores pode-se ver que o setor de tabaco (SIC 21), n˜ao segue os demais. Al´em disso, pode-se notar, nas imagens bapode-seadas no produto, que os pode-setores de comida (SIC20), tabaco (SIC21), textil (SIC22) e vestu´ario (SIC23) est˜ao mais afastados (pouco correlacionados) dos demais setores. O mesmo pode ser visto para as matrizes baseadas no insumo, com mais intensidade.
A divulga¸c˜ao das tabelas de insumo-produto a cada cinco anos nos leva a obter matrizes de distˆancias econˆomicas que variam no tempo. Isso ´e, a diferen¸ca estrutural entre as matrizes obtidas, notada pela an´alise da matriz de 1982, nos motiva a incluir na modelagem futura diferentes matrizes para cada instante de tempo. Por´em, a s´erie temporal dos setores utilizados tem varia¸c˜ao mensal, e dado que as matrizes constru´ıdas n˜ao s˜ao compat´ıveis na escala temporal com os dados, um m´etodo de interpola¸c˜ao foi utilizado.
0 5 10 15 20 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 1.2 −0.4 −0.2 0.0 0.2 0.4 0.6 −0.6 −0.4 −0.2 0.0 0.2 0.4 0.6 0.8 CMDS coordenada 1 coordenada 2 S20 S21 S22S23 S24 S25 S26 S27 S28S29 S30 S31 S32 S33 S34 S35S36 S37 S38 S39 imagem − 1977 CM DS − 1977 0 5 10 15 20 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 −1.0 −0.8 −0.6 −0.4 −0.2 0.0 −0.4 −0.3 −0.2 −0.1 0.0 0.1 0.2 CMDS coordenada 1 coordenada 2 S20 S21 S22 S23 S24 S25 S26 S27 S28 S29 S30 S31 S32 S33 S34 S35 S36 S37 S38S39 imagem − 1982 CM DS − 1982 0 5 10 15 20 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 1.2 −0.4 −0.2 0.0 0.2 0.4 0.6 −0.6 −0.4 −0.2 0.0 0.2 0.4 0.6 CMDS coordenada 1 coordenada 2 S20 S21 S22 S23 S24 S25S26 S27 S28 S29 S30 S31 S32 S33 S34 S35 S36 S37 S38 S39 imagem − 1987 CM DS − 1987
Figura 2.3: Imagem e representa¸c˜ao CMDS dos setores norte-americanos relativo as distˆancias econˆomicas sob a ´otica do produto, ao longo dos anos.
0 5 10 15 20 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 −0.2 0.0 0.2 0.4 0.6 −0.2 0.0 0.2 0.4 CMDS coordenada 1 coordenada 2 S20 S21 S22 S23 S24 S25 S26S27 S28 S29 S30 S31 S32 S33 S34 S35 S36 S37 S38S39 imagem − 1977 CM DS − 1977 0 5 10 15 20 5 10 15 20 X Coord Y Coord 0.1 0.2 0.3 0.4 0.5 0.6 −0.1 0.0 0.1 0.2 0.3 0.4 −0.2 −0.1 0.0 0.1 0.2 CMDS coordenada 1 coordenada 2 S20 S21 S22 S23 S24 S25 S26 S27 S28 S29 S30 S31 S32 S33 S34 S35 S36 S37 S38 S39 imagem − 1982 CM DS − 1982 0 5 10 15 20 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 −0.2 0.0 0.2 0.4 −0.4 −0.2 0.0 0.2 0.4 CMDS coordenada 1 coordenada 2 S20 S21 S22 S23 S24 S25S26 S27 S28 S29 S30 S31 S32 S33 S34 S35 S36 S37 S38 S39 imagem − 1987 CM DS − 1987
Figura 2.4: Imagem e representa¸c˜ao CMDS dos setores norte-americanos relativo as distˆancias econˆomicas sob a ´otica do insumo, ao longo dos anos.
Para obtermos matrizes de distˆancias econˆomicas mensalmente vamos utilizar m´etodos de interpola¸c˜ao por spline. O m´etodo de interpola¸c˜ao por spline c´ubico foi
escolhido porque fornece valores interpolados mais suaves ao longo do tempo com rela¸c˜ao ao spline linear e quadr´atico. Ent˜ao, para p = 3 considere a fun¸c˜ao f (x) tabelada nos pontos x0, x1, . . . , xl. Uma fun¸c˜ao Sp(x) ´e denominada spline de grau p com n´os nos
pontos xi, i = 0, 1, . . . , l se satisfaz as seguintes condi¸c˜oes:
(i) em cada subintervalo [xi, xi+1], i = 0, 1, . . . , (l − 1), Sp(x) ´e um polinˆomio de grau
p,
(ii) Sp(x) ´e cont´ınua e tem derivada cont´ınua at´e ordem (p − 1) em [a, b].
Se al´em disso, Sp(x) tamb´em satisfaz a condi¸c˜ao:
(iii) Sp(xi) = f (xi), i = 0, 1, . . . , l ent˜ao ser´a denominada spline interpolante.
Portanto, S3(x), ´e uma fun¸c˜ao polinomial por partes, cont´ınua, onde cada parte,
sk(x) = ak(x − xk)3+ bk(x − xk)2+ dk, ´e um polinˆomio de grau 3 no intervalo [xk−1, xk],
k = 1, 2, . . . , l.
Segundo a teoria de interpola¸c˜ao por spline, vamos assumir os anos 1972, 1977, 1982, 1987 e 1992 como n´os. Ent˜ao, consideramos as matrizes de distˆancias econˆomicas, obtidas por meio das tabelas, como as matrizes dos meses de janeiro de cada ano, ou seja, a matriz constru´ıda pela tabela do ano de 1972 ´e identificada como uma matriz de distˆancias econˆomicas do mˆes de janeiro do ano de 1972. Dessa forma as demais matrizes, dos meses faltantes, entre os n´os ser˜ao estimadas por interpola¸c˜ao via spline c´ubico. As Figuras 2.5 e2.6 mostram as imagens de algumas das matrizes de distˆancias econˆomicas estimadas por spline c´ubico tanto para a m´etrica de insumo como de produto. Mais uma vez cores mais fortes indicam menores distˆancias e, consequentemente, maiores pesos. Embora as imagens se pare¸cam, os valores variam suavemente e algumas similaridades se conservam ao longo do tempo.
0 5 10 15 20 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 0 5 10 15 20 0 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 1.2 0 5 10 15 20 0 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 1.2
janeiro1972 janeiro1973 janeiro1974
0 5 10 15 20 0 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 1.2 0 5 10 15 20 0 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 1.2 0 5 10 15 20 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1
janeiro1975 janeiro1976 janeiro1977
Figura 2.5: Imagem das distˆancias econˆomicas de insumo entre setores norte-americanos interpoladas por spline c´ubico.
0 5 10 15 20 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 1.2 0 5 10 15 20 0 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 1.2 1.4 0 5 10 15 20 0 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 1.2 1.4
janeiro1972 abril1972 julho1972
0 5 10 15 20 0 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 1.2 1.4 0 5 10 15 20 0 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 0 5 10 15 20 0 5 10 15 20 X Coord Y Coord 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6
janeiro1973 julho1973 janeiro1974
Figura 2.6: Imagem das distˆancias econˆomicas de produto entre setores norte-americanos interpoladas por spline c´ubico.
2.2.2
Aplica¸
c˜
ao a matrizes brasileiras de insumo-produto
Matrizes insumo-produto s˜ao instrumentos da contabilidade social que permitem conhecer fluxos de bens e servi¸cos produzidos em cada setor da economia, destinados a servir de insumos a outros setores e para atender a demanda final. Essas matrizes, produzidas pelo IBGE desde a d´ecada de 1970, s˜ao elaboradas a partir dos dados das Contas Nacionais do Brasil. Seus objetivos iniciais eram a cria¸c˜ao de um marco estrutural para o Sistema de Contas Nacionais e de uma ferramenta que ajudasse o desenvolvimento das estat´ısticas econˆomicas necess´arias `a constru¸c˜ao de tabelas macroeconˆomicas.
O uso de matrizes de insumo-produto difundiu-se muito nos ´ultimos anos, e hoje ´
e considerada um instrumento de grande utilidade para analisar os efeitos estruturais de choques na economia, bem como para fazer proje¸c˜oes sobre o comportamento de atividades.
Uma matriz de insumo-produto ´e entendida normalmente como uma matriz de coeficientes t´ecnicos diretos que apresenta o quanto determinado setor econˆomico necessita consumir dos demais setores para que possa produzir uma unidade monet´aria adicional. O c´alculo da matriz de coeficientes t´ecnicos diretos ´e baseado nas tabelas de produ¸c˜ao e consumo intermedi´ario das Tabelas de Recursos e Usos - TRU. Estas tabelas devem sofrer altera¸c˜oes para se adequarem `as caracter´ısticas de um modelo de insumo-produto.
A partir do c´alculo dos coeficientes t´ecnicos diretos e das matrizes de insumo-produto, modelos s˜ao propostos e diversas matrizes podem ser extra´ıdas, uma delas ´e a matriz dos coeficientes t´ecnicos intersetoriais. Pelo fato desta matriz nos fornecer a dependˆencia direta, atividade por atividade, a selecionamos para, a partir dela, obtermos uma matriz de distˆancias econˆomicas. Detalhes de modelos e c´alculos para obten¸c˜ao de matrizes podem ser vistos no endere¸co http://www.ipeadata.gov.br.
As atividades econˆomicas utilizadas nas matrizes calculadas pelo IBGE, inclusive nas matrizes dos coeficientes t´ecnicos que utilizaremos, podem ser descritas segundo diferentes n´ıveis. As desigualdades nas descri¸c˜oes das atividades, baseada nos n´ıveis, leva-nos `a atividades mais agregadas ou menos agregadas, dependendo do n´ıvel. Na Se¸c˜ao 4.2 do Cap´ıtulo 4 definimos os dados com os quais utilizaremos as matrizes dos coeficientes t´ecnicos intersetoriais e vale ressaltar que deve haver compatibilidade entre os setores que comp˜oem as matrizes e os setores analisados nos dados. Para atingir essa compatibilidade a CNAE (Classifica¸c˜ao Nacional de Atividades Econˆomicas) apresenta a padroniza¸c˜ao nacional dos c´odigos de atividades econˆomicas. A partir disso, agregamos os setores desagregados das matrizes de coeficientes t´ecnicos intersetoriais, somando atividades pertencentes `a mesma descri¸c˜ao, para atingir a igualdade desejada. A Tabela
Tabela 2.2: Atividades da economia brasileira
C´odigo da Atividade n´ıvel 12 Descri¸c˜ao da Atividade n´ıvel 12
01 Agropecu´aria
02 Ind´ustria extrativa mineral
03 Ind´ustria de transforma¸c˜ao
04 Produ¸c˜ao e distribui¸c˜ao de eletricidade, g´as e ´agua
05 Constru¸c˜ao
06 Com´ercio
07 Transporte armazenagem e correio
08 Servi¸cos de informa¸c˜ao
09 Intermedia¸c˜ao financeira, seguros e previdˆencia complementar
10 Atividades imobili´arias e aluguel
11 Outros servi¸cos
12 Administra¸c˜ao, sa´ude e educa¸c˜ao p´ublicas
As matrizes de coeficientes t´ecnicos intersetoriais referentes aos anos 1992, 1993, 1994, 1995, 1996, 2000, 2005 e contendo os 12 setores apresentados, foram obtidas. A partir delas as matrizes de distˆancias econˆomicas foram constru´ıdas baseadas nas m´etricas de insumo e produto propostas por Conley e Dupor (2003) pelas equa¸c˜oes em (2.1) e (2.2). As matrizes de distˆancias econˆomicas nos fornecem as rela¸c˜oes existentes entre os 12 setores da economia brasileira considerados, ou seja, se o elemento Dt(i, j) for pequeno
temos que a distˆancia econˆomica entre o setor i e o setor j ´e pequena, e portanto a rela¸c˜ao entre eles ´e forte. Podemos observar essas rela¸c˜oes de forma gr´afica por meio das Figuras 2.7 e 2.8. A primeira delas nos mostra as imagens e os gr´aficos CMDS das matrizes de distˆancias econˆomicas sob a ´otica do produto nos anos de 1993, 1996, 2005. A segunda figura, com a mesma varia¸c˜ao temporal que a primeira, apresenta as distˆancias
econˆomicas baseadas na m´etrica do insumo. Em ambas as figuras temos que as cores mais fortes representam menores distˆancias e, portanto, maiores pesos econom´etricos.
Observe que independente da ´otica sob a qual as matrizes de distˆancias econˆomicas est˜ao baseadas, o setor de produ¸c˜ao e distribui¸c˜ao de eletricidade e ´agua (setor 04) se mat´em afastado dos demais ao longo dos anos. No gr´afico das imagens ´e poss´ıvel notar tal afastamento devido a faixa mais clara presente ao longo do setor 04, e no gr´afico CMDS notamos pela grande distˆancia f´ısica de ”S4”dos demais setores. Al´em disso, pode-se notar que o setor de atividades imobili´arias e aluguel (setor 10) est´a distante dos outros setores, sob a ´otica do insumo. J´a sob a ´otica do produto esse setor est´a inserido em um cluster formado pelos setores de intermedia¸c˜ao financeira, seguros e previdˆencia complementar (setor 09) e outros servi¸cos (setor 11).
As matrizes aqui calculadas ser˜ao utilizadas como matrizes de distˆancia ex´ogenas na aplica¸c˜ao desenvolvida no Cap´ıtulo 4. Vale ressaltar que ´e necess´ario haver compatibilidade temporal entre as matrizes calculadas e a s´erie temporal dos dados, que s˜ao trimestrais. Portanto, o m´etodo de interpola¸c˜ao por spline ser´a utilizado para encontrarmos matrizes intermedi´arias e dessa forma transform´a-las em matrizes trimestrais.
O m´etodo de interpola¸c˜ao por spline c´ubico, que j´a foi descrito anteriormente, tem como ponto de partida os n´os da interpola¸c˜ao. Dessa forma, vamos assumir as matrizes dos anos de 1992, 1993, 1994, 1995, 1996, 2000, 2005 como n´os referentes ao primeiro trimestre de cada um deses anos. As matrizes referentes aos trimestres entre os n´os ser˜ao estimadas por interpola¸c˜ao via spline c´ubico. A Figura2.9mostra as imagens de algumas matrizes de distˆancias econˆomicas estimadas segundo a m´etrica de produto.
0 2 4 6 8 10 12 14 0 2 4 6 8 10 12 X Coord Y Coord 0.2 0.4 0.6 0.8 −0.2 0.0 0.2 0.4 −0.4 −0.3 −0.2 −0.1 0.0 CMDS coordenada 1 coordenada 2 S1 S2 S3 S4 S5 S6S7 S8 S9S10 S11 S12 1993 CM DS − 1993 0 2 4 6 8 10 12 14 0 2 4 6 8 10 12 X Coord Y Coord 0.2 0.4 0.6 −0.3 −0.2 −0.1 0.0 0.1 0.2 0.3 −0.1 0.0 0.1 0.2 CMDS coordenada 1 coordenada 2 S1 S2 S3 S4 S5 S6 S7 S8 S9 S10S11 S12 1996 CM DS − 1996 0 2 4 6 8 10 12 14 0 2 4 6 8 10 12 X Coord Y Coord 0.2 0.4 0.6 0.8 −0.2 0.0 0.2 0.4 −0.2 −0.1 0.0 0.1 0.2 0.3 0.4 CMDS coordenada 1 coordenada 2 S1 S2 S3 S4 S5 S6 S7 S8S10S9 S11 S12 2005 CM DS − 2005
Figura 2.7: Imagem das distˆancias econˆomicas de produto entre setores brasileiros ao longo dos anos.
0 2 4 6 8 10 12 14 0 2 4 6 8 10 12 X Coord Y Coord 0.2 0.4 0.6 0.8 1 −0.2 0.0 0.2 0.4 0.6 −0.2 0.0 0.2 0.4 0.6 CMDS coordenada 1 coordenada 2 S1 S2 S3 S4 S5 S6 S7 S8 S9 S10 S11 S12 1992 CM DS − 1993 0 2 4 6 8 10 12 14 0 2 4 6 8 10 12 X Coord Y Coord 0.2 0.4 0.6 0.8 1 −0.2 0.0 0.2 0.4 0.6 0.8 −0.2 0.0 0.2 0.4 CMDS coordenada 1 coordenada 2 S1 S2 S3 S4 S5 S6 S7 S8 S9 S10 S11 S12 1995 CM DS − 1996 0 2 4 6 8 10 12 14 0 2 4 6 8 10 12 X Coord Y Coord 0.2 0.4 0.6 −0.2 −0.1 0.0 0.1 0.2 0.3 0.4 −0.2 −0.1 0.0 0.1 0.2 0.3 0.4 0.5 CMDS coordenada 1 coordenada 2 S1 S2 S3 S4 S5 S6 S7 S8 S9 S10 S11 S12 2005 CM DS − 2005
Figura 2.8: Imagem das distˆancias econˆomicas de insumo entre setores brasileiros ao longo dos anos.
0 5 10 15 0 2 4 6 8 10 12 14 X Coord Y Coord 0.2 0.4 0.6 0.8 0 5 10 15 0 2 4 6 8 10 12 14 X Coord Y Coord 0.2 0.4 0.6 0.8 0 5 10 15 0 2 4 6 8 10 12 14 X Coord Y Coord 0.2 0.4 0.6 0.8
1otrimestre1992 3otrimestre1992 1otrimestre1993
0 5 10 15 0 2 4 6 8 10 12 14 X Coord Y Coord 0.2 0.4 0.6 0.8 0 5 10 15 0 2 4 6 8 10 12 14 X Coord Y Coord 0.2 0.4 0.6 0.8 0 5 10 15 0 2 4 6 8 10 12 14 X Coord Y Coord 0.2 0.4 0.6 0.8
2otrimestre1993 4otrimestre1993 1otrimestre1994 Figura 2.9: Imagem das distˆancias econˆomicas de produto entre setores brasileiros interpoladas por spline c´ubico.
Cap´ıtulo 3
Modelos Espa¸
co-Temporais com
Distˆ
ancias Econˆ
omicas
Neste cap´ıtulo um modelo econom´etrico espacial dinˆamico ´e proposto. Esse modelo trata da dependˆencia econom´etrica espacial atrav´es da intera¸c˜ao entre unidades observacionais e da dependˆencia temporal atribuindo a cada unidade uma s´erie temporal. Al´em disso, foi incoporado ao modelo a id´eia, j´a tratada no Cap´ıtulo 2, de distˆancias econˆomicas, que ir˜ao influenciar tanto na estrutura de m´edias como na estrutura de covariˆancia.
3.1
Introdu¸
c˜
ao
Neste cap´ıtulo ser˜ao desenvolvidos modelos econom´etricos espa¸co-temporais para dados de painel, cujos elementos correspondem a agentes econˆomicos. Por painel entende-se obentende-serva¸c˜oes repetidas no tempo para um n´umero fixo de agentes. Exemplos com este tipo de dados incluem observa¸c˜oes trimestrais sobre vari´aveis de setores espec´ıficos ou ainda dados de pre¸cos semanais para empresas em uma regi˜ao. Dados de painel para modelos espaciais e econom´etricos espaciais tem sido amplamente utilizados na literatura.
Baltagi et al. (2003), Case (1991) e Kapoor et al. (2004) utilizam modelos, para dados de painel, com correla¸c˜ao espacial no erro. Baltagi et al. (2003) abordam modelos de regress˜ao com essas caracter´ısticas e fazem testes de multiplicadores de Lagrange para
permitir correla¸c˜ao espacial do erro bem como efeitos aleat´orios. J´a Case (1991) discute processos econˆomicos que d˜ao origem a padr˜oes espaciais nos dados. Kelejian e Prucha
(1999) e Bell e Bockstael (2000) sugerem respectivamente, um estimador de momentos generalizados, computacionalmente simples e independente do tamanho da amostra, para o parˆametro autorregressivo de um modelo espacial, e a primeira aplica¸c˜ao em econometria espacial para as t´ecnicas desenvolvidas por Kelejian e Prucha (1999) para dados de painel de grandes dimens˜oes.
Muitos modelos tradicionais em econometria n˜ao consideram intera¸c˜oes entre agentes econˆomicos. Nesses casos, frequentemente, ´e assumido que o resultado de um agente n˜ao ´e afetado pelo resultado dos demais. No entanto, as decis˜oes econˆomicas s˜ao caracterizadas por um significativo grau de interdependˆencia. Portanto, sob a forma de dependˆencia espacial, modelos econom´etricos incorporam similaridades entre agentes ou especialidades geogr´aficas, como medidas que s˜ao incorporadas na estrutura de covariˆancia ou ainda na m´edia do processo. Exemplos seguindo essa abordagem podem ser vistos principalmente em Anselin (1988), que trata de modelos e m´etodos da econometria espacial. Anselin
(1988) motivou uma s´erie de estudos mais aprofundados na ´area como: Anselin et al.
(2004), que apresentam importantes avan¸cos na ´area econom´etrica espacial, LeSage e Pace(2004), que tratam tamb´em de econometria espa¸co-temporal eGamerman e Moreira
(2004), que descrevem procedimentos para realizar inferˆencia Bayesiana em modelos multivariados econom´etricos com componente espacial, entre outros. Baltagi et al.(2007) reune uma s´erie de estudos que se relacionam tanto para o desenvolvimento te´orico de modelos espaciais na economia para a an´alise de dados espacialmente dependentes, como para aplica¸c˜oes `as diferentes quest˜oes econˆomicas.
Agentes que se encontram em um espa¸co Euclidiano foram modelados. As distˆancias entre eles, inicialmente, s˜ao determinadas simplesmente pela distˆancia Euclidiana e mais tarde por uma m´etrica econˆomica. A m´etrica atribu´ıda pode, por exemplo, mostrar que os agentes est˜ao pr´oximos, se eles usam insumos nas mesmas propor¸c˜oes, e longe, se utilizam insumos em propor¸c˜oes diferentes, caso os agentes correspondam a setores econˆomicos.
Nosso modelo de gera¸c˜ao de dados ´e dinˆamico com um parˆametro de estados autorregressivo onde m´edia e matriz de variˆancia s˜ao fun¸c˜oes de distˆancias econˆomicas entre agentes. Portanto, levaremos em considera¸c˜ao a dependˆencia espacial entre os agentes por meio de distˆancias econˆomicas que ser˜ao incorporadas tanto na m´edia como na estrutura de variˆancia do modelo. Al´em disso, ambos os termos s˜ao influenciados por fun¸c˜oes de distˆancias econˆomicas entre agentes que variam ao longo do tempo. A estrutura incorporada na m´edia ´e padronizada e, devido a isso, carrega uma interpreta¸c˜ao de interdependˆencia temporal e entre agentes com pesos atribu´ıdos. J´a a distˆancia incorporada na variˆancia ´e dotada de princ´ıpios espaciais para a estrutura de covariˆancia, ou seja, usamos representa¸c˜oes de estruturas estat´ısticas da literatura para particularizar as fun¸c˜oes de distˆancias econˆomicas presentes no modelo. As distˆancias econˆomicas foram calculadas segundo a m´etrica econˆomica descrita no Cap´ıtulo 2 e ser˜ao exogenamente incorporadas ao modelo.
A principal contribui¸c˜ao deste trabalho consiste na abordagem de Chen e Conley
(2001) com algumas altera¸c˜oes na modelagem. Adicionalmente, a fim de acomodar a ocasional presen¸ca de outliers um modelo de regress˜ao t-Student tamb´em ´e apresentado. A estima¸c˜ao dos modelos ser´a feita lan¸cando m˜ao de uma abordagem completamente Bayesiana. ´E avaliada a sensibilidade para a especifica¸c˜ao de distribui¸c˜oes a priori para os hiperparˆametros e, finalmente, exemplos utilizando dados artificiais s˜ao apresentados. Neste caso a m´etrica econˆomica utilizada se resume a distˆancia Euclidiana.
O restante do cap´ıtulo est´a organizado da seguinte forma. A Se¸c˜ao 3.2 descreve o modelo proposto, algumas das suas caracter´ısticas, apresenta especifica¸c˜oes para as fun¸c˜oes de distˆancias econˆomicas e interpreta¸c˜oes para elas. A Se¸c˜ao3.3 apresenta nossa estrat´egia de estima¸c˜ao, ou seja, apresenta o procedimento de inferˆencia, todo sob o enfoque Bayesiano. A Se¸c˜ao 3.4 discute a possibilidade de modelagem de s´eries n˜ao estacion´arias e apresenta um exemplo simulado para verifica¸c˜ao da proposta. As Se¸c˜oes
3.5e3.6apresentam estudos simulados com dados artificiais tanto para o modelo proposto como para sua extens˜ao, que trata da acomoda¸c˜ao de poss´ıveis outliers.