• Nenhum resultado encontrado

4.2.1

Análise Exploratória de Dados Espaciais

A Análise Exploratória de Dados Espaciais (AEDE) é um método para descrever a distribuição e a associação espacial de certa variável entre as unidades avaliadas e ainda perceber padrões e formas de instabilidade espacial, além de identificar outliers. Essa análise é pré-requisito no estudo da econometria espacial, pois é o primeiro momento que se percebe as complicações geradas pelos efeitos espaciais na forma da autocorrelação e da heterogeneidade (ALMEIDA; HADDAD,2004).

Ainda cabe ressaltar, que a análise exploratória é mais indicada para variáveis intensivas, ou seja, variáveis divididas por algum indicador de intensidade como variáveis per capita ou por área (ALMEIDA,2012).

De acordo com Almeida (2012) e Raiher et al. (2016) para realizar uma AEDE é necessário, primeiramente, a adoção de uma matriz de ponderação espacial (W ). Se trata de uma matriz quadrada de ordem n por n, cujos elementos denotam o grau de conexão

espacial, seguindo algum critério de proximidade como o de contiguidade e/ou distância geográfica.

As matrizes de contiguidade são matrizes de pesos espaciais binários que podem ser construídas em consonância com a ideia de vizinhança baseada na contiguidade, em que duas regiões são vizinhas, caso elas partilhem de uma fronteira física comum. Geralmente essas matrizes fazem alusão ao movimento de peças do tabuleiro de xadrez, a convenção de contiguidade pode ser rainha (queen), torre (rook) e/ou bispo (bishop). Já as matrizes de distância contabilizam os vizinhos mais próximos (k-neighbors), assim pode-se definir k, ou seja, quantos vizinhos mais próximos desejar, por exemplo 5, 10 ou 15 vizinhos mais próximos. Para além dessas, há também o critério matriz de peso das distâncias, ou seja, definir a distância dos vizinhos a considerar, por exemplo levar em conta um município e seus vizinhos em um raio de 100 km2, dentre outras, como a matriz do inverso

das distâncias1 (ANSELIN, 1988; LESAGE, 1999; ELHORST, 2003; ALMEIDA, 2012;

JUSTO, 2014; GOLGHER, 2015; ALVES; ANDRÉ; ALVES, 2019).

Para Anselin (1988), normalmente a matriz de pesos é definida de forma exógena e após a comparação entre vários tipos de matrizes. Nesse sentido, criam-se vários tipos de matrizes de pesos e escolhe-se aquela que apresenta a mais alta significância estatística2.

Este método será considerado na presente dissertação.

A estatística I de Moran oferece a observação da existência de regimes espaciais globais nos dados. No entantoAnselin(1988) propôs a estatística LISA (Local Indicators of Spatial Association) que precisa satisfazer dois critérios: primeiro, para cada observação o LISA deve oferecer uma indicação de clusters espaciais significantes de valores similares em torno da observação; segundo, a soma dos LISA’s para todas as observações é proporcional ao indicador de associação espacial global.

Essa condição estatística varia de acordo com o teste feito para a autocorrelação espacial. Isto é, para se construir uma estatística de autocorrelação espacial são considera- dos três elementos, a saber: uma medida de covariância, uma medida de variância dos dados e uma matriz de ponderação espacial (W ). Em seguida, é mostrado como estas medidas de autocovariância foram usadas no cálculo das estatísticas de autocorrelação espacial mais adotadas na literatura. Dentre as várias estatísticas, como I de Moran, c de Geary, G de Getis Ord e Join Count ou contagem de junções, a mais difundida na literatura é a estatística I de Moran, que é uma espécie de coeficiente de autocorrelação. Ou seja, é a relação da autovariância do tipo do produto cruzado pela variância dos dados (z0z). Justificando assim, o seu uso na presente dissertação, e demonstrada matricialmente,

1 Para mais detalhes verAnselin(1988) eAlmeida(2012).

2 Muito comum, com base na teoria. Noe entando, é evidente que há outros meios para a escolha da melhor matriz de pesos espaciais, como, por exemplo, o procedimento deBaumont(2004), bastante utilizado.

essa estatística, em um contexto univariado, é dada por:

I = n S0

z0W z

z0z (4.14)

onde n é o número de regiões, z denota os valores da variável de interesse padronizada; W z representa os valores médios da variável de interesse padronizada nos vizinhos, definidos segundo uma matriz de ponderação espacial W (ALMEIDA, 2012).

O Índice de Moran (ou Estatística I de Moran) foi proposta por Moran (1948) e mede a correlação espacial, usando uma medida de auto covariância na forma de produto cruzado. Vale ressaltar que a hipótese nula testada é a da aleatoriedade espacial. De modo geral, trata-se de uma coleção de técnicas que visam descrever e visualizar distribuições espaciais, identificar padrões (clusters espaciais) e, também, identificar localidades atípicas (outliers espaciais).

A estatística I de Moran fornece informações acerca do tipo de autocorreção. Nesse caso pode ser ou positiva ou negativa, ou seja, se positiva, indica que, no geral, altos valores de uma variável de interesse (y) tendem a estar circundados por altos valores desta variável em regiões vizinhas (W y), indicando similaridade. Do mesmo modo, vale para o caso contrário, ou seja, para baixos valores.

Além do contexto univariado, a estatística I de Moran Global pode ser testada em um contexto Bivariado. SegundoRodrigues et al. (2015), a autocorrelação espacial global bivariada permite verificar se uma variável observada em determinada região tem alguma associação com outra variável em regiões vizinhas. O coeficiente I de Moran bivariado é dado pela Equação 4.15:

IZ1Z2 = n S0 z10W z2 z0 1z1 (4.15) onde W z2 representa a defasagem da variável Z2. SegundoRocha e Parré(2009), a presença

de autocorrelação espacial positiva indica uma associação dos valores das variáveis que está sendo estudada e de suas localizações. Sendo assim, a autocorrelação positiva mostra que municípios com uma alta (baixa) renda per capita são rodeados por municípios com um alto (baixo) infraestrutura, por exemplo. O I de Moran esperado é dado por [E (I) = [−1/ (n − 1)]], ele fornece o valor que seria obtido se não houvesse padrão espacial nos dados. Sendo que os valores de I de Moran acima da esperança de Moran indicam autocorrelação espacial positiva e, do mesmo modo, os valores abaixo indicam autocorrelação negativa (ROCHA; PARRÉ, 2009; RODRIGUES et al., 2015).

Vale destacar que segundo Almeida (2012) eRocha e Parré(2009), assim como se pôde obter um coeficiente de autocorrelação espacial global num contexto bivariado, também é possível conseguir uma medida de autocorrelação espacial local multivariada.

De acordo com Anselin (2003), Elhorst (2003), Rocha e Parré (2009), Almeida (2012) e

Rodrigues et al. (2015), essa estatística dá uma indicação do grau de associação linear (positiva ou negativa) entre o valor para uma variável em um dado município i e a média de uma outra variável nos municípios vizinhos. É possível mapear os valores da probabilidade da medida, estatisticamente significativos, gerando o diagrama de dispersão de I de Moran bivariado, o mapa de significância LISA bivariado e também o mapa de clusters LISA. (RODRIGUES et al.,2015).

Uma abordagem alternativa para visualizar a autocorrelação espacial é baseada no diagrama de dispersão de Moran. De acordo comSilva, Borges e Parré (2013) mostra a defasagem espacial da variável de interesse no eixo vertical e o valor da variável de interesse no eixo horizontal. Conforme Figura 5:

Figura 5 – Diagrama de dispersão de Moran

Fonte: Lima, Caldarelli e Camara (2014, p.8).

Na análise do diagrama, a autocorrelação espacial pode ser positiva indicando clusters espaciais de valores semelhantes ou pode ser negativa, indicando clusters espaciais

de valores não semelhantes (GALLO; ERTUR, 2003).

De acordo com Gallo e Ertur (2003) e Rocha e Parré (2009), um agrupamento alto-alto (AA) significa que as unidades espaciais pertencentes a esse agrupamento exibem valores altos da variável de interesse (A) rodeados por unidades espaciais que apresentam valores também altos da variável defasada (B), representado pelo primeiro quadrante do diagrama. Um agrupamento baixo-alto (BA) concerne a um clusters no qual uma unidade espacial qualquer com um baixo valor da variável de interesse (A) são circundados por unidades espaciais com alto valor da variável (B). Sendo representado no segundo quadrante (ROCHA; PARRÉ,2009).

Os agrupamentos do tipo baixo-baixo (BB) referem-se a agrupamentos cujas unidades espaciais mostram valores baixos da variável (A) rodeados por unidades espaciais que ostentam valores também baixos da defasagem da variável (B), representado pelo terceiro quadrante. Um agrupamento alto-baixo (AB) diz respeito a um clusters no qual uma unidade espacial qualquer com um alto valor da variável de interesse (A) são vizinhos

de unidades espaciais com um baixo valor da variável (B). Isso é representado pelo quarto quadrante (ROCHA; PARRÉ,2009; ALMEIDA,2012).

Figura 6 – Diagrama de dispersão de Moran indicando autocorrelação espacial positiva (lado esquerdo) e negativa (lado direito)

Fonte: Rocha e Parré(2009, p.174).

A Análise Exploratória dos Dados Espaciais utilizará as técnicas descritas, con- forme os testes de autocorrelação espacial global e local, em conjunto com a apresentação de mapas de significância, diagramas de dispersão e formação de clusters ou padrões de associação espacial local. Tanto em um contexto univariado, quanto num contexto bivariado.

4.2.2

Econometria Espacial

As técnicas de econometria espacial representam procedimentos metodológicos inovadores para a especificação, estimação, teste e diagnóstico de modelos para fenômenos, levando em conta a influência da dependência e da heterogeneidade espaciais para dados em seção cruzada e em painel (ALMEIDA, 2012).

Esse estudo visa investigar as desigualdades intermunicipais de renda no Brasil no período de 2000 e 2010. A estratégia empírica adotada consiste em analisar tal problemática levando em consideração (com e sem) os efeitos espaciais sobre as unidades geográficas utilizadas. Assim, foram utilizadas técnicas de econometria espacial que consideraram o padrão de interação dos agentes no espaço, diferentemente dos modelos econométricos convencionais.

O uso dessas técnicas visa contornar dois possíveis problemas como dependência ou autocorrelação espacial e a heterogeneidade espacial. Já que se não controlados os resultados obtidos podem ser ineficientes e/ou inconsistentes (ALMEIDA; PEROBELLI; FERREIRA, 2008). Naturalmente, dependerá do tipo de análise feita e do conjunto de dados utilizados, como se trata de problemáticas regionais, deve-se levar em conta esses problemas na análise.

No que se refere ao primeiro problema, o da dependência ou autocorrelação espacial, este é associado à primeira Lei da Geografia, segundoAnselin (1988), surge ao se questionar o princípio de independência entre os dados coletados, tudo está relacionado a todo o resto, aqueles elementos que estão mais próximos no espaço tem um efeito maior do que os que estão mais distantes.

Já o segundo problema é referente ao da heterogeneidade espacial, também chamado de segunda Lei da Geografia, de acordo com Almeida (2012), é um fenômeno que ocorre devido à ausência de estabilidade de comportamento ao longo do espaço, pode surgir nos municípios pobres e aglutinados em diferentes regiões do país. Logo, conclui-se que é relevante levar em consideração aspectos espaciais ao se investigar determinadas variáveis (ANSELIN,1988;LESAGE, 1999; ELHORST, 2003).

Os modelos que estimam a autocorrelação são bem conhecidos na literatura da econometria espacial e se adequam a maioria dos casos de autocorrelação espacial. Descritos em Anselin (1988) e aprimorados por econometristas espaciais e economistas regionais ao longo dos anos, os modelos incorporam um termo de defasagem espacial na forma da matriz de pesos espaciais (W ) onde se quer capturar o efeito espacial.

A partir do modelo dos Mínimos Quadrados Ordinários (MQO), a econometria espacial desenvolveu três abordagens que medem os efeitos de interação de unidades espaciais: o efeito exógeno nas variáveis explicativas (W X), uma interação endógena na variável de interesse (W y) ou nos termos de erro (W u e W e). De acordo com LeSage e Pace(2004) no espaço o significado do operador de defasagem de uma variável é a média do valor dessa variável nas regiões vizinhas.

Para Almeida (2012) e Golgher (2015) é razoável supor quando estas variáveis são a níveis de indivíduos, empresas, dentre outros. E, contudo, é pouco razoável quando se trata de unidades espaciais, tais como, regiões, cidades, microrregiões dentre outros recortes geográficos. Nesse sentido, é justificado o uso de meios adaptativos quando se pretende utilizar variáveis a esse nível.

4.2.3

Modelos de regressão: efeitos fixos e aleatórios sem e com dependên-

cia espacial

Por utilizar dois períodos de tempo, o presente estudo irá considerar modelos com painel de dados. Onde, segundo Baltagi(2008), os benefícios dos modelos convencionais de dados em painel, são: i) controlar a heterogeneidade individual; ii) fornecem dados mais informativos, mais variabilidade, menos colinearidade entre as variáveis, mais graus de liberdade e mais eficiência; iii) são mais capazes de estudar a dinâmica do ajuste; iv) são mais eficientes em identificar e medir efeitos que simplesmente não são detectáveis em dados puros de seção cruzada ou de séries temporais puras; v) permitem construir e

testar modelos comportamentais mais complicados do que dados puramente transversais ou séries temporais; vi) os dados de micro painel coletados em indivíduos, empresas e domicílios podem ser medidos com mais precisão do que variáveis similares medidas no nível macro; vii) o painel de dados ao nível macro, por outro lado, têm uma série temporal mais longa e, diferentemente do problema de distribuições não padrão típicas dos testes de raízes unitárias na análise de séries temporais.

No que diz respeito às limitações, Baltagi (2008) elenca cinco: i) problemas de design e coleta de dados; ii) Distorções de erros de medição; iii) problemas de seletividade (auto seletividade, não resposta, atrito.); iv) dimensão de séries temporais curtas; e v)

dependência de seção transversal.

O método de painel de dados é composto por uma combinação de dados de séries temporais com dados de corte transversal. Tais observações podem variar de acordo com o objeto de estudo, isto é, são características de indivíduos ao longo do tempo, sendo que os indivíduos podem ter uma conotação mais geral como regiões, firmas, países, entre outros. Nesse caso, os municípios brasileiros. Partindo de sua expressão mais geral, tem-se que:

Yit = β0+ β1x1it+ ... + xkit+ uit (4.16)

onde, Yit, é o valor da variável dependente para a unidade seccional i no instante t, onde

i = 1, ..., net = 1, ..., T . E xit, nada mais é, do que o valor da j-ésima variável explicativa

para a unidade i no tempo t (JOHNSON; DINARDO, 2001).

Inicialmente, tem-se o estimador combinado (pooled data). Se trata do método de estimação mais simples, o qual ignora a estrutura de painel. Os dados são organizados de forma empilhada, conforme o modelo:

Yt= Xtβ + t (4.17)

Segundo Baltagi (2008), as hipóteses assumidas correspondem às condições do modelo clássico linear. Dessa forma, pode-se aplicar o método dos Mínimos Quadrados Ordinários (MQO) nesse modelo. Apesar da simplicidade do método, este tende a ser inapropriado, dado a violação das hipóteses assumidas.

Outro meio de estimação se dar por meio do modelo de regressão com efeitos fixos. Nesse modelo, tem-se que os coeficientes angulares são constantes, mas o intercepto varia entre os indivíduos. Se trata de uma forma de levar em conta a “individualidade” dos municípios, isto é, de cada unidade de corte transversal. De modo geral, se trata de um modelo invariante ao longo do tempo e pode ser estimado utilizando, inicialmente, a

técnica das variáveis dummies. Formalmente expresso na Equação 4.18:

Yit = β1t+ β2x2it+ β3x3it+ uit (4.18)

Nesse modelo, é possível identificar que o termo de intercepto tem um subscrito i, sugerindo que os interceptos podem variar para cada indivíduo.

Considerando ainda a Equação 4.18, pode-se estender a outro método de estimação que é o dos modelos de efeitos aleatórios. Ao invés de tratar β1t como fixo no tempo,

supõe-se que seja uma variável aleatória com valor médio β1 (sem o subscrito i). E o valor

do intercepto para um dos municípios é representado por:

β1t= β1+ i (4.19)

onde, i é um termo de erro aleatório com média zero e variância σ2ε. Nesse modelo,

presume-se que o intercepto e que as diferenças individuais no intercepto de cada unidade se refletem no termo de erro i.

Outra característica do modelo de efeitos aleatórios, é que além de utilizar o método de estimação de Mínimos Quadrados Generalizados (MQG), o termo de erro consiste de dois elementos: i) específico dos indivíduos (elemento de corte transversal): i; ii) E o elemento

combinado da série temporal e do corte transversal: uit. Por pressuposição, os componentes

de erro individuais não estão correlacionados entre si nem estão correlacionados entre as unidades de corte transversal e as de séries temporais. Logo:

E (W1t) = 0 (4.20)

var (W1t) = σ2 + σ 2

u (4.21)

Mas, se σ2ε = 0, não há diferença entre os modelos de regressão combinada e

este de efeitos aleatórios. Em termos formais, o modelo de efeitos aleatórios é descrito da seguinte maneira:

Yit= α1+ β2x2it+ β3x3it+ ... + βkxkit+ α∗1+ εit (4.22)

No entanto, dado a complexidade das características do objeto em estudo, pode-se haver uma possível dependência espacial entre as unidades de corte transversal no modelo de painel de dados. Nesse sentido, o mais indicado é utilizar um painel de dados que considere os efeitos espaciais. SegundoAlmeida(2012), consiste de uma amostra de regiões, observadas em diversos momentos do tempo. De modo geral,Anselin(1988) afirma que um

painel de dados espaciais é a forma de acomodar a heterogeneidade espacial não observável que se manifesta nos parâmetros da regressão, sobretudo nos interceptos e, ainda, podendo se manifestar no componente de erro. Estas variáveis omitidas podem exercer influência sobre os interceptos, fazendo-os variar conforme a região.

SegundoAlmeida(2012), num primeiro momento, considera-se um modelo simples de dados agrupados (pooled data), sem controle para efeitos não observados, na forma empilhada, conforme Equação 4.17, descrita anteriormente:

Yt= Xtβ + t (4.23)

em que a variável depende é representada por yt= (y1t, ..., ynt); as variáveis explicativas

exógenas são denotadas por Xt = (x1t, ..., xnt), sendo que β é um vetor de coeficientes

que acompanha as variáveis explicativas; e o termo de erro t = (1t, ..., nt) 0

é idêntico e independentemente distribuído, com média zero e variância constante. Assim, se se considera modelo de efeitos não observados, com dados espaciais na forma empilhada, sem dependência espacial:

Yt = Xtβ + α + t (4.24)

na qual αt = (α1, ..., αn) são efeitos não observados, específicos às regiões e invariantes

com o decorrer do tempo de análise. Esses efeitos podem ou não estar correlacionados com as variáveis explicativas do modelo (Xt), conforme explanado por Almeida (2012) e

Arbia (2014).

Já no modelo de efeitos fixos com dependência espacial, assume que as diferentes regiões são captadas nos diferentes interceptos. Esses efeitos pretendem capturar se há heterogeneidade não observável na desigualdade intermunicipal de renda, permitindo que tais diferenças sejam tratadas de forma sistemática. Portanto, segundo LeSage e Pace

(2004) eAlmeida(2012) a estimação por efeitos fixos tem a vantagem de controlar este tipo de heterogeneidade não observável, considerando adicionalmente a dependência espacial dos dados. Em termos formais, o modelo geral assume, usando dados empilhados:

yt= α + ρW1yt+ Xtβ + W1Xtτ + ξt (4.25)

ξt= λW2ξt+ εt (4.26)

ou

em que W1yt é a defasagem espacial da variável dependente; as variáveis explicativas exóge-

nas defasadas espacialmente são representadas por W1Xt; os erros defasados espacialmente

são simbolizados por λW2ξt. Finalmente ρ e λ são parâmetros espaciais escalares, ao passo

que τ é um vetor de coeficientes espaciais.

Conforme Almeida(2012), um modelo alternativo ao de efeito fixo, é aquele que considera os efeitos não observados e invariantes no tempo, que são específicos à região, não como sendo fixos, mas como sendo variável aleatório. Denominados efeitos aleatórios, que avalia como sendo um componente do termo de erro aleatório. Nesse sentido, agora há de considerar a extensão do modelo de efeitos aleatórios com a dependência espacial. Em primeiro lugar, especifica-se o modelo geral espacial com efeitos aleatórios:

yt= ρW yt+ Xtβ + W Xtτ + ξt (4.28)

ξt= α + λW ξt+ εt (4.29)

A partir desses modelos generalizados, são impostos algumas restrições dado os resultados de alguns testes. Assim, obtêm-se os modelos com variável defasada espacial- mente, ou autocorrelação espacial nos termos de erros, ou mesmo ambos. Na subseção seguinte é demonstrado o modelo empírico adotado e os testes feitos para esse diagnóstico.

4.2.4

Modelo empírico adotado

A escolha do modelo mais adequado à base de dados em estudo, é fundamentado em alguns testes essenciais. Mais recentemente, a quantidade de estudos referentes aos modelos de painel espacial vêm crescendo e a quantidade das informações estão cada vez mais aprimoradas (SILVA,2019).

A análise espacial de dados caracteriza-se por levar em consideração o modo como as observações distribuem-se espacialmente (OLIVEIRA; DOMINGUES,2005). Estudos de

Elhorst (2003),LeSage e Pace (2004) e Almeida (2012) identificam que a heterogeneidade espacial, conforme discutida anteriormente, deve ser controlada ou por meio da utilização de modelos de efeitos fixos ou de efeitos aleatórios, no caso do uso de painel de dados, e a escolha entre os modelos será feita com base no teste de Hausman.

Basicamente, segundo Baltagi (2008), o teste de especificação de Hausman é um teste estatístico utilizado em Econometria que avalia a consistência de um estimador comparado a um outro estimador alternativo. Esse teste é válido para modelos com e sem dependência espacial.

Para o diagnóstico do modelo mais adequado para dependência espacial, é utilizado os testes de Multiplicador de Lagrange. A estatística descoberta por Rao (1948), que

ficou conhecida na literatura como teste do Multiplicador de Lagrange (LM), tornou-se amplamente utilizada em função de sua facilidade operacional. Nesse sentido, os resultados