• Nenhum resultado encontrado

2.3 ECONOMETRIA ESPACIAL: A TÉCNICA

2.3.1 Análise Exploratória dos Dados Espaciais (AEDE)

Esta etapa da modelagem tem por objetivo descrever e visualizar a distribuição espacial, definir os padrões de associação espacial (clusters espaciais), verificar regimes espaciais e instabilidades espaciais (não-estacionariedade), identificar observações atípicas (outliers espaciais), sendo capaz de auxiliar no processo de especificação do modelo, tratando, para isso, os efeitos decorrentes da dependência espacial e da heterogeneidade espacial (ANSELIN, 1999). O objetivo desta etapa é conhecer melhor os dados em estudo, realizando uma análise exploratória antes da análise confirmatória, deixando os dados falarem por si próprios.

O primeiro passo na AEDE é testar a hipótese de distribuição aleatória dos dados. Essa aleatoriedade espacial indica que a variável observada em determinada região não depende dessa mesma variável presente na região vizinha.

Moran (1948) propôs o primeiro coeficiente de autocorrelação espacial, denominado de I de Moran. Essa estatística fornece o grau de associação linear entre os valores observados de uma observação de interesse no tempo t (𝑍𝑡) e a média ponderada dos valores da vizinhança ou defasagens espaciais (spatial lags) (Wz) e sua hipótese nula é a completa aleatoriedade espacial ou a dispersão espacial, com variáveis distribuídas ao acaso entre as regiões, sem relação com sua posição geográfica (ALMEIDA, 2012). Essa estatística é expressa conforme Equação (12) abaixo:

𝐼 = 𝑛 𝑆𝑜 ∑ ∑ 𝑊𝑖 𝑗 𝑖𝑗𝑍𝑖𝑍𝑗 ∑𝑛 𝑍𝑖2 𝑖=1 (12)

Podendo ser expressa matricialmente conforme Equação (13):

𝐼 = 𝑛 𝑆𝑜 𝑍′𝑊𝑍 𝑍′𝑍 (13) Onde: n é o número de regiões;

Z são os valores da variável de interesse padronizada;

𝑊𝑍 são os valores médios da variável de interesse padronizada nos vizinhos, definidos segundo uma matriz de ponderação espacial W, ou de maneira geral, o termo z defasado espacialmente;

𝑊𝑖𝑗 é um elemento da matriz de ponderação espacial, referente à região i e a região j; 𝑆𝑜 corresponde a ∑ ∑𝑊𝑖𝑗, indicando que todos os elementos da matriz de pesos especiais W devem ser somados.

No caso da utilização da matriz normalizada na linha, a Equação (14) pode ser escrita como:

𝐼 = 𝑍′𝑊𝑍

𝑍′𝑍 (14)

Conforme dito anteriormente, a hipótese nula testada é a da aleatoriedade espacial, onde o valor esperado para a estatística I de Moran é −[1/(𝑛 − 1)], ou seja, o valor sem o padrão espacial nos dados. O valor calculado de I é igual ao seu valor esperado, estatisticamente significativo, se 𝑦𝑖 for independente desse mesmo valor nas regiões vizinhas. Caso o valor de I seja maior que o seu valor esperado, há uma indicação de autocorrelação espacial positiva, caso seja menor que seu valor esperado, indica autocorrelação espacial negativa.

𝐼 > 𝐸 = 𝑎𝑢𝑡𝑜𝑐𝑜𝑟𝑟𝑒𝑙𝑎ç𝑎õ 𝑒𝑠𝑝𝑎𝑐𝑖𝑎𝑙 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎; 𝐼 < 𝐸 = 𝑎𝑢𝑡𝑜𝑐𝑜𝑟𝑟𝑒𝑙𝑎çã𝑜 𝑒𝑠𝑝𝑎𝑐𝑖𝑎𝑙 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑎.

A autocorrelação espacial positiva indica a similaridade entre o atributo e sua localização espacial. Fotheringham, Brunsdon e Charlton (2002) explicam que altos valores de um atributo tendem a se agrupar em uma região da área em estudo e baixos valores desse mesmo atributo tendem a se agrupar em outra região, assim esse atributo possui autocorrelação espacial positiva. Essa ideia conceitua o que é chamado de contágio ou efeito de transbordamento, no qual altos (ou baixos) valores de y tendem a estar rodeados de altos (ou baixos) valores de y em regiões vizinhas Wy. No caso da autocorrelação espacial negativa, há uma dissimilaridade entre esses valores e sua localização.

De acordo com Gonçalves e Almeida (2009), essa autocorrelação (positiva ou negativa) será mais forte quanto maior for o valor dessa estatística em módulo.

Essa estatística teve suas vantagens e desvantagens descritas e analisadas em diversas publicações (KELEJIAN; ROBINSON, 1992; ANSELIN; FLORAX, 1995), com a indicação de que apresenta resultados mais satisfatórios que outras estatísticas para identificação da autocorrelação espacial, e com a desvantagem de não ser capaz de identificar se esta autocorrelação está presente na variável dependente ou nos erros da correlação espacial.

O Diagrama de Dispersão de Moran ou Diagrama de Espelhamento de Moran (Moran

Scatterplot) (Figura 3) é uma das maneiras de interpretar a estatística I de Moran, sendo uma

representação visual desta estatística. Foi proposto por Anselin (1996) e representa o valor de uma variável para cada uma das observações no eixo das abscissas e a média do valor dessa mesma variável para os vizinhos dessas unidades, no eixo das ordenadas, ambos padronizados.

Esse índice é uma representação do coeficiente de regressão, permitindo visualizar a correlação linear entre os valores observados Z e os valores das médias locais 𝑊𝑍 pelo gráfico de duas variáveis, onde o coeficiente I de Moran é a inclinação da reta de regressão (𝛽𝑜) de 𝑊𝑍 em Z, indicando o grau de ajustamento. Na prática, esse diagrama é o gráfico da dispersão da nuvem de pontos (regiões), com a declividade da reta de regressão.

Figura 3 - Diagrama de Dispersão de Moran

Fonte: Organização do autor (2017).

Para a declividade da reta, deve-se estimar a regressão linear simples, por MQO, conforme Equação (15):

𝑊𝑍 = 𝛼 + 𝛽𝑍 + 𝜀 (15)

Onde:

𝛼 é a constante de regressão; 𝛽 é o coeficiente angular; 𝜀 é o termo de erro aleatório.

Esse diagrama indica a medida global de associação linear, sendo que a autocorrelação espacial é positiva quando o coeficiente angular da reta é positivo, e negativa caso esse coeficiente seja negativo.

O Diagrama de Dispersão de Moran (Figura 3) é dividido em quatro quadrantes, que representam os quatro padrões de associação local espacial entre as regiões em estudo e seus vizinhos: Alto-Alto (AA), Baixo-Baixo (BB), Alto-Baixo (AB) e Baixo-Alto (BA).

O primeiro quadrante, AA, representa que a variável de interesse apresenta valores acima da média e está rodeada por regiões vizinhas com valores também altos. No segundo quadrante, BA, a variável de interesse apresenta um valor abaixo da média, mas está rodeada por regiões com valores altos. No terceiro quadrante, BB, as regiões com baixo valor estão rodeadas por regiões vizinhas também com valor abaixo da média e o quarto quadrante, AB, indica alto valor para a variável de interesse e baixo valor nas suas regiões vizinhas. O segundo e quarto quadrantes são conhecidos como regiões de transição. Uma localização que possui vizinhos com valores semelhantes (ou distintos), formará clusters de valores similares (ou diferentes). Quando não há correlação espacial, a nuvem de pontos fica bem distribuída nos quatro quadrantes do diagrama.

Esses indicadores globais de autocorrelação espacial citados anteriormente fornecem um único valor de medida da associação espacial para todo o conjunto de dados, caracterizando assim toda a região em estudo. Dessa maneira, torna-se necessário utilizar os Indicadores Locais de Associação Espacial ou Local Indicator of Spatial Association (LISA), caracterizando especificamente cada objeto em estudo.

Os indicadores locais devem atender aos seguintes objetivos (ANSELIN, 1995): - Permitir a identificação de padrões de associação espacial significativos (clusters espaciais) para cada observação;

- Ser uma decomposição do Índice Global de Associação Espacial, satisfazendo a propriedade de que o somatório dos indicadores locais é proporcional ao indicador de autocorrelação espacial global.

Um LISA realiza uma decomposição do indicador global de autocorrelação espacial para cada observação em quatro categorias (AA, BB, AB e BA) e cada uma dessas categorias corresponde a um quadrante do Diagrama de Dispersão de Moran.

O coeficiente 𝐼𝑖 de Moran local pode ser expresso conforme Equação (16) abaixo:

𝐼𝑖 = 𝑍𝑖∑ 𝑊𝑖𝑗𝑍𝑗 𝑗

𝑗=1

(16)

Onde:

y é uma variável padronizada, observada na região i, 𝑍𝑖.

Assim, para cada observação tem-se um 𝐼𝑖, gerando uma quantidade significativa de informações. Uma forma efetiva de apresentar essas informações é mapeá-las, utilizando-se, para isso, o LISA map (ANSELIN, 1995).

Esse mapa de significância é um mapa de clusters, que possui as informações do Diagrama de Dispersão de Moran e das medidas de associação local 𝐼𝑖, com quatro categorias de associação espacial, desde que estatisticamente significativas: Alto-Alto, Baixo-Baixo, Alto-Baixo e não significante.

Realizada a descrição da distribuição espacial e a definição dos padrões de associação espacial existentes nos dados em análise, compreendida pela AEDE, parte-se para a próxima etapa da técnica em questão: a modelagem econométrica-espacial, que está descrita no item que segue nesta pesquisa.