• Nenhum resultado encontrado

2. EVOLUÇÃO E DISTRIBUIÇÃO DA CRIMINALIDADE EM MINAS

2.2 Metodologia

2.2.3 Análise Exploratória de dados espaciais (AEDE)

A econometria espacial difere da econometria convencional porque leva em consideração os chamados efeitos espaciais na especificação, na estimação e no teste de hipótese e previsão de modelos, com dados do tipo cross-section ou com um painel de dados. Metodologicamente, a econometria espacial busca tratar quantitativamente o comportamento do agente tanto do ponto de vista atomístico (quais são os fatores exógenos independentes do espaço que interferem em sua tomada de decisões) quanto da sua interação com outros agentes heterogêneos ao longo do espaço, este igualmente heterogêneo (ALMEIDA, 2004).

Os efeitos espaciais derivam diretamente da Lei de Tobler, também conhecida como a primeira Lei da Geografia: “todas as informações são relacionadas entre si, mas informações vizinhas são mais relacionadas que informações distantes”. Dessa forma, a dependência espacial ou sua forma empírica, a autocorrelação espacial, ocorre num modelo econométrico quando os valores de variáveis dependentes e/ou dos termos de erros em um local são correlacionados com os valores das observações correspondentes nas vizinhas locais (PEIXOTO et al., 2004).

Conforme destacado por Anselin e Bera (1998), em processos espaciais existe imbricamento entre os efeitos de violação da esfericidade dos erros e da heterocedasticidade, gerada pela dependência espacial: heterogeneidade gera dependência espacial e, por sua vez, dependência espacial pode também induzir heterogeneidade. Assim, essas características provocam sérias dificuldades para identificar modelos econométricos espaciais de forma apropriada. Em vista disso, uma análise exploratória de dados espaciais (AEDE) pode auxiliar a superar tal problema de identificação, provendo claras dicas e indicações sobre a existência de padrões de associação espacial.

Uma questão crucial no estudo da análise exploratória de dados espaciais é descobrir se os dados são distribuídos aleatoriamente através do espaço ou se estão autocorrelacionados espacialmente. Caso eles estejam autocorrelacionados no espaço, haverá a presença de externalidades. De forma intuitiva, não havendo aleatoriedade espacial, os valores de um atributo num município, por exemplo, dependerão dos valores desse atributo nos municípios vizinhos.

Para identificação e mensuração da autocorrelação espacial, é necessário, portanto, a definição do critério de vizinhança. Existem vários critérios de vizinhança, dependendo da escolha de elementos diferentes de zero para pares de observações correlacionadas. Para

análise das taxas de crime em Minas Gerais, será utilizado o critério de matriz binária de vizinhança. A matriz binária de pesos espaciais pode ser construída segundo a idéia da contigüidade, cuja definição é: duas regiões são vizinhas, caso elas partilhem de uma fronteira física comum. Com base nesse conceito de contigüidade, é atribuído um valor unitário na matriz a duas regiões vizinhas; caso contrário, atribui-se um valor nulo. Há duas convenções usadas na construção de matrizes binárias de pesos espaciais: torre e rainha. Na convenção torre, somente fronteiras comuns são consideradas no cálculo da matriz de peso espacial, enquanto na convenção rainha ambas as fronteiras comuns e vértices comuns (ou nós) existentes entre os municípios também são considerados5.

Com o objetivo de verificar se os dados espaciais são distribuídos de forma aleatória, utilizam-se estatísticas que, por meio de testes formais, examinam a presença ou não de autocorrelação espacial. As estatísticas dos testes apresentam como hipótese nula a aleatoriedade espacial. Essas fazem uso de uma matriz binária, onde se estabelece 1 no caso em que há relação de vizinhança (contigüidade) e 0 quando não são vizinhos (ALMEIDA, 2004). Esta matriz é a de pesos espaciais, sendo, neste artigo, simbolizada pela letra W.

Para descobrir se valores de um atributo numa região não dependem dos valores desse atributo nas regiões vizinhas, ou seja, são distribuídos aleatoriamente, pode-se utilizar a estatística I de Moran global, ou simplesmente I de Moran. O coeficiente de correlação espacial I de Moran pode ser descrito da seguinte forma:

) ( ) )( ( y y y y y y w w n I i j i ij ij − − − =

∑∑

∑∑

(2.5)

em que yi é a variável de interesse, n é o número de unidades espaciais, wij é o peso espacial para o par de unidades i e j, medindo o grau de interação entre elas. Essa estatística tem valor esperado igual a E(I) =-1/(n-1), valor que resultaria da ausência de autocorrelação espacial nos dados.

Valores de I maiores que os esperados indicam autocorrelação espacial positiva, enquanto valores menores que os esperados apontam para autocorrelação negativa. A estatística varia entre –1 e +1 e não é centrada em 0, aproximando-se deste valor de forma assintótica.

5

Autocorrelação espacial positiva indica que há similaridade entre os valores do atributo em estudo (por exemplo, taxa de homicídio) e da localização espacial do atributo (por exemplo, município). Ou seja, um valor positivo do I de Moran revela que, de modo geral, municípios com altas (baixas) taxas de homicídio tendem a ser rodeados por municípios com altas (baixas) taxas de homicídio.

Um valor negativo de I indicando autocorrelação espacial negativa aponta para uma dissimilaridade entre os valores do atributo e da localização espacial deste. Assim, por exemplo, autocorrelação negativa revela que, em geral, municípios com alta (baixa) taxa de homicídio tendem a ser rodeado por municípios com baixa (alta) taxa de homicídio.

Contudo, deve-se tomar cuidado, pois uma forte indicação tanto de autocorrelação global quanto de ausência de autocorrelação global pode ocultar padrões de associação local, como clusters e outliers. Nesses casos, o I de Moran global não consegue captar a presença de autocorrelação local estatisticamente significante. Para isso, deve-se usar uma variante do I de Moran global.

Segundo Anselin e Bera (1998), o I de Moran local univariado decompõe o indicador global de autocorrelação na contribuição local de cada observação em quatro categorias, cada uma correspondendo individualmente a um quadrante no diagrama de dispersão de Moran6. A estatística I de Moran local univariada pode ser interpretada como uma indicação de agrupamento dos valores similares em torno de uma determinada observação, identificando clusters espaciais estatisticamente significativos.

Essa estatística, para cada observação i, pode ser apresentada como:

− − − = i i j i ij i i n y y y y w y y I / ) ( ) ( ) ( 2 (2.6) ou

= j j ij i i z w z I (2.7) 6

Nesse diagrama são representados os coeficientes de correlação I de Moran para cada município analisado, e acima do diagrama é apresentado o valor da estatística I global. O eixo horizontal representa a variável analisada e no eixo vertical a variável nos seus vizinhos. É importante destacar que as variáveis apresentadas no diagrama são padronizadas.

em que zi e zj são as variáveis padronizadas e o somatório sobre j é tal que somente os valores dos vizinhos j ∈ Ji são incluídos. O conjunto Ji abrange os vizinhos da observação i. O valor esperado da estatística Ii sob o pressuposto de aleatoriedade é dado por:

[ ]

I =−w /(n−1)

E i i (2.8)

em que wi é a soma dos elementos da linha da matriz w. A variância é apresentada da seguinte forma:

V w I

Var( i)= i2 (2.9)

em que V é a variância de I sob o pressuposto da aleatoriedade.

Pode-se mostrar que o I de Moran é tido como a inclinação da regressão do atributo em um dado município em função do mesmo atributo nos municípios vizinhos (ALMEIDA, 2004).

Documentos relacionados