• Nenhum resultado encontrado

3 METODOLOGIA

3.3 Método de análise

3.3.2 Autocorrelação espacial global univariada

A autocorrelação espacial significa que o valor de uma variável de interesse, no caso a produtividade agrícola do feijão, numa certa região i, tende a estar relacionado ao valor dessa mesma variável nas regiões vizinhas j no mesmo ano (ALMEIDA, 2012).

De acordo com Paiva (2010), os indicadores de autocorrelação espacial global medem o grau de associação linear para o estado como um todo, caracterizando-o de um

modo geral. O cálculo destes indicadores é o primeiro passo para verificar a existência de efeitos espaciais nos dados, ou mais precisamente, a presença da dependência espacial no fato observado que pode ser univariada ou bivariada.

A autocorrelação espacial global univariada busca detectar a existência ou não de dependência espacial na variável de interesse, identificando padrões de associação linear de forma global. Tal medida é capaz de afirmar se um conjunto de dados está ordenado segundo uma certa sequência espacial. Segundo Almeida (2012), o primeiro coeficiente de autocorrelação espacial global univariado foi proposto por Moran em 1948, denominado de I de Moran: 𝐼 = 𝑛 𝑠0 ∑ ∑ 𝑤𝑖 𝑗 𝑖𝑗𝑧𝑖𝑧𝑗 ∑𝑛𝑖=1𝑧𝑖2 , (−1 ≤ 𝐼 ≤ 1) (2) Ou matricialmente: 𝐼 = 𝑛 𝑠0 𝑧′𝑊𝑧 𝑧′𝑧 , (−1 ≤ 𝐼 ≤ 1) (3) Em que n é o número de regiões, z denota os valores da variável de interesse

padronizada, ou seja, a produtividade agrícola do feijão, Wz representa os valores médios da variável de interesse padronizada nos vizinhos, definidos segundo uma matriz de ponderação

espacial W. Um elemento dessa matriz, referente à região i e à região j, é registrado como wij.

S0 é igual à operação ∑ ∑𝑖 𝑗𝑤𝑖𝑗, denotando que todos os elementos da matriz de pesos

espaciais W devem ser somados.

Conforme Almeida (2012, p. 106), a hipótese nula sendo testada por meio dessa estatística é a da aleatoriedade espacial. De acordo com Cliff e Ord (1981), o I de Moran tem

um valor esperado de – [1/(n – 1)]5

, isto é, o valor que seria obtido se não houvesse padrão espacial nos dados, indicando que os valores observados numa da região são independentes dos valores nas regiões vizinhas.

Caso os valores de I excedam o valor esperado, isto é, um indicador de autocorrelação espacial positiva [I > E(I)], têm-se, em geral, uma similaridade entre os valores do atributo estudado e da localização espacial do atributo. Ou seja, a autocorrelação espacial positiva indica que, no geral, altos valores de uma variável de interesse (y) tendem a estar

5 Ou seja, estatística I não é centrada em zero, mas à medida que o número de regiões aumenta, o valor esperado da estatística I de Moran aproxima-se de zero. Anselin (1992) afirma que o I de Moran é na verdade um pseudocoeficiente de autocorrelação.

circundados por altos valores desta mesma variável em regiões vizinhas (Wy) e/ou baixos valores da variável de interesse (y) tendem a estar rodeados por baixos valores desta mesma variável também para regiões vizinhas (Wy).

Esse é, na opinião de Fotheringham, Brundsdon e Charlton (2002), o padrão sistemático de distribuição dos valores da variável quando há um efeito de contágio ou efeito de transbordamento de um fenômeno em estudo. Nesse caso, a chance de se ter numa região vizinha um valor parecido com o que se tem numa determinada região é alta.

Por outro lado, se os valores de I ficarem abaixo do seu valor esperado isso sinaliza uma autocorrelação espacial negativa [I < E(I)], revelando que, em geral, existe uma dissimilaridade entre os valores do atributo estudado e da localização espacial do atributo, ou seja, altos valores da variável de interesse de uma dada região tende a estar rodeados por baixos valores desta mesma variável nas regiões vizinhas e/ou baixos valores da variável de interesse da região tendem a estar rodeados por altos valores desta mesma variável de interesse nas regiões vizinhas.

Almeida (2012, p. 107) aponta duas formas para verificar a significância estatística do I de Moran. A primeira forma é assumir o pressuposto da normalidade, isto é, assumir que a variável padronizada, Z(I), tem uma distribuição amostral que segue uma distribuição normal com média zero e variância unitária cuja fórmula para Z(I) é expressa como:

Z(I) = [I – E(I)]/DP(I) (4) Em que E(I) e DP(I) são, respectivamente, o valor esperado e desvio padrão teórico de I.

Já a segunda forma, conhecida como permutação aleatória, assume que o mecanismo estocástico gerador dos dados espaciais é aleatório, e o padrão dos dados observados é simplesmente um de muitas possíveis realocações das n observações em n locações.

Em suma, a partir do cálculo da estatística do I de Moran, têm-se as seguintes informações: (i) o nível de significância provê a informação sobre os dados estarem distribuídos aleatoriamente ou não; (ii) o sinal positivo da estatística I de Moran, desde que significativo, indica que os dados estão concentrados espacialmente através das regiões; (iii) o sinal negativo, por sua vez, indica a dispersão espacial dos dados; e (iv) a magnitude da estatística que fornece a força da autocorrelação espacial, ou seja, quanto mais próximo de 1,

mais forte é a concentração; quanto mais próxima de –1, mais dispersos estão espacialmente os dados.

O diagrama de dispersão de Moran apresenta, conforme Almeida (2012), o valor da variável de interesse no eixo horizontal e a defasagem espacial da mesma variável de

interesse no eixo vertical6

. Tanto a variável de interesse (y) quanto a sua defasagem espacial (Wy) que é dada pelo produto da matriz de ponderação espacial pelo valor da variável em estudo são padronizadas de tal modo que tenha média zero e variância unitária, quando apresentadas no diagrama, transformando-se em z e Wz.

Na verdade, o diagrama de dispersão de Moran é somente o gráfico da dispersão da nuvem de pontos representando as regiões, com a indicação da declividade da reta de regressão. Para conseguir a declividade dessa reta, estima-se uma regressão linear simples por mínimos quadrados ordinários (MQO), especificada como:

𝑊𝑧 = 𝛼 + 𝛽𝑧 + 𝜀 (5)

Em que α é a constante da regressão, β é o coeficiente angular, ε é um termo de erro aleatório. Nota-se que coeficiente I de Moran pode ser interpretado como o coeficiente angular da reta de regressão da defasagem espacial (Wz) contra a variável de interesse (z), estimado por mínimos quadrados ordinários (MQO).

Almeida (2012) destaca que, além da medida global de associação linear espacial, esse diagrama fornece muitas outras informações interessantes, tais como quadrantes representando quatro tipos de associação linear espacial diferentes, a saber, Alto-Alto (AA),

Baixo-Baixo (BB), Alto-Baixo (AB) e Baixo-Alto (BA)7

, como mostrado na Figura 5.

Figura 5 – Diagrama de dispersão de Moran

Fonte: Elaboração do autor.

6 Entende-se por defasagem espacial a média do valor da variável de interesse nas regiões vizinhas.

7 Almeida (2012, p. 109) alerta para a possível presença de outliers espaciais ou pontos de alavancagem que podem influenciar a inclinação da reta, afetando sobremaneira o valor da estatística do I de Moran.

Wz Wz z Alto-Alto (AA) Baixo-Baixo (BB) Alto-Baixo (BA) z Baixo-Alto (BA)

O primeiro quadrante Alto-Alto (AA) significa que as regiões exibem valores altos da variável de interesse, ou seja, acima da média, estão rodeados por regiões que também apresentam valores altos da variável de interesse. O segundo quadrante Baixo-Alto (BA) do diagrama refere-se a um grupo no qual uma região qualquer com baixo valor da variável de interesse é circundada por região com alto valor da mesma variável. O terceiro quadrante Baixo-Baixo (BB) do diagrama refere-se a um grupo de associação espacial cujas regiões mostram valores baixos, isto é, abaixo da média, circundados por regiões que

ostentam valores também baixos da variável de interesse, representados no terceiro quadrante. O quarto quadrante Alto-Baixo (AB) diz respeito a um agrupamento no qual uma região

qualquer com um alto valor da variável de interesse é vizinha de regiões com baixo valor da mesma variável de interesse.