• Nenhum resultado encontrado

3 ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOS

3.2 CONCEITOS BÁSICOS EM ANÁLISE ESPACIAL

3.2.1 Dependência Espacial

A noção de dependência espacial parte de Tobler (1979) que enuncia a primeira lei da geografia, segundo a qual, todas as coisas são parecidas; no entanto, coisas mais próxi- mas se parecem mais do que coisas mais distantes. Nesse contexto, Cressie (1991) afirma que a dependência espacial está presente em todas as direções e torna-se mais fraca à medida que se aumenta a dispersão na localização dos dados.

Em termos gerais, diz-se que a maior parte dos fenômenos; quer sejam naturais, quer sejam sociais, apresentam uma relação que depende da distância. Por exemplo, se há um foco de criminalidade em uma região da cidade, é mais provável que locais próximos também tenham altos índices de violência.

Capítulo 3 – Análise Espacial de Dados Geográficos 48

No caso das PNTs, nem sempre a lei de Tobler é obedecida. Se um cliente pratica fraude não necessariamente seu vizinho também praticará. Logo, não há evidência de que a presença de uma UCs com fraude estimule as UCs vizinhas na prática de igual delito. Uma subárea distante, por exemplo, pode exercer maior influência do que uma subárea fronteiriça. Portanto, a abordagem tradicional da análise espacial de considerar subáreas vizinhas como sendo apenas subáreas fronteiriças será adaptada a fim de melhor representar o problema das PNTs.

A dependência espacial é representada computacionalmente por meio da autocor- relação espacial. A correlação é uma medida estatística com o intuito de mensurar o relacio- namento entre duas variáveis aleatórias. O prefixo “auto” indica que a correlação é realizada com a mesma variável aleatória medida em locais distintos do espaço. Verifica-se como varia a dependência espacial a partir da comparação dos valores de uma amostra e de seus vizinhos. Existem vários indicadores para mensurar a autocorrelação espacial como o índice de Moran (para análise espacial de áreas agregadas) e o variograma (para análise espacial de superfícies contínuas), por exemplo. Todos são casos particulares de uma estatística de produtos cruzados conforme (2).

Γ = ∑ ∑ �

= =

(2)

Dada uma distância d, são os elementos da matriz de contiguidade espacial entre as variá- veis e informando, por exemplo, se elas estão separadas por uma distância inferior a d. � fornece uma medida de correção entre estas variáveis aleatórias. Os valores obtidos são comparados com os valores que seriam produzidos se não houvesse associação espacial entre as variáveis. Valores significativos dos índices de autocorrelação espacial indicam dependên- cia espacial e, por isso, os modelos inferenciais, nesses casos, devem necessariamente consi- derar o espaço explicitamente.

3.2.2 Inferência Estatística em Dados Espaciais

Uma consequência da dependência espacial é que as inferências estatísticas não serão tão eficientes quanto no caso de amostras independentes de mesmo tamanho. A depen- dência espacial leva a uma perda do poder explicativo. Isso se reflete em variâncias maiores para as estimativas, em níveis menores de significância em testes de hipóteses e a um ajuste

Capítulo 3 – Análise Espacial de Dados Geográficos 49

pior para modelos estimados frente a dados de mesma dimensão que exibam independência (DRUCK et al., 2004).

A perspectiva mais apropriada é considerar os dados espaciais, não como um con- junto de amostras independentes, mas como uma única realização de um processo estocástico. Na visão amostral tradicional, cada observação traz uma informação; em um processo esto- cástico, todas as observações são utilizadas de forma conjunta para descrever o padrão espaci- al do fenômeno estudado.

3.2.3 Estacionaridade e Isotropia

Os principais conceitos estatísticos que definem a estrutura espacial dos dados relacionam-se aos efeitos de primeira e de segunda ordem. O efeito de primeira ordem é o valor esperado, ou seja, a média global do processo no espaço. Efeito de segunda ordem cor- responde à covariância entre as áreas e .

O processo é dito estacionário se os efeitos de primeira e de segunda ordem são constantes na região sob análise, isto é, não há tendência.

Um processo é isotrópico se, além de estacionário, a covariância depende apenas da distância entre os pontos e não da direção entre os mesmos.

Um processo estocástico é estacionário de segunda ordem se a esperança de é uma constante m em toda região A conforme expressão (3).

�{ } = (3)

Ademais, a estrutura de covariância espacial depende unicamente do vetor dife- rença entre os pontos = − ′ conforme (4).

� = �{ . + } − �{ }. �{ + } (4)

A hipótese de estacionaridade de um processo espacial pode ser verificada via análises exploratórias e estatísticas descritivas que consideram explicitamente a localização espacial. Quando a covariância varia simultaneamente com a distância e a direção ela é dita anisotrópica. Quando a dependência espacial é a mesma em todas as direções, o fenômeno é isotrópico, conforme supracitado.

Capítulo 3 – Análise Espacial de Dados Geográficos 50

3.2.4 Modelos inferenciais

A análise espacial é composta por um conjunto de procedimentos encadeados cuja finalidade é a escolha de um modelo inferencial que considere explicitamente o relacionamen- to espacial presente no fenômeno (DRUCK et al., 2004).

O procedimento inicial da análise espacial é a análise exploratória que se constitui basicamente na visualização dos dados, em geral, por meio de mapas. Observa-se, dessa for- ma, a distribuição das variáveis sob estudo, identificam-se padrões na distribuição espacial e padrões atípicos – denominados outliers. Através desses procedimentos de exploração inicial dos dados, elaboram-se hipóteses a partir das observações realizadas e seleciona-se o modelo inferencial que melhor se adequa aos dados.

Os modelos inferenciais espaciais são categorizados em três grupos: processos pontuais, variação contínua e variação discreta. Para resolução de um problema espacial pode- se empregar um deles, a interação de alguns ou mesmo o uso de todos. Uma das vantagens dos modelos contínuos, por exemplo, é que a inferência não se limita a áreas arbitrariamente definidas. Em contrapartida, modelos discretos permitem mais facilmente estimar parâmetros de associação entre as variáveis.

Conforme Druck et al. (2004), a escolha final será do pesquisador que sabe não existir “o modelo certo”, mas que busca um modelo que se ajuste aos dados e que tenha maior potencial para contribuir para a compreensão do fenômeno sob estudo.

Neste estudo, as PNTs são representadas como pontos no espaço (processo pontu- al) e como dados agregados por áreas. Esses modelos de inferências são abordados com mais detalhes nas seções subsequentes. Uma abordagem completa a respeito dos modelos espaciais de variação contínua, como em Diggle e Ribeiro (2007), foge ao escopo do presente trabalho.