Este capítulo tem por objetivo apresentar a metodologia a ser utilizada nesse trabalho. Esta metodologia compreende a análise exploratória de dados espaciais, tendo como base metodológica estatística a autocorrelação espacial do Índice Global de Moran – indicador de nível global – e o Índice Local de Associação Espacial (LISA) – indicador de nível local. A autocorrelação refere-se à correlação espacial entre atributos de uma mesma variável aleatória em diferentes localizações do espaço. Somando-se, a isto, uma avaliação de mapas de percentis extraídos a partir do software GeoDa. Os dados da indústria de plástico da Bahia foram inseridos em uma tabela (.dbf), que contêm polígonos delimitadores dos municípios do estado.
O objetivo proposto consiste em identificar quais os municípios obtiveram maior índice de empresas e emprego e qual a intensidade da correlação espacial existente entre os mesmos. Com base nos resultados espera-se fornecer um panorama da indústria de plástico no estado baiano, além de identificar possíveis arranjos produtivos (clusters).
4.1 MAPAS DE PERCENTIL
O mapa de percentil é um instrumento de medida da posição de uma unidade observacional, responsável em permitir localizar territorialmente os municípios para a amostra em análise. Ferramenta importante, uma vez que possibilita revelar o nível da concentração espacial dos elementos analisados. O intuito da utilização desse instrumento neste trabalho consiste em demonstrar nível ou o padrão de distribuição espacial da indústria de plástico.
4.2 ÍNDICE GLOBAL DE MORAN
O Índice Global de Moran está entre os índices de autocorrelação espacial como maior frequência de utilização em economia espacial, sendo este um indicador que fornece uma medida geral da associação espacial existente para todo o conjunto de dados. Em síntese, mostrar como os valores estão correlacionados no espaço (RIGOTTI, 2012). Segundo Paiva (2012), este índice presta-se a um teste cuja hipótese nula representa independência espacial, ou seja, o índice seria igual a zero, indicando a inexistência de autocorrelação espacial e valores próximos a zero correspondem à autocorrelação espacial não significativa, entre o valor do atributo do objeto e o valor médio do atributo de seus vizinhos.
O cálculo do índice global de Moran (I) é expresso pela seguinte fórmula:
Onde:
n é o número de observações, neste caso, de municípios; wij é o elemento na matriz de vizinhança para o par i e j; zi e zj são desvios em relação à média (zi – zm); (zj – zm); zm é a média.
De acordo com Paiva (2012), a correlação só é calculada para os vizinhos de primeira ordem no espaço, conforme estabelecido pelos pesos wij. Por conseguinte, o mesmo cálculo sendo realizado para a matriz de proximidade de maior ordem permite estimar a função de autocorrelação para cada ordem de vizinhança.
Embora o índice global de Moran seja considerado um bom indicador sobre o comportamento espacial, este explicita apenas um único valor como medida de associação espacial para todo o conjunto da área de estudo. Desse modo, quando houver um elevado número de áreas é provável que ocorram diferentes regimes de associação espacial. “Dito isso, para evidenciar os locais em que a dependência espacial é ainda mais acentuada, uma possibilidade é utilizar o Índice Local de Associação Espacial – LISA” (MARQUES et al.,2010, p. 03).
4.3 ÍNDICE LOCAL DE ASSOCIAÇÃO ESPACIAL (LISA)
Apesar do índice global de Moran responder de forma eficiente como bom indicador sobre o comportamento espacial dos fenômenos, infelizmente ele não propicia uma observação detalhada para um elevado número de áreas, o que possibilita que nessas áreas ocorram
diferentes regimes de associação espacial que não são contidas por esse índice (HOLZSCHUH et al., 2010). Assim, uma forma de identificar padrões locais de autocorrelação espacial estatisticamente significativos, segundo Holzschuh et al. (2010), é fazer uso do Índice Local de Associação Espacial, pois o LISA identifica clusters estatísticos de regiões com o mesmo comportamento da variável estudada e outros padrões espaciais locais.
De acordo com Paiva (2012), a Estatística Espacial Local foi desenvolvida com o intuito de “quantificar o grau de associação espacial a que cada localização do conjunto amostral está submetida em função de um modelo de vizinhança preestabelecido.” Assim, os LISAs possibilitam a separação dos indicadores globais, como o índice de Moran, em índices singulares que revelem territórios e aglomerados (clusters) significativos de valores semelhantes em torno de determinadas localizações. Isso ocorre, segundo Anselin (1995 apud PAIVA, 2012), devido à proporcionalidade direta entre o valor da autocorrelação global e os valores auferidos de autocorrelações locais.
Ademais, é possível identificar outliers, ou seja, objetos anômalos, tendo em vista que:
Anselin (1994) afirma que um indicador local de associação espacial é qualquer estatística que (1) permita a identificação de padrões de associação espacial significativos, e (2) que a soma total do LISA de todas as áreas é proporcional ao valor obtido para o índice global, isto é, que o indicador local seja uma decomposição do indicador global. (MARQUES et al. ,2010, p. 03).
Neste índice, a autocorrelação espacial é calculada a partir do produto dos desvios em relação à média como medida de covariância, de modo que os valores significativamente elevados indicam elevadas probabilidades de que haja locais de associação espacial, aplicando-se tanto a regiões com altos valores associados quanto àquelas com baixos valores associados (PAIVA, 2012). A estatística local de Moran para cada área i a partir dos valores normalizados zi do atributo é dada por:
Os valores alcançados através do índice de Moran Local podem ser evidenciados em um mapa denominado de LISA MAP, sendo possível realizar uma análise visual sobre as áreas mais correlacionadas no espaço, ou seja, dependentes espacialmente.
Anselin (1994 apud MARQUES, 2012) afirma que nesse mapa as áreas apresentam cinco diferentes classificações a depender do nível de significância, que são: sem significância; significância de 0,05 (95% de confiança); de 0,01 (99% de confiança); de 0,001 (de 99,9% de confiança); e de 0,0001 (de 99,99% de confiança).
Para melhor compreensão da análise dos dados, Druck et al.(apud MARQUES, 2012) expõe que uma maneira alternativa de visualização da dependência espacial existente no conjunto de dados é através do gráfico de espelhamento de Moran. De acordo com o autor, este diagrama é dividido em quatro quadrantes, de forma que permite interpretar a associação linear entre cada valor de atributo zi em relação à média dos valores dos atributos de seus vizinhos zm, dado que Anselin (1993 apud MARQUES, 2012) afirma que o indicador de Moran é um coeficiente de regressão linear entre zi e zm.
Sendo assim, Marques (2012) expõem os quadrantes do gráfico de Moran com as seguintes situações: os quadrantes superior direito e inferior esquerdo – indicam associação espacial positiva, ou seja, a área para o valor do atributo considerado está cercada por áreas que tem comportamento similar, sendo o quadrante superior direito (High-High = Alto-Alto), indicando que os valores do atributo considerado e os de seus vizinhos estão acima da média do conjunto e o quadrante inferior esquerdo (Low-Low = Baixo-Baixo), sinalizando que tanto os valores do atributo quanto à média dos vizinhos, estão abaixo da média.
Os quadrantes superior esquerdo e inferior direito – sinalizam comportamentos espaciais negativos. Os valores baixos estão arrodeados por valores altos, isto é, com valores que apresenta áreas que tem comportamento divergentes (quadrante superior esquerdo: Baixo- Alto (Low-High), indicando valor negativo e média dos vizinhos positiva) e valores altos são rodeados por valores baixos (quadrante inferior direito: Alto - Baixo (High-Low), demonstrando valor positivo e média dos vizinhos negativa) (ANSELIN, 1993 apud MARQUES et al.,2012, p. 03).
5 O PADRÃO DE DISTRIBUIÇÃO ESPACIAL DA INDÚSTRIA DE PLÁSTICO NO