ferramental de estatística espacial tentando conciliar, na modelagem, os aspectos geográficos e sociais do espaço. Os espaços sociais para Bourdieu equivalem às estruturas de diferença que são os princípios geradores da distribuição das formas de poder ou dos tipos de capital efici- entes no universo social considerado, que variam nos lugares e momentos. E para Giddens os atores humanos ao agirem possuem a capacidade para entender o que fazem enquanto fazem (capacidade reflexiva). Essa consciência prática (diferente da consciência discursiva e do in- consciente) está relacionada às atividades sociais cotidianas (rotinização) e, portando a ação recebe influência do posicionamento do indivíduo e das relações de co-presença (regionaliza- ção dos encontros). “As propriedades estruturais dos sistemas sociais só existem na medida em que formas de conduta social são cronicamente reproduzidas através do tempo e espaço. A estruturação de instituições pode ser entendida em função de como acontece de as atividades sociais se ’alongarem’ através de grandes extensões de ’espaço-tempo’ ” (GIDDENS, 2013, pp. XXII-XXIII).
Não será problematizada esta diferença, mas consideraremos que as componentes espaço- temporais como propostas por Giddens e os espaços sociais podem ser tratados de maneira con- junta e inovadora através da estatística espacial. Na seção a seguir será visto com mais detalhes e, claro, sem ser exaustivo, alguns aspectos desta área da estatística.
Figura 3 - Exemplos de padrão de pontos.
(a) (b)
Legenda: (a) Locais de ocorrências de crimes no município do Rio de Janeiro, (b) Posição dos países por IDH e Gini.
Fonte: (a) dados da Secretaria de Segurança Pública do Estado do Rio de Janeiro obtidos através do Laboratório de Análise da Violência (LAV-UERJ); (b) dados coletados da internet nas páginas do Banco Mundial e da Organização das Nações Unidas para o Desenvolvimento.
O autor, 2019.
e Cressie (1993), referências adicionais sobre estatística espacial são Shaddick e Zidek (2016), Cressie e Wikle (2011), Diggle e Ribeiro (2007) e, em português, Schmidt e Sansó (2006) ou Gamerman e Paez (2005).
(1) Dados pontuais:um processo pontual é um processo estocástico (i.e., uma variável aleatória indexada pela localização de ocorrência), cuja componente aleatória (o evento) é o local de ocorrência do fenômeno observado. A Figura 3 apresenta dois exemplos de dados pontuais:
(a) dados de homicídios, lesões e roubos na cidade do Rio de Janeiro no ano de 20077 e (b) posições dos países do mundo de acordo com um plano cartesiano cujos eixos são IDH e 1- GINI (desenvolvimento e igualdade).
Observe que na Figura 3, mapa (a), existem vários padrões de ocorrência dos crimes na cidade. O primeiro refere-se a topologia da cidade, tanto o Parque Nacional da Floresta da Tijuca, quanto o Parque Nacional da Pedra Branca são locais onde praticamente não há registros de crime. A zona norte da cidade constitui a região com maior incidência de crimes e há forte ocorrência dos crimes no entorno das principais vias da cidade (linha vermelha, linha amarela
7Agradeço aos professores Ignácio Cano e Eduardo Ribeiro do LAV-UERJ por terem disponibilizado os dados.
e avenida Brasil)8.
No mapa (b), da Figura 3, nota-se um padrão espacial dos países no qual a maioria concentra-se acima do IDH=0,5 e do GINI=0,5 (retas verticais e horizontais, respectiva- mente). O objetivo inicial na análise dos dados consiste em entender os agrupamentos (clusters) ou afastamentos das ocorrências.
Em termos de estimação dos parâmetros e teste de hipóteses, o objetivo primeiro é mos- trar que os dados não são completamente aleatórios espacialmente, isto é, que o processo pon- tual tem alguma estrutura espacial. Outro objetivo é estimar a intensidade de ocorrência, comu- mente a partir de modelagem dos processos pontuais por processos Poisson homogêneos e não homogêneos.
(2) Dados geoestatísticos:são variáveis aleatórias geograficamente localizadas, o local de ocor- rência é geralmente fixo e a quantidade aleatória de interesse é o fenômeno observado neste ponto. Segundo (BIVAND; PEBESMA; GÓMES-RUBIO, 2008, p. 191), geoestatística trata da análise de campos aleatóriosZ(s), sendoZuma variável aleatória indexada no locals, que pode pertencer ao plano ou mais dimensões espaciais. A Figura 4 apresenta um exemplo de dados deste tipo. O mapa (a) exibe o reservatório da hidrelétrica de Corumbá e o gráfico (b) apresenta os dados da coleta de gás metano (no tempo inicial) em diversas localizações dos reservatórios9. Exemplos desse tipo são bastante comuns nas áreas de biologia e meio ambiente. A Figura 5 apresenta o logaritmo das taxas de encarceramento de 148 países do mundo considerando sua posição social em termos de desenvolvimento e desigualdade (IDH e 1-GINI).
8Quem me chamou atenção para este efeito foi a professora Alba Zaluar ao apresentar um trabalho no seminário sobre etnografia e violência no IESP-UERJ em 2015.
9Mais detalhes sobre os dados podem ser obtidos nos relatórios sobre em “Balanço de Carbono em Reservató- rios de FURNAS” em Santos et al. (2005-2006). A análise estatística dos dados usando modelos de difusão multivariada sob o paradigma bayesiano encontra-se em Israel e Migon (2012).
Figura 4 - Dados geoestatísticos.
(a) (b)
Legenda: (a) Reservatório da hidrelétrica de Corumbá, (b) Concentração de metano no tempo inicial.
Fonte: Balanço de Carbono em Reservatórios de FURNAS em Santos et al. (2005-2006).
Figura 5 - Dados geoestatísticos: logaritmo das taxas de encarceramento nos países de acordo com suas posições em termos de desenvolvimento e desigualdade.
(a) (b)
Legenda: (a) Log-taxas de encarceramento, (b) Gráfico em 3D.
Fonte: Lista da população mundial presa gerado peloInternational Centre for Prison Studies (ICPS) no site <http://www.prisonstudies.org/>. Censo Penitenciário Brasileiro do Ministério da Justiça em <http://www.justica.gov.br/portalpadrao>. Sites da ONU:
<http://nacoesunidas.org/> e Banco Mundial: <http://search.worldbank.org/data>. O autor, 2019.
Segundo Bivand, a análise de dados geoestatísticos envolve a estimação e modelagem da correlação espacial (covariograma e semivariograma) e a avaliação de quando é razoável assumir estacionariedade nos dados. Uma forma de estacionariedade é conhecida porestaci- onariedade intrínsecano qual o processo espacial é composto por uma média constante nas localizações e a variabilidade só depende das distâncias entre os pontos (considerando as dire- ções).
Matematicamente, o processo espacial escrito da forma,Z(s) =m+e(s), possui média, E[Z(s)] =m, constante, com a matriz de covariância da estrutura de erro, e(s), dependendo somente da distância e suas direçõesh(vetorial), da forma γ(h) = 12E[Z(s)−Z(s+h)]2. Na última fórmula,γ, é chamado de variogramaque possui um papel importante na modelagem de dados desse tipo, pois indica se existe dependência espacial nos dados. Quando a variância depende somente da distância entre as observações, não sendo influenciada pela direção da distância entre as observações, diz-se que o processo éisotrópico.
Há várias maneiras de estimar uma aproximação para o variograma e outras tantas for- mas de modelar a estrutura de covariância espacial. Em todas as referências citadas sobre estatística espacial essas formas são detalhadas, por isso, não são desenvolvidas aqui. Na Fi- gura 6 (a) apresenta-se o gráfico do variograma estimado sob a hipótese de isotropia para os dados de encarceramento nos países do mundo localizados pelo IDH e 1-GINI e na imagem (b) exibe-se a interpolação dos logaritmos das taxas com as curvas de nível. É interessante notar pelos gráficos da Figura 6 que há uma estrutura espacial da taxa de encarceramento pela posição dos países. Em (a) nota-se que conforme a distância entre os países aumenta, a variabilidade dos dados também aumenta, significando que países próximos em termos de desenvolvimento e desigualdade possuem variabilidade menor nas taxas. No mapa em (b) o degrade (de vermelho a amarelo, menor ao maior) nota-se a posição espacial que apresenta maiores taxas.
As liberdades substantivas podem ser pensadas de várias maneiras, no exemplo sobre as taxas de encarceramento, medidas de desenvolvimento e desigualdade foram usadas. A pro- posta macrossociológica do trabalho é estender esses espaços de liberdade considerando outras variáveis que podem ser: índices de liberdade política, liberdades econômicas ou medidas de felicidades. Para um debate sobre determinantes de felicidade no Brasil e formas de mensurá- los ver Ribeiro (2015). Para medidas de liberdade pode-se citar os trabalhos de Peter Graeff (2012) e, com enfoque nas liberdades econômica, Beach e Kane (2008). Este último tópico será apresentado no Capítulo 3.10
(3) Dados de área: são os dados observados dentro de polígonos cujas fronteiras são pré-
10Medidas de liberdade econômica para diversos países no mundo em diversos anos podem ser obtidas no site
<http://www.heritage.org/index/download> e índices de democracia são compilados pela revistaThe Economist em <https://www.eiu.com/topic/democracy-index>
Figura 6 - Análise geoestatística do logaritmo das taxas de encarceramento pelo espaço de desenvolvimento e igualdade (IDH, 1-GINI).
(a) (b)
Legenda: (a) Gráfico do variograma estimado com a curva (ajuste) do variograma teórico (linha contínua), (b) Interpolação espacial com curva de níveis (quanto mais amarelo maior o log das taxas).
Fonte: Israel, 2019.
definidas, por exemplo: países, estados, municípios, setores administrativos ou censitários, entre outros. Normalmente o que se observa são dados agregados dentro da fronteira como:
número de homicídios, índices econômicos (e.g., renda média ou produção industrial), propor- ção de votantes em um determinado candidato, etc. Um dos objetivos principais da análise de dados de área é verificar se há correlação espacial entre o fenômeno e as características de vizinhança dos polígonos.
Na Figura 7 pode-se observar o tipo mais comum de dado de área, o mapa (a) apresenta as taxas de homicídios nas cidades do estado do Rio de Janeiro pelos municípios. Nota-se que as áreas com maiores taxas de homicídios referem-se aos municípios que compõem a região metropolitana do Rio de Janeiro e as cidades do interior mais urbanizadas ou que sofreram o impacto dos royates do petróleo como: Macaé, Campos, Cabo Frio, Angra dos Reis, dentre outras11. O mapa da Figura 7 (b) exibe a posição das pessoas presas segundo Censo de 2010 de acordo as dimensões categóricas: nível de instrução e idade. Outras categorias mais inte- ressantes devem ser usadas, dependendo da disponibilidade dos dados, e podem incluir: classe social (do indivíduo ou dos pais), categorias de cor (preta, parda, branca, amarela ou indígena), tipologia do crime, etc. No caso da amostra da população presa no estado do Rio de Janeiro, as características espaciais são bastante marcadas: jovens (entre 18 e 31 anos) com baixa es- colaridade (quase predominantemente até ensino fundamental). Uma tarefa interessante seria comparar as posições espaciais de diversos grupos com coortes, por exemplo: presos e não presos, por cor, por sexo, por tipo de crime, etc. Esta tarefa será feita no Capítulo 5.