• Nenhum resultado encontrado

Processos Pontuais Espaciais para Dados das Unidades Prisionais no Brasil

N/A
N/A
Protected

Academic year: 2021

Share "Processos Pontuais Espaciais para Dados das Unidades Prisionais no Brasil"

Copied!
105
0
0

Texto

(1)

Processos Pontuais Espaciais para dados

das unidades prisionais no Brasil

Rebecca de Oliveira Souza

Universidade Federal do Rio de Janeiro

Instituto de Matem´

atica

Departamento de M´etodos Estat´ısticos

2018

(2)

Processos Pontuais Espaciais para dados

das unidades prisionais no Brasil

Rebecca de Oliveira Souza

Disserta¸c˜ao de Mestrado submetida ao Programa de P´os-Gradua¸c˜ao em Estat´ıstica do Instituto de Matem´atica da Universidade Federal do Rio de Janeiro, UFRJ, como parte

dos requisitos necess´arios `a obten¸c˜ao do grau de Mestre em Estat´ıstica.

Orientadora: Marina Silva Paez Coorientador: Vinicius Pinheiro Israel

Rio de Janeiro, RJ - Brasil 2018

(3)

Processos Pontuais Espaciais para dados

das unidades prisionais no Brasil

Rebecca de Oliveira Souza

Disserta¸c˜ao de Mestrado submetida ao Programa de P´os-Gradua¸c˜ao em Estat´ıstica do Instituto de Matem´atica da Universidade Federal do Rio de Janeiro - UFRJ, como parte dos requisitos necess´arios `a obten¸c˜ao do t´ıtulo de Mestre em Estat´ıstica.

Aprovada por:

Rio de Janeiro, RJ - Brasil 2018

(4)

CIP - Catalogação na Publicação

Elaborado pelo Sistema de Geração Automática da UFRJ com os dados fornecidos pelo(a) autor(a).

S719p

Souza, Rebecca de Oliveira

Processos Pontuais Espaciais para dados das unidades prisionais no Brasil / Rebecca de Oliveira Souza. -- Rio de Janeiro, 2018.

103 f.

Orientadora: Marina Silva Paez. Coorientador: Vinicius Pinheiro Israel.

Dissertação (mestrado) - Universidade Federal do Rio de Janeiro, Instituto de Matemática, Programa de Pós-Graduação em Estatística, 2018.

1. Estatística Espacial. 2. Inferência bayesiana. 3. Processo de Cox. 4. Aprisionamento no Brasil. I. Paez, Marina Silva, orient. II. Israel, Vinicius Pinheiro, coorient. III. Título.

(5)

Agradecimentos

Agrade¸co, primeiramente, a Deus por nunca desistir de mim. Pelo Seu amor incon-dicional e pela f´e que me faz seguir em frente.

Aos meus pais Alexandre Carlos e Adriana Gon¸calves por todo carinho e cuidado. Por entenderem todo meu estresse e me darem conforto quando eu mais precisei.

Aos meus orientadores Marina Paez e Vinicius Israel pela aten¸c˜ao e dedica¸c˜ao durante todo o ano. Foi um prazer trabalhar e aprender com vocˆes.

Ao meu melhor amigo e companheiro Marcus Gerardus por ser minha pessoa prefe-rida. Obrigada tamb´em pelas ideias compartilhadas sobre esse trabalho.

`

A minha querida amiga Vanessa Eufrauzino por todas as conversas e desabafos. Por saber mais de mim do que eu mesma.

A todos os amigos que fiz durante o mestrado por tornarem esses dois anos mais agrad´aveis. Em especial `a Ra´ıra Marotta por ser minha gˆemea.

(6)

Resumo

O aprisionamento vem sendo estudado no ˆambito internacional e apresenta resulta-dos preocupantes com crescimento acelerado nas ´ultimas d´ecadas. Segundo dados do Institute for Criminal Policy Research da universidade de Birkbeck em Londres, o Brasil multiplicou o n´umero de presos em 20 vezes desde 1973 at´e os dias de hoje. Diante disso, h´a interesse em investigar a distribui¸c˜ao das unidades prisionais no Brasil e estudar a as-socia¸c˜ao de covari´aveis para ent˜ao entender a disposi¸c˜ao dessas unidades. Neste trabalho, propomos modelar as localiza¸c˜oes dessas unidades atrav´es de Processos de Cox. Primei-ramente, a fun¸c˜ao de intensidade foi definida a partir de uma mistura de distribui¸c˜oes normais com o objetivo de definir a forma¸c˜ao de conglomerados de pontos. As covari´aveis nesse modelo s˜ao referentes as unidades prisionais e s˜ao inclusas nas dimens˜oes dos pon-tos, isso leva a forma¸c˜ao de conglomerados compostos por unidades prisionais pr´oximas geograficamente e que possuem poss´ıveis caracter´ısticas semelhantes. Na segunda parte do trabalho foi utiliza um modelo proposto por Diggle et al. (1997) que permite que a fun¸c˜ao de intensidade leve em considera¸c˜ao as distˆancias das localiza¸c˜oes das unidades prisionais `as fontes de influˆencias previamente definidas, al´em de covari´aveis espaciais. Em ambos os modelos, a inferˆencia foi feita sob o enfoque bayesiano.

Palavras-Chave: Estat´ıstica Espacial; Inferˆencia bayesiana; Processo de Cox; Aprisiona-mento no Brasil.

(7)

Abstract

Imprisonment has been studied in the international scene and it has worrying out-comes with a rapid growth in recent decades. According to data from the Institute for Criminal Policy Research in Birkbeck University in London, the size of the Brazilian im-prisoned population increased twentyfold from 1973 to the present days. Therefore, there is an interest in investigating the distribution of the locations of prison units in Brazil anda also their association with covariates. This work aims to model the location of this units through a Cox Process. Firstly, the intensity function was defined by the mixture of normal distributions with the goal of describing the formation of point clusters. The covariates in this model are realtive to the prison units, and they are included as new dimensions in the model, leading to the formation of clusters of points which are close not only geografically but also present similar values of covariates. The second part of this work uses a model proposed byDiggle et al.(1997) that allows the intensity function to depend on covariates, as well as on the distance between the prison units to sources of influence which are fixed, and previously specified. In both parts, inference is performed under the Bayesian approach.

(8)

Sum´

ario

Sum´ario viii

Lista de Tabelas x

Lista de Figuras xii

1 Introdu¸c˜ao 1

2 Aplica¸c˜ao motivacional 6

3 Revis˜ao metodol´ogica 16

3.1 Processos pontuais espaciais . . . 17

3.1.1 Propriedades de primeira e segunda ordem . . . 18

3.1.2 Analisando padr˜oes pontuais no espa¸co . . . 19

3.1.3 Modelagem para padr˜oes de pontos espaciais . . . 27

3.2 Inferˆencia sob o enfoque bayesiano. . . 29

3.2.1 Amostrador de Gibbs . . . 30

3.2.2 Metropolis-Hastings. . . 31

3.3 Crit´erios de compara¸c˜ao de modelos . . . 33

4 Estrutura de mistura normal para a fun¸c˜ao de intensidade 35 4.1 O modelo . . . 36

4.1.1 Distribui¸c˜ao a posteriori . . . 39

4.2 Estudo simulado . . . 43

(9)

4.3.1 Mistura de normais em duas dimens˜oes . . . 51

4.3.2 Mistura de normais em trˆes dimens˜oes . . . 54

4.3.3 Mistura de normais em quatro dimens˜oes . . . 61

5 Fontes de pontos para a fun¸c˜ao de intensidade 67 5.1 O modelo . . . 68

5.1.1 Distribui¸c˜ao a posteriori . . . 70

5.2 Estudo simulado . . . 72

5.3 Aplica¸c˜ao . . . 75

6 Conclus˜oes 80

Referˆencias Bibliogr´aficas 83

(10)

Lista de Tabelas

2.1 N´umero de unidades prisionais exclu´ıdas das an´alises, n´umero de unidades analisadas e informa¸c˜oes prisionais para as divis˜oes administrativas do Brasil. 7

2.2 Resumo das vari´aveis popula¸c˜ao prisional, capacidade prisional e taxa de ocupa¸c˜ao das 1392 unidades prisionais no Brasil para o ano de 2014. . . . 9

2.3 Resumo do IDH do ano de 2010 e GINI do ano de 2014 para os estados brasileiros. . 11

2.4 Medidas de posicionamento pol´ıtico para um per´ıodo de classifica¸c˜ao de 2003 a 2014, segundo crit´erios de Madeira e da Silva Tarouco (2013) e

Braga et al. (2015), em Israel e Bachini (2017). . . 15

4.1 Crit´erios de compara¸c˜ao para os modelos com mistura de normais consi-derando apenas as coordenadas na dimens˜ao. . . 52

4.2 Moda e intervalo de credibilidade de 95% a posteriori para os parˆametros

do modelo com mistura de 5 normais com dimens˜oes compostas pelas

coordenadas das unidades prisionais no Brasil. . . 52

4.3 Crit´erios de compara¸c˜ao para os modelos com mistura de normais conside-rando coordenadas e logaritmo da taxa de ocupa¸c˜ao prisional na dimens˜ao. 54

4.4 Moda e intervalo de credibilidade de 95% a posteriori para os parˆametros

do modelo com mistura de 4 normais com dimens˜oes compostas pelas

coordenadas e logaritmo da taxa de ocupa¸c˜ao das unidades prisionais no Brasil. . . 55

4.5 Crit´erios de compara¸c˜ao para os modelos com mistura de normais

(11)

4.6 Moda e intervalo de credibilidade de 95% a posteriori para os parˆametros

do modelo com mistura de 4 normais com dimens˜oes compostas pelas

coordenadas e logaritmo da taxa de ocupa¸c˜ao das unidades prisionais no Brasil. . . 59

4.7 Crit´erios de compara¸c˜ao para os modelos com mistura de normais

con-siderando coordenadas, logaritmo da taxa de ocupa¸c˜ao e logaritmo da

capacidade prisional na dimens˜ao. . . 61

4.8 Moda e intervalo de credibilidade de 95% a posteriori para os parˆametros

do modelo com mistura de 5 normais com dimens˜oes compostas pelas

coordenadas, logaritmo da taxa de ocupa¸c˜ao e logaritmo da capacidade

das unidades prisionais no Brasil. . . 63

5.1 Resultados dos ajustes dos modelos com fontes pontuais na fun¸c˜ao de

(12)

Lista de Figuras

2.1 Localiza¸c˜ao das unidades prisionais no Brasil no ano de 2014. ´Area e cor dos c´ırculos representam a quantidade de presos (a) e a quantidade de vagas (b). . . 8

2.2 Localiza¸c˜ao das unidades prisionais no Brasil no ano de 2014. ´Area e cor dos c´ırculos representam a taxa de ocupa¸c˜ao. . . 9

2.3 Taxa prisional (a) e taxa da capacidade prisional (b) dos estados brasileiros por 100 mil habitantes no ano de 2014. Cores mais escuras representam taxas mais altas. . . 10

2.4 Taxa de ocupa¸c˜ao prisional dos estados brasileiros no ano de 2014. Cores mais escuras representam taxas mais altas. . . 11 2.5 Distribui¸c˜ao do IDH 2010 (a) e do GINI 2014 (b) para os estados brasileiros de acordo

com as regi˜oes Centro-Oeste (CO), Nordeste (NE), Norte (N), Sudeste (SE) e Sul (S). 12

2.6 Logaritmo da taxa prisional por 100 mil habitantes e o IDH 2010 para os estados brasileiros classificados pelo ´ındice GINI 2014. . . 13

2.7 Distribui¸c˜ao das medidas de posicionamento pol´ıtico segundo Madeira e da Silva Ta-rouco(2013) (a) eBraga et al.(2015) (b) para os estados brasileiros de acordo com as

regi˜oes Centro-Oeste (CO), Nordeste (NE), Norte (N), Sudeste (SE) e Sul (S). . . 14

3.1 Simula¸c˜ao de padr˜oes de pontos aleat´orios (a); agrupados (b); e regulares (c). . . 17

3.2 Estimativa da fun¸c˜ao de intensidade utilizando o estimador Kernel com

(13)

3.3 Estimador da fun¸c˜ao F (linha preta s´olida), fun¸c˜ao F aproximada para a hip´otese de CSR (linha vermelha pontilhada) e envelopes de 99 simula¸c˜oes de CSR (pol´ıgono cinza) para dados artificiais de um padr˜ao de pontos aleat´orios (a); agrupados (b); e regulares (c). . . 22

3.4 Estimador da fun¸c˜ao G (linha preta s´olida), fun¸c˜ao G aproximada para a hip´otese de CSR (linha vermelha pontilhada) e envelopes de 99 simula¸c˜oes de CSR (pol´ıgono cinza) para dados artificiais de um padr˜ao de pontos: aleat´orios (a); agrupados (b); e regulares (c). . . 23

3.5 Estimador da fun¸c˜ao K menos πx2 (linha preta s´olida), linha de referˆencia em K(x) − πx2 = 0 para a hip´otese de CSR (linha vermelha pontilhada) e

envelopes de 99 simula¸c˜oes de CSR (pol´ıgono cinza) para dados artificiais de um padr˜ao de pontos aleat´orios (a); agrupados (b); e regulares (c). . . 25

3.6 Estimativas da intensidade pontual das unidades prisionais utilizando a fun¸c˜ao de Quar-tic Kernel variando a largura da banda. . . 27

3.7 Estimador das fun¸c˜oes G (a), F (b) e K-πx2(c) para as unidades prisionais brasileiras

(linha preta s´olida), respectivas fun¸c˜oes te´oricas para a hip´otese de CSR (linha vermelha

pontilhada) e envelopes de 99 simula¸c˜oes de CSR (pol´ıgono cinza). . . 27

4.1 Fun¸c˜ao de intensidade simulada considerando o cen´ario 1 (a) e o cen´ario

2 (b) para o modelo com mistura de normais. . . 44

4.2 Pontos simulados considerando o cen´ario 1 (a) e o cen´ario 2 (b) para o modelo com mistura de normais.. . . 45

4.3 Histogramas para as amostras a posteriori para os parˆametros µ1 (supe-rior) e µ2 (inferior) no primeiro cen´ario dos dados simulados. Limites do intervalo de credibilidade de 95% (linha tracejada vermelha), moda a pos-teriori (linha tracejada azul), valor verdadeiro (linha tracejada verde) e distribui¸c˜ao a priori (linha pontilhada preta).. . . 46

(14)

4.4 Histogramas para as amostras a posteriori para os parˆametros Σ1

(supe-rior) e Σ2 (inferior) no primeiro cen´ario dos dados simulados. Limites

do intervalo de credibilidade de 95% (linha tracejada vermelha), moda a posteriori (linha tracejada azul) e valor verdadeiro (linha tracejada verde). 47

4.5 Histogramas para as amostras a posteriori para os parˆametros λ0

(es-querda), w1 (meio) e w2 (direita) no primeiro cen´ario dos dados simulados.

Limites do intervalo de credibilidade de 95% (linha tracejada vermelha), moda a posteriori (linha tracejada azul), valor verdadeiro (linha tracejada verde) e distribui¸c˜ao a priori (linha pontilhada preta). . . 47

4.6 Histogramas para as amostras a posteriori para os parˆametros µ1 (supe-rior) e µ2 (inferior) no segundo cen´ario dos dados simulados. Limites do intervalo de credibilidade de 95% (linha tracejada vermelha), moda a pos-teriori (linha tracejada azul), valor verdadeiro (linha tracejada verde) e distribui¸c˜ao a priori (linha pontilhada preta).. . . 48

4.7 Histogramas para as amostras a posteriori para os parˆametros Σ1

(su-perior) e Σ2 (inferior) no segundo cen´ario dos dados simulados. Limites

do intervalo de credibilidade de 95% (linha tracejada vermelha), moda a posteriori (linha tracejada azul) e valor verdadeiro (linha tracejada verde). 49

4.8 Histogramas para as amostras a posteriori para os parˆametros λ0

(es-querda), w1 (meio) e w2 (direita) no segundo cen´ario dos dados simulados.

Limites do intervalo de credibilidade de 95% (linha tracejada vermelha), moda a posteriori (linha tracejada azul), valor verdadeiro (linha tracejada verde) e distribui¸c˜ao a priori (linha pontilhada preta). . . 49

4.9 Fun¸c˜oes de intensidade ajustada para os dados simulados referentes ao

cen´ario 1 (a) e cen´ario 2 (b) para o modelo com mistura de normais. . . . 50

4.10 Contorno da fun¸c˜ao de intensidade ajustada (a) e Mapa de calor para a fun¸c˜ao de intensidade ajustada (b) para o modelo com estrutura de mistura

(15)

4.11 Localiza¸c˜oes das unidades prisionais com cores representando cada con-glomerado de pontos para o modelo com coordenadas e logaritmo da taxa de ocupa¸c˜ao (a). Box-plot do logaritmo da taxa de ocupa¸c˜ao de acordo com os conglomerados de pontos (b), logaritmo da taxa de ocupa¸c˜ao igual a zero (linha tracejada vermelha). . . 56

4.12 Fun¸c˜ao de intensidade estimada para o modelo com mistura de 4

nor-mais para cada coordenada e logaritmo da taxa de ocupa¸c˜ao das unidades prisionais. Cor e ´area dos c´ırculos representam a fun¸c˜ao de intensidade estimada. . . 57

4.13 Localiza¸c˜oes das unidades prisionais com cores representando cada con-glomerado de pontos para o modelo com coordenadas e logaritmo da ca-pacidade prisional (a). Box-plot do logaritmo da caca-pacidade prisional de

acordo com os conglomerados de pontos (b). . . 60

4.14 Fun¸c˜ao de intensidade estimada para o modelo com mistura de 5 normais para cada coordenada e logaritmo da capacidade prisional das unidades prisionais. Cor e ´area dos c´ırculos representam a fun¸c˜ao de intensidade estimada. . . 60

4.15 Localiza¸c˜oes das unidades prisionais com cores representando cada conglo-merado de pontos para o modelo com coordenadas, logaritmo da taxa de ocupa¸c˜ao e logaritmo da capacidade prisional (a). Box-plots do logaritmo da taxa de ocupa¸c˜ao (b) e do logaritmo da capacidade prisional (c) de

acordo com os conglomerados de pontos. . . 65

4.16 Fun¸c˜ao de intensidade estimada para o modelo com mistura de 5

nor-mais para cada coordenada, logaritmo da taxa de ocupa¸c˜ao e logaritmo

da capacidade prisional das unidades prisionais. Cor e ´area dos c´ırculos representam a fun¸c˜ao de intensidade estimada. . . 66

5.1 Fun¸c˜ao de intensidade simulada (a) e pontos simulados (b) para o modelo com fontes pontuais. . . 73

(16)

5.2 Histogramas para as amostras a posteriori para os parˆametros λ0(superior

esquerda), β1 (superior direita), α (inferior esquerda), φ (inferior meio)

e δ (inferior direito) para o dados simulados. Limites do intervalo de

credibilidade de 95% (linha tracejada vermelha), moda a posteriori (linha tracejada azul), valor verdadeiro (linha tracejada verde) e distribui¸c˜ao a priori (linha pontilhada preta). . . 74

5.3 Fun¸c˜ao de intensidade ajustada para os dados simulados considerando o

modelo com fontes pontuais. . . 75

5.4 Fun¸c˜ao de intensidade estimada para o modelo com mistura de normais de dimens˜oes compostas pelas coordenadas (a). N´umero de unidades prisio-nais em cada estado do Brasil (b). Cores das barras indicam a regi˜ao dos estados: Centro-Oeste (vermelho); Nordeste (verde); Norte (azul escuro); Sudeste (azul claro); Sul (rosa). . . 76

5.5 Localiza¸c˜ao das unidades prisionais com a identifica¸c˜ao das fontes pontuais (c´ırculos vermelhos) . . . 77

5.6 Fun¸c˜oes de intensidade estimadas com fontes pontuais para os modelos

com a covari´avel: IDH (a); GINI (b); Pol´ıtica I (c); Pol´ıtica II (d). . . 79

A.1 Gr´afico de dispers˜ao da longitude contra latitude contra logaritmo da taxa de ocupa¸c˜ao marcados com os conglomerados para o modelo que considera as coordenadas e o

loga-ritmo da taxa de ocupa¸c˜ao. . . 86

A.2 Gr´afico de dispers˜ao da longitude contra latitude contra logaritmo da ca-pacidade marcados com os conglomerados para o modelo que considera as coordenadas e o logaritmo da capacidade.. . . 87

A.3 Gr´afico de dispers˜ao da longitude contra latitude contra logaritmo da taxa de ocupa¸c˜ao marcados com os conglomerados para o modelo que considera as coordenadas, logaritmo da taxa de ocupa¸c˜ao e logaritmo da capacidade. 88

A.4 Gr´afico de dispers˜ao da longitude contra latitude contra logaritmo da ca-pacidade marcados com os conglomerados para o modelo que considera as

(17)

Cap´ıtulo 1

Introdu¸

ao

O aprisionamento vem sendo estudado tanto no ˆambito nacional quanto no internaci-onal e apresenta resultados preocupantes com crescimento acelerado nas ´ultimas d´ecadas em diversos pa´ıses desenvolvidos e nos estados brasileiros, em particular. Segundo da-dos do Institute for Criminal Policy Research (ICPR-Instituto de Pesquisa em Pol´ıticas Criminais) da universidade de Birkbeck em Londres (Jacobson et al., 2017), mais de 10 milh˜oes de pessoas estavam presas em todo o mundo no ano de 2017. Dentre os princi-pais pa´ıses que apresentaram r´apido crescimento da popula¸c˜ao prisional, destacam-se os Estados Unidos que mais do que quadruplicou o n´umero de presos de 1980 a 2008, pas-sando de aproximadamente 500 mil para 2,3 milh˜oes. J´a o Brasil multiplicou o n´umero de presos em vinte vezes nos ´ultimos quarenta e quatro anos, passando de cerca de 30 mil presos em 1973 para mais de 600 mil presos em 2017.

Segundo o ´ultimo relat´orio da ICPR com dados referentes a outubro de 2015 ( Walms-ley,2016), o Brasil tem a quarta maior popula¸c˜ao prisional em n´umeros absolutos, ficando atr´as apenas dos Estados Unidos, China e R´ussia. Al´em disso, o n´umero de presos sem condena¸c˜ao ultrapassa de 212 mil, sendo a terceira maior popula¸c˜ao, em termos absolu-tos. O aumento dos n´ıveis de deten¸c˜ao sem julgamento, principalmente em pa´ıses menos desenvolvidos, expressam a ineficiˆencia, desorganiza¸c˜ao e falta de recursos dos sistemas e processos judiciais.

(18)

acarretam no fenˆomeno conhecido como o “boom carcer´ario1”. S˜ao variadas as causas do aumento da popula¸c˜ao carcer´aria no Brasil e em muitos outros pa´ıses. Pesquisadores atribuem esse aumento a fatores como mudan¸cas nos padr˜oes de crimes, debates p´ublicos cada vez mais punitivistas e culturas pol´ıticas, domina¸c˜ao de classes, fatores econˆomicos, entre outros.

Enquanto as causas do crescimento carcer´ario podem apresentar certa complexidade, as consequˆencias s˜ao incontest´aveis. O encarceramento em massa junto com a escassez de cadeias levam a condi¸c˜oes de superlota¸c˜ao, que em muitas das vezes, s˜ao agravadas com a falta de estrutura das unidades prisionais. Isso afeta os grupos mais marginali-zados e diminui as chances de poss´ıveis reabilita¸c˜oes, limitando a efic´acia dos sistemas penitenci´arios em lidar com a minoria de presos que representam riscos para a seguran¸ca p´ublica. Al´em de aumentar os riscos para os pr´oprios prisioneiros, gerando violˆencia e re-beli˜oes. O uso excessivo da pris˜ao tamb´em demanda gastos aos cofres p´ublicos, podendo impedir o desenvolvimento econˆomico.

Segundo relat´orio do minist´erio da justi¸ca, o Brasil possui uma taxa de ocupa¸c˜ao m´edia de 161%, ou seja, 16 pessoas estariam ocupando um espa¸co destinado para apenas 10 pessoas. A maioria das unidades prisionais brasileiras n˜ao apresentam condi¸c˜oes fa-vor´aveis para a sobrevivˆencia dos presos que geralmente depende da prote¸c˜ao de gangues. A violˆencia nas pris˜oes brasileiras tornou-se frequente nas ´ultimas d´ecadas e ´e uma das respons´aveis por grande parte das mortes na popula¸c˜ao carcer´aria. Um dos maiores con-flitos prisionais ocorreu no Complexo Penitenci´ario An´ısio Jobim (Compaj, Manaus) em janeiro de 2017, resultando em 56 mortes e desencadeando outros conflitos em diferentes unidades pelo Brasil. Muitas dessas rebeli˜oes est˜ao ligadas ao controle do narcotr´afico e disputa de poder por fac¸c˜oes criminosas.

Heran¸cas hist´oricas do per´ıodo da ditadura militar no Brasil (1964 a 1985) s˜ao em parte causadoras dos principais problemas do sistema penitenci´ario brasileiro. A transi¸c˜ao da ditadura para a democracia marca um per´ıodo de grandes desafios pol´ıtico-institucionais (Adorno, 2002), com instabilidade pol´ıtica e n˜ao aprova¸c˜ao das propostas

1Mudan¸cas nas pol´ıticas de justi¸ca criminal e resultam em aumento do tempo de encarceramento,

(19)

do novo governo por agentes penitenci´arios. A mudan¸ca de regime veio acompanhado de muita violˆencia, massacres e rebeli˜oes nas pris˜oes organizadas por dirigentes do crime organizado. Grupos como o Comando Vermelho (CV) e o Primeiro Comando da Capital (PCC) representam duas grandes organiza¸c˜oes criminosas que foram formadas dentro das dependˆencias das pris˜oes. Esses grupos e o crime organizado controlam 90% das pris˜oes do Brasil, onde conseguem organizar opera¸c˜oes de tr´afico e extors˜ao em grande parte do pa´ıs (Miraglia, 2015).

O aumento da puni¸c˜ao reflete as desigualdades impostas aos grupos pobres e margi-nalizados da sociedade, incluindo grupos n˜ao nacionais e minorit´arios ´etnicos e culturais

(Israel, 2016). A aplica¸c˜ao da lei e o sistema de justi¸ca s˜ao marcados por corrup¸c˜ao e

ineficiˆencia, isso mostra a instabilidade pol´ıtica e a falta de uma pol´ıtica criminal mais justa. As consequˆencias levam a deteriora¸c˜ao das pris˜oes e da comunidade.

`

A vista disso, ´e relevante a realiza¸c˜ao de estudos mais aprofundados das informa¸c˜oes dispon´ıveis das unidades prisionais. Com a finalidade de compreender melhor o cen´ario das pris˜oes do Brasil, n˜ao apenas tendo uma vis˜ao geral do contexto, mas entendendo como o sistema funciona e quais s˜ao os principais fatores que contribuem para a sua organiza¸c˜ao. Ferramentas estat´ısticas atuais s˜ao de grande valor para essa tarefa, pois, atrav´es de an´alises de dados e modelagem ´e poss´ıvel extrair resultados que podem auxiliar na tomada de decis˜ao dos respons´aveis pelo sistema. Estat´ıstica voltada para o sistema prisional oferece, portanto, meios para entender se as decis˜oes tomadas pelo governo realmente est˜ao deixando a popula¸c˜ao mais segura.

Nos Estados Unidos, Milgram (2012) usa an´alise de dados para resolver o problema de reincidˆencia nas cadeias americanas e a grande quantidade de pessoas presas que est˜ao apenas aguardando pelo julgamento. A autora calcula o risco do preso cometer um novo crime ou um ato de violˆencia se for solto, al´em de prever se o preso vai voltar ao tribunal, ajudando nas decis˜oes dos ju´ızes no julgamento do r´eu. No Brasil, ainda s˜ao poucos os trabalhos que utilizam ferramentas estat´ısticas robustas para o estudo do encarceramento em massa no Brasil. O trabalho desenvolvido porIsrael e Bachini (2017) utiliza modelos estat´ısticos para investigar quais seriam os principais fatores que contribuem para as taxas de encarceramento nos estados do Brasil. Vari´aveis como quantidade de jovens,

(20)

´ındice de desigualdade e influˆencia pol´ıtica apresentam associa¸c˜ao significativa com essa taxa.

O presente trabalho prop˜oe explorar uma ferramenta estat´ıstica que lida com a va-riabilidade espacial dos dados. Em particular, ser˜ao utilizados modelos destinados `as observa¸c˜oes de eventos em uma regi˜ao geogr´afica. Esses modelos s˜ao conhecidos como processos pontuais espaciais. Al´em disso, a inferˆencia que ser´a aplicada a esses modelos ser´a sob a perspectiva bayesiana. Apesar do custo computacional, uma das vantagens da estat´ıstica bayesiana ´e a produ¸c˜ao de modelos mais real´ısticos que podem incorpo-ram suposi¸c˜oes do pr´oprio pesquisador. Trabalhos que usam processos pontuais espaciais bayesianos podem ser visto, por exemplo, emPaez e Diggle(2009) eJunior et al.(2015). Esse trabalho ´e pioneiro na ´area, sendo sua proposta estudar a rela¸c˜ao espacial das lo-caliza¸c˜oes das unidades prisionais no Brasil, utilizando-se de processos pontuais espaciais sob o enfoque bayesiano. H´a interesse em investigar a distribui¸c˜ao das unidades prisi-onais no Brasil e estudar a associa¸c˜ao de covari´aveis para ent˜ao entender a disposi¸c˜ao dessas unidades. A partir disso, ´e poss´ıvel compreender as caracter´ısticas das unidades brasileiras e o fenˆomeno do encarceramento no Brasil, pois se espera que o n´umero de unidades prisionais seja correspondente as necessidades de cada estado.

O primeiro modelo proposto nesse trabalho incorpora uma estrutura de mistura de distribui¸c˜oes normais em modelos para processos pontuais. O objetivo dessa modela-gem ´e identificar padr˜oes nas localiza¸c˜oes das unidades prisionais brasileiras. O estudo considera n˜ao apenas o espa¸co geogr´afico, mas tamb´em um espa¸co social baseado em covari´aveis. Com isso, deseja-se investigar se unidades pr´oximas geograficamente apre-sentam caracter´ısticas sociais semelhantes.

A segunda abordagem proposta nesse trabalho baseia-se no modelo desenvolvido por

Diggle et al. (1997) e faz uso de processos pontuais considerando que as observa¸c˜oes

est˜ao sendo influenciadas por fontes pontuais. Nesse trabalho, as fontes pontuais ser˜ao selecionadas com base nas an´alises dos focos ou picos de pontos encontrados na primeira modelagem. A partir disso, novas covari´aveis poderiam ser inclu´ıdas no modelo com o objetivo de explicar a disposi¸c˜ao das unidades ao redor dessas fontes.

(21)

cor-robora com a base da investiga¸c˜ao sociol´ogica defendida porGoldthorpe (2016). Segundo Goldthorpe, uma investiga¸c˜ao sociol´ogica n˜ao dever ser conduzida atrav´es dos compor-tamentos particulares dos indiv´ıduos dessa popula¸c˜ao, mas a partir das regularidades presentes nessa popula¸c˜ao que s˜ao como propriedades. ´E necess´ario que tais regulari-dades sejam vis´ıveis para ent˜ao tornarem-se transparentes, ou seja, deve-se explorar e descrever essas regularidades e depois deve-se buscar explica¸c˜oes para as mesmas.

Este trabalho est´a organizado em seis cap´ıtulos, em que o primeiro ´e a introdu¸c˜ao. O Cap´ıtulo 2 traz a aplica¸c˜ao motivacional, onde s˜ao realizadas an´alises descritivas dos dados sobre encarceramento no Brasil com o objetivo de entender melhor como eles se organizam e compreender o problema em quest˜ao.

O Cap´ıtulo 3 consiste na apresenta¸c˜ao dos m´etodos estat´ısticos trabalhados nessa disserta¸c˜ao, com foco nos processos pontuais espaciais. Inicialmente, o cap´ıtulo traz defini¸c˜oes b´asicas para a compreens˜ao e identifica¸c˜ao de um processo pontual. Tamb´em s˜ao abordados os m´etodos de inferˆencia bayesiana e alguns crit´erios de compara¸c˜ao de modelos.

No Cap´ıtulo 4, um processo pontual com uma estrutura de mistura de normais ´e estudado. A descri¸c˜ao e a inferˆencia do modelo s˜ao realizadas, seguidas de um breve estudo simulado para a valida¸c˜ao do modelo proposto. A aplica¸c˜ao do modelo ´e dada com base nas localiza¸c˜oes das unidades prisionais brasileiras e a inclus˜ao das covari´aveis no modelo ´e feita a partir da amplia¸c˜ao do espa¸co de estudo.

O cap´ıtulo 5 descreve uma nova abordagem discutida nesse trabalho que incorpora fontes de pontos ao processo espacial. A organiza¸c˜ao do cap´ıtulo ´e an´aloga ao cap´ıtulo anterior, com descri¸c˜ao e inferˆencia do modelo proposto, seguidas de um breve estudo simulado e a aplica¸c˜ao para os dados das unidades prisionais no Brasil. Por fim, no Cap´ıtulo 6 s˜ao apresentados a conclus˜ao e trabalhos futuros.

(22)

Cap´ıtulo 2

Aplica¸

ao motivacional

Os dados sobre encarceramento no Brasil s˜ao provenientes do censo penitenci´ario bra-sileiro e foram obtidos a partir do Levantamento Nacional de Informa¸c˜oes Penitenci´arias (Infopen) organizado pelo Departamento Penitenci´ario Nacional (DEPEN) em 2014. Os dados contˆem informa¸c˜oes de todas as 1424 unidades prisionais brasileiras. No entanto, devido `a indisponibilidade de alguns dados para determinadas unidades, preferiu-se ex-cluir essas das an´alises. A Tabela2.1mostra o n´umero de unidades que apresentam dados faltantes e que foram exclu´ıdas das an´alises e tamb´em o n´umero de unidades prisionais por estados e regi˜oes do Brasil que foram consideradas nas an´alises, totalizando 1392 unidades. O n´umero de unidades desconsideradas apresenta um percentual pequeno do n´umero total de unidades e, aparentemente, n˜ao exibem nenhum padr˜ao espacial. Por-tanto, a retirada dessas n˜ao deve prejudicar as an´alises das localiza¸c˜oes das unidades que ser˜ao discutidas nos cap´ıtulos seguintes.

Das 32 unidades desconsideradas, 12 n˜ao informam a quantidade de presos, 7 n˜ao informam a quantidade de vagas dispon´ıveis e 2 n˜ao possuem ambas as informa¸c˜oes. Al´em disso, 11 unidades apresentam quantidade de vagas igual a zero e foi observado que algumas n˜ao dispunham de infraestrutura adequada e foram interditadas.

Tomando como base as 1392 unidades analisadas, a Tabela 2.1 traz informa¸c˜oes pri-sionais dos estados e regi˜oes do Brasil. Os estados do Mato Grosso do Sul e S˜ao Paulo com o Distrito Federal s˜ao os que apresentam mais presos por 100 mil habitantes, sendo S˜ao Paulo o estado com maior n´umero de presos em termos absolutos. Quanto `a taxa de

(23)

ocupa¸c˜ao, todas as regi˜oes apresentam n´umero de presos maior que o n´umero de vagas oferecidas, sendo a regi˜ao com maior taxa o nordeste (169,43%) e a com menor taxa a regi˜ao sul (116,27%).

Tabela 2.1: N´umero de unidades prisionais exclu´ıdas das an´alises, n´umero de unidades analisadas e informa¸c˜oes prisionais para as divis˜oes administrativas do Brasil.

Divis˜oes N. de unidades N. de unidades N. de Presos por Taxa de administrativas exclu´ıdas analisadas presos 100 mil hab. ocupa¸c˜ao %

Distrito Federal (DF) - 6 13.269 463,490 200,893

Goi´as (GO) - 95 13.244 202,376 155,977

Mato Grosso (MT) - 59 10.357 320,330 125,327

Mato Grosso do Sul (MS) 1 44 14.203 540,547 201,948

Centro-Oeste 1 204 51.073 334,513 168,042 Alagoas (AL) 1 8 3345 100,571 129,200 Bahia (BA) - 22 11.836 78,157 142,243 Cear´a (CE) 3 155 18.278 206,242 155,030 Maranh˜ao (MA) 3 29 4.392 64,046 89,982 Para´ıba (PB) 1 77 9.596 243,058 155,527 Pernambuco (PE) - 77 31.510 339,096 264,923 Piau´ı (PI) 1 12 2.414 75,499 140,512

Rio Grande do Norte (RN) - 33 7.192 210,489 152,308

Sergipe (SE) - 8 4.057 182,305 157,309 Nordeste 9 421 92.620 164,600 169,435 Acre (AC) 2 10 2384 300,601 114,615 Amap´a (AP) - 8 2.654 351,418 139,831 Amazonas (AM) 3 17 6.379 164,045 188,449 Par´a (PA) - 41 12.604 155,738 139,718

Rondˆonia (RO) 7 44 6.590 375,840 122,719

Roraima (RR) - 5 1.605 320,915 148,611

Tocantins (TO) 1 42 3.160 210,487 138,354

Norte 13 167 35.376 204,666 140,839

Esp´ırito Santo (ES) 1 34 15461 397,020 119,806

Minas Gerais (MG) - 184 56.236 270,798 150,674

Rio de Janeiro (RJ) 2 48 39.266 238,118 139,093

S˜ao Paulo (SP) 4 158 214.843 486,730 167,171

Sudeste 7 424 325.806 381,992 157,413

Paran´a (PR) 1 35 19.516 175,734 102,007

Rio Grande do Sul (RS) 1 95 25.858 230,365 119,145

Santa Catarina (SC) - 46 17.914 265,511 131,759

Sul 2 176 63.288 217,655 116,272

(24)

Na Figura 2.1, cada c´ırculo representa a localiza¸c˜ao de um unidade prisional e a ´

area do c´ırculo ´e proporcional ao n´umero de presos (mapa da esquerda) ou ao n´umero de vagas (mapa da direita) naquela unidade. Observando a Figura 2.1(a), ´e evidente o aglomeramento de presos em grande parte do litoral, em maior peso nas regi˜oes sudeste e nordeste, sendo mais disperso ao norte e no interior do pa´ıs. Percebe-se tamb´em que a maioria das unidades que encarceram mais, em n´umeros absolutos, est˜ao localizadas no estado de S˜ao Paulo. Na Figura2.1(b), o n´umero de vagas parece acompanhar o n´umero de presos que pode ser observado no mapa ao lado, por´em, em propor¸c˜oes menores.

(a) (b)

Figura 2.1: Localiza¸c˜ao das unidades prisionais no Brasil no ano de 2014. ´Area e cor dos c´ırculos representam a quantidade de presos (a) e a quantidade de vagas (b).

A Figura 2.2 traz a taxa de ocupa¸c˜ao para cada uma das unidades prisionais no Brasil. Em todo o pa´ıs, a situa¸c˜ao de superpopula¸c˜ao ´e not´oria, destacando-se mais a regi˜ao nordeste. Os estados que apresentam pelo menos uma unidade prisional com mais de cinco presos por vaga (c´ırculo vermelho escuro) s˜ao: Amazonas, Cear´a, Goi´as, Mato Grosso do Sul, Par´a, Para´ıba, Pernambuco, Rio Grande do Norte, Rio Grande do Sul e Santa Catarina.

(25)

Figura 2.2: Localiza¸c˜ao das unidades prisionais no Brasil no ano de 2014. ´Area e cor dos c´ırculos representam a taxa de ocupa¸c˜ao.

A Tabela 2.2 mostra o cen´ario das unidades prisionais no Brasil em 2014. Em m´edia, as unidades prisionais brasileiras possuem 408 presos, enquanto que em m´edia as uni-dades disp˜oem de 267 vagas. Al´em disso, em torno de 75% das unidades apresentam superpopula¸c˜ao de presos, ou seja, o n´umero de presos excede o n´umero de vagas.

Tabela 2.2: Resumo das vari´aveis popula¸c˜ao prisional, capacidade prisional e taxa de ocupa¸c˜ao das 1392 unidades prisionais no Brasil para o ano de 2014.

Vari´avel M´ınimo 1o Quartil Mediana edia (Desvio Padr˜ao) 3oQuartil aximo

Popula¸c˜ao Prisional 0 51 134 408 (354,300) 476 4337

Capacidade Prisional 4 43 105 267 (595,680) 359 2696

Taxa de Ocupa¸c˜ao 0 0,953 1,333 1,563 (0,996) 1,965 9,778

´

E de grande importˆancia lembrar a diversidade no ˆambito econˆomico, pol´ıtico e so-cial dos estados do Brasil. Consequentemente, ´e natural pensar que para estados mais desenvolvidos, ou que possuem uma pol´ıtica punitivista (ou carcer´aria) mais agressiva, ou ainda os mais populosos, o quantitativo de presos ser´a maior. Sendo assim, espera-se que o n´umero de unidades prisionais seja correspondente `as necessidades de cada estado. Tendo em vista isso, as an´alises a seguir possuem grande relevˆancia para a investiga¸c˜ao das vari´aveis associadas `as unidades prisionais dos estados brasileiros.

(26)

A taxa da popula¸c˜ao carcer´aria brasileira em 2014 foi de 279,62 presos por 100 mil habitantes, apesar das cadeias brasileiras ofertarem apenas 182,87 vagas por 100 mil habi-tantes. Esses dados s˜ao ainda mais preocupantes no cen´ario estadual. Os mapas represen-tados nas Figuras2.3 e2.4 remetem a realidade da superpopula¸c˜ao de presos dos estados brasileiros no ano de 2014. O gr´afico da esquerda, na Figura 2.3, representa a taxa prisi-onal dos estados por 100 mil habitantes (#presos/#habitantes × 100mil) e o gr´afico da direita indica a taxa da capacidade prisional por 100 mil habitantes (#vagas/#habitantes × 100mil). Observa-se que o mapa da taxa prisional possui cores mais escuras para a maioria dos estados do que o mapa da taxa da capacidade prisional, indicando a super-popula¸c˜ao carcer´aria para esses estados. A superpopula¸c˜ao pode ser mais evidenciada na Figura 2.4 que apresenta a taxa de ocupa¸c˜ao (#presos/#vagas) para cada estado do Brasil. Apenas o estado do Maranh˜ao possui um quantitativo de presos inferior ao n´umero de vagas dispon´ıveis. Al´em disso, o Distrito Federal e os estados do Mato Grosso do Sul e Pernambuco s˜ao os que possuem mais que o dobro de presos por vagas, sendo Pernambuco o estado com maior taxa de ocupa¸c˜ao com 264,92%.

(a) (b)

Figura 2.3: Taxa prisional (a) e taxa da capacidade prisional (b) dos estados brasileiros por 100 mil habitantes no ano de 2014. Cores mais escuras representam taxas mais altas.

Com o objetivo de entender as caracter´ısticas das unidades prisionais, foram estudadas tamb´em vari´aveis referentes aos estados brasileiros. O IDH (´Indice de Desenvolvimento Humano), ´ındice desenvolvido pelo Programa das Na¸c˜oes Unidas para o Desenvolvimento

(27)

Figura 2.4: Taxa de ocupa¸c˜ao prisional dos estados brasileiros no ano de 2014. Cores mais escuras representam taxas mais altas.

(PNUD) em 1990, ´e comumente utilizado para mensurar as condi¸c˜oes b´asicas de vida de uma sociedade. Valores altos desse ´ındice indicam sociedades com condi¸c˜oes de vida b´asica melhores. J´a o GINI (´Indice de desigualdade), foi criado pelo matem´atico italiano Conrado Gini, e mensura a concentra¸c˜ao de renda em determinada sociedade. O valor de GINI igual a zero representa a situa¸c˜ao de igualdade, ou seja, todos tˆem a mesma renda. A Tabela 2.3 mostra medidas resumo para o IDH e o GINI dos estados brasileiros.

Tabela 2.3: Resumo do IDH do ano de 2010 e GINI do ano de 2014 para os estados brasileiros.

´Indices M´ınimo 1o Quartil Mediana edia (Desvio Padr˜ao) 3o Quartil aximo

IDH 2010 0,631 0,664 0,699 0,705 (0,049) 0,738 0,824

GINI 2014 0,429 0,463 0,480 0,480 (0,027) 0,495 0,565

Na Figura 2.5, est˜ao representados os box-plots das distribui¸c˜oes do IDH 2010, `a esquerda, e do GINI 2014, `a direita, para os estados brasileiros segundo as respectivas regi˜oes. Nota-se que h´a uma alta variabilidade tanto do IDH 2010 quanto do GINI 2014 para os estados da regi˜ao centro-oeste. Nessa regi˜ao tamb´em se encontra o Distrito Federal que ´e o que apresenta maior ´ındice de desenvolvimento (IDH 2010 = 0,824) e maior ´ındice de desigualdade (GINI 2014 = 0,565). Deve-se ressaltar ainda que a regi˜ao sul ´e a que possui valores relativamente altos e uma menor variabilidade do ´ındice de desenvolvimento de seus estados, e ´e a regi˜ao que apresenta os menores ´ındices de desigualdade.

(28)

CO NE N SE S 0.65 0.70 0.75 0.80 Região Índice (a) IDH 2010 CO NE N SE S 0.44 0.48 0.52 0.56 Região Índice (b) GINI 2014

Figura 2.5: Distribui¸c˜ao do IDH 2010 (a) e do GINI 2014 (b) para os estados brasileiros de acordo

com as regi˜oes Centro-Oeste (CO), Nordeste (NE), Norte (N), Sudeste (SE) e Sul (S).

A Figura 2.6 apresenta um gr´afico de dispers˜ao do logaritmo da taxa prisional por 100 mil habitantes e o IDH calculado no ano de 2010 para os estados. Os dados foram classificados em dois grupos de acordo com o ´ındice GINI calculado no ano de 2014: o primeiro grupo engloba os estados que est˜ao abaixo ou na m´edia desse ´ındice e o outro grupo engloba os que est˜ao acima da m´edia. Nota-se que, para ambos os grupos de GINI 2014, o logaritmo da taxa prisional cresce a medida que o ´ındice de desenvolvimento au-menta. Por´em, esse crescimento ´e mais lento para os estados com ´ındice de desigualdade menor, ou seja, estados mais desenvolvidos e mais desiguais tendem a apresentar taxas mais elevadas de encarceramento (Israel, 2016).

Somando-se a esses ´ındices, ´e de grande importˆancia o estudo de medidas capazes de aferir sobre a ideologia e orienta¸c˜ao dos partidos pol´ıticos dos governadores dos es-tados brasileiros, visto que a jurisdi¸c˜ao das unidades prisionais pertence ao governo do estado. Israel e Bachini (2017) medem o posicionamento pol´ıtico dos governos estaduais do per´ıodo de 2003 a 2014 a partir da classifica¸c˜ao dos partidos pol´ıticos dos governadores dos estados nesse per´ıodo. Para cada estado, os autores somam -1 se o partido ´e definido como de esquerda, 0 se ´e definido como de centro e 1 se ´e definido como de direita. O equivalente vale para a defini¸c˜ao de liberal (-1) e conservador (1).

(29)

Figura 2.6: Logaritmo da taxa prisional por 100 mil habitantes e o IDH 2010 para os estados brasileiros classificados pelo ´ındice GINI 2014.

As medidas de Israel e Bachini (2017) s˜ao baseadas nos trabalhos de Madeira e

da Silva Tarouco(2013) e Braga et al. (2015). O primeiro classifica os partidos pol´ıticos

apenas pelos seus estatutos, enquanto que o segundo mostra-se como uma atualiza¸c˜ao do primeiro, classificando os partidos a partir dos seus estatutos e do seu grau de fisio-logismo. A Tabela 2.4 apresenta as medidas pol´ıticas desenvolvidas por Israel e Bachini

(2017) para um per´ıodo de classifica¸c˜ao de 2003 a 2014.

A Figura 2.7 mostra os box-plots das distribui¸c˜oes das medidas de posicionamento pol´ıtico para os partidos dos governadores dos estados brasileiros de acordo com as res-pectivas regi˜oes. Constata-se que, as medidas baseadas no trabalho deBraga et al.(2015) tende a classificar os partidos um pouco mais `a esquerda, havendo certa dificuldade de diferenciar a classifica¸c˜ao entre os partidos.

(30)

CO NE N SE S −3 −2 −1 0 1 2 3 Região P osicionamento político

(a)Madeira e da Silva Tarouco (2013)

CO NE N SE S −3 −2 −1 0 1 2 3 Região P osicionamento político (b)Braga et al. (2015)

Figura 2.7: Distribui¸c˜ao das medidas de posicionamento pol´ıtico segundoMadeira e da Silva Tarouco

(2013) (a) eBraga et al. (2015) (b) para os estados brasileiros de acordo com as regi˜oes Centro-Oeste

(31)

Tabela 2.4: Medidas de posicionamento pol´ıtico para um per´ıodo de classifica¸c˜ao de 2003 a 2014, segundo crit´erios deMadeira e da Silva Tarouco (2013) e Braga et al.(2015), em

Israel e Bachini (2017).

Estados Segundo crit´erios Segundo crit´erios

deMadeira e da Silva Tarouco(2013) deBraga et al.(2015)

Acre -3 -3 Alagoas 2 -1 Amap´a -2 -3 Amazonas 0 1 Bahia -1 -1 Cear´a 1 -2 Distrito Federal 0 0 Esp´ırito Santo 0 -2 Goi´as 1 1 Maranh˜ao 0 0 Mato Grosso 0 0

Mato Grosso do Sul -1 -1

Minas Gerais 3 0 Par´a 1 -1 Para´ıba 2 -1 Paran´a 1 0 Pernambuco 0 -2 Piau´ı -2 -3 Rio de Janeiro 0 -1

Rio Grande do Norte 1 -1

Rio Grande do Sul 0 -1

Rondˆonia 1 0 Roraima 2 1 Santa Catarina 1 1 S˜ao Paulo 3 0 Sergipe -1 -1 Tocantins 2 1

(32)

Cap´ıtulo 3

Revis˜

ao metodol´

ogica

Conjuntos de dados georreferenciados s˜ao comumente encontrados em diversas ´areas da ciˆencia. Diz-se de dados georreferenciados aqueles que est˜ao relacionados `a uma localiza¸c˜ao e eles podem ser classificados em trˆes tipos: dados geoestat´ısticos, dados de ´

area e padr˜oes de pontos. Conjuntos de dados como por exemplo localiza¸c˜oes de ´arvores de uma determinada esp´ecie encontrada na floresta amazˆonica, focos de dengue em um estado, ocorrˆencia de assalto em determinados pontos de um munic´ıpio, s˜ao chamados de padr˜ao de pontos espaciais e referem as localiza¸c˜oes como eventos. Ao estudar o padr˜ao de pontos distribu´ıdo aleatoriamente no espa¸co, surgem questionamentos como: existe algum padr˜ao na distribui¸c˜ao desses pontos no espa¸co? ´E poss´ıvel associar covari´aveis que expliquem esse padr˜ao?

Verificar se os eventos observados apresentam algum tipo de padr˜ao sistem´atico (agru-pado ou regular), ao contr´ario de estarem distribu´ıdos aleatoriamente, e entender a forma¸c˜ao desses padr˜oes s˜ao caracter´ısticas principais da an´alise estat´ıstica de padr˜ao de pontos espaciais.

A Figura 3.1 ilustra trˆes padr˜oes de pontos espaciais que foram obtidos por meio de simula¸c˜oes. Nota-se que, na Figura 3.1(a), n˜ao h´a uma estrutura claramente definida e pode ser vista como um padr˜ao de pontos completamente aleat´orio. Por outro lado, na Figura 3.1(b), observa-se uma forte estrutura de agrupamento dos pontos. O padr˜ao de pontos agrupados pode surgir atrav´es de algum mecanismo de agrupamento ou por meio de varia¸c˜oes do meio de estudo levando `a concentra¸c˜oes de eventos relativamente altas

(33)

em determinadas regi˜oes. J´a na Figura3.1(c), tem-se uma distribui¸c˜ao dos pontos mais ou menos regular sobre toda a ´area de estudo, indicando que a ocorrˆencia de um ponto tende a repelir a existˆencia de outro ponto em sua vizinhan¸ca.

(a) (b) (c)

Figura 3.1: Simula¸c˜ao de padr˜oes de pontos aleat´orios (a); agrupados (b); e regulares (c).

Uma breve revis˜ao de literatura sobre processos pontuais espaciais ser´a exposta a seguir. Para defini¸c˜oes mais completas matematicamente, ver por exemplo,Diggle(2003),

Cressie (1991) e Mφller e Waagepetersen (2003).

3.1

Processos pontuais espaciais

Considerando apenas processos pontuais simples em Rr (isto ´e, ou nenhum evento ou um ´unico evento ocorre em qualquer ponto do Rr),Diggle(2003) define um processo

pontual X = {X(s) : s ∈ S} como um processo estoc´astico que rege as localiza¸c˜oes dos eventos {si} em algum conjunto S ⊆ Rr, onde o n´umero desses eventos em S tamb´em ´e

aleat´orio. Logo, a aleatoriedade est´a nas localiza¸c˜oes espaciais e n˜ao em caracter´ısticas associadas a elas.

Na pr´atica, somente pontos contidos em uma regi˜ao A ⊂ S limitada ser˜ao observados. Portanto, ser˜ao considerados realiza¸c˜oes de um conjunto finito de localiza¸c˜oes em S de um processo pontual. Essas realiza¸c˜oes s˜ao ditas um padr˜ao de pontos espaciais {s1, ..., sn},

si ∈ S, para i = 1, ..., n e n ≥ 0.

(34)

revisadas na se¸c˜ao seguinte.

3.1.1

Propriedades de primeira e segunda ordem

Definindo N (A) como sendo o n´umero de eventos na regi˜ao A ⊂ S limitada, pode-se calcular a esperan¸ca de N (A), denotada por E(N (A)), em termo da fun¸c˜ao de intensidade λ(s). A fun¸c˜ao de intensidade λ(s) mensura o potencial para um evento ocorrer em qualquer localiza¸c˜ao s ∈ S (Cressie e Wikle, 2011), ou ainda, o n´umero de eventos por unidade r-dimensional de volume.

Seja ds uma regi˜ao pequena localizada em s com volume |ds|. Ent˜ao, a fun¸c˜ao de intensidade de primeira ordem do processo pontual X ´e definida por

λ(s) = lim

|ds|→0

E(N (ds))

|ds| , s ∈ S, (3.1)

se o limite existe. Assim,

E(N (A)) = Z

A

λ(s)ds, A ⊂ S. (3.2)

O conhecimento de λ(·) n˜ao caracteriza completamente o comportamento espacial do processo pontual. Propriedades de segunda ordem podem expressar a complexa intera¸c˜ao espacial, ou seja, a dependˆencia espacial do processo. Por exemplo, a estrutura de co-variˆancia para N (A) ´e comumente baseada na fun¸c˜ao de intensidade de segunda ordem λ2(s, x) entre duas regi˜oes infinitesimais |ds| e |dx| contendo s e x, dada como

λ2(s, x) = lim |ds|,|dx|→0

E(N (ds)N (dx))

|ds||dx| , s, x ∈ S. (3.3)

Caracter´ısticas importantes de um processo pontual espacial X est˜ao diretamente re-lacionadas com as fun¸c˜oes de intensidade de primeira e segunda ordens. A seguir, ser˜ao introduzidos os conceitos de estacionariedade e isotropia, que s˜ao hip´oteses simplificado-ras largamente utilizadas.

A estacionariedade de X afirma que a sua distribui¸c˜ao ´e invariante sobre transla¸c˜ao em Rr. Um processo ´e fracamente estacion´ario se

(35)

em que λ∗2(·) ´e a fun¸c˜ao de intensidade de segunda ordem escrita como fun¸c˜ao de um ´

unico parˆametro.

Para alguns autores, o termo estacionariedade ´e usado para processos que tenham propriedades semelhantes em todos os locais da regi˜ao de interesse. Al´em disso, se um processo estacion´ario ´e tamb´em isotr´opico, a sua distribui¸c˜ao ´e invariante sobre rota¸c˜oes na origem de Rr, isto ´e,

λ2(s, x) = λ∗2(||s − x||), (3.5)

ou seja, λ2(s, x) ´e fun¸c˜ao apenas da distˆancia entre s e x.

As hip´oteses de estacionariedade e isotropia s˜ao amplamente utilizadas em mode-lagens espaciais, pois simplificam as an´alises de forma consider´avel. Essas suposi¸c˜oes, entretanto, devem ser consideradas com cautela, apenas ao se verificar apropriadas para o processo pontual em quest˜ao. A seguir s˜ao revisadas algumas an´alises de processos pontuais utilizadas para a compreens˜ao de padr˜oes de pontos.

3.1.2

Analisando padr˜

oes pontuais no espa¸

co

Segundo Diggle(2003), a hip´otese de aleatoriedade espacial completa (CSR - na sigla em inglˆes) para um padr˜ao de pontos espacial afirma que: (i) o n´umero de eventos em uma regi˜ao A plana com ´area |A| segue uma distribui¸c˜ao de Poisson com m´edia λ|A|; (ii) dado n eventos na regi˜ao A, as localiza¸c˜oes desses eventos constituem uma amostra aleat´oria independente de uma distribui¸c˜ao uniforme em A. Essa hip´otese tamb´em pode ser vista como um processo de Poisson homogˆeneo, que ser´a contemplado na Se¸c˜ao3.1.3. A seguir, ser˜ao apresentadas algumas ferramentas que podem ser ´uteis na an´alise da hip´otese de CSR.

Estimador de Kernel

Uma an´alise preliminar do comportamento do padr˜ao de pontos em estudo pode ser realizada a partir da estima¸c˜ao n˜ao param´etrica da fun¸c˜ao de intensidade λ(·). O estimador de Kernel ´e uma op¸c˜ao simples para essa tarefa, que tem como objetivo estimar

(36)

a densidade de probabilidade de uma vari´avel aleat´oria. Baseado em n localiza¸c˜oes de eventos {s1, ..., sn} em S, o estimador de intensidade de Kernel ´e (Cressie e Wikle,2011)

ˆ λ(s) = 1 pb(s) n X i=1 kb(s − si), s ∈ S, (3.6)

em que kb(·) ´e uma fun¸c˜ao de densidade de probabilidade (Kernel) sim´etrica na origem,

b > 0 ´e o parˆametro de suaviza¸c˜ao chamado largura da banda, e pb(s) =

R

Skb(s − x)dx

´

e a corre¸c˜ao de borda.

As fun¸c˜oes de Kernel mais utilizadas s˜ao a uniforme, quartic, triangular, Epanech-nikov, normal, entre outras. Por exemplo, em R2, considere a escolha de um Kernel

quartic1, k b(x) = ρb(x1)ρb(x2), em que x = (x1, x2)0 e ρb(·) ´e ρb(x) = 15 16b[1 − (x/b) 2]2I(|x| ≤ b), (3.7)

sendo I(|x| ≤ b) uma fun¸c˜ao indicadora que assume 1 se em m´odulo de x for menor ou igual a b e 0 caso contr´ario. A escolha do parˆametro b influencia fortemente o resultado da estima¸c˜ao. Valores pequenos de b podem gerar superf´ıcies muito descont´ınuas, enquanto valores grandes geram superf´ıcies muito suavizadas. A Figura 3.2 mostra a estimativa da fun¸c˜ao de intensidade para o padr˜ao de pontos agrupados apresentados na Figura

3.1(b) definido em um quadrado [0, 1] × [0, 1], considerando as larguras de bandas 0,04, 0,1 e 0,24. Percebe-se que h´a picos da intensidade em locais com grande concentra¸c˜ao de pontos e a medida que o parˆametro b aumenta, a fun¸c˜ao intensidade vai sendo suavizada e apresentando valores mais baixos para essas regi˜oes.

O estimador Kernel, como visto, ´e adequado para estudar de forma n˜ao param´etrica a distribui¸c˜ao de primeira ordem do processo pontual. Para explorar propriedades de segunda ordem do processo, pode-se utilizar as fun¸c˜oes emp´ıricas F, G e K. Tais fun¸c˜oes s˜ao descritas a seguir.

(37)

Figura 3.2: Estimativa da fun¸c˜ao de intensidade utilizando o estimador Kernel com fun¸c˜ao quartic para uma simula¸c˜ao do padr˜ao de pontos agrupados.

Fun¸c˜ao F

Ripley(1977) define a fun¸c˜ao F como a fun¸c˜ao de distribui¸c˜ao acumulada da distˆancia

entre um ponto aleat´orio e o evento mais pr´oximo a este. Um estimador para a fun¸c˜ao F pode ser dado por:

ˆ F (d) =

Pm

i=1I(di ≤ d)

m d > 0, (3.8)

em que m ´e o n´umero de pontos aleat´orios n˜ao observados na regi˜ao de estudo e di a

distˆancia do i-´esimo ponto aleat´orio ao ponto mais pr´oximo de n eventos na regi˜ao de estudo.

Diggle (2003) mostra que a fun¸c˜ao F para a hip´otese de CSR ´e aproximadamente

dada por

F (d) = 1 − exp(−πλd2), (3.9)

em que λ = n|A|−1. Para avaliar a hip´otese de CSR, ´e realizada uma an´alise gr´afica do estimador da fun¸c˜ao F avaliada em di, contra a distˆancia di. Nesse gr´afico, ´e poss´ıvel

incluir envelopes inferiores e superiores de simula¸c˜oes para um cen´ario de CSR, definidos como:

I(d) = min( ˆF (d)) S(d) = max( ˆF (d)). (3.10)

(38)

3.1). Eles s˜ao mostrados a seguir na Figura3.3. Percebe-se pela figura que para distˆancias maiores, o padr˜ao agrupado difere-se dos demais padr˜oes apresentando um crescimento um pouco mais lento, uma vez que a probabilidade de um ponto aleat´orio estar pr´oximo de pontos com padr˜ao agrupado ´e menor do que se o padr˜ao fosse aleat´orio ou regular. Al´em disso, identifica-se uma CSR quando os valores estimados da fun¸c˜ao F se aproximam dos valores aproximados pela fun¸c˜ao sob a hip´otese de CSR descrita pela Equa¸c˜ao 3.9.

0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.0 0.2 0.4 0.6 0.8 1.0 x F(x) (a) 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.0 0.2 0.4 0.6 0.8 1.0 x F(x) (b) 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.0 0.2 0.4 0.6 0.8 1.0 x F(x) (c)

Figura 3.3: Estimador da fun¸c˜ao F (linha preta s´olida), fun¸c˜ao F aproximada para a hip´otese de CSR (linha vermelha pontilhada) e envelopes de 99 simula¸c˜oes de CSR (pol´ıgono cinza) para dados artificiais de um padr˜ao de pontos aleat´orios (a); agrupados (b); e regulares (c).

Fun¸c˜ao G

Comumente conhecida na literatura como m´etodo do vizinho mais pr´oximo, a fun¸c˜ao G ´e a distribui¸c˜ao acumulada da distˆancia entre um evento e o vizinho mais pr´oximo. Tamb´em proposta por Ripley(1977), um estimador para esta pode ser definido por:

ˆ G(d) =

Pn

i=1I(di ≤ d)

n , d > 0, (3.11)

em que, para n eventos localizados na regi˜ao de estudo A, di representa a distˆancia do

i-´esimo evento ao evento mais pr´oximo em A. A diferen¸ca entre as fun¸c˜oes F e G ´e que a fun¸c˜ao F usa a distˆancia de um evento a um ponto aleat´orio n˜ao observado enquanto a fun¸c˜ao G usa a distˆancia de um evento a um outro evento.

(39)

Analogamente `a fun¸c˜ao F,Diggle(2003) demonstra que a fun¸c˜ao G, sob a hip´otese de CSR, ´e aproximadamente definida pela Equa¸c˜ao3.9. Para verificar essa hip´otese, an´alises gr´aficas equivalentes `as realizadas para a fun¸c˜ao F podem ser feitas para a fun¸c˜ao G. Assim, para os dados artificiais apresentados na Figura 3.1, os gr´aficos das estimativas da fun¸c˜ao G s˜ao apresentados da Figura3.4. Nota-se que a estimativa da fun¸c˜ao G cresce mais r´apido para o padr˜ao de pontos agrupados do que para os outros padr˜oes. Isso se deve ao fato de que a probabilidade de eventos estarem pr´oximos uns dos outros a uma dada distˆancia d ´e maior para padr˜oes agrupados do que para os demais padr˜oes. J´a para o padr˜ao regular, a estimativa da fun¸c˜ao G cresce bem mais lentamente, pois os eventos est˜ao bem mais espa¸cados uns dos outros.

0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.0 0.2 0.4 0.6 0.8 1.0 x G(x) (a) 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.0 0.2 0.4 0.6 0.8 1.0 x G(x) (b) 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.0 0.2 0.4 0.6 0.8 1.0 x G(x) (c)

Figura 3.4: Estimador da fun¸c˜ao G (linha preta s´olida), fun¸c˜ao G aproximada para a hip´otese de CSR (linha vermelha pontilhada) e envelopes de 99 simula¸c˜oes de CSR (pol´ıgono cinza) para dados artificiais de um padr˜ao de pontos: aleat´orios (a); agrupados (b); e regulares (c).

Fun¸c˜ao K

A fun¸c˜ao F ´e mais indicada para a identifica¸c˜ao de agrupamentos de eventos, enquanto que a fun¸c˜ao G ´e mais relevante para a identifica¸c˜ao de padr˜oes regulares (Diggle,2003). Diante disso, buscando-se uma fun¸c˜ao igualmente capaz de distinguir ambos os padr˜oes,

(40)

e segunda ordem de um processo estacion´ario e isotr´opico, definida como: K(d) = 2π λ2 Z d 0 λ∗2(s)sds, (3.12)

ou alternativamente, pode ser definida como:

K(d) = λ−1E(N0(d)) d > 0, (3.13)

em que N0(d) ´e o n´umero de eventos a menos de uma distˆancia d de um evento arbitr´ario,

e λ ´e a intensidade do processo.

Um estimador proposto por Ripley (1977) para a fun¸c˜ao K ´e da foma:

ˆ K(d) = |A| n2 n X i=1 n X j=1 I(dij < d) wij , (3.14)

em que I(dij < d) ´e uma indicadora que assume 1 se a distˆancia dij entre os eventos i

e j (i 6= j) ´e menor que d, e 0 caso contr´ario. |A| ´e a ´area da regi˜ao de estudo onde se localizam os n eventos; e wij ´e a propor¸c˜ao da circunferˆencia ao redor de um evento i,

passando sobre o evento j, que est´a dentro da regi˜ao A. J´a sobre a hip´otese de CSR, sabe-se que as fun¸c˜oes de intensidade mantˆem-se constantes, ou seja, λ(s) = λ e λ∗2(s) = λ2.

Logo, sob estas condi¸c˜oes, a fun¸c˜ao K para a hip´otese de CSR ´e

K(d) = 2π λ2 Z d 0 λ∗2(s)sds = 2π λ2 Z d 0 λ2sds = πd2, (3.15)

e pode ser facilmente calculada para a constru¸c˜ao de gr´aficos semelhantes aos gr´aficos apresentados para as fun¸c˜oes F e G, e an´alise da hip´otese de CSR.

Para facilitar a interpreta¸c˜ao, a Figura 3.5 exibe o gr´afico do estimador da fun¸c˜ao K menos o seu valor te´orico sob a hip´otese CSR (ou seja, K(d) = πd2), contra a distˆancia d, para os padr˜oes de pontos artificiais apresentados no Figura3.1.

Nota-se pela Figura 3.5, que para o exemplo com padr˜ao de pontos agrupados, a estimativa da fun¸c˜ao K posiciona-se acima do envelope superior. Por outro lado, para o padr˜ao regular, percebe-se uma curvatura para abaixo do envelope inferior em distˆancias

(41)

0.00 0.10 0.20 0.30 −0.15 −0.05 0.05 0.15 x K(x) − π x 2 (a) 0.00 0.10 0.20 0.30 −0.10 0.00 0.05 0.10 0.15 0.20 x K(x) − π x 2 (b) 0.00 0.10 0.20 0.30 −0.20 −0.10 0.00 0.05 x K(x) − π x 2 (c)

Figura 3.5: Estimador da fun¸c˜ao K menos πx2 (linha preta s´olida), linha de referˆencia em K(x) − πx2 = 0 para a hip´otese de CSR (linha vermelha pontilhada) e envelopes de

99 simula¸c˜oes de CSR (pol´ıgono cinza) para dados artificiais de um padr˜ao de pontos aleat´orios (a); agrupados (b); e regulares (c).

pequenas (abaixo de 0,1), enquanto que para o padr˜ao aleat´orio a estimativa da fun¸c˜ao K est´a bem pr´oxima `a linha de referˆencia da CSR. Conforme a distˆancia aumenta, a estima¸c˜ao da fun¸c˜ao K para o padr˜ao regular se assemelha `a estima¸c˜ao para o padr˜ao aleat´orio.

An´alise explorat´oria espacial para os dados prisionais

A seguir ser´a realizada uma an´alise explorat´oria espacial com base nas estat´ısticas apresentadas anteriormente. Com o objetivo de identificar a existˆencia de padr˜oes de pontos nos dados das localiza¸c˜oes das unidades prisionais, primeiramente foi realizado uma estima¸c˜ao da intensidade do processo utilizando o estimador de Kernel. Para tal, baseado nas localiza¸c˜oes das 1392 unidades prisionais distribu´ıdas por todo Brasil, o estimador de Kernel foi calculado para diferentes valores de largura da banda e o resultado ´

e mostrado na Figura 3.6. S˜ao percept´ıveis fortes evidˆencias de estrutura espacial na distribui¸c˜ao pontual das unidades prisionais e com maior incidˆencia no sudeste, em torno da regi˜ao mais urbanizada e desenvolvida do Rio de Janeiro, S˜ao Paulo e Minhas Gerais, e no nordeste com centro entre Pernambuco e Cear´a. Pode-se observar tamb´em que ao

(42)

aumentar o tamanho da largura da banda, a estimativa da intensidade vai sendo suavizada e fica claro a intensidade crescente da regi˜ao norte em dire¸c˜ao ao litoral brasileiro. Por´em, esse estimador fornece apenas uma an´alise pr´evia do comportamento do processo. Para melhor compreender o padr˜ao de pontos da amostra e assim poder classific´a-lo entre os tipos de padr˜oes sistem´aticos (agrupamento ou regularidade), foi investigado a hip´otese de CSR das unidades aplicando-se as fun¸c˜oes G, F e K.

A Figura 3.7(a) traz o gr´afico da fun¸c˜ao de distribui¸c˜ao emp´ırica da fun¸c˜ao G e claramente pode-se observar o excesso de pequenas distˆancia de vizinhos mais pr´oximos o que caracteriza um padr˜ao de agrupamento. A Figura3.7(b) mostra o gr´afico da fun¸c˜ao de distribui¸c˜ao emp´ırica da fun¸c˜ao F em que se percebe que a estimativa de F encontra-se abaixo do limite inferior do envelope de simula¸c˜oes de um CSR, indicando um padr˜ao de pontos agrupados.

O conhecimento da intensidade n˜ao caracteriza completamente o comportamento es-pacial do processo pontual. Existem medidas de momento de ordem superior que ex-pressam complexas intera¸c˜oes espaciais (Diggle, 2003). Al´em disso, as fun¸c˜oes G e F tratam de apenas contagem de pontos na procura do vizinho mais pr´oximo ou dentro de uma regi˜ao espec´ıfica de estudo, sendo assim muito simplificadas e havendo perda de informa¸c˜ao no que diz respeito a intera¸c˜ao dos eventos. A fun¸c˜ao K mostra-se mais completa e robusta para caracterizar o processo pontual, uma vez que se baseia na fun¸c˜ao de intensidade de segunda ordem e ent˜ao agregando mais informa¸c˜ao a respeito da de-pendˆencia espacial. Na Figura3.7(c) encontra-se a estimativa da fun¸c˜ao K menos o valor te´orico sob um CSR (K(r) = πx2) e nota-se que essa permanece acima do limite superior

do envelope de simula¸c˜ao, caracterizando um padr˜ao de pontos agrupados.

Dada a descri¸c˜ao dos dados e apresenta¸c˜ao do problema, nos pr´oximos cap´ıtulos, ser´a feita uma revis˜ao metodol´ogica com o prop´osito de aprofundar o estudo do fenˆomeno apresentado.

(43)

Figura 3.6: Estimativas da intensidade pontual das unidades prisionais utilizando a fun¸c˜ao de Quartic Kernel variando a largura da banda.

0.00 0.01 0.02 0.03 0.04 0.05 0.0 0.2 0.4 0.6 0.8 1.0 x G(x) (a) 0.00 0.01 0.02 0.03 0.04 0.05 0.0 0.2 0.4 0.6 0.8 1.0 x F(x) (b) 0.0 0.1 0.2 0.3 0.4 0.00 0.05 0.10 0.15 0.20 x K(x) − π x 2 (c)

Figura 3.7: Estimador das fun¸c˜oes G (a), F (b) e K-πx2 (c) para as unidades prisionais brasileiras

(linha preta s´olida), respectivas fun¸c˜oes te´oricas para a hip´otese de CSR (linha vermelha pontilhada) e

envelopes de 99 simula¸c˜oes de CSR (pol´ıgono cinza).

3.1.3

Modelagem para padr˜

oes de pontos espaciais

(44)

trabalho.

O Processo de Poisson desempenha um papel fundamental na modelagem de padr˜oes de pontos. O processo pontual de Poisson X ´e definido no espa¸co S ⊆ Rd e especificado por uma fun¸c˜ao de intensidade λ : S −→ [0, ∞) que ´e localmente integr´avel, isto ´e, R

Aλ(s)ds < ∞, A ⊂ S (Mφller e Waagepetersen,2003).

Tem-se que a intensidade do processo ´e dada por:

µ(A) = Z

A

λ(s)ds A ⊆ S, (3.16)

em que λ(s)ds ´e a probabilidade de ocorrˆencia de um ponto em uma regi˜ao infinitesimal centrada em s e de ´area ds. A intensidade do processo de Poisson pode ser interpretada como o n´umero esperado de pontos em A, para todo A ⊆ S, ou seja E[N (A))] = µ(A).

Mφller e Waagepetersen(2003) definem o processo pontual de Poisson X com fun¸c˜ao

de intensidade λ(·) como aquele que satisfaz as seguintes propriedades (em que µ ´e dado por 3.16):

(i) para qualquer A ⊆ S com µ(A) < ∞, N (A) segue uma distribui¸c˜ao de Poisson com m´edia µ(A), isto ´e, N (A) ∼ P oisson(µ(A));

(ii) para qualquer n ∈ N e A ⊆ S com 0 < µ(A) < ∞, condicionado em N (A) = n, o processo pontual X|N (A) = n, que consiste em n pontos independentes e identicamente distribu´ıdos em A com densidade f (s) = µ(A)λ(s), ´e um processo pontual binomial, ou seja, X|N (A) = n ∼ Binomial(A, n, f ).

Denota-se que X segue um processo de Poisson na regi˜ao S e com intensidade λ(·) por X ∼ P oisson(S, λ(·)).

Se χ = {s1, ..., sn}, si ∈ S ´e uma realiza¸c˜ao do processo pontual. Condicionalmente ao

n´umero de eventos em S, as localiza¸c˜oes si s˜ao independentes e tem distribui¸c˜ao comum

com densidade λ(s)/µ. Ent˜ao, a verossimilhan¸ca para λ(·) baseada no dado χ ´e

L(λ(·); s1, ..., sn) = n Y i=1 λ(si)exp  − Z A λ(s)ds  . (3.17)

Se a fun¸c˜ao de intensidade ´e uma constante que n˜ao depende das localiza¸c˜oes dos eventos de X, isto ´e, λ(s) = λ, ent˜ao tem-se um processo de Poisson homogˆeneo; do

(45)

contr´ario, se a fun¸c˜ao de intensidade λ(s) varia no espa¸co S, tem-se um processo de Poisson n˜ao-homogˆeneo.

O processo de Poisson homogˆeneo ´e o mecanismo estoc´astico mais simples poss´ıvel para a gera¸c˜ao de padr˜oes de pontos espaciais e, em aplica¸c˜oes, ´e usado como padr˜ao idealizado de aleatoriedade espacial completa CSR (Diggle, 2013). Ele ´e isotr´opico e estacion´ario o que faz com que, para muitos fenˆomenos, n˜ao seja realista, pois se mostra muito trivial. J´a o processo n˜ao-homogˆeneo de Poisson se apresenta n˜ao-estacion´ario, por´em o mesmo n˜ao possui efeitos de segunda ordem.

Apesar da classe de modelos do processo de Poisson ser muito simplista para dados reais, ela pode ser utilizada como base para constru¸c˜ao de modelos mais flex´ıveis, como por exemplo, processos de Cox. Esses s˜ao modelos geralmente utilizados para padr˜oes de pontos agregados devido `a heterogeneidade aleat´oria do espa¸co ou pelo agrupamento de pontos de eventos relacionados (Mφller e Waagepetersen,2003) (Diggle,2013).

O processo de Cox foi considerado pela primeira vez por Lundberg (1940) e Cox

(1955) e ele ´e naturalmente uma extens˜ao de um processo de Poisson. O processo de Cox ´e conduzido por um processo estoc´astico n˜ao negativo λ = {λ(s) : s ∈ S}. Se a distribui¸c˜ao condicional de X dado λ ´e um processo de Poisson em S com fun¸c˜ao de intensidade λ, ent˜ao diz-se que X ´e um processo de Cox conduzido por λ.

3.2

Inferˆ

encia sob o enfoque bayesiano

Ap´os a especifica¸c˜ao do modelo, tornar-se essencial a escolha do m´etodo de estima¸c˜ao dos parˆametros. A seguir ´e feito um breve resumo sobre os m´etodos de inferˆencia baye-sianos.

Na inferˆencia Bayesiana, a principal ferramenta para estima¸c˜ao dos parˆametros do modelo ´e a distribui¸c˜ao a posteriori. Essas distribui¸c˜oes s˜ao capazes de conter tanto in-forma¸c˜oes provindas dos dados, atrav´es da fun¸c˜ao de verossimilhan¸ca, quanto informa¸c˜oes vindas de cren¸cas ou conjecturas do pesquisador a respeito dos parˆametros desconhecidos. Assim, diferentemente dos m´etodos cl´assicos que tratam os parˆametros como quantida-des fixas, a inferˆencia Bayesiana atribui aos parˆametros uma distribui¸c˜ao de

(46)

probabi-lidade chamada de distribui¸c˜ao a priori. Atrav´es dessas distribui¸c˜oes que tais cren¸cas s˜ao incorporadas ao modelo. No entanto, quando n˜ao se tem informa¸c˜oes pr´evias so-bre os parˆametros, distribui¸c˜oes a priori n˜ao informativas s˜ao utilizadas, fazendo assim, uma associa¸c˜ao `a inferˆencia cl´assica. Logo, a distribui¸c˜ao a posteriori dos parˆametros ´

e dada como a combina¸c˜ao da fun¸c˜ao de verossimilhan¸ca e da distribui¸c˜ao a priori dos parˆametros, da seguinte forma:

p(θ|s1, ..., sn) ∝ L(λ(·); s1, ..., sn)p(θ), (3.18)

em que p(θ|s1, ..., sn) e p(θ) s˜ao as distribui¸c˜oes a posteriori e a priori, respectivamente,

para o vetor de parˆametros θ. A express˜ao 3.18 ´e fundamentada no teorema de Bayes. Para obter mais detalhes sobre a teoria da inferˆencia Bayesiana, consultar Migon et al.

(2014).

O estimador Bayesiano para θ ´e aquele que minimiza o risco a posteriori de Bayes. No caso particular da fun¸c˜ao perda quadr´atica, um estimador para θ ´e representado por ˆθ que minimiza E[(θ − ˆθ)2|s], isto ´e, ˆθ = E(θ|s). Al´em de estimadores pontuais, o intervalo de credibilidade tamb´em pode ser obtido. No entanto, em muitos casos a distribui¸c˜ao a posteriori n˜ao possui forma anal´ıtica conhecida ou os c´alculos dessas medidas resumo s˜ao de dif´ıcil resolu¸c˜ao. Para contornar tal problema, m´etodos iterativos computacionais s˜ao utilizados, como os m´etodos de Monte Carlo via cadeias de Markov (MCMC).

Os m´etodos MCMC permitem obter amostras de uma distribui¸c˜ao alvo π(.) (no caso da estima¸c˜ao bayesiana, a distribui¸c˜ao alvo ´e a distribui¸c˜ao a posteriori) por meio de simula¸c˜ao estoc´astica e ent˜ao calcular as estimativas amostrais. O processo ´e iniciado em um estado arbitr´ario θ(0), e ap´os um n´umero suficientemente grande de simula¸c˜oes, a distribui¸c˜ao das observa¸c˜oes geradas ´e aproximadamente igual a distribui¸c˜ao alvo π(θ), θ ∈ Rr. Para mais detalhes desses m´etodos, consultar Gamerman e Lopes (2006). Os dois algoritmos MCMC mais significativos ser˜ao apresentados a seguir.

3.2.1

Amostrador de Gibbs

O amostrador de Gibbs gera, de forma iterativa, uma amostra da distribui¸c˜ao conjunta de interesse a partir das distribui¸c˜oes condicionais completas dos parˆametros

Referências

Documentos relacionados

Laboratório de Genética Toxicológica, Departamento de Bioquímica e Biologia Molecular, Insti- tuto de Ciências Biológicas (ICB), Universidade Federal de Goiás (UFG), Goiânia,

Analysis of relief and toponymy of the landscape based on the interpretation of the military topographic survey: Altimetry, Hypsometry, Hydrography, Slopes, Solar orientation,

ed è una delle cause della permanente ostilità contro il potere da parte dell’opinione pubblica. 2) Oggi non basta più il semplice decentramento amministrativo.

Posteriormente, em Junho de 1999, ingressei no grupo Efacec, onde fui responsável pela elaboração de projetos e propostas para a construção de Estações de Tratamento

The quality of the sensory stimulation that is provided to individuals with profound intellectual and multiple disabilities (PIMD) has recently emerged as a

Considerando a importância dos tratores agrícolas e características dos seus rodados pneumáticos em desenvolver força de tração e flutuação no solo, o presente trabalho

A simple experimental arrangement consisting of a mechanical system of colliding balls and an electrical circuit containing a crystal oscillator and an electronic counter is used

O modelo de toxicidade reprodutiva empregado para realização deste trabalho consiste da administração prolongada do eugenol durante a gestação de ratas Wistar,