• Nenhum resultado encontrado

Mistura de normais em trˆ es dimens˜ oes

4.3 Aplica¸c˜ ao

4.3.2 Mistura de normais em trˆ es dimens˜ oes

Com o objetivo de entender o fenˆomeno do encarceramento no Brasil, ser˜ao incorpo- radas ao modelo covari´aveis como a taxa de ocupa¸c˜ao prisional. Essa taxa ´e de grande importˆancia, pois, remete o valor percentual da quantidade de presos por vagas. Por meio dessa, pode-se verificar a situa¸c˜ao de aloca¸c˜ao dos presos em cada unidade. Al´em disso, ser´a analisado se unidades pr´oximas apresentam taxas de ocupa¸c˜ao semelhantes.

Para esse ajuste, as distribui¸c˜oes a priori permanecem as mesmas descritas nas Equa¸c˜oes de4.20a4.24. Tamb´em foi gerada uma cadeia com 50.000 itera¸c˜oes e tomados uma amos- tra de aquecimento de tamanho 2.500 e um espa¸camento de tamanho 50. A amostra final de cada parˆametro foi composta por 951 valores.

A Tabela4.3mostra o resultado dos crit´erios de compara¸c˜ao de modelos para o ajuste dos modelos com estrutura de mistura normal para diversos valores k de componentes na mistura considerando que as dimens˜oes s˜ao compostas pelas coordenadas e o logaritmo da taxa de ocupa¸c˜ao das unidades prisionais no Brasil.

Tabela 4.3: Crit´erios de compara¸c˜ao para os modelos com mistura de normais conside- rando coordenadas e logaritmo da taxa de ocupa¸c˜ao prisional na dimens˜ao.

Crit´erios k = 2 k = 3 k = 4 k = 5 k = 6

DIC 6955,435 5312,433 4531,929 3260,174 4625,383 BIC 6984,563 5317,971 4644,310 4822,505 5035,927 AIC 6880,053 5161,206 4435,291 4561,231 4722,399

De acordo com os crit´erios de compara¸c˜ao, os modelos que melhor ajustam os dados s˜ao os que possuem uma mistura de quatro normais e mistura de cinco normais. Como os crit´erios para esses dois modelos n˜ao diferem muito, optou-se por mostrar os resulta- dos da mistura com quatro normais, j´a que quatro conglomerados formados em ambos os modelos s˜ao bem parecidos e o quinto conglomerado n˜ao apresenta muito ganho de

informa¸c˜ao. Al´em disso, ser´a priorizado modelos com menos parˆametros. Segue a Tabela

4.3 para os resultados do ajuste do modelo com mistura de quatro normais.

Tabela 4.4: Moda e intervalo de credibilidade de 95% a posteriori para os parˆametros do modelo com mistura de 4 normais com dimens˜oes compostas pelas coordenadas e logaritmo da taxa de ocupa¸c˜ao das unidades prisionais no Brasil.

Parˆametros Moda 95% Parˆametros Moda 95%

λ0 2854,630 (2599,684; 3147,078) σ21,23 -0,832 (-4,050; 1,144) w1 0,114 (0,079; 0,160) σ21,33 0,210 (0,155; 0,281) w2 0,324 (0,273; 0,392) σ22,11 17,556 (12,088; 27,180) w3 0,309 (0,242; 0,365) σ22,12 -11,571 (-18,507; -6,805) w4 0,243 (0,201; 0,303) σ22,13 -0,255 (-0,867; 0,399) µ1,1 -48,626 (-48,947; -48,271) σ22,22 12,681 (8,687; 19,411) µ1,2 -14,562 (-19,801; -8,540) σ22,23 0,823 (0,323; 1,473) µ1,3 0,314 (0,218; 0,411) σ22,33 0,616 (0,527; 0,732) µ2,1 -36,194 (-37,043; -34,834) σ23,11 53,208 (37,865; 80,305) µ2,2 -6,628 (-7,776; -5,842) σ23,12 -34,796 (-59,631; -22,541) µ2,3 0,390 (0,276; 0,516) σ23,13 0,090 (-0,814; 1,156) µ3,1 -54,441 (-56,345; -51,628) σ23,22 96,131 (70,818; 125,314) µ3,2 -24,228 (-26,722; -22,001) σ23,23 1,343 (0,422; 2,390) µ3,3 0,124 (0,014; 0,222) σ23,33 0,465 (0,396; 0,551) µ4,1 -44,816 (-45,289; -44,118) σ24,11 11,282 (8,438; 17,110) µ4,2 -23,637 (-24,525; -22,718) σ24,12 10,951 (7,436; 15,653) µ4,3 0,260 (0,165; 0,335) σ24,13 -0,164 (-0,427; 0,080) σ1,112 1,405 (0,866; 2,056) σ24,22 17,441 (13,877; 23,469) σ2 1,12 -1,137 (-10,316; 8,570) σ24,23 0,146 (-0,157; 0,578) σ1,132 0,085 (-0,044; 0,228) σ24,33 0,210 (0,174; 0,260) σ2 1,22 178,693 (84,881; 399,125)

A maioria das estimativas dos parˆametros mostram-se bem precisas com amplitudes pequenas nos intervalos de credibilidade de 95%. A maior estimativa para a m´edia da terceira coordenada da localiza¸c˜ao dos pontos (relativa ao logaritmo da taxa de ocupa¸c˜ao

– 0, 390) ´e referente ao conglomerado que cobre a maioria dos estados do nordeste (con- glomerado 2), a segunda maior (0, 314) ´e referente ao conglomerado centrado no estado de Goi´as (conglomerado 1).

A Figura 4.11(a) mostra a identifica¸c˜ao dos conglomerados estimados de pontos e a Figura 4.11(b) mostra a distribui¸c˜ao do logaritmo da taxa de ocupa¸c˜ao das unidades de acordo com os conglomerados identificados — as cores das caixas correspondem as cores dos pontos no mapa e a linha tracejada vermelha indica a taxa de ocupa¸c˜ao igual a 100% (logaritmo da taxa de ocupa¸c˜ao igual a zero). Repare que a diferen¸ca sutil entre os box- plots de cada conglomerado sugere que a forma¸c˜ao dos conglomerados est´a sendo mais influenciada pelas localiza¸c˜oes dos pontos do que pela covari´avel taxa de ocupa¸c˜ao. A maioria das unidades em cada conglomerado possuem taxas de ocupa¸c˜ao altas, sendo que em torno de 75% das unidades ultrapassa o n´umero de presos por vaga. Aparentemente, o modelo n˜ao identificou conglomerados de pontos t˜ao marcantes em rela¸c˜ao `a taxa de ocupa¸c˜ao. Vale ressaltar que o conglomerado 3 apresenta a menor mediana da taxa de ocupa¸c˜ao e tamb´em possui muitos pontos discrepantes.

(a) 1 2 3 4 −3 −2 −1 0 1 2 (b)

Figura 4.11: Localiza¸c˜oes das unidades prisionais com cores representando cada conglo- merado de pontos para o modelo com coordenadas e logaritmo da taxa de ocupa¸c˜ao (a). Box-plot do logaritmo da taxa de ocupa¸c˜ao de acordo com os conglomerados de pontos (b), logaritmo da taxa de ocupa¸c˜ao igual a zero (linha tracejada vermelha).

Para a an´alise da fun¸c˜ao de intensidade, a Figura 4.12mostra a fun¸c˜ao de intensidade estimada para cada unidade. As cores e as ´areas dos c´ırculos nesse gr´afico representam a fun¸c˜ao de intensidade estimada pelo modelo com mistura de quatro normais para os pontos tridimensionais compostos pelas coordenadas e logaritmo da taxa de ocupa¸c˜ao. Percebe-se uma alta intensidade nas regi˜oes sudeste e nordeste. Esses resultados n˜ao diferem muito da fun¸c˜ao de intensidade estimada para o modelo que considerava apenas as coordenadas nas dimens˜oes.

Figura 4.12: Fun¸c˜ao de intensidade estimada para o modelo com mistura de 4 normais para cada coordenada e logaritmo da taxa de ocupa¸c˜ao das unidades prisionais. Cor e ´

area dos c´ırculos representam a fun¸c˜ao de intensidade estimada.

Outra covari´avel que ser´a estudada e inclusa no modelo ´e a capacidade prisional das unidades. Com essa vari´avel ´e poss´ıvel analisar o tamanho das unidades, percebendo se h´a diferen¸ca na estrutura das unidades em regi˜oes distintas do Brasil. Assim, foi proposto tamb´em um modelo com mistura de normais em que as dimens˜oes s˜ao compostas pelas coordenadas e o logaritmo da capacidade prisional das unidades do Brasil.

Para esse ajuste, as distribui¸c˜oes a priori permanecem as mesmas descritas nas Equa¸c˜oes de4.20a4.24. Uma cadeia com 50.000 itera¸c˜oes foi gerada e a convergˆencia foi alcan¸cada ap´os um per´ıodo de aquecimento de 12.000. Para tratar a autocorrela¸c˜ao dos valores da cadeia, um espa¸camento de tamanho 30 foi tomado e a amostra final de cada parˆametro

foi composta por 1.267 valores.

A Tabela 4.5 mostra os resultados dos crit´erios de compara¸c˜ao de modelos para o ajuste dos modelos para esse caso, novamente considerando diversos valores para o n´umero k de componentes da mistura.

Tabela 4.5: Crit´erios de compara¸c˜ao para os modelos com mistura de normais conside- rando coordenadas e logaritmo da capacidade prisional na dimens˜ao.

Crit´erios k = 2 k = 3 k = 4 k = 5 k = 6

DIC 8963,047 7796,827 7490,150 6039,056 6894,625 BIC 8995,631 7800,168 7657,984 6146,365 7205,871 AIC 8890,861 7643,013 7448,444 5884,441 6891,561

Segundo os crit´erios de compara¸c˜ao de modelos, aquele que melhor ajusta o conjunto de dados ´e o que tem uma mistura de cinco normais. Sendo assim, s˜ao apresentados os resultados das amostras a posteriori para os parˆametros referentes a esse modelo.

A Tabela 4.5 mostra as modas e os intervalos de credibilidade de 95% a posteriori para as amostras dos parˆametros do modelo proposto com a inclus˜ao do logaritmo da capacidade prisional. Para a maioria dos parˆametros, seus intervalos de credibilidade mostram-se com amplitude pequena indicando uma maior precis˜ao na estima¸c˜ao desses parˆametros. Constata-se que o conglomerado 1 possui a maior estimativa para a m´edia da terceira coordenada da localiza¸c˜ao dos pontos (relativa ao logaritmo da capacidade prisional – 6,723) ´e aquele que cobre a maioria das unidades do estado de S˜ao Paulo. Por outro lado, a menor estimativa para tal m´edia (3,949) ´e correspondente ao conglomerado 2 que representa as unidades da maioria dos estados do nordeste.

A Figura 4.13 (a) marca os conglomerados de pontos identificados no modelo com a inclus˜ao do logaritmo da capacidade e a Figura 4.13 (b) mostra as distribui¸c˜oes do logaritmo da capacidade para cada conglomerado identificado. Em ambas as figuras, as cores de cada conglomerado est˜ao de acordo. Ao acrescentar o logaritmo da capacidade prisional nas dimens˜oes das normais da mistura, marcas da pol´ıtica carcer´aria dos estados aparecem, como ´e o caso do estado de S˜ao Paulo que representa em sua maioria unidades maiores. O conglomerado formado no nordeste possui a menor mediana para o logaritmo

da capacidade prisional contendo tamb´em as menores unidades. De modo geral, os conglomerados formados nas regi˜oes sudeste e sul s˜ao os que possuem as maiores unidades.

Tabela 4.6: Moda e intervalo de credibilidade de 95% a posteriori para os parˆametros do modelo com mistura de 4 normais com dimens˜oes compostas pelas coordenadas e logaritmo da taxa de ocupa¸c˜ao das unidades prisionais no Brasil.

Parˆametros Moda 95% Parˆametros Moda 95%

λ0 2815,789 (2564,049; 3146,029) σ1,332 0,095 (0,071; 0,134) w1 0,114 (0,080; 0,172) σ2,112 7,984 (5,948; 11,514) w2 0,227 (0,186; 0,279) σ2,122 -5,596 (-8,809; -3,396) w3 0,034 (0,024; 0,046) σ2,132 2,051 (1,148; 3,059) w4 0,251 (0,198; 0,314) σ2,222 7,552 (5,362; 11,547) w5 0,363 (0,298; 0,434) σ2,232 -1,667 (-2,815; -0,743) µ1,1 -44,214 (-45,957; -42,292) σ2,332 1,810 (1,450; 2,307) µ1,2 -23,762 (-24,451; -23,286) σ3,112 1,381 (0,822; 2,166) µ1,3 6,723 (6,583; 6,835) σ3,122 0,404 (-0,232; 1,358) µ2,1 -36,631 (-37,205; -35,865) σ3,132 0,381 (-0,052; 0,716) µ2,2 -6,447 (-7,183; -5,730) σ3,222 2,336 (0,544; 6,083) µ2,3 3,949 (3,736; 4,200) σ3,232 -0,264 (-1,382; 0,251) µ3,1 -49,065 (-49,437; -48,783) σ3,332 1,070 (0,371; 1,510) µ3,2 -16,603 (-17,057; -16,058) σ4,112 170,922 (99,240; 271,353) µ3,3 4,360 (3,930; 4,613) σ4,122 111,282 (63,886; 206,871) µ4,1 -53,700 (-57,130; -49,372) σ4,132 3,581 (-0,658; 9,266) µ4,2 -11,056 (-13,927; -5,790) σ4,222 140,000 (96,367; 240,448) µ4,3 4,443 (4,235; 4,650) σ4,232 5,086 (1,117; 10,624) µ5,1 -44,804 (-46,012; -43,480) σ4,332 1,196 (0,954; 1,635) µ5,2 -23,541 (-24,672; -22,374) σ5,112 48,009 (32,985; 69,988) µ5,3 5,277 (5,153; 5,449) σ5,122 33,974 (21,046; 50,944) σ2 1,11 15,543 (10,255; 23,594) σ5,132 0,864 (-0,290; 2,003) σ2 1,12 -4,278 (-6,828; -2,798) σ5,222 36,036 (26,147; 50,587) σ2 1,13 -0,256 (-0,680; 0,180) σ5,232 0,500 (-0,356 ; 1,334) σ2 1,22 1,730 (1,196; 2,670) σ5,332 0,974 (0,847; 1,140) σ2 1,23 0,076 (-0,062; 0,205)

(a) 1 2 3 4 5 2 3 4 5 6 7 8 (b)

Figura 4.13: Localiza¸c˜oes das unidades prisionais com cores representando cada conglo- merado de pontos para o modelo com coordenadas e logaritmo da capacidade prisional (a). Box-plot do logaritmo da capacidade prisional de acordo com os conglomerados de pontos (b).

Figura 4.14: Fun¸c˜ao de intensidade estimada para o modelo com mistura de 5 normais para cada coordenada e logaritmo da capacidade prisional das unidades prisionais. Cor e ´area dos c´ırculos representam a fun¸c˜ao de intensidade estimada.

A Figura 4.14 mostra a fun¸c˜ao de intensidade estimada para o modelo em quest˜ao. H´a uma intensidade maior e mais marcada nos estados de S˜ao Paulo e Goi´as e em grande parte dos estados do nordeste.

Documentos relacionados