• Nenhum resultado encontrado

AnaliseCriminal_Mod3

N/A
N/A
Protected

Academic year: 2021

Share "AnaliseCriminal_Mod3"

Copied!
32
0
0

Texto

(1)

Análise Criminal

Análise Criminal

(2)

Módulo 3 – Análise estatística crimi Módulo 3 – Análise estatística crimi nalnal

Neste módulo, você estudará os conceitos básicos relacionados ao estudo da estatística para Neste módulo, você estudará os conceitos básicos relacionados ao estudo da estatística para compreender melhor as técnicas utilizadas na análise estatística criminal.

compreender melhor as técnicas utilizadas na análise estatística criminal.  Ao

 Ao fifi nal nal do do mómódudulolo, vo, você dcê devereverá ser á ser capcapaz de:az de: - Definir os

- Definir os principaprincipais conceitos relacionados à estatística;is conceitos relacionados à estatística; - Correlacionar as séries estatísticas aos fatores básicos que

- Correlacionar as séries estatísticas aos fatores básicos que a estruturam;a estruturam;

- Descrever as formas pelas quais as informações podem ser apresentadas estatisticamente; - Descrever as formas pelas quais as informações podem ser apresentadas estatisticamente; - Identificar as t

- Identificar as técnicas utilizécnicas utilizadas na estatística descritiva; eadas na estatística descritiva; e - Definir análise de regressão.

- Definir análise de regressão.

O conteúdo deste módulo está dividido em cinco aulas: O conteúdo deste módulo está dividido em cinco aulas:  Au

 Aula 1la 1 – Conceitos bási – Conceitos básicoscos  Au

 Aula 2la 2 – Séries estatística – Séries estatísticass  Au

 Aula 3 –la 3 – Apresentação dos dadosApresentação dos dados  Au

 Aula 4la 4 – Estatística descriti – Estatística descritivava  Au

 Aula 5la 5 – Análise de regressão – Análise de regressão  Au

 Aula 1 - Cola 1 - Concnceiteitos os básbásicicosos O termo

O termo estatísticaestatística  surgiu da expressão em  surgiu da expressão em latimlatim –  – statisticum statisticum collegium collegium – – que que significasignifica palestra sobre os assuntos do Estado. No século XVII, o termo Statistik foi utilizado designando palestra sobre os assuntos do Estado. No século XVII, o termo Statistik foi utilizado designando a análise da dados sobre o Estado. Entretanto, somente no início do século XIX o termo a análise da dados sobre o Estado. Entretanto, somente no início do século XIX o termo adquiriu o significado de coleta e classificação de dados, que persiste até hoje. A análise adquiriu o significado de coleta e classificação de dados, que persiste até hoje. A análise estatística criminal consiste na aplicação da análise estatística aos dados de criminalidade e estatística criminal consiste na aplicação da análise estatística aos dados de criminalidade e segurança pública.

segurança pública.

Clique nos termos abaixo para compreender melhor alguns conceitos básicos utilizados em Clique nos termos abaixo para compreender melhor alguns conceitos básicos utilizados em estatística.

estatística. - População

- População: É um conjunto de indivíduos ou objetos que apresentam pelo menos uma: É um conjunto de indivíduos ou objetos que apresentam pelo menos uma característica em comum.

(3)

Módulo 3 – Análise estatística crimi Módulo 3 – Análise estatística crimi nalnal

Neste módulo, você estudará os conceitos básicos relacionados ao estudo da estatística para Neste módulo, você estudará os conceitos básicos relacionados ao estudo da estatística para compreender melhor as técnicas utilizadas na análise estatística criminal.

compreender melhor as técnicas utilizadas na análise estatística criminal.  Ao

 Ao fifi nal nal do do mómódudulolo, vo, você dcê devereverá ser á ser capcapaz de:az de: - Definir os

- Definir os principaprincipais conceitos relacionados à estatística;is conceitos relacionados à estatística; - Correlacionar as séries estatísticas aos fatores básicos que

- Correlacionar as séries estatísticas aos fatores básicos que a estruturam;a estruturam;

- Descrever as formas pelas quais as informações podem ser apresentadas estatisticamente; - Descrever as formas pelas quais as informações podem ser apresentadas estatisticamente; - Identificar as t

- Identificar as técnicas utilizécnicas utilizadas na estatística descritiva; eadas na estatística descritiva; e - Definir análise de regressão.

- Definir análise de regressão.

O conteúdo deste módulo está dividido em cinco aulas: O conteúdo deste módulo está dividido em cinco aulas:  Au

 Aula 1la 1 – Conceitos bási – Conceitos básicoscos  Au

 Aula 2la 2 – Séries estatística – Séries estatísticass  Au

 Aula 3 –la 3 – Apresentação dos dadosApresentação dos dados  Au

 Aula 4la 4 – Estatística descriti – Estatística descritivava  Au

 Aula 5la 5 – Análise de regressão – Análise de regressão  Au

 Aula 1 - Cola 1 - Concnceiteitos os básbásicicosos O termo

O termo estatísticaestatística  surgiu da expressão em  surgiu da expressão em latimlatim –  – statisticum statisticum collegium collegium – – que que significasignifica palestra sobre os assuntos do Estado. No século XVII, o termo Statistik foi utilizado designando palestra sobre os assuntos do Estado. No século XVII, o termo Statistik foi utilizado designando a análise da dados sobre o Estado. Entretanto, somente no início do século XIX o termo a análise da dados sobre o Estado. Entretanto, somente no início do século XIX o termo adquiriu o significado de coleta e classificação de dados, que persiste até hoje. A análise adquiriu o significado de coleta e classificação de dados, que persiste até hoje. A análise estatística criminal consiste na aplicação da análise estatística aos dados de criminalidade e estatística criminal consiste na aplicação da análise estatística aos dados de criminalidade e segurança pública.

segurança pública.

Clique nos termos abaixo para compreender melhor alguns conceitos básicos utilizados em Clique nos termos abaixo para compreender melhor alguns conceitos básicos utilizados em estatística.

estatística. - População

- População: É um conjunto de indivíduos ou objetos que apresentam pelo menos uma: É um conjunto de indivíduos ou objetos que apresentam pelo menos uma característica em comum.

(4)

- Amostra

- Amostra: É uma coleção de dados relativos a uma parte da população que a representa. É: É uma coleção de dados relativos a uma parte da população que a representa. É usada, na maioria das vezes, por causa da impossibilidade e dos custos de coletar informações usada, na maioria das vezes, por causa da impossibilidade e dos custos de coletar informações de todos os elementos da população.

de todos os elementos da população. - Variáveis

- Variáveis: São objetos que servem para guardar informações e permitem dar nomes a cada: São objetos que servem para guardar informações e permitem dar nomes a cada uma das partes da informação que se quer guardar. Por exemplo, tratando-se de vitimização uma das partes da informação que se quer guardar. Por exemplo, tratando-se de vitimização dos indivíduos, há como variáveis distintas: quantos crimes o indivíduo sofreu, sua dos indivíduos, há como variáveis distintas: quantos crimes o indivíduo sofreu, sua escolaridade, seu gênero, sua idade, etc.

escolaridade, seu gênero, sua idade, etc.

- Fluxo de execução da análise estatística

- Fluxo de execução da análise estatística: O trabalho de análise estatística resulta da: O trabalho de análise estatística resulta da execução de quatro etapas dispostas conforme o diagrama abaixo: coleta, crítica, execução de quatro etapas dispostas conforme o diagrama abaixo: coleta, crítica, apresentação e análise dos dados.

apresentação e análise dos dados.

A execução do fluxo da análise estatística envolve sempre a possibilidade de se ter que A execução do fluxo da análise estatística envolve sempre a possibilidade de se ter que retornar à primeira etapa da pesquisa referente à coleta de dados. Tanto uma crítica dos dados retornar à primeira etapa da pesquisa referente à coleta de dados. Tanto uma crítica dos dados pode mostrar que a etapa de coleta não foi bem planejada ou executada, quanto às etapas de pode mostrar que a etapa de coleta não foi bem planejada ou executada, quanto às etapas de apresentação e análise dos dados podem evidenciar que os dados coletados são insuficientes apresentação e análise dos dados podem evidenciar que os dados coletados são insuficientes para garantir uma boa compreensão do fenômeno estudado.

para garantir uma boa compreensão do fenômeno estudado. Figura 6: Fluxo da execução da análise estatística

Figura 6: Fluxo da execução da análise estatística

Coleta de Dados

Coleta de Dados   – Após a definição do problema a ser estudado e o estabelecimento do  – Após a definição do problema a ser estudado e o estabelecimento do projeto de pesquisa (objetivo, a forma pela qual os dados serão coletados, cronograma das projeto de pesquisa (objetivo, a forma pela qual os dados serão coletados, cronograma das

Coleta de Coleta de dados dados Crítica de Crítica de dados dados  Ap

 Apresresentent açãoação de dados de dados Elaboração Elaboração dde e m am a aass Elaboração Elaboração de ráficos de ráficos Elaboração Elaboração de tabelas

de tabelas  An Análiáli sese

Elaboração do próprio conteudista. Elaboração do próprio conteudista.

(5)

atividades, custos envolvidos, exame das informações disponíveis e delineamento da amostra), o passo seguinte é a coleta de dados, que consiste na busca ou compilação das informações em variáveis, componentes do fenômeno a ser estudado.

Crítica dos dados  – A revisão crítica dos dados procede com a finalidade de identificar e suprimir os valores estranhos ao levantamento, os quais são capazes de provocar futuros enganos. Esses valores podem ocorrer, principalmente, por problemas de preenchimento ou digitação dos questionários.

 Apresentação dos dados  – Convém que sejam organizados em conjunto de dados de forma prática e racional, para facilitar sua apresentação no formato de tabelas, gráficos ou mapas. A execução dessa etapa ocorre de forma interligada à próxima etapa referente à análise dos dados, pois com o desenvolvimento da análise é possível descobrir outras tabelas, gráficos ou mapas que sejam necessários para uma melhor compreensão do fenômeno estudado.

 Análise – Análise das informações produzidas a partir da leitura das tabelas, gráficos e mapas, sistematizando as conclusões em um relatório.

Elaboração de tabelas / Elaboração de gráficos / Elaboração de mapas - Estatística descritiva: São técnicas analíticas utilizadas para resumir e apresentar os dados de uma pesquisa, visando descrevê-la.

Estatística Descritiva: são técnicas analíticas utilizadas para resumir e apresentar os dados de uma pesquisa, visando descrevê-la.

A execução desse fluxo da análise estatística envolve sempre a possibilidade de se ter que retornar à primeira etapa da pesquisa referente à coleta de dados. Tanto uma crítica dos dados pode mostrar que a etapa de coleta não foi bem planejada ou executada, quanto às etapas de apresentação e análise dos dados podem evidenciar que os dados coletados são insuficientes para garantir uma boa compreensão do fenômeno estudado.

 Aula 2 - Séries estatísticas

Uma série estatística constitui uma coleção de dados estatísticos referidos a uma mesma ordem de classificação, ou seja, uma seqüência de números que se refere a uma certa variável. Três fatores básicos estruturam a construção de séries estatísticas:

(6)

- Época – Fator temporal ou cronológico a que se refere o fenômeno analisado; - Local – Fator espacial ou geográfico onde o fenômeno acontece; e

- Fenômeno – Espécie do fator que é descrito.

Esses fatores levam a existência de quatro tipos distintos de séries estatísticas: série temporal, série geográfica e série específica.

Síntese dos t ipos de séries estatísticas

SITUAÇÃO TEMPORAL GEOGRÁFICA ESPECÍFICA

Parte variável Época Local Fenômeno

Parte fixa Local e fenômeno Época e fenômeno Época e local

Série temporal

 A série temporal   (cronológica, histórica, evolutiva ou marcha) é identificada pelo caráter variável do fator cronológico.

Tabela 2 – Existência de plantão 24 horas nas DEAMs (Brasil-2003/2005)

Fonte: MJ/SENASP

Elaboração do próprio conteudista.

Existência de plantão 24 horas

2003 2004 2005

N. Abs. % N. Abs . % N. Abs . %

SIM 61 21,11 54 20,22 41 18,39

NÃO 228 78,89 213 79,78 182 81,61

(7)

Série geográfica

 A série geográfi ca  (territoriais, espaciais ou de localização) é identificada pelo caráter variável do fator loc al.

Tabela 3 – Distribuição das vítimas de homicídio doloso e taxa de vítimas por 100 mil habitantes entre as unidades da federação (Brasil – 2006) - Fonte: MS/SVS.

Vítimas Taxas Vítimas / 100mil hab.  Acre 152 22,1  Alagoas 1.592 52,2  Amapá 191 31,0  Amazonas 689 20,8 Bahia 3.138 22,5 Ceara 1.677 20,4 Distrito Federal 646 27,1 Espírito Santo 1.699 49,0 Goiás 1.298 22,6 Maranhão 771 12,5 Mato Grosso 739 25,9

Mato Grosso do Sul 658 28,6

Minas Gerais 3.594 18,5 Para 1.945 27,4 Paraíba 807 22,3 Paraná 2.897 27,9 Pernambuco 4.215 49,6 Piauí 402 13,2 Rio de Janeiro 5.992 38,5

Rio Grande do Norte 405 13,3 Rio Grande do Sul 1.972 18,0

Rondônia 445 28,5 Roraima 64 15,9 Santa Catarina 649 10,9 São Paulo 7.274 17,7 Sergipe 560 28,0 Tocantins 192 14,4 Homicídios Dolosos Unidades da Federação

Tabela 3 – Distribuição das vítimas de homicídio doloso e taxa de vítimas por 100 mil habitantes entre as unidades da federação (Brasil – 2006) - Fonte: MS/SVS.

(8)

Série específica

 A série específica  (categórica ou por categoria) é identificada pelo caráter variável do fator fenômeno.

Indicadores criminais Número de

ocorrências Taxa por 100mil hab. (1) Crimes violentos letais e intencionais 40.974 23,6

Crimes violentos não-letais contra

pessoa 61.232 35,2

Crimes violentos contra o patrimônio 903.773 519,6

Delitos envolvendo drogas 87.170 50,1

Delitos de trânsito 320.265 184,1

Homicídios dolosos 38.180 22,0

Tentativas de homicídio 36.080 20,7

Lesões corporais 696.774 400,6

Estupros 14.557 16,5

Atentados violentos ao pudor 10.355 7,8

Extorsões mediante seqüestro 475 0,4

Roubos 903.298 519,4

Furtos 2.022.896 1.163,1

 Aula 3 – Apresentação dos dados

Uma vez que os dados foram coletados, deve-se ter atenção ao examiná-los, pois, muitas vezes, o conjunto de valores é extenso e desorganizado e há risco de se perder a visão global do fenômeno analisado. Para que isso não ocorra, é interessante reunir os valores em tabelas, gráficos ou mapas, facilitando sua compreensão.

Tabela 4 – Ocorrências registradas pelas polícias civis por número e taxas por 100 mil habitantes (Brasil – 2005) - Fonte: MJ/SENASP.

(9)

Um dos objetivos da construção de tabelas é sistematizar os valores que uma ou mais variáveis podem assumir , para que tenhamos uma visão gl obal da sua variação .

 A tabela é uma maneira de apresentar resumidamente um conjunto de dados.

Construção de tabelas

Tabela 5 – Unidades operacionais do s corpos de bombeiros militares (Brasil - 2004) Título da tabela - Conjunto de informações, as mais completas possíveis, respondendo às perguntas: O quê? Quando? e Onde? – localizado no topo da tabela, além de contar a palavra “TABELA” e sua respectiva numeração.

Corpo da tabela - É o conjunto de linhas e colunas que contêm informações sobre a variável em estudo. A substituição de uma informação da tabela pode ser feita pelos seguintes sinais: (...) informação é coletada, mas não está disponível; (–) informação não coletada e (?) quando há dúvida da validade da informação.

Tipos de unidades operacionais do s

corpos de bombeiros Número de unidadesoperacionais

N.Abs (%)

Batalhões e grupamentos 190 17,6

Companhias e subgrupamentos 279 25,8

Centros executores de atividades

operacionais 361 33,4

Destacamentos com sede própria e

pelotões independentes 252 23,3

Total de unidades operacionais 1082 100,0

Fonte: MJ/SENASP. Rodapé

(10)

a) Fonte: Identifica o responsável (pessoa física ou jurídica) pela sistematização dos dados numéricos;

b) Notas: É o texto que irá esclarecer de forma geral ou específica algum conteúdo da tabela; e c) Chamadas: Símbolo remissivo atribuído a algum elemento de uma tabela que necessita de uma nota específica.

Construção de gráficos

A construção de gráficos atende as mesmas finalidades da construção das tabelas – representar os resultados de forma simples, clara e verdadeira, demonstrar a evolução do fenômeno em estudo e observar a relação dos valores analisados. A disposição dos elementos é idêntica a das tabelas.

- Título do g ráfico

Conjunto de informações, as mais completas possíveis, respondendo às perguntas: O quê? Quando? e Onde? – localizado no topo do gráfico, além de contar a palavra “GRÁFICO” e sua respectiva numeração.

- Corpo do gr áfico

É a representação gráfica da análise efetuada. - Rodapé

Elementos complementares do gráfico:

a) Fonte: Identifica o responsável (pessoa física ou jurídica) pela sistematização dos dados numéricos;

b) Notas: É o texto que irá esclarecer de forma geral ou específica algum conteúdo do gráfico; e

c) Chamadas: Símbolo remissivo atribuído a algum elemento do gráfico que necessita de uma nota específica.

(11)

Gráficos em colunas

Conjunto de retângulos dispostos verticalmente, separados por um espaço.

Gráfico 2 – Percentual dos custos da violência e criminalidade em relação ao PIB Municipal (São Paulo – 1999, Rio de Janeiro – 1995 e Belo Horizonte – 1999)

0 1 2 3 4 5 6

São Paulo Rio de Janeiro Belo Horizonte

Municípios    P  e   r   c   e   n    t  u  a    l    d  o    P    I    B    M  u   n    i  c    i  p  a    l

(12)

Gráficos de Barras

Conjunto de retângulos dispostos horizontalmente, separados por um espaço.

Gráfico 3 – Percentual da população que considera que a polícia faz um bom trabalho (34 países – 2002)

Gráficos em setores

(13)

Representação através de um círculo, por meio de setores, sendo muito utilizado quando se quer comparar cada valor de uma série com o seu total (proporção).

Gráfico 4 – Percentual dos IMLs que possuem verba própria e percentual dos IMLs conforme cobertura das despesas de manutenção pelas verbas próprias (Brasil -  2003)

Fonte: MJ/SENASP.

Gráficos em de linhas ou curvas

Utilizado principalmente para representar séries temporais.

Gráfico 5 – Taxa de homicídios por 100 mil habitantes (Brasil – 1980/2005)

   1    0    1    2    1    4    1    6    1    8    2    0    2    2    2    4    2    6    2    8    3    0    t  a  x   a    h  o  m    i  c    i    d    i  o  s   p   o   r    1    0    0  m    i    l    1    9    8    0    1    9    8    3    1    9    8    6    1    9    8    9    1    9    9    1    1    9    9    5    1    9    9    8    2    0    0    0    2    0    0    3    2    0    0    5 ano Fonte: MS/SVS.  Aula 4 – Estatística descritiva

Existência de verba própria

Não ( 84%)

Sim ( 16%)

Verba própria cobre todas as despesas de manutenção

Não ( 82%)

Sim ( 18%)

(14)

Como você estudou na aula 1, a análise descritiva envolve técnicas para organizar, resumir e descrever os dados de uma pesquisa.

Para facilitar a descrição dos dados são utilizados alguns parâmetros, apresentados a seguir, de forma didática, divididos em cinco grupos:

- Parâmetros para comparação relativa; - Distribuição de freqüência;

- Medidas de tendência central; - Medidas de dispersão; e - Análise de correlação.

Parâmetros para comparação relativa Proporção

É obtida a partir do cálculo de uma parte do conjunto sobre o seu total . Considere 10 pessoas retidas em uma delegacia, das quais 4 são homens. A proporção de homens é de 4/10 = 0,4, ou seja, temos 0,4 homens por pessoa retida na delegacia. Considere que 20 ocorrências são registradas em um município, das quais 10 são homicídios dolosos. A proporção de homicídios é de 10/20 = 0,5, ou seja, 0,5 homicídios por ocorrência registrada no município.

Porcentagem

 As porcentagens são obti das a partir do cálculo das proporções , simplesmente multiplicando-se o quociente obtido por 100. A palavra porcentagem significa “por cem”. Uma vez que a soma das proporções é a igual a 1, a soma das porcentagens é igual a 100, a menos que as partes não sejam mutuamente exclusivas e exaustivas. Assim, nos exemplos de proporção, há 40% de homens entre as pessoas retidas e 50% de homicídios entre as ocorrências registradas no município.

Razão

Definida a razão de um número A em relação a um número B como “A dividido por B”, como por exemplo, a razão de policiais por viatura no Brasil é de (policiais)/(viaturas) = 618.613 / 76.074 = 8,13, ou seja, há 8,13 policiais por viatura. Resta esclarecer que a razão busca relacionar quantidades de itens diferentes, como: policiais por viatura, PIB por habitantes, recursos financeiros gastos pela polícia militar pelo total do efetivo da polícia militar, etc.

(15)

Tabela 6 – Gastos das po lícias milit ares segundo tip o de gasto  (Brasil – 2005)

Fonte: MJ/SENASP .

Cálculos da proporção, porcentagem e razão – Tabela 6 - Proporção de gastos com a folha de pagamento

Para cada real gasto pelas polícias militares, 91 centavos são referentes à folha de pagamento

- Porcentagem de gastos com a folha de pagamento:

Cerca dos 91% dos gastos das polícias militares são referentes à folha de pagamento.

Razão de gastos com folha de pagamento por gastos com aquisição de viatura.

Para cada um real gasto com aquisição de viatura são gastos R$ 69,63 com a folha de pagamento. 0,91 x 100 = 91% 5.516.952.440,11 = 69,63 79.226.268,00 Folha de pagamento Aquisição de viaturas 5.516.952.440,11 6.005.508.679,78 = 0,91 Gasto com a folha de pagamento

(16)

Tabela 7 – Efetivo das polícias ci vis, segundo a categoria profissional (Brasil – 2005) Fonte: MJ/SENASP. Categorias profissionais Polícia Civil Total do efetivo Delegado 5.479 Inspetor 9.655 Investigador e detetives 15.162 Agente 16.517 Papiloscopista 2.170 Escrivão 10.764 Carcereiro 2.145 Outros 8.988 Total 70.880 Fonte: MJ/SENASP.

Cálculos da proporção, porcentagem e razão – Tabela 7 - Proporção de investigadores e detetives:

Para cada profissional do efetivo da polícia civil, existem 0,23 investigadores e detetives. Tipo de gasto das polícias

militares Valor gast o (R$)

Folha de pagamento R$ 5.516.952.440,11 Material de consumo R$ 162.438.522,90 Aquisição de viaturas R$ 79.226.268,00 Outros R$ 246.891.448,77 Total R$ 6.005.508.679,78 15.162 70.880 = 0,23

(17)

- Porcentagem de investigadores e detetives:

Cerca dos 23% do efetivo da Polícia Civil são investigadores e detetives. Razão do efetivo de escrivães pelo efetivo de delegados:

Para cada delegado existem 1,9 escrivães.

Distribui ção de freqüências

 A distr ibuição de freqüência é o conjunto de mensurações de freqüências para os dados observados.

- Freqüência absoluta: É o número de vezes que o valor de uma determinada variável é observado.

- Freqüência absolut a acumulada: É a soma das freqüências absolutas dos valores inferiores ou iguais ao valor dado.

- Freqüência relativa: É a razão da freqüência absoluta pelo número total de observações. - Freqüência relativa acumulada: É a soma das freqüências relativas dos valores inferiores ou iguais ao valor dado.

- Distribuição de freqüência: É uma forma de apresentar as freqüências. São apresentadas as variáveis seguidas de suas freqüências absolutas.

Exemplo - Número de homicídios oc orridos em 16 cidades distint as

Tabela 8 – Distribuição de freqüência dos homicídios Elaboração do próprio conteudista.

10.764 5.479

= 1,9 0,23 x 100 = 23%

(18)

Cidade 1 3 Cidade 9 5 Cidade 2 9 Cidade 10 6 Cidade 3 0 Cidade 11 8 Cidade 4 3 Cidade 12 10 Cidade 5 4 Cidade 13 12 Cidade 6 5 Cidade 14 12 Cidade 7 5 Cidade 15 14 Cidade 8 5 Cidade 16 18 Número de homicídios Freqüência absoluta Freqüência absoluta acumulada Freqüência relativa Freqüência relativa acumulada 0 1 1 0,0625 0,0625 3 2 3 0,1250 0,1875 4 1 4 0,0625 0,2500 5 4 8 0,2500 0,5000 6 1 9 0,0625 0,5625 8 1 10 0,0625 0,6250 9 1 11 0,0625 0,6875 10 1 12 0,0625 0,7500 12 2 14 0,1250 0,8750 14 1 15 0,0625 0,9375 18 1 16 0,0625 1,00 Total 16 1,00

(19)

Distribui ção de freqüências

- Freqüência absoluta: Na primeira coluna foram colocados, em ordem crescente, todos os possíveis números de homicídios ocorridos em 16 cidades. Na segunda coluna, aparecem quantas cidades sofreram aquele número de homicídios. Na tabela 8, a freqüência absoluta de 0 homicídio é um, ou seja, das 16 cidades analisadas somente uma delas teve 0 homicídio. A freqüência absoluta de 3 homicídios é dois, ou seja, duas cidades tiveram 3 homicídios. A freqüência absoluta de 4 homicídios é um, ou seja, uma cidade teve 4 homicídios, e assim por diante.

- Freqüência absoluta acumulada: Foi construída a terceira coluna da tabela 8, somando a cada linha a freqüência absoluta. Na primeira linha, a freqüência absoluta acumulada coincide com a freqüência absoluta (1). Na segunda linha soma-se a freqüência absoluta acumulada da primeira linha (1) com a freqüência absoluta da segunda linha (2), obtendo uma freqüência acumulada 3. Na terceira linha, soma-se a freqüência absoluta acumulada anterior (3) com a freqüência absoluta dessa categoria (1), sendo a freqüência acumulada igual a 4, e assim por diante.

- Freqüência relativa: A freqüência relativa é dada pela divisão da freqüência absoluta da categoria pelo número total de cidades, obtendo-se o percentual das cidades que sofreram aquele número de crimes. Para obter a freqüência relativa de 0 homicídio divide-se a freqüência absoluta dessa categoria (1) pelo total (16) – (1)/(16) = 0,0625, ou seja, 0,0625 das cidades têm 0 homicídio. Da mesma forma encontra-se que 0,125 das cidades têm 3 homicídios, 0,625 das cidades têm 4 homicídios, 0,25 das cidades têm 5 homicídios. Multiplicando a freqüência relativa por cem, encontra-se a porcentagem das cidades com determinado número de homicídios. Por exemplo: 0,0625 x 100 = 6,25, ou seja, 6,25% das cidades não sofrem homicídios.

- Freqüência relativa acumulada: É obtida de forma similar a freqüência absoluta acumulada, ou seja, somando a cada linha a freqüência relativa das categorias dos números de homicídio. Na primeira linha, a freqüência relativa acumulada coincide com a freqüência relativa. Na segunda linha ao se somar a freqüência relativa acumulada da primeira linha (0,0625) com a freqüência relativa da segunda linha (0,125), resulta na freqüência acumulada de 0,1875.

(20)

Gráficos utilizados na distribuição de freqüênciaHistograma   é um gráfico de barras  justapostas, com a área das barras proporcional à freqüência absoluta.

Exemplo: Gráfico 6 – Histograma da distribuição de homicídios por cidade

V A R 0 0 0 0 1 1 7 , 5 1 5 , 0 1 2 , 5 1 0 , 0 7 , 5 5 , 0 2 , 5 0 , 0    F  r   e   q   u   e   n   c   y 7 6 5 4 3 2 1 0 Número de Homicídios    F  r  e   q   u    ê  n   c    i  a    A    b  s   o    l  u    t  a V A R 0 0 0 0 1 1 7 , 5 1 5 , 0 1 2 , 5 1 0 , 0 7 , 5 5 , 0 2 , 5 0 , 0    F  r   e   q   u   e   n   c   y 7 6 5 4 3 2 1 0 Número de Homicídios    F  r  e   q   u    ê  n   c    i  a    A    b  s   o    l  u    t  a

Elaboração do próprio conteudista.

Gráficos utili zados na distri buição de freqüência

- Polígono de freqüência: É a representação gráfica de uma distribuição de freqüências absolutas. São gráficos de linhas que unem os pontos médios das bases superiores dos retângulos de um histograma.

- Polígono de freqüência acumulada: É a representação gráfica de uma distribuição de freqüências absolutas acumuladas. São gráficos de linhas que unem os pontos correspondentes ao limite superior da freqüência acumulada.

Gráfico 7 – Polígonos de freqüência e freqüência acumulada relativos a distribuição de homicídios por cidade

(21)

Elaboração do próprio conteudista. Medidas de tendência central

São indicadores que resumem a distribuição de um conjunto de dados e devem ser utilizados quando se pretende comparar distintos grupos de dados,   como por exemplo, comparações entre diferentes regiões ou comparações de uma mesma região em tempos distintos, dentre outras situações.

- Média: É a soma de todos os resultados dividida pelo total dos casos. - Moda: É a observação que ocorre com maior freqüência em uma amostra.

- Mediana: É o valor da variável que ocupa a posição central nos dados, ou seja, que divide a amostra ao meio.

Exemplo:  Considerando os dados hipotéticos da aula anterior, mostrados na tabela 8, as medidas de tendência central em relação à distribuição de homicídios por cidade é:

Variável Média Moda Mediana

Número de homicídio 7,4375 5 5,5 0 2 4 6 8 10 12 14 16 18 0 3 4 5 6 8 9 10 12 14 18 Número de homicídio        F      r       e       q        ü        ê      n       c        i      a Polígono de freqüência

Polígono de freqüência acumulada

(22)

Como calcular a média, a moda e a mediana

Média

Somam-se todos os homicídios ocorridos e divide-se por 16, que é o número de ci dades. Média = (0+3+3+4+5+5+5+5+6+8+9+10+12+12+14+18)/16 = 119/16 = 7,4375

Mediana: Há duas fórmulas para calcular a mediana:

- número de observação par: Mediana = (X(n/2)+ X[(n/2)+1])/2

- número de observação ímpar: Mediana = X[(n+1)/2]

Para o cálculo da mediana, o primeiro passo é a ordenação crescente das observações, como mostrado no exemplo anterior (cálculo da média). Após a ordenação das observações, identifica-se cada uma delas por um índice numérico. No exemplo citado X2 é igual a 3, ou seja,

a cidade 2, nesta seqüência de cidades em ordem crescente de número de homicídios, possui 3 homicídios. No mesmo exemplo, a mediana é calculada da seguinte forma:

Mediana = (X(n/2)+ X[(n/2)+1])/2 = (X(16/2)+ X[(16/2)+1])/2 = (X8+ X9)/2 = (5 + 6)/2 = 11/2 = 5,5

Moda: O valor que ocorreu com maior freqüência absoluta . No exemplo citado, o valor 5 ocorreu mais vezes, 4 vezes.

Outros conceitos

Para compreender melhor os cálculos das medidas apresentadas, conheça mais três

- Taxa bruta - é o estimador mais simples para o risco de ocorrência de um evento, definindo-se como a razão entre o número de eventos ocorridos na área e o número de pessoas expostas à oco rrência desse evento. O cálculo da taxa é desenvolvido quando se

precisa comparar a incidência de fenômenos entre diferentes regiões, com tamanho populacional diferente, ou uma mesma região onde a população varia com o tempo. O valor da taxa é calculado pela divisão do número de vítimas efetivas pelo tamanho da população de

(23)

risco, ou seja, pelo tamanho da população que poderia sofrer esse crime, e o valor obtido é multiplicado por 100 mil.

Quartis

São os valores que determinam uma divisão do conjunto de dados em quatro partes iguais. Decis

São os valores que determinam uma divisão do conjunto de dados em dez partes iguais. Exemplo

Veja a tabela 10 em anexo – Ocorrências de estupro registradas pelas polícias civis segundo unidade da federação (Brasil – 2005)

Diferente da maior parte das ocorrências criminais, os estupros vitimam apenas mulheres e, por essa razão, o cálculo de sua taxa tem como denominador a população feminina.

O cálculo da taxa de estupros em Rondônia é efetuado pela seguinte fórmula:

A importância do cálculo da taxa é verificada, por exemplo, quando observam que apesar da Polícia Civil de São Paulo ter registrado 3.903 vítimas de estupro, em 2005, a unidade da federação com maior incidência de estupros foi Roraima, com apenas 81 ocorrências registradas. Dado a diferença do tamanho da população dessas UFs, em São Paulo foram 18,9 vítimas para cada grupo de 100.000 mulheres e, em Roraima, 42,4 vítimas para cada grupo de 100.000 mulheres.

Cálculos

Para se determinar a taxa de uma região geográfica (que reúne várias UFs) não deve-se calcular a média das taxas das UFs, pois esse cálculo não leva em consideração o tamanho da população de cada UF dentro da região geográfica. O correto é somar as vítimas de todas as UFs, a população de todas as UFs e realizar o cálculo da taxa média da região geográfica.

número de estu ro ocorridos em Rondônia x 100.000 = (população feminina em Rondônia)

224 x (100.000) = 30,03 745.802

(24)

Veja a seguir a diferença gerada a partir desses dois tipos de cálculo. BRASIL, REGIÕES E UNIDADES DA FEDERAÇÃO POPULAÇÃO FEMININA TOTAL DE OCORRÊNCIAS DE ESTUPRO TAXA POR 100.000 MULHERES Região Sudeste 40.064.296 6.419 16,02 Minas Gerais 9.721.532 1.047 10,77 Espírito Santo 1.719.969 140 8,14 Rio de Janeiro 8.001.992 1.329 16,61 São Paulo 20.620.803 3.903 18,93

Taxa da Região Sudeste:

Média das taxas das UFs da Região Sudeste:

Cálculos

Moda: A amostra de taxa de estupro não apresenta moda, dado que as taxas de estupro entre as 27 unidades da federação não têm valores repetidos.

Mediana: Como a informação de 1 das UFs não está disponível, para o cálculo da mediana devem ser consideradas apenas 26 UFs (número par de observações). Assim, a mediana será calculada através da fórmula:

onde X é a taxa de estupro em cada UF e n é o numero de UFs

Mediana = (X(n/2)+X[(n/2)+1])/2 = (X(26/2)+X[(26/2)+1])/2 = (X13+X14)/2 = (18,8+18,93)/2 = 18,865

Identificação dos quartis

A identificação dos quartis pode ser exemplificada da seguinte forma 40.064.296 6.419 x 100.000 = 16 02 10,77 + 8,14 + 16,61 + 18,93 = 54,45 = 13,61 4 4 (X(n/2)+ X[(n/2)+1]) 2

(25)

Figura 7: Identificação dos quartis para a distribuição de estupros entre as unidades da federação (Brasil / 2005) - Fonte: MJ/SENASP e IBGE.

Brasil/2005A Secretaria Estadual de Segurança Pública do Paraná não encaminhou informações sobre as ocorrências de estupros no ano de 2005 para a SENASP. Portanto, essa unidade da Federação não foi considerada nos cálculos.

Medidas de dispersão

É um conj unto de medidas que descrevem a variabilidade de um conjunto de dados e permite verificar como os dados estão distr ibuídos em torn o da tendência central. São m edidas de dispersão: amplitude, variância e desvio p adrão.

Para que você entenda melhor os cálculos das medidas de dispersão, volte aos dados hipotéticos da tabela 8.

- Amplit ude: É a diferença entre o maior e o menor valor dos dados analisados . Se os

dados são categóricos, a amplitude é a diferença entre o limite superior da última categoria e o limite inferior da primeira categoria.

Q1 Q2 Q3 4,94 6,27 7,32 8,14 8,89 10,52 10,77 11,27 11,44 11,74 16,61 16,91 18,8 18, 93 19,12 20,27 20,77 22,89 25,38 27,08 27,53 30,03 32,2 32,96 36,81 42,4

(26)

Como calcular a Amplitude

Para calcular a amplitude subtrai-se o número de homicídios da cidade 16 (18), que é o maior , do número de homicídios da cidade 3 (0), que é o menor .

Amplitude = 18 – 0 = 18 Medidas de dispersão

- Variância: É a medida do grau de dispersão dos dados em torno da média . Mostra o quanto agrupado ou disperso estão os dados . A variância é representada por s2.

Como calcular a variância

Para o cálculo da variância na amostra, primeiramente, subtrai-se o número de homicídios em cada cidade (Xi) da média da amostra ( X ) e eleva-se esse valor a segunda potência. Média =

s²=[2.(3-7,4375)]²+(9-7,4375)²+(0-7,4375)²+(4-7,4375)²+[4.(5-7,4375)]²+(6-7,4375)²+(8-7,4375)²+(10-7,4375)²+[2(12-7,4375)]²+(14-7,4375)²+(18-7,4375)²=

119/16 = 7,4375

s²=39,3828+2,4414+5,3164+11,8164+23,7656+2,0664+0,3164+6,5664+41,6328+43,0664+111 ,5664=

Em seguida, somam-se as diferenças e divide-se o resultado pelo número de observação da amostra menos um (n-1). Novamente, Xi representa o número de homicídios que ocorreram na

cidade i. Logo: Variância = ) 1 ( ) ( ... ) ( ) ( 1 2 2 2 2 2 − − + + − + − = n  X   X   X   X   X   X  s n

Média: É a soma de todos os resultados dividida pelo total dos casos. Medidas de dispersão

- Desvio Padrão: É obtido através da raiz quadrada da variância . Sua representação é realizada por σ.

= 337,9374 s² = 337,9374

16-1 15

(27)

Como calcular o desvio padrão

Após descobrir o valor da variância, calcula-se a sua raiz quadrada, esse resultado, é o valor do desvio padrão. 74649 , 4 52971 , 22 2 = = = s s

Todos os pacotes estatísticos, incluindo o Excel, fazem o cálculo da variância como do desvio padrão desse valor automaticamente.

Tabela 11 – Medidas de dispersão

Variável Amplitude Variância (σ ) Desvio padrão (σ)

Número de homicídio 18 22,52917 4,74649

Elaboração do próprio conteudista.

Exemplo prático d e uso das medidas de dispersão

Após o diagnóstico da situação de um estado, identifica-se que duas (2) regiões se destacam pelas altas taxas de incidência de homicídios.

Comparando as medidas de dispersão das taxas municipais de homicídios para essas duas regiões, descobre-se que em uma delas os valores estão mais dispersos do que na outra região. Isto significa que na região onde os valores estão menos dispersos o problema da alta incidência de homicídios está distribuído de forma ampla, atingindo grande parte dos muni cípios da região.

Na região onde os valores estão mais dispersos ocorre o contrário: a incidência de homicídios está concentrada em alguns poucos municípios e um outro conjunto signif icativo de municípios tem incid ência baixa de homicídios .

Nesse caso, identificar o grau de dispersão dos dados informará se é pr eciso planejar a ação tendo como foco todos os municípios da região ou apenas alguns que têm a

(28)

Coefici ente de c orrelação

 A análise de correlação tem como objetivo medir a intensidade ou grau de associação linear entre duas variáveis , sem, no entanto, determinar a relação funcional entre elas, ou seja, que uma variável é responsável pela alteração na outra .

 A análise é realizada através da interpretação do coeficiente de corr elação , permitindo identificar se um fator está associado a outro: se o desemprego está associado à incidência criminal, se o aumento do número de policiais está associado a uma redução da incidência de crimes e se o aumento do salário dos policiais está associado a uma melhora na eficiência dos órgãos de segurança pública, dentre outras relações.

Pelo coeficiente de correlação, é possível saber se o desemprego está associado ao aumento da criminalidade, mas não é possível saber se é o desemprego que causa o aumento do cri me ou se é o aumento do crime que leva ao aumento no desemprego. Coeficiente de correlação

Mede a intensidade de associação linear entre duas variáveis. Por exemplo, a associação entre número de homicídio e número de armas de fogo.  Seu cálculo é realizado com base na variância da amostra, através da seguinte fórmula:

r = sxy / (sxsy) 1 ) ( ) ( − − − =

n Y  Y   X   X  s xy i i

Onde: sx é o desvio padrão da variável X, no exemplo, número de homicídio. sy é o desvio padrão da variável Y, no exemplo, número de armas de fogo.

A interpretação do coeficiente de correlação não permite fazer inferências (deduções). Considerando o exemplo da arma de fogo e do homicídio, suponha que o coeficiente de correlação seja 0,6, portanto positivo. Pode-se afirmar que as duas variáveis se correlacionam positivamente, mas não pode prever o número de homicídio com base no número de arma de fogo. Para se constatar a relação funcional entre as duas variáveis e fazer a inferência, é necessário a análise de regressão, apresentada na subseção seguinte.

(29)

A interpretação desse coeficiente é simples. Considerando que r é sempre um valor entre -1 e +1, temos:

- Se r = 0, não existe correlação;

- Quanto mais próximo de -1 ou de +1, mais forte é a correlação;

- Se r < 0 existe uma correlação negativa, ou seja, quando uma variável cresce a outra decresce. No exemplo, quando o número de arma de fogo decresce, o número de homicídio cresce; e

- Se r > 0 existe uma correlação positiva, ou seja, quando uma variável cresce a outra também cresce. No exemplo, quando o número de arma de fogo cresce, o número de homicídio cresce. Os pacotes estatísticos calculam o coeficiente de correlação automaticamente.

 Aula 5 – Análise de regressão

 A análise de regressão procura determinar a relação funcional entre duas ou mais variáveis. O termo regressão foi introduzido pela primeira vez em 1886, por Francis Galton, no estudo da relação entre as alturas de pais e filhos. Hoje, os modelos de regressão são amplamente utilizados em várias áreas do conhecimento, inclusive na análise criminal.

O principal objetivo da análise de regressão é modelar o relacionamento entre uma variável  (chamada de dependente) e outras variáveis  (chamadas explicativas). Em outras palavras, procura determinar em que medida as variáveis explicativas se r elacionam c om a variável dependente. Para isso, estima-se o valor médio da variável dependente, a partir dos valor es das variáveis explicativas. Veja o exemplo.

No exemplo apresentado no cálculo do coeficiente de correlação (associação entre número de homicídio e número de armas de fogo), não há interesse em saber somente a correlação entre a arma de fogo e o homicídio, quer se saber em que medida um aumento ou diminuição no número de armas de fogo implica no aumento ou diminuição de homicídios.

Para isso, estima-se uma regressão linear considerando como variável dependente o número de homicídio e, como variável explicativa, o número de arma de fogo. Essa estimativa fornece uma equação, através da qual, é possível inferir o número médio de homicídio de acordo com o número de arma de fogo. Entretanto, como a regressão estima uma relação estatística, ela está

(30)

sempre sujeita a um erro. Toda a análise de regressão se baseia na correção desse erro estatístico através de diversos métodos que variam de acordo com o tipo e distribuição dos dados.

Para realizar a análise de regressão é necessário um conhecimento avançado em estatística e em álgebra, fugindo do escopo desse curso. O conhecimento necessário para a realização de uma análise de regressão é conteúdo suficiente para a realização de um curso especifico sobre o tema.

Para os interessados em aprofundar no assunto, dois manuais bastante conhecidos na área são indicados: Wooldridge (Wooldridge, J.M. Introdução  à Econometria: uma abordagem moderna, São Paulo: Pioneira Thomson Learning, 2006) e Gujarati (Gujarati, D. Econometria Básica. São Paulo, Makron, 3ª edição, 2000).

Neste módulo são apresentados exercícios de fixação para auxiliar a compreensão do conteúdo.

O objetivo destes exercícios é complementar as informações apresentadas nas páginas anteriores.

1. Uma série estatística constitui uma coleção de dados estatísticos referidos a uma mesma ordem de classificação. Quando o fator básico que estrutura a construção de séries estatísticas é o fator descrito, po demos dizer que esta série é:

( ) Uma série temporal. ( ) Uma série geográfica. ( ) Uma série específica. ( ) Uma série bipartida. ( ) Uma série espacial.

(31)

2. Uma vez que os dados fo ram coletados, muit as vezes o con junto de valores é extenso e desorganizado e seu exame requer atenção, pois há risco de perder a visão global do fenômeno analisado. Para que isso não o corra é interessante reunir os valores em:

( ) Tabelas, organogramas e mapas. ( ) Tabelas, cronogramas e mapas. ( ) Tabelas, fluxogramas e mapas. ( ) Tabelas, gráficos e mapas.

3. A análise descritiva se constitui de técnicas utilizadas para organizar, resumir e descrever os dados de um a pesquisa. O parâmetro para a comparação relativa, obti do a partir do cálcul o de uma parte do conjunt o sobre o seu total é denominado:

( ) Porcentagem ( ) Razão

( ) Proporção

4. “ A distribuição de freqüência é o conjunt o de mensurações de freqüências para os dados observados. A _____________ é o número de vezes que o valor de uma determinada variável é observado”. Marque a alternativa correta que completa a frase acima na área tracejada:

( ) Freqüência absoluta acumulada. ( ) Freqüência relativa acumulada. ( ) Freqüência relativa.

( ) Freqüência absoluta.

(32)

Gabarito

1. Uma série específica. 2. Tabelas, gráficos e mapas. 3. Proporção

4. Freqüência absoluta. Este é o final do m ódulo 3 Análise estatística criminal

Referências

Documentos relacionados

o banCo do braSil e Sua HiStória diariamente Exposição – 4º andar A história da moeda, no Brasil e no mundo, com cerca de duas mil peças do acervo numismático do Banco

Aerodispersóide, gerado mecanicamente, constituído por partículas sólidas formadas pela ruptura mecânica de um sólido.. Ex.: aerossol formado: na moagem de rochas, no lixamento

A Figura ao lado, nos mostra que os raios de luz incidentes 1 e 2, não conseguem se propagar ao longo da Fibra, por não estarem dentro de uma figura geométrica, na forma de um

De modo similar aos Procuradores e Defensores Públicos, a avaliação consiste em duas partes: um teste escrito e a avaliação do desempenho durante o período de formação 30 .O

Por meio de Dias (1993) foi possível a constatação de que dentre as mais de 100 espécies de triatomíneos, descritas no continente Americano, poucas merecem um maior

Uma das principais barreiras não-tarifárias utilizada pelo Brasil é o antidumping, que é caracterizado quando o preço de exportação do produto está abaixo do normal

Resumindo: pode-se afirmar que a Danone, nesses anúncios, para driblar o possível entendimento de que ela continuaria a reproduzir o discurso que foi proibido pela

Convecção ocorre quando o calor é transferido através de uma massa de ar aquecida, se deslocando do ambiente incendiado para outros locais, em quantidade suficiente