n
c
i
a
A
b
s
o
l
u
t
a
V A R 0 0 0 0 1
1 7 , 5
1 5 , 0
1 2 , 5
1 0 , 0
7 , 5
5 , 0
2 , 5
0 , 0
F
r
e
q
u
e
n
c
y
7
6
5
4
3
2
1
0
Nmero de Homicdios
F
r
e
q
u
n
c
i
a
A
b
s
o
l
u
t
a
Elaborao do prprio conteudista.
Grficos utilizados na distribuio de freqncia
- Polgono de freqncia: a representao grfica de uma distribuio de freqncias
absolutas. So grficos de linhas que unem os pontos mdios das bases superiores dos
retngulos de um histograma.
- Polgono de freqncia acumulada: a representao grfica de uma distribuio de
freqncias absolutas acumuladas. So grficos de linhas que unem os pontos
correspondentes ao limite superior da freqncia acumulada.
Grfico 7 Polgonos de freqncia e freqncia acumulada relativos a distribuio de
homicdios por cidade
Curso Anlise Criminal Mdulo 3
SENASP/MJ - ltima atualizao em 22/06/2009
Pgina 20
Elaborao do prprio conteudista.
Medidas de tendncia central
So indicadores que resumem a distribuio de um conjunto de dados e devem ser
utilizados quando se pretende comparar distintos grupos de dados, como por exemplo,
comparaes entre diferentes regies ou comparaes de uma mesma regio em tempos
distintos, dentre outras situaes.
- Mdia: a soma de todos os resultados dividida pelo total dos casos.
- Moda: a observao que ocorre com maior freqncia em uma amostra.
- Mediana: o valor da varivel que ocupa a posio central nos dados, ou seja, que divide a
amostra ao meio.
Exemplo: Considerando os dados hipotticos da aula anterior, mostrados na tabela 8, as
medidas de tendncia central em relao distribuio de homicdios por cidade :
Varivel Mdia Moda Mediana
Nmero de homicdio 7,4375 5 5,5
0
2
4
6
8
10
12
14
16
18
0 3 4 5 6 8 9 10 12 14 18
Nmero de homi cdio
F
r
e
q
n
c
i
a
Polgono de freqncia
Polgono de freqncia acumulada
Elaborao do prprio conteudista.
Curso Anlise Criminal Mdulo 3
SENASP/MJ - ltima atualizao em 22/06/2009
Pgina 21
Como calcular a mdia, a moda e a mediana
Mdia
Somam-se todos os homicdios ocorridos e divide-se por 16, que o nmero de cidades.
Mdia =(0+3+3+4+5+5+5+5+6+8+9+10+12+12+14+18)/16 =119/16 =7,4375
Mediana: H duas frmulas para calcular a mediana:
- nmero de observao par: Mediana = (X
(n/2)
+ X
[(n/2)+1]
)/2
- nmero de observao mpar: Mediana = X
[(n+1)/2]
Para o clculo da mediana, o primeiro passo a ordenao crescente das observaes, como
mostrado no exemplo anterior (clculo da mdia). Aps a ordenao das observaes,
identifica-se cada uma delas por um ndice numrico. No exemplo citado X
2
igual a 3, ou seja,
a cidade 2, nesta seqncia de cidades em ordem crescente de nmero de homicdios, possui
3 homicdios. No mesmo exemplo, a mediana calculada da seguinte forma:
Mediana =(X
(n/2)
+X
[(n/2)+1]
)/2 =(X
(16/2)
+X
[(16/2)+1]
)/2 =(X
8
+X
9
)/2 =(5 +6)/2 =11/2 =5,5
Moda: O valor que ocorreu com maior freqncia absoluta. No exemplo citado, o valor 5
ocorreu mais vezes, 4 vezes.
Outros conceitos
Para compreender melhor os clculos das medidas apresentadas, conhea mais trs
- Taxa bruta - o estimador mais simples para o risco de ocorrncia de um evento,
definindo-se como a razo entre o nmero de eventos ocorridos na rea e o nmero de
pessoas expostas ocorrncia desse evento. O clculo da taxa desenvolvido quando se
precisa comparar a incidncia de fenmenos entre diferentes regies, com tamanho
populacional diferente, ou uma mesma regio onde a populao varia com o tempo. O valor da
taxa calculado pela diviso do nmero de vtimas efetivas pelo tamanho da populao de
Curso Anlise Criminal Mdulo 3
SENASP/MJ - ltima atualizao em 22/06/2009
Pgina 22
risco, ou seja, pelo tamanho da populao que poderia sofrer esse crime, e o valor obtido
multiplicado por 100 mil.
Quartis
So os valores que determinam uma diviso do conjunto de dados em quatro partes iguais.
Decis
So os valores que determinam uma diviso do conjunto de dados em dez partes iguais.
Exemplo
Veja a tabela 10 em anexo Ocorrncias de estupro registradas pelas polcias civis
segundo unidade da federao (Brasil 2005)
Diferente da maior parte das ocorrncias criminais, os estupros vitimam apenas mulheres e,
por essa razo, o clculo de sua taxa tem como denominador a populao feminina.
O clculo da taxa de estupros em Rondnia efetuado pela seguinte frmula:
A importncia do clculo da taxa verificada, por exemplo, quando observam que apesar da
Polcia Civil de So Paulo ter registrado 3.903 vtimas de estupro, em 2005, a unidade da
federao com maior incidncia de estupros foi Roraima, com apenas 81 ocorrncias
registradas. Dado a diferena do tamanho da populao dessas UFs, em So Paulo foram 18,9
vtimas para cada grupo de 100.000 mulheres e, em Roraima, 42,4 vtimas para cada grupo de
100.000 mulheres.
Clculos
Para se determinar a taxa de uma regio geogrfica (que rene vrias UFs) no deve-se
calcular a mdia das taxas das UFs, pois esse clculo no leva em considerao o tamanho da
populao de cada UF dentro da regio geogrfica. O correto somar as vtimas de todas
as UFs, a populao de todas as UFs e realizar o clculo da taxa mdia da regio
geogrfica.
(nmero de estupro ocorridos em Rondnia) x (100.000) =
(populao feminina em Rondnia)
224 x (100.000) =30,03
745.802
Curso Anlise Criminal Mdulo 3
SENASP/MJ - ltima atualizao em 22/06/2009
Pgina 23
Veja a seguir a diferena gerada a partir desses dois tipos de clculo.
BRASIL, REGIES E
UNIDADES DA
FEDERAO
POPULAO
FEMININA
TOTAL DE
OCORRNCIAS DE
ESTUPRO
TAXA POR
100.000
MULHERES
Regio Sudeste 40.064.296 6.419 16,02
Minas Gerais 9.721.532 1.047 10,77
Esprito Santo 1.719.969 140 8,14
Rio de J aneiro 8.001.992 1.329 16,61
So Paulo 20.620.803 3.903 18,93
Taxa da Regio Sudeste:
Mdia das taxas das UFs da Regio Sudeste:
Clculos
Moda: A amostra de taxa de estupro no apresenta moda, dado que as taxas de estupro entre
as 27 unidades da federao no tm valores repetidos.
Mediana: Como a informao de 1 das UFs no est disponvel, para o clculo da mediana
devem ser consideradas apenas 26 UFs (nmero par de observaes). Assim, a mediana ser
calculada atravs da frmula:
onde X a taxa de estupro em cada UF e n o numero de UFs
Mediana = (X
(n/2)
+X
[(n/2)+1]
)/2 = (X
(26/2)
+X
[(26/2)+1]
)/2 = (X
13
+X
14
)/2 = (18,8+18,93)/2 = 18,865
Identificao dos quartis
A identificao dos quartis pode ser exemplificada da seguinte forma
40.064.296
6.419 x (100.000) =16,02
10,77 +8,14 +16,61 +18,93 =54,45 =13,61
4
4
(X
(n/2)
+X
[(n/2)+1]
)
2
Curso Anlise Criminal Mdulo 3
SENASP/MJ - ltima atualizao em 22/06/2009
Pgina 24
Figura 7: Identificao dos quartis para a distribuio de estupros entre as unidades da
federao (Brasil / 2005) - Fonte: MJ /SENASP e IBGE.
Brasil/2005A Secretaria Estadual de Segurana Pblica do Paran no encaminhou
informaes sobre as ocorrncias de estupros no ano de 2005 para a SENASP. Portanto, essa
unidade da Federao no foi considerada nos clculos.
Medidas de disperso
um conjunto de medidas que descrevem a variabilidade de um conjunto de dados e
permite verificar como os dados esto distribudos em torno da tendncia central.
So medidas de disperso: amplitude, varincia e desvio padro.
Para que voc entenda melhor os clculos das medidas de disperso, volte aos dados
hipotticos da tabela 8.
- Amplitude: a diferena entre o maior e o menor valor dos dados analisados. Se os
dados so categricos, a amplitude a diferena entre o limite superior da ltima categoria e o
limite inferior da primeira categoria.
Q1
Q2
Q3
4,94
6,27
7,32
8,14
8,89
10,52
10,77
11,27
11,44
11,74
16,61
16,91
18,8
18, 93
19,12
20,27
20,77
22,89
25,38
27,08
27,53
30,03
32,2
32,96
36,81
42,4
Curso Anlise Criminal Mdulo 3
SENASP/MJ - ltima atualizao em 22/06/2009
Pgina 25
Como calcular a Amplitude
Para calcular a amplitude subtrai-se o nmero de homicdios da cidade 16 (18), que o maior,
do nmero de homicdios da cidade 3 (0), que o menor.
Amplitude =18 0 =18
Medidas de disperso
- Varincia: a medida do grau de disperso dos dados em torno da mdia. Mostra o
quanto agrupado ou disperso esto os dados. A varincia representada por s
2
.
Como calcular a varincia
Para o clculo da varincia na amostra, primeiramente, subtrai-se o nmero de homicdios em
cada cidade (X
i
) da mdia da amostra ( X ) e eleva-se esse valor a segunda potncia. Mdia =
s=[2.(3-7,4375)]+(9-7,4375)+(0-7,4375)+(4-7,4375)+[4.(5-7,4375)]+(6-7,4375)+(8-
7,4375)+(10-7,4375)+[2(12-7,4375)]+(14-7,4375)+(18-7,4375)=
119/16 =7,4375
s=39,3828+2,4414+5,3164+11,8164+23,7656+2,0664+0,3164+6,5664+41,6328+43,0664+111
,5664=
Em seguida, somam-se as diferenas e divide-se o resultado pelo nmero de observao da
amostra menos um (n-1). Novamente, X
i
representa o nmero de homicdios que ocorreram na
cidade i.
Logo: Varincia =
) 1 (
) ( ... ) ( ) (
2 2
2
2
1 2
+ + +
=
n
X X X X X X
s
n
Mdia: a soma de todos os resultados dividida pelo total dos casos.
Medidas de disperso
- Desvio Padro: obtido atravs da raiz quadrada da varincia. Sua representao
realizada por .
=337,9374 s =337,9374
16-1 15
=22,52917
Curso Anlise Criminal Mdulo 3
SENASP/MJ - ltima atualizao em 22/06/2009
Pgina 26
Como calcular o desvio padro
Aps descobrir o valor da varincia, calcula-se a sua raiz quadrada, esse resultado, o valor
do desvio padro.
74649 , 4 52971 , 22
2
= = = s s
Todos os pacotes estatsticos, incluindo o Excel, fazem o clculo da varincia como do desvio
padro desse valor automaticamente.
Tabela 11 Medidas de disperso
Varivel Amplitude Varincia (
2
) Desvio padro ()
Nmero de homicdio 18 22,52917 4,74649
Elaborao do prprio conteudista.
Exemplo prtico de uso das medidas de disperso
Aps o diagnstico da situao de um estado, identifica-se que duas (2) regies se destacam
pelas altas taxas de incidncia de homicdios.
Comparando as medidas de disperso das taxas municipais de homicdios para essas duas
regies, descobre-se que em uma delas os valores esto mais dispersos do que na outra
regio. Isto significa que na regio onde os valores esto menos dispersos o problema da
alta incidncia de homicdios est distribudo de forma ampla, atingindo grande parte
dos municpios da regio.
Na regio onde os valores esto mais dispersos ocorre o contrrio: a incidncia de
homicdios est concentrada em alguns poucos municpios e um outro conjunto
significativo de municpios tem incidncia baixa de homicdios.
Nesse caso, identificar o grau de disperso dos dados informar se preciso planejar a
ao tendo como foco todos os municpios da regio ou apenas alguns que tm a
situao mais precria.
Curso Anlise Criminal Mdulo 3
SENASP/MJ - ltima atualizao em 22/06/2009
Pgina 27
Coeficiente de correlao
A anlise de correlao tem como objetivo medir a intensidade ou grau de associao
linear entre duas variveis, sem, no entanto, determinar a relao funcional entre elas,
ou seja, que uma varivel responsvel pela alterao na outra.
A anlise realizada atravs da interpretao do coeficiente de correlao, permitindo
identificar se um fator est associado a outro: se o desemprego est associado incidncia
criminal, se o aumento do nmero de policiais est associado a uma reduo da incidncia de
crimes e se o aumento do salrio dos policiais est associado a uma melhora na eficincia dos
rgos de segurana pblica, dentre outras relaes.
Pelo coeficiente de correlao, possvel saber se o desemprego est associado ao
aumento da criminalidade, mas no possvel saber se o desemprego que causa o
aumento do crime ou se o aumento do crime que leva ao aumento no desemprego.
Coeficiente de correlao
Mede a intensidade de associao linear entre duas variveis. Por exemplo, a associao
entre nmero de homicdio e nmero de armas de fogo. Seu clculo realizado com base
na varincia da amostra, atravs da seguinte frmula:
r =sxy / (sxsy)
1
) ( ) (
n
Y Y X X
s
i i
xy
Onde: sx o desvio padro da varivel X, no exemplo, nmero de homicdio. sy o desvio
padro da varivel Y, no exemplo, nmero de armas de fogo.
A interpretao do coeficiente de correlao no permite fazer inferncias (dedues).
Considerando o exemplo da arma de fogo e do homicdio, suponha que o coeficiente de
correlao seja 0,6, portanto positivo. Pode-se afirmar que as duas variveis se correlacionam
positivamente, mas no pode prever o nmero de homicdio com base no nmero de arma de
fogo. Para se constatar a relao funcional entre as duas variveis e fazer a inferncia,
necessrio a anlise de regresso, apresentada na subseo seguinte.
Curso Anlise Criminal Mdulo 3
SENASP/MJ - ltima atualizao em 22/06/2009
Pgina 28
A interpretao desse coeficiente simples. Considerando que r sempre um valor entre -1 e
+1, temos:
- Se r =0, no existe correlao;
- Quanto mais prximo de -1 ou de +1, mais forte a correlao;
- Se r < 0 existe uma correlao negativa, ou seja, quando uma varivel cresce a outra
decresce. No exemplo, quando o nmero de arma de fogo decresce, o nmero de homicdio
cresce; e
- Se r >0 existe uma correlao positiva, ou seja, quando uma varivel cresce a outra tambm
cresce. No exemplo, quando o nmero de arma de fogo cresce, o nmero de homicdio cresce.
Os pacotes estatsticos calculam o coeficiente de correlao automaticamente.
Aula 5 Anlise de regresso
A anlise de regresso procura determinar a relao funcional entre duas ou mais
variveis. O termo regresso foi introduzido pela primeira vez em 1886, por Francis Galton, no
estudo da relao entre as alturas de pais e filhos. Hoje, os modelos de regresso so
amplamente utilizados em vrias reas do conhecimento, inclusive na anlise criminal.
O principal objetivo da anlise de regresso modelar o relacionamento entre uma
varivel (chamada de dependente) e outras variveis (chamadas explicativas). Em outras
palavras, procura determinar em que medida as variveis explicativas se relacionam com
a varivel dependente. Para isso, estima-se o valor mdio da varivel dependente, a
partir dos valores das variveis explicativas. Veja o exemplo.
No exemplo apresentado no clculo do coeficiente de correlao (associao entre nmero de
homicdio e nmero de armas de fogo), no h interesse em saber somente a correlao entre
a arma de fogo e o homicdio, quer se saber em que medida um aumento ou diminuio no
nmero de armas de fogo implica no aumento ou diminuio de homicdios.
Para isso, estima-se uma regresso linear considerando como varivel dependente o nmero
de homicdio e, como varivel explicativa, o nmero de arma de fogo. Essa estimativa fornece
uma equao, atravs da qual, possvel inferir o nmero mdio de homicdio de acordo com o
nmero de arma de fogo. Entretanto, como a regresso estima uma relao estatstica, ela est
Curso Anlise Criminal Mdulo 3
SENASP/MJ - ltima atualizao em 22/06/2009
Pgina 29
sempre sujeita a um erro. Toda a anlise de regresso se baseia na correo desse erro
estatstico atravs de diversos mtodos que variam de acordo com o tipo e distribuio
dos dados.
Para realizar a anlise de regresso necessrio um conhecimento avanado em estatstica e
em lgebra, fugindo do escopo desse curso. O conhecimento necessrio para a realizao de
uma anlise de regresso contedo suficiente para a realizao de um curso especifico sobre
o tema.
Para os interessados em aprofundar no assunto, dois manuais bastante conhecidos na rea
so indicados: Wooldridge (Wooldridge, J .M. Introduo Econometria: uma abordagem
moderna, So Paulo: Pioneira Thomson Learning, 2006) e Gujarati (Gujarati, D. Econometria
Bsica. So Paulo, Makron, 3 edio, 2000).
Neste mdulo so apresentados exerccios de fixao para auxiliar a compreenso do
contedo.
O objetivo destes exerccios complementar as informaes apresentadas nas pginas
anteriores.
1. Uma srie estatstica constitui uma coleo de dados estatsticos referidos a uma
mesma ordem de classificao. Quando o fator bsico que estrutura a construo de
sries estatsticas o fator descrito, podemos dizer que esta srie :
( ) Uma srie temporal.
( ) Uma srie geogrfica.
( ) Uma srie especfica.
( ) Uma srie bipartida.
( ) Uma srie espacial.
Curso Anlise Criminal Mdulo 3
SENASP/MJ - ltima atualizao em 22/06/2009
Pgina 30
2. Uma vez que os dados foram coletados, muitas vezes o conjunto de valores extenso
e desorganizado e seu exame requer ateno, pois h risco de perder a viso global do
fenmeno analisado. Para que isso no ocorra interessante reunir os valores em:
( ) Tabelas, organogramas e mapas.
( ) Tabelas, cronogramas e mapas.
( ) Tabelas, fluxogramas e mapas.
( ) Tabelas, grficos e mapas.
3. A anlise descritiva se constitui de tcnicas utilizadas para organizar, resumir e
descrever os dados de uma pesquisa. O parmetro para a comparao relativa, obtido a
partir do clculo de uma parte do conjunto sobre o seu total denominado:
( ) Porcentagem
( ) Razo
( ) Proporo
4. A distribuio de freqncia o conjunto de mensuraes de freqncias para os
dados observados. A _____________ o nmero de vezes que o valor de uma
determinada varivel observado . Marque a alternativa correta que completa a frase
acima na rea tracejada:
( ) Freqncia absoluta acumulada.
( ) Freqncia relativa acumulada.
( ) Freqncia relativa.
( ) Freqncia absoluta.
( ) Distribuio de freqncia.
Curso Anlise Criminal Mdulo 3
SENASP/MJ - ltima atualizao em 22/06/2009
Pgina 31
Gabarito
1. Uma srie especfica.
2. Tabelas, grficos e mapas.
3. Proporo
4. Freqncia absoluta.
Este o final do mdulo 3
Anlise estatstica criminal
Curso Anlise Criminal Mdulo 3
SENASP/MJ - ltima atualizao em 22/06/2009
Pgina 32
Anexo - Tabela 10