Estatstica Descritiva
oO que a estatstica ?
Para muitos, a estatstica no passa de conjuntos
de tabelas de dados numricos. Os estatsticos so
pessoas que coletam esses dados.
A estatstica originou-se com a coleta e construo
de tabelas de dados para os governos
A situao evoluiu e esta coleta de dados
representa somente um dos aspectos da estatstica.
Definio de Estatstica
A estatstica um conjunto de tcnicas que permite,
de forma sistemtica, organizar, descrever, analisar e
interpretar
dados
oriundos
de
estudos
ou
experimentos, realizados em qualquer rea do
conhecimento.
reas da Estatstica
1.- Estatstica Descritiva
2.- Probabilidade
3.- Inferncia estatstica
ESTATSTICA DESCRITIVA
A estatstica descritiva a etapa inicial da anlise
utilizada para descrever e resumir os dados. A
disponibilidade de uma grande quantidade de dados
e de mtodos computacionais muito eficientes
revigorou est rea da estatstica.
PROBABILIDADE
A teoria de probabilidades nos permite
descrever os fenmenos aleatrios, ou
seja, aqueles em que est presente a
incerteza.
INFERENCIA ESTATISTICA
E o estudo de tcnicas que possibilitam a
extrapolao, a um grande conjunto de
dados, das informaes e concluses
obtidas a partir da amostra.
Etapas da Analise
Estatstica
AMOSTRAGEM
Uma rea importante em muitas aplicaes Estatsticas a da
de Amostragem.
Tecnologia
Exemplos de Aplicao:
Pesquisa de mercado,
Pesquisa de opinio,
Avaliao do processo de produo,
Praticamente em todo experimento.
Amostragem Aleatria
Cada elemento da populao tem a
mesma chance de ser escolhido.
Amostragem Estratificada
Classificar a populao em, ao
menos dois estratos e extrair uma
amostra de cada um.
Amostragem Sistemtica
Escolher cada elemento de ordem k.
10
Amostragem de Convenincia
Utilizar resultados de fcil acesso.
11
Exemplo 1
Numa pesquisa eleitoral, um instituto de pesquisa
procura, com base nos resultados de um
levantamento aplicado a uma amostra da
populao, prever o resultado da eleio.
12
Na eleio Presidencial
Os Institutos de Pesquisa de opinio
colhem periodicamente amostras de
eleitores para obter as estimativas de
inteno de voto da populao. As
estimativas so fornecidas com um valor e
uma margem de erro.
O quadro do Instituto Toledo &
Associados, a seguir refere-se inteno
de voto no 1 turno das eleies para o
governo em 2002.
13
46,3%
34,9%
40,5%
Lula(PT)
34,3%
33,6%
22,8%
23,3%
Serra(PSDB)
17,6%
13,8%
Ciro(PPS)
Garotinho(PSB) 12,6%
Maio
12,1%
13,8%
9,0%
10,5%
Junio
Jul/Ago
14,8%
11,3%
Set/Out
15
Tabela 1.1 Informao do estado civil, grau de instruo, nmero de filhos, idade e procedncia de 36
funcionrios sorteados ao acaso da empresa MB.(Bussab e Morettin)
No
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
Estado
Civil
Solteiro
Casado
Casado
Solteiro
Solteiro
Casado
Solteiro
Solteiro
Casado
Solteiro
Casado
Solteiro
Solteiro
Casado
Casado
Solteiro
Casado
Casado
Solteiro
Solteiro
Casado
Solteiro
Solteiro
Casado
Casado
Casado
Solteiro
Casado
Casado
Casado
Solteiro
Casado
Casado
Solteiro
Casado
Casado
Grau de
Instruo
10 grau
10 grau
10 grau
20 grau
10 grau
10 grau
10 grau
10 grau
20 grau
20 grau
20 grau
10 grau
20 grau
10 grau
20 grau
20 grau
20 grau
10 grau
Superior
20 grau
20 grau
20 grau
10 grau
Superior
20 grau
20 grau
10 grau
20 grau
20 grau
20 grau
Superior
20 grau
Superior
Superior
20 grau
Superior
No de
filhos
1
2
0
1
2
3
0
1
2
1
0
2
2
0
5
2
1
3
2
3
Salrio (X
Sal. Min)
4,00
4,56
5,25
5,73
6,26
6,66
6,86
7,39
7,59
7,44
8,12
8,46
8,74
8,95
9,13
9,35
9,77
9,80
10,53
10,76
11,06
11,59
12,00
12,79
13,23
13,60
13,85
14,69
14,71
15,99
16,22
16,61
17,26
18,75
19,40
23,30
Idade
Regio de
anos meses procedncia
26 03
Interior
32 10
Capital
36 05
Capital
20 10
Outro
40 07
Outro
28 00
Interior
41 00
Interior
43 04
Capital
34 10
Capital
23 06
Outro
33 06
Interior
27 11
Capital
37 05
Outro
44 02
Outro
30 05
Interior
38 08
Outro
31 07
Capital
39 07
Outro
25 08
Interior
37 04
Interior
30 09
Outro
34 02
Capital
41 00
Outro
26 01
Outro
32 05
Interior
35 00
Outro
46 07
Outro
29 08
Interior
40 06
Interior
35 10
Capital
31 05
Outro
36 04
Interior
43 07
Capital
33 07
Capital
48 11
Capital
42 02
Interior
16
17
Varivel
Qualquer caracterstica associada a uma populao
Classificao de variveis
Qualitativa
Quantitativa
Nominal
Ordinal
Contnua
Discreta
18
Medidas Resumo
Variveis Quantitativas
MEDIDAS DE POSIO: Moda, Mdia, Mediana, Percents,
Quartis.
19
Medidas de Posio
Moda(mo): o valor (ou atributo) que
ocorre com maior freqncia.Moda
Ex: 4,5,4,6,5,8,4,4
Mo = 4
Variavel
qualitativa
20
Mdia
n
x1
x2
x3 ...
n
x
i 1
Ex:2,5,3,7,8
Mdia = [(2+5+3+7+8)/5]=5
21
Mediana
Ex: 3,5,2,1,8,6
Dados
ordenados:1,2,3,5,6,8
=>
(6+1)/2=3,5 => Md=(3+5)/2=4
22
Percentis
O percentil de ordem px100 (0<p<1), em um
conjunto de dados de tamanho n, o valor da
varivel que ocupa a posio px(n+1) do conjunto
de dados ordenados.
O percentil de ordem p (ou p-quantil) deixa
px100% das observaes abaixo dele na amostra
ordenada.
Casos Particulares:
Percentil 50 = mediana, segundo quartil(md,Q2,q(0,5))
23
Exemplos
Ex(1): 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7
=>n=10
Posio Md:0,5(n+1)=0,5x11=>Md=(3+3,1)/2=3,05
Posio de Q1:0,25(11)=2,75=> Q1=(2+2,1)/2=2,05
Posio de Q3:0,75(11)=8,25=>Q3=(3,7+6,1)/2=4,9
Ex(2):0,9 1,0 1,7 2,9 3,1 5,3 5,5 12,2 12,9 14,0 33,6
=>n=11
Md=5,3 Q1=1,7 Q3=12,9
24
G1
G2
G3
10
10
10
5
Temos : x 1 x 3 x 3 5
Md1 Md 3 Md 3 5
25
Medidas de Disperso
Finalidade: encontrar um valor que resuma a
variabilidade de um conjunto de dados
Amplitude (A): A=mx-min
Para os grupos anteriores, temos:
Grupo 1, A=4
Grupo 2, A=8
Grupo 3, A=0
26
Intervalo-Interquartil (d)
a diferena entre o terceiro quartil e o primeiro
quartil, ou seja,
d= Q3-Q1
Ex(1): 15,5,3,8,10,2,7,11,12
Q1=4,5
e Q3=11,25
d =Q3-Q1=4,9-2,05=2,85
Max,Min,Q1,Q3,Q2: importantes para se ter uma boa ideia da
forma dos dados (simetrica ou assimetrica) e construir box-plots
27
Varincia
n
( x x ) ... ( x x )
(
x
)
x
1
2
n
n 1
x
i
i 1
n 1
Desvio padro S
28
x 5
2
2
2
2
2
(
3
5
)
(
4
5
)
(
5
5
)
(
6
5
)
(
7
5
)
10
S2
2,5
5 1
4
Desvio padro
S 2,5 1,58
G1 : S 2,5
S 1,58
S 3,16
S 0
G 2 : S 10
G3 : S 0
29
S
CV
100%
X
30
Desvio padro
Coeficiente de
variao
Altura
1,143m
Peso
50Kg
0,063m
6kg
5,5%
12%
31
32
fi
f ri
1o Grau
12
0,3333
33,3%
2o Grau
18
0,5000
50 %
Superior
0,1667
16.7%
n=36
1,0000
100%
total
fi
f ri
Tabela de freqncia
Contagem
f ri %
50,00%
40,00%
33,33%
30,00%
20,00%
16,70%
10,00%
0,00%
1o Grau
2o Grau
Superior
34
1oGrau (33.3%)
2oGrau (50.0%)
1o Grau
33%
Superior (16.7%)
2o Grau
50%
35
Nmero de
filhos
(Xi )
0
1
2
3
5
total
Nmero de
funcionrios
(fi )
4
5
7
3
1
20
% de funcionrios
(fri)
20%
25%
35%
15%
5%
100%
36
35%
% de funcionrios
35
Mo=2
25%
25
20%
15%
15
5%
5
0
Nmero
de filhos
37
Mdia:
X 1 f1 X 2 f 2 X k f k
X
fi
i 1
0 4 1 5 2 7 3 3 5 1 33
1,65
20
20
Mediana:
Dados ordenados:
0 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 5 =>
(20+1)/2=10,5
38
Varincia:
k
( X 1 X ) 2 f1 ( X 2 X ) 2 f 2 ( X k X ) 2 f k
S
n 1
2
(X
X )2 fi
i 1
n 1
0,858553
19
2
Desvio padro:
S S 2 0,858553 0,927
39
40
41
SEGUNDO INTERVALO :
Limite inferior : LI 2 LS1
Limite superior : LS2 LI 2 h
k - SIMO INTERVALO :
Limite inferior : LI k LS k 1
Limite superior : LSk LI k h
42
LS i LI i
Fi f 1 f 2 f i
j 1
Fri f r1 f r2 f ri
j 1
Fi
f r j ; ou Fri
n
43
intervalos
foram
gerados
seguindo
o
44
Ponto mdio:X 1
4 7,9 5,95;
2
X 2
45
Representao grfica:
Histograma de freqncias relativas (em %) para a varivel salrio
33,33%
% de funcionrios
30
27,78%
19.44%
20
16,67%
10
2,7%
0
4.0
7.9
11.8
15.7
19.6
23.5
Salrio
46
100
100%
80,56%
61,11%
50
27,78%
0
4.0
7.9
11.8
15.7
19.6
23.5
Salario
47
00 56
25 73
26 66 86
39 44 59
12 46 74 95
13 35 77 80
10
53 76
11
06 59
12
00 79
13
23 60 85
14
69 71
15
99
16
22 61
17
26
18
75
19
40
Valores
concentrados entre 4 e 19
20
21
22
23
30
48
Mdia:
X
X 1
f1 X f 2 X f k
fi
i 1
11,15
35
X 1 X 2 X 36
4 4,36 23,30
11,122
36
36
f X
k
Varincia:
S2
i 1
n 1
Intervalos
de classe
4,0 |-- 7,9
7,9 |-- 11,8
11,8 |-- 15,7
15,7 |-- 19,6
19,6 |-- 23,5
Total
1
2
3
4
5
f X
5
S2
i 1
36 1
Xi
fi
5,95
9,85
13,75
17,65
21,55
10
12
7
6
1
36
X 11,15
f i X i X
270,40
20,28
47,32
253,50
108,16
699,66
699,66
19,99029
35
50
x(1)
Q1
Q2
Q3
x(n)
Total Observaes
Mediana
Q2
Quartis
Q1
Q3
Extremos
x(1)
x(n)
51
Boxplot
O BOXPLOT representa os dados atravs de um retngulo
construdo com os quartis e fornece informao sobre valores
extremos. (veja o esquema embaixo)
52
53
11.2
Observao
exterior
(discrepante
ou atipica)
54
25
G
r
a
u
I
n
s
t
r
u
c
a
o
15
5
1
Grau de Instrucao
15
25
Salario
Regio de Procedncia
S
a
l
a
r
i
o
Outro
Capital
Interior
15
25
Salario
55