Estatstica
Aula 02
Estatstica Descritiva
1
Varincia ............................................................................................................................ 2
1.2
1.3
1.4
1.5
Amostragem .......................................................................................................................... 11
2.1
Tcnicas de Amostragem........................................................................................... 12
2.1.1
2.1.2
2.1.3
Amostragem Sistemtica............................................................................................. 14
2.1.4
2.1.5
2.1.6
Resumo.................................................................................................................................... 18
Gabarito .................................................................................................................................. 27
www.pontodosconcursos.com.br
Medidas de Disperso
Pense na seguinte situao: uma pessoa faz quatro refeies por dia, enquanto
que outra no faz nenhuma refeio por dia. Na mdia, ambas fazem duas
refeies por dia. Isto quer dizer que os dois indivduos esto bem
alimentados? A resposta bvia no. para isso que servem as medidas de
disperso, isto , medidas de como os dados esto agrupados: mais ou menos
prximos entre si (mais ou menos dispersos).
As medidas de disperso indicam o quanto os dados se apresentam dispersos
em torno da regio central. Desta forma, caracterizam o grau de variabilidade
existente nos dados. As seguintes medidas de disperso nos interessam: a
varincia, o desvio padro, o coeficiente de variao e o desvio
interquartlico.
1.1
Varincia
s 2x =
1 n
(x i x)2
n i=1
distintos
x1 , x 2 ,..., x k
ocorrerem
com
as
frequncias
f1 , f 2 ,..., f k
( f i = n ),
i =1
s 2x =
1 k
fi (x i x)2 .
n i=1
www.pontodosconcursos.com.br
1
1
1
s = x i2 x i = x i2 x 2 ,
n i
n i
n i
2
x
2 + 5 + 8 + 11 + 14
=8
5
e a varincia
s
2
x
(x
=
x)2
(2 8) 2 + (5 8) 2 + (8 8) 2 + (11 8) 2 + (14 8) 2
= 18.
5
Sequncia de clculos:
1) Mdia dos quadrados:
Profs. Alexandre Lima
O
www.pontodosconcursos.com.br
1
2 2 + 52 + 82 + 112 + 142 410
2
x
=
=
= 82 .
i
n i
5
5
2) Quadrado da mdia:
2
x i = x 2 = 82 = 64 .
n i
Ento,
3) s 2x = 82 64 = 18 (mesmo resultado!).
GABARITO: C
Varincia Combinada
Considere o conjunto de dados A com NA elementos, mdia A e varincia s 2A e
o conjunto B com NB elementos, mdia B e varincia s 2B . Pode-se demonstrar
que a varincia da populao conjunta A+B, tambm denominada
varincia combinada ou global, dada por
2
A+ B
A + B
=
+
.
NA + NB NA + NB NA + NB
2
2
A+B
A
=
N
B
+
N
A + B
.
Nmero de funcionrios
Mdia
Varincia
Feminino
20
6
3,4
Masculino
30
7
4
www.pontodosconcursos.com.br
XA+B =
N A A + N B B 20 6 + 30 7
=
= 6,6.
NA + NB
20 + 30
2
A+B
A
=
B
+
N
A + B
.
A = 6
20
B
30
sA2
A
=
NA
A 2
A2
A2
A2
2
2
www.pontodosconcursos.com.br
sB2
B
=
NB
B 2
B2
B2
B2
2
2
=
= 47,56 6,6 2
= 50 + 50
N
N
N
50
50
50
A + B
=
2
sA2 + B
sA2 + B
GABARITO: C
Nota: se as mdias dos conjuntos A e B forem iguais, ou seja, se A = B , a
varincia combinada pode ser calculada por meio da frmula simplificada
sA2 + B =
2 + 5 + 8 +11+14 40
=
=8
5
5
www.pontodosconcursos.com.br
2 + 8 +14 24
=
= 8.
3
3
N A sA2 + N B sB2
=
.
N
Varincia do 1 conjunto:
2
A
(A A )
=
NA
(2 8) 2 + (5 8) 2 + (8 8) 2 + (11 8) 2 + (14 8) 2
= 18.
5
2
B
Varincia do 2 conjunto: s
(B B )
=
NB
(2 8) 2 + (8 8) 2 + (14 8) 2
= 24.
3
5 18 + 3 24
= 20,25.
5+3
GABARITO: B
1.2
Desvio Padro
s x = + s x2 .
O desvio padro est na mesma unidade da varivel, sendo, por isso, de maior
interesse na prtica.
Exemplo. Determine o desvio padro do conjunto 2, 5, 8, 11, 14.
Vimos que esse conjunto possui varincia igual a 18. Logo, s x = 18 4,24 .
1.3
Coeficiente de Variao
cv( x ) =
sx
.
x
Esta medida caracteriza a disperso dos dados em termos relativos a seu valor
mdio.
Profs. Alexandre Lima
O
www.pontodosconcursos.com.br
4,24
0,53 = 53% .
8
Desvio Interquartlico
d Q = Qs Qi ,
1.5
Diagrama de Caixa
BUSSAB, Wilton de O.; MORETTIN, Pedro Alberto. Estatstica Bsica. So Paulo: Ed. Saraiva, 2010.
www.pontodosconcursos.com.br
alguns
autores2:
observaes
fora
de
lugar,
0%
1,7524
25%
4,6901
50%
5,7004
75%
6,1768
100%
7,3658
MONTGOMERY, Douglas C.; RUNGER, George C. Estatstica Aplicada e Probabilidade para Engenheiros. Rio de
Janeiro: LTC, 2008.
www.pontodosconcursos.com.br
Valores
2
1
90
80
70
60
50
40
30
20
10
0
1
_______________________________________________________
www.pontodosconcursos.com.br
10
7
6.5
6
Valores
5.5
5
4.5
4
3.5
3
versicolor
virginica
Amostragem
www.pontodosconcursos.com.br
11
Tcnicas de Amostragem
www.pontodosconcursos.com.br
13
Amostragem Estratificada
Amostragem Sistemtica
www.pontodosconcursos.com.br
14
www.pontodosconcursos.com.br
15
www.pontodosconcursos.com.br
16
Varincia Amostral
s 2x =
1 n
(x i x )2
n 1 i=1
s 2x =
1 n 2 n 2
x i n 1 x
n 1 i =1
(8)
s 2x =
1 k
n 2
f i x i2
x .
n 1 i=1
n 1
www.pontodosconcursos.com.br
17
Resumo
n
n
1
1
n 2
- Varincia amostral: s 2x =
(x i x)2 =
x i2
x
n 1 i=1
n 1 i=1
n 1
2
A+B
A
=
B
+
N
A + B
sx
.
x
- Desvio interquartlico: d Q = Qs Q i
- Um diagrama de caixa ou box-plot um retngulo que representa o desvio
interquartlico. Esse retngulo indica, portanto, a faixa dos 50% dos valores
mais tpicos da distribuio. O retngulo dividido no valor correspondente
mediana; assim, ele indica o quartil inferior, a mediana e o quartil superior.
- Uma populao consiste na totalidade das observaes.
- Uma amostra um subconjunto de observaes selecionadas a partir de
uma populao.
- Os elementos de uma amostra aleatria so independentes.
www.pontodosconcursos.com.br
18
Exerccios de Fixao
mnimo
1 quartil
mediana
mdia
3 quartil
mximo
varincia
20
25
27,5
30
32,5
50
49
18
23
32
33
42
52
100
A ou B
31
www.pontodosconcursos.com.br
19
II.
III.
Assinale:
A) se somente a afirmativa I for verdadeira.
B) se somente a afirmativa II for verdadeira.
C) se somente a afirmativa III for verdadeira.
D) se somente as afirmativas I e II forem verdadeiras.
E) se somente as afirmativas II e III forem verdadeiras.
www.pontodosconcursos.com.br
20
Mdia
Desvio-Padro
Qualidade
Tempestividade
50
25
10,0
6,0
20
24
Coeficiente de
Variao (%)
www.pontodosconcursos.com.br
21
A) 3,0%
B) 9,3%
C) 17,0%
D) 17,3%
E) 10,0%
www.pontodosconcursos.com.br
22
P (%)
5
15
40
70
85
95
100
A) 140,10
B) 115,50
C) 120,00
D) 140,00
E) 138,00
13. Assinale a opo que corresponde estimativa do quinto decil da
distribuio de X.
A) 138,00
B) 140,00
C) 136,67
D) 139,01
E) 140,66
14. Assinale a opo que corresponde estimativa da freqncia relativa de
observaes de X menores ou iguais a 145.
A) 62,5%
B) 70,0%
C) 50,0%
D) 45,0%
E) 53,4%
Profs. Alexandre Lima
O
www.pontodosconcursos.com.br
23
Z f
2
i i
i =1
A) 34.000,00
B) 50.000,00
C) 194.000,00
D) 207.500,00
E) 288.000,00
17. (ICMS-RJ/2010/FGV) A mdia, a mediana e a varincia das idades de
um grupo de vinte pessoas so, hoje, iguais, respectivamente, a 34, 35 e 24.
Daqui a dez anos, os valores da mdia, da mediana e da varincia das idades
dessas pessoas sero, respectivamente:
A) 44, 35 e 34
B) 44, 45 e 12
C) 44, 45 e 24
D) 34, 35 e 12
E) 44, 45 e 124
(Analista de Estatstica/Perito/MPU/2010/CESPE) Considere que um
perito tenha efetuado um estudo acerca do tempo gasto X , em meses,
por empresas notificadas para quitar suas pendncias com a Previdncia
Social. Uma amostra de 35 empresas notificadas com pendncias foi
selecionada de um banco de dados da Previdncia. A partir dessa amostra, o
www.pontodosconcursos.com.br
24
= 1027;
i =1
35
x
i =1
2
i
= 66317;
1 35
x i = 30135,11
35 i =1
y
6,8
2,6
s
1,7
1,3
n
15
20
www.pontodosconcursos.com.br
25
17
6
2
34,5
128
www.pontodosconcursos.com.br
26
Gabarito
1E
2C
3C
4E
5E
6C
7E
8B
9C
10 C
11 B
12 E
13 C
14 A
15 B
16 C
17 C
18 E
19 E
20 C
21 C
22 C
23 E
24 E
25 C
26 E
27 C
www.pontodosconcursos.com.br
27
frequncia (n de dias)
1.000
2.000
3.000
4.000
5.000
6.000
Total
5
6
10
6
3
1
31
www.pontodosconcursos.com.br
28
GABARITO: C
3. A quantidade de 2.000 acessos simultneos dirios representa o primeiro
quartil da distribuio X.
Resoluo
quantidade de acessos
simultneos
1.000
2.000
3.000
4.000
5.000
6.000
Total
frequncia (n de
dias)
5
6
10
6
3
1
31
frequncia
relativa
5/31 = 16,1%
6/31 = 19,4%
10/31 = 32,3%
6/31 = 19,4%
3/31 = 9,7%
1/31 = 3,1%
31/31 = 100%
frequncia
acumulada
16,1%
35,5%
67,8%
87,2%
96,9%
100,0%
www.pontodosconcursos.com.br
29
mnimo
1 quartil
mediana
mdia
3 quartil
mximo
varincia
20
25
27,5
30
32,5
50
49
18
23
32
33
42
52
100
A ou B
31
www.pontodosconcursos.com.br
30
v=S
2
A+B
A + B
=
+
nA + nB nA + nB nA + nB
A = 30
A = 30
A = 30n
B = 33
B = 33
B = 33n
nA
S = 49
2
A
S = 100
2
B
nB
A = 49
2
nA
B
nB
B = 100
2
= 60n B
nA
B
nB
= 49 + 30 2 = 949
= 949n A = 1898n B
= 1189n B
v=S
2
A+B
GABARITO: E
8. (ICMS-RJ/2009/FGV) Para comparar as rendas de dois grupos de
pessoas, A e B, foram preparados diagramas de caixas (box-plots) com os
valores observados dos salrios, representados na figura a seguir:
V.
VI.
Assinale:
A) se somente a afirmativa I for verdadeira.
B) se somente a afirmativa II for verdadeira.
C) se somente a afirmativa III for verdadeira.
D) se somente as afirmativas I e II forem verdadeiras.
E) se somente as afirmativas II e III forem verdadeiras.
Resoluo
ANLISE DAS AFIRMATIVAS
www.pontodosconcursos.com.br
32
GABARITO: B
9. (ICMS-RJ/2008/FGV) Uma companhia utiliza um sistema de avaliao de
desempenho de seus funcionrios por meio de dois indicadores de
performance: Qualidade das tarefas e a Tempestividade com que as tarefas
so realizadas.
Mdia
Desvio-Padro
Qualidade
Tempestividade
50
25
10,0
6,0
20
24
Coeficiente de
Variao (%)
www.pontodosconcursos.com.br
33
www.pontodosconcursos.com.br
34
A) 3,0%
B) 9,3%
C) 17,0%
D) 17,3%
E) 10,0%
Resoluo
www.pontodosconcursos.com.br
35
P (%)
5
15
40
70
85
95
100
A) 140,10
B) 115,50
C) 120,00
D) 140,00
E) 138,00
Resoluo
x = x jp j
j=1
www.pontodosconcursos.com.br
36
Pj
0,05
0,15
0,40
0,70
0,85
0,95
1,00
pi
0,15
0,40
0,70
0,85
0,95
1,00
0,05
0,05=0,10
0,15=0,25
0,40=0,30
0,70=0,15
0,85=0,10
0,95=0,05
1,00
xi
xjpj
(90+70)/2=80
(110+90)/2=100
(130+110)/2=120
(150+130)/2=140
(170+150)/2=160
(190+170)/2=180
(210+190)/2=200
4
10
30
42
24
18
10
138
GABARITO: E
13. Assinale a opo que corresponde estimativa do quinto decil da
distribuio de X.
A) 138,00
B) 140,00
C) 136,67
D) 139,01
E) 140,66
Resoluo
md = L i +
(n / 2) Fa
h md ,
f md
www.pontodosconcursos.com.br
37
pj
fj
0,05
0,10
0,25
0,30
0,15
0,10
0,05
1,00
200
200
200
200
200
200
200
Fj
x 0,05 =10
x 0,10 =20
x 0,25 =50
x 0,30 =60
x 0,15 =30
x 0,10 =20
x 0,05 =10
200 = n
10
10 + 20 = 30
30 + 50 = 80
80 + 60 = 140
140 + 30 = 170
170 + 20 = 190
190 + 20 = 200
(200 / 2) 80
20 136,67 .
60
GABARITO: C
14. Assinale a opo que corresponde estimativa da freqncia relativa de
observaes de X menores ou iguais a 145.
A) 62,5%
B) 70,0%
C) 50,0%
D) 45,0%
E) 53,4%
Resoluo
Classes
70-90
90-110
110-130
130-150
fi
10
20
50
60
Fazendo a interpolao:
(150 130) = 20 = 60
(145 130) = 15 = x
x = (15 x 60)/20 = 45
www.pontodosconcursos.com.br
38
Z f
2
i i
i =1
1 k
1 k
2
f
(
z
z
)
=
i i
f i z i2 z 2 = mdia dos quadrados quadrado da
n i =1
n i =1
mdia
s 2z =
www.pontodosconcursos.com.br
39
k
k
1 k
1 k
1 k
2
2
f
z
2
z
f
z
z
fi
f i (z i2 2z i z + z 2 ) =
+
f i (z i z ) 2 =
i
i
i
i
n 1 i =1
n 1 i =1
n 1 i =1
i =1
i =1
s 2z =
f z
2
i
nz 2
1
2
2
2
i =1
=
f
z
2
n
z
n
z
+
i i
n 1
n 1
n 1 i =1
1 k
n 2
f i z i2
z note que o fator 1 /( n 1) multiplica a soma dos
n 1 i =1
n 1
quadrados e o fator n /( n 1) multiplica o quadrado da mdia.
s 2z =
Classes
fi
xi
zi = ( xi 140) / 10
zi f i
zi2 f i
70-90
90-110
110-130
130-150
150-170
170-190
190-210
Total
10
20
50
60
30
20
10
200
80
100
120
140
160
180
200
-6
-4
-2
0
2
4
6
-60
-80
-100
0
60
80
60
-40
360
320
200
0
120
320
360
1.680
f z
2
i
= 8,402 ,
s =
n 1
n 1 199
199
i
2
z
i =1
1 k
1680
( 0,2) 2 = 8,40 0,04 = 8,36
f i z i2 z 2 =
200
n i =1
s 2x = 100s 2z = 100 8,360 = 836 opo com o valor mais prximo a B (840,20).
www.pontodosconcursos.com.br
40
A) 34.000,00
B) 50.000,00
C) 194.000,00
D) 207.500,00
E) 288.000,00
Resoluo
A banca pediu para o candidato calcular a varincia em (R$)2 dos valores das
vendas dirias realizadas pelos dois setores reunidos, ou seja, a varincia da
populao conjunta
A + B = {a1 , a 2 ,..., a N A , b1 , b 2 ,..., b N B } .
2
A+ B
A + B
=
+
.
NA + NB NA + NB NA + NB
2
2
A+B
A
=
N
B
+
N
A + B
.
B.
Os
e B , respectivamente. Os somatrios
sero determinados em
funo de ( s 2A , A ) e ( s 2B , B ), respectivamente.
www.pontodosconcursos.com.br
41
s 2B =
1
B2 B 2
200
A + B
1
1
=
= A 2 + B2
N
N
N
2
A+B
GABARITO: C
17. (ICMS-RJ/2010/FGV) A mdia, a mediana e a varincia das idades de
um grupo de vinte pessoas so, hoje, iguais, respectivamente, a 34, 35 e 24.
Daqui a dez anos, os valores da mdia, da mediana e da varincia das idades
dessas pessoas sero, respectivamente:
A) 44, 35 e 34
B) 44, 45 e 12
C) 44, 45 e 24
D) 34, 35 e 12
E) 44, 45 e 124
Resoluo
Est implcito que todas as pessoas do grupo estaro vivas daqui a dez anos. A
disperso da distribuio de frequncias (das idades) no mudar com o
envelhecimento das pessoas do grupo (ou seja, a forma da distribuio se
Profs. Alexandre Lima
O
www.pontodosconcursos.com.br
42
mantm ao longo do tempo). Logo, a varincia daqui a dez anos ainda ser
igual a 24. A nica opo com este valor a C.
Daqui a dez anos, a mdia e a mediana sero acrescidas de 10 unidades
(anos), haja vista que a distribuio de frequncias sofrer um deslocamento
para a direita de 10 unidades. Assim, a mdia e a mediana sero iguais a 44 e
45, respectivamente.
GABARITO: C
(Analista de Estatstica/Perito/MPU/2010/CESPE) Considere que um
perito tenha efetuado um estudo acerca do tempo gasto X , em meses,
por empresas notificadas para quitar suas pendncias com a Previdncia
Social. Uma amostra de 35 empresas notificadas com pendncias foi
selecionada de um banco de dados da Previdncia. A partir dessa amostra, o
perito fez uma anlise exploratria da varivel X, cujos resultados so
apresentados a seguir.
Estatsticas Descritivas:
tempo mnimo = 2 meses
tempo mximo = 128 meses
35
= 1027;
i =1
35
x
i =1
2
i
= 66317;
1 35
x i = 30135,11
35 i =1
www.pontodosconcursos.com.br
43
y
6,8
2,6
s
1,7
1,3
n
15
20
www.pontodosconcursos.com.br
44
Rol: {2 3 4 4 6 6 6 6 6 6 7 10 11 12 12 14 15 17 17 20 20 23 25 25 27 34 35
49 57 62 68 88 92 110 128}
O rol acima possui 35 amostras em ordem crescente. A mediana o valor que
ocupa a 18 posio, a saber, o valor 17. Uma rpida inspeo do box plot
confirma que o valor da mediana inferior a 20. Item errado.
GABARITO: E
20. No diagrama de caixas, quatro observaes foram identificadas como
valores atpicos por estarem fora do intervalo [0; 77,25].
Resoluo
Uma rpida inspeo do box plot sugere que os valores 88, 92, 110 e 128
(vide diagrama de ramo e folhas) so outliers. Item Certo. Resolvo mais
detalhadamente a seguir.
Rol: {2 3 4 4 6 6 6 6 6 6 7 10 11 12 12 14 15 17 17 20 20 23 25 25 27 34 35
49 57 62 68 88 92 110 128}
Q1 (primeiro quartil) = 6 (ocupa a 9 posio do rol)
Q3 (terceiro quartil) = 35 (ocupa a 27 posio do rol)
Logo, o desvio interquartlico (IQR) dado por
IQR = Q3 Q1 = 35 6 = 29
E o Limite Superior (LS) do diagrama ser
LS = Q3 + (1,5 x IQR) = 35 + 1,5 x 29 = 35 + 43,5 = 78,5
Contudo, a banca trabalhou com LS = 77,25, valor diferente do calculado
acima. Qual a provvel causa dessa discrepncia?
Vamos supor a banca tenha adotado Q3= (34 + 35)/2 = 34,5.
Neste caso, IQR = Q3 Q1 = 34,5 - 6 = 28,5 28,5 x 1,5 = 42,75 LS =
42,75 + 34,5 = 77,25.
Foi da que saiu o valor 77,25 citado no item. Mas isso no quer dizer que eu
concorde com o raciocnio da banca. A questo no foi anulada.
GABARITO: C
www.pontodosconcursos.com.br
45
17
6
2
34,5
128
Resoluo
17 (mediana)
6 (quartil inferior)
34,5 (quartil superior)
2 (mnimo amostral)
128 (mximo amostral)
(*) No faz sentido comparar objetos diferentes (por exemplo, banana com
laranja), utilizando uma medida absoluta como o desvio padro. por isso que
necessrio trabalhar com um adimensional como o coeficiente de variao.
Profs. Alexandre Lima
O
www.pontodosconcursos.com.br
46
GABARITO: C
23. O desvio padro amostral de X foi inferior a 31 meses.
Resoluo
Varincia = Mdia dos Quadrados Quadrado da Mdia
1
s = x2 x
n
QUADRADO DA MDIA:
2
2
2
1
1
1 1
1
30.135,11
x = 2 ( x ) = ( x ) =
n
n n
35
n
35
s2 =
=
= 1.033,77 s = 1.033,77 32,15
35
35
35
N = 10 par. Ento
mediana = mdia aritmtica entre as 5a e 6a medies do rol
Profs. Alexandre Lima
O
www.pontodosconcursos.com.br
47
mediana = (3+3)/2 = 3
GABARITO: E
25. As mdias harmnica e geomtrica so ambas inferiores a 3.
Resoluo
Frmulas:
n
Mdia geomtrica: x g = n x1.x 2 ...x n = x i 1 / n
i=1
Mdia harmnica: x h =
n
1
1
1
+
+ ... +
xn
x1 x 2
n
n
x
i =1
Mdia geomtrica:
x g = 10 8640 < 3
Mdia harmnica:
xh =
n
1
1
1
+
+ ... +
x1 x 2
xn
10
10
300
=
=
2<3
1 1 1 1 1 1 1 1 1 1
61 151
3+
+ + + + + + + + +
1 1 1 2 3 3 4 4 5 6
30
GABARITO: C
26. O terceiro quartil igual a 3.
Resoluo
Rol: 1, 1, 1, 2, 3, 3, 4, 4, 5, 6 (N = 10 medies)
Profs. Alexandre Lima
O
www.pontodosconcursos.com.br
48
Varincia Amostral =
x i2
x
n 1 i
n 1
2
i
= 12 + 12 + 12 + 2 2 + 32 + 32 + 4 2 + 4 2 + 5 2 + 6 2 = 3 + 4 + 9 + 9 + 16 + 16 + 25 + 36 = 118
118
1
13,1
x i2 =
9
n 1 i
1 + 1 + 1 + 2 + 3 + 3 + 4 + 4 + 5 + 6 30
n 2 10
=
= 3 x2 = 9
x = 9 = 10
10
10
9
n 1
x
i
2
i
= 118
1
118
= 11,8
x i2 =
10
n i
www.pontodosconcursos.com.br
49
www.pontodosconcursos.com.br
50