DISTRIBUIO DE FREQUNCIAS
Ao estudar grandes conjuntos de dados, conveniente resumi-los numa tabela, atravs do agrupamento
dos dados em classes, com suas respectivas frequncias.
Denominamos frequncia o nmero que fica relacionado a um determinado valor da varivel.
Quando os dados so discretos com valores repetidos, a simples identificao dos mesmos com as
respectivas frequncias, pode ser um procedimento adequado, ao que damos o nome de distribuio de
frequncias sem intervalos de classes.
Quando os dados so contnuos, pode acontecer que poucos, ou at nenhum deles, apresente frequncia.
Nestes casos, o procedimento comea pela definio de classes.
Classes de frequncia, ou simplesmente, classes so intervalos de variao da varivel.
Uma distribuio de frequncias uma tabela na qual os possveis valores de uma varivel se encontram
agrupados em classes, registrando-se o nmero de valores observados em cada classe. Os dados organizados
em uma distribuio de frequncia so chamados de dados agrupados.
1.1. Conceitos Essenciais
Para cada classe, em uma distribuio de frequncia, os limites de classe inferior e superior indicam os
valores compreendidos pela classe. As classes so representadas simbologicamente por i, sendo i = 1, 2, 3, ..., k
(onde k o nmero total de classes da distribuio). H diversos mtodos para determinar o nmero de classes,
os quais veremos mais adiante.
Limites de classes so os extremos de cada classe. O menor nmero o limite inferior da classe (li) e o maior
nmero, o limite superior da classe (Li).
Classe ou Intervalo de classe li (incluir) | Li (excluir)
Amplitude de um intervalo de classe, ou simplesmente, intervalo de classe (hi) a medida do intervalo que
define a classe:
hi = Li li, amplitude da i-sima classe.
Amplitude total da distribuio (AT) a diferena entre o limite superior da ltima classe (limite superior
mximo) e o limite inferior da primeira classe (limite inferior mnimo):
AT = Lmx lmn.
Amplitude amostral (AA) a diferena entre o valor mximo e o valor mnimo da amostra:
AA = xmx xmn.
Ponto mdio de uma classe (xi) , como o prprio nome indica, o ponto que divide o intervalo de classe em
duas partes iguais. O ponto mdio da i-sima classe obtido da seguinte maneira:
xi
li Li
.
2
Regras bsicas
1. Efetua-se um rol (ordenao crescente ou decrescente de grandeza) nos dados brutos (aqueles ainda
no organizados numericamente tabela primitiva).
2. Determina-se a amplitude amostral da distribuio.
3. Escolhe-se convenientemente o nmero de classes k (n. inteiro), 5 k 15 onde podemos tomar
k n ou a regra de Sturges k 1 3,3 log n , n 25 (total de observaes). Se possvel determinaAA
se, ou seja, constri-se classes de mesma amplitude, tomando h
.
k
4. Efetua-se o agrupamento em classes e, a seguir, toma-se s frequncias das classes, elaborando-se,
portanto, a tabela de distribuio de frequncias.
Obs.:
f f
i 1
b) Frequncias relativas (fri) so valores das razes entre as frequncias simples e a frequncia total:
fi
.
n
fri
Obs.:
fr
1 ou 100%.
c) Frequncia acumulada (Fi) (do tipo abaixo de) o total das frequncias de todos os valores
inferiores ao limite superior do intervalo de classe:
Fk f 1 f 2 ... f k ou Fk
f
i 1
d) Frequncia acumulada relativa (Fri) de uma classe a frequncia acumulada da classe, dividida
pela frequncia total da distribuio:
Fri
Fi
.
i
fi
x1
f1
x2
f2
xn
fn
fi n
Exemplo
A distribuio das notas dos trinta alunos de Estatstica de uma escola est representada abaixo:
Classes
(notas)
0
2
4
6
8
2
4
6
8
10
fi
4
5
12
8
1
Representando as classes da distribuio no eixo das abscissas e as frequncias no eixo das ordenadas,
temos o seguinte histograma:
2.4.3.
2.4.44.
Exemplo
Sejam os seguintes dados:
Estaturas de 50 crianas
30
51
62
69
80
35
52
64
71
81
35
53
65
73
84
39
54
65
73
85
41
55
65
74
85
41
55
66
74
88
42
57
66
76
89
45
59
66
77
91
47
60
67
77
94
48
60
68
78
97
xi
fi
Fi
Histograma
fi
12
30
40
50
60
70
80
90 100
Classes
Polgono de Frequncia
fi
12
35
45
55
65
75
85
95
xi
31
18
10
4
30
100
40
50
60
70
80
90
Classes
Exemplos
1. Os valores abaixo representam a estatura (em cm) de 75 alunos regularmente matriculados no curso A
(Utilize uma casa decimal para as frequncias relativas).
172
180
174
182
176
167
160
162
162
164
167
174
169
155
155
180
176
171
179
167
173
180
172
163
168
165
183
189
178
164
170
168
169
180
174
175
191
172
176
172
174
173
165
165
163
150
166
178
178
168
181
184
166
177
167
166
173
160
180
186
156
163
169
155
172
164
154
165
181
156
180
168
185
169
179
Rol
Estaturas (cm)
xi
fi
fri (%)
Fi
Fri (%)
1
2
3
4
5
6
7
8
9
xi o ponto mdio da classe
Pede-se:
a) o rol;
b) a amplitude amostral;
c) o nmero de classes;
d) a amplitude das classes;
e) a amplitude total;
f) preencher a distribuio de frequncias;
g) a frequncia da quinta classe;
h) qual o limite superior da segunda classe?
i) qual o limite inferior da terceira classe?
j) qual o ponto mdio da quarta classe?
k) qual a porcentagem dos alunos que possui estatura inferior a 175 cm?
l) qual a porcentagem dos alunos cuja estatura no atinge 185 cm?
m) qual a porcentagem dos alunos cuja estatura seja maior ou igual 170 cm?
n) o histograma;
o) o polgono de frequncia;
p) o polgono de frequncia acumulada.
2. Seja x a varivel nmero de cmodos das casas ocupadas por vinte famlias entrevistadas:
xi
fi
1
2
3
4
5
6
2
3
4
5
6
7
4
7
5
2
1
1
fri (%)
Fi
Fri (%)
20
N da face (dado)
fi
fri (%)
1
2
3
4
5
6
Fi
Fri (%)
34
60
54
60
78
90
36
55
36
66
42
21
65
72
84
47
48
60
10
65
54
20
18
77
Classes
42
24
12
34
xi
24
85
22
51
96
52
25
80
fi
fri (%)
Fi
fri (%)
Fi
Fri (%)
1
2
3
4
5
6
4.
Classes
fi
1
2
3
4
5
6 |--- 10
10 |--- 14
14 |--- 18
18 |--- 22
22 |--- 26
Fri (%)
25
8
14
90
20
Classes
xi
fi
1
2
3
4
5
6
6 |--- 10
fri (%)
16
5
2
24
1
Fri (%)
20
35
14 |--- 18
Fi
11
18
5
5
20
80
90
i
1
Classes
fri (%)
Fi
100 |--
|--
|--
|--
fi
Fri (%)
72
14
44
68
600 |--
|--
|--
|--
TOTAL
52
360
8
400
a)
b)
c)
d)
e)
Durao
(horas)
N de luminrias
fi
14
46
58
76
68
62
48
22
fri
400
Fi
Fri
f)
g)
h)
i)
j)
7. A distribuio abaixo indica o nmero de acidentes ocorridos com 70 motoristas de uma empresa de
nibus (Utilize duas casas decimais para as frequncias relativas):
N de acidentes ( xi )
fi
1
2
3
4
5
6
7
8
0
1
2
3
4
5
6
7
20
10
16
9
6
5
3
1
fri (%)
Fi
Fri (%)
fi o nmero de motoristas
a)
b)
c)
d)
e)
Determine:
o nmero de motoristas que no sofreram nenhum acidente;
o nmero de motoristas que sofreram pelo menos 4 acidentes;
o nmero de motoristas que sofreram menos de 3 acidentes;
o nmero de motoristas que sofreram no mnimo 3 e no mximo 5 acidentes;
a porcentagem de motoristas que sofreram no mximo 2 acidentes.
8. A tabela abaixo apresenta a distribuio de frequncia das notas de 50 alunos, em Estatstica. Complete
esta tabela:
i
1
2
3
4
5
6
7
8
a)
b)
c)
d)
e)
f)
g)
NOTAS
20 |----- 30
30 |----- 40
40 |----- 50
50 |----- 60
60 |----- 70
70 |----- 80
80 |----- 90
90 |----- 100
fi
fri (%)
Fi
Fri (%)
2
4
6
8
12
10
6
2
h) a porcentagem dos alunos cuja nota de 40, no mnimo, mas inferior a 80; _______
i) at que classe esto includos 70% dos alunos; ______________________________
j) a porcentagem dos alunos cuja a nota no atinge 50. _________________________
9. Pesquisadas as idades de quarenta pessoas, obtiveram-se os seguintes resultados:
4
22
10
17
10
23
6
12
21
12
14
8
22
9
10
5
13
18
20
10
18
6
21
15
16
13
6
17
15
13
12
18
14
11
15
8
23
17
14
4
Classes
xi
fi
fri (%)
Fi
Fri (%)
1
2
3
4
c) quantas pessoas pertencem classe 14
19?
d) qual a porcentagem de pessoas que tm menos de 14 anos?
e) construa o histograma, o polgono de frequncia e o polgono de frequncia acumulada da distribuio
feita acima.
3.
MEDIDAS DE POSIO
O estudo feito sobre distribuies de frequncias, at agora, permite-nos descrever, de modo geral, os
grupos dos valores que uma varivel pode assumir. Dessa forma, podemos localizar a maior concentrao de
valores de uma dada distribuio, isto , se ela se localiza no incio, no meio ou no final, ou, ainda, se h uma
distribuio por igual.
Porm, para ressaltar as tendncias caractersticas de cada distribuio, isoladamente, ou em confronto
com outras, necessitamos introduzir conceitos que se expressem atravs de nmeros, que nos permitam traduzir
essas tendncias.
Estudaremos, agora, as medidas de posio estatsticas que representam uma srie de dados
orientando-nos quanto posio da distribuio em relao ao eixo horizontal (eixo das abscissas).
As medidas de posio mais importantes so as medidas de tendncia central, que recebem tal
denominao pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores centrais.
Dentre as medidas de tendncia central, destacamos:
a) a mdia aritmtica;
b) a mediana;
c) a moda.
As outras medidas de posio so as separatrizes, que englobam:
a) a prpria mediana;
b) os quartis;
c) os percentis.
Obs.: As respostas das mesmas sero dadas com duas casas decimais.
3.1. Dados no-agrupados
3.1.1. Mdia Aritmtica ( x )
Em um conjunto de dados, podemos definir vrios tipos de mdias. Porm em nossos estudos iremos
nos limitar a mais importante: a mdia aritmtica.
Definio: A mdia aritmtica, ou simplesmente, mdia de um conjunto de dados a soma das
entradas de dados dividida pelo nmero de entradas. Para encontrar a mdia use a frmula a seguir: x
xi
,
n
sendo:
x a mdia aritmtica;
xi os valores da varivel;
n o nmero de valores.
Exemplo
A tabela seguinte mostra o nmero de gols feitos em cada uma das quatro rodadas de um campeonato de
futebol.
1 rodada
26 gols
2 rodada
23 gols
3 rodada
20 gols
4 rodada
21 gols
Se a srie dada tiver um nmero par de termos, a mediana ser, por definio, qualquer dos nmeros
compreendidos entre os dois valores centrais da srie. Convencionou-se utilizar o ponto mdio.
Assim, a srie de valores:
2, 4, 7, 8, 10, 12, 12, 14
tem para mediana a mdia aritmtica entre ______ e _______.
8 10
9.
Logo: Md
2
Exemplo
Para os dados no agrupados, 1, 3, 3, 3, 4, 5, 6, 6, determinar:
a) a mdia
b) os desvios em relao mdia
c) a moda
d) a mediana.
EXERCCIOS
1. Considerando os conjuntos de dados:
a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6
b) 20, 9, 7, 2, 12, 7, 20, 15, 7
c) 51,6; 48,7; 50,3; 49,5; 48,9
d) 15, 18, 20, 13, 10, 16, 14
Calcule:
I.
a mdia;
II.
a mediana;
III. a moda.
2. D um exemplo, de um conjunto de 5 (cinco) dados, no qual a mediana e a moda sejam iguais.
3. D um exemplo, de um conjunto com 7 (sete) dados, no qual a amplitude total seja 10 e a mediana seja 6.
4. Os salrios-hora de cinco funcionrios de uma companhia so:
R$ 75, R$ 90, R$ 83, R$ 142 e R$ 88.
Determine:
a) a mdia dos salrios-hora;
b) o salrio-hora mediano.
5.
a)
b)
c)
As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7 e 7,2. Determine:
a nota mdia;
a nota mediana;
a nota modal.
xi
fi
4
5
6
7
20
40
30
10
xi f i
f i 100 xi f i ______
7. A mdia das idades de trs pessoas reunidas em uma sala 25 anos. Se uma criana de 5 anos entrar na sala,
a nova mdia das idades ser:
a) 15 anos
b) 18 anos
c) 20 anos
d) 22 anos
e) 24 anos
8. A nota mdia dos meninos de uma classe foi 6,0 e das meninas, 7,0. Se a classe composta de dezoito
meninos e doze meninas, ento a nota mdia da classe foi:
a) 6,5
b) 7,2
c) 4,8
d) 6,4
e) 7,0
10. A mdia das idades dos 11 funcionrios de uma empresa era de 40 anos. Um dos funcionrios se aposentou
com 60 anos, saindo da empresa. A mdia de idade dos 10 funcionrios restantes passou a ser:
a) 40 anos
b) 39,8 anos
c) 38,9 anos
d) 38 anos
e) 37,8 anos
11. Em um edifcio residencial com 54 apartamentos, 36 condminos pagam taxa de condomnio de R$ 380,00;
para os demais, essa taxa de R$ 440,00. Qual o valor da taxa mdia de condomnio nesse edifcio?
3.2. Dados agrupados
3.2.1. Mdia Aritmtica ( x )
3.2.1.1. Sem Intervalos de Classes
Consideremos a distribuio relativa a 34 famlias de quatro filhos, tomando para varivel o nmero de
filhos do sexo masculino:
xi f i
fi
N de meninos ( xi )
0
1
2
3
4
2
6
10
12
4
f i 34 xi f i ______
TABELA 1.
Neste caso, como as frequncias so nmeros indicadores da intensidade de cada valor da varivel, elas
funcionam como fatores de ponderao, o que nos leva a calcular a mdia aritmtica, dada pela frmula:
xi f i
.
fi
xi f i
fi
Consideremos a distribuio:
Estaturas (cm)
fi
1
2
3
4
5
6
4
9
11
8
5
3
f i ______
TABELA 2.
Calcule a mdia:
xi
xi f i
xi f i ______
N de meninos
fi
0
1
2
3
4
2
6
10
12
4
Fi
f i 34
Sendo:
fi =
2
Md
xi
fi
12
14
15
16
17
20
1
2
1
2
1
1
fi 8
Fi
fi
, a mediana ser dada por:
2
fi
=
2
Logo:
Md = _________
fi
.
2
fi
Fant . h *
Md l *
*
f
na qual:
l * o limite inferior da classe mediana;
Fant . a frequncia acumulada da classe anterior classe mediana;
f * a frequncia simples da classe mediana;
h * a amplitude do intervalo da classe mediana.
Estaturas (cm)
fi
1
2
3
4
5
6
4
9
11
8
5
3
Fi
f i ______
Como:
fi
=
2
fi
classe
fi
, a mediana ser o limite
2
Classes
fi
1
2
3
4
5
6
0 |---- 10
10 |---- 20
20 |---- 30
30 |---- 40
40 |---- 50
50 |---- 60
1
3
9
7
4
2
Fi
Temos:
fi
=
2
Logo:
Md =
f i ______
3.3. As Separatrizes
Como vimos, a mediana caracteriza uma srie de valores devido sua posio central. No entanto, ela
apresenta uma outra caracterstica, to importante quanto a primeira: ela separa a srie em dois grupos que
apresentam o mesmo nmero de valores.
Assim, alm das medidas de posio que estudamos, h outras que, consideradas individualmente, no
so medidas de tendncia central, mas esto ligadas mediana relativamente sua segunda caracterstica, j que
se baseiam em sua posio na srie. Essas medidas os quartis, os percentis e os decis so, juntamente com
a mediana, conhecidas pelo nome genrico de separatrizes.
3.3.1. Os Quartis
Denominamos quartis os valores de uma srie que a dividem em quatro partes iguais.
H, portanto, trs quartis:
a) O primeiro quartil (Q1) valor situado de tal modo na srie que uma quarta parte (25%) dos
dados menor que ele e as trs quartas partes restantes (75%) so maiores.
b) O segundo quartil (Q2) evidentemente, coincide com a mediana (Q2 = Md).
c) O terceiro quartil (Q3) valor situado de tal modo que as trs quartas partes (75%) dos termos
so menores que ele e a uma quarta parte restante (25%) maior.
Quando os dados so agrupados, para determinar os quartis usamos a mesma tcnica do clculo da
f i
kf i
por:
, sendo k o nmero de ordem do quartil.
2
4
fi
3 fi
Fant . h *
Fant . h *
e
.
4
4
Q3 l *
*
*
f
f
Assim, temos:
3.3.2.
Q1 l *
Os Percentis
Denominamos percentis os noventa e nove valores que separam uma srie em 100 partes iguais.
Indicamos:
P1 , P2 , ..., P32 , ..., P99 .
evidente que:
P50 Md , P25 Q1 e P75 Q3 .
f i
ser
2
kf i
, sendo k o nmero de ordem do percentil.
100
EXERCCIOS
1. Determine a mdia aritmtica de:
a)
Valores ( xi ) Quantidades ( f i )
i
1
2
3
4
50
60
80
90
xi f i
8
5
4
3
f i ______
b)
xi
fi
1
2
3
50
58
66
20
50
30
xi f i ______
xi f i
f i ______ xi f i ______
xi
fi
1
2
3
4
5
6
3
4
5
6
7
8
4
8
11
10
8
3
Notas (
xi )
1
2
3
4
5
6
7
8
9
2
3
4
5
6
7
8
9
10
xi f i
fde
______
N
alunos
( f i ) xi f i x______
i
i fi
Calcule:
a) a mdia;
b) a mediana;
c) a moda.
Fi
1
3
6
10
13
8
5
3
1
f i ______
Fi
Calcule:
a) a nota mdia;
b) a nota mediana;
c) a nota modal.
xi f i ______
4. Calcule a mdia aritmtica, mediana e moda de cada uma das distribuies abaixo:
a)
Fi
xi
xi f i
fi
i
Notas
1
2
3
4
5
0 |---- 2
2 |---- 4
4 |---- 6
6 |---- 8
8 |---- 10
5
8
14
10
7
f i ______
xi f i ______
b)
Estaturas (cm)
fi
1
2
3
4
5
5
12
18
27
8
xi
f i ______
xi f i
Fi
xi f i ______
c)
Salrios (R$)
fi
1
2
3
4
5
6
7
18
31
15
3
1
1
1
f i ______
xi
xi f i
Fi
xi f i ______
a)
b)
c)
d)
4. MEDIDAS DE DISPERSO
4.1. Disperso ou Variabilidade
As medidas de disperso so utilizadas para avaliar o grau de variabilidade dos dados. No se justifica
calcular uma mdia de um conjunto de dados onde no haja variao, todavia se a variabilidade desses dados for
muito grande, a representatividade da mdia ser muito pequena. Assim, importante caracterizar a disperso
dos dados, uma vez que diferentes amostras com mdias semelhantes, podem apresentar diferentes
variabilidades.
Por exemplo, mesmo sabendo que a temperatura mdia de duas cidades a mesma, e igual a 24C,
ainda assim somos levados a pensar a respeito do clima dessas cidades. Em uma delas poder a temperatura
variar entre limites de muito calor e de muito frio e haver, ainda, uma temperatura mdia de 24C. A outra
poder ter uma variao pequena de temperatura e possuir, portanto, no que se refere temperatura, um clima
mais favorvel.
Vemos, ento, que a mdia ainda que considerada como um nmero que tem a faculdade de
representar uma srie de valores no pode, por si mesma, destacar o grau de homogeneidade ou
heterogeneidade que existe entre os valores que compem o conjunto.
Por exemplo, consideremos os seguintes conjuntos de valores das variveis x, y e z:
X: 70, 70, 70, 70, 70.
Y: 68, 69, 70, 71, 72.
Z: 5, 15, 50, 120, 160.
Verifiquemos que a mdia dos trs conjuntos so iguais.
Portanto, para qualificar os valores de uma dada varivel, ressaltando a maior ou menor disperso ou
variabilidade entre esses valores e a sua medida de posio, a Estatstica recorre s medidas de disperso ou de
variabilidade.
Dessas medidas, estudaremos a amplitude total, a varincia, o desvio padro e o coeficiente de
variao.
4.2. Amplitude Total
Amplitude total a diferena entre o maior e o menor dos valores da srie de dados, ou seja, o maior
desvio da amostra. A sua utilizao, alm de mostrar o mximo desvio, serve para uma avaliao preliminar dos
dados, verificando-se a possibilidade de possveis erros nas coletas dos dados ou das digitaes, j que as
variveis podem apresentar extremos conhecidos.
AT x mx . x mn .
No caso dos dados serem agrupados com intervalos de classe, a amplitude total a diferena entre o
limite superior da ltima classe e o limite inferior da primeira classe:
AT Lmx . l mn.
A amplitude , na verdade, uma medida fraca de disperso, porque ela considera somente os valores
extremos e no diz nada sobre a distribuio dos valores intermedirios.
4.3. Varincia e Desvio Padro
Como vimos, a amplitude total instvel, por se deixar influenciar pelos valores extremos, que so, na
sua maioria, devidos ao acaso.
A varincia e o desvio padro so medidas que fogem a essa falha, pois levam em considerao a
totalidade dos valores da varivel em estudo, o que faz delas ndices de variabilidade bastante estveis e, por
isso mesmo, os mais geralmente empregados.
A varincia baseada nas diferenas entre cada valor do conjunto de dados e a mdia do grupo
(desvios). A varincia dada pela soma dos quadrados dos desvios xi x de cada observao em relao
mdia, dividida pelo nmero de elementos da amostra, ou seja, ela a mdia aritmtica dos quadrados dos n
desvios.
Para uma populao, a varincia representada pela letra grega minscula 2 (ler sigma dois ou
sigma ao quadrado) e a varincia de uma amostra representada por s2.
Para uma amostra de n valores x1 , x 2 , ..., x n de uma varivel X, a varincia dada por:
n
s2
(x
i 1
x )2
d1
d4
d3
d2
d6
d5
d7
=
7
s
2
(x
i 1
x )2
d d2 d3 d4 d5 d6 d7
1
7
Sendo a varincia calculada a partir dos quadrados dos desvios, ela um nmero em unidade quadrada
em relao varivel em questo, o que, sob o ponto de vista prtico, um inconveniente.
Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretao prticas, denominada
desvio padro, definida como a raiz quadrada da varincia e representada por s: s s 2 .
Assim:
. (I)
Se bem que a frmula dada para o clculo do desvio seja a que torna mais fcil a sua compreenso, ela
no uma boa frmula para fins de computao, pois, em geral, a mdia aritmtica x um nmero
fracionrio, o que torna pouco prtico o clculo das quantidades xi x .
2
Podemos simplificar os clculos fazendo uso de uma equivalente de (I), escrevendo-a da seguinte
maneira:
s
x
n
2
i
. (II)
No apenas este mtodo usualmente mais prtico, como tambm mais preciso. Quando a mdia no
exata e tem de ser arredondada, cada desvio fica afetado ligeiramente do erro, devido a esse arredondamento. O
mesmo acontece com os quadrados, podendo o resultado do clculo ser menos exato do que quando a frmula
(II) usada.
O desvio padro uma das medidas mais comumente usadas para distribuies, e desempenha papel
relevante em toda a Estatstica. Cabe notar que a unidade do desvio padro a mesma da mdia. Por exemplo,
se a mdia em R$ (real), o desvio padro tambm se exprime em real. A varincia, por outro lado, se exprime
em quadrados de unidades (Ex.: real2, metros2), como j vimos anteriormente.
Intuitivamente, o desvio padro representa uma mdia dos desvios (absolutos) que todos os valores
amostrais possuem ao redor da mdia. Valores da srie prximos uns dos outros originam um desvio padro
menor, enquanto valores muito afastados uns dos outros do um desvio padro maior. Em outras palavras, a
srie de dados que apresentar desvio padro maior, ter uma distribuio de frequncias mais aberta que a srie
com desvio padro menor.
Obs.: Quando os dados esto agrupados, o desvio padro obtido pela seguinte frmula:
fx
f
i
2
i
fx
f
onde x i o valor da varivel (sem intervalos de classes) e o ponto mdio (com intervalos de classe).
4.4. Coeficiente de Variao
Considere, a ttulo de ilustrao, as vendas dirias de dois restaurantes.
Restaurante
Restaurante
Fogo
Dallas
Lenha
50
470
70
490
60
460
80
480
x = 65
x = 475
s = 11,18
s = 11,18
Obviamente, trata-se de restaurantes com poder de vendas diferentes. Apesar de possurem o mesmo
desvio padro, evidente que diferenas nas vendas da ordem de 10 kg, por exemplo, possuem um peso relativo
muito maior para o restaurante Dallas comparado ao Fogo Lenha. Assim, razovel afirmar que as
variabilidades das vendas dirias em kg para o restaurante Dallas bem superior, tornando-se necessria a
elaborao de uma medida apropriada nessas situaes onde se deseja comparar conjuntos de dados com mdias
bem discrepantes.
Necessitamos de uma medida que rene essas caractersticas, que no seja til apenas na comparao
entre conjuntos de dados de mesma unidade, mas que permita ainda a comparao da variabilidade entre
conjuntos de dados referentes a diferentes caractersticas. O desvio padro por si s no nos diz muita coisa.
Assim, um desvio padro de duas unidades pode ser considerado pequeno para uma srie de valores cujo valor
mdio 200; no entanto, se a mdia for igual a 20, o mesmo no pode ser dito. Alm disso, o fato de o desvio
padro ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou
mais sries de valores, relativamente sua disperso ou variabilidade, quando expressas em unidades diferentes.
Para contornar essas dificuldades e limitaes, podemos caracterizar a disperso ou variabilidade dos
dados em termos relativos a seu valor mdio, medida essa denominada coeficiente de variao (CV):
s
CV 100 .
x
O Coeficiente de Variao indica o percentual de variao mdia dos dados em torno da sua mdia.
Voltando ao exemplo considerado no incio, temos:
Restaurante Dallas: CV = 17,20% - A variao mdia das vendas foi de 17,20% em torno da sua mdia.
Restaurante Fogo Lenha: CV = 2,35% - A variao mdia das vendas foi de 2,35% em torno da sua
mdia.
Desta forma pode-se afirmar que as vendas dirias do restaurante Dallas em kg apresentam uma
variabilidade bem superior comparada ao restaurante Fogo Lenha.
Exemplos
1. Seja o conjunto de dados (no-agrupados):
40, 45, 48, 52, 54, 62 e 70.
Calcule a amplitude total e o desvio padro.
R: AT = 30 e s = 9,49.
xi
40
45
48
52
54
62
70
xi2
2. Suponha que voc esteja gerenciando uma pizzaria e que mantm um controle das vendas dos diversos
tipos de pizza. Suponha ainda que tenha observado os seguintes valores de vendas dirias de pizzas do
tipo calabreza durante um perodo de 9 dias: 40, 56, 38, 38, 63, 59, 52, 49, 46. Calcule, nesses 9 dias:
a) a mdia
b) a mediana
c) a moda
d) o desvio padro
fi
0
1
2
3
4
2
6
12
7
3
f i xi
f i xi2
x
Estaturas (cm)
Pesos (kg)
175
68
s
5,0
2,0
Temos:
CVE =
CVP =
Logo, nesse grupo de indivduos, os pesos apresentam ______________ (maior, menor) grau de
disperso que as estaturas.
5. Considere a seguinte distribuio de frequncias com dados agrupados com intervalos de classe:
Estaturas (cm)
fi
1
2
3
4
5
6
4
9
11
8
5
3
xi
f i xi
f i xi2
EXERCCIOS
29
f i xi
fi
f i xi2
2. Uma amostra de 17 operrios de uma companhia apresentou os seguintes salrios (R$) recebidos
durante uma certa semana: 140, 140, 140, 140, 140, 140, 140, 140, 155, 155, 165, 165, 180, 180,
190, 200, 240. Calcule a amplitude total e o desvio padro. R: AT = R$ 100,00 e s = R$ 27,60.
xi
fi
f i xi
f i xi2
30
xi
fi
2
3
4
5
6
7
8
1
3
5
8
5
4
2
f i xi
f i xi2
fi
0
1
2
3
4
5
4
14
34
29
16
3
f i xi
f i xi2
N de apartamentos ( f i )
3
8
10
13
33
40
35
30
16
12
xi
f i xi2
f i xi
7. Em conjunto com uma auditoria anual, uma firma de contabilidade pblica anota o tempo
necessrio para realizar a auditoria de 50 balanos contbeis, tal como indicado na seguinte
tabela. Calcule a amplitude total e o desvio padro para o tempo de auditoria necessrio para esta
amostra de registros. R: AT = 50 min. e s = 12,28 min..
31
Tempo de auditoria
(min)
10 |---- 20
20 |---- 30
30 |---- 40
40 |---- 50
50 |---- 60
Nmero de
balanos ( f i )
xi
f i xi
3
5
10
12
20
f i xi2
N de acidentes ( f i )
3
12
14
9
7
5
xi
f i xi2
f i xi
32
14. Uma distribuio apresenta as seguintes estatsticas: s = 1,5 e CV = 2,9%. Determine a mdia da
distribuio. R: x 51,72.
REFERNCIA BIBLIOGRFICA
BUSSAB, Wilton O.; MORETTIN, Pedro A. Estatstica Bsica. 4 ed. So Paulo: Atual, 1987.
CRESPO, Antnio Arnot. Estatstica Fcil. 18 ed. So Paulo: Saraiva, 2002.
DOWNING, Douglas; CLARK, Jeffrey. Estatstica Aplicada. So Paulo: Saraiva, 1999.
FONSECA, Jairo Simon da; MARTINS, Gilberto Andrade. Curso de Estatstica. 6 ed. So
Paulo: Atlas, 1996.
FREUND, John E.; SIMON, Gary. Estatstica Aplicada: Economia, Administrao e
Contabilidade. 9 ed. Porto Alegre: Bookman, 2000.
HOEL, Paul G. Estatstica Elementar. So Paulo: Atlas, 1980.
McCLAVE, James T. Estatstica para administrao e economia. 10 ed. So Paulo: Pearson
Prentice Hall, 2009.
MONTEIRO FILHO, Gercino. Estatstica Prtica para Administrao e Contbeis. 1 ed.
Goinia: Grfica e Editora Vieira Ltda, 1999.
LARSON, Ron. Estatstica aplicada. 4 ed. So Paulo: Pearson Prentice Hall, 2010.
SILVA, Ermes Medeiros da. Et al. Estatstica para os curso de Economia, Administrao e
Cincias Contbeis. 3 ed. So Paulo: Atlas, v. I, 1999.
SPIEGEL, Murray R. Estatstica. 3 ed. So Paulo: Makron Books, 1996.
SPIEGEL, Murray R. Probabilidade e Estatstica. Coleo Schaum. 3 ed. So Paulo: Pearson
Education do Brasil, 2004.
STEVENSON, Willian. Estatstica Aplicada Administrao. So Paulo: Harpes & Row,
1981.
TRIOLA, Mrio F. Introduo Estatstica. 7 ed. Rio de Janeiro: LTC, 1999.
33
15.
34