Aula Teórica 06
4. Introdução
Suponhamos que aplicado o mesmo teste de estatística 1 a duas turmas do 2º ano de gestão
que tiveram as aulas com o mesmo docente, ambas tivessem tido média 14. Baseando-nos
nesse dado, diríamos que as duas turmas possuem o mesmo nível de conhecimento, mas
analisando atentamente as notas das duas turmas, poderia dar-se o caso de os estudantes da
turma 1 terem tido todos eles 14 revelando homogeneidade de conhecimento, enquanto que,
na turma 2 as notas variaram de 7 a 18, mostrando maior heterogeneidade de conhecimento
onde os valores extremos contribuíram muito para que a média da turma fosse boa.
Por causa de situações como as descritas acima, torna-se necessário visualizar como os
dados estão dispersos. Para tal, iremos fazer uso das chamadas medidas de dispersão.
As medidas de dispersão são utilizadas para medir o grau de variabilidade, ou dispersão dos
valores em torno da média aritmética. Servem para medir a representatividade da média e
Docentes: Dr. Cabral O. Suela e Dr. Inácio Tepeia 1
proporcionam conhecer o nível de homogeneidade ou heterogeneidade dentro de cada grupo
analisado, permitindo estabelecer comparações entre fenómenos da mesma natureza e
mostrando até que ponto os valores se distribuem acima ou abaixo da média
As medidas de dispersão podem ser absolutas e relativas. A presente ficha irá debruçar-se
sobre o modo de cálculo e interpretação da Variância e Desvio padrão (medidas de dispersão
absolutas) e Coeficiente de variação (medida de dispersão relativa) que são as mais comuns.
4.1. Variância
Símbolo: Variância populacional: 2 ; Variância amostral: s 2
A variância é a média aritmética dos quadrados dos desvios tomados em relação a média
aritmética de um conjunto de números.
Seja o seguinte conjunto de números: X x1 , x2 , ... , xn . A variância deste conjunto será
definida por:
N 2 n 2
xi 1 N 2 xi x 1 n 2 1
2
2 i 1
x ( )
2
i s
2 i 1
n 1
n 1 i 1
xi xi
n
N N i 1
(1) Variância populacional (2) Variância amostral
x i * fi
1 N x i x * fi
1 n 2 1 n
2
2 i 1
N
N
x
i 1
2
i f i (3)
2
s
2 i 1
n 1
xi f i n
n 1 i 1 i 1
xi
Variância populacional (4) Variância amostral
Como a variância é calculada a partir dos quadrados dos desvios, ela é um número que
apresenta a unidade elevada ao quadrado em relação à variável que não está elevada ao
quadrado; isto se torna um inconveniente em termos de interpretação do resultado. Por isso,
definiu-se uma nova medida com mais utilidade e interpretação prática, o desvio-padrão.
O desvio padrão dá-nos a idéia de o quão os valores estão próximos ou dispersos do valor da
média, facilitando assim, a percepção da homogeniedade ou heterogeniedade dos dados.
É definido como sendo a raiz quadrada da média aritmética dos quadrados dos desvios em
relação a média aritmética de um conjunto de números, isto é, é somar cada diferença do valor
do conjunto de dados pela média, elevada ao quadrado, e dividi-la pelo número total de
observações, isto é, o desvio padrão é a raiz quadrada da variância.
N
x
2
i
i 1
(3)
N
x * fi
2
i
i 1
(4)
N
n n
xi x x x * fi
2 2
i
s i 1
(5) s i 1
(6)
n 1 n 1
Para valores grandes de n não há grande diferença entre o resultado proporcionado pela
utilização de qualquer dos divisores, n ou n 1.
Resolução:
xi xi x xi x 2
780 -20 400
800 0 0
810 10 100
820 20 400
Total 1000
1
Resultado obtido no cálculo da média para dados brutos, na aula teórica 4
n 2
xi x 1000 1000
s2 i 1
250
n 1 5 1 4
s s 2 250 15.81
Interpretação: o salário médio dos advogados estagiários apresenta um desvio médio de 15.81
usd, o que significa que os salários dos advogados estagiários podem ter uma variação de até
15.81 usd acima ou abaixo da média, isto é, os salários podem rondar em média entre 784.19 usd
e 815.81 usd.
x i * fi
6360
x i 1
79.5
n 80
xi x * fi
80780
s
2 i 1
1009.75 kwh2
n 1 80
Como foi dito, a variância e o desvio padrão são medidas de dispersão absolutas, deste modo
só podem ser utilizadas para comparar a variabilidade de dois ou mais conjuntos de dados
quando estes apresentarem a mesma média, mesmo número de observações e estiverem
expressos nas mesmas unidades.
Para comparar dois ou mais conjuntos de valores, relativamente à sua dispersão ou variabilidade,
quando estão expressas em unidades de medida diferentes, podemos usar a medida de dispersão
relativa denominada coeficiente de variação, que é igual ao quociente entre o desvio padrão e a média
aritmética.
s
CV (7)
x
Muitas vezes a fórmula é expressa em percentagem:
s
CV *100 (8)
x
Repare-se que o desvio padrão na segunda distribuição tem um peso muito mais significativo
do que na primeira, isto é, a dispersão na 2ª distribuição tem maior efeito que na 1ª, e no
4 4
Nos exemplos dados, o coeficiente de variação é respectivamente 0,1 e 0,8 = 0,8 . Ao se
40 5
interpretar estes valores pode-se afirmar que, na primeira distribuição, em média, os desvios
relativamente à média atingem 10% do valor desta. Na segunda distribuição, porém, os desvios
relativamente à média atingem, em média, 80% do valor desta. As percentagens mostram o peso do
desvio padrão sobre a distribuição.
Exemplo3: Numa empresa o salário médio dos funcionários de sexo masculino é de 4000 Mt
com um desvio padrão de 1500 Mt, e o dos funcionários do sexo feminino é em média de
3000 Mt, com um desvio padrão de 1200. Então:
s 1500
Sexo masculino: CV *100 *100 37.5%
x 4000
s 1200
Sexo feminino: CV *100 *100 40%
x 3000
Interpretação: Podemos concluir que o salário médio das mulheres apresenta maior
dispersão relativa (maior variabilidade) em relação a média dos salários, em relação ao salário
médio dos homens, podendo atingir uma dispersão de até 40%.
Quanto a dispersão podemos afirmar que ambos os sexos possuem uma dispersão alta em
relação aos seus valores médios, pois, os seus CV´s estão acima de 30%.
Grupo Médias das notas (de 0-10) Desvio padrão das notas
A 6 2
B 6.2 1.5