Anda di halaman 1dari 8

Turma Engenharia Eléctrica 2º ano laboral

Tema 4 Medidas de Dispersão ou variabilidade

Aula Teórica 06

4. Introdução

Como foi visto anteriormente, podemos sintetizar um conjunto de observações em alguns


valores representativos como média, mediana, moda e quartis. No entanto, é importante
realçar que a análise completa dos dados não requer apenas sua apresentação através de
gráficos e tabelas ou o cálculo de medidas de posição. Por exemplo, caracterizar um
conjunto de valores apenas através da média é descrevê-lo inadequadamente, pois os dados
diferem entre si em maior ou menor grau.

Suponhamos que aplicado o mesmo teste de estatística 1 a duas turmas do 2º ano de gestão
que tiveram as aulas com o mesmo docente, ambas tivessem tido média 14. Baseando-nos
nesse dado, diríamos que as duas turmas possuem o mesmo nível de conhecimento, mas
analisando atentamente as notas das duas turmas, poderia dar-se o caso de os estudantes da
turma 1 terem tido todos eles 14 revelando homogeneidade de conhecimento, enquanto que,
na turma 2 as notas variaram de 7 a 18, mostrando maior heterogeneidade de conhecimento
onde os valores extremos contribuíram muito para que a média da turma fosse boa.

Por causa de situações como as descritas acima, torna-se necessário visualizar como os
dados estão dispersos. Para tal, iremos fazer uso das chamadas medidas de dispersão.

As medidas de dispersão são utilizadas para medir o grau de variabilidade, ou dispersão dos
valores em torno da média aritmética. Servem para medir a representatividade da média e
Docentes: Dr. Cabral O. Suela e Dr. Inácio Tepeia 1
proporcionam conhecer o nível de homogeneidade ou heterogeneidade dentro de cada grupo
analisado, permitindo estabelecer comparações entre fenómenos da mesma natureza e
mostrando até que ponto os valores se distribuem acima ou abaixo da média

As medidas de dispersão podem ser absolutas e relativas. A presente ficha irá debruçar-se
sobre o modo de cálculo e interpretação da Variância e Desvio padrão (medidas de dispersão
absolutas) e Coeficiente de variação (medida de dispersão relativa) que são as mais comuns.

4.1. Variância

 
Símbolo: Variância populacional:  2 ; Variância amostral: s 2  
A variância é a média aritmética dos quadrados dos desvios tomados em relação a média
aritmética de um conjunto de números.

4.1.1. Variância de dados não agrupados (Dados brutos)

Seja o seguinte conjunto de números: X  x1 , x2 , ... , xn  . A variância deste conjunto será
definida por:

N 2 n 2

  xi    1 N 2   xi  x  1  n 2 1  
2


 
2 i 1
  x  ( )
2
i s 
2 i 1

n 1
 
n  1  i 1
xi    xi 
n 
N N i 1
  
(1) Variância populacional (2) Variância amostral

4.1.2. Variância de dados agrupados (Dados tabulados)

Quando os dados estiverem agrupados numa distribuição de frequência simples, usaremos a


variância dos valores x1 , x2 , ..., xn ponderados pelas respectivas frequências absolutas
f1 , f 2 , ..., f n ou então, quando os dados estiverem agrupados numa distribuição de
frequência por classes usaremos a variância dos pontos médios x1 , x2 , ..., xn de cada classe,
ponderadas pelas frequências absolutas f1 , f 2 , ..., f n

Docentes: Dr. Cabral O. Suela e Dr. Inácio Tepeia 2


N 2 n 2

 x i    * fi
1 N  x i  x  * fi
1  n 2 1  n  
2

 
2 i 1

N

N
x
i 1
2
i  f i   (3)
2
s 
2 i 1

n 1
  xi  f i  n  
n  1  i 1 i 1
xi 
 
Variância populacional (4) Variância amostral

4.2. Desvio padrão

Símbolo: Desvio padrão populacional   ; Desvio padrão amostral s 

Como a variância é calculada a partir dos quadrados dos desvios, ela é um número que
apresenta a unidade elevada ao quadrado em relação à variável que não está elevada ao
quadrado; isto se torna um inconveniente em termos de interpretação do resultado. Por isso,
definiu-se uma nova medida com mais utilidade e interpretação prática, o desvio-padrão.

O desvio padrão dá-nos a idéia de o quão os valores estão próximos ou dispersos do valor da
média, facilitando assim, a percepção da homogeniedade ou heterogeniedade dos dados.

É definido como sendo a raiz quadrada da média aritmética dos quadrados dos desvios em
relação a média aritmética de um conjunto de números, isto é, é somar cada diferença do valor
do conjunto de dados pela média, elevada ao quadrado, e dividi-la pelo número total de
observações, isto é, o desvio padrão é a raiz quadrada da variância.
N

 x  
2
i
 i 1
(3)
N

Da mesma maneira quando os dados estiverem agrupados numa distribuição de frequência


usaremos a fórmula:

 x    * fi
2
i
 i 1
(4)
N

Docentes: Dr. Cabral O. Suela e Dr. Inácio Tepeia 3


Observação:
Quando se trabalha com uma amostra e não com uma população, como acontece na grande
maioria das situações relacionadas com a inferência estatística, ou então quando o número de
observações não é grande n  30 , o denominador das expressões (5) e (6) será igual a (n-1),
desvio padrão, e não (n) para obter uma melhor estimativa do parâmetro da população e o
símbolo do desvio padrão será representado por s e não  .

n n

  xi  x   x  x  * fi
2 2
i
s i 1
(5) s i 1
(6)
n 1 n 1

Para valores grandes de n não há grande diferença entre o resultado proporcionado pela
utilização de qualquer dos divisores, n ou n 1.

Exemplo 1: considerando o exemplo 1 da aula teórica 4, sobre os salários que 5 advogados


estagiários auferem, após termos calculado o salário médio, vamos analisar, qual a variância e
o desvio médio que os salários apresentam.
A  820, 810, 790, 800, 780

Resolução:

Primeiro: cálculo da média do conjunto de dados que é igual a 8001


Segundo: cálculo dos desvios quadráticos dos valores em relação a média

xi xi  x  xi  x 2
780 -20 400

790 -10 100

800 0 0

810 10 100

820 20 400

Total 1000

1
Resultado obtido no cálculo da média para dados brutos, na aula teórica 4

Docentes: Dr. Cabral O. Suela e Dr. Inácio Tepeia 4


Pela fórmula calculemos a variância: De referir que o tamanho da amostra é 5, portanto n  30

n 2

  xi  x  1000 1000
s2  i 1
   250
n 1 5 1 4

Para calcular o desvio padrão basta tirar a raiz quadrada da variância:

s  s 2  250  15.81

Interpretação: o salário médio dos advogados estagiários apresenta um desvio médio de 15.81
usd, o que significa que os salários dos advogados estagiários podem ter uma variação de até
15.81 usd acima ou abaixo da média, isto é, os salários podem rondar em média entre 784.19 usd
e 815.81 usd.

Exemplo 2: Calcular o desvio padrão da distribuição de frequências do consumo de energia


eléctrica (kwh)

Consumo Nº de usuários xi xi * f i xi  x xi  x 2 xi  x 2 * f i


fi
5|---25 4 15 60 -64.5 4160.25 16641
25|---45 6 35 210 -44.5 1980.25 11881.5
45|---65 14 55 770 -24.5 600.25 8403.5
65|---85 26 75 1950 -4.5 20.25 526.5
85|---105 14 95 1330 15.5 240.25 3363.5
105|---125 8 115 920 35.5 1260.25 10082
125|---145 6 135 810 55.5 3080.25 18481.5
145|---165 2 155 310 75.5 5700.25 11400.5
80 6360 80780

x i * fi
6360
x i 1
  79.5
n 80

Como n >30, então:


n 2

  xi  x  * fi
80780
s 
2 i 1
  1009.75 kwh2
n 1 80

Docentes: Dr. Cabral O. Suela e Dr. Inácio Tepeia 5


Para calcular o desvio padrão basta tirar a raiz quadrada da variância:
s  s 2  1009.75  31.7765 kwh

Interpretação: O desvio médio em relação a média de consumo da energia eléctrica é de


31.7765 kwh, isto é, o consumo médio de energia eléctrica pode ter uma variação de até
31.7765 Kw/h acima ou aaixo da média.

Condições para se usar o desvio-padrão ou variância para comparar variabilidade entre


grupos:
 Mesmo número de observações;
 Mesma unidade de medida; e
 Mesma média.

4.3. Coeficiente de variação

Como foi dito, a variância e o desvio padrão são medidas de dispersão absolutas, deste modo
só podem ser utilizadas para comparar a variabilidade de dois ou mais conjuntos de dados
quando estes apresentarem a mesma média, mesmo número de observações e estiverem
expressos nas mesmas unidades.

Para comparar dois ou mais conjuntos de valores, relativamente à sua dispersão ou variabilidade,
quando estão expressas em unidades de medida diferentes, podemos usar a medida de dispersão
relativa denominada coeficiente de variação, que é igual ao quociente entre o desvio padrão e a média
aritmética.

s
CV  (7)
x
Muitas vezes a fórmula é expressa em percentagem:
s
CV  *100 (8)
x

Exemplo de uma aplicação do coeficiente de variação:


Considere uma distribuição com média/valor médio igual a 40 e um desvio padrão igual a 4.
Considere agora uma outra distribuição com média/valor médio igual a 5 e um desvio padrão
igual a 4.

Repare-se que o desvio padrão na segunda distribuição tem um peso muito mais significativo
do que na primeira, isto é, a dispersão na 2ª distribuição tem maior efeito que na 1ª, e no

Docentes: Dr. Cabral O. Suela e Dr. Inácio Tepeia 6


entanto, este é igual em ambas. Ao se determinar o coeficiente de variação é possível saber de
que forma o desvio padrão está para a/o média/valor médio.

4 4
Nos exemplos dados, o coeficiente de variação é respectivamente  0,1 e  0,8 = 0,8 . Ao se
40 5
interpretar estes valores pode-se afirmar que, na primeira distribuição, em média, os desvios
relativamente à média atingem 10% do valor desta. Na segunda distribuição, porém, os desvios
relativamente à média atingem, em média, 80% do valor desta. As percentagens mostram o peso do
desvio padrão sobre a distribuição.

Classificação da distribuição quanto à dispersão:

Dispersão baixa: CV  15%


Dispersão média: 15% CV  30%
Dispersão alta: CV  30%

Exemplo3: Numa empresa o salário médio dos funcionários de sexo masculino é de 4000 Mt
com um desvio padrão de 1500 Mt, e o dos funcionários do sexo feminino é em média de
3000 Mt, com um desvio padrão de 1200. Então:

s 1500
Sexo masculino: CV  *100  *100  37.5%
x 4000
s 1200
Sexo feminino: CV  *100  *100  40%
x 3000

Interpretação: Podemos concluir que o salário médio das mulheres apresenta maior
dispersão relativa (maior variabilidade) em relação a média dos salários, em relação ao salário
médio dos homens, podendo atingir uma dispersão de até 40%.
Quanto a dispersão podemos afirmar que ambos os sexos possuem uma dispersão alta em
relação aos seus valores médios, pois, os seus CV´s estão acima de 30%.

Exemplo 4: Um teste de estatística aplicado a dois grupos de estudantes sendo a classificação


de 0 a 10 valores, apresentou os seguintes resultados:

Grupo Médias das notas (de 0-10) Desvio padrão das notas
A 6 2
B 6.2 1.5

Docentes: Dr. Cabral O. Suela e Dr. Inácio Tepeia 7


Observando estes dados, podemos constatar que as notas são expressas na mesma unidade de
medida, e suas médias são quase iguais ou muito próximas. Neste caso é válido comparar os
valores de s, não se obtendo informação adicional significativa com o uso do CV. Por isso,
não há necessidade de muito esforço de raciocínio para concluir que o grupo B apresentou
menos dispersão em relação ao grupo A, tanto em termos absolutos como relativos.

Docentes: Dr. Cabral O. Suela e Dr. Inácio Tepeia 8

Anda mungkin juga menyukai