Medidas de disperso: os
valores esto prximos entre si
ou variam muito?
Measures of dispersion: are all values
close to each other or do they vary a lot?
JOO LUIZ DORNELLES BASTOS1
RODRIGO PEREIRA DUQUIA2
DESCRITORES:
MEDIDAS
EM
EPIDEMIOLOGIA;
EPIDEMIOLOGIA E BIOESTATSTICA; ANLISE DE DADOS;
FATORES EPIDEMIOLGICOS.
As informaes e os conhecimentos adquiridos com a leitura da segunda Nota de Epidemiologia e Bioestatstica, cujo ttulo Medidas de
tendncia central: onde a maior parte dos indivduos se encontra? impe algumas novas necessidades. Para alm de expressar atravs de um
nico valor em torno do qual tende a se concentrar um conjunto de dados numricos, importa
saber como estas observaes esto distribudas
em nossa populao de estudo so elas bastante prximas entre si ou variam muito?1
Isto ocorre porque duas distribuies podem
apresentar mdias aritmticas idnticas e, ao
mesmo tempo, possuir valores que se distribuem de maneiras completamente diferentes em
relao a ela. Para ilustrar, considere a Tabela 1,
que apresenta a situao hipottica de duas distribuies das pontuaes obtidas por um grupo
de alunos de ensino mdio nas disciplinas de
1
2
40
TABELA 1 Pontuaes obtidas por alunos do ensino mdio conforme as disciplinas cursadas (dados
hipotticos).
Aluno
Biologia
Matemtica
Ana
Carla
Csar
Joo Paulo
Jos Nilton
Luiz Roberto
Marcelo
10
Maria
10
Mariana
Pmela
Pedro
Roberta
Mdia aritmtica ( X )
1 AMPLITUDE DE VARIAO
Distribuio da pontuao
.1
Percentual
.2
.3
.4
.5
Disciplina de Biologia
4
5
6
Pontuao obtida
A variabilidade (ou disperso) de um conjunto de dados pode ser quantificada atravs da amplitude de variao, da varincia, do desvio-padro e do coeficiente de variao, entre outras.1-4
Nas sees que seguem, so apresentadas as frmulas e exemplos do clculo de cada uma das
quatro medidas, bem como suas vantagens e desvantagens para utilizao na anlise de dados e
leitura crtica de trabalhos cientficos.
10
A amplitude de variao pode ser obtida facilmente atravs da diferena entre o maior e o
menor valor de uma distribuio de dados.3
Aproveitando o exemplo das notas nas disciplinas de Biologia e Matemtica, a amplitude de
variao em cada um dos casos foi de 4 (7 [maior
pontuao] 3 [menor pontuao] = 4) e de 8 (10
[maior pontuao] 2 [menor pontuao] = 8),
respectivamente. A maior amplitude de variao
nas notas de Matemtica est de acordo com o
que foi observado na Figura 2, ou seja, em uma
distribuio com maior disperso dos dados, a
amplitude de variao tende a ser maior. Entretanto, cabe salientar que o clculo da medida em
questo no leva em considerao os valores intermedirios da distribuio, de forma que estes
no influenciam seu resultado final.2 Esta poderia ser considerada uma desvantagem, uma vez
que as medidas de disperso deveriam levar em
conta todas as observaes e no somente os limites do conjunto de dados, isto , seus valores
mximo e mnimo.
2 VARINCIA (s 2)
Ao contrrio da medida supracitada, a
varincia consiste em uma medida de disperso
que leva em conta todos os valores de uma distribuio para seu clculo.2 Ela estimada a partir do somatrio do quadrado da distncia de
cada valor em relao mdia, dividido pelo
total de observaes menos um, tal como na
frmula:2
(x X)2 ,
2
Distribuio da pontuao
Percentual
.2
.3
.4
Disciplina de Matemtica
.1
s =
5
6
Pontuao obtida
10
(n 1)
(5 - 5) 2 + (6 - 5) 2 + (5 - 5) 2 + (4 - 5) 2 + (5 - 5) 2 + (5 - 5) 2 + (5 - 5) 2 + (6 - 5) 2 + (4 - 5) 2 + (7 - 5) 2 + (3 - 5) 2 + (5 - 5) 2
= 1,09
(12 - 1)
3 DESVIO-PADRO (s)
O desvio-padro amplamente utilizado na
literatura cientfica como medida de disperso
dos dados. Ele estima o quanto, em mdia, cada
valor se distancia da prpria mdia aritmtica de
uma distribuio com a vantagem de preservar a
unidade de mensurao original das observaes, algo que no ocorre com a varincia. Para
calcul-lo, basta extrair a raiz quadrada da frmula da varincia:2,3
s=
(x X)2 ,
(n 1)
Figura 3 rea sob a curva da distribuio Normal (Gaussiana) e sua relao com os desvios padro.
os valores de mdia e desvio-padro, pode-se julgar adequado ou no o uso de um teste estatstico em uma publicao cientfica.5 Se, em uma
publicao, tiver sido adotado o teste t para comparar a mdia de algum atributo entre dois grupos e o desvio-padro for maior do que metade
da mdia aritmtica, pode-se considerar inadequado seu uso e colocar sob suspeita o resultado
apresentado.
s
X
que no possui unidade de medida. Assim, possvel comparar a disperso entre duas variveis,
mesmo que tenham sido mensuradas em escalas
de medida diferentes e possuam mdias diferentes. Por exemplo, atravs do coeficiente de variao pode-se comparar, diretamente e sem o recurso de transformaes, a variabilidade existente em uma distribuio de alturas medidas em
metros com outra de alturas medidas em milmetros. Mesmo com estas vantagens, o coeficiente de variao pouco utilizado e cede lugar
na maioria das vezes ao desvio-padro e varincia nas anlises estatsticas e nas publicaes
cientficas.
5 CONSIDERAES FINAIS
Os conhecimentos introduzidos no presente
artigo, somados queles da nota anterior, fornecem informaes bsicas e necessrias para se conhecer as principais caractersticas de uma distribuio, tais como sua forma e disperso. Quando a distribuio dos dados no se aproxima de
uma forma Normal, muitos testes estatsticos so
contra-indicados e o uso deles pode produzir resultados invlidos. Nestes casos, pode-se transformar os dados (calculando-se o logaritmo dos
valores, por exemplo) para que a distribuio assuma uma forma mais prxima da Normal ou
43
REFERNCIAS
1. Altman DG. Practical statistics for medical research.
London: Chapman & Hall; 1997.
44