Contenidos
Aprendizaje
MEDIDAS DE DISPERSION
esperado
MEDIDAS DE DISPERSIN
Al igual que en el mdulo anterior referido a medidas de tendencia central, se va a tomar
como referencia principal las variables cuantitativas, es decir, se usarn trminos como
variable y valores, aunque algunas de estos indicadores tambin se aplican a
caracteres cualitativos o atributos (escalas de medicin ordinal y nominal).
Las medidas de dispersin son aquellas que nos permiten determinar la distancia o
desviacin que existe entre los valores de la variable. Como toda distancia es el recorrido
entre dos puntos habr que ver entonces cules puntos se usan de referencia en cada una
de las medidas que mencionaremos a continuacin.
1. La ms habitual de las medidas de dispersin es la DESVIACION TIPICA raiz
cuadrada de la VARIANZA. Este es un indicador de la dispersin de los datos
respecto a su promedio (MEDIA). Generalmente se expresa en porcentaje a travs
de su conversin en un COEFICIENTE DE VARIACION.
2. Sin embargo, cabe destacar antes de abocarnos a trasmitir el procedimiento de
clculo que su uso lleva, igual que en la media, presupuestos infranqueables, que
es necesario que el alumno revise si se cumplen antes nada. El principal es que la
variable tenga un nivel de medicin por lo menos intervalo de razn.
3. Igual que antes, si la variable no es por lo menos intervalo debe pasarse a otros
indicadores de centralidad y dispersin. En el caso de las medidas de dispersin,
estos otros indicadores sern el RANGO y el RANGO INTERCUARTLICO.
Por lo tanto, empezaremos por estudiar la VARIANZA, pues las dems medidas
(DESVIACIN TPICA y Coeficiente de Variacin) se derivarn directamente de
su clculo.
POR QUE ESTUDIAR LA DISPERSIN
Usos:
1. Las medidas de dispersin son indicadores que se toman para tener la posibilidad de
establecer comparaciones de diferentes medias Por ejemplo: Si se conoce el valor promedio
de aprobacin de una Facultad en dos perodos distintos, no alcanza con encontrar su
promedio y evaluar sus diferencias, habr que ver tambin cuan dispersos se encuentran los
datos en torno a una u otra medida. Las medidas de dispersin, asimismo, nos darn cuenta
de la representatividad de un promedio, en funcin de observar si estas distancias medidas
en valores relativos (coeficiente de variacin) o absolutos (desvo estndar) son grandes o
pequeas. Que sean pequeas es un indicador de homogeneidad de la poblacin observada.
2. Las medidas de dispersin (sobre todo las relativas) sirven para observar en que
caractersticas (variables) las poblaciones son ms o menos homogneas u heterogneas a
su interior. Si miramos varias distribuciones de sus caractersticas y ordenamos las mismas de
acuerdo a la magnitud del coeficiente de variacin, podremos as concluir cuales son las
caractersticas que dotan a la poblacin de ms homogeneidad (CV ms bajos) y de mayor
heterogeneidad (CV altos)
PROCEDIMIENTOS DE CLCULO:
1. VARIANZA
S2
(X
i 1
X )2
Obsrvese que la varianza de una variable queda expresada en sus unidades de estudio al
cuadrado. En el ejemplo: 65,76 unidades (p.e. aos) al cuadrado
b) Tablas de frecuencias simples:
En el caso de las tablas de frecuencias simples, igual que en el clculo de la media,
podemos reducir los trminos del clculo de la sumatoria de las distancias cuadrticas de la
frmula anterior, ponderando cada distancia al cuadrado por su respectiva frecuencia. Por
tanto, en este caso la varianza puede ser expresada como el promedio de la suma
ponderada de las distancias con respecto a la media.
n
S2
(X
i 1
X )2 fi
N
cada diferencia por su frecuencia y luego dividir la suma de todos los trminos entre N,
podemos solamente ponderar por su frecuencia relativa
Cmo sera la frmula de la varianza del promedio de materias aprobadas si los mismos
datos estuvieran agrupados en una tabla de frecuencias?. El procedimiento sera el siguiente:
(Xi media)2
Xi media)2 * fi
Materias aprobadas Xi
fi
fr
0,15
3,42
10,27
0,30
0,72
4,34
0,25
0,02
0,11
0,20
1,32
5,29
0,05
4,62
4,62
0,05
9,92
9,92
20
S2
(suma) 34,55
34,55
1,72 materias aprobadas 2
20
c) Tablas de frecuencias con datos agrupados en intervalos de clase
En el caso de las tablas de frecuencias agrupadas en intervalos de clase, dada la prdida del dato
original, en estos casos la varianza debe ser definida como la suma ponderada no de la distancia que
toman los valores originales con respecto a la media - sino de las marcas de clase.
S2
(X
i 1
X )2 fi
(Xi media)2
Xi media)2 * fi
Xc
fi
3-6
4,5
14
0,81
11,34
6-9
7,5
4,41
26,46
Li-1 - Li
20
S2
37,80
37,8
1,89 _ materias aprobadas 2
20
Propiedades de la varianza:
1. V[a+bX] = b2 V[X]
La varianza es invariante respecto a un cambio de origen (sumarle una cantidad igual a todos los
valores), pero no es invariante respecto a un cambio de escala (multiplicar por una constante los
valores).
Qu pasara con la varianza de las edades de todos los que estamos en esta clase si nos encontramos
dentro de 10 aos para una fiesta de camaradera y se nos ocurre volver a calcular esa cantidad?
2. V[XY] = V[X] + V[Y] 2 Cov[X,Y]
DESVIACIN ESTNDAR
varianza: S = +
S2
Tomando el ejemplo anterior: La desviacin estndar de los datos del ejemplo anterior es
(para los datos originales) : S= raz de 1,72 = 1,31 materias aprobadas
1. COEFICIENTE DE VARIACION
El coeficiente de variacin es el cociente entre la desviacin estndar y la media:
X
CV =
Muchas veces el coeficiente de variacin se expresa en porcentaje:
X
CV =
*100
8,1 =
27,21%
29,8
El coeficiente de variacin se utiliza para comparar la variabilidad de
caractersticas que tienen diferentes unidades de medidas. Supongamos que
a un investigador le interesa saber si dos poblaciones varan ms en poder
adquisitivo (medido en dlares por ingresos) o en educacin (medida a travs
de los aos de estudio). Resulta difcil comparar pesos contra aos, por lo
que puede acudir al coeficiente de variacin.
Los datos estn en las mimas unidades, pero las medias muy distantes, ejemplo
de ello son los ingresos de los gerentes ejecutivos y los trabajadores no
calificados.
PRACTICA CALIFICADA N 11
1) Calcular todas las medidas de dispersin para la siguiente distribucin
Xi
10
15
20
25
ni
2) Calcular todas las medidas de dispersin para los datos de la siguiente distribucin
x
0100
100200
200300
300-800
90
140
150
120
3) Una empresa de fabricacin de productos cermicos dispone de tres centros de produccin. En el centro A,
el ms grande y moderno, se hace un estudio de los m de azulejo producidos al mes durante el ao
x A 250.000
10) La distribucin de edades del Censo Electoral de Residentes a 1 de enero de 1.999 para las comunidades
autnomas de Huaycn y Manchay, en tantos por cien es la siguiente:
Edades
Aragn
Canarias
1618
3.54
4.35
1830
21.56
29.99
3050
31.63
35.21
5070
28.14
21.97
7090
15.12
8.48
a) Representa sobre los mismos ejes de coordenadas los histogramas de la distribucin de la edad
para las dos CC.AA. (emplea distinto trazo o distintos colores). Qu conclusiones obtienes a la vista
de los histogramas?
b) Calcula la edad mediana para las dos comunidades. Compralas. Qu indican estos resultados?
c) Qu comunidad tiene mayor variabilidad en la distribucin de su edad?
11).
0.1
0.05
0
60
80
100
120
140
160
180
200
220
240
260
c) Sueldo mnimo del 20% de los empleados con mayor sueldo. Qu porcentaje de la nmina
corresponde a este grupo.
d) De los sueldos de otra empresa tambin perteneciente al sector cermico se sabe que el sueldo
medio de sus trabajadores es de 120.000 ptas., con una varianza de 0,5 y que la mediana de los
sueldos es de 125.000 ptas. Qu empresa tiene un sueldo medio ms representativo? Razona la
respuesta.
12) Al lanzar 200 veces un dado se obtuvo la siguiente distribucin de frecuencias
x
32
35
33
35
Hallar la mediana, la moda y la varianza de la distribucin, sabiendo que la media aritmtica es 3,6.
13) En un taller de reparacin de automviles recojo datos sobre los das de permanencia de los vehculos a
reparar en l, y obtengo:
Das
estancia
de
N de coches
15
23
12
10
2
Y 7 sy 8
; Mo = 5;
S x2 1,2
; n= 30.
x4
x7
; Mo = 5 ;
s x2 3,4
; Me= 6. Determinar
2x i 3
5
17) La siguiente tabla muestra los coeficientes de inteligencia de 480 nios de una escuela elemental.
C.I.
70
74
78
82
86
90
94
98
102
106
110
114
118
122
126
ni
16
28
45
66
85
72
54
38
27
18
11
Calcula:
a) El C.I. medio de los nios estudiados
b) Su desviacin tpica.
c) Si una madre afirma que exactamente la mitad de los nios del colegio tienen un C.I. superior al
de su hijo, qu C.I. tiene el nio?
d) Supongamos que se quieren hacer estudios sobre el proceso de aprendizaje de los nios con
mayor C.I., pero que el psiclogo solo puede atender al 15% de los nios del centro. Qu C.I.
deber tener un nio como mnimo para ser considerado dentro de ese grupo de elegidos?
e) Se van a preparar unas clases de apoyo, para un 25% de los nios del centro, precisamente para
aquellos que tengan menor C.I. Hasta qu nios de qu C.I. deberemos considerar en estas
clases?
18) La tabla siguiente recoge la distribucin (en porcentajes) de volmenes de ventas anuales en las
empresas cermicas de la provincia durante el ao pasado:
Ventas (dlares)
Empresas (%)
menos de 2.500
25,9
2.5005.000
13,2
5.000010.000
13,0
10.00020.000
17,7
20.00040.000
11,0
40.000100.000
14,4
100.000250.000
8,5
250.000500.000
1,8
500.000 o ms
0,6