Anda di halaman 1dari 10

SESIN N 11

Contenidos

Aprendizaje

MEDIDAS DE DISPERSION

Aplicar y calcular la dispersin para determinar la


conclusin de datos.

esperado

MEDIDAS DE DISPERSIN
Al igual que en el mdulo anterior referido a medidas de tendencia central, se va a tomar
como referencia principal las variables cuantitativas, es decir, se usarn trminos como
variable y valores, aunque algunas de estos indicadores tambin se aplican a
caracteres cualitativos o atributos (escalas de medicin ordinal y nominal).
Las medidas de dispersin son aquellas que nos permiten determinar la distancia o
desviacin que existe entre los valores de la variable. Como toda distancia es el recorrido
entre dos puntos habr que ver entonces cules puntos se usan de referencia en cada una
de las medidas que mencionaremos a continuacin.
1. La ms habitual de las medidas de dispersin es la DESVIACION TIPICA raiz
cuadrada de la VARIANZA. Este es un indicador de la dispersin de los datos
respecto a su promedio (MEDIA). Generalmente se expresa en porcentaje a travs
de su conversin en un COEFICIENTE DE VARIACION.
2. Sin embargo, cabe destacar antes de abocarnos a trasmitir el procedimiento de
clculo que su uso lleva, igual que en la media, presupuestos infranqueables, que
es necesario que el alumno revise si se cumplen antes nada. El principal es que la
variable tenga un nivel de medicin por lo menos intervalo de razn.

No debe sorprender al alumno que ambas estn ntimamente ligadas. De hecho el


DESVO ESTANDAR y su expresin en trminos relativos: COEFICIENTE DE

VARIACION, son indicadores del grado de REPRESENTATIVIDAD DE LA MEDIA


respecto a todos los puntos de la distribucin.

3. Igual que antes, si la variable no es por lo menos intervalo debe pasarse a otros
indicadores de centralidad y dispersin. En el caso de las medidas de dispersin,
estos otros indicadores sern el RANGO y el RANGO INTERCUARTLICO.
Por lo tanto, empezaremos por estudiar la VARIANZA, pues las dems medidas
(DESVIACIN TPICA y Coeficiente de Variacin) se derivarn directamente de
su clculo.
POR QUE ESTUDIAR LA DISPERSIN
Usos:
1. Las medidas de dispersin son indicadores que se toman para tener la posibilidad de
establecer comparaciones de diferentes medias Por ejemplo: Si se conoce el valor promedio
de aprobacin de una Facultad en dos perodos distintos, no alcanza con encontrar su
promedio y evaluar sus diferencias, habr que ver tambin cuan dispersos se encuentran los
datos en torno a una u otra medida. Las medidas de dispersin, asimismo, nos darn cuenta
de la representatividad de un promedio, en funcin de observar si estas distancias medidas
en valores relativos (coeficiente de variacin) o absolutos (desvo estndar) son grandes o
pequeas. Que sean pequeas es un indicador de homogeneidad de la poblacin observada.
2. Las medidas de dispersin (sobre todo las relativas) sirven para observar en que
caractersticas (variables) las poblaciones son ms o menos homogneas u heterogneas a
su interior. Si miramos varias distribuciones de sus caractersticas y ordenamos las mismas de
acuerdo a la magnitud del coeficiente de variacin, podremos as concluir cuales son las
caractersticas que dotan a la poblacin de ms homogeneidad (CV ms bajos) y de mayor
heterogeneidad (CV altos)

PROCEDIMIENTOS DE CLCULO:
1. VARIANZA

Se define a la varianza como la media aritmtica de las desviaciones cuadrticas con


respecto a la media.
Dado que existen diferentes formas de recibir los datos, segn lo estudiado, la VARIANZA puede ser
expresada a travs de las siguientes formas equivalentes:
a) Tablas de datos originales: si los valores de una tabla son:
x1; x2; x3; xi
n

S2

(X
i 1

X )2

Por lo tanto, su clculo exige una serie de pasos:


1. se calculan todas las desviaciones con respecto a la media. Esto es x x para
todas las observaciones
2. Se les eleva al cuadrado
3. se realiza su sumatoria trmino a trmino
4. se le promedia entre N
Ejemplo: Se tomo una muestra de edades de la clase del Curso de Estadstica I la cual se
distribuye de la siguiente manera: 38, 26, 22, 41, 22.
la media es de: 29,8
La varianza de los datos es
(38-29,8)2 + (26-29,8)2 + (22-29,8)2 + (41-29,8)2 + (22-29,8)2 = 328,8 = 65,76
5

Obsrvese que la varianza de una variable queda expresada en sus unidades de estudio al
cuadrado. En el ejemplo: 65,76 unidades (p.e. aos) al cuadrado
b) Tablas de frecuencias simples:
En el caso de las tablas de frecuencias simples, igual que en el clculo de la media,
podemos reducir los trminos del clculo de la sumatoria de las distancias cuadrticas de la
frmula anterior, ponderando cada distancia al cuadrado por su respectiva frecuencia. Por

tanto, en este caso la varianza puede ser expresada como el promedio de la suma
ponderada de las distancias con respecto a la media.
n

S2

(X
i 1

X )2 fi
N

Tambin igual que en el clculo de la media en vez de ponderar

cada diferencia por su frecuencia y luego dividir la suma de todos los trminos entre N,
podemos solamente ponderar por su frecuencia relativa
Cmo sera la frmula de la varianza del promedio de materias aprobadas si los mismos
datos estuvieran agrupados en una tabla de frecuencias?. El procedimiento sera el siguiente:
(Xi media)2

Xi media)2 * fi

Materias aprobadas Xi

fi

fr

0,15

3,42

10,27

0,30

0,72

4,34

0,25

0,02

0,11

0,20

1,32

5,29

0,05

4,62

4,62

0,05

9,92

9,92

20

S2

(suma) 34,55

34,55
1,72 materias aprobadas 2
20
c) Tablas de frecuencias con datos agrupados en intervalos de clase

En el caso de las tablas de frecuencias agrupadas en intervalos de clase, dada la prdida del dato
original, en estos casos la varianza debe ser definida como la suma ponderada no de la distancia que
toman los valores originales con respecto a la media - sino de las marcas de clase.

S2

(X
i 1

X )2 fi

Usando el ejemplo anterior:


Materias aprobadas

(Xi media)2

Xi media)2 * fi

Xc

fi

3-6

4,5

14

0,81

11,34

6-9

7,5

4,41

26,46

Li-1 - Li

20

S2

37,80

37,8
1,89 _ materias aprobadas 2
20

Propiedades de la varianza:
1. V[a+bX] = b2 V[X]
La varianza es invariante respecto a un cambio de origen (sumarle una cantidad igual a todos los
valores), pero no es invariante respecto a un cambio de escala (multiplicar por una constante los
valores).
Qu pasara con la varianza de las edades de todos los que estamos en esta clase si nos encontramos
dentro de 10 aos para una fiesta de camaradera y se nos ocurre volver a calcular esa cantidad?
2. V[XY] = V[X] + V[Y] 2 Cov[X,Y]
DESVIACIN ESTNDAR

La desviacin estndar o desviacin tpica es la raz cuadrada (positiva) de la

varianza: S = +

S2

La desviacin estndar tiene la ventaja de que se expresa en las mismas


unidades que la variable en estudio, pero no tiene las propiedades
matemticas de la varianza, por lo que la consideramos un subproducto de la
varianza.

Tomando el ejemplo anterior: La desviacin estndar de los datos del ejemplo anterior es
(para los datos originales) : S= raz de 1,72 = 1,31 materias aprobadas
1. COEFICIENTE DE VARIACION
El coeficiente de variacin es el cociente entre la desviacin estndar y la media:

X
CV =
Muchas veces el coeficiente de variacin se expresa en porcentaje:

X
CV =

*100

El coeficiente de variacin del ejemplo mencionado es:


CV =

8,1 =

27,21%

29,8
El coeficiente de variacin se utiliza para comparar la variabilidad de
caractersticas que tienen diferentes unidades de medidas. Supongamos que
a un investigador le interesa saber si dos poblaciones varan ms en poder
adquisitivo (medido en dlares por ingresos) o en educacin (medida a travs
de los aos de estudio). Resulta difcil comparar pesos contra aos, por lo
que puede acudir al coeficiente de variacin.

Por lo tanto esta medida es til cuando:

Los datos estn en unidades diferentes (como dlares y aos de estudios)

Los datos estn en las mimas unidades, pero las medias muy distantes, ejemplo
de ello son los ingresos de los gerentes ejecutivos y los trabajadores no
calificados.

PRACTICA CALIFICADA N 11
1) Calcular todas las medidas de dispersin para la siguiente distribucin
Xi

10

15

20

25

ni

2) Calcular todas las medidas de dispersin para los datos de la siguiente distribucin
x

0100

100200

200300

300-800

90

140

150

120

3) Una empresa de fabricacin de productos cermicos dispone de tres centros de produccin. En el centro A,
el ms grande y moderno, se hace un estudio de los m de azulejo producidos al mes durante el ao
x A 250.000

pasado, obtenindose una media de produccin mensual


m , con una desviacin tpica
SA = 15.000 m . Se sabe que el centro B, por tener maquinaria ms anticuada que A, produce cada
mes un tercio de la produccin de A, y que el centro C, por tener un horno menos que B, produce cada
mes 25.000 m menos que B Cual es la media y la varianza de la produccin mensual de C?
4) Sumando 5 a cada nmero del conjunto 3, 6, 2, 1, 7, 5, obtenemos 8, 11, 7, 6, 12, 10. Probar que ambos
conjuntos de nmeros tienen la misma desviacin tpica pero diferentes medias cmo estn
relacionadas las medias?.
5) Multiplicando cada nmero 3, 6, 2, 1, 7 y 5 por 2 y sumando entonces 5, obtenemos el conjunto 11, 17, 9 7,
19 15. Cul es la relacin entre la desviacin tpica de ambos conjuntos? Y entre las medias?
6) Tenemos una variable X de la que sabemos que: CV = 0,5 y que Sx = 3. Cul es el valor de la media de
X?.
7) El coeficiente de variacin de la variable X sabemos que es 1 Qu podemos decir sobre su media y su
varianza?
8) Tenemos dos variables X e Y con el mismo recorrido y media, siendo sus varianzas 4 y 9 respectivamente.
Para cual de las dos variables el valor de la media es ms representativo?
9) Sea una variable con media 8 y desviacin tpica 0. Qu se puede afirmar sobre el comportamiento de
esta variable?.

10) La distribucin de edades del Censo Electoral de Residentes a 1 de enero de 1.999 para las comunidades
autnomas de Huaycn y Manchay, en tantos por cien es la siguiente:
Edades

Aragn

Canarias

1618

3.54

4.35

1830

21.56

29.99

3050

31.63

35.21

5070

28.14

21.97

7090

15.12

8.48

a) Representa sobre los mismos ejes de coordenadas los histogramas de la distribucin de la edad
para las dos CC.AA. (emplea distinto trazo o distintos colores). Qu conclusiones obtienes a la vista
de los histogramas?
b) Calcula la edad mediana para las dos comunidades. Compralas. Qu indican estos resultados?
c) Qu comunidad tiene mayor variabilidad en la distribucin de su edad?
11).

En el siguiente histograma se representa la distribucin de los salarios (variable X), en miles de


pesetas de una industria del sector cermico:
0.25
0.2
0.15

Fre cue ncias re lativas

0.1
0.05
0
60

80

100

120

140

160

180

200

Variable X (m arcas de clase )

Conforme a esta informacin determinar


a) Tabla estadstica de frecuencias
b) Salario mediano, moda y coeficiente de variacin

220

240

260

c) Sueldo mnimo del 20% de los empleados con mayor sueldo. Qu porcentaje de la nmina
corresponde a este grupo.
d) De los sueldos de otra empresa tambin perteneciente al sector cermico se sabe que el sueldo
medio de sus trabajadores es de 120.000 ptas., con una varianza de 0,5 y que la mediana de los
sueldos es de 125.000 ptas. Qu empresa tiene un sueldo medio ms representativo? Razona la
respuesta.
12) Al lanzar 200 veces un dado se obtuvo la siguiente distribucin de frecuencias
x

32

35

33

35

Hallar la mediana, la moda y la varianza de la distribucin, sabiendo que la media aritmtica es 3,6.
13) En un taller de reparacin de automviles recojo datos sobre los das de permanencia de los vehculos a
reparar en l, y obtengo:
Das
estancia

de

N de coches

15

23

12

10

a) Calcula el nmero medio de das de permanencia y una medida de su representatividad


b) Cuantos das como mximo permanecen en el taller el 75% de los automviles, que menos
permanecen en el taller?
c) Calcula la mediana y la moda
14) Sea una distribucin de frecuencias con las siguientes caractersticas
Determinar estas medidas para la distribucin yi = xi + 10
2
x 5 sx 2

2
Y 7 sy 8

15) Sean X e Y tales que


;
;
;
los valores de estas dos constantes a y b

estas medidas para la distribucin:

; Mo = 5;

S x2 1,2

; n= 30.

. Sabiendo que yi = axi + b y que a>0, determinar

16) Sea una distribucin con las siguientes caractersticas


yi

x4

x7

; Mo = 5 ;

s x2 3,4

; Me= 6. Determinar

2x i 3
5

17) La siguiente tabla muestra los coeficientes de inteligencia de 480 nios de una escuela elemental.
C.I.

70

74

78

82

86

90

94

98

102

106

110

114

118

122

126

ni

16

28

45

66

85

72

54

38

27

18

11

Calcula:
a) El C.I. medio de los nios estudiados
b) Su desviacin tpica.
c) Si una madre afirma que exactamente la mitad de los nios del colegio tienen un C.I. superior al
de su hijo, qu C.I. tiene el nio?
d) Supongamos que se quieren hacer estudios sobre el proceso de aprendizaje de los nios con
mayor C.I., pero que el psiclogo solo puede atender al 15% de los nios del centro. Qu C.I.
deber tener un nio como mnimo para ser considerado dentro de ese grupo de elegidos?
e) Se van a preparar unas clases de apoyo, para un 25% de los nios del centro, precisamente para
aquellos que tengan menor C.I. Hasta qu nios de qu C.I. deberemos considerar en estas
clases?
18) La tabla siguiente recoge la distribucin (en porcentajes) de volmenes de ventas anuales en las
empresas cermicas de la provincia durante el ao pasado:
Ventas (dlares)

Empresas (%)

menos de 2.500

25,9

2.5005.000

13,2

5.000010.000

13,0

10.00020.000

17,7

20.00040.000

11,0

40.000100.000

14,4

100.000250.000

8,5

250.000500.000

1,8

500.000 o ms

0,6

a) Por qu ni la media ni la desviacin tpica son medidas apropiadas de centralizacin y de


dispersin, respectivamente, para esta distribucin?.
b) Qu medidas de centralizacin y de dispersin deben utilizarse en su lugar?

Anda mungkin juga menyukai