Anda di halaman 1dari 19

Medidas de dispersin

1.Una medida de dispersin cuantifica el grado de variabilidad


o dispersin de los datos respecto a la medida de tendencia
central correspondiente. Estas medidas tiene la propiedad de
que si los datos estn ampliamente extendidos, la medida ser
alta; y cuando los datos se encuentran muy agrupados, ser
baja.
Las medidas de dispersin ms frecuentes son:
1. Varianza y desviacin estndar poblacional (2, ) y varianza y
desviacin estndar muestral (s2, s)
2. Rango y Rango intercuartil
3. Coeficiente de variacin (CV).

Desviacin Estndar y Varianza


2

La desviacin estndar y varianza, de un conjunto de n


mediciones (Datos sueltos) se calcula como sigue:
La varianza muestral es igual a:

La desviacin estndar muestral es igual a:

Una frmula prctica para calcular la desviacin estndar es:

Estas medidas son siempre positivas y sus unidades de medida


son las mismas que los datos originales en el caso de la
desviacin estndar.

Desviacin Estndar
3

Para datos individuales, la desviacin estndar se calcula por:

Para datos agrupados, la desviacin estndar se calcula por:

Propiedades de la Desviacin Estndar


4

Ejemplo:

Calcular la desviacin estndar de los sueldos de diez


personas que ganan en dlares: 170; 172; 168; 165; 173;
178; 180; 165; 167; 172; sabiendo que el promedio es de
171.

Estos sueldos tienen una desviacin estndar de 5,1 dlares.

Propiedades de la Desviacin Estndar


5

Ejemplo: Calcular la desviacin estndar de 31 seoras,


cuyas medidas se dan a continuacin y sabiendo que el
promedio es de 1,52.
Frec.
Estat
Absol

ura
uta
1,45
2
1,48
4
1,5
5
1,53
8
La estatura
1,55 de
12 las
TOTAL
estndar de
7 cm.

4,21
8,76
11,25
18,73
seoras
28,83
71,77

analizadas tiene una desviacin

Propiedades de la Desviacin Estndar


6

Ejemplo: Sea una muestra de 70 personas, distribuidas por


edad segn como sigue, calcular , sabiendo que :
Marca
de
Interval
Edad
clase
os
(aos)
Reales
(MCj)
15-19
20-24
25-29
30-34
35-39
Total

14,5-19,5
19,5-24,5
24,5-29,5
29,5-34,5
35,5-39,5

17
22
27
32
37

8
19
23
14
6
70

8
27
50
64
70

11,4
27,1
32,9
20,0
8,6
100,0

11,4
38,5
71,4
91,4
100,0

2312
9196
16767
14336
8214

50825

Propiedades de la Desviacin Estndar


7

Se expresa en las mismas unidades que los datos originales.


En su clculo intervienen todos los valores de la distribucin.
Es nica.
Se ve muy afectada por la presencia de valores atpicos.
La varianza y la desviacin estndar poblacionales difieren
en su clculo de la varianza y la desviacin estndar
muestrales, debido a que en el clculo de estos ltimos se
toman en cuenta los grados de libertad (n-1) antes que el n
(tamao de la muestra). Tambin es debido a que la
desviacin estndar es un estimador insesgado.

Rango y Rango intercuartil


8

El rango o recorrido de mediciones es igual a la diferencia


entre los valores mayor y menor de las mismas:

Propiedades del rango

En su calculo solo intervienen los dos valores extremos de la


distribucin y por ello se ve muy afectado por la presencia de
valores atpicos.
Es fcil de calcular.

Rango y Rango intercuartil


9

El rango intercuartil (RIQ) de un conjunto de datos es igual a


la diferencia entre los cuartiles superior e inferior, es decir:

Propiedades del rango intercuartil

Se ve poco afectado por la presencia de valores atpicos.


En su determinacin no interviene la totalidad de los datos.
Es fcil de calcular.

Coeficiente de variacin
10

El coeficiente de variacin (CV), es igual a la desviacin


estndar dividido por la media, es decir:

Si un conjunto de datos es homogneo, ; si , los datos podran


ser heterogneos.

Coeficiente de variacin
11

Ejemplo:

Calcular CV del sueldo de diez personas que ganan en


dlares: 170; 172; 168; 165; 173; 178; 180; 165; 167; 172;
sabiendo que el promedio es de 171 y la s=5,1.

Los datos de sueldos son homogneos es decir su variacin


es relativamente pequea.

Propiedades del Coeficiente de Variacin


12

Es una medida adimensional.


En su clculo intervienen todas las observaciones, pudiendo
ser muy influido por valores atpicos.
Puede ser difcil de interpretar.
Pierde significado si el promedio es igual a cero.
Es til para comparar la variabilidad relativa de datos de dos
o ms distribuciones de variables diferentes.

Medidas de Forma
13

Las medidas de forma de una distribucin se clasifican en dos grupos:


medidas de asimetra y medidas de curtosis.

Simetra

Curtosis

Asimetra
14

El coeficiente de asimetra de una variable mide el grado de asimetra de la


distribucin de sus datos en torno a su media. Es adimensional y se define
como sigue:

Las colas de una variable estn constituidas por los valores alejados de la
media (valores extremos). Una variable es asimtrica si su cola a un lado es
ms larga que su cola al otro y simtrica si ambas colas son iguales de largas.

Si , la distribucin ser asimtrica a la derecha (La cola derecha es ms larga


que la cola izquierda).

Si , la distribucin ser simtrica (Ambas colas son igual de largas).

Si , la distribucin ser asimtrica a la izquierda (La cola izquierda es ms


larga que la cola derecha).

Apuntamiento o curtosis
15

El coeficiente de curtosis de una variable mide el grado de concentracin de


los valores que toma en torno a su media. Se toma como referencia una
variable con distribucin normal, de tal modo que para ella el coeficiente de
curtosis es 0.

Segn su apuntamiento, una variable puede ser:

Leptocrtica, si , es decir, es ms apuntada que la normal. Los valores que


toma la variable estn muy concentrados en torno a su media y hay pocos
valores extremos.

Mesocrtica si , es decir, es tan apuntada como la normal.

Platicrtica si , es decir, es menos apuntada que la normal. Hay muchos


valores extremos, las colas de la variable son muy pesadas.

Medidas de Forma
16

Ejemplo:

Calcular CV del sueldo de diez personas que ganan en


dlares: 170; 172; 168; 165; 173; 178; 180; 165; 167; 172;
sabiendo que el promedio es de 171 y la s=5,1.

Los datos de sueldos son levemente asimtricos, con


asimetra hacia la derecha; tambin, son platicrticos, con
posible presencia de valores atpicos..

Otra representacin grfica


17

Diagrama de caja: Consultar sobre este grfico as como tambin, aplicarlo


en la deteccin de valores extremos de 4 casos particular de su inters (A
mano mximo 4 fojas individualmente).

Miscelnea
18

La descripcin adecuada de los datos cuantitativos implica


examinar la tendencia central, junto con la dispersin y la
asimetra.
Se debe elegir adecuadamente las medidas descriptivas: la
media con la desviacin estndar; la mediana, con la
desviacin cuartil por ejemplo.

Taller en clase
19

Mediante los datos de MEDIDAS TENDENCIA


CENTRAL_IEI.xlsx estudiar todas las medidas de dispersin
y forma para la variable edad.

Anda mungkin juga menyukai