Anda di halaman 1dari 39

MEDIDAS DE

DISPERSIN Y ASIMETRA

OBJETIVOS
1. Calcular e interpretar las principales medidas de
dispersin:
A) Rango
B) Rango intercuartlico
C) Varianza
D) Desviacin estndar
E) Coeficiente de variabilidad
2. Calcular e interpretar las principales medidas de la
forma de la distribucin.
A) Coeficiente de asimetra
B) Coeficiente de curtosis

CONTENIDO
1. MEDIDAS DE DISPERSIN
1.1 Rango
1.2 Rango intercuartlico
1.3 Varianza
1.4 Desviacin estndar
1.5 Coeficiente de variabilidad
2. MEDIDAS DE LA FORMA DE LA DISTRIBUCIN
2.1 Asimetra
2.2 Curtosis
3

LAS MEDIDAS DE DISPERSIN


Llamadas tambin medidas de variabilidad
Son tiles porque:
1. Permiten juzgar la confiabilidad de la medida de
tendencia central.
2. Los datos demasiados dispersos tienen un
comportamiento especial.
3. Es posible comparar dispersin de diversas
muestras.

6.1.1 EL RANGO (R)


Llamado tambin recorrido, amplitud total o
alcance.
a) Obtencin: se obtiene de la influencia entre
el dato mayor y el dato menor ms una unidad
significativa, a fin de incluir ambos
valores
extremos.

Ejemplo:
Los siguientes datos representan el peso de 10 cajas con
mercancias (en Kg.). Calcule e interprete el rango.
2,860 3,150 3,450 2,950 3,780
4,170 3,920 3,280 4,050 3,120
Rango = (4,170 - 2,860) + 0.001
Rango = 1,311 Kg.

b) Interpretacin
La diferencia entre la caja de mayor peso y la caja de
menor peso es 1,311 Kg.
c) Clculo a partir de datos agrupados, se utiliza
siguiente frmula:
R= (Ls - Li ) + 1
donde:

la

: Limite superior de la
ltima clase
: Limite inferior de la
primera clase
7

Ejemplo:
La distribucin de frecuencias siguiente representa el tiempo
que espera un cliente de un Banco para ser atendido en la
ventanilla. Calcule e interprete el rango
Rango = (36-12) + 1
R = 25 minutos

Interpretacin: la diferencia de tiempo entre el cliente que ms


espera y el que menos espera para ser atendido en la ventanilla
es 25 minutos.
8

f) Ventajas y desventajas del rango


Ventajas
fcil de calcular
fcil de entender e interpretar
Desventajas
slo considera los valores extremos
no toma en cuenta ni el nmero de datos ni
el valor de estos
no es posible calcular en tablas con
extremos abiertos.
9

6.1.2 EL RANGO INTERCUARTLICO


Permite ubicar el
50% de los datos que
se encuentran en el
centro de la
distribucin, es decir,
el 25% de los datos
son menores al
primer cuartil y
tambin 25% de los
datos son mayores al
tercer cuartil.
10

Ejemplo:

La tabla muestra la experiencia (en aos) del personal


administrativo que labora en el Industria Textil
Experiencia
Trabajadores
(aos)
0-3
18
4-7
42
8 - 11
68
12 - 15
120
16 - 19
40
20 - 23
34
24 - 27
12
Total
334

A)Entre
qu
valores
se
encuentra el 50%
intermedio
de
estos datos?
B)Cul es el rango
intercuartlico?
11

50 %

25 %

25 %

Q1

Q3
Rango Intercuartlico

Lugar Q1 P25

25(334) 60 1

100

Q 7.5
1

25(334)
83.5o se ubica en la 3ra clase
100

68

Q 8.82 aos
1

12

Lugar Q 3 P75

75(334)
250.5o se ubica en la 5ta clase
100

75(334) 248 1

100

Q 15.5

40

Q 15.65 aos
3

A. El 50% de los trabajadores con


experiencia intermedia se encuentran
entre 8,82 y 15,65 aos.
B. El rango intercuartlico es 6 aos 10
meses aproximadamente
13

6.1.3 LA DESVIACIN CUARTLICA


Es una medida de variabilidad fcil de calcular. Es la
mitad del rango intercuartil. Mide la dispersin del
50% central de las observaciones respecto a la
mediana.
Es imposible tener una DC negativa. Es raro, pero
podra tener un valor igual a 0, en el caso que los
percentiles sean iguales (P75 = P25). Cuando mayor
sea la diferencia entre los percentiles, mayor ser el
valor de la DC.
P75 P25
DC
2
14

Ejemplo:
Si P25 = 7,2
P75 = 13,4

13,4 7,2
DC
3,1
2

Interpretacin:
50% central de las observaciones vara en 3,1 con
respecto a la mediana.

15

6.1.3 LA VARIANZA
Es una medida de desviacin promedio con respecto
a la media aritmtica
a) Clculos a partir de datos no agrupados.
n

para una muestra

(X x )
i 1

n 1
N

para un poblacin

(X )
i 1

N
16

Ejemplo:
La siguiente informacin se refiere al nmero
de radiografas reprocesadas
durante una
semana. Calcule la varianza. 8, 10, 5, 12, 10,
15
Primero, elaboramos un cuadro
de la forma
2
Xi x
x
Xi x
siguiente:
8

8 - 10 = 2

10
5

10 - 10 = 0
5 - 10 = 5

12

12 - 10 = 2

25
4

10

10 - 10 = 0
15 - 10 = 5

0
25

15
X 60

4
0

Xi x 0 Xi x

60
x
6
x 10
2

58
17

X i x 58
2

(X i x )

n 1

58
S 6 1 11.6
2

18

6.1.4 LA DESVIACIN ESTNDAR


Llamada tambin desviacin tpica representa la
variabilidad (o desviaciones) promedio de los datos con
respecto a la media aritmtica. Es la raz cuadrada de la
varianza, sea poblacional o muestral.
a) Clculos a partir de datos no agrupados
n

para la muestra

(X i x )
i 1

n 1

para la poblacin

2
(Xi )

i 1

N
19

Ejemplo:
La siguiente informacin se refiere al nmero
de radiografas reprocesadas durante una
semana. Calcule la desviacin estndar.
8, 10, 5, 12, 10, 15
Ya sabemos por el ejemplo anterior que S2 =
11,6 Entonces
2
S

S 11,6
S 3,4 radiografias
20

6.1.5 EL COEFICIENTE DE VARIACIN


Es una medida relativa de variabilidad de los datos.
Permite comparar la variabilidad de dos o ms
conjuntos de datos expresados en unidades diferentes
(peso: Kg. y libras).
a) Clculos a partir de datos no agrupados
para la muestra:

s
CV 100
x

para la poblacin:

CV
100

21

Ejemplo:
A continuacin se presentan las tarifas (en
unidades monetarias) de dos proveedores
de telefona celular. El proveedor I tiene
sus tarifas en soles y el proveedor II en
dlares Cul de ellos tiene un plan
tarifario ms homogneo o estable?.
Proveedor I (soles)
(dlares)

Proveedor II

40,70,60,48,52,65,58
70,35,150,140,82,110,140,120

Calculamos la media y desviacin estndar


22
por cada una de los proveedores

Proveedor I
n

x
x

Xi
i 1

393

56.14
7

Xi x

Xi x

40

-16.14

70
60

13.86
3.86

48

-8.14

14.90
66.26

52

-4.14

17.14

65

8.86
1.86

78.50
3.46

58

X 393

Xi x 0

260.50
192.10

Xi x

632,86

23

Si X i x 632.86
2

2
(
X

x
)

i 1

n 1

632.86
10.27
7 1

S
CV 100
x
10.27
CV
100 18.29
56.14
24

Proveedor II

Xi

i 1

847
105.87
8

Xi x

Xi x

70

-35.87

1286.6569

35

-70.87

5022.5569

150

44.13

1947.4569

140

34.13

1164.8569

82

-23.87

569.7769

110

4.13

17.0569

140

34.13

1164.8569

120

14.13

199.6569

847

Xi x 0,04

Xi x

11372,88

25

n
Si X i x
i 1
n

(X i

i 1

11372 .88

x)

n 1

S
CV 100
x

11372,88
40.30
8 1

40,30
CV
100 30,06
105,87

El proveedor II presenta una mayor


variabilidad en el plan tarifario.
26

6.2 MEDIDAS DE ASIMETRIA O SESGO


6.2.1 Coeficiente de Asimetra

Es un indicador del grado de asimetra que presenta


una distribucin.
S kp

3( X Md )

Valores posibles
S kp

3 asimetra

3 asimetra

negativa
positiva
27

Si Skp tiende a 3 la distribucin es asimtrica hacia la


derecha o asimetra positiva.
Si Skp tiende a -3 la distribucin es asimtrica a la
izquierda o asimetra negativa.
En distribuciones simtricas, no existe sesgo, es
decir Skp = 0.
En la prctica, el coeficiente de Asimetra de Pearson
vara entre -1 y +1
28

6.2.2 COEFICIENTE DE
CURTSIS
Es una medida del grado de apuntalamiento,
generalmente comparada con el apuntalamiento
de la distribucin normal.

0,5( P0 , 75 P0 , 25 )
Ku
P0 , 9 P0 ,1

29

Valores posibles
a) Leptocrtica (concentracin al centro): Si el grado de
apuntalamiento de una distribucin es mayor que el de la
distribucin normal. K 0,5
b) Mesocrtica (distribuidos simtricamente): Si el grado de
apuntalamiento de una distribucin es igual que el de la
distribucin normal. K 0,25
c) Platicrtica (aplanada).Si el grado de apuntalamiento de una
distribucin es menor que el de la distribucin normal. 0 K
0,25

Leptocrtica
0,50

Mesocurtica
0,25

Platicurtica
0,0
30

Ejemplo:
La tabla muestra la edad (en aos) de 70 pacientes atendidos
en el servicio de emergencia de un hospital local.
4
3
5
6
7
25
13
2
4
5

67
85
6
7
7
10
12
15
16
17

18
15
16
17
15
13
13
14
20
14

15
15
15
16
17
17
13
14
16
17

11
14
13
10
6
4
8
14
18
20

3
5
7
8
12
15
17
18
20
21

24
26
21
22
17
16
9
9
15
12

A) Calcular e interpretar la asimetra de la


distribucin
B) Calcular e interpretar la curtosis de la

31

Los resultados han sido obtenidos usando Microsoft


Excel

Media aritmetica
Desviacion estandar
Mediana
Cuartil 1
Cuartil 3
Percentil 90
Percentil10

14.27
3(14,27 13,50)
S kp
0,202
11.42
11,42
13.50
7.00
0,5(17,00 7,00)
Ku
0,263
17.00
23,00 4,00
23.00
4.00

32

HOJA DE COMPROBACIN
1. El valor de cada observacin del conjunto de datos se toma en cuenta
cuando calculamos su mediana
2. Cuando la poblacin esta sesgada positiva o negativamente, a menudo es
preferible utilizar la mediana como mejor medida de posicin, debido a
que siempre cae entre la media y la moda
3. Las medidas de tendencia central de un conjunto de datos se refieren al
grado en que las observaciones estn dispersas
4. Una medida de la agudeza de una curva de distribucin es el sesgo
5. Con un conjunto de datos no agrupados, la moda se utiliza con mas
frecuencia como medida de tendencia central
6. Si organizamos las observaciones de un conjunto de datos en orden
descendente, el punto de datos que se encuentra en medio es la mediana
del conjunto de datos
33

7. Cuando se trabaja con datos agrupados, podemos calcular una media


aproximada si suponemos que cada valor de una clase dada es igual a su
punto medio
8. El valor que ms se repite en un conjunto de datos se conoce como media
aritmtica
9.Para un arreglo de datos con 50 observaciones, la mediana ser el valor de
la observacin numero 25 del arreglo
10.La desviacin estndar se mide en las mismas unidades que las
observaciones del conjunto de datos

34

11. Si la curva de una cierta distribucin tiene el extremo mas largo


hacia la izquierda de la escala de medicin del eje horizontal, se dice que
la distribucin esta negativamente sesgada
12.Despus de agrupar un conjuntos de datos en un cierto numero de clases,
podemos identificar la clase mediana como la que tiene el mayor numero
de observaciones
13.Una media calculada a partir de un conjunto de datos agrupados siempre
da una buena estimacin del valor real, aunque rara vez es exacto
14..Podemos calcular una media para cualquier conjunto de datos, si se nos
da su distribucin de frecuencias
15..La moda siempre se encuentra en el punto mas alto de una grfica de un
arreglo de datos
16. El numero de elementos de una poblacin se denota con n
35

17.Los valores extremos de un conjunto de datos tienen un fuerte efecto sobre


la mediana
18.La diferencia entre las observaciones mas alta y mas baja de un conjunto
de datos se conoce como media geomtrica
19.La dispersin de un conjunto de datos da una cierta visin de la
confiabilidad de la medida de tendencia central
20.La desviacin estndar es igual a la raz cuadrada de la varianza
21. .La diferencia entre las observaciones mas alta y mas baja de un conjunto
de datos se conoce como el alcance cuartil
22. El alcance intercuartil esta basado solamente en dos valores tomados del
conjunto de datos
36

23.Un fractil es una posicin en una distribucin de frecuencias


en la que una determinada fraccin (o porcin) de los datos esta
situada en ella o por encima
24.La varianza, al igual que la desviacin estndar, toma en cuenta cada una
de las observaciones del conjunto de datos
25. .El coeficiente de variacin es una medida absoluta de la dispersin
26. La medida de dispersin que con mas frecuencia utilizan los especialistas
en estadstica es la desviacin estndar
27.Una de las ventajas de las medidas de dispersin es que cualquier
estadstica que mide variacin absoluta, tambin mide variacin relativa
28. Una desventajas de utilizar el alcance para medir la dispersin es que no
toma en cuenta la naturaleza de las variaciones entre la mayora de las
observaciones
37

29.La varianza indica la distancia promedio de cualquier


observacin del conjunto de datos con respecto a la media
30. Cada poblacin tiene una varianza que se simboliza con S2
31.De acuerdo con el teorema de Chebyshev, no mas de 11% de las
observaciones de una poblacin puede tener resultados estndar de la
poblacin mayores que 3 o menores que -3
32.El alcance intercuartil es un ejemplo especifico de un alcance interfractil
33.Es posible medir el alcance de una distribucin de extremo abierto
34.El alcance intercuartil mide el alcance promedio de la cuarta parte ms
baja de una distribucin.

38

El sordo cree
que los que bailan
estn locos.
Si tu no escuchas,
es probable que
puedas
estar pensando de
una manera
semejante.
ESCUCHA!

39

Anda mungkin juga menyukai