Anda di halaman 1dari 32

Material de Clases Germn Pomachagua Perez 16-ene-12

Germn Elas Pomachagua Prez


CLASE05: MEDIDAS DE DISPERSION
gpomachagua@hotmail.com
Material de Clases Germn Pomachagua Perez 16-ene-12
Una de las caractersticas importantes en el
anlisis de los datos es la DISPERSIN
VARIABILIDAD.
La dispersin es la cantidad de variacin, de los
datos en torno al promedio.
Las medidas de Dispersin ms usadas son:
MEDIDAS DE DISPERSIN
RANGO
RANGO INTERCUARTILIC0
VARIANZA
DESVIACION ESTANDAR
COEFICIENTE DE VARIACION
Material de Clases Germn Pomachagua Perez 16-ene-12
MEDIDAS DE DISPERSIN
Nos permiten
cuantificar cuan
separados estn los
datos de una
distribucin.

A
=
B

Dispersin A > B
A
B
Material de Clases Germn Pomachagua Perez 16-ene-12
Permite ubicar 50% de los datos
que se encuentran en el centro de
la distribucin
R.I.= Q
3
Q
1

Mide la dispersin en la parte
central de los datos, as que no se
ve influenciada por los valores
extremos.
Es una medida resistente en el
sentido de ser poco sensible a las
observaciones extremas
150 160 170 180 190
0
.
0
0
0
.
0
1
0
.
0
2
0
.
0
3
0
.
0
4
0
.
0
5
150 160 170 180 190
25% 25% 25% 25%
Mn. P
25
P
50
P
75
Mx.
Rango intercuartlico
Rango
2 : RANGO INTERCUARTILICO
Material de Clases Germn Pomachagua Perez 16-ene-12
Ejemplo1: Hallar el Rango Intercuartilico de las edades:
7, 8, 12, 17, 29, 18, 4, 27, 30, 2, 4, 10, 21, 5, 8
El Rango Intercuartilico ser:
Solucin : Primero se ordena en forma ascendente
Estadsticos
EDADES
N Vlidos
15
Perdidos
0
Percentiles 25
5,00
50
10,00
75
21,00
X
(1)
X
(2)
X
(3)
X
(4)
X
(5)
X
(6)
X
(7)
X
(8)
X
(9)
X
(10)
X
(11)
X
(12)
X
(13)
X
(14)
X
(15)


2 4 4 5 7 8 8 10 12 17 18 21 27 29 30
Material de Clases Germn Pomachagua Perez 16-ene-12
Ejemplo2: La tabla muestra la experiencia (en aos) del personal que
labora en el Hospital Central.
a)Entre qu valores se encuentra el
50% intermedio de estos datos?
Rpta:
b)Cul es el rango intercuartlico?
Rpta:

Experiencia
(aos)
Trabajadores
F
0 4 18 18
4 - 8 42 60
8 - 12 68
128
12 - 16 120 248
16 - 20 40 288
20 - 24 34 322
24 - 27 12 334
Total 334
Rango
Intercuartlico
50 %
25 %
Q
3

25 %
Q
1

Material de Clases Germn Pomachagua Perez 16-ene-12
3. VARIANZA: La varianza se define como la media
de las diferencias cuadrticas de todas las
observaciones con respecto a su media
aritmtica.
Se usa
Para comparar dos o ms poblaciones.
En inferencia estadstica
Para calcular el tamao de muestra


Material de Clases Germn Pomachagua Perez 16-ene-12
x
1

x
2

.
.
.
.
.
x
N
Poblacin (X)
Parmetro
o
2

Muestra (X
j
)
x
1j

x
2j

.
.
x
nj
Estimador
S
2

2
2
1
( )
N
i
i
x
N

o
=

=

1
) (
1 1
2
2

=

=
n
x x
s
n
i
2 2
S o de estimador es manera esta De
Material de Clases Germn Pomachagua Perez 16-ene-12
MEDIDAS DE DISPERSIN
DATOS SIN AGRUPAR
1
) (
1
2
2

=
n
x x
S
n
i
i
1
1
2
1 2
2

|
.
|

\
|


=
=
n
n
x
x
S
n
i
n
i
i
i
Calculo
abreviado
DATOS AGRUPADOS
SIN INTERVALOS CON INTERVALOS



1
) (
1
2
2

=
n
x x f
S
m
i
i i
1
) (
1
2
2

'
=

=
n
x X f
S
m
i
i i
Material de Clases Germn Pomachagua Perez 16-ene-12
Ejemplo1 :
Calcular la varianza de los siguientes valores numricos:
5, 9, 11, 7


Primero calculamos el promedio




Entonces la varianza ser




Utilizando la frmula simplificada:


5 9 11 7
x 8
4
+ + +
= =
2 2 2 2
2
(5 8) (9 8) (11 8) (7 8) 9 1 9 1
S 6.667
3 3
+ + + + + +
= = =
2 2 2 2 2
2
(5 9 11 7 ) 4(8)
S 6.667
3
+ + +
= =
1
) (
1
2
2

=
n
x x
S
n
i
i
Material de Clases Germn Pomachagua Perez 16-ene-12
8 8 - 10 = 2 4
10 10 - 10 = 0
0
5 5 - 10 = 5
25
12 12 - 10 = 2
4
10 10 - 10 = 0 0
15
15 - 10 = 5 25
i
X X x
i

( )
2
X x
i

60 X=

( )

= 0 X x
i
10
6
60
= = x
( )

= 58 X
2
x
i
Ejemplo2: La siguiente informacin se refiere al nmero de
radiografas reprocesadas durante una semana.
Calcule la varianza. 8, 10, 5, 12, 10, 15
Primero, elaboramos un cuadro de la forma siguiente:
1
) (
1 1
2
2

=

=
n
x x
s
n
i
6 . 11
1 6
58 2
=

=
S
Material de Clases Germn Pomachagua Perez 16-ene-12
Reemplazando
1
1
2
1 2
2

|
.
|

\
|


=
=
n
n
x
x
S
n
i
n
i
i
i
Ejemplo3: Se uso dos tipos de mquinas para la produccin de un tipo de agujas
descartables. Se tomo una muestra de 5 y se muestran los tiempos en segundos.
A: 14, 24, 46, 50, 70
B: 15, 38, 46, 52, 53
En qu grupo hay mas dispersin?
Material de Clases Germn Pomachagua Perez 16-ene-12
2 . 491
4
8 . 1964
2
= = s
Reemplazando

Usando la frmula en
maquina A
2 . 491
4
8 . 1964
2
= = S

=
=
5
1 i
1
) (
1
2
2

=

=
n
x x
S
n
i
i
Material de Clases Germn Pomachagua Perez 16-ene-12
DATOS AGRUPADOS: sin intervalos
1
) (
1
2
2

=
n
x x f
S
m
i
i i
Ejemplo: En cierta clnica, muestra los das de
permanencia que se distribuye entre sus paciente
Das (xi) N Pacientes(f
j
) Xifi
1 3 3
5 3 15
6 3 18
9 4 36
12 1 12
14 84
Material de Clases Germn Pomachagua Perez 16-ene-12
DATOS AGRUPADOS: con intervalos
1
) (
2
1
2

'
=

=
n
X X f
S
i
i
i
i
X'
<X
i-1
- X
i
] f
i
X
<38 - - 45] 3 45.5 136.5
<45 - - 52] 2 52.5
<52 - - 59] 7 59.5
<59 - - 66] 3 66.5
<66 - -73] 6 73.5
21
Material de Clases Germn Pomachagua Perez 16-ene-12
PROPIEDADES DE LA VARIANZA
Se X una variable tal que X
i :
x
1
, x
2
,.., x
n
1. La varianza de una constante es cero
En este caso X
i :
k, k,..,k i:1, 2..n
0 ) ( ) ( = = K V X V
3. La varianza de una constante multiplicada por una variable mas(o
menos) una constante es igual a:
En este caso Y
i
=ax
i
b i:1, 2..n
) ( ) ( ) ( ) (
2
X V a aX V b aX V Y V = = =
2. La varianza de una constante multiplicada por una variable, es igual
a la constante al cuadrado multiplicada por la varianza de la variable.
Y
i :
kx
i
i:1, 2..n
) ( ) ( ) (
2
X V k kX V Y V = =
Material de Clases Germn Pomachagua Perez 16-ene-12
61 15 7 243
16 22 2 491
. . B es S
. . A es S
= =
= =
1
) (
1
2

=

=
n
x x
S
n
i
i

Luego la desviacin estndar de


4. DESVIACIN ESTNDAR (TPICA): Es la raz cuadrada
de la varianza
MEDIDAS DE DISPERSIN
Material de Clases Germn Pomachagua Perez 16-ene-12
5. COEFICIENTE DE VARIACIN: Es una medida de variabilidad
relativa de los datos, permite comparar la variabilidad de dos o
ms conjuntos de datos.
100 . . =
X
s
V C
Tipo
s
C.V.
A 40.8 22.16 0.5431
B 40.8 15.61 0.3826
X
Si el Coeficiente de Variacin es:
< 5% ----> datos muy homogneos, Media
aritmtica muy representativa

5% s CV < 20% ----> datos con homogeneidad
aceptable. La media aritmtica es
representativa

Si el CV > 20% ----> datos heterogneos, la
media aritmtica es poco representativa

Material de Clases Germn Pomachagua Perez 16-ene-12
Material de Clases Germn Pomachagua Perez 16-ene-12
MEDIDAS DE FORMA
Las medidas de forma permiten comprobar si una distribucin de frecuencia
tiene caractersticas especiales como simetra, asimetra, nivel de
concentracin de datos y nivel de apuntamiento que la clasifiquen en un tipo
particular de distribucin.
En este capitulo analizaremos dos medidas de forma:
1) Coeficiente de asimetra
2) Curtosis
Las medidas de forma son necesarias para determinar el comportamiento de los
datos y as, poder adaptar herramientas para el anlisis probabilstico.
Material de Clases Germn Pomachagua Perez 16-ene-12
Estadsticos para detectar asimetra
Hay diferentes estadsticos que sirven para detectar asimetra.
Coeficiente de simetra de Pearson: Se usa solo en datos unimodales




Basado en la diferencia entre el 1 y 2 cuartiles y 2 y 3.
Basados en desviaciones con signo al cubo con respecto a la media.




Calculados con ordenador. Es pesado de hacer a mano.
En funcin del signo del estadstico diremos que la asimetra es positiva o
negativa.
S
M x
As
e)
( 3
=
3
1
3
1
( )
n
i
i
x x
n
As
s
=

=

Material de Clases Germn Pomachagua Perez 16-ene-12
x
8 10 12 14 16 18 20
0
.
0
0
0
.
0
5
0
.
1
0
0
.
1
5
0
.
2
0
8 10 12 14 16 18 20
x s
78 %
x
-2 -1 0 1 2 3
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
0
.
5
-2 -1 0 1 2 3
x s
66 %
x
0 2 4 6 8 10 12 14
0
.
0
0
0
.
0
5
0
.
1
0
0
.
1
5
0
.
2
0
0 2 4 6 8 10 12 14
x s
78 %
Asimetra negativa
As<0
Asimetra nula
(simtrica) As=0
Asimetra positiva
As>0
<Me<Mo
=Me=Mo >Me>Mo
Las medidas de asimetra se dirigen a elaborar un indicador que
permita establecer el grado de simetra (asimetra) que presenta la
distribucin, sin la necesidad de llevar a cabo su representacin
grafica (histograma)
Material de Clases Germn Pomachagua Perez 16-ene-12
Curtosis
La curtosis nos indica el grado de apuntamiento
(aplastamiento) de una distribucin con respecto a la
distribucin normal (distribucin simtrica).
Indican el nivel de concentracin de los datos
respecto a su media.


3
) (
1
4
1
4

=

=
s
x x
n
K
n
i
i
Material de Clases Germn Pomachagua Perez 16-ene-12
Apuntamiento o curtosis
Platicrtica (aplanada): curtosis < 0




Aplanada
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
5
1
.
0
1
.
5
2
.
0
0.0 0.2 0.4 0.6 0.8 1.0
x s
57 %
Apuntada como la normal
-3 -2 -1 0 1 2 3
0
.
0
0
.
1
0
.
2
0
.
3
-3 -2 -1 0 1 2 3
x s
68 %
Apuntada
-2 -1 0 1 2
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
-2 -1 0 1 2
x s
82 %
Mesocrtica (como la normal): curtosis = 0
Leptocrtica (apuntada): curtosis > 0
sern de especial
inters las mesocrticas
y simtricas (parecidas
a la normal).
Material de Clases Germn Pomachagua Perez 16-ene-12
Reporte de SPSS



Estadsticos
5 5
0 0
40,80 40,80
9,912 6,981
46,00 46,00
22,163 15,611
491,200 243,700
,070 -1,515
,913 ,913
-1,107 2,140
2,000 2,000
56 38
14 15
70 53
19,00 26,50
46,00 46,00
60,00 52,50
Vlidos
Perdidos
N
Media
Error tp. de la media
Mediana
Desv. t p.
Varianza
Asimetr a
Error tp. de asimetra
Curtosis
Error tp. de curtosis
Rango
Mnimo
Mximo
25
50
75
Percentiles
A B
Material de Clases Germn Pomachagua Perez 16-ene-12
Reporte de Minitab
70 60 50 40 30 20 10
Median
Mean
70 60 50 40 30 20 10
Anderson-Darling Normality Test
Variance 491,200
Skewness 0,06988
Kurtosis -1,10743
N 5
Minimum 14,000
A-Squared
1st Quartile 19,000
Median 46,000
3rd Quartile 60,000
Maximum 70,000
95% Confidence Interv al for Mean
13,281
0,21
68,319
95% Confidence Interv al for Median
14,000 70,000
95% Confidence Interv al for StDev
13,279 63,687
P-V alue 0,730
Mean 40,800
StDev 22,163
95% Confidence Intervals
Summary for A
Material de Clases Germn Pomachagua Perez 16-ene-12
Reporte de Minitab
50 40 30 20
Median
Mean
60 50 40 30 20 10
Anderson-Darling Normality Test
V ariance 243,700
Skewness -1,51515
Kurtosis 2,13976
N 5
Minimum 15,000
A-Squared
1st Quartile 26,500
Median 46,000
3rd Quartile 52,500
Maximum 53,000
95% Confidence Interv al for Mean
21,417
0,43
60,183
95% Confidence Interv al for Median
15,000 53,000
95% Confidence Interv al for StDev
9,353 44,859
P-V alue 0,171
Mean 40,800
StDev 15,611
95% Confidence Intervals
Summary for B
Material de Clases Germn Pomachagua Perez 16-ene-12
ANALISIS EXPLORATORIO DE DATOS
Antes de proceder a cualquier anlisis se debe
hacer un Anlisis Exploratorio que nos permita
ver la naturaleza de los datos.
El Anlisis exploratorio se usa par detectar
valores atpicos (outliers) es decir valores que
no son igual al resto
Material de Clases Germn Pomachagua Perez 16-ene-12
Diagrama de Caja y Bigotes
Escala
Q
1
Q
3
mediana
Max
Min
*
Dato
atpico
Material de Clases Germn Pomachagua Perez 16-ene-12
Ejemplo 1: Sean los puntajes de un grupo de trabajadores y ver si hay outliers
150 151 150 147 155 145 151 152 150 149
166 142 158 153 144 190 145 147 151 156
ORDEN PUNTAJES
1 142
2 144
3 145
4 145
5 147
6 147
7 149
8 150
9 150
10 150
11 151
12 151
13 151
14 152
15 153
16 155
17 156
18 158
19 166
20 190
SOLUCION: Primero ordenar los datos
Material de Clases Germn Pomachagua Perez 16-ene-12
Ejemplo 1: Los trabajadores de cierta empresa tienen un sueldo promedio de $383.29,
con una varianza de 30.571 ($)
2
. Si a cada trabajador se le aumenta el sueldo en 8%
ms un bono de $10.5.
a) Determine el sueldo promedio y la varianza luego del aumento.
b) En porcentaje en cual hay mas variabilidad antes o despus del aumento
Ejemplo 2: En una Empresa donde los salarios tienen una media de $100 y una
desviacin estndar de $10, el sindicato solicita que cada salario X, se transforme en Y,
mediante la siguiente relacin Y = 2,5 X +10. El Gerente acoge la peticin rebajando los
salarios propuestos por el sindicato en10%, lo que es aceptado. Qu distribucin de
salarios es ms homognea? Qu propuesta prefieren los trabajadores?
Ejemplo 3 : El coeficiente de variacin de los salarios pagados a 200 trabajadores de
una empresa es del 30%. Con el aumento de 100 soles a cada trabajador, el nuevo
coeficiente de variacin sera del 25% Qu cantidad debe tener disponible la
compaa para hacer efectiva la nueva planilla? .Rpta: S/.120,000
Material de Clases Germn Pomachagua Perez 16-ene-12
Ejemplo4: En un proceso de reorganizacin una empresa pblica fue sometida a
evaluacin mediante una prueba de conocimientos con escala de calificacin
centesimal. Las puntuaciones obtenidas fueron tabuladas en un cuadro de
frecuencias con 7 clases de igual amplitud. Si la puntuacin mnima es de 30
puntos, la media aritmtica es de 61.5 y las frecuencias acumuladas porcentuales
de los intervalos del 1 al 6 son respectivamente: 8, 23, 43, 73, 91 y 97.
Identificar el tipo de asimetra que presenta esta distribucin.
a) Calcular e interpretar el coeficiente de variacin..
b) Si la empresa tiene 2000 trabajadores y el directorio acuerda promocionar a
todos los empleados con una puntuacin superior a la media + S. Cuntos
trabajadores sern promovidos?.

Anda mungkin juga menyukai