LA
ESTADSTICA.
MEDIDAS
DE
RESUMEN
Despus de recopilar y resumir los datos, las medidas de resumen descriptivas son tiles para describir, analizar e interpretar datos cuantitativos. Un conjunto de datos pertenecientes a una variable aleatoria numrica, posee tres propiedades que lo describen: la posicin, la variabilidad y la forma. Se utilizan una gran variedad de medidas descriptivas (estadsticos) para resumir las caractersticas salientes de un conjunto de datos: Media Aritmtica Media Aritmtica Ponderada Mediana Moda Cuartiles Deciles Percentiles
MEDIDAS DE POSICIN CENTRAL La posicin o tendencia central es la caracterstica ms importante que describe o resume un conjunto de datos, es el punto alrededor del cual se agrupan la mayora de los datos de la distribucin. La Media ( ) La media o promedio formaliza el concepto de punto de equilibrio o centro de gravedad de las observaciones. Es un valor representativo de los datos. Como por ejemplo
la nota promedio obtenida por un grupo de estudiantes, el nmero de hijos promedio por familia en un pas. Dado un conjunto de n valores x1, x2, x3,xn, la media se representa mediante y se obtiene dividiendo la suma de todos los valores entre la cantidad de valores, es decir,
i n
+ + + 1 2 3 n
+ n
i =1
Ejemplo: Se tienen datos sobre el tiempo de arranque de un motor en segundos: 1.75; 1.92; 2.62; 2.35; 3.09; 3.15; 2.53; 1.91. Calcular la media.
= 1.75 + 1.92 + 2.62 + 2.35 + 3.09 + 3.15 + 2.53 + 1.91 19 .32 = = 2.42 segundos 8 8
MEDIDAS DE VARIABILIDAD La variabilidad o dispersin es la segunda caracterstica ms importante que describe un conjunto de datos, miden la cantidad de variacin o diseminacin de los datos. Dos conjuntos de datos pueden diferir tanto en tendencia central como en dispersin, o bien pueden tener la misma tendencia central y diferir en la variabilidad. El Rango (R) Para un conjunto de datos el recorrido o rango es la diferencia entre el dato mayor y el dato menor de dicho grupo de datos.
R = M - X m
Una de las desventajas del rango es que no proporciona informacin sobre los datos que estn entre el dato mayor y el menor. Ejemplo: Calcular el rango para los datos de tiempo de arranque del motor.
R = 3 .1 5 1.7 = 1.4s g n o 5 euds
La Varianza (S2) y la Desviacin Estndar (S) Estas son las medidas de dispersin ms utilizadas y toman en cuenta como estn distribuidos los datos. La varianza (S2) de un conjunto de datos se define como el promedio del cuadrado de las diferencias entre cada dato individual con respecto a la media de stos.
i n
S2 =
i =1
)2
Siendo Xi = los datos individuales i = 1, 2, 3,..n = media de los datos n = nmero total de datos Las unidades en que viene expresada la varianza son el cuadrado de las unidades de la variable que se est estudiando, resultando difcil de interpretar. Por esta razn se prefiere trabajar con la Desviacin Estndar, que es la raz positiva de la Varianza y se expresa en las mismas unidades de la variable que se est estudiando.
S= + S2
La Varianza y la Desviacin Estndar miden la dispersin promedio en torno a la media, es decir, como fluctan los datos por encima o por debajo de la media. Mientras mayor sea la extensin de los datos mayor ser el Rango, la Varianza y la Desviacin Estndar. Ejemplo: Calcular la Varianza y la Desviacin Estndar para los datos de tiempo de arranque del motor. Se tiene que para los datos de arranque del motor
= 2.4 s gno 2 e uds
n=8
i
( i
)2
S2 =
i =1
i n
)2
=
2 = 0.29 segundos 2 7
S= +
0 .2 9
MEDIDAS DE ASIMETRA (SESGO) El sesgo se define como el grado de asimetra de una distribucin con respecto a su media. Se dice que la distribucin es asimtrica positiva cuando tiene una cola ms larga a la derecha del mximo central que a la izquierda, si es al contrario se dice que tiene una asimetra negativa. Coeficiente de Asimetra (a3): puede estimarse a partir de un conjunto de n observaciones, usando la siguiente ecuacin:
(X
n i =1
X)
a3 =
n S3
S=
(
i =1
i )
Para distribuciones simtricas a3 = 0, para distribuciones asimtricas positivas a3 > 0 y para distribuciones asimtricas negativas a3 < 0.
Simtrica a3 = 0
MEDIDAS DE APUNTAMIENTO (KURTOSIS) La kurtosis se refiere al grado de apuntamiento de una distribucin tomando como referencia la distribucin normal. Si el apuntamiento es relativamente alto se dice que la distribucin es leptokrtica, mientras que si el apuntamiento es relativamente bajo se dice que es platikurtica. La distribucin normal es denominada mesokrtica. Coeficiente de Kurtosis (a4): puede estimarse a partir de un conjunto de n observaciones, usando la siguiente ecuacin:
( X
n i =1
i X)
a3 =
n S4
S=
(
i =1
Para distribuciones mesokurticas a4 = 0, para distribuciones leptokurticas a3 > 0 y para distribuciones platikurticas a3 < 0.
Leptokurticas a4 > 0
Mesokurticas a4 = 0
Platikurticas a4 < 0