Anda di halaman 1dari 5

MEDIDAS DE DISPERSIN Un promedio no dice nada acerca de la diseminacin de los datos.

El promedio no es representativo cuando se tiene una amplia dispersin. Se puede comparar cun dispersas estn dos o ms distribuciones. Una medida de dispersin puede utilizarse para evaluar la confiabilidad de dos o ms promedios. Medidas de dispersin: Varias medidas de dispersin: Amplitud de Variacin: Tal intervalo especial se utiliza ampliamente en las aplicaciones del control estadstico de procesos. AMPLITUD DE VARIACIN = VALOR MS GRANDE VALOR MS PEQUEO Desviacin media: Es la media aritmtica de los valores absolutos de las desviaciones con respecto a la media aritmtica. /XX/ DESVIACIN MEDIA DM = n Donde: X valor de cada observacin X media aritmtica de los valores n nmero de observaciones de la muestra / / valor absoluto No se consideran los signos de las desviaciones respecto de la media dado que las desviaciones positivas y negativas se compensaran exactamente y la desviacin media siempre sera cero. Cero es un dato estadstico intil. Dos ventajas: Utiliza en su clculo todos los valores de la muestra. Fcil de comprender pues es el promedio en que los valores se desvan con respecto a la media. Desventaja: El uso de valores absolutos. Variancia y Desviacin Estndar: se basan en las desviaciones al cuadrado con respecto a la media.

Variancia: la media aritmtica de las desviaciones cuadrticas con respecto al a media La Variancia Poblacional para datos no agrupados o para datos no tabulados en una distribucin de frecuencias se calcula como: " ( X )2 = N Donde: smbolo de variancia poblacional X valor de una observacin de poblacin N nmero total de observaciones en la citada poblacin media aritmtica de la poblacin La variancia es difcil de interpretar a causa de las unidades. La Desviacin Estndar Poblacional es el promedio de las desviaciones respecto de la media, se presenta en las mismas unidades que los datos. Frmula: ( X )2 = N ( X X )2 Variancia Muestral s2 = n1 Donde: X valor de las observaciones en la muestra X media de la muestra N nmero total de observaciones de la muestra Puede demostrarse que: ( X X )2 = X2 (X)2/ n Frmula operativa de la variancia muestral:

X2 (X)2/ n s2 = n1 La Desviacin Estndar Muestral se utiliza como un estimador, es la raz cuadrada de la variancia muestral: X2 (X)2/ n s= n1 Medidas de dispersin para datos agrupados en distribucin de frecuencias: Amplitud de Variacin: se resta el lmite inferior de la clase ms pequea del lmite superior de la clase mayor. Desviacin estndar: para datos no agrupados. Frmula: fX2 (fX)2/ n s= n1 Donde: S desviacin estndar muestral X punto medio de la clase f frecuencia de clase n nmero total de observaciones en la muestra Para encontrar la desviacin de los datos agrupados en una distribucin de frecuencias se produce: Paso 1. Cada frecuencia de clase se multiplica por su punto medio. Paso 2. Se calcula fX2, esto podra explicarse como fX. X. Paso 3. Se suman las columnas fX y fX2.. Interpretacin y usos de la desviacin estndar: La desviacin estndar se emplea como una medida para comparar la dispersin en dos o ms conjuntos de observaciones. Teorema de Chebyshev: Para un conjunto cualquiera de observaciones (muestra o poblacin), la proporcin mnima de los valores que se encuentran dentro de k desviaciones estndares desde la media es al menos 1 1/k2, donde k es una constante mayor que 1. 3

Regla emprica: Para una distribucin de frecuencias simtrica de campana, aproximadamente 68% de las observaciones estar a ms y menos una desviacin estndar desde la media, aproximadamente 95% de tales observaciones se encontrar a ms y menos dos desviaciones estndares de la misma; y prcticamente todas las observaciones (99,7%)se hallarn a ms y menos tres desviaciones con respecto a la media. Forma grfica: Curva simtrica de campana que muestra las relaciones entre la desviacin estndar y la media 3s 2s 1s X 1s 2s 3s 70 80 90 100 110 120 130 68% 95% 99,7% Si una distribucin es simtrica con forma de campana, prcticamente todas las observaciones se encuentran entre la media ms o menos tres desviaciones estndares. Dispersin Relativa: Karl Pearson (18571936) desarroll una medida relativa denominada coeficiente de variacin(CV). Es una medida til cuando: Los datos estn en unidades diferentes(como U$S y das de asistencia). Los datos estn en la mismas unidades, pero las medias muy distantes (ingresos de superiores e ingresos de empleados). Coeficiente de variacin: es la razn (cociente) de la desviacin estndar a la media aritmtica, expresada como un porcentaje: s CV = (100) X Karl Pearson desarroll tb una medida para evaluar el grado de orientacin al sesgo, denominada coeficiente de asimetra (CA): 3 ( media mediana) CA = Desviacin Estndar Otras medidas de dispersin: Un mtodo es determinar la ubicacin de los valores que dividen un conjunto de observaciones en partes iguales. Estas medidas son:

Los cuartiles, que dividen un conjunto de observaciones en 4 partes iguales(conjuntos ordenados de menor a mayor). El primer cuartil (Q1) es el valor abajo del cual se encuentra el 25% de las observaciones, y, el tercer cuartil (Q3) es el valor por abajo del cual se encuentra el 75% de las observaciones. Q2 es la mediana. Los deciles dividen un conjunto de observaciones en 10 partes iguales. Los centiles se utilizan para reportar resultados acerca de ciertas pruebas nacionales estandarizadas, empleado para calificar la admisin a programas. Cuartiles, Deciles y Centiles ( o Porcentiles): Para formalizar el procedimiento, sea Lp la ubicacindel centil deseado. Ej: porcentil 33 L33 . El nmero de observaciones es n. Entonces se aplica: (n +1) /2 Ubicacin de un centil Lp = (n +1) P/100 Diagramas de caja: representacin grfica basada en cuartiles, que ayuda a ilustrar un conjunto de dato. Se necesitan 5 valores estadsticos: el valor mnimo; Q1 ; la mediana; Q3 ; y el valor mximo. Mediana Q1 Q3 Valor mnimo Valor Mximo La distancia entre los extremos de la caja se denomina amplitud cuartlica ( o intercuartlica). Dicho intervalo es la distancia entre el primero y el tercer cuartiles. Se indican dos asteriscos (**) . Uno indica n dato impropio. Un dato incongruente es un valor inconsciente con el resto de los datos. Es como aquel valor que ms de 1,5 veces el valor de la amplitud intercuartlica, mayor que Q3 o bien, menor que Q1. Dato incongruente = Q1 1,5 (Q3 Q1) 5

Anda mungkin juga menyukai