Anda di halaman 1dari 10

ESTADISTICA DESCRIPTIVA III Medidas de Dispersin o Variabilidad Hemos visto que cuando tenemos un grupo grande de nmeros para

ser analizados alguna de las medidas de tendencia central nos dan alguna idea de las caractersticas de estos nmeros, por ejemplo veamos estos cuatro grupos de nmeros a) b) c) d) 10, 10, 10, 10, 20,30, 30, 30,30. 20, 22, 21, 20,20, 19, 13, 20,20. 1, 4, 6, 8, 20, 32, 34, 36,39. 10, 12, 14, 16, 20, 24, 26, 28,30.

Efectuando un anlisis encontramos que para los cuatro grupos la media es la misma 20, y la mediana tambin 20, pero an as existen diferencias entre ellos. Qu nos podr hacer que nos demos cuenta de esas diferencias? Una mirada ms profunda, nos permitir ver que ellos difieren en como es que estn dispersos, separados o distribuidos respecto a la media. En el grupo (b) la mayora de los nmeros esta muy cerca a la media. En el grupo (c) existe una mayor variacin entre los nmeros y la media. Tener una informacin ms completa de estos datos numricos la podremos obtener mediante la medicin de estas Variaciones.

Rango o Recorrido El Rango denotado por la letra R, no es ms que la diferencia entre el Mayor Valor y el Menor Valor de las variables existentes en el conjunto de datos. Si lo colocamos en una formula ser: R = Vmx. - Vmin. Para el caso del grupo (a), la diferencia ser entre 30 y 10, luego se tendr un rango de 20. En el grupo (b) la diferencia ser entre 22 y 18, y el rango ser igual a 4. Para el grupo (c), tendremos que el rango es 33, pues los valores son 39 y 1. Y para el grupo (d), el rango lo obtenemos en la diferencia entre 30 y 10, siendo esta igual a 20. Otro ejemplo, durante el mes de enero, ocho vendedores de-aparatos electrodomsticos de la empresa XYZ vendieron el siguiente nmero de ventiladores: 3, 11, 5, 14, 8, 11, 16,11. Luego el Rango de unidades vendidas ser:

R = 16 - 5 = 11.0 unidades Normalmente al efectuar el reporte de la medida de variabilidad este se efecta con un dgito adicional ai nivel original de medicin. Si deseramos hallar el rango para datos agrupados tendremos que emplear la siguiente formula: R = Ls (A) - Li (B) Li = Limite exacto o frontera inferior Ls = Limite exacto o frontera superior Desviacin Media (DM) Consiste en la media de los valores absolutos de las diferencias entre las variables y la media aritmtica. Su formula matemtica es: | | | |

Calculemos la desviacin media para los datos empleados en el rango , primero hallaremos la media aritmtica, que en este caso es 10.5, para luego hallar los valores individuales de X - u , sus valores absolutos y la sumatoria de estos, lo cual nos da un valor de 21.0, aplicando la formula tendremos : | |

Con este resultado podemos concluir que, en promedio, las ventas por vendedor difieren en 2.6 ventiladores de la media del grupo, sea ms o menos. Tambin podremos calcular la DM para un conjunto de datos Agrupados mediante las siguientes formulas | |

Varianza y Desviacin Estndar La varianza es semejante a la DM en vista de que tambin es una diferencia de cada una de las variables y la media de ese grupo, la diferencia se encuentra en que cada una de las diferencias es elevada al cuadrado y luego se efecta una sumatoria de estas, la formula para una poblacin es :

En esto caso la varianza de una muestra no es, en forma estrictamente matemtica; equivalente a la de la poblacin, lo que cambia en la formulacin es el denominador, que en trminos simples lo que se hace es incluir un factor de correccin con la finalidad de que la varianza de una muestra sea en forma efectiva un buen estimador (no sesgado) de la varianza de la poblacin, la formulacin seria:

Si queremos hallar la varianza en Datos Agrupados emplearemos:

Generalmente nos resulta muy difcil efectuar una interpretacin rpida sobre el significado del valor de la varianza debido a que son valores al cuadrado. Por esta razn es que se emplea la raz cuadrada de la varianza, a la que se le denomina Desviacin Estndar. La desviacin estndar es la ms importante de las medidas de dispersin, mide la desviacin promedio de cada una de las variables respecto a la media aritmtica. En otras palabras, la desviacin estndar es la raz

cuadrada del promedio de los cuadrados de las diferencias entre cada una de las variables y la media aritmtica. Su formula es: Poblacin:

Muestra:

La Desviacin Estndar es muy til conjuntamente con la Distribucin Normal.

cuando

se

le

emplea

Usemos el ejemplo anterior y calculemos la desviacin estndar para esa poblacin, primero tendremos que hallar la diferencia X - u para cada variable luego elevarlas al cuadrado efectuar la sumatoria de estos cuadrados y posteriormente a la suma total sacarle la raiz cuadrada, con lo que obtendremos:

Como ya hemos dicho la DS es la medida de dispersin ms importante/ debido a que la empleamos conjuntamente con varias tcnicas de inferencia estadstica, si la empleamos con una distribucin normal (simtrica y mesocrtica), se sabe que aproximadamente el 68.26% de las mediciones (elementos) se encuentran a no ms de una desviacin estndar de la media (hacia arriba y hacia abajo), aproximadamente el 95.5% de las mediciones se encuentran a no ms de dos desviaciones estndar de la media ,y el 99.7% se encuentran dentro de las tres DS, dndonos una idea de probabilidad de ocurrencia de un evento. En el caso de contar con una agrupacin de Datos usaremos las siguientes formulas:

Poblacin

Muestra

Con la finalidad de aliviar en alguna medida los clculos de la varianza y desviacin estndar se cuenta con formulas abreviadas: Datos No Agrupados

Datos Agrupados

Si empleamos nuestra formula abreviada de la DS en nuestro ejemplo obtendremos el mismo resultado:

Nmero Estndar

Coeficiente de Variacin Este coeficiente los indica la magnitud relativa de la desviacin estndar con respecto a la media aritmtica de la distribucin analizada, el coeficiente de variacin se emplea cuando se quiere comparar la variabilidad de 2 conjuntos de datos con respecto al nivel general de los valores de cada conjunto de datos sus formulas para poblacin y muestra son :

Por ejemplo, tenemos dos acciones comunes de una empresa, el precio promedio al cierre en el mercado de valores durante el mes pasado fue, para las acciones A $1500 con una DS de $500, para las B fue de $5000 con una DS de $300, si efectuamos una comparacin absoluta diremos que la accin A es ms variable pues tiene una DS mayor, pero si efectuamos una comparacin basados en los niveles de precios debemos efectuar una comparacin de los CV, luego tendremos:

CV (A) = (500 / 1500) 100 = 3.3 CV (B) = (300 / 5000) 100 = 0.6

Con estos resultados podremos llegar a una mejor conclusin, en la cual diremos que el precio de la accin B ha sido casi dos veces ms variable que el de A (precio promedio para C/U).

Sesgo y Curtosis

Con la finalidad de describir los datos o informacin recolectada, hemos usado medidas de tendencia central y medidas de dispersin o variacin. Pero se nos puede presentar la siguiente situacin, que dos grupos de datos tengan medidas similares y an as sean completamente distintos. Si observamos los grficos siguientes, el de la izquierda es simtrico y unimodal, entonces podemos decir que la media, mediana y la moda tienen un mismo valor. El de la derecha, es asimtrico y presenta una cola ms larga hacia el lado izquierdo, podemos decir que esta sesgado hacia la izquierda. En este caso los valores de la media, mediana y moda no son el mismo, sino que el valor de la moda est ubicado en el punto pico de la distribucin, esto nos permite deducir que existe un nmero mayor de observaciones hacia el lado izquierdo de la moda, que hacia el derecho. La razn es que los valores extremos estn concentrados hacia la mano izquierda, luego la media que es influenciada por estos valores, se sita a la izquierda de la mediana. Si observbamos un cayo contrario, la concentracin de vaporeo extremos es hacia el lado derecho, entonces la media y la mediana estarn situadas a la derecha de la moda, estando por supuesto la media ms hacia la derecha que la mediana. En este caso observamos que la media tiene un valor mayor que la mediana, luego diremos que la distribucin est sesgada a la derecha. Pero si observamos que la media tiene un menor valor que la mediana diremos que la distribucin est sesgada a la izquierda. A una distribucin sesgada a la derecha tambin se le conoce como asimtrica positiva, mientras que a una sesgada a la izquierda como asimtrica negativa. El grado de asimetra de una distribucin lo podemos determinar mediante el llamado Coeficiente de asimetra de Pearson, cuyas formulas son:

Para una distribucin simtrica este coeficiente ser CERO, en distribucin sesgada a la derecha asumir valores positivos y para una sesgada a la izquierda asumir valores negativos.

Como informacin general podemos verificar que una distribucin de Ingresos es sesgada hacia la derecha, y esto debido a que algunos ingresos tienen valores extremadamente altos lo que hace que la media se desplace hacia la derecha. Tomemos el siguiente ejemplo, la cantidad de automviles HYUNDAI EXCEL de tres puertas vendidas por diez vendedores de la distribuidora de Camino Real durante el mes pasado fue: 10, 2, 7, 10, 4, 12, 10, 12, 15 y 14. Este es un dato muestral que podra ser proyectado para determinar ventas futuras. Determinemos el coeficiente de asimetra y qu tipo de sesgo tiene la distribucin. X = (10+2+7+10+4+12+10+12+15+14) / 10 = 9.6 Med. = X(10/2+0.5) = 10 s = 4.1687 ASIMETRIA MUESTRAL = 3 ( X - Med.) s = 3 (9.6-10)/4.1687 - 0.2879 El coeficiente hallado de -0. 2 8 7 9 nos indica que la distribucin de ventas de automviles es asimtrica negativa o lo que da lo mismo sesgada a la izquierda. Veamos otro ejemplo, una muestra de trece empresas metal-mecnicas de Lima indica que la cantidad de accidentes mensuales es: 0, 0, 3 , 2 , 1 2 , 3 , 0, 1 , 1 , 8 , 5 , 0, 1 . Desearnos determinar que tipo de curva tiene esta muestra. X = 36 /13 - 2.7692 Med. = X ( 1 3 / 2 S = 3.6321 ASIMETRIA MUESTRAL = 3 ( X - Med.) s 1.4613
+ 0.5)

=X7 = 1

La muestra tomada a los accidentes ocurridos en empresas metal-mecnicas tiene una curva de distribucin asimtrica positiva o sesgada a la derecha.

Otra forma de describir una distribucin es mediante la medicin de su achatamiento. Si observamos las siguientes curvas todas ellas son simtricas pero a su vez son de diferente forma. Por ej emplo, 1 a primera curva es una normal como vemos no es plana ni puntiaguda, respecto de la distribucin de los diferentes valores de las observaciones, sino es una figura proporcional; a esta forma de curva se le denomina mesocrtica. La segunda observamos que es algo puntiaguda en la regin central, lo que significa que las observaciones se encuentran concentradas asumiendo valores con un estrecho rango de diferencia, a esta forma de curva se le denomina leptocrtica. La ltima curva como observamos es completamente diferente a las otras dos, esta presenta un achatamiento mucho mayor es decir es ms plana, por lo que podemos deducir que las observaciones se encuentran distribuidas de una manera relativamente uniforme en todos los valores de la muestra, a esta curva la denominaremos platicrtica. Ahora supongamos que somos un profesor y que confeccionado una curva con la distribucin de las notas, y que esta tiene una forma leptocrtica, y si adems hemos normalizado las notas, tendremos dificultad para distinguirlas debido a que todos los valores seran similares, estaran concentrados. Pero si la curva fuese una platicrtica las notas estaran distribuidas en todos los valores posibles, lo cual nos indica un alto grado de variabilidad. PROBLEMA Carlos Ruiz ha finalizado una discusin respecto a un control de matemticas, con algunos de sus desafortunados compaeros. Carlos piensa que fue perjudicado por el profesor al emplear una distribucin normal en la asignacin del calificativo en una prueba tan difcil como la que tom. Unos de sus amigos, Pepe, dijo que piensa que los calificativos estuvieron bastante sesgados, por esta razn ambos hicieron una encuesta a sus compaeros de clase para chequear la distribucin, obteniendo los siguientes datos: Alumno 1 2 3 4 5 Carlos 6 7 Nota 53 63 77 68 75 68 59 81

8 9 Pepe 10 11 12 13

84 79 75 82 76 52 76

a. Calcular la media, mediana y DS para las notas de la clase. b. El profesor ha decidido que el intervalo de 1 DS hacia arriba y abajo de la media es el rango del calificativo C. De 1 a 2 DS hacia arriba ser B, ms de 2 DS una A. Una D le corresponder a quienes caigan entre 1 y 2DS por debajo de la media y F a ms de 2 DS por debajo. Para este control en que puntaje deben comenzar los calificativos A, B, C, D y F. Cuntos alumnos caen en cada grupo de calificativos? Est sesgada la distribucin? De qu forma? c. Est de acuerdo con Carlos? Cmo calificara a los alumnos?

Anda mungkin juga menyukai