Anda di halaman 1dari 16

GUIA # 3 MEDIDAS DESCRIPTIVAS ESTADISTICAS: MEDIDAS DE TENDENCIA CENTRAL, DE VARIACION Y DE POSICION 1.

Elementos de copetencia Calcular y analizar medidas descriptivas utilizando EXCEL. Identificar e interpretar las medidas descriptivas ms utilizadas en un anlisis estadstico. .

2. Recursos y programas a utilizar Base de datos cuantitativos Excel

3. CONCEPTOS BASICOS MEDIDAS ESTADISTICAS DESCRIPTIVAS clases de medidas Medidas representativas Media aritmtica : es el cociente entre la suma de todas las observaciones ye el total de observaciones

Ventajas y desventajas Es vlida para datos de nivel de medicin de intervalos y de razn Es nica Incluye todos los valores de la muestra La desventaja es que es sensible a datos extremos

Para datos agrupados es

ni: frecuencia absoluta de la clase i xi: Marca de clase i

Medidas de tendencia central: Son valores o indicadores estadstico, que muestran concentracin de valores o punto central una la serie de datos

Moda: es el valor de la observacin con mayor frecuencia Cuando los datos estn agrupados se utiliza la siguiente formula Mo= =limite inferior de la clase modal = diferencia entre la frecuencia modal y pre modal = diferencia entre la frecuencia modal y post modal A= amplitud de la clase modal

Es la nica medida que puede utilizarse en datos de nivel nominal Desventaja: No siempre existe o no es nica Carece de formula algebraica, por lo cual no es muy utilizada en la inferencia estadstica

MEDIDAS ESTADISTICAS DESCRIPTIVAS clases de medidas Medidas representativas Ventajas y desventajas Ventajas: Mediana: punto medio de los valores una vez que se han ordenado los datos de menor a mayor Med= =limite inferior de la clase mediana = la mitad del tamao de la muestra o poblacion = Frecuencia acumulada antes de la clase mediana nmed =frecuencia absoluta de la clase mediana A= amplitud de la clase modal Rango: representa la diferencia entre el valor mximo y mnimo de un conjunto de datos Medidas de dispersin Miden las diferencias entre unos datos y otros, la diferencias de cada dato con la media, esto es, usando las desviaciones; sin embargo, como stas siempre suman cero, es preciso considerar su valor absoluto o su cuadrado para que ello no ocurra Desviacin media: Media aritmtica de los valores absoluto de las desviaciones con respecto a la media | | Ventajas: fcil de calcular y entender Desventaja: No da informacin interna ms detallada de los datos Ventajas: Fcil de calcular Desventaja: Por los valores absoluto, no resulta muy til en la inferencia estadstica Los datos deben ser por lo menos de nivel de medicin ordinal Es nica Es un mejor indicador cuando hay datos extremos en la muestra Desventajas: Carece de formula algebraica, lo cual le resta importancia en la inferencia estadstica

Para datos agrupados | |

MEDIDAS ESTADISTICAS DESCRIPTIVAS clases de medidas Medidas representativas Varianza: existen dos tipos de varianza Varianza poblacional( 2) Es la media aritmtica de las desviaciones elevada al cuadrada Ventajas y desventajas Ventajas: Es nica y siempre est definida para variables cuantitativas Compensa el inconveniente de utilizar valores absoluto y es muy utilizada en la estadstica inferencial Desventajas: Tiene diferente unidad de medida que los datos por lo cual su interpretacin no tiene sentido en trminos de los datos

Para datos agrupados

Varianza Muestral: Cociente entre la suma de las desviaciones al cuadrado y el numero de observaciones menos uno

Desviacin Estndar: Raz cuadrada de la varianza (Poblacional o muestral) , = o S=

Ventajas: A la hora de interpretacin es ms til que la varianza

Coeficiente de variacin: Cociente entre la desviacin estndar y la media aritmtica CV=

o CV=

Ventajas: es til para comparar la variacin de dos poblaciones porque es adimencional

Donde S y son la desviacin y media muestral , y son la desviacin y la media poblacional

MEDIDAS ESTADISTICAS DESCRIPTIVAS clases de medidas Medidas representativas Cuartiles: Dividen la poblacin en cuatro partes Ventajas y desventajas Ventajas: son tiles cuando hay muchos datos porque muestra informacin ms precisa de la poblacin Desventajas: No tiene sentido en pocos datos Deciles: Dividen la poblacin en 10 partes iguales, Ventajas: son tiles cuando hay muchos datos porque muestra informacin ms precisa de la poblacin Desventajas: No tiene sentido en pocos datos Ventajas: son tiles cuando hay muchos datos porque muestra informacin ms precisa de la poblacin Desventajas: No tiene sentido en pocos datos

Medidas de Posicin o cuantiles: Son valores que dividen el conjunto de observaciones en partes iguales , pueden ser vistos tambin como medida de centralizacin o de variacin En calculo general de estas medidas se siguen los siguientes pasos 1. Se ordenan los datos 2. Se calcula P es el porcentaje deseado N:tamao muestral 3. Si i es decimal se aproxima al entero mas cercano por encima, el dato ubicado en esa posicin ser el cuantil buscado 4. Si i es entero, el cuantil se obtiene realizando el promedio entre los datos que ocupa la posicin i y i+1 5. Para datos agrupados se utiliza la formula de la mediana cambiando N/2 por N/k donde k es el numero de partes en que quieres dividir la poblacin y las frecuencias sern las de la menor de las clase que contiene acumulado N/k datos.

Percentiles: Dividen la poblacin en 100 partes iguales, se calcula como los deciles o cuartiles

4. CALCULO DE MEDIDAS DESCRIPTIVAS CON EXCEL Excel dispone de una gran variedad de funciones que nos permiten calcular medidas estadsticas para datos organizados en columnas o filas, pero no en tablas de distribuciones de frecuencia. Cuando los datos estn en tablas de distribucin de frecuencias, se insertan formulas siguiendo formulas algebraicas para cada medida, que son aproximaciones a los valores reales de las medidas o parmetros, algunas veces resulta ms fcil realizar dichos clculos de forma manual con ayuda de una calculadora. Excel ser muy til cuando se tengan muchos datos y no estn agrupados. A continuacin se muestran las medidas estadsticas descritas anteriormente que se pueden calcular en Excel y tomando como ejemplo el conjunto de datos que se encuentra de ejemplo en la gua # 2

4,1 MEDIDA DE TENDENCIA CENTRAL LA MODA: Se utiliza la funcin =MODA (rango de valores)

El resultado seria Moda= 59, esto es el numero de litro de leche que con mayor frecuencia cooperativa coolacteos durante los 70 da observado fue 59 lt vendi la

MEDIANA: se utiliza la funcin = mediana (rango de valores)

El resultado sera: MEDIANA=40,5, esto es el 50% de la cantidad de litros de leche que vendi la cooperativa coolacteos durante los 70 das observados tuvo un valor igual o inferior a 40,5 litros

MEDIA: Se utiliza la funcin =promedio (rango de valores)

El resultado sera: MEDIA=39,58, esto: En promedio nmero de litro de leche que vendi la cooperativa coolacteos fue igual a 39,58 lt

4,2 MEDIDAS DE DISPERSIN DESVIACION MEDIA: se utiliza la formula = DESVPROM (rango de valores)

El resultado sera: DESVIACION MEDIA =12, 29 esto es: los datos se encuentran desviados (alejados) en promedio de la media alrededor de 12,29 litros VARIANZA POBLACIONAL: Se utiliza la formula =VARP (rango de valores)

El resultado sera: VARIANZA POBLACIONAL=204,61, Se interpreta como: la varianza (variabilidad) poblacional del numero de litros de leche que vendi la cooperativa Coolacteos en los 70 das es igual 204, 61 lt2. La interpretacin de la varianza no es muy til porque su unidad es cuadrada sea no tiene la misma unidad de medida de los datos VARIANZA MUESTRAL: Se utiliza la formula =VAR (rango de valores)

El resultado seria: VARIANZA MUESTRAL=207,5, Se interpreta como: la varianza (variabilidad) muestral del nmero de litros de leche que vendi la cooperativa Coolacteos en los 70 das es igual 205, 5 lt2. Como en la varianza poblacional, la interpretacin de la varianza muestral no es muy til porque su unidad es cuadrada sea no tiene la misma unidad de medida de los datos DESVIACION ESTANDAR POBLACIONAL: Se utiliza la formula = DESVESTP (rango de valores)

El resultado sera:

DESVIACION ESTANDAR POBLACIONAL=14.30, su interpretacin es: El nmero de leche vendido durante los 70 das estuvieron alejados de la media poblacional en promedio 14,30 lt DESVIACION ESTANDAR POBLACIONAL: Se utiliza la formula = DESVEST (rango de valores)

El resultado sera: DESVIACION ESTANDAR MUESTRAL=14,70 El nmero de leche vendido durante los 70 das estuvieron alejados o desviados de la media muestral en promedio 14,30 lt 4.3 MEDIDAS DE POSICIN CUARTILES: Se utiliza la funcin = CUARTIL (Matriz o rango de valores; cuartil a buscar y tiene 5 opciones 0, 1, 2, 3,4) Por ejemplo para el cuartil 1= CUARTIL (matriz; 1)

El resultado seria CUARTIL 1 = 28,25, Se interpreta como: el 25% de la cantidad de litros de leche que se vendieron en la cooperativa coolacteos durante los 70 das tuvo un valor igual o inferior a 28,25 lt De igual forma colocando 2 y despus 3 en la frmula utilizada en el cuartil 1, nos permite hallar el cuartil 2 y 3 cuyos resultados serian CUARTIL 2=40,5 Se interpreta como: el 50% de la cantidad de litros de leche que se vendieron en la cooperativa coolacteos durante los 70 das tuvo un valor igual o inferior a 40,5 lt CUARTIL 3= 51 Se interpreta como: el 75% de la cantidad de litros de leche que se vendieron en la cooperativa coolacteos durante los 70 das tuvo un valor igual o inferior a 51 lt PERCENTILES Y DECILES: Para los deciles y percentiles solo existe una funcin que es =PERCENTILES (MATRIZ; k que es una valor entre 0 y 1) Para hallar el percentil 10 que es igual a primer decil escribimos =PERCENTIL (MATRIZ; 0,1)

EL resultado seria PERCENTIL 10 = DECIL 1= 19,9 , que se interpreta como el 10% de la cantidad de litros de leche que se vendieron en la cooperativa coolacteos durante los 70 das tuvo un valor igual o inferior a 19,9 lt De igual forma se hallaran los otros deciles y percentiles.

Otra forma de calcular medidas descriptivas con Excel es a travs del comando, ANALISIS DE DATOS. Esta herramienta posee una opcin llamada ESTADISTICA DESCRIPTIVA, La cual nos permite realizar un resumen estadstico de los datos en un solo procedimiento. Los datos deben estar en forma de columna

El resultado sera:

5. Problemas Propuestos En los siguientes problemas realice un resumen de medidas estadstico en Excel y responda los interrogantes planteados Problema 1 En una granja avcola se lleva a cabo un registro de los pesos de un lote de 80 pollos que ya cumplieron con el ciclo de crecimiento y van a ser sacrificados para venta. Los pesos de las aves despus de sacrificada y lista para la venta estn registrados a continuacin: 3,4 3,6 2,7 2,3 3,2 1,8 2,5 3,2 2,7 2,3 3,2 1,8 2,6 3,5 2,7 2,3 3,2 1,8 2,6 3,5 3,7 3,4 3,2 1,8 2,6 3,5 3,7 3,4 2,7 2,3 2,6 3,5 3,7 3,4 2,8 2,5 3,2 1,8 3,7 3,4 2,8 2,5 3,1 3,4 2,6 3,5 2,8 2,5 3,1 3,4 3,2 1,8 3,7 3,4 3,1 3,4 4 2,5 2,6 3,5 2,8 2,5 3,5 2,8 2,4 2,7 3,7 3,4 3,1 3,4 3,4 3,1 3,6 2,6 3,5 3,7 3,4 2,7 2,3 2,6

a. Cul es el peso promedio de las 80 aves? si el dueo de la granja le pagan en el mercado $1800 por kilo, Cul sera su ganancia promedio? b. Cul es el peso modal de las 80 aves? interprete c. El 50% de las aves tuvieron un peso igual o inferior a que valor

d. Que varianza y dispersin muestral presentan los pesos de las 80 aves, interprete e. Calcules los cuartiles para este conjunto de datos e interprete f. Calcule los deciles 2,4 y 6 e interprete

Problema 2. Se desea probar la efectividad de un herbicida en la erradicacin de cierta maleza daina para los cultivos de maz, se aplica el herbicida en 120 hectreas sembradas y se registra el tiempo en horas que demoro la maleza en presentar evidencia de deterioro por accin del herbicida Los tiempos registrados se presentan a continuacin: 3 2 3 5 6 4 4 4 3 5 4 3 5 4 3 5 2 2 5 4 2 5 4 2 5 4 5 5 6 7 5 6 7 5 6 7 7 7 4 6 7 4 6 7 4 6 8 8 7 8 8 7 4 4 3 5 3 4 3 5 3 8 2 2 5 4 6 2 5 4 6 3 5 5 6 7 5 5 6 7 5 6 7 7 4 6 7 7 4 6 4 7 8 8 7 8 8 8 7 8 6 2 3 3 8 3 3 3 8 3 7 5 6 6 3 2 6 6 3 2

a. Cul es el tiempo promedio? si el fabricante del herbicida afirma que en promedio este empecer a deteriorar la maleza en 5 horas despus de aplicado, Con base a los resultados se est cumpliendo la afirmacin del fabricante? Justifique con base a los resultados b. Cul es el tiempo modal ? interprete c. El 50% de las hectreas mostro evidencia de accin del herbicida al cabo del nmero de horas igual o inferior a que valor? d. Qu varianza y dispersin muestral presentan estos datos? interprete e. Calcule los cuartiles para este conjunto de datos e interprete f. Calcule los deciles 2,4 y 6 e interprete

Bibliografa
PEREZ L, Cesar. Estadistica Aplicada a travs de Excel. Prentice Hall y Pearson 2002 Douglas A. Lind, Marchal William G y Wathen Samuel. Estadstica Aplicada a los Negocios y la Economa. 12 edicin. Editorial McGraw-Hill.2005 BERENSON, Levine. Krehbel. Estadstica para Administracin. Editorial Prentice Hall. Bertsekas D.P. and Tsitsilikis.MIT. Introduction of Probability. www.athenas. com CHAO, Lincoln. Estadstica para las Ciencias Administrativas. Editorial Mac Graw Hill. MARTINEZ B, Ciro. Estadstica y Muestreo. Editorial ECOE Editores. SHAO, Stephen. Estadstica para Economistas y Administradores de Empresas. Editorial Herreros hermanos. YA-LU, Chou. Anlisis Estadstico. Editorial Fondo Educativo Interamericano. Editores