Anda di halaman 1dari 7

Estadstica y Biometra

Laboratorio 4

Inferencia Estadstica
La ejercitacin propuesta en esta gua tiene como finalidad la revisin de conceptos en el marco de la Inferencia Estadstica como lo son los intervalos de confianza, los contrastes de hiptesis referidos a parmetros de una o dos distribuciones, el error de tipo II y la potencia de una prueba de hiptesis, usando como soporte computacional el software estadstico InfoStat.

Problema 4.1 Aplicaciones sobre intervalos de confianza


Se dispone de observaciones de permetro de cabezas de ajo blanco, para bulbos obtenidos en dos campaas (1998 y 1999). Se desean estimar los parmetros distribucionales del variable dimetro (calibre) ya que dicha variable es utilizada en la clasificacin de los ajos. La clasificacin tipifica 3 tamaos: Grande, si el calibre es mayor que 7, Mediano si el calibre est entre 5 y 6, y Chico para calibres menores a 4. El permetro es igual al producto del dimetro por el nmero = 3.1416. Utilice los datos registrados, disponibles en el archivo Ajoblanc.idb2, y realice las siguientes actividades:

Actividades
1. Realice una estadstica descriptiva para el calibre para las campaas 1988 y 1999. 2. Compare mediante un diagrama de densidad de puntos la distribucin de calibres en ambas campaas. Utilizando el men Estadsticas> Inferencia basada en una muestra > Intervalos de confianza, obtenga los intervalos de confianza para la media en ambas campaas. Utilizando el men Estadsticas> Inferencia basada en dos muestras > prueba T, Compare los valores medios poblaciones del calibre entre el ao 1988 y 1999. De acuerdo a estos resultados hubo un cambio significativo de tamao de un ao a otro?

Estadstica y Biometra

Laboratorio 4

Utilizando el men Datos> Categorizar genere una variable que indique a que categora de ajo pertenece cada caso segn los criterios de clasificacin enunciados en la presentacin del problema. Utilizando el men Estadsticas> Datos categorizados>Tablas de contingencia, genere una tabla de clasificacin cruzada que muestre las frecuencias de las categoras de tamao en los distintos aos. Utilizando las opciones de tablas de contingencias genere porcentajes de cada categora por ao.

3. Grafique, mediante un diagrama de tortas los porcentajes en que cada categora de tamao esta representada en cada ao.

Problema 4.2 Aplicacin sobre el clculo del tamao de muestra


En un laboratorio un investigador conduce un ensayo para estudiar caractersticas del hongo Phytophtora infestans. Los siguientes estadsticos corresponden a una muestra de 20 colonias del hongo, donde se midi la longitud de esporas (en micrones): =40 y S=6. Se desea estimar por intervalo de confianza la longitud media de las esporas, de modo que la amplitud del intervalo represente un 10% de la media muestral. Qu nmero de colonias se deberan tomar al construir el intervalo para con una confianza del 90%? Para responder al inters del investigador, utilice el men Estadsticas > Clculo del tamao muestral > Para estimar una media con una precisin deseada. Tenga en cuenta: En la ventana Tamao muestral para..., se debe activar la solapa Estimar una media En el panel Criterio para la obtencin del tamao muestral se deber activar la opcin correspondiente al criterio que se desea usar, elegir el nivel de confianza para el intervalo e ingresar el valor de referencia para el criterio indicado.

Estadstica y Biometra

Laboratorio 4

En Cota superior para la varianza, se debe ingresar el valor de varianza para la variable en estudio. Luego de ingresar los valores requeridos, se debe pulsar la tecla <Enter>. Completada la informacin en el campo Tamao muestral requerido aparecer el clculo de n.

Problema 4.3 Aplicacin sobre el clculo de la probabilidad del error de tipo II


Se cree que la ganancia de peso promedio bajo una dieta experimental es de 140 gramos. Si se prueba la siguiente hiptesis: H0: =140 y H1: 140, usando una muestra de 36 individuos y sabiendo que la desviacin estndar es de 15 gramos,

Actividad
1. Obtenga la probabilidad de aceptar la hiptesis nula cuando en realidad el aumento de peso promedio es de 143 gramos. Utilice un =0.05. 2. Realice el clculo de error de tipo II para el siguiente contraste H0: =140 y H1: >140. Utilice un =0.05. 3. Compare los resultados obtenidos anteriormente y escriba una conclusin.

A continuacin se da un ejemplo para el clculo de la probabilidad asociada a un error de tipo II, utilizando aplicaciones del software InfoStat.
Suponga el contraste de hiptesis H0: = 50 H1: > 50, y que dicha hiptesis fue aceptada cuando en realidad la verdadera media era 52. Este resultado conduce a pensar en la probabilidad de cometer un error de tipo II. Suponga conocer que la variable aleatoria estudiada, se distribuye como una normal con varianza 2=100 y que se trabaj con una muestra aleatoria de tamao 25.

Estadstica y Biometra

Laboratorio 4

Para calcular la probabilidad del Error de tipo II, previamente se debe delimitar la regin de no rechazo bajo la hiptesis nula (H0: =50) y luego calcular el rea correspondiente a dicha zona bajo la distribucin con =52 (que es la distribucin correcta). Para ello se pueden utilizar los siguientes procedimientos:

1) Graficacin de la distribucin de X y delimitacin de la regin de rechazo.


La regin de rechazo queda definida por los valores de X c, donde c es el punto crtico elegido de manera tal que P( X c| =50)=; esto es, la probabilidad de observar valores de medias muestrales mayores o iguales al punto crtico cuando la H0 es verdadera (es decir =50), es igual a . Tomando =0.05, el punto crtico (c) puede ser obtenido en InfoStat de la siguiente manera: En el men Aplicaciones Didcticas Grficos de funciones de densidad continuas, generar la distribucin del estadstico X bajo la hiptesis nula. Esto es, una normal con media = 50 y varianza = 4.

Nota: si X se distribuye normal media = 50 (como se postula en la H0) y varianza = 100, por el Teorema Central del Lmite sabemos que el estadstico X se distribuir normal con media =50 y varianza 100/25=4. Para delimitar la regin de rechazo en El evento est definido por valores... activar la opcin Mayores o iguales que..., aparecer automticamente el punto crtico c, ya que InfoStat reporta por defecto el cuantil 0.95 de la distribucin al activar dicha opcin. Luego, para estos datos, c=53.28 es el punto crtico que delimita las regiones de rechazo y aceptacin. Al presionar aceptar se visualizar la distribucin y el rea sombreada correspondiente a la probabilidad del evento rechazar H0 verdadera. As, en este ejemplo la regin crtica corresponde a los puntos muestrales para los cuales X 53.28. Nota: si se desean obtener regiones crticas de otro tamao (un distinto al 5%) se deber primero utilizar el men Probabilidades y cuantiles para obtener los puntos crticos (cuantiles) que necesita ingresar en El evento est definido por valores....

Estadstica y Biometra

Laboratorio 4

2) Clculo del Error de tipo II.


Considere ahora el problema de calcular , asumiendo H0: =50 y H1: >50, n=25, varianza 100 y =0.05 para una prueba unilateral. Recordar que =P( X regin de aceptacin de H0| H1 verdadera), esto es la probabilidad asociada al evento el estadstico pertenece a la regin de aceptacin dado que la hiptesis alternativa es verdadera. Luego, en este ejemplo, =P( X 53.28|=52). Para obtener el valor de en InfoStat se podran seguir los siguientes pasos: Sobre la grfica anterior generar la distribucin del estadstico X bajo la hiptesis alternativa. Es decir graficar una densidad normal con parmetros media = 52 y varianza = 4. Para lograr esto se deber Clonar la serie grfica existente y cambiar el parmetro media ingresando 52, tarea realizada desde la ventana Herramientas grficas. En Evento activar la opcin <= y en el campo escribir 53.28. La porcin sombreada de esta distribucin corresponde a . Se puede leer debajo del ttulo del grfico, el valor de la probabilidad de error de tipo II como p(evento)=0.7405.

Problema 4.4 Aplicacin de la prueba T para observaciones independientes


En un estudio para analizar la evolucin de tubrculos almacenados, se deseaba comparar dos pocas de cosecha: Abril y Agosto, las que determinan diferentes periodos de almacenamiento. La variable en estudio fue la prdida de peso por deshidratacin (en gr). El archivo Epoca.idb2 contiene las observaciones del estudio.

Actividad
Realice el contraste de las hiptesis: H0: Abril = Agosto versus H1: Abril Agosto.

Estadstica y Biometra

Laboratorio 4

Utilice el men Estadsticas Inferencia basada en dos muestras Prueba T: Interprete los resultados obtenidos. Nota: Al invocar esta prueba, en el selector de variables de la ventana Prueba T para muestras independientes se deber especificar la variable respuesta en la subventana Variables, (en este caso el peso) y la variable que ser usada para identificar ambas muestras en la subventana Criterio de Clasificacin (en este ejemplo, poca). La ventana Prueba T para muestras independientes que se visualiza al Aceptar permite especificar el tipo de Prueba (bilateral, unilateral izquierda o unilateral derecha). En cuanto a la informacin que se desea visualizar como resultado, el campo Inter conf. permite solicitar la construccin de un intervalo de confianza para la diferencia de medias poblacionales con coeficiente de confianza indicado por el usuario; los campos T, gl y p, cuando son activados, permiten la visualizacin del estadstico de la prueba, los grados de libertad de la distribucin del mismo y el valor p de la prueba de hiptesis realizada. En este men se puede realizar la prueba de homogeneidad de varianzas (H0:
2 2 2 12 = 2 versus H1: 1 2 ) cuyo valor p se informar en la salida como

p(Var.Hom.). InfoStat seleccionar el estadstico T para varianzas heterogneas o para varianzas homogneas, segn el resultado de la prueba. Se podr especificar el nivel de significacin a usar en la prueba de homogeneidad de varianzas. Recuerde que el valor p permite tomar una decisin sobre la H0.

Problema 4.5 Aplicacin de la prueba T para observaciones apareadas


Para estudiar el efecto de la polinizacin artificial sobre el peso promedio de las semillas obtenidas, se efectu un experimento sobre 10 plantas. La mitad de cada planta fue polinizada artificialmente y la otra mitad no. Se pesaron las semillas de cada mitad por separado, registrndose de cada planta un par de observaciones. El archivo Poliniza.idb2 contiene los valores registrados en el estudio.

Estadstica y Biometra

Laboratorio 4

Actividad
Realice un contraste que permita comparar las medias bajo ambos tratamientos Interprete los resultados obtenidos y concluya sobre recomendar o no el uso de la polinizacin artificial. Observe el formato del archivo en que debieran ser ingresados los datos en InfoStat cuando se desea trabajar con muestras obtenidas de a pares. Utilice el men Estadsticas Inferencia basada en dos muestras Prueba T apareada y en el selector de variables elija como variables aquellas que identifican las dos columnas del archivo.