Anda di halaman 1dari 7

PRUEBAS DE HIPTESIS CON DOS MUESTRAS Y VARIAS MUESTRAS CON DATOS CATEGRICOS

5.1 PRUEBA Z PARA LA DIFERENCIA ENTRE DOS PROPORCIONES: La ltima prueba estadstica que se puede realizar por medio del procedimiento Tablas personalizadas corresponde a la comparacin de las proporciones de las columnas. A travs de esta prueba se determina si existe una diferencia estadsticamente significativa entre los porcentajes obtenidos por cada una de las categoras de la variable ubicada en las columnas de acuerdo al cruce con cada una de las categoras de la variable ubicada en las filas; es decir, compara todos los porcentajes obtenidos para las categoras de la variable de columna con la primera, segunda, etc, categora de la variable de fila. Para comprender los resultados de esta prueba, generaremos un ejemplo con las variables Estado civil y la Regin. Para realizarlo debemos volver al generador de resultados y hacer clic en el botn Restablecer de modo que se retome la configuracin inicial. Una vez aparece el cuadro ubicamos en la lista la variable Regin y la ingresamos en las Columnas, posteriormente ubicamos la variable Estado civil y la ingresamos en las filas. Dado que la prueba evala la diferencia de los porcentajes de columna, hacemos clic en el botn Estadsticos de resumen; al aparecer el cuadro, resaltamos en la tabla de seleccin el estadstico Recuento y lo reemplazamos con el estadstico porcentaje de columna; para finalizar hacemos clic en Aplicar a seleccin. Despus de definir las variables y el estadstico activamos la pestaa Estadsticos de resumen y sucesivamente seleccionamos la prueba Comparacin de proporciones de las columnas; para finalizar hacemos clic en Aceptar y las tablas se crean en el visor de resultados [Fig.8-105].

Al igual que en las pruebas anteriores, el programa realiza dos tablas. La primera corresponde a la tabla de cruce o contingencia, en ella aparecen las etiquetas de las variables, las categoras y los resultados de los estadsticos que se hayan definido.La segunda tabla corresponde a los resultados de la prueba. Para esta prueba el programa asigna para cada categora de la variable de Columna una letra (Norte = A, Este = B, Oeste = C y Sur = D); adicionalmente genera una prueba de comparacin por cada par de categoras de la variable de columna, cuyo objetivo es determinar si existe una diferencia estadsticamente significativa entre los porcentajes de las dos categoras. Si la hay, ubica en la casilla de cruce (Fila por columna) la letra de columna a la que se comparo. Por ejemplo, si nos fijamos en la fila Divorciado, notaremos que en la casilla que se cruza con la columna Sur (Regin), aparecen la letra A; estas letras nos indican que el porcentaje de columna para la categora Sur es estadsticamente mayor que los porcentajes de las categoras Norte (Letra A), para el cruce especfico con la categora Divorciado de la variable de filas; es decir, que en las personas divorciadas las regiones Norte y Sur cuentan con diferencias porcentuales estadsticamente significativas. Si nos fijamos en los valores del porcentaje para la categora Norte del cruce con Divorciado, notaremos que el valor corresponde a 2.5%, mientras que el porcentaje para la categora Sur es de 9.8%. Desde luego estas aseguraciones no se pueden realizar hasta generar la prueba. Cabe notar que cuando alguno de los porcentajes es cero o menor que uno, las pruebas de comparacin no pueden realizarse. Las pruebas de comparacin tambin pueden ser aplicadas a variables Anidadas y /o Apiladas. Para conocer la forma en que se afecta la prueba con la anidacin de variables, retomaremos el ejemplo anterior, pero ingresando la variable Gnero a las filas de manera que sus categoras aniden a la variable Estado civil. Para realizarlo debemos volver al generador de tablas, ubicar en la lista la variable Gnero y arrastrarla hasta las filas de manera que anide al costado derecho de la variable Estado civil. Despus de ubicar la variable hacemos clic en Aceptar con lo que las tablas se crean en el visor de resultados [Fig.8-106]. Al igual que en ejemplo anterior, el programa realiza una prueba por cada una de las categoras de la variable de columna.

Figura 8-106

Es posible que los resultados de la prueba se modifiquen con la anidacin, ya que al anidar las variables los porcentajes de columna tienden a variar. Para analizar los resultados de las pruebas se deben tomar las categoras de cada fila y concluir sobre el gnero al que corresponda. Por ejemplo, la letra B en la fila divorciado nos indica que la categora Sur cuenta con porcentajes de columna estadsticamente mayores que el Este para los hombres. En conclusin, las pruebas estadsticas que se incluyen en el procedimiento Tablas personalizadas, nos permiten determinar si existe una relacin entre las variables de fila y columna; teniendo en cuenta que las pruebas Chi-cuadrado y Comparacin de proporciones slo pueden ser utilizadas con variables Categricas y la prueba Comparacin de medias slo puede ser empleada si existe una variable Categrica en las columnas y una variable de escala en las filas. Adicionalmente, estas pruebas pueden ser empleadas aun cuando se hayan anidado o apilado mltiples variables en la dimensiones. Es importante resaltar que las pruebas estadsticas no pueden ser empleadas cuando se incluyen en la tabla conjuntos de respuestas mltiples. 5.2 PRUEBA PARA LA DIFERENCIA ENTRE DOS PROPORCIONES:

5.3 PRUEBA PARA LA DIFERENCIA EN N PROPORCIONES Z: El concepto de prueba de hiptesis se puede utilizar para probar hiptesis en relacin con datos cualitativos. Por ejemplo, en el problema anterior el gerente de la fabrica de llantas quera determinar la proporcin de llantas que se reventaban antes de 10,000 millas. Este es un ejemplo de una variable cualitativa, dado que se desea llegar a conclusiones en cuanto a la proporcin de los valores que tienen una caracterstica particular. El gerente de la fbrica de llantas quiere que la calidad de llantas producidas, sea lo bastante alta para que muy pocas se revienten antes de las 10,000 millas. Si ms de un 8% de las llantas se revientan antes de las 10,000 millas, se llegara a concluir que el proceso no funciona correctamente. La hiptesis nula y alternativa se pueden expresar como sigue: Ho: p .08 (funciona correctamente) H1: p > .08 (no funciona correctamente) La prueba estadstica se puede expresar en trminos de la proporcin de xitos como sigue: En donde p = proporcin de xitos de la hiptesis nula Ahora se determinar si el proceso funciona correctamente para las llantas producidas para el turno de da. Los resultados del turno de da ndican que cinco llantas en una muestra de 100 se reventaron antes de 10,000 millas para este problema, si se selecciona un nivel de significanca de .05, las regiones de rechazo y no rechazo se estableceran como a continuacin se muestra: Y la regla de decisin sera:

Rechazar Ho si > + 1.645; de lo contrario no rechazar Ho. Con los datos que se tienen, = = .05 Y entonces, = = = = 1.107 Z 1.107 < + 1.645; por tanto no rechazar Ho. La hiptesis nula no se rechazara por que la prueba estadstica no ha cado en la regin de rechazo. Se llegara a la conclusin de que no hay pruebas de que ms del 8% de las llantas producidas en el turno de da se revienten antes de 10,000 millas. El gerente no ha encontrado ninguna prueba de que ocurra un nmero excesivo de reventones en las llantas producidas en el turno de da. Pruebas de hiptesis a partir de proporciones. Las pruebas de hiptesis a partir de proporciones se realizan casi en la misma forma utilizada cuando nos referimos a las medias, cuando se cumplen las suposiciones necesarias para cada caso. Pueden utilizarse pruebas unilaterales o bilaterales dependiendo de la situacin particular. La proporcin de una poblacin Las hiptesis se enuncian de manera similar al caso de la media. Ho: p = p0 H1: p p0 En caso de que la muestra sea grande n>30, el estadgrafo de prueba es: se distribuye normal estndar. Regla de decisin: se determina de acuerdo a la hiptesis alternativa (si es bilateral o unilateral ), lo cual puedes fcilmente hacerlo auxilindote de la tabla 4.4.1. En el caso de muestras pequeas se utiliza la distribucin Binomial. No lo abordaremos por ser complicado y poco frecuente su uso. Diferencia entre las proporciones de dos poblaciones La situacin ms frecuente es suponer que existen diferencias entre las proporciones de dos poblaciones, para ello suelen enunciarse las hiptesis de forma similar al caso de las medias: Ho: p1 = p2 p1 - p2 = 0 H1: p1 p2 Puede la hiptesis alternativa enunciarse unilateralmente.

El estadgrafo de prueba para el caso de muestras independientes: Siendo a1 y a2, el nmero de sujetos con la caracterstica objeto de estudio en las muestras 1 y 2 respectivamente, es decir, en vez de calcular la varianza para cada muestra, se calcula una p conjunta para ambas muestras bajo el supuesto que no hay diferencias entre ambas proporciones y as se obtiene la varianza conjunta. Recuerda que q = 1-p. Est de ms que te diga que este estadgrafo se distribuye normal estndar. La regla de decisin se determina de manera similar a los casos ya vistos anteriormente. El objetivo de la prueba es comparar estas dos proporciones, como estimadores H1: p1 p2 Recuerda que la H1 tambin puede plantearse de forma unilateral.

5.4 PRUEBA DE INDEPENDENCIA (JI-CUADRADA): Ji Cuadrada En estadstica y estadstica aplicada se denomina prueba (pronunciado como "ji-cuadrado" y a veces incorrectamente como "chi-cuadrado") a cualquier prueba en la que el estadstico utilizado sigue una distribucin si la hiptesis nula es cierta. Algunos ejemplos de pruebas son: La prueba de Pearson, la cual tiene numerosas aplicaciones: La prueba de frecuencias La prueba de independencia La prueba de bondad de ajuste La prueba de Pearson con correccin por continuidad o correccin de Yates La prueba de Bartlett de homogeneidad de varianzas Prueba de Pearson La prueba de Pearson es considerada como una prueba no paramtrica que mide la discrepancia entre una distribucin observada y otra terica (bondad de ajuste), indicando en qu medida las diferencias existentes entre ambas, de haberlas, se deben al azar en el contraste de hiptesis. Tambin se utiliza para probar la independencia de dos variables entre s, mediante la presentacin de los datos en tablas de contingencia. La frmula que da el estadstico es la siguiente: Cuanto mayor sea el valor de 2, menos verosmil es que la hiptesis sea correcta. De la misma forma, cuanto ms se aproxima a cero el valor de chi-cuadrado, ms ajustadas estn ambas distribuciones. Los grados de libertad gl vienen dados por : gl= (r-1)(k-1). Donde r es el nmero de filas y k el de columnas. Criterio de decisin: Se acepta H0 cuando . En caso contrario se rechaza.

Donde t representa el valor proporcionado por las tablas, segn el nivel de significacin estadstica elegido.

5.5 PRUEBAS DE CONTINGENCIA (JI-CUADRADA)

5.6 PRUEBAS DE BONDAD DE AJUSTE: INTRODUCCIN Una de las bases fundamentales del control estadstico de la calidad es la inferencia estadstica. Por ello, la determinacin del tipo de distribucin correspondiente a un conjunto de datos provenientes del estudio es absolutamente necesaria. La prueba de bondad de ajuste permite probar el ajuste de los resultados de un experimento a una distribucin de probabilidad terica sujeto a un error o nivel de confianza. El mtodo en cuestin se basa en la comparacin de las frecuencias absolutas observadas y las frecuencias absolutas esperadas, calculadas a partir de la distribucin terica en anlisis. Las pruebas de bondad de ajuste tienen por objetivo determinar si los datos se ajustan a una determinada distribucin, esta distribucin puede estar completamente especificada (hiptesis simple) o perteneciente a una clase paramtrica (hiptesis compuesta). Las pruebas de Bondad de Ajuste ms comnmente conocidas, son: Anderson-Darling Chi-Cuadrada Kolmogorov-Smirnov La prueba Chi-Cuadrada se emplea tanto para distribuciones continuas como para discretas, mientras que la de Kolmogorov-Smirnov como la de Anderson Darling se emplean slo para distribuciones continuas. Prueba Distribucin Normal Esta prueba se usa cuando se quiere probar la hiptesis de que unos datos mustrales provienen de una determinada distribucin. La prueba chi cuadrado se basa en la comparacin entre la frecuencia observada en un intervalo de clase y la frecuencia esperada en dicho intervalo, calculada de acuerdo con la hiptesis nula formulada. Es decir, se quiere determinar si las frecuencias observadas en la muestra estn lo suficientemente cerca de las frecuencias esperadas bajo la hiptesis nula. Para esta prueba es necesario agrupar o distribuir las observaciones de la muestra en intervalos de clase, preferiblemente del mismo tamao. El estadstico de prueba est definido como: [pic]

donde: Oi = Total de valores que caen en el intervalo i. Ei = Nmero

5.7 APLICACIONES: En ingeniera se usa mucho, pues para poder aceptar o rechazar alguna idea (probabilsticamente se denomina hiptesis estadstica) debes poder mostrarlo por resultados estadsticas. Una de las variaciones de la idea anterior que considero ms importante (en particular para mi ingeniera que es la qumica) es el control de calidad, pues si ves estadsticamente fallos (productos que se salen del error estipulado para un standar, entonces el proceso esta fallando y debes averiguar porque) En ciencias puras, sirve para encontrar correlaciones entre las variables, lo que se denomina la teora de la regresin. Es decir si tomas datos, por ejemplo de temperatura, contra tiempo, podras escribir una funcin que las relacione ( o aceptar la hiptesis de que una funcin las correlaciona) En las ciencias sociales, se utiliza para determinar muchos factores como la esperanza de vida, nivel econmico, nmero de hijos, y poder as relacionar los problemas sociales con posibles causas y proporcionar soluciones ( los famosos censos) En medicina se utiliza para hacer estimados de enfermedades cada cierto tiempo, y as poder prevenir posibles epidemias, o poder relacionar los tipos de muertes con posibles causas y factores como la edad. La gentica estudia la probabilidad de obtener ciertos factores hereditarios. En general se utiliza en todos los campos donde se deban recolectar datos para detener conclusiones que es en particular una rama de la estadstica denominada estadstica inferencial