Anda di halaman 1dari 7

Tabulaciones cruzadas y pruebas de chicuadrado

A. Panorama general de las pruebas de chi-cuadrado B. Paso a paso las instrucciones para la creacin de tablas dinmicas en Excel C. Paso a paso las instrucciones para hacer una prueba de chi-cuadrado en Excel D. Interpretacin de la salida de Excel

A. PANORAMA-CHI CUADRADO PRUEBAS Y PRUEBAS DE LA IGUALDAD DE LAS PROPORCIONES


Con frecuencia tenemos que saber si varios grupos tienen la misma probabilidad de hacer algo, comprar algo, etc .. Por otra parte, si dos o ms grupos que no tienen la misma probabilidad de hacer algo, qu grupo o poblacin es ms probable que lo haga? As que, como en todas las estadsticas, nos tomamos una muestra de cada grupo y tratar de ver si sus resultados son similares. Por supuesto, simplemente porque los resultados de cada muestra no son exactamente iguales no significa que esta diferencia se observa es "estadsticamente significativo". Las diferencias que observamos en nuestro muestreo podra ser simplemente el resultado de un error de muestreo al azar. Por ejemplo, podramos simplemente al azar un montn de hombres en la muestra que realmente gusta ir de compras, aunque, en realidad, las mujeres son ms propensas a comprar. As que, independientemente de los resultados de la muestra se obtiene, tenemos que probar para ver si las diferencias que vemos puede ser simplemente debido a un error de muestreo al azar o si en realidad son indicativos de una verdadera diferencia entre los dos grupos.

B. CMO CREAR una tabla dinmica en Excel


tabulaciones cruzadas son una y conveniente manera fcil de resumir los datos, especialmente cuando usted tiene un montn de respuestas categricas (S / No, Coca-Cola / Pepsi, etc.). Excel puede generar este tipo de tablas mediante la creacin de lo que se llama una tabla dinmica. Tomemos un ejemplo de Pablo de Marketing Dr. curso de Anlisis hace varios aos. Un grupo de estudiantes encuestados 57 mujeres, entre las edades de 18 a 25. Los encuestados se dividieron en 2 grupos de edad, 18-21 (= 1) y 22-25 (= 2). La siguiente pregunta fue hecha: "En una escala del 1 al 5 (5 =" muy importante ", 1 =" no es importante en absoluto "), Qu tan importante es para usted que comprar ropa de

marca nombre?" Una parte de su hoja de clculo Excel aparece a continuacin:

Supongamos que queremos construir una tabla que muestra la relacin entre el grupo de edad y la importancia relativa de las marcas de nombre. Paso 1: Una tabulacin cruzada se pueden construir fcilmente en Excel mediante una tabla dinmica. Ir a datos, tabla dinmica y el prximo xito. A continuacin, Excel le pide a la entrada de la gama. Asegrese de que toda la gama de los datos se ha seleccionado. En este ejemplo, los datos se extiende desde la fila 2 a 58, y se encuentra en las columnas A, B y C. Al siguiente.

Paso 2: Ahora, usted est listo para configurar la tabla. Las etiquetas de tus series estn en cajas a la derecha. Siempre se debe poner al menos una etiqueta como una partida (fila o columna). Adems,

siempre hay que poner en el campo de datos "lo que usted desea que Excel para medir."

Paso 3: Tienes que poner el "lo importante" cuadro como un campo de la partida tambin. Esto se debe a que van a estar pidiendo Excel para contar el nmero de mujeres en cada grupo de edad que responde a "1", "2", "3", "4" y "5". Asegrese de hacer doble clic en el cuadro de datos para asegurarse de que usted ha pedido Excel para "contar" el nmero de mujeres contestar cada respuesta:

Siga las instrucciones y la tabla se coloca en otra pgina:

A primera vista, puede ver que en la muestra, 12 de los 38 (31,5%) de las mujeres de 18 a 21 no tienen en cuenta la marca que es importante en absoluto, mientras que slo 2 de 19 (10,5%) de las mujeres mayores hizo esa afirmacin. Es evidente que, dentro de esta muestra de 57 mujeres, los ms jvenes estn menos interesados en la marca. Pero (otra vez, un enorme pero) se puede inferir que en las mujeres toda la poblacin de entre 22 a 25 en promedio, estn ms preocupados por las marcas que las mujeres de entre 18 a 21? Una vez ms, para hacer tal inferencia requiere una prueba. En este caso, el criterio adecuado es llamado a-squared test de Chi.

C. CMO REALIZAR UNA PRUEBA CHI-CUADRADO EN EXCEL


Paso 1: Estado de la hiptesis nula. La hiptesis es que "los dos grupos de edad tienen la misma probabilidad de responder" 1 "," 2 "," 3 "," 4 "y" 5 "a la pregunta". En otras palabras, la probabilidad de que las mujeres en el grupo de edad 18-21 tasas de la importancia de las marcas de nombre como un "1", "2", etc .. es igual a la probabilidad de que las mujeres en el grupo de edad 22-25 tasa nombre de importantes marcas por igual:

0:

18-21 aos de edad

22-25 aos

Tenga en cuenta que estos datos son categricos (no numrico). Como resultado, no sera conveniente hacer una "t-test" para probar esta

hiptesis. En este caso, el criterio adecuado es lo que llamamos una prueba de Chi-cuadrado. Paso 2: Elija un nivel crtico para la prueba y encontrar el valor crtico. La distribucin muestral de un estadstico que compara la "espera" la frecuencia de una muestra con el, o "observa" la frecuencia real se llama Chi-cuadrado . Para una muestra de esta estadstica se distribuye como una chi-cuadrado con (filas-1) * (columnas-1) gl (en este caso, df = (2-1) * (5-1) = 4). Ver la distribucin Chi-cuadrado para los valores crticos. En el nivel 10% (90% nivel de confianza) la crtica de Chicuadrado es 7,77. Paso 3: Calcular la estadstica de prueba. La clave para el clculo de la estadstica de chi-cuadrado y la prueba esta hiptesis es comparar lo real, o "observa" los valores en cada mesa o de las clulas con la "espera" la frecuencia de respuesta que se hubiera producido si la hiptesis fuera verdad. La estadstica de prueba se calcula mediante la frmula:

donde O = frecuencia observada en la muestra en esta clase y E = frecuencia esperada de la muestra en esta clase. Recuerde, usted puede hacer una prueba de Chi-cuadrado con cualquier dimensin de la tabla. Usted puede tener ms de dos grupos y que puede tener cualquier nmero de categoras de la encuesta que se est comparando. Que se modifique el df, sin embargo. La frecuencia esperada, E, se encuentra multiplicando la frecuencia relativa de esta clase en la poblacin de la hiptesis (57) por el tamao de la muestra. Por ejemplo, la relativa frecuencia esperada de las mujeres que dicen que las marcas no son importantes en absoluto (1) 14/57 (# que respondieron a "1" dividido por el nmero total de la muestra). Esto le da el nmero de esa clase en la muestra si la distribucin de frecuencias relativas a travs de las clases en la muestra coincide exactamente con la distribucin de la poblacin. Tenga en cuenta que Chi-cuadrado es siempre mayor que 0 y es igual a 0 si lo observado es igual a la esperada en cada clase. Mira a la ecuacin y asegrese de que usted ve que un valor mayor de va con las muestras con grandes diferencias entre la espera y las frecuencias observadas. Por ejemplo, las frecuencias esperadas para cada una de las cinco categoras, 2 grupos de edad se dan de la siguiente manera (el primer nmero en el subndice representa el grupo de edad (1 = 18-21, 2 = 22-

25) y el segundo subndice es cmo nominal que las marcas de nombre en la escala de 1 a 5): E 11 = 14/57 * 38 = 9,33 E 21 = 14/57 * 19 = 4,67 E 12 = 17/57 * 38 = E 13 = 9 / 57 * E 14 = 15/57 * 11,33 38 = 6 38 = 10 E 22 = 17/57 * 19 = E 23 = 9 / 57 * E 24 = 15/57 * 5,67 19 = 3 19 = 5 E 15 = 2 / 57 * 38 = 1,33 E 25 = 2 / 57 * 19 = 0,67

Hacer esto en la hoja de clculo Excel dar los siguientes:

Observe que la tabla de "valores esperados" tiene las mismas dimensiones exactas al original (observado) mesa. Ahora que hemos calculado los valores esperados, estamos listos para compararlos con los valores observados. Tenga en cuenta que, si los dos grupos de edad fueron las mismas probabilidades de tasa de la importancia de la marca como "1" (muy importante), que debera haber visto 9,33 las mujeres en el grupo de edad ms joven marca "1" y 4.67 de las mujeres en la tercera edad marca del grupo "1". pero, en nuestra muestra de 12 (no 9.33) la mujer ms joven eligi "1". Slo 2 (no 4.67) del grupo de mayor edad elegido "1". En nuestra muestra, las mujeres ms jvenes tenan ms probabilidades de marcas conocidas como tasa muy importante. Sin embargo, este resultado es debido a una base verdadera diferencia en las dos poblaciones, o fue simplemente el resultado del error de muestreo al azar? Para responder a esa pregunta, tenemos que probarlo. Tenemos que calcular el cuadrado de la prueba estadstica de Chi-utilizando la siguiente frmula y compararlo con el chi-cuadrado

nmero crtico que obtenemos de la tabla de chi-cuadrado. Una vez ms, la frmula es:

La estadstica de Chi-cuadrado = (12-9.33) 2 / 9,33 + (11-11.33) 2 / 11,33 + (6-6) 2 / 6 + (109) 2 / 10 + (0-1.33) 2 / 1,33 + (2-4.67) 2 / 4,67 + (6-5.67) 2 / 5,67 + (3-3) 2 / 3 + (6-5) 2 / 5 + (2-0.67) 2 / 0,67 = 6.59 D. INTERPRETACIN DE LOS RESULTADOS
Como sealamos anteriormente, en el nivel de 10% (90% nivel de confianza) la crtica de Chi-cuadrado es 7,77 (ver la distribucin de Chicuadrado ). Por lo tanto, la hiptesis de que los dos grupos tienen la misma probabilidad de responder que las marcas son importantes, muy importantes, etc .. no se rechaza en el nivel de 10%. En este caso, no podemos afirmar con mucha confianza de que las diferencias que vemos en esta muestra son generalizables a la poblacin en general (al menos en esta pregunta). As que, por qu observamos estas diferencias en nuestras muestras realmente no hay ninguna? Todo esto resultado de la prueba nos dice es que no es al menos un 90% seguro de que hay una diferencia entre estos dos grupos de edad en sus preferencias para la compra de marca de ropa nombre. En otras palabras, no tenemos suficiente evidencia de que las diferencias de la muestra se debe a otra cosa que el error de muestreo al azar. No debemos, en este caso, que la afirmacin de que las mujeres ms jvenes se preocupan ms por las marcas de nombre. En el futuro, una amplia mayor tamao nos permitira hacer un reclamo ms fuerte.

Anda mungkin juga menyukai