Anda di halaman 1dari 25

ESTADSTICOS INFERENCIALES

PRUEBA DE CHI CUADRADO

MARCO TERICO.
Pruebas Paramtricas. Se llama as a las pruebas de hiptesis que cumplen tres requisitos fundamentales:

1. La variable de la prueba debe ser la variable cuantitativa. 2. Los datos se obtienen por muestreo estadstico. 3. Los datos deben ajustarse a determinadas distribuciones estadsticas.
Ejemplos. 1. La prueba basada en la distribucin normal de probabilidades. 2. La prueba de student.

Pruebas No Paramtricas.- llamadas tambin pruebas de distribucin libre. Son aquellas que:
1. La variable de la prueba puede ser cualitativa o cuantitativa. 2. Los datos se obtienen por muestreo estadstico. 3. Son independientes de cualquier distribucin de probabilidad.

Ejemplo.
1. La prueba de Chi Cuadrado (tambin llamada prueba Ji Cuadrado). 2. Las pruebas paramtricas son mas poderosas. Sin embargo cuando la variable es cualitativa, slo se puede usar las pruebas no paramtricas.

El Estadstico Chi Cuadrado


En un estadstico que sirve de base para una prueba no paramtrica denominada prueba chi cuadrado que se utiliza especialmente para variables cualitativas, esto es, variables que carecen de unidad y por lo tanto sus valores no pueden expresarse numricamente. Los valores de estas variables son categoras que slo sirven para clasificar los elementos del universo del estudio. Tambin puede utilizarse para variables cuantitativas, transformndolas, previamente, en variables cualitativas ordinales.

Prueba Chi cuadrada

El estadsticos chi- cuadrado se define por

En donde: n= nmero de elementos de la muestra. n -1= nmero de grados de libertad s2= varianza de la muestra a2= varianza de la poblacin Desarrollaremos un ejemplo numrico con la finalidad de fijar el concepto de Chi cuadrado.

DEFINICIONES INVESTIGADAS
1. Esta prueba puede utilizarse incluso con datos medibles en una escala nominal. La hiptesis nula de la prueba Chi-cuadrado postula una distribucin de

probabilidad totalmente especificada como el modelo matemtico de la poblacin


que ha generado la muestra. 2. Para realizar este contraste se disponen los datos en una tabla de frecuencias. Para cada valor o intervalo de valores se indica la frecuencia absoluta observada o emprica (Oi). A continuacin, y suponiendo que la hiptesis nula es cierta, se calculan para cada valor o intervalo de valores la frecuencia absoluta que cabra esperar o frecuencia esperada (Ei=npi , donde n es el tamao de la muestra y pi la probabilidad del i-simo valor o intervalo de valores segn la hiptesis nula).

(.ub.edU, 2010) El estadstico de prueba se basa en las diferencias entre la Oi y Ei


y se define como:

2. El Chi-cuadrado es un ejemplo de los denominados test de ajuste estadstico, cuyo objetivo es evaluar la bondad del ajuste de un conjunto de datos a una determinada distribucin candidata. Su objetivo es aceptar o rechazar la hiptesis que se relate en un ejercicio. (tgrajales.net, 2009) 3. La prueba del chi cuadrado es solo un clculo que se utiliza para ver qu tanto se parece la distribucin observada con los resultados tericos, para determinar si un suceso es al azar o tiene alguna tendencia. Por ejemplo, si lanzas una moneda, en teora tienes 50% de probabilidad de cara o cruz en cada uno. Si la lanzas y te sale un resultado ms seguido que el otro, entonces puedes determinar mediante el chi cuadrado que los resultados no son al azar. Para interpretar este dato, el resultado que te salga lo tienes que comparar con un "nivel de tolerancia" que quieras dar al error en una distribucin. Entre ms alta sea el valor de la chi cuadrada, ser mayor la probabilidad de que los datos tengan una tendencia. Normalmente se utiliza la siguiente frmula para aceptar o rechazar el valor del chi cuadrado. (spssfree.com, 2008)

5. La prueba estadstica para determinar la significatividad de la diferencia en las frecuencias observadas es la prueba llamada Chi Cuadrada, la cual nos sirve para rechazar o aceptar las hiptesis NULA-ALTERNATIVA. (wikibooks.org, 2009)

PROBLEMA 1.
En un estudio de la capacidad de aprendizaje de matemticas, en los nios de una poblacin, se tom una muestra representativa de 40 nios. Se les aplic una prueba de diagnostico del aprendizaje en matemticas y con los datos obtenidos se calcul la varianza s2=8.4, conociendo que la varianza poblacional es de 2= 12,37, calcular el valor del estadstico chi-cuadrado. Datos: n= 40 S2= 8,4 a2= 12,37

Ahora vamos a elaborar el concepto de DISTRIBUCIN MUESTRAL DEL ESTADSTICO CHI- CUADRADO. Supongamos que se realiza los pasos siguientes: 1. De una poblacin de N elementos se extrae todas las muestras posibles del mismo tamao n. 2. Con los datos de cada muestra se calcula el estadstico chi cuadrado. 3. Con todos los valores de Chi cuadrado se forma una distribucin de frecuencias; stas se denomina distribucin muestral del Chi-cuadrado.

Esta distribucin muestral se representa grficamente en un sistema de coordenadas, colocando en el eje de abscisas los valores del estadstico Chi- cuadrado. Cuadrado en el eje vertical se colocan las frecuencias de cada valor del chi-cuadrado.

El rea encerrada bajo la curva y el eje horizontal es igual a uno y representar la probabilidad de que Chi-cuadrado tome valores mayores que 0.

El rea rayada situada a la derecha de la ordenada levantada en la abscisa x2 (gl), representa la probabilidad de cometer el error tipo l en la prueba de chi-cuadrado. Esta probabilidad es el nivel de significacin de la prueba. El valor x2 (gl) se llama valor crtico del chi-cuadrado y se determina por medio de una tabla especial, que representa al final del libro el aprendizaje de tablas. Antes de entrar en el manejo de la tabla debemos tener encuentra que para una probabilidad dad, por ejemplo =0.05, al aumentar el nmero de grados de libertada tambin aumenta el valor crtico de Chi-cuadrado; esto se ilustra en las tres figuras siguientes:

Este crecimiento del valor crtico se debe a que el aumentar el nmero de grados de libertad, la curva de la distribucin muestral de Chi-cuadrado tiende a tomar una forma ms extendida y por tanto el punto crtico se desplaza hacia la derecha. Descripcin y manejo de la tabla.- La tabla de valores crticos de x2 se encuentra en el apndice. En la lnea horizontal superior encabezando en cada columna se hayan los valores de . . En la primera columna de la izquierda estn los grados de libertad. Los ejemplos siguientes el manejo de la tabla.

Ejemplo:

=0.05 y gl= 4 g de l A partir de gl=4g de l, dirigimos una visual hacia la derecha hasta cortar a la visual que baja por =0.05; en la interseccin se encuentra el valor crtico
Ejemplo: Si Hallamos x2 (6)=12.592 Ejemplo: Si Encontramos x2 (10) = 18.307

Con estos 9 valores de la variable de estudio X, vamos a elaborar el cuadro de frecuencias observadas correspondientes a las 10 categoras establecidas.
Intervalos Frecuencias Observadas

1
2 3

< 6,26 a 6, 26
6 , 26 a 11,62 11,62 a 15,51

IIII - I
IIII - I III

6
6 3

4
5 6 7 8 9 10

15,51 a 18,80
18,80 a 21,96 21,96 a 25,12 25,12 a 28,41 28,41 a 32,30 32,30 a 37,66 37,66 a ms.

IIII
IIII IIII - IIII III IIII IIII IIII

5
4 10 3 4 4 5

50

A continuacin debemos realizar la clasificacin y conteo de los 50 datos, es decir, colocar a cada uno de ellos dentro de su categora representndolo por una tarja. La suma de las tarjas de cada clase da la frecuencia observada de esta clase. Para facilitar el clculo del estadstico chi-cuadrado mediante la frmula indicada.

Agregamos las frecuencias observadas y esperadas en celdas tal como se presenta a continuacin. Recordemos que se fijo la frecuencia esperada de 5 en cada intervalo, luego:

Agregamos las frecuencias observadas y esperadas en celdas tal como se presenta a continuacin. Recordemos que se fijo la frecuencia esperada de 5 en cada intervalo, luego: Frecuencia observada O, y frecuencia esperada E, en la Prueba Chi-cuadrado de Bondad de Ajuste.
Ei Oi 6 5 6 5 3 5 5 5 4 5 10 5 3 5 4 5 4 5 5 5

7) Toma de decisiones
Observamos que este valor de Chi-cuadrado, en el esquema grafico (figura 11.3.5) se ubica en la regresin de aceptacin, luego aceptamos esto es, que la muestra se obtiene de una poblacin distribuida normalmente.

PROBLEMA 2.
De una investigacin demogrfica se conoce que los habitantes de ciertos pases se distribuyen en la forma siguiente:
0 - 20 aos, 25%; 21 - 40 aos, 35%; 41 - 61 aos, 25%; 61 -80 aos, 10%; 81 100 aos, 5%. Despus de transcurridos varios aos se quiso probar que la distribucin poblacional de las edades no ha cambiado para lo que se selecciono una muestra respectiva de 1000 personas y se observo que las frecuencias de las 5 categoras fueron: 0 21 41 61 81 - 20 aos, 200; - 40 aos, 300; - 61 aos, 300; - 80 aos, 100; - 100 aos, 100.

1. H0 la distribucin actual por edades es igual a la del ao de ejecucin del censo H1 La distribucin actual por edades no es igual a la del ao de ejecucin

2. La prueba es unilateral y de cola derecha 3. Nivel de significacin a= 0.10 4. Se utiliza la distribucin CHI CUADRADO
ESQUEMA DE LA PRUEBA Existen k= 5 celdas, tenemos gl = K-1 = 5-1=4 grados de libertad a = 0.10 en la tabla de CHI CUADRADO obtenemos

7.779
77.14

CALCULO DEL ESTADSTICO DE LA PRUEBA


200 300 300 100 100

Las frecuencias observadas nos las proporcionan con la muestra aleatoria de los 1.000 habitantes. CALCULO DE LAS FRECUENCIAS ESPERADAS E1 = 1.000 X 25% = 250 E3 = 1.000 X 25% = 250 E5 = 1.000 X 5% = 50 E2 = 1.000 X 35% E4 = 1.000 X 10% = 350 = 100

CALCULO DEL ESTADISTICO CHI CUADRADO

= 10+7.14+10+0+50 = 77.14

TOMA DE DECISIONES Vemos que el estadstico calculado CHI CUADRADO (77.14) es mayor que el valor critico encontrado en la tabla (7.779) vemos que 77.14 cae en la regin de rechazo por lo tanto rechazamos, y aceptamos es decir la distribucin actual por edades no es igual a la de la investigacin demogrfica.

Anda mungkin juga menyukai