Estadstica II Unidad 1. Evidencia de aprendizaje. Pruebas no paramtricas y bondad de ajuste Rodrigo Galindo Murillo 1. Durante diez das se prueban dos mquinas con la finalidad de verificar si hay diferencias en cuanto al nmero de productos defectuosos. Se supone que las mquinas tienen la misma produccin por da. El resultado es el siguiente: Da 1 2 3 4 5 6 7 8 9 10 Maquina I 40 59 70 56 47 30 35 35 39 33 Maquina II 59 62 52 46 48 42 47 66 65 65 Utiliza la prueba de signo al nivel de significancia del 5% para realizar el siguiente contraste: H 0 : Las diferencias observadas de las mquinas en trmino de los productos defectuosos es el mismo H 1 : Las diferencias observadas de las mquinas en trmino de los productos defectuosos es distinto Para resolver por medio de la prueba de signo, tomamos las diferencias de las maquinas, de esta manera: Da Diferencia Signo 1 59-40=19 + 2 62-59= 3 + 3 52- 70=-18 - 4 46-56=-10 - 5 48-47= 1 + 6 42-30=12 + 7 47-35=12 + 8 66-35= 31 + 9 65-39= 26 + 10 65-33=22 +
Tomando los positivos tenemos 8 de 10 lo cual dara una proporcin de 0.8 que es bastante superior a 0.5. La hiptesis nula es que los productos defectuosos son iguales, entonces es necesario que sean bastante desiguales para rechazarla. El intervalo de confianza de p=0.5 nos da 95%. Para que los 8 signos positivos caigan fuera de l, la probabilidad de obtener 8 o ms debe ser menor que el 2.5% = 0.025. Es la mitad de 5%=0.05 porque tambin se puede incumplir la hiptesis nula por el otro extremo, cuando los signos + hubieran sido menos que los -. Vamos a calcular esa probabilidad de acuerdo con la frmula de la probabilidad binomial suponiendo que fuera p=0.5 P(8) = C(10,8) 0.5^8 0.5^2 = (109)/2 (1/2)^10 = 45 / 1024 = 0.04394 Este valor supera nuestro intervalo de 0.025, as que aceptamos la hiptesis nula y las diferencias observadas son similares. 2. La profesora Leticia Sandoval imparte la materia de lgebra en dos horarios distintos, una en la maana con 11 estudiantes y uno en la tarde con 8 estudiantes. Todos los estudiantes presentaron el mismo examen final, a la misma hora. Las calificaciones se muestran en la siguiente tabla: Clases de la maana (C1) 3 5 7 7 5 0 7 4 5 1 6 Clases de la tarde (C2) 1 1 2 3 4 3 7 9 Se puede concluir al nivel de significancia del 0.05 que el desempeo de la clase de la maana es peor que el de la clase de la tarde? Utiliza la prueba U de Mann-Whitney. Se deben primero ordenar los datos de manera que encontremos los rangos: 7 8 9 10 11 12 13 14 15 4 5 5 5 6 7 3 3 4 7 9.5 12 16.5
Y en aquellos datos que se repiten les daremos el mismo orden, que ser la media de los lugares que ocupan. As pues cada dato de los que estn subrayados tendr el orden que he puesto abajo del todo, no el de la tercera lnea. Calculamos R1 que la suma de los rdenes de la muestra 1 R1 = 1+2+7+9.5+12+12+12+14+16.5+16.5+16.5 = 119 R2 = 3+3+5+7+7+9.5+18+19= 71.5 Calculamos U1 = n1n2 + n1(n1+1)/2 - R1 = 118 + (1112)/2 - 119 = 35 U2 = n1n2 + n2(n2+1)/2 - R2 = 118 + (89)/2 - 71.5 = 52.5 Y el estadstico U es el mnimo (U1,U2) = 35 Y por teora esta U se aproxima a una normal con media = n1n2/2 = 118/2 = 44 Desviacin estndar = sqrt[n1n2(n1+n2+1)/12] = sqrt[8819/12] = 11.80395414 La hiptesis nula ser: Ho: Las dos clases tienen el mismo desempeo Se toma el estadstico de prueba Z = (U - media) / desviacin = (35 - 44) / 11.80395414 = -0.7624 Los valores de rechazo (p-valores) para este estadstico con significancia del 0.05 son -1.96 y 1.96. Son unos valores muy conocidos que se usan infinidad de veces, aunque si sabes cmo se calculan me lo dices y lo hago. Y el estadstico de prueba est entre los valores de rechazo, o sea, dentro de la zona de aceptacin de Ho. Luego no se rechaza Ho y el desempeo de ambas clases es el mismo. 3. Se muestrean 20 individuos que dan su opinin acerca de si les gusta o no cierto producto (indicando como S=S o N=no, respectivamente). Las respuestas se muestran a continuacin: S N S S N N N S N S N N N S S N S N S S Prueba al nivel de significancia del 0.05 si las respuestas son aleatorias.
4. Se cree que el peso del cerebro se distribuye de manera normal con media 1030 y desviacin estndar de 30, por lo que se toma una muestra de 25 individuos durante la autopsia. Pruebe si la afirmacin es cierta a un nivel del 0.05% Peso del cerebro (gramos) 1391 901 926 1012 827 1164 1351 1015 1043 1092 1365 1016 958 1052 976 1359 1045 1098 1345 842 1373 1233 1212 926 1041 Utilizando una prueba de chi cuadrado se deben sumar estas cantidades de manera que quede: (observada - esperada)^2 / esperada que de acuerdo a los nombres que hemos dado ser la suma de los 24 datos: [S(X) - F(X)]^2 / F(X) = 277526528.9 Los grados de libertad sern los de los datos menos uno, pero los datos no son 25 sino 24 que son los que se han entrado en el sumatorio, luego los grados de libertad son 23 Ahora hay que buscar en la tabla inversa de una chi cuadrado con 23 grados de libertad, los valores que encuentro son para 0.05 ----> 13.09 para 0.95 ----> 35.17 Entiendo que cuando el enunciado dice a un nivel de 0.05 se refiere al nivel de significancia, no al de confianza. Entonces el lmite de la suma de cuadrados habra sido 13.09 que ha sido ampliamente superado con el 277526528,9 Y aunque hubiera sido nivel de confianza da lo mismo, el 35.17 tambin fue superado. Luego la conclusin es que la hiptesis es falsa.