La prueba de hipótesis es un procedimiento estadístico
que comienza con una suposición que se hace con respecto a un parámetro de población, luego se recolectan datos de la muestra, se producen estadísticas de muestra y se usa esta información para decidir qué tan probable es que sean correctas nuestras suposiciones acerca del parámetro de la población en estudio. Objetivo de la prueba de hipótesis Decidir, basados en la muestra de una población, cuál de dos hipótesis complementarias es cierta. Las dos hipótesis complementarias se denominan hipótesis nula e hipótesis alternativa. Hipótesis Nula (H0) Representa la hipótesis que mantendremos cierta a no ser que los datos indiquen su falsedad. Esta hipótesis nunca se considera aceptada, en realidad lo que se quiere decir es que no hay suficiente evidencia estadística para rechazarla por lo que aceptar H0 no garantiza que H0 sea cierta. Es la hipótesis que se desea probar.
Hipótesis Alternativa (H1)
Hipótesis que se acepta cuando los datos no respaldan la hipótesis nula. PROCEDIMIENTO GENERAL PARA LA PRUEBA DE HIPÓTESIS PASO 1. Proponer las hipótesis Ho y H1 PASO 2. Especificar o seleccionar el nivel de significancia α PASO 3. Calcular los valores Críticos y de Prueba, definiendo las zonas de aceptación y rechazo de Ho. Paso 4. Tomar una decisión y redactar una conclusión VALORES CRÌTICO Y DE PRUEBA ESTADÍSTICOS DE PRUEBA A UTILIZAR 1. Teóricamente una máquina automática despachadora de refrescos vierte 225 ml por unidad. Una muestra aleatoria de 36 refrescos tiene un contenido promedio de 220 ml con una desviación estándar de 15 ml. Pruebe la hipótesis del promedio teórico igual a 225 ml en contraposición a la hipótesis alternativa de que es menor a 225 ml con un nivel de significación del 5% 2. El gerente de crédito de almacenes flamingo afirma que la media del saldo para los clientes con crédito en el almacén es de 410 mil pesos. Un auditor externo selecciona una muestra aleatoria de 18 cuentas y encuentra una media en el saldo de 511 mil pesos y una desviación estándar de 183 mil pesos. Si la afirmación del gerente no es apoyada por estos datos, el auditor pretende examinar todos los saldos de las cuentas de crédito. Si se supone que la población de saldos de créditos tiene una distribución aproximadamente normal, con un nivel de significancia del 5%; qué acción debe emprender el auditor? 3.Una compañía productora de yogurt controla su proceso de producción hasta tal punto de que los envases del producto los etiquetan con 20 gramos. El proceso lo detendrán cuando el promedio de llenado de cada envase no sea de 20 gramos; para ello toman una muestra de 16 envases determinando una media de 19 gramos. A un nivel de significancia del 5% y con una desviación poblacional de 2 gramos deberá pararse el proceso y ajustarse la máquina de llenado. 4. La tasa actual para producir fusibles de 5 amp en Neary Electric Co. es 250 por hora. Se compró e instaló una máquina nueva que, según el proveedor, aumentará la tasa de producción. Una muestra de 10 horas seleccionadas al azar el mes pasado indica que la producción media por hora en la nueva máquina es 256, con desviación estándar muestral de 6 por hora. Con .05 de nivel de significancia, ¿puede Neary concluir que la nueva máquina es más rápida? b. PRUEBA DE INDEPENDENCIA
La prueba Chi cuadrada es considerada como
una prueba no paramétrica que mide la discrepancia entre una distribución observada y otra teórica o esperada. También se utiliza para probar la independencia estadística de dos variables entre sí(lo cual será nuestro tema de estudio en la clase de hoy) mediante la presentación de los datos en tablas de contingencia. PRUEBA DE INDEPENDENCIA
Esta prueba se realiza, utilizando el estadística CHI CUADRADO
Ejemplo.
Se realizó una encuesta a 400 personas a las cuales se les
preguntó acerca de qué sistema operativo prefieren usar en sus dispositivos móviles( Celulares). Los resultados obtenidos se muestran en la siguiente tabla. Mujeres Hombres Total
S. ANDROID 95 55 150
S. iOS 110 30 140
S. WINDOWS MOBILE 92 18 110
Total 297 103 400
Establecer si el género (Hombre, Mujer) de una persona
tienen relación con el sistema operativo que prefiere en sus celulares a un nivel de significancia del 5% EJERCICIO 1. PARA ESTUDIAR LA DEPENDENCIA ENTRE LA PRÁCTICA DE ALGÚN TIPO DE DEPORTE Y LA DEPRESIÓN, SE SELECCIONÓ UNA MUESTRA ALEATORIA SIMPLE DE 100 JÓVENES CON LOS SIGUIENTES RESULTADOS SIN CON TOTAL DEPRESIÓN DEPRESIÓN
PRÁCTICA 38 11 49 DEPORTE NO PRACTICA 30 21 51 DEPORTE TOTAL 68 32 100
DETERMINAR SI HAY EVIDENCIA PARA DECIR QUE LA PRÁCTICA DE ALGÚN
DEPORTE ESTÁ RELACIONADO CON LA DEPRESIÓN, CON UN NIVEL DE SIGNIFICANCIA DEL 5% 16-34 34-55 55 o más Total Poca 8 12 21 41 Violencia Mucha 18 15 7 40 Violencia Total 26 27 28 81 Estamos interesados en estudiar la fiabilidad de cierto componente informático con relación al distribuidor que nos lo suministra. Para realizar esto, tomamos una muestra de 100 componentes de cada uno de los 3 distribuidores que nos sirven el producto comprobando el número de defectuosos en cada lote. La siguiente tabla muestra el número de componentes defectuosos para cada uno de los distribuidores. Realizar un contraste de homogeneidad para concluir si entre los distribuidores existen diferencias de fiabilidad referente al mismo componente con una significancia del 5%. Estamos interesados en estudiar la relación entre cierta enfermedad y la adicción al tabaco. Para realizar esto seleccionamos una muestra de 150 individuos, 100 individuos no fumadores y 50 fumadores. La siguiente tabla muestra las frecuencias de enfermedad en cada grupo (Completar la tabla). Realizar un contraste de homogeneidad y obtener las conclusiones sobre la relación entre las variables.
El Muestreo Aleatorio Simple Significa Que Cierta Muestra Dada de Un Tamaño Muestral Específico Tiene La Misma Probabilidad de Ser Seleccionada Que Cualquier Otra Muestra Del Mismo Tamaño