Anda di halaman 1dari 9

1 Comprendiendo la Estadstica

Hiptesis sobre la varianza


9.1 INTRODUCCION
En situaciones como la del control estadstico de calidad, de antemano se conocen los parmetros de referencia del proceso bajo control. La actividad central para decidir si en un momento dado, el proceso est bajo control o no, es la confrontacin permanente de los datos obtenidos con las hiptesis sobre la centralidad del proceso (media ) y sobre la magnitud de su variabilidad (varianza). Por esta razn desarrollaremos una seccin que se ocupe de resolver la contrastacin de una hiptesis que confronta un valor particular de la varianza contra los datos obtenidos del proceso, con el propsito de calcular un valor P, o equivalentemente, determinar una franja de confianza, con base en la cual puedan tomarse decisiones al respecto. Tuvimos la oportunidad de percibir la importancia de la comparacin de dos varianzas poblacionales. En la seccin de comparacin de medias, la situacin lleg a ser tan crtica, que dependiendo de si poda considerarse que dos varianzas eran iguales, se dispona o no de un instrumento para contrastar las hiptesis sobre igualdad de medias. El famoso problema de Behrens-Fisher, es un ejemplo de ello. En otras ocasiones estamos interesados en decidir entre dos procesos o tratamientos que producen artculos con la misma media de cierta caracterstica de inters. Un criterio plausible ser seleccionar aquel que tenga menor varianza. Surgiendo as la necesidad de la comparacin de las varianzas de los procedimientos. Estas son razones mas que suficientes para estar muy interesados en conocer algunos instrumentos que nos permitan tomar posicin frente a situaciones donde la variabilidad es un factor determinante.

9.1.1 Estimacin y Contraste de Hiptesis sobre la varianza 2 de una poblacin. (Poblacin Normal).
Desarrollemos esta prueba con base en un ejemplo de control estadstico de calidad. 1
Roberto Behar robehar@pino.univalle.edu.co

2 Comprendiendo la Estadstica

EJEMPLO 9.1-1 (Produccin de salchichas) Se sabe que un proceso de produccin de salchichas debe garantizar 2 un peso promedio por unidad de = 45 gramos, y una varianza = 4 gramos. En forma peridica se toma una muestra de 16 salchichas y se pesa cada una de ellas para controlar la variabilidad del proceso. En uno de los controles se obtiene los siguientes datos en gramos: 46.2 47.5 43.6 43.7 45.2 41.6 42.2 47.8 44.3 46.4 44.0 41.8 S = 2.8 51.7 49.0 47.8 44.2
S = 7.84
2

X = 45.4

La hiptesis que deseamos contrastar es: 0 : 2= 4

contra

1 : > 4
2

Recordemos que

(n 1)S 2

2 ~ n 1

Chi - cuadrado con (n -1) g.l

La regin de rechazo es de la forma ={ S 2 >c}. Por lo tanto:


Valor P = P S 2 > 7.84 / 0 = P S 2 > 7.84 / 2 = 4

(n 1)S 2 (16 1)7.84 Valor P = P > 2 4


2 Valor P = P( 15 > 29.4) = 0.55

Este valor P tan alto, no constituye evidencia para rechazar la hipte2 sis nula 0 =4. Por lo tanto asumimos que el proceso est bajo control en lo que a su varianza se refiere.

2
Roberto Behar robehar@pino.univalle.edu.co

3 Comprendiendo la Estadstica
COMENTARIOS- 1

Recuerde que estamos suponiendo que la distribucin del peso de


las salchichas es Normal. Exploremos este supuesto, observando el histograma.

7 6 Frecuencia 5 4 3 2 1 0 -3 -2 -1 0 1 2 3 4 Peso de una salchicha (Estandarizado)

Grfico 9.1-1. Distribucin del peso estandarizado de salchichas, comparada con la correspondiente distribucin normal estndar.

Recuerde que usted puede contrastar la hiptesis de normalidad, usando las herramientas desarrolladas en el captulo anterior.

9.1.2 Contraste de hiptesis sobre la comparacin de las varianzas 12 y 2 2 de dos poblaciones.


Desarrollemos este tema usando los datos del ejemplo 6.6-2
EJEMPLO 9.1-2

En el ejemplo 6.6-2 se tomaron mediciones de oxigeno disuelto Antes y despus de la implementacin de un proyecto para mejorar las condiciones del lago Titicoca. 3
Roberto Behar robehar@pino.univalle.edu.co

4 Comprendiendo la Estadstica Los datos fueron: OXIGENO DISUELTO DESPUS DEL PROYECTO
11.2 11.9 11.2 11.9 11.2 12.1 11.2 11.4 11.5 11.6 11.7 11.8

OXIGENO DISUELTO ANTES DEL PROYECTO


10.2 11.1 10.3 11.1 10.4 11.3 10.6 10.6 10.7 10.8 10.8 10.9

La pregunta ahora es el proyecto implementado ha aumentado la variabilidad del Oxigeno Disuelto? En smbolos podemos representar la pregunta con base en las siguientes hiptesis :
2 0 ; 2 A = D no aument)

(No hubo cambio en la variabilidad o por lo menos (La variabilidad aumento despus del proyecto)

2 1 : 2 A < D

2 es un estimador insesgado de 2 SA A
2 2 SD es un estimador insesgado de D

Para nuestro ejemplo, tenemos que


2 SA = 0.113

2 SD =0.104

De acuerdo con la definicin del valor P, debemos calcular la probabilidad de obtener unos datos como los nuestros o peores, cuando la hiptesis nula 0 es cierta. Cuando decimos peores, nos referimos S2 a valores grandes para el cociente: D . Note que esto suceder S2 A 2 ) sea mucho mayor que la del cuando la varianza del numerador ( SD denominador, lo cual favorece la hiptesis alternativa 1 . Para nuestros datos concretos tenemos que :
2 SD 0.104 = 0.92 2 = SA 0.113

4
Roberto Behar robehar@pino.univalle.edu.co

5 Comprendiendo la Estadstica Por lo tanto el valor P se calcula como:


2 S2 SD 2 D = P Valor P = P D > 0.92 / > 0.92 / 2 2 2 =1 0 SA SA A

Afortunadamente, cuando la hiptesis nula es cierta, es decir cuando


2 D = 1, el cociente de las varianzas muestrales 2 A

2 SD ~ F(n D 1, n A 1 ) Distribucion F con ( n D 1) grados de libertad S2 A en el numerador y ( nA 1) grados de libertad en el denominador.

De esta manera ya podemos calcular el valor P.


Valor P = P F(11, 11 ) > 0.92 > 0.25 (De la tabla de la distribucin F, no es posible saber exactamente cunto vale, pero si se sabe que el valor es superior al 25%). Este valor P, no permite rechazar la hiptesis nula 0 y por lo tanto podemos decir que los datos no presentan suficiente evidencia para afirmar que la variabilidad despus del proyecto ha aumentado.

COMENTARIOS- 2

Si el inters del problema fuera inferir de los datos si las varianza


son iguales o no, como sera la exigencia en las pruebas de comparacin de medias que suponen igualdad de varianzas, entonces al calcular el valor de P, resultados peores pueden ocurrir si el cociente de las varianzas muestrales es muy alto o tambin muy bajo, podemos calcular en este caso el valor P en forma aproximada multiplicando por dos (2) el valor que encontramos, cuando la prueba sea de una cola, como en el ejemplo que acabamos de resolver.

9.1.2.1 Sensibilidad del contraste para la comparacin de varianzas a la falta de normalidad - Una solucin alternativa.

5
Roberto Behar robehar@pino.univalle.edu.co

6 Comprendiendo la Estadstica Contrariamente a la prueba de igualdad de medias, esta prueba sobre igualdad de varianzas es bastante sensible al supuesto de normalidad, lo cual quiere decir que alejamientos no muy grandes de la distribucin normal, pueden invalidar la prueba, de tal manera que bajo la hiptesis nula 0 , el cociente de varianzas muestrales, no tenga distribucin conocida y por lo tanto se imposibilite el clculo del Valor P. Box, hunter and Hunter (1993), plantean una forma alternativa de cumplir el objetivo, llevando el contraste de varianzas a un contraste de medias, a travs del cual se puede resolver la situacin. Veamos un ejemplo.
EJEMPLO 9.1-3

Se desea comparar la precisin (variabilidad) de dos mtodos de medicin, digamos A y B. Para ello se hacen 10 tomas de un material a medir y se parten al azar en dos grupos de 5 datos, cada uno de los cuales va a ser sometido a los respectivos mtodos A y B de medicin. En cada caso se calcula la varianza correspondiente. Este proceso se repite por 5 veces. Los valores de las varianzas obtenidas se presentan en el cuadro. El fundamento de la prueba consiste en trabajar con base en el logaritmo del cociente de las varianzas. Observe que la hiptesis nula que se desea contrastar es:
2 A 0 : 2 = 1 Las varianzas son iguales B

La cual es perfectamente equivalente con: 2 2 = 0 Log 2 0 : log A 2 A Log B = 0 B


2 SA La estadstica con base en la cual se realiza el contraste, ya no es 2 SB 2 S 2 = LogS2 como antes, sino: log A 2 A LogS B SB

De esta manera lo que era un cociente, se convierte en una suma (resta). La gran ventaja es que el logaritmo de la varianza posee una distribucin mas cercana a la Normal, que la propia varianza. De esta manera 6
Roberto Behar robehar@pino.univalle.edu.co

7 Comprendiendo la Estadstica podemos realizar un contraste en forma aproximada, como si las observaciones originales fueran los logaritmos de las varianzas.
2 Queremos saber si la media de LogS2 A es igual a la media de LogSB .

En este caso, en que se hacen las dos mediciones cada vez sobre un mismo material, se trabajara con el enfoque de muestras apareadas. Por esta razn en el cuadro se hacen las diferencias observadas en cada material de nuestra variable de inters LogS2 .

CUADRO 9.1-1. Varianzas obtenidas en muestras de tamao 5, al hacer mediciones por mtodos distintos A y B.

Material 1 2 3 4 5

2 SA

LogS2 A
1.15 0.96 1.33 1.05 0.91

2 SB

2 LogSB

2 2 D = LogSA LogSB

14.2 9.1 21.4 11.3 8.2

4.3 7.9 10.7 3.7 4.5

0.63 0.90 1.03 0.43 0.65

0.52 0.06 0.30 0.62 0.26


d = 0.352

Suponiendo que la distribucin de D bajo la hiptesis nula, es aproximadamente Normal, entonces dado que la muestra es pequea n=5, usamos la distribucin t-student, para calcular el valor P. Veamos. 2 ValorP = P D > 0.352 / A 2 = 1 = 2 P(D > 0.352) B
D 0.352 0 D ValorP = 2 P > Sd n Sd

Como puede calcularse del cuadro la varianza de las diferencias:


2 SD =

(0.52 0.352)2 + (0.06 0.352)2 + ... + (0.26 0.352)2


5 1

= 0.051

De donde SD = 0.226 . As pues nuestro Valor P, resulta:

7
Roberto Behar robehar@pino.univalle.edu.co

8 Comprendiendo la Estadstica
0.352 ValorP 2 P t 4 > = 2 P (t4 > 3.49) = 2 0.013 = 0.026 0.226 5 Este valor es relativamente bajo, lo cual nos inducira a pensar que el Mtodo B es mas preciso que el mtodo A.

COMENTARIOS- 3

En este caso el apareamiento se dio en forma natural, pues la unidad (bloque) es el material. Cada vez se media el mismo material con los dos mtodos. Sin embargo no es necesario que este apareamiento ocurra en el contexto del problema para aplicar esta prueba, pues este puede inducirse, construyendo grupos al azar en cada una de las dos muestras. As por ejemplo, en este caso hubo 25 mediciones de A y 25 mediciones de B. Si no hubiera apareamiento, construiremos al azar en cada conjunto de mediciones, 5 grupos de 5 observaciones, a cada uno de los cuales se le calcula su varianza muestral. Luego se aparean al azar, y se aplica la prueba.

9.1 INTRODUCCION........................................................................................... 1

8
Roberto Behar robehar@pino.univalle.edu.co

9 Comprendiendo la Estadstica
9.1.1 Estimacin y Contraste de Hiptesis sobre la varianza de una poblacin. (Poblacin Normal). ..................................................................................................... 1 2 9.1.2 Contraste de hiptesis sobre la comparacin de las varianzas y 2 de dos poblaciones. ................................................................................................................... 3

9
Roberto Behar robehar@pino.univalle.edu.co

Anda mungkin juga menyukai