Anda di halaman 1dari 5

Anlisis de varianza

En el parrafo precedente, hemos visto como el test de Student permita hacer un test sobre el efecto de un tratamiento comparando con un grupo de control. Podramos querer evaluar los efectos de varios tratamientos diferentes. El anlisis de varianza (analysis of variance o ANOVA) puede ser visto como una generalizacin del test de Student.

Se quiere hacer un test sobre los efectos de tratamientos que han sido administrados a individuos respectivamente. En el anlisis de varianza, el parmetro que puede influir sobre los datos se llama un factor, y sus valores las modalidades (en este caso los diferentes tratamientos).

En el modelo probabilista, cada modalidad corresponde a una muestra. Para denotamos por:

a las variables aleatorias que modelan los datos del

-simo grupo, que se suponen es constante,

independientes y con una misma ley . Se supone que en particular la varianza hiptesis que puede ser validada a travs de un test.

Se quiere saber si la variabilidad que se observa en los datos se debe solamente al azar o si existen efectivamente diferencias significativas entre las clases, imputables al factor. Para esto vamos comparar las varianzas empricas de cada muestra con la varianza de la muestra global, de tamao . La media de las varianzas (ponderada por los efectivos) resume la variabilidad en el interior de las clases, de ah el nombre de varianza intra-clases o varianza residual.

La varianza de las medias describe las diferencias entre las clases que pueden deberse al tratamiento, de aqu el nombre de varianza inter-clases, o varianza explicada. Si los tratamientos tienen efectivamente un efecto, se espera que la varianza explicada sea grande en comparacin con la varianza residual. La descomposicin de la varianza de la muestra global en varianza explicada y varianza residual se da explcitamente en el siguiente resultado.

Proposicin 3.6 Se denota por:

la media emprica de la -sima clase,

la varianza emprica de la -sima clase,

la media de la muestra global,

la media de las varianzas (varianza intra-clases),

la varianza de las medias (varianza inter-clases),

la varianza de la muestra global. Entonces:

Demostracin : Desarrollemos:

La hiptesis a comprobar es la igualdad de las esperanzas.

El inciso 3 del teorema 3.1 permite cuantificar la ley de las diferentes componentes de la varianza, empleando el hecho que la suma de dos variables independientes que siguen dos leyes de chicuadrado sigue tambin una ley de chi-cuadrado, y que su cociente ponderado sigue una ley de Fisher. Los resultados son los siguientes.

Proposicin 3.7 Bajo la hipotesis :

sigue la ley de chi-cuadrado .

sigue la ley de chi-cuadrado .

sigue la ley de Fisher .

El test ANOVA consiste entonces en rechazar la igualdad de las medias (aceptar que hay un efecto de los tratamientos), cuando el cociente ponderado entre la varianza explicada (inter-clases) y la variance residual (intra-clases) es significativamente ms grande que los cuantiles de la ley . Retomemos los datos sobre las tasas de colesterol en sangre del parrafo precedente. El factor tiene dos modalidades. La varianza explicada vale , la varianza residual . El cociente ponderado de las dos es , con un p-valor de:

Es el doble del p-valor que habamos encontrado para el test de Student. En el caso de un anlisis de varianza con dos modalidades, el estadgrafo del test es el cuadrado del estadgrafo del test de Student. Si una variable aleatoria sigue la ley , su cuadrado sigue la ley . Efectuar un anlisis de varianza o un test de Student bilateral es estrictamente equivalente.

Si el anlisis de varianza acepta la hiptesis de la igualdad de las esperanzas, el estudio est terminado. Pero si es rechazada, podramos desear ir ms all y comparar los efectos de un factor, para subconjuntos de modalidades, realizando anlisis de varianza parciales.

Se puede presentar el anlisis de varianza con un factor desde un punto de vista ligeramente diferente. Escribamos cada una de las variables aleatorias de la muestra relativa a la -sima modalidad en la forma:

donde las variables aleatorias (los errores o residuos del modelo) son independientes y de una misma ley . Los parmetros son nmeros reales tales que . Nos encontramos con el modelo precedente poniendo . La hiptesis a comprobar ser, por supuesto:

Esta presentacin tiene la ventaja de aislar (en los parmetros ) los efectos fijos de los factores. En los casos en que las modalidades son muy numerosas o si los tamaos de las muestras son muy pequeos, a veces se recurre a un modelo de efectos aleatorios :

donde los efectos son variables aleatorias independientes de ley normal . La hiptesis se convierte en:

Aunque el modelo sea diferente, el procedimiento es rigurosamente idntico.

El anlisis de varianza se extiende al estudio de los efectos de varios factores. Es la base de un campo completo de la estadstica, el diseo de experimentos

Anda mungkin juga menyukai