El anlisis de la varianza (ANOVA, ANalysis Of VAriance, segn terminologa inglesa) es una
coleccin de modelos estadsticos y sus procedimientos asociados, en el cual la varianza est particionada en ciertos componentes debidos a diferentes variables explicativas. Las tcnicas iniciales del anlisis de varianza fueron desarrolladas por el estadstico y genetista R. A. Fisher en los aos 1920 y 1930 y es algunas veces conocido como "Anova de Fisher" o "anlisis de varianza de Fisher", debido al uso de la distribucin F de Fisher como parte del contraste de hiptesis. En resumen, el anlisis de varianza sirve para comparar si los valores de un conjunto de datos numricos son significativamente distintos a los valores de otro o ms conjuntos de datos. El mtodo para comparar estos valores est basado en la varianza global observada en los grupos de datos numricos a comparar. Tpicamente, el anlisis de varianza se utiliza para asociar una probabilidad a la conclusin de que la media de un grupo de puntuaciones es distinta de la media de otro grupo de puntuaciones. VISIN GENERAL Existen tres clases conceptuales de estos modelos: 1. El Modelo de efectos fijos asume que los datos provienen de poblaciones normales las cuales podran diferir nicamente en sus medias. (Modelo 1) 2. El Modelo de efectos aleatorios asume que los datos describen una jerarqua de diferentes poblaciones cuyas diferencias quedan restringidas por la jerarqua. Ejemplo: El experimentador ha aprendido y ha considerado en el experimento slo tres de muchos ms mtodos posibles, el mtodo de enseanza es un factor aleatorio en el experimento. (Modelo 2) 3. El Modelo de efectos mixtos describen situaciones que ste puede tomar. Ejemplo: Si el mtodo de enseanza es analizado como un factor que puede influir donde estn presentes ambos tipos de factores: fijos y aleatorios. (Modelo 3) SUPUESTOS PREVIOS El ANOVA parte de algunos supuestos o hiptesis que han de cumplirse: La variable dependiente debe medirse al menos a nivel de intervalo. Independencia de las observaciones. La distribucin de los residuales debe ser normal. Homocedasticidad: homogeneidad de las varianzas.
TCNICA FUNDAMENTAL La tcnica fundamental consiste en la separacin de la suma de cuadrados (SS, 'sum of squares') en componentes relativos a los factores contemplados en el modelo. Como ejemplo, mostramos el modelo para un ANOVA simplificado con un tipo de factores en diferentes niveles. (Si los niveles son cuantitativos y los efectos son lineales, puede resultar apropiado un anlisis de regresin lineal).
SSTotal = SSError + SSFactores
El nmero de grados de libertad (gl) puede separarse de forma similar y se corresponde con la forma en que la distribucin chi-cuadrado describe la suma de cuadrados asociada. glTotal = glError + glFactores IMPORTANCIA DEL ANOVA El objetivo central del diseo experimental es la comparacin de dos o ms tratamientos, cada uno de los cuales representa una poblacin, como es usual en experimentos comparativos. Si, por ejemplo, se tiene un factor A con k niveles o tratamientos, y cada uno de ellos est repetido r veces en el experimento, cada unidad experimental produce una observacin, la cual se analiza con base en un modelo estadstico llamado modelo lineal aditivo. El anlisis de un experimento est basado, por lo general, en un modelo matemtico para las observaciones, y este modelo matemtico est relacionado y justificado por el diseo. Se puede asegurar que la aleatorizacin es el paso que introduce los modelos probabilsticos para las observaciones. Este hecho fue observado inicialmente por Fisher y es considerado actualmente como una de sus mayores contribuciones al desarrollo de la ciencia.
DISEO DE BLOQUES COMPLETOS ALEATORIZADOS Factor perturbador: Factor del diseo que probablemente tenga un efecto sobre la respuesta, pero no existe un inters especfico en l Factor Perturbador Desconocido y no controlable: Puede tener niveles variables mientras se est realizando el experimento Una forma de protegerse contra estos factores perturbadores es la aleatorizacin. Factor Perturbador conocido pero no controlable: Si por lo menos, puede observarse el valor que asume el factor perturbador en cada corrida del experimento, puede hacerse la compensacin correspondiente mediante el uso de anlisis de covarianza (no la estudiaremos en este curso) Factor perturbador conocido y controlable: Puede usarse una tcnica conocida como formacin de bloques para eliminar de manera sistemtica su efecto. DESCRIPCIN DEL PROBLEMA Tcnica de diseo importante Se utiliza ampliamente en la experimentacin industrial
Quiere determinarse si cuatro puntas diferentes producen o no lecturas diferentes en una mquina para probar la dureza. La mquina funciona presionando la punta en un ejemplar de prueba de metal Por la profundidad de la depresin resultante puede determinarse la dureza del ejemplar El experimentador ha decidido obtener cuatro observaciones para cada punta Hay un solo factor: el tipo de punta Un diseo completamente aleatorizado de un solo factor consistira en asignar al azar cada una de las 4x4=16 corridas a una unidad experimental (ejemplar de prueba de metal) y observar qu resulta de la lectura de la dureza. Se requieren 16 ejemplares de prueba de metal (uno por cada corrida del diseo) PROBLEMTICA DE LA SITUACIN Problema para esta situacin: Si los ejemplares de prueba de metal difieren ligeramente en sus durezas (podra ocurrir si los lingotes se produjeron a temperaturas diferentes), Las unidades experimentales (ejemplares de prueba) contribuirn a la variabilidad observada en los datos de la dureza Como resultado, el error experimental reflejar tanto el error aleatorio, como la variabilidad entre los ejemplares de la prueba. El objetivo del diseo debera ser hacer el error experimental tan pequeo como fuera posible: eliminar del error experimental la variabilidad de los ejemplares de prueba. Se requiere que el experimentador pruebe cada punta una vez en cada uno de los cuatro ejemplares de prueba DISEO DE BLOQUES Diseo de bloques completos aleatorizados (RCBD, randomized complete block design) Completo: cada bloque (ejemplar de prueba) contiene todos los tratamientos (Puntas) Los bloques o ejemplares de prueba forman una unidad experimental ms homognea en la cual comparar las puntas
Esta estrategia de diseo mejora la precisin de las comparaciones entre las puntas al eliminar la variabilidad entre los ejemplares de prueba Dentro de un bloque, el orden en que se prueban las cuatro puntas se determina aleatoriamente APLICACIONES DEL RCBD Es uno de los diseos experimentales ms utilizados Es apropiado en un amplio nmero de situaciones Un caso de aplicacin es en las unidades de equipo o maquinaria de prueba (que son diferentes entre s) Otros factores: Lotes de materia prima Personas Tiempo Son fuentes de variabilidad perturbadora comunes en un experimento que pueden controlarse de manera sistemtica mediante la formacin de bloques La conformacin de bloques puede ser til en situaciones que no incluyen necesariamente factores perturbadores Puede haber un conjunto de factores no controlables: Ejemplo: Un ingeniero qumico est interesado en el efecto de la velocidad de alimentacin del catalizador sobre viscosidad de un polmero. Hay varios factores difciles de controlar: fuente de materia prima, temperatura, operador, pureza de la materia prima Se decide probar en bloques la velocidad de alimentacin del catalizador, donde cada bloque consiste en alguna combinacin de estos factores no controlables Se utilizan los bloques para probar la robustez de la variable de proceso para las condiciones que no pueden controlarse con facilidad. ANLISIS ESTADSTICO PARA RCBD Suponga que se tienen a tratamientos a comparar Se tienen b bloques Hay una observacin por tratamiento en cada bloque El orden en que se corren los tratamientos dentro de cada bloque se determina al azar
Debido a que la nica aleatorizacin de los tratamientos se hace dentro de los bloques, con frecuencia se dice que los bloques representan una restriccin sobre la aleatorizacin Modelo de los efectos para RCBD: