NOTAS DE CLASE: SEPTIEMBRE 2 DE 2008
EL EXPERIMENTO FACTORIAL
‐ Se utiliza cuando se quiere analizar el efecto de dos o más fuentes de interés (factores).
‐ Permite analizar los efectos de las interacciones, además del efecto aislado de cada uno de
los factores.
Ejemplo: Se quiere analizar la respuesta en la longitud de una pieza de determinado material,
ante variaciones de presión y temperatura. En la tabla siguiente se podrían registrar las
observaciones correspondientes a cada tratamiento.
TEMPERATURA (A)
ALTA BAJA
ALTA
PRESIÓN (B)
BAJA
Acerca de la notación: Los factores se representan con letras mayúsculas, mientras que los
tratamientos se identifican mediante letras minúsculas.
Si un investigador quisiera determinar el efecto de tres factores (A, B, C) con dos niveles cada
uno, podría considerar la opción de experimentar con un solo factor a la vez. Sin embargo,
como se explicará más adelante, no es ésta la forma más eficiente de conducir un
experimento.
Si se realiza el experimento de un solo factor se consideraría de forma directa los siguientes
tratamientos:
‐ Todos los factores en nivel bajo (1)
‐ Factor A en nivel alto (a)
‐ Factor B en nivel alto (b)
‐ Factor C en nivel alto (c)
Estos tratamientos están representados por 4 vértices del cubo mostrado en la siguiente
figura:
c
(1) b
a
Por otro lado, si el mismo investigador decidiera realizar un experimento factorial completo,
adicionalmente tendría en cuenta los efectos combinados de los tratamientos.
El diagrama siguiente representa todos los tratamientos que compondrían el experimento
factorial completo con tres factores y dos niveles para cada factor:
c bc
ac abc
(1)
b
a ab
Ahora cabe formularse la pregunta ¿Por qué el experimento factorial completo puede ser más
eficiente que el experimento de un solo factor?
Supóngase que se quiere experimentar con dos factores A y B, uno a la vez. Si cada uno de
dichos factores se puede ajustar en dos niveles, sería necesario considerar 3 tratamientos (A
en alto, B en alto, A y B en bajo). Para tener una base de comparación de la variabilidad dentro
de los factores, es necesario disponer de por lo menos 2 datos en cada uno de los tres
tratamientos.. La figura siguiente representa los tratamientos y los valores supuestos de los
efectos.
27.9
28.2
B
24.3 30.3
25.1 29.1
A
Si se realizara un experimento factorial, se consideraría además el tratamiento AB en nivel
alto. Al incluir este tratamiento, sólo se requeriría de 1 observación en cada tratamiento, dado
se dispondría de un par de observaciones en cada nivel de cada uno de los factores (ver figura
siguiente).
27.9 25.2
B
24.3 30.3
A
Además de necesitar menos datos (solamente cuatro en el ejemplo anterior), este plan
experimental permitiría estudiar todas las combinaciones de los niveles de los factores, lo cual
se permitiría analizar los efectos de las interacciones.
El modelo estadístico que se utiliza para construir la tabla ANOVA del experimento factorial de
dos factores:
Donde,
: Respuesta observada cuando el factor A está en el i‐ésimo nivel (i = 1, 2, 3, …, a) y el
factor B está en el j‐ésimo nivel ( j = 1, 2, …, b) para la k‐ésima réplica (k = 1, 2, …, n)
: Efecto medio global
: Efecto del i‐ésimo nivel del factor A
: Efecto del j‐ésimo nivel del factor B
: Efecto de la interacción entre y
: Error
En este modelo, el error total se puede descomponer en los siguientes elementos:
SSTOTAL = SSA + SSB + SSAB + SSERROR
De manera similar se descomponen los grados de libertad:
glTOTAL = glA + glB + glAB + glERROR
Si el factor A tiene a niveles y el factor B tiene b niveles,
glA : a ‐1
glB : b ‐1
glAB : (a ‐1)( b ‐1)
Ejemplo: Se quiere analizar la dureza de un nuevo material ante cambios en la presión y la
temperatura. Para cada tratamiento se registraron 2 observaciones.
Temperatura (oC)
100 200 300
5 10 19
Presión 3
7 12 17
(Bares)
11 6 9
5
8 8 10
Para realizar el ANOVA, se procede a obtener las sumatorias correspondientes los niveles de
cada factor.
5 10 14
65
7 12 17
11 6 9
52
8 8 10
31 36 50 117
31 36 50 117
4 12
48.4
65 52 117
6 12
14.08
Se calculará a partir de los errores de los tratamientos. Para ello se organiza la tabla de la
siguiente manera:
Tratamientos
100 ; 3 100; 5 200; 3 200; 5 300, 3 300; 5
Réplica 1 5 11 10 6 14 9
Réplica 2 7 8 12 8 17 10
Suma 12 19 22 14 31 19
Suma2 144 361 484 196 961 361
144 361 484 196 961 361 117
2 12
112.75
Dado que,
112.75 48.5 14.08
50.17
Además, debe calcularse . Éste se obtiene a partir del .
117
5 7 … 9 10
12
128.25
De esta manera,
128.25 48.5 14.08 50.15
Con esta información se construye la tabla ANOVA.
De esta manera se obtienen los siguientes valores:
FUENTE SS gl Mean Square F Calculada
A 48.50 2 24.25 9.38
B 14.08 1 14.08 5.44
AB 50.15 2 25.08 9.69
ERROR 15.52 6 2.59
TOTAL 128.25 11
FACTORIALES 2K
En este experimento se analizan:
• k Factores
• 2 Niveles para cada factor
Por consiguiente, se consideran 2k tratamientos.
El siguiente diagrama representa los tratamientos de un factorial 2K , cuando k = 2.
ab
b
(1)
a
En este tipo de experimento, los tratamientos se representan como se indica en la tabla
siguiente.
NIVELES DE LOS NOTACIÓN DE LOS FUENTES
FACTORES TRATAMIENTOS A B AB
FACTORES A B
Bajo Bajo a0b0 = 1 ‐ ‐ +
Alto Bajo a1b0 = a + ‐ ‐
TRATAMIENTOS
Bajo Alto a0b1 = b ‐ + ‐
Alto Alto a1b1 = ab + + +
Para analizar el impacto de cada fuente, se utiliza el concepto de contraste. El contraste i se
refiere la variación total en la respuesta ante cambios de nivel de la fuente i. Las figuras
siguientes representan los principales contrastes:
Contraste de la fuente A:
b ab
(1)
a
Contraste de la fuente B
b ab
(1) a
Contraste de las fuentes AB
b ab
a
(1)
MODELO DE REGRESIÓN PARA EL EXPERIMENTO FACTORIAL
Como se había explicado en una clase anterior, el modelo de regresión se utiliza cuando los
niveles de los factores son de carácter cuantitativo. Si se supone un modelo lineal, y se hacen n
observaciones independientes y1 , y2 , …, yn , la i‐ésima observación puede representarse como
…
Mediante notación matricial, el modelo puede escribirse simplemente como
Donde,
⎡ y1 ⎤ ⎡β0 ⎤ ⎡1 X 11 X 12 ... X 1k ⎤ ⎡ε1 ⎤
⎢y ⎥ ⎢β ⎥ ⎢1 X X 22 ... X 2 k ⎥⎥ ⎢ε ⎥
Y= ⎢ 2⎥
, β = ⎢ 1⎥
, X = ⎢
21
, ε = ⎢ 2⎥
⎢:⎥ ⎢: ⎥ ⎢: : : : : ⎥ ⎢:⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎣ yn ⎦ ⎣β k ⎦ ⎣1 X n1 X n2 ... X nk ⎦ ⎣ε n ⎦
En el ámbito del diseño de experimentos, a se le llama matriz de diseño. Dicha matriz está
conformada por:
‐ Una columna por cada estimador del modelo.
‐ Una fila por cada observación en el experimento.
Las ecuaciones de mínimos cuadrados para obtener los estimadores del modelo de regresión,
están dadas por:
( X' X)βˆ = X' Y
Por lo tanto,
βˆ = ( X' X) −1 X' Y
Ejemplo: A través de un experimento factorial 22 se intenta determinar la respuesta de la
dureza de un material ante cambios de presión y temperatura.
5 300; 5
Presión
3
100 300
Temperatura
Si emplea un modelo de regresión para este problema, la ecuación correspondiente es:
Entonces, la matriz de diseño será:
β0 β1 β2 β3
1 100 3 300
1 100 3 300
1 200 3 600
1 200 3 600
1 100 5 500
1 100 5 500
1 200 5 1000
1 200 5 1000
La matriz anterior es poco práctica por las siguientes razones:
‐ Se emplean valores con diferentes unidades (dimensiones). Por lo tanto, no será posible
realizar una comparación directa de los estimadores βi , dado que estos también tendrán
diferentes unidades.
‐ La matriz no se puede operar con facilidad
‐ Si se suprime una columna de esta matriz, cambiarán todos los términos de ´
Por las anteriores razones, se procede a codificar las variables, de acuerdo con la siguiente
ecuación:
2
Donde,
: Variable natural i
: Promedio de la variable i
Rango: Rango de la variable i
Por ejemplo,
100 150
1
100/2
Al efectuar la conversión del resto de las variables, la matriz de diseño queda como se
muestra:
β0 β1 β2 β3
1 ‐1 ‐1 +1
1 ‐1 ‐1 +1
1 +1 ‐1 ‐1
1 +1 ‐1 ‐1
1 ‐1 +1 ‐1
1 ‐1 +1 ‐1
1 +1 +1 +1
1 +1 +1 +1
Nota: Nuevamente, los valores de la columna β3 se pueden calcular como el producto de los
valores de las columnas β1 y β2 en la misma fila.
Al calcular la matriz ´ , se obtiene:
1/8 0 0 0
0 1/8 0 0
0 0 1/8 0
0 0 0 1/8
A la anterior, también se le denomina matriz de coeficientes varianza‐covarianza. Debido a que
en ella sólo los únicos elementos diferentes de cero se encuentran en la diagonal principal,
permite estimar el impacto aislado de cada fuente (columna).
Si el vector de las respuestas Y registradas durante el experimento fuese:
9
12
16
19
6
8
11
9
Entonces, para obtener los estimadores del modelo de regresión bastará con hacer las
respectivas sustituciones en la expresión:
βˆ = ( X' X) −1 X' Y
De esta manera, X' Y =
Finalmente, al premultiplicar ´ por el resultado anterior, se obtienen los estimadores
del modelo de regresión:
90 20 22
8 8 8
Estos estimadores también podrían haberse obtenido mediante el método de la pendiente.