Instituto Tecnolgico de
Ensenada
Competencias
Explicar cuando un diseo de experimentos es un diseo factorial, describiendo los
conceptos bsicos que estos involucran y mostrado cmo se hace tal experimentacin.
Desarrollar los diseos factoriales de dos y tres factores. Conocer el diseo factorial
general y diferenciar los modelos de efectos fijos con los modelos de efectos aleatorios.
Interpretar correctamente los anlisis grficos y el anlisis de varianza en los diseos
factoriales.
11
4
CAPTULO
4
Diseos
factoriales
cada uno con tres niveles de prueba. Es claro que si los k factores no tienen la misma
cantidad de niveles, entonces no se puede factorizar de esta forma, y debe escribirse el
producto de manera ms explcita: por ejemplo con k = 3 factores, el primero con cuatro
niveles y los dos restantes con dos niveles, se tiene el diseo factorial
, que consiste de 16 combinaciones de niveles diferentes.
A: Levadura
B: Temperatura Y: Rendimiento
28
41
63
45
Para los datos de la tabla 4.1, los efectos principales estn dados por
Instituto Tecnolgico de
Ensenada
Efecto A =
Efecto B =
por lo que en trminos absolutos el efecto principal de B es mayor. Por otra parte, se
dice que dos factores interactan entre s o tienen un efecto de interaccin sobre la
variable de respuesta, cuando el efecto de un factor depende del nivel en que se
encuentra el otro. Por ejemplo, los factores A y B interactan si el efecto de A es muy
diferente en cada nivel de B, o viceversa. Ahora veamos esto con los datos de la tabla
4.1: el efecto de A cuando B es baja est determinado por
Efecto A (con B bajo) = 41 - 28 = 13
y cuando la temperatura es alta, el efecto de A es
Efecto A (con B alta) = 45 - 63 = 13
Como estos dos efectos de A en funcin del nivel de B son muy diferentes,
entonces es evidencia de que la eleccin ms conveniente del nivel de A depende del
nivel en que est B, y viceversa. Es decir, eso es evidencia de que los factores de A y B
interactan sobre Y. En la prctica, el clculo del efecto A en cada nivel de B no se
hace, y ms bien se calcula el efecto global de la interaccin de los dos factores, que se
denotan por AB y se calculan como la diferencia entre la respuesta media cuando ambos
factores se encuentran en el m ismo nivel: (-1, -1); (1, 1), y la respuesta media cuando
los factores se encuentran en niveles opuestos: (-1, 1) (1, -1). Para el ejemplo, el efecto
de interaccin levadura x temperatura est dado por
Los valores absolutos (sin importar el signo) de los efectos principales y del
efecto de interaccin son una medida de importancia de su efecto sobre la variable de
respuesta. Sin embargo, como se tienen estimaciones muestrales, para saber si los
efectos son estadsticamente significativos (diferentes de coro) se requiere el anlisis de
varianza (ANOVA).
Modelo estadstico
Con un diseo factorial
se pueden estudiar los dos efectos individuales y el efecto
de interaccin de ambos factores. En trminos estadsticos, lo que se afirma es que el
comportamiento de la respuesta Y en el experimento con k rplicas se podra describir
mediante el modelo de efectos:
combinacin
es el error aleatorio que supone sigue una distribucin con media
cero y varianza constante
y son independientes entre s. Para que la
estimacin de los parmetros en este modelo sea nica, se introducen las restricciones:
El factor
en los grados de libertad de la suma de cuadrados del error
( ) seala que se necesitan al menos dos rplicas del experimento para calcular ese
componente y, por ende, para construir una tabla de ANOVA. Recordemos que las
sumas de cuadrados divididas entre sus correspondientes grados de libertad se llama
cuadrados medios
. Al dividir stos entre el cuadrado medio del error
se
obtienen estadsticos de prueba con distribucin F. Toda esta informacin se sintetiza
en la siguiente tabla:
ANOVA para el diseo factorial
FV
SC
GL
Efecto A
Efecto B
Efecto AB
Error
Total
CM
Valor-p
y al final, al restar stas del total, se obtiene la suma de cuadrados del error como:
Ejemplo
Consideremos un experimento en el que se quiere estudiar el efecto de los factores A:
profundidad de corte sobre el acabado de un metal y B: velocidad de alimentacin.
Aunque los factores son de naturaleza continua, en este proceso slo se puede trabajar
en 4 y 3 niveles, respectivamente. Por ello, se decide correr un factorial completo 4 x 3
con tres rplicas, que permitir obtener toda la informacin relevante en relacin al
efecto de esos factores sobre el acabado. Al aleatorizar las 36 pruebas se obtienen los
datos de la siguiente tabla:
A: Profundidad
0,20
74
64 198
60
79
68 220
73
82
88 262
92
99
104 299
96
979
B: velocidad
0,25
0,30
92
99
86 266
98 299
88
102
98
104
104 290 99 298
88
95
99
108
108 302 110 317
95
99
104
114
110 313 111 332
99
107
1 171
1 246
Total
763
808
881
944
La suma de cuadrados totales y la suma de cuadrados del error estn dadas por
CM
Valor-p
1 580,25 55,02 0,0000
708,37
24,66 0,0000
92,84
3,23 0,0180
28,72
2
12
1
Rplicas:
3
Total de corridas: 36
Total de bloques:
1
Nmero de niveles: 4; 3
Tipo
fijo
fijo
Niveles
4
3
Valores
0.15; 0.18; 0.21; 0.24
0.20; 0.25; 0.30
GL
3
2
6
24
35
SC sec.
2125,11
3160,50
557,06
689,33
6532,00
SC ajust.
2125,11
3160,50
557,06
689,33
MC ajust.
708,37
1580,25
92,84
28,72
F
24,66
55,02
3,23
P
0,000
0,000
0,018
Comparacin de
medias
12
0
Comparacin de medias
Las comparaciones de medias se introdujeron en la seccin Diseo completamente al
azar y ANOVA del captulo 2, para despus de un ANOVA en el que se rechaza ,
investigar cules medias causa las diferencias detectadas. El ANOVA slo indica que al
menos un par de niveles del factor significativo son diferentes entre s, pero no dice
cules son. Por facilidad, denotemos los cuatro niveles de la profundidad (A) del
ejemplo anterior como
as como los tres niveles de la velocidad (B)
como
Entonces es, los seis pares de hiptesis para comparar las medias del
factor A son:
Para probar estas hiptesis con el mtodo LSD habra que calcular las
diferencias muestrales en el valor absoluto y compararlas con la diferencia mnima
significativa. Cabe aclarar que este anlisis es engaoso cuando el efecto de interaccin
es significativo. Por ello, y slo por ilustrar el mtodo, se prueban las hiptesis del
factor A ignorando por el momento la interaccin. La diferencia mnima significativa
para comparar los niveles
del factor A, est dada por:
Donde
es el punto porcentual 100(
de la distribucin T de
Student,
los grados de libertad del cuadrado medio del error,
y
son el
total de observaciones en los niveles del factor A, que estn comparando. De esta
manera, en el ejemplo, como es un diseo balanceado
= = 9; entonces,
2
6
1
Rplicas:
Total de corridas:
Total de bloques:
3
18
1
Nmero de niveles: 3; 2
Tipo
fijo
Niveles
3
Valores
1; 2; 3
28.7
34.1
27.0
89.8 =
12
2
CAPTULO
4
Adherencia
Diseos
factoriales
fijo
Inmersin; Aspersin
GL
2
1
2
12
17
SC sec.
4,5811
4,9089
0,2411
0,9867
10,7178
R-cuad. = 90,79%
SC ajust.
4,5811
4,9089
0,2411
0,9867
MC ajust.
2,2906
4,9089
0,1206
0,0822
F
27,86
59,70
1,47
P
0,000
0,000
0,269
R-cuad.(ajustado) = 86,96%
Dado que utilizamos un = 0.05 y puesto que el valor de tanto para el factor
A (tipo de pintura) como para el factor B(tipo de aplicacin), con su nivel de
significancia como con sus grados de libertad respectivamente tenemos
y
. Se concluye que los efectos principales del tipo de pintura
tapaporo y del mtodo de aplicacin afectan la fuerza de adherencia. Adems, puesto
que 1,5
, no hay indicios de interaccin entre estos factores. En la
ltima columna del ANOVA se muestra el valor P para cada cociente F. Obsrvese que
los valores P de los dos estadsticos de prueba para los efectos principales son
considerablemente menores que 0,05 mientras que el valor P para el estadstico de
prueba de la interaccin es mayor que 0,05.
Se rechaza
Se rechaza
Se acepta
Temperatura (
Baja
Media
130 155 34 40
74 180 80 75
150 188 136 122
159 126 106 115
138 110 174 120
168 160 150 139
Alta
20 70
82 58
25 70
58 45
96 104
82 60
factorial y los factoriales mixtos con no ms de cuatro niveles en dos de los factores,
por ejemplo, el factorial 4 x 3 x 2 y el factorial 4 x 4 x 2, por mencionar dos de ellos.
Hiptesis de inters
El estudio factorial de tres factores (A, B y C) permite investigar los efectos: A, B, C,
AB, AC, BC y ABC, donde el nivel de desglose o detalle con el que pueden estudiarse
depende del nmero de niveles utilizando en cada factor. Por ejemplo, si un factor se
prueba en dos niveles, todo su efecto marginal (individual) es lineal, o sea que su efecto
individual no se puede descomponer; pero, si tuviera tres niveles su efecto marginal se
puede descomponer en una parte lineal y otra cuadrtica pura.
En resumen, se tienen siete efectos de inters sin considerar desglose, y con ellos
se pueden plantar las siete hiptesis nulas
cada una aparejada con su correspondiente hiptesis alternativa. El ANOVA para probar
estas hiptesis se muestran en la siguiente tabla.
ANOVA para el diseo a x b x c
FV
SC
GL
Efecto A
Efecto B
Efecto C
Efecto AB
Efecto AC
Efecto BC
Efecto ABC
Error
Total
CM
Valor-p
Al efecto cuyo valor-p sea menor al valor especificado para alfa, se declara
estadsticamente significativo o se dice que est activo. Las sumas de cuadrados son
muy similares a las obtenidas para dos factores; habr que considerar un subndice
adicional para el tercer factor, y comenzando otra vea, por la suma total de cuadrados,
stas resultan ser:
donde N =
12
5
de efectos son:
Al restar stas del total, la suma de cuadrados del error resulta ser
cuyos respectivos grados de libertad se dan en la tabla anterior. Una vez hecho el
ANOVA, se procede a interpretar los efectos activos, y luego (aunque no
necesariamente despus) a diagnosticar la calidad del modelo.
Ejemplo
El experimento. Se desea investigar el efecto del tipo de suspensin (A), abertura de
malla (B) y temperatura de ciclaje (C) en el volumen de sedimentacin Y(%) de una
suspensin. Para ello se decide correr un experimento factorial 3 x 2 x 2 con seis
rplicas, y las observaciones obtenidas en las 72 corridas experimentales se muestran en
la siguiente tabla:
60, 75, 75
86, 70, 70
55, 53, 53
55, 55, 55
67, 73, 73
67, 68, 68
52, 52, 57
52, 54, 54
62, 68, 65
76, 65, 65
44, 44, 45
48, 48, 45
71, 80, 80
72, 80, 80
60, 60, 60
67, 67, 65
76, 71, 75
70, 68, 73
52, 51, 50
52, 48, 54
75, 75, 75
75, 75, 77
56, 55, 57
59, 50, 55
Los niveles de prueba para cada factor, tanto en unidades originales como en
unidades codificadas, se muestran en la siguiente tabla
Factor
U. originales
U. codificadas
Bajo Medio Alto Bajo Medio Alto
-1
0
1
A: Tipo de suspensin
-1
1
40
60
B: Abertura de malla
-1
1
0
30
C: Temperatura
El anlisis de varianza para este ejemplo se muestra en la siguiente tabla. De
aqu se concluye que no influyen los efectos ABC, AC ni A, dado que su valor-p es
mayor que
. Por otra parte, se encuentran activos los efectos B, C, AB y en
menor medida BC. stos son los cuatro efectos que se deben interpretar. Los efectos
que no influyeron se pueden eliminar mandndolos al trmino error. El ANOVA
simplificado, pero con el efecto A note que el en ambos ANOVAS es
prcticamente igual. En general se recomienda interpretar slo los efectos significativos.
Diseo factorial de mltiples niveles
Factores:
Corridas base:
Bloques base:
3
12
1
Rplicas:
Total de corridas:
Total de bloques:
6
72
1
Nmero de niveles: 3; 2; 2
Niveles
3
2
2
Valores
A1; A2; A3
B1; B2
C1; C2
S = 3,74537
GL
2
1
1
2
2
1
2
SC sec.
13,86
480,50
6086,72
788,25
40,86
56,89
31,03
60
71
841,67
8339,78
R-cuad. = 89,91%
SC ajust.
13,86
480,50
6086,72
788,25
40,86
56,89
31,03
841,67
MC ajust.
6,93
480,50
6086,72
394,13
20,43
56,89
15,51
F
0,49
34,25
433,90
28,10
1,46
4,06
1,11
14,03
R-cuad.(ajustado) = 88,06%
Respuesta
60,0000
76,0000
86,0000
Ajuste
72,6667
66,8333
72,6667
Ajuste SE
1,5290
1,5290
1,5290
Residuo
-12,6667
9,1667
13,3333
Residuo
estndar
-3,70 R
2,68 R
3,90 R
P
0,613
0,000
0,000
0,000
0,241
0,049
0,338
Ejercicios
1.- Se investigan el porcentaje de la concentracin de madera dura en la pulpa cruda, la
libertad de orientacin de la fibra o lof, y el tiempo de coccin de la pulpa en cuanto a
sus efectos sobre la resistencia del papel. En la siguiente tabla se muestran los datos de
un experimento factorial con tres factores.
Porcentaje de la
Concentracin de
Madera dura
10
15
20
a) Analice los datos usando el anlisis de varianza bajo el supuesto de que todos
los factores son fijos. Use
b) Encuentre los valores de P de los cocientes F del inciso a
2.- El departamento de control de calidad de una planta de acabados textiles estudia los
efectos de varios factores sobre el teido de una tela combinada de algodn y fibra
sinttica que se usa para hacer camisas. Se seleccionan tres operadores, tres duraciones
del ciclo y dos temperaturas, y tres ejemplares de prueba pequeos de tela se tieron
bajo cada conjunto de condiciones. La tela terminada se compar con un patrn y se
asigno una puntuacin numrica. Los resultados se presentan en la tabla siguiente
Temperatura
300
350
Operador
Operador
1
2
3
1
2
23 27 31
24 38 34
24 28 32
23 36 36
25 26 28
28 35 39
36 34 33
37 34 34
35 38 34
39 38 36
36 39 35
35 36 31
28 35 26
26 36 28
24 35 27
29 37 26
27 34 25
25 34 34
Rapidez de
alimentacin
30 pulg/min
30 pulg/min
a) Analice los datos usando el anlisis de varianza bajo el supuesto de que todos
los factores son fijos. Use
b) Encuentre los valores de P de los cocientes F del inciso a
Diseo factorial
general
12
9
SC
GL
Error
Total
Modelo de efectos
aleatorios
13
1
como en efectos fijos. Lo que ahora (con efectos aleatorios) tiene sentido es hablar de la
varianza con la que el factor aleatorio contribuye a la variacin total; es decir, es preciso
estimar dicha varianza y probar si su contribucin a la variabilidad total es significativa.
El caso de dos factores aleatorios.
Si se consideran dos factores aleatorios A y B, de los cuales se prueban niveles
elegidos de una poblacin grande de niveles, entonces si los tratamientos se
replican veces, el modelo de efectos aleatorios es
Los clculos necesarios para probar estas hiptesis involucran las mismas sumas
de cuadrados del modelo de efectos fijos (diseos factoriales con dos factores), de las
cuales se obtienen los correspondientes cuadrados medios. Para obtener los estadsticos
de prueba apropiados debe tomarse en cuenta que los valores esperados de los
cuadrados medios son
de tal forma que para probar la hiptesis mencionadas, los estadsticos de prueba
apropiados en el ANOVA son
Ejemplo
En una compaa dedicada a la fabricacin de bombas y vlvulas, algunos componentes
crticos tienen tolerancias muy estrechas que son difciles de cumplir. De aqu que sea
necesario estimar el error de medicin con el fin de ver la posibilidad de reducirlo para
cumplir con las especificaciones. El ancho de una pieza particular es una caracterstica
de calidad crtica, cuyas especificaciones son 69 0,4mm. Se eligen dos inspectores al
azar y siete piezas para correr un experimento, a fin de estimar la contribucin de los
inspectores, de las piezas y del error aleatorio (repetibilidad) en la variabilidad total
observada. El experimento utilizado se muestra en la siguiente tabla:
Nmero de
piezas
1
2
3
4
5
6
7
Inspector Z
1
2
69,38 69,60
39,72 69,80
69,58 69,70
69,50 69,50
69,48 69,40
69,56 69,40
69,90 70,02
Inspector W
1
2
69,62 69,52
69,78 69,90
69,70 69,92
69,46 69,50
69,50 69,42
69,68 69,64
69,94 69,88
Ntese que cada inspector mide dos veces cada pieza. Sean los inspectores el
factor A y las piezas el factor B, el primero con dos niveles y el segundo con siete
niveles, en ambos casos seleccionados al azar. El modelo de componentes de varianza
propuesto para describir estos datos es donde
es el componente de varianza de los
inspectores,
es el componente debido a las piezas,
es el componente de
interaccin de ambos factores y
es el componente aleatorio.
Interesa probar las hiptesis:
SC
0,00036
0,7516
0,0313
0,097
0,8803
GL
1
6
6
14
27
CM
Valor-p
0,00036 0,069 0,8043
0,1252 24,07 0,0000
0,0052 0,75 0,6169
0,0069
Las tres primeras columnas se obtienen igual que el modelo de efectos fijos,
pero las dos ltimas deben corregirse de acuerdo con el estadstico de prueba apropiado
para un modelo de efectos aleatorios (
y
). Los valor-p indican que la variabilidad de las
piezas es
estadsticamente diferente a cero, mientras que la variabilidad de los inspectores y de la
interaccin inspector x pieza no es significativa (es igual a cero). Desde el punto de
vista del objetivo del experimento, los resultados del ANOVA son los deseados: la
reproducibilidad ( + ) es estadsticamente igual a cero, es decir, los inspectores no
afectan el proceso de medicin. La estimacin de los componentes de varianza, a partir
de los cuadros medios, queda como:
Uso de
software
13
5
debe oprimir el botn de la opcin <<Diseos>> para poder escoger su diseo, nmero
de repeticiones y otras opciones.
3.En la siguiente ventana escribir el nombre de nuestros factores A y B, adems de indicar
el numero de niveles para ambos (4 y 3 respectivamente), tambin indicar que
realizamos tres repeticiones por tratamiento, para esto en la casilla <<Nmero de
replicas>>, usted deber tener el valor de 3. Finalice esta pantalla oprimiendo
<<Aceptar>>. Esto lo devolver a la pantalla anterior <<Crear diseo factorial>>.
6.Una vez capturados los datos (estos datos debern corresponder al factor A con respecto a
factor B de acuerdo a la tabla original) en su correspondiente rengln. El siguiente paso
es regresar al paso 1.