0.79
1.00
79.06
20.00
Coefficient
Estimate
1.00
1.50
1.13
0.88
0.38
0.13
0.25
0.25
R-Squared
Adj R-Squared
Pred R-Squared
Adeq Precision
DF
1
1
1
1
1
1
1
1
Prob> F
0.0003
<0.0001
0.0005
0.0022
0.0943
0.5447
0.2415
0.2415
significant
0.9359
0.8798
0.7436
13.416
Standard
Error
0.20
0.20
0.20
0.20
0.20
0.20
0.20
0.20
950/0 Cl
95% CI
Low
0.54
1.04
0.67
0.42
-0.081
-0.33
-0.21
-0.21
High
1.46
1.96
1.58
1.33
0.83
0.58
0.71
0.71
VIF
1.00
1.00
1.00
1.00
1.00
1.00
1.00
237
Tabla 6-7
(continuacin)
Sumof
Squares
70.75
Source
Model
A
B
AB
Residual
Lack ofFit
Pure Error
'.~';
;:1
;'~:':j1
:~~~
~~:~
I;~:-;:
j~:
12.25
2.25
7.25
2.25
5.00
Cor Total
78.00
Std. Dev.
Mean
C.V.
PRESS
0.81
1.00
81.18
15.34
Factor
Intercept
A-Ca rbo natio n
B-Pressure
C-Speed
AB
w'
36.00
20.25
DF
4
1
1
1
1
11
3
8
15
Coefficient
Estimate
1.00
1.50
1.13
0.88
0.38
Mean
Square
17.69
36.00
20.25
F
Value
26.84
54.62
Prob> F
<0.0001
12.25
2.25
0.66
18.59
3.41
<0.0001
0.0002
0.0012
0.0917
0.75
0.63
1.20
0.3700
30.72
R-Squared
Adj R-Squared
Pred R-Squared
Adeq Precision
DF
1
1
1
1
1
Standard
Error
0.20
0.20
0.20
0.20
0.20
significant
not significant
0.9071
0.8733
0.8033
15.424
95% CI
Low
0.55
1.05
0.68
0.43
-0.072
95% CI
High
1.45
1.95
1.57
1.32
0.82
1.00
1.00
1.00
1.00
Student
Residual
-1.300
1.671
-0.186
1.300
-0.557
0.928
-1.671
-0.186
-0.928
0.557
0.186
-1.300
-0.186
-0.186
1.671
0.186
Cook's
Distance
0.154
0.254
0.003
0.154
0.028
0.078
0.254
0.003
0.078
0.028
0.003
0.154
0.003
0.003
0.254
0.003
Outlier
t
-1.347
1.845
-0.177
1.347
-0.539
0.922
-1.845
-0.177
-0.922
0.539
0.177
-1.347
-0.177
-0.177
1.845
0.177
VIF
238
Residual
-0.88
1.13
-0.12
0.88
-0.38
0.63
-1.13
-0.13
-0.63
0.37
0.13
-0.88
-0.13
-0.13
1.13
0.13
Leverage
0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313
"
6-3 EL DISEO 23
239
puesto que F o es grande, se concluira que al menos una de las variables tiene un efecto diferente de cero.
Entonces se prueba la significacin de cada efecto factorial individual utilizando el estadstico F. Estos resultados concuerdan con la tabla 6-6.
Abajo del anlisis de varianza del modelo completo se presentan varios estadsticosR2 LaR 2 ordinaria es
R2 = SSModelo = 73.00 = 0.9359
SSTotal
78.00
y mide la proporcin de la variabilidad total explicada por el modelo. Un problema potencial con este estadstico es que siempre se incrementa cuando se agregan factores al modelo, incluso cuando estos factores no son significativos. El estadstico R 2 ajustada, definido como
=1-
R 2.
Ajustada
SSTotal
es un estadstico que est ajustado para el "tamao" del modelo; es decir, para el nmero de factores. La
R 2 ajustada puede decrecer en realidad si se agregan trminos no significativos al modelo. El estadstico
PRESS es una medida de qu tan bien predecir datos nuevos el modelo (PRESS es en realidad el acrnimo de Prediction En'or Sum ofSquares -suma de cuadrados del error de prediccin-, y se calcula a partir
de los errores de prediccin obtenidos al predecir el punto i-simo de los datos con un modelo que incluye
todas las observaciones, excepto la i-sima). Un modelo con un valor pequeo de PRESS indica que es posible que el modelo sea un buen predictor. El estadstico "R2 de prediccin" se calcula como
R2
..
Predlcclon
Total
78 00
Esto indica que se esperara que el modelo completo explique cerca de 74% de la variabilidad de los datos
nuevos.
La siguiente seccin de la salida presenta el coeficiente de regresin de cada trmino del modelo y el
error estndar (se, standard error) de cada coeficiente, definido como
se(f3) = V~
V(f3) = ~MSE
- k =
A
n2
~O.625
= 0.20
2(8)
Los intervalos de confianza de 95% para cada coeficiente de regresin se calculan a partir de
240
turales. La proporcin de la variabilidad total de l desviacin de la altura del llenado que se explica por
este modelo es
R2
SSTotal
que es menor que laR 2 del modelo completo. Observe, sin embargo, que laR 2 ajustada del modelo reducido apenas ha cambiado ligeramente respecto de laR 2 ajustada del modelo completo, y PRESS del modelo reducido es considerablemente menor, lo cual produce un valor ms grande de R;rediccio del modelo
reducido. Evidentemente, la eliminacin de los trminos no significativos del modelo completo ha producido un modelo final que posiblemente funcionar con mayor eficiencia como predictor de datos nuevos.
Observe que los intervalos de confianza para los coeficientes de regresin del modelo reducido son ligeramente ms cortos que los intervalos de confianza correspondientes en el modelo completo.
En la ltima seccin de la salida se presentan los residuales del modelo reducido. Design-Expel1 tambin construir todas las grficas de los residuales que se estudiaron anteriormente.
Otros mtodos para evaluar la significacin de los efectos
El anlisis de varianza es una manera formal de determinar cules son los efectos de los factores que son
diferentes de cero. Existen varios mtodos ms que son tiles. A continuacin se indica cmo calcular el
error estndar de los efectos y cmo usar los errores estndar para construir intervalos de confianza para
los efectos. Otro mtodo, que se ilustrar en la seccin 6-5, utiliza grficas de probabilidad normal para
valorar la importancia de los efectos.
Es sencillo encontrar el error estndar de un efecto. Si se supone que hay n rplicas en cada una de las
2k corridas del diseo, y si Yi!' Yi2' ..., Yin son las observaciones de la corridai-sima, entonces
i
= 1, 2, ...,
2k
es una estimacin de la varianza de la corrida i-sima. Las estimaciones de la varianza del diseo 2k pueden combinarse para dar una estimacin de la varianza global:
(6-19)
sta es tambin la estimacin de la varianza dada por el cuadrado medio del error en el anlisis de varianza. La varianza de la estimacin de cada efecto es
V(Efecto) = V
(c:n;~~lste )
1
(n2
k-l
)-
V(Contraste)
Cada contraste es una combinacin lineal de los 2k totales de los tratamientos, y cada total consta de n observaciones. Por lo tanto,
V(Contraste) = n2 k 0
"
6-3 EL DISEO 23
241
y la varianza de un efecto es
V(Efecto):=:
:=:
:=:
:-1 ) 2n2 a
k
(n2
1
-a -?
k 2
n2 2a
.Jn2 k
El error estndar estimado se encontrara sacando la raz cuadrada de esta ltima expresin y sustituyendo con su estimacin S2:
.
2S
se(Efecto):=:.J k.
(6-20)
n2
Observe que el error estndar de un efecto es el doble del error estndar de un coeficiente de regresin estimado en el modelo de regresin del diseo 2k (ver la salida de computadora de Design-Expel1 del
ejemplo 6-1).
Los intervalos de confianza de 100(1 - a) por ciento para los efectos se calculan a partir de Efecto
ta/2.N_pSe(Efecto), donde los grados de libertad de t son slo los grados de libertad de los residuales o del
error (N - p :=: nmero total de corridas - nmero de parmetros del modelo).
Para ilustrar este mtodo, considere el experimento de la desviacin de la altura de llenado del ejemplo 6-1. El cuadrado medio del error esMSE :=: 0.625. Por lo tanto, el error estndar de cada efecto es (utilizando S2 :=: MSE)
se(Efecto):=:
:=:
2S
vn2 k
2.JOJ?E
~2(23 )
:=: 0.40
Entonces, tO.025.8 :=: 2.31 y t O.025 gSe(Efecto) :=: 2.31(0.40)
95% aproximados para los efectos de los factores son
:=:
A: 3.000.92
B: 2.250.92
C: 1.750.92
AB: 0.750.92
AC: 0.250.92
BC: 0.500.92
ABC: 0.500.92
Este anlisis indica queA, By C son factores importantes, porque son las nicas estimaciones de los efectos de los factores para las que los intervalos de confianza de 95% aproximados no incluyen al cero.
Efectos de dispersin
El ingeniero de proceso que trabaj en el caso del llenado tambin se interes en los efectos de dispersin; es decir, alguno de los factores afecta la variabilidad de la desviacin de la altura de llenado de una
242
CAPTULO 6
DISEO FACTORIAL 2k
R=O
R= 1
R= 1
250 bpm
Velocidad (e)
+~--~I--""
I
I
I
R=ll__
R=1
-7730
,,"~
200 bpm R =_2F-"
R_=~1.... ~_,
+
psi
Presin (B)
25 psi
.~!,..--------:-:"
10%
12%
Carbonatacin (A)
corrida a otra? Una manera de responder esta pregunta es examinando el rango de las desviaciones de la
altura de llenado para cada una de las ocho corridas del diseo 23 Estos rangos se grafican en el cubo de la
figura 6-8. Observe que los rangos son aproximadamente iguales para las ocho corridas del diseo. Por
consiguiente, no hay evidencia slida que indique que alguna de las variables del proceso afecte directamente la variabilidad de la desviacin de la altura de llenado en el proceso.
6~4
EL DISEO GENERAL 2k
Los mtodos de anlisis que se han presentado hasta este punto pueden generalizarse para el caso de un
diseo factorial2k, es decir, un diseo con k factores que tfenen dos niveles cada uno. El modelo estadstico para un diseo 2k incluira k efectos principales, (~) interacciones de dos factores, (~) interacciones de
tres factores, oo., y una interaccin de k factores. Es decir, para un diseo 2k el modelo completo contendra 2k -1 efectos. Thmbin se usa aqu la notacin introducida anteriormente para las combinaciones de .
los tratamientos. Por ejemplo, en un diseo 25, abd denota la combinacin de tratamientos con los factoresA, By D en el nivel alto y los factores e y E en el nivel bajo. Las combinaciones de los tratamientos
pueden escribirse en orden estndar introduciendo los factores uno a la vez y combinando sucesivamente
cada nuevo factor con los que lo preceden. Por ejemplo, el orden estndar de un diseo 24 es (1), a, b, ab,
e, ae, be, abe, d, ad, bd, abd, ed, aed, bed y abed.
El enfoque general para el anlisis estadstico del diseo 2k se resume en la tabla 6-8. Como se seal
anteriormente, suele emplearse un paquete de software de computadora en este proceso de anlisis.
A estas alturas, la secuencia de pasos de la tabla 6-8 debe resultar familiar. El primer paso es estimar
los efectos de los factores y examinar sus signos y magnitudes. De este modo el experimentador obtiene inTabla 6-8
1.
2.
3.
4.
5.
6.
Procedimiento de anlisis
para un diseo 2"
ti
243
formacin preliminar respecto de los factores y las interacciones que pueden ser importantes, y en qu direcciones debern ajustarse estos factores para mejonrr la respuesta. Para formar el modelo inicial del
experimento, por lo general se elige el modelo completo, es decir, todos los efectos principales y las interacciones, siempre que se haya hecho una rplica de al menos uno de los puntos del diseo (en la seccin siguiente se revisa una modificacin de este paso). Despus, en el paso 3 se usa el anlisis de varianza para
probar formalmente la significacin de los efectos principales y las interacciones. En la tabla 6-9 se presenta
la forma general de un anlisis de varianza para un diseo factorial 2k con 11 rplicas. El paso 4, refinar el
modelo, suele consistir en la eliminacin de las variables no significativas del modelo completo. El paso 5 es
el anlisis residual usual para verificar la adecuacin del modelo y los supuestos. En ocasiones ocurrir una
refinacin del modelo despus del anlisis residual, si se encuentra que el modelo es inadecuado o que hay
violaciones serias de los supuestos. El ltimo paso consiste generalmente en el anlisis grfico: grficas de
los efectos principales o las interacciones, o superficies de respuesta y grficas de contorno.
Aun cuando los clculos descritos se realizan por lo general con una computadora, en ocasiones es necesario calcular manualmente la estimacin de un efecto o la suma de cuadrados de un efecto. Para estimar
un efecto o calcular la suma de cuadrados de un efecto, primero debe determinarse el contraste asociado
con ese efecto. Esto puede hacerse siempre utilizando una tabla de signos positivos y negativos, como la tabla 6-2 o 6-3. Sin embargo, para valores grandes de k esto resulta laborioso, y puede usarse un mtodo alternativo. En general, el contraste del efecto AB"K se determina expandiendo el miembro derecho de
Contraste AB...K
= (a l)(b 1) (k 1)
Grados de
libertad
SSB
1
1
SSK
SSAB
SSA
K
(~ ) interacciones
(6-21)
de dos factores
AB
AC
SSAC
1
1
JK
SSJK
ABC
ABD
SSABC
SSABD
1
1
IJK
SSIJK
SSABC...K
SSE
(Z ) = 1 interaccin de k factores
ABCK
Error
Total
SST
2k (n -1)
n2 k -1
11'
244
Para expandir la ecuacin 6-21 se usa el lgebra ordinaria reemplazando "1" con (1) en la expresin final.
El signo de cada grupo de parntesis es negativo si el factor est incluido en el efecto y es positivo si el factor no est incluido.
Para ilustrar el uso de la ecuacin 6-21, considere un diseo factorial 2 3 El contraste deAB sera
Contraste AB
= (a-1)(b-1)(e+1)
= abe + ab + e + (1) -
ae - be - a - b
y
SS AB' ..K
= n2 k
(Contraste AB ...K
2
)
(6-23)
respectivamente, donde n denota el nmero de rplicas. Se cuenta tambin con un algoritmo tabular debido al Dr. Frank Yates que en ocasiones puede ser til para el clculo manual de las estimaciones de los
efectos y las sumas de cuadrados. Referirse al material suplementario del texto de este captulo.
6~5
245
Verdadero
efecto
del factor
Efecto estimado
del factor
+
Factor, x
al Distancia pequea entre los niveles del factor
Verdadero
efecto
del factor
Efecto estimado
del factor
Factor, x
bl Separacin agresiva de los niveles del factor
la figura 6-9b. Observe que en esta figura la distancia incrementada entre los niveles bajo y alto del factor
resulta en una estimacin razonable del verdadero efecto del factor.
El uso de la estrategia de una sola rplica es comn en los experimentos de exploracin cuando hay
un nmero relativamente grande de factores bajo consideracin. Debido a que en estos casos nunca puede tenerse la certeza absoluta de que el error experimental es pequeo, una buena prctica en este tipo de
experimentos es separar los niveles de los factores de manera agresiva. Quizs el lector encuentre til releer las pautas generales para elegir los niveles de los factores del captulo 1.
Una sola rplica de un diseo 2k se denomina en ocasiones diseo factorial no replicado. Con una
sola rplica, no se cuenta con ninguna estimacin interna del error (o "error puro"). Una forma de abordar este anlisis de un diseo factorial no replicado consiste en suponer que algunas interacciones de orden superior son insignificantes y combinar sus cuadrados medios para estimar el error. Esto es una
apelacin al principio de efectos esparcidos; es decir, la mayora de los sistemas estn dominados por algunos de los efectos principales y las interacciones de orden inferior, y la mayor parte de las interacciones
de orden superior son insignificantes.
246
EJEMPLO
6~2
lF;
11"
Nmero
de corrida
1
2
3
4
5
6
7
8
9
10
+
+
+
+
+
11
12
+
+
+
+
+
+
13
14
15
16
+
+
+
+
Etiqueta de
la corrida
(1)
a
b
ab
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
ae
be
abe
d
ad
bd
abd
ed
acd
bed
abed
ndice de
filtracin (gal/h)
45
71
48
65
68
60
80
65
43
100
45
104
75
86
70
96