SUPERFICIE DE LA RESPUESTA
RAYMOND H. MYERS
Virginia Polytechnic University, Department of Statistics, Blacksburg, VA
DOUGLAS C. MONTGOMERY
Arizona State University, Department of Industrial Engineering, Tempe, AZ
CHRISTINE M. ANDERSON-COOK
Los Alamos National Laboratory, Los Alamos, NM
Tabla de contenido
1. INTRODUCCIN.......................................................................................................3
1.1 METODOLOGA DE LA SUPERFICIE DE RESPUESTA................................3
1.1.1 Aproximacin de las funciones de respuesta.................................................4
1.1.2 La naturaleza secuencial de RSM.................................................................9
1.1.3 Objetivos y aplicaciones tpicas de RSM.....................................................12
1.1.4 RSM y la Filosofa del Mejoramiento de la Calidad......................................13
1.2 DISEO Y FORMULACIN DEL PRODUCTO (PROBLEMAS DE MEZCLA)...14
1.3 DISEO ROBUSTO Y ESTUDIOS DE ROBUSTEZ DEL PROCESO................14
1.4 REFERENCIAS TILES SOBRE RSM..............................................................15
2.- CONSTRUIR MODELOS EMPIRICOS..................................................................16
2.1 MODELOS DE REGRESIN LINEAL................................................................16
2.2 ESTIMACIN DE LOS PARMETROS EN LOS MODELOS DE REGRESIN
LINEAL.................................................................................................................... 17
2.3 PROPIEDADES DE LOS ESTIMADORES DE MENOS CUADRADOS Y
ESTIMACIN DE 2................................................................................................24
2.4 PRUEBAS DE HIPTESIS EN REGRESIN MLTIPLE..................................26
2.4.1 Prueba de la significacin de la regresin...................................................26
1. INTRODUCCIN
La forma del modelo de primer orden en la ecuacin 1.4 se denomina a veces modelo
principal de efectos, ya que slo incluye los efectos principales de las dos variables x1 y
x2. Si existe una interaccin entre estas variables, puede agregarse fcilmente al modelo
de la siguiente manera:
Este es el modelo de primer orden con interaccin. La figura 1.3 muestra la superficie
de respuesta tridimensional y el grfico de contornos para el caso especial
Figura 1.5 Algunos ejemplos de tipos de superficies definidas por el modelo de segundo orden en
dos variables x1 y x2. (Adaptado con permiso de Empirical Model Building y Response Surfaces, G.
E. P. Box y N. R. Draper, John Wiley & amp; Sons, New York, 1987)
2. Es fcil estimar los parmetros (los 's) en el modelo de segundo orden. El mtodo
de los mnimos cuadrados, que se presenta en el captulo 2, puede utilizarse para este
propsito.
3. Existe una considerable experiencia prctica que indica que los modelos de segundo
orden funcionan bien en la resolucin de problemas reales de superficie de respuesta.
En general, el modelo de primer orden es
Los 's son un conjunto de parmetros desconocidos. Para estimar los valores de estos
parmetros, debemos recopilar datos sobre el sistema que estamos estudiando. El
anlisis de regresin es una rama de la construccin de modelos estadsticos que utiliza
estos datos para estimar los 's. Debido a que, en general, los modelos polinomiales son
funciones lineales de las desconocidas, nos referimos a la tcnica como anlisis de
regresin lineal. Tambin veremos que es muy importante planificar cuidadosamente la
fase de recoleccin de datos de un estudio de superficie de respuesta. De hecho, los
tipos especiales de diseos experimentales, llamados diseos de superficies de
respuesta, son valiosos a este respecto. Una parte sustancial de este libro est dedicada a
diseos de superficies de respuesta. Tenga en cuenta que los anlisis y los diseos deben
ser cuidadosamente combinados. Si estamos planeando analizar datos de nuestro
experimento planeado usando un modelo de primer orden, entonces el diseo que
seleccionamos debera ser adecuado para este anlisis. De manera similar, si
anticipamos una curvatura similar a la que se puede modelar con un modelo de segundo
orden, entonces se debe seleccionar un diseo diferente.
Se han construido buenos diseos de superficies de respuesta para que funcionen bien
basndose en un modelo particular asumido, pero tambin se han estructurado de
manera que sean capaces de evaluar los supuestos del modelo que se est analizando
para determinar si las impresiones iniciales del sistema del experimentador Bajo estudio
coinciden con la verdadera relacin subyacente que produjo los datos a analizar. Por lo
tanto, el experimentador debe pensar cuidadosamente acerca de los objetivos de un
experimento en particular y lo que el anlisis anticipado implicar antes de seleccionar
el diseo para la recopilacin de datos.
1.1.2 La naturaleza secuencial de RSM
La mayora de las aplicaciones de RSM son de naturaleza secuencial. Es decir, al
principio se generan algunas ideas sobre qu factores o variables pueden ser importantes
en el estudio de superficie de respuesta. Esto suele conducir a un experimento diseado
para investigar estos factores con vistas a verificar el papel de los factores que influyen
en la respuesta y la eliminacin de los no importantes. Este tipo de experimento se
denomina usualmente un experimento de tamizaje. A menudo, al comienzo de un
estudio de superficie de respuesta, existe una lista bastante larga de variables que
podran ser importantes para explicar la respuesta. El objetivo del cribado de factores es
reducir esta lista de variables candidatas a un nmero relativamente pequeo para que
los experimentos posteriores sean ms eficientes y requieran menos pruebas o pruebas.
Nos referimos a un experimento de cribado como fase cero de un estudio de superficie
de respuesta. Dado que el inters en un experimento de deteccin se encuentra en la
comprensin del comportamiento bruto del sistema y cmo los factores estn
relacionados con la respuesta, un modelo de primer orden se selecciona comnmente.
La clase de diseos de superficie de respuesta que se utilizan para los experimentos de
cribado son bien adecuados para comprender mejor los efectos principales de diferentes
variables independientes y comparar sus contribuciones relativas con los cambios en los
valores de respuesta. Puesto que esto representa una etapa temprana en la secuencia
planificada de experimentos, el objetivo es determinar cules de los factores son ms
influyentes en la respuesta mientras se utiliza una proporcin tan pequea como sea
posible del presupuesto experimental total. Nunca debe realizar un anlisis de superficie
de respuesta hasta que se haya realizado un experimento de deteccin para identificar
los factores importantes.
Una vez que se identifican las variables independientes importantes, comienza la fase
uno del estudio de superficie de respuesta. En esta fase, el objetivo del experimentador
es determinar dnde se encuentran los datos recogidos en relacin con una respuesta
ideal. A menudo, hay dos resultados posibles con los niveles o ajustes actuales de las
variables independientes que resultan en un valor de la respuesta que est cerca del
ptimo (tal como el punto B en la figura 1.1b), o el proceso est funcionando en algn
otro Regin (posiblemente) alejada de la ptima (tal como el punto A de la figura 1.1b).
Si los ajustes o niveles actuales de las variables independientes no son consistentes con
el rendimiento ptimo, entonces el experimentador debe determinar un conjunto de
ajustes a las variables de proceso que movern el proceso hacia el ptimo. Esta fase de
la metodologa de superficie de respuesta hace un uso considerable del modelo de
primer orden y una tcnica de optimizacin llamada el mtodo de subida ms
pronunciada. Estas tcnicas sern discutidas e ilustradas en el Captulo 5.
La fase dos de un estudio de superficie de respuesta comienza cuando el proceso est
cerca del ptimo. En este punto, el experimentador suele querer un modelo que se
aproximar con precisin a la funcin de respuesta verdadera dentro de una regin
relativamente pequea alrededor del ptimo. Debido a que la superficie de respuesta
verdadera normalmente exhibe curvatura cerca del ptimo (ver la figura 1.1), se
utilizar un modelo de segundo orden (o muy ocasionalmente algn polinomio de orden
superior). Una vez que se ha obtenido un modelo de aproximacin apropiado, este
modelo puede ser analizado para determinar las condiciones ptimas para el proceso. El
captulo 6 presentar tcnicas para el anlisis del modelo de segundo orden y la
determinacin de condiciones ptimas.
Los diseos de superficies de respuesta para modelar la respuesta cerca del ptimo se
seleccionan de nuevo para coincidir con el anlisis anticipado. A menudo, el plan es
caracterizar la relacin entre la respuesta y las variables independientes clave utilizando
el modelo de segundo orden de la forma en la ecuacin 1.8. Los diseos se construyen
para poder estimar la respuesta para las combinaciones de factores de entrada alrededor
del ptimo esperado, donde la curvatura en la relacin es comn. Dado que esta etapa
de la experimentacin se centra en la determinacin de un mejor conjunto de valores de
entrada para los que el proceso de operar, una porcin generosa del presupuesto
experimental se reserva generalmente para esta parte del proceso.
Una etapa final de la experimentacin, que generalmente no requiere sofisticados
diseos de superficie de respuesta o una gran porcin del presupuesto experimental, es
un experimento confirmatorio. Esta recoleccin de datos es generalmente simple y
pequea, pero est diseada para confirmar que el ptimo identificado que se obtuvo en
la fase dos se puede lograr estableciendo las variables independientes en los ajustes
designados.
Este proceso experimental secuencial se realiza generalmente dentro de una regin del
espacio variable independiente denominada regin de operabilidad. Para el proceso
qumico ilustrado en la Fig. 1.1, la regin de operabilidad es 0 hr <1 7 h y 100C 2
800C. Supongamos que actualmente estamos operando a los niveles 1 = 2,5 hr y 2 =
500 C, mostrados como el punto A en la Fig. 1.6. Ahora es poco probable que
queramos explorar toda la regin de operabilidad con un solo experimento. En cambio,
usualmente definimos una regin de inters o regin de experimentacin ms pequea
alrededor del punto A dentro de la regin ms grande de operabilidad. Tpicamente, esta
regin de experimentacin es o bien una regin cuboidal, como se muestra alrededor del
punto A en la Fig. 1.6, o una regin esfrica, como se muestra alrededor del punto B. La
eleccin del diseo de la superficie de respuesta coincide con la regin especificada de
experimentacin.
Figura 1.6 La regin de operabilidad y la regin de experimentacin.
Figura 1.7 La regin no sombreada que muestra las condiciones para las cuales el rendimiento
70%, el costo 34 $ / libra, y 62 g / litro concentracin 68 g / litro.
Que es un modelo estndar de regresin lineal mltiple con tres regresores. Como otro
ejemplo, considere el modelo de superficie de respuesta de segundo orden en dos
variables:
y x1 x2 xk
Podemos escribir la ecuacin del modelo (Ec. 2.2) en trminos de las observaciones en
la Tabla 2.1 como
El mtodo de los mnimos cuadrados elige los en la ecuacin 2.7 para que la suma de
los cuadrados de los errores, i, se minimice. La funcin de mnimos cuadrados es
dnde
lo que simplifica a
Es fcil ver que la forma matriz de las ecuaciones normales es idntica a la forma
escalar. Escribiendo la Ecuacin 2.12 en detalle, obtenemos
Si se realiza la multiplicacin matricial indicada, se obtendr la forma escalar de las
ecuaciones normales (es decir, la Ec. 2.10). En esta forma es fcil ver que X'X es una
matriz simtrica p p y X'y es un vector de columna p 1. Obsrvese la estructura
especial de la matriz X'X. Los elementos diagonales de X'X son las sumas de cuadrados
de los elementos en las columnas de X y los elementos fuera de la diagonal son las
sumas de productos cruzados de los elementos en las columnas de X. Adems, observe
que los elementos de X X'y son las sumas de productos cruzados de las columnas de X
y las observaciones {yi}.
El modelo de regresin ajustado es
Ejemplo 2.1 Los datos de ganancia del transistor. La ganancia del transistor en un
dispositivo de circuito integrado entre emisor y colector (hFE) se relaciona con dos
variables que pueden ser controladas en el proceso de deposicin, el tiempo de entrada
del emisor (1, en minutos) y Emisor (2, unidades de 1014 iones). Catorce muestras
fueron observadas despus de la deposicin, y los datos resultantes se muestran en la
Tabla 2.2. Vamos a ajustar un modelo de regresin lineal utilizando la ganancia como la
respuesta y el tiempo de emisin de emisin y la dosis de emisor como las variables de
regresin.
TABLA 2.2 Datos sobre la ganancia del transistor (y) para el ejemplo 2.1
1 (drive-in 2 (dose,
Observation time, minutes) 1014 ions) x1 x2 y (gain or hFE)
1 195 4.00 1 1 1004
2 255 4.00 1 1 1636
3 195 4.60 1 0.6667 852
4 255 4.60 1 0.6667 1506
5 225 4.20 0 0.4444 1272
6 225 4.10 0 0.7222 1270
7 225 4.60 0 0.6667 1269
8 195 4.30 1 0.1667 903
9 255 4.30 1 0.1667 1555
10 225 4.00 0 1 1260
11 225 4.70 0 0.9444 1146
12 225 4.30 0 0.1667 1276
13 225 4.72 0 1 1225
14 230 4.30 0.1667 0.1667 1321
Las columnas 2 y 3 del cuadro 2.2 muestran los valores unitarios reales o naturales de 1
y 2, mientras que las columnas 4 y 5 contienen valores de las correspondientes variables
codificadas x1 y x2, donde
La matriz X'X es
Y el vector X'y es
La estimacin de mnimos cuadrados de es
Tabla 2.3 Observaciones, valores ajustados, residuos y otra informacin de resumen del ejemplo 2.1
Observacin yi y ei hii ri ti Di
1 1004.0 ii
973.7 30.3 0.367 1.092 1.103 0.231
2 1636.0 1620.5 15.5 0.358 0.553 0.535 0.057
3 852.0 882.4 30.4 0.317 1.052 1.057 0.171
4 1506.0 1529.2 23.2 0.310 0.801 0.787 0.096
5 1272.0 1266.7 5.3 0.092 0.160 0.153 0.001
6 1270.0 1281.9 11.9 0.133 0.365 0.350 0.007
7 1269.0 1205.8 63.2 0.148 1.960 2.316 0.222
8 903.0 928.0 25.0 0.243 0.823 0.810 0.072
9 1555.0 1574.9 19.9 0.235 0.651 0.633 0.043
10 1260.0 1297.1 37.1 0.197 1.185 1.209 0.115
11 1146.0 1190.6 44.6 0.217 1.442 1.527 0.192
12 1276.0 1251.4 24.6 0.073 0.730 0.714 0.014
13 1225.0 1187.5 37.5 0.233 1.225 1.256 0.152
14 1321.0 1305.3 15.7 0.077 0.466 0.449 0.006
La tabla 2.3 muestra los valores observados de yi, los correspondientes valores
ajustados i, y los residuos de este modelo. Hay varias otras cantidades dadas en esta
tabla que sern definidas y discutidas ms adelante. La figura 2.1 muestra la superficie
de respuesta ajustada y el grfico de contorno para este modelo. La superficie de
respuesta para la ganancia es un plano situado por encima del espacio de tiempo-dosis.
Figura 2.1 (a) Superficie de respuesta para la ganancia, Ejemplo 2.1. (B) El grfico de contornos de
ganancia.
Parameter Estimates
Term Estimate Std Error t-Ratio Prob > |t|
Intercept 1242.3181 9.373196 132.54 <0.0001
x1 323.4253 14.22778 22.73 <0.0001
x2 54.77165 13.2001 4.15 0.0016
Figura 2.2 Salida de regresin de JMP. (A) Respuesta y modelo entero, real por grfica
pronosticada. (B) Residuales segn la grfica prevista.
Ejemplo 2.2 Los datos de ganancia del transistor Estimaremos 2 para el modelo de
regresin para los datos de ganancia del transistor del ejemplo 2.1. Porque
Observe que la salida de JMP en la Tabla 2.4 calcula la suma residual de cuadrados
(mirar bajo la seccin de anlisis de varianza de la salida) como 13,417.72. La
diferencia entre los dos valores es round-off. Tanto los clculos manuales como JMP
producen estimaciones prcticamente idnticas de 2.
La estimacin de 2 producida por la ecuacin 2.18 depende del modelo. Es decir,
depende de la forma del modelo que se ajuste a los datos. Para ilustrar este punto,
supongamos que ajustamos un modelo cuadrtico a los datos de ganancia, digamos
En este modelo se puede demostrar que SSE = 12.479,8. Debido a que el nmero de
parmetros del modelo, p, es igual a 6, la estimacin de 2 basada en este modelo es