Anda di halaman 1dari 20

Curso de diseño de experimentos

Norbey Marín Arredondo

Metodología de Superficie de
Respuesta

Norbey Marín Arredondo - Estadístico 1


Introducción

La Metodología de Superficies de Respuesta (RSM) es un conjunto de técnicas


matemáticas utilizadas en el tratamiento de problemas en los que una respuesta de
interés está influida por varios factores de carácter cuantitativo.

El propósito inicial de estas técnicas es diseñar un experimento que proporcione


valores razonables de la variable respuesta y, a continuación, determinar el modelo
matemático que mejor se ajusta a los datos obtenidos.

El objetivo final es establecer los valores de los factores que optimizan el valor de la
variable respuesta.
Cuando decimos que el valor real esperado, η, que toma la variable de interés
considerada está influido por los niveles de k factores cuantitativos, X1, X2, ..., Xk, esto
significa que existe alguna función de X1, X2, ..., Xk (que se supone continua en Xi, ∀ i =
1, ..., k) que proporciona el correspondiente valor de η para alguna combinación dada
de niveles:
η = f (X1, X2, ..., Xk)

de tal forma que la variable respuesta puede expresarse como:

Y = η + ε = f (X1, X2, ..., Xk) + ε

donde ε es el error observado en la respuesta.

La relación η = f (X1, X2, ..., Xk) existente entre η y los niveles de los k factores puede
representarse a través de una hipersuperficie (subconjunto de un espacio euclídeo
(k+1)-dimensional) a la que llamaremos superficie de respuesta.
500

-500

-1000

Y -1500

-2000

-2500

8.0
-3000 5.0
2.0
-1.0 X2
-3500
-4.0
1 2 3
4 5 6 -7.0
7 8 9
10 11 12
13 14 15 -10.0
X1 16 17 18
19 20 21
SUPERFICIES DE RESPUESTA POLINÓMICAS. MODELOS DE PRIMER Y
SEGUNDO ORDEN

Los polinomios usados más frecuentemente como funciones de aproximación son los
de órdenes uno y dos, que nos proporcionan, respectivamente los siguientes modelos:
k k k
Modelo de primer orden Y   0    i X i    ij X i X j  
i 1 i j i

Variable de Parámetros Factores Error


respuesta del modelo evaluados aleatorio
k k k

Modelo de segundo orden Y   0   i X i    ii X    ij X i X j  


i
2

i 1 i 1 i, j
i j
Error
Variable de Parámetros aleatorio
respuesta del modelo

Factores
evaluados
Modelos ajustados

k k

De primer orden Yˆ  ˆ0   ˆi X i   ˆij X i X j


i 1 i, j
i j

k k k
De segundo orden Yˆ  ˆ0   ˆi X i   ˆii X   ˆij X i X j
i
2

i 1 i 1 i, j
i j

Si el modelo está bien ajustado, la parte no aleatoria del modelo representa la


respuesta real esperada y ε es el error experimental. Sin embargo, si el modelo
no está ajustado a la función respuesta real, lo que ocurre cuando la relación
entre la respuesta y los factores está demasiado simplificada, ε contiene, además
del error experimental, una parte de error no aleatorio que se debe a la falta de
ajuste.
UTILIZACIÓN DE VARIABLES CODIFICADAS

En la construcción de modelos de superficies de respuesta, es muy común la


codificación de los valores reales de los niveles de los factores, pues las distancias
medidas sobre los ejes de las variables codificadas en el espacio k-dimensional se
convierten en estándar, lo que facilita considerablemente los cálculos que deben
llevarse a cabo para obtener el modelo de aproximación e incrementa el ajuste en la
estimación de los coeficientes.
METODOS DE OPTIMIZACION
1. Algoritmo de la pendiente ascendente

• Un método para encontrar óptimos en programación


matemática es llamado el algoritmo de la pendiente
ascendente.

• Bajo este algoritmo:


– Inicie en punto arbitrario.
– Calcule la función y su derivada en este punto.
– Busque en la dirección de la pendiente ascendente
(derivada máxima)
– Continúe en esa dirección hasta que no se tiene ya
incrementos.
2. Análisis canónico

Se aplica a un diseño de segundo orden cuando se quiere explorar con mas amplitud
una región experimental y/o cuando se espera que el punto optimo ya este cerca,
probablemente dentro de la región experimental.

a. A partir del conocimiento que ya se tiene del problema, seleccionar los niveles de
los factores para determinar la región de exploración
b. Correr un diseño de segundo orden para explorar la región experimental determina
antes
c. Ajustar el modelo con niveles codificados. Si este explica bien la variabilidad
observada continuar el siguiente paso, de lo contrario investigar la falta de ajuste.
d. Encontrar las coordenadas del punto estacionario
e. Expresar el modelo en forma canónica, es decir, expresar el modelo en términos de
las nuevas variables canónicas. La ventaja es que la ecuación canónica
proporciona información sobre el tipo de superficie que se esta observando y sobre
su forma
f. Evidenciar la relación entre las variables canónicas y las codificadas.
Determinación del punto estacionario (candidato a óptimo)

El punto estacionario es el punto (x10, x20, . . . , Xk0 ) en el espacio de los factores,


sobre el cual el plano tangente a la superficie tiene pendiente igual a cero. Por ejemplo,
si la superficie tiene un máximo, el punto estacionario es justo el punto donde se ubica
el máximo. De aquí que el punto estacionario sea un candidato natural a punto óptimo,
que resulta electo solo cuando es del tipo que interesa y se encuentra dentro de la
región experimental. Podría pasar que el punto óptimo es un mínimo o punto de silla,
el cual evidentemente no es el óptimo buscado.

Cresta ascendente Cordillera


Máximo o Mínimo Punto de silla o descendente estacionaria
3. Análisis de cordillera

Consiste en calcular el máximo o mínimo de la superficie es esferas concéntricas al centro


del diseño, empezando por esferas de radio casi cero y posteriormente se abre la
exploración y posteriormente se abre la exploración incrementando el radio de la siguiente
esfera. Así se continua hasta llegar a la primera esfera que cubre todos los puntos
experimentales.

El mejor punto posible es aquel sobre el cual se predice el óptimo desempeño de la


variable de respuesta. Con frecuencia este punto se ubica en le esfera de radio mas
grande.

El mejor posible “dentro”


de la región
DISEÑOS DE SUPERFICIES DE RESPUESTA

La elección de un diseño adecuado del experimento a realizar es fundamental para modelar y


explorar la superficie de respuesta usada para ajustar un modelo polinómico al conjunto de datos
recogidos en los puntos del diseño. Así pues, sería deseable que el diseño tuviera, de las
características que se enumeran a continuación, y dado que algunas de ellas resultan conflictivas
entre sí, las que más sirvan al interés del experimento:

1. Generar una distribución razonable de puntos y, por tanto, de información, en toda la región
de interés, pero utilizando el menor número posible de puntos experimentales.
2. Asegurar que, para cada punto x, el valor ajustado, Ŷ(x), está tan cerca como sea posible del
valor real, Y(x).
3. Permitir la detección de falta de ajuste en el modelo.
4. Permitir la ejecución de los experimentos en bloques.
5. Permitir la construcción secuencial de diseños de orden creciente.
6. Proporcionar una estimación interna de la varianza del error.
7. Asegurar simplicidad en los cálculos de las estimaciones de los parámetros del modelo.
Además de las propiedades mencionadas, sería muy conveniente que el diseño elegido fuera
ortogonal y/o invariante por rotación:

Un diseño ortogonal es aquel en el que los términos del modelo ajustado son incorrelacionados y,
por tanto, también las estimaciones de los parámetros lo son, en cuyo caso, la varianza de la
respuesta esperada en cualquier punto de la región experimental se puede expresar como la suma
ponderada de las varianzas de los parámetros estimados del modelo.

Por otro lado, en un diseño invariante por rotación, la varianza de Ŷ(x), que depende de la situación
del punto x, es función únicamente de la distancia del punto al centro del diseño, lo que significa
que es la misma en todos los puntos equidistantes del centro del diseño. Teniendo en cuenta que
el objetivo de la RSM es la optimización de la respuesta y que se desconoce la localización del
óptimo antes de ejecutar el experimento, esta propiedad resulta muy interesante, puesto que
garantiza que el diseño proporciona estimaciones igualmente precisas en todas las direcciones.
DISEÑOS DE PRIMER ORDEN

Los diseños considerados con el propósito de recoger datos para ajustar un modelo de primer
orden se conocen como diseños de primer orden.

Un criterio razonable para la elección de un diseño de primer orden adecuado es la minimización


de Var(Ŷ), lo que se logra minimizando la varianza de los estimadores de los parámetros βi, i = 1,
..., k.

Hay una única clase de diseños que lo consiguen, los ortogonales, que en los modelos de primer
orden son aquellos para los que se verifica que los elementos de fuera de la diagonal principal de
la matriz X’X son cero, lo que nos permite determinar de manera independiente los efectos de los
k factores (medidos a través de los valores deˆi , i = 1, ..., k). Además, se verifica que todo diseño
ortogonal de primer orden es invariante por rotación.

Por tanto, consideraremos únicamente aquellos diseños de primer orden que son ortogonales
- Diseños factoriales 2k
- Diseños factoriales fraccionados 2k-p.
- Diseños de Plackett Burman
- Diseños simplex
DISEÑOS DE SEGUNDO ORDEN

Los diseños utilizados para recoger observaciones que permitan estimar los parámetros
de los modelos de segundo orden se denominan diseños de segundo orden. Éstos
deben tener, al menos, (k+1)(k+2)/2 puntos, que es precisamente el número de
coeficientes del modelo que se necesita estimar y deben involucrar, como mínimo 3
factores, dado que el modelo contiene términos cuadráticos puros.

Por otro lado, sería conveniente, por las razones que se han comentado, que fueran
ortogonales y/o invariantes por rotación. Así pues, se van a considerar los diseños
factoriales 3k, que son ortogonales, pero no invariantes por rotación, y los diseños
compuestos centrales, que verifican ambas propiedades y los diseños de Box-Behnken.

Los diseños 3k y sus fracciones presentan el inconveniente de que, aunque son


ortogonales, no son invariantes por rotación, lo que hace que no sean muy buena
elección como diseños de superficies de respuesta de segundo orden.
DISEÑOS COMPUESTOS CENTRALES
Los diseños compuestos centrales se presentan como una alternativa a los diseños
factoriales 3k.

Un diseño compuesto central consiste en:

1. Parte factorial: un diseño factorial 2k, completo o fraccional, en el que los niveles
están codificados en la forma habitual como ±1 ,

2. n0 ( ≥ 1) puntos centrales

3. Parte axial: dos puntos axiales en los ejes correspondientes a cada uno de los
factores, situados a una distancia α del centro del diseño.

de manera que el número total de puntos del diseño es N = 2k + 2k + n0.


En principio, los DCC así definidos no tienen porque ser ni ortogonales ni invariantes por rotación.
Se convierten en invariantes por rotación mediante la elección adecuada del valor de α, que debe
depender del numero de puntos de la parte factorial del diseño para conseguirlo. Por otro lado, a
través de una selección adecuada de n0 el diseño puede hacerse ortogonal o incluso la precisión
uniforme (diseño que verifica que Var(Y) en el origen es la misma que en un punto a una distancia
unitaria del origen), que permite mayor protección que en diseño ortogonal contra el sesgo de los
coeficientes de regresión producidos por la presencia de términos mayor que en la superficie real.

5 6 7 8
2 3 4 5 (1/2 6 (1/2 (1/2) (1/2
Factores (k) rep) rep) rep rep)

Puntos 4 8 16 32 16 64 32 64 128
factoriales
Puntos axiales 4 6 8 10 10 12 12 14 16

Diseño Ortogonal
n 5 6 12 17 10 24 15 22 33
N 13 20 36 59 36 100 29 100 177
Los DCC se pueden construir a partir de un diseño de primer orden 2k agregando los
puntos axiales y los puntos centrales

X1 X2
-1 -1
-1 1
1 -1
1 1
-1,414 0
1,414 0
0 -1,414
0 1,414
0 0
0 0
0 0
0 0
0 0
Matriz de diseño
de DCC en dos
factores
Relación modelo - diseño

Modelo de primer orden

Y   0  1 X 1   2 X 2   3 X 1 X 2  

Y  0  1 X1  2 X 2  3 X1 X 2  curvatura  

 4 X 12 o  4 X 22

Modelo de segundo orden

Y  0  1 X1  2 X 2  3 X12  4 X 22  5 X1 X 2  
Cual diseño de segundo orden utilizar?

1. Que tenga un numero mínimo de tratamientos y que permita estimar todos


los parámetros del modelo de segundo orden completo
2. Que sea flexible, en el sentido que se pueda construir a partir diseños de
primer orden
3. Que tenga buenas propiedades de ortogonalidad, rotabilidad y/o precisión
uniforme, las cuales tienen que ver con la calidad de estimación.

Anda mungkin juga menyukai