Anda di halaman 1dari 130

2016

FACULTAD DE INGENIERIA
ESCUELA DE FORMACION PROFESIONAL
INGENIERIA METALURGICA

MODULO
OPTIMIZACION POR DISEOS
EXPERIMENTALES

UNIDAD I
Sesin I: Diseo Experimental
Sesin II: Experimento de comparacin Simple
Sesin III: Inferencia de las Medias Diseo
Aleatorizado
Sesin IV: Experimento de un Solo Factor

SESION I
1.1. EXPERIMENTO
Definicin
Se refiere a la creacin y preparacin de lotes de prueba que verifiquen la validez de las
hiptesis establecidas sobre las causas de un determinado problema o defecto, objeto de
estudio.
Concepto
En un Experimento, el experimentador escoge ciertos factores para su estudio, los altera
deliberadamente de forma controlada y despus, observa el efecto resultante.
El Experimento puede realizarse bien en laboratorio o bien en el exterior: En la fbrica, en unos
almacenes, en los locales del usuario, etc.
1.2. DISEO DE EXPERIMENTOS
Definicin
Metodologa estadstica destinada a la planificacin y anlisis de un Experimento.
Concepto
El Diseo de un Experimento debe garantizar que este cumpla ciertos requisitos mnimos:

Debe poder comprobar las hiptesis objeto de estudio, no dejndose confundir por variables
insospechadas (=ruido), como errores de medida desproporcionados, etc.
Debe poder revelar la existencia de cualquier causa importante de variacin, aunque no
haya sido adelantada como hiptesis.
Debe mantener los costos de experimentacin a un nivel razonable, en comparacin con el
problema objeto de estudio.
Debe tener un alto grado de seguridad en las respuestas.
Si el Experimento se realiza en un laboratorio, ste ha de ser, respecto a las variables
estudiadas, un buen indicador de las pruebas que se obtendran en el taller o "in situ".
Si el Experimento se realiza durante el desarrollo normal del proceso en estudio, se tendr
adems cuidado de interferir lo menos posible en el trabajo normal y protegerse de las
interferencias no autorizadas o involuntarias en la prueba por parte del personal adepto.

1.3 QUE ES EL DISEO EXPERIMENTAL? (segn Duglas Montgomery)


Los investigadores realizan experimentos virtualmente en todos los campos del saber, por lo
general para descubrir algo acerca de un proceso o sistema en particular. Literalmente, un
experimento es una prueba o ensayo. Un experimento diseado es una prueba o serie de
pruebas en las cuales se inducen cambios deliberados en las variables de entrada de un
proceso o sistema, de manera que sea posible observar e identificar las causas de los cambios
en la respuesta de salida.

El proceso o sistema bajo estudio puede representarse por medio del modelo de la Fig. 1-1.
Suele ser posible visualizar el proceso como una combinacin de mquinas, mtodos, personas
y otros recursos que transforman alguna entrada a menudo un material en una salida que tiene
una o ms respuestas observables. Algunas de las variables del proceso x 1, x2...............xn, son
controlables, mientras que otras z1, z2,... zp son incontrolables aunque pueden ser controlables
para los fines de una prueba). Entre los objetivos del experimento pueden incluirse:
1. Determinar cules variables tienen mayor influencia en la respuesta, y.
2. Determinar el mejor valor de las x que influyen en y, de modo que Y tenga casi siempre
un valor cercano al valor nominal deseado.
3. Determinar el mejor valor de las x que influyen en y, de modo que la variabilidad de y
sea pequea.
4. Determinar el mejor valor de las x que influyen en y, de modo que se minimicen los
efectos de las variables incontrolables z 1, z2,..., zp.
Los mtodos de diseo experimental tienen un cometido importante en el desarrollo de procesos
y en la depuracin de procesos para mejorar el rendimiento. En muchos casos, el objetivo puede
ser desarrollar un proceso consistente o robusto; esto es, un proceso afectado mnimamente por
fuentes de variabilidad externas (la z).
He aqu un ejemplo de experimento. Supngase que un ingeniero metalrgico est interesado en
estudiar el efecto que tienen sobre una aleacin de aluminio dos procesos diferentes de
endurecimiento: el templado en aceite y el templado en agua salada. En este caso, el objetivo
del investigador es determinar cul de las dos soluciones produce el mximo grado de dureza
sobre la aleacin mencionada. El ingeniero decide someter un cierto nmero de probetas de la
aleacin a cada medio de templado, para despus medir la dureza de las muestras. La dureza
promedio de las probetas tratadas en cada solucin servir para determinar cul de las dos
soluciones es la mejor.

1.4 APLICACIONES DEL DISEO EXPERIMENTAL (segn Duglas Montgomery)


El diseo experimental tiene amplia aplicacin en muchas disciplinas. En efecto, es posible
considerar a la experimentacin parte del proceso cientfico y una de las formas en que
aprendemos acerca de la forma en que funcionan los sistemas o procesos.
El diseo experimental es un medio de importancia crtica en el medio de la ingeniera para
mejorar el rendimiento de un proceso de manufactura. Tambin se emplea extensamente en el
desarrollo de nuevos procesos. La aplicacin de tcnicas de diseo experimental en una fase
temprana del desarrollo de un proceso puede dar por resultado:
1. Mejora en el rendimiento del proceso.

2. Menor variabilidad y mayor apego a los requerimientos nominales u objetivo.


3. Menor tiempo de desarrollo.
4. Menores costos globales.
Los mtodos de diseo experimental tambin tienen un cometido importante en las actividades de diseo tcnico (o diseo de ingeniera), en las cuales se desarrollan nuevos productos y
se mejoran otros ya existentes. Algunas aplicaciones del diseo experimental en el diseo
tcnico son:
1. Evaluacin y comparacin de configuraciones de diseo bsicas.
2. Evaluacin de materiales alternativos.
3. Seleccin de parmetros de diseo de modo que el producto funcione bien en una
amplia variedad de condiciones de campo (de uso real); esto es, de modo que el
producto sea consistente (robusto).
El uso del diseo experimental en estas reas puede dar por resultado productos con mayor
confiabilidad y mejor funcionamiento en el campo, menores costos, y menor tiempo de diseo y
desarrollo del producto. En seguida se presentan algunos ejemplos que ilustran algunas de estas
ideas.
Ejemplo 1.1
Caracterizacin de un Proceso.
Se utiliza una mquina de soldar en onda en el proceso de manufactura de tarjetas de circuitos
impresos. La mquina limpia las tarjetas en un bao de fundente, las precalienta y las hace
pasar en banda transportadora a travs de una onda de soldadura fundida. Este pro ceso de
soldadura forma las conexiones elctricas y mecnicas entre los componentes de las tarjetas.
En la actualidad, el proceso opera a un nivel de defectuosos aproximado de 1%. Es decir,
alrededor del 1 % de los puntos de soldadura, en una tarjeta son defectuosos y requieren
retoque manual. Sin embargo, dado que en promedio una tarjeta de circuito impreso contiene
ms de 2000 uniones de soldadura. Incluso un nivel de defectuosos de 1% significa que
demasiadas uniones de soldadura requieren trabajo. El ingeniero de proceso responsable de
esta rea quisiera emplear un experimento diseado a fin de determinar que parmetros de la
mquina Influyen en la ocurrencia de defectos de soldadura y que ajustes deben hacerse en
dichas variables para reducir tales defectos.
La mquina de soldar en onda tiene varias variables que pueden controlarse. Entre ellas se
incluyen:
1.
2.
3.
4.
5.
6.
7.

Temperatura de la soldadura
Temperatura de precalentamiento
Velocidad de banda transportadora
Tipo fundente
Densidad relativa del fundente
Profundidad de la onda de soldadura
Angulo de la banda transportadora

Adems de estos factores controlables, existen varios otros cuyo control no es fcil durante el
proceso de manufactura ordinario, aunque podran controlarse para los fines de una prueba.
Ellos son:
1. Espesor de la tarjeta de circuitos impresos.
2. tipos de componentes usados en la tarjeta.

3. Disposicin de los componentes en la tarjeta.


4. Operario.
5. Ritmo de produccin.
En estas circunstancias el ingeniero est interesado en caracterizar la mquina de solda dura en
onda; es decir, desea determinar los factores (controlables e incontrolables) que influyen en la
ocurrencia de defectos en las tarjetas de circuitos impresos. Para lograrlo puede disear un
experimento que le permita estimar la magnitud y direccin de los efectos del factor: esto es,
cuanto cambia la variable de respuesta (defectos por unidad) cuando se modifica cada factor, y
si cambian los factores simultneamente produce resultados distintos de los que se obtienen con
ajustes de factores individuales Algunas veces, esto se denomina experimento de escrutinio.
La informacin que se obtiene de este experimento de escrutinio o caracterizacin se utiliza
entonces para identificar los factores crticos del proceso y determinar la direccin de ajuste de
estos factores a fin de reducir an ms el nmero de defectos por unidad. El experimento
tambin puede proporcionar informacin acerca de cules factores deben controlarse con ms
cuidado durante el proceso ordinario de manufactura a fin de evitar altos niveles de productos
defectuosos y comportamiento errtico del proceso. De este modo un resultado del experimento
podra ser la aplicacin de tcnicas tales como los diagramas de control a una o ms variables
del proceso como temperatura de la soldadura, as como a su salida. Con el tiempo, si el
proceso mejora lo suficiente, suele ser posible basar la mayor parte del plan de control del
proceso en la regulacin de sus variables de entrada en vez de hacerlo en el anlisis de
diagramas de control de la salida.
Ejemplo 1.2
Optimizacin de un Proceso
En un experimento de caracterizacin, normalmente nos interesa determinar cules variables,
del proceso influyen en la respuesta. Un siguiente paso lgico es optimizar esto es, determinar
en qu regin los procesos importantes conducen a la mejor respuesta posible. Por ejemplo, si la
respuesta es rendimiento, buscaramos una regin en que este fuera mximo mientras que si la
respuesta es variabilidad en una dimensin critica de un producto, buscaramos una regin de
variabilidad mnima.
Supngase que nos interesa mejorar el rendimiento de un proceso qumico. Sabemos, con base
en los resultados de un experimento de caracterizacin, que las dos ms importantes variables
de proceso que influyen en el rendimiento son temperatura y tiempo de reaccin. En la
actualidad el proceso ocurre a 155 F en un tiempo de reaccin de 1.7 h, con rendimiento
aproximada de 75%. En la Fig. 1-2 es una vista en planta desde arriba de la regin tiempotemperatura. En dicha grfica, las lneas de rendimiento constante se unen para formar
contornos de respuesta, de los cuales se muestran los de 60, 70, 80, 90 y 95 % de rendimiento.

Fig. 1-2 Diagrama de contornos de rendimiento en funcin del tiempo y la temperatura de


reaccin, para ilustrar un experimento de optimizacin.
Estos contornos son proyecciones en la regin al tiempo temperatura de cortes transversales de
la superficie de rendimiento que corresponden a los rendimientos antes mencionados. Dicha
superficie se denomina en ocasiones superficie de respuesta. La verdadera superficie de
respuesta real correspondiente a la Fig. 1-2 es desconocida para el personal de proceso, de
modo que se requerirn mtodos experimentales a fin de optimizar el rendimiento con respecto a
tiempo y temperatura.
Para localizar el intervalo ptimo, es necesario realizar un experimento en el que se hagan variar
simultneamente tiempo y temperatura. Esto se denomina experimento factorial; la Fig. 1-2 es un
ejemplo de los resultados que se obtienen cuando tiempo y temperatura varan en dos niveles,
Las respuestas observadas en las cuatro esquinas del cuadrado indican que debemos
desplazarnos en la direccin general de aumento en la temperatura y descenso en el tiempo de
reaccin con objeto de incrementar el rendimiento. Podran efectuarse algunas pocas
variaciones ms en esta direccin, lo cual bastara para localizar la zona de mximo rendimiento.
Ejemplo 1.3
Diseo de un Producto
A menudo es posible aplicar los mtodos del diseo experimental en el proceso de diseo de un
producto. Para ilustrar lo anterior, supngase que un grupo de ingenieros disea una bisagra
para la puerta de un automvil. La caracterstica de calidad de inters es el esfuerzo de cierre, o
sea la capacidad de retencin del picaporte de la puerta lo cual impide que esta se cierre cuando
se le tiene abierta estando el vehculo estacionado en una pendiente. El mecanismo de cierre
consiste en un resorte de hojas y un rodillo. Cuando la puerta se abre, el rodillo describe un arco
hacienda que el resorte de hojas se comprima. Para cerrar la puerta, el resorte debe ser forzado
a desplazarse a un lado, y esto crea el esfuerzo de cierre. El equipo tcnico considera que este
esfuerzo es funcin de los siguientes factores:
1. Distancia de recorrido del rodillo.
2. Altura del resorte, del pivote a la base.
3. Distancia horizontal del pivote al resorte.

4. Altura libre del resorte de refuerzo.


5. Altura libre del resorte principal.
Los ingenieros pueden construir un mecanismo de bisagra prototipo en el cual todos estos
factores pueden hacerse varan entre ciertos intervalos. Una vez que se han identificado nive les
apropiados para estos cinco factores, es posible disear un experimento que consiste en
diversas combinaciones de niveles de los factores, y probar la bisagra prototipo a estas
combinaciones. Ello proporcionar informacin acerca de los cuales factores influyen ms en el
esfuerzo de cierre del picaporte, y mediante el anlisis de esta informacin es posible mejorar el
diseo de este ltimo.
1.5 DIRECTRICES PARA EL DISEO DE EXPERIMENTOS (segn Duglas Montgomery)
Para usar un enfoque estadstico al disear y analizar un experimento se requiere que todos los
participantes en el tengan de antemano una idea clara de que es exactamente o que se va a
estudiar, como se van a recopilar los datos y, al menos, una idea cualitativa de cmo se van a
analizar. A continuacin, se ofrece una gua del procedimiento recomendado:
1. Comprensin y planteamiento del problema. Este punto pudiera parecer obvio, sin
embargo, en la prctica no es sencillo darse cuenta de que existe un problema que
requiere experimentacin, ni disear un planteamiento claro y aceptable del mismo. Es
necesario desarrollar todas las ideas sobre los objetivos del experimento. Suele ser
importante solicitar la opinin de todas las partes implicadas: cuerpo tcnico,
aseguramiento de la calidad, manufactura, divisin comercial, direccin, clientes y
personal operativo (quienes normalmente saben mucho del asunto pero con demasiada
frecuencia son ignorados). Un planeamiento claro del problema contribuye a menudo en
forma sustancial a un mejor conocimiento del fenmeno y de la solucin final del
problema.
2. Eleccin de factores y niveles. La eleccin de los factores o variables, intervalos y
niveles especficos a los cuales se har el experimento, son tareas que deben
emprenderse desde inicio. Tambin la forma de controlar esos factores y los mtodos de
medicin. Es importante fijar todos los factores que pueden ser de inters, y no
depender demasiado de experiencias pasadas, en particular durante las primeras
etapas, cuando el objetivo es la caracterizacin del proceso.
3. Seleccin de la variable de respuesta. Al seleccionar la respuesta o variable
dependiente se debe estar seguro que la respuesta que se va medir realmente provea
informacin til acerca del proceso de estudio. Usualmente el promedio o la desviacin
estndar (o ambos) de la caracterstica medida, sern la variable de respuesta. La
capacidad de medicin es tambin un factor importante y si esta es deficiente, no podr
esperarse ms que la deteccin de efectos relativamente grandes de los factores; en
caso contrario deben hacerse repeticiones.
4. Eleccin del diseo experimental. Para elegir el diseo es necesario considerar el
tamao de muestra (nmero de repeticiones), seleccionar un orden, adecuado para los
ensayos experimentales, y determinar si hay implicado bloqueo u otras restricciones de
aleatorizacin.
5. Realizacin del experimento. Cuando se realiza el experimento, es vital vigilar el

proceso cuidadosamente para asegurar que todo se haga conforme a lo planeado. En


este caso, los errores en el procedimiento suelen anular la validez experimental. La
planeacin integral es decisiva para el proceso.
6. Anlisis de datos. Deben emplearse mtodos estticos para analizar los datos, de
modo que los resultados y conclusiones sean objetivos ms que apreciativos. Hay que
recordar que los mtodos estadsticos. Solo proporcionan directrices para la veracidad y
validez de los resultados. Los mtodos estadsticos, slo hacen posible obtener el
probable error de una conclusin, o asignar un nivel de confiabilidad a los resultados.
Las tcnicas estadsticas, aunadas a un buen conocimiento tcnico o del proceso y al
sentido comn, suelen llevar a conclusiones razonables.
7. Conclusiones y recomendaciones. Una vez que se han analizado los datos, el
experimentador debe extraer conclusiones prcticas de los resultados y recomendar un
curso de accin. En esta fase a menudo son tiles los mtodos grficos, en especial al
presentar los resultados a otras personas.
1.6 ETAPAS EN UNA INVESTIGACIN. (Segn Fernando Caicedo)
En general podemos dividir en tres partes un trabajo de investigacin experimental: el
experimento, el diseo y el anlisis.
a) El experimento.
El experimento no es otra cosa que la definicin del problema a estudiar, constituye un punto de,
partida tan importante, que el xito de la investigacin est basado en gran parte en l, en otras
palabras, en esta etapa" es necesario considerar:
Una comprensin profunda del problema a estudiar, es decir, considerar todos los antecedentes
tericos y bibliogrficos que nos aclaren perfectamente lo que deseamos obtener y los
elementos que entran en juego. La seleccin de variables dependientes (respuestas) a ser
estudiadas, como pueden ser ellas medidas, la disponibilidad de instrumentos de medicin y
control, al mismo tiempo la precisin de estos instrumentos.
Es necesario tambin definir las variables independientes o factores que pueden afectar la
respuesta o variable dependiente. Los niveles o valores que le daremos a estos factores, en
caso de que estos sean cuantitativos, por ejemplo temperatura, pH, etc., o algunas decisiones si,
estos son de tipo cualitativo, por ejemplo: diferentes operadores.
b) El diseo.
Consiste en disear todas las experiencias a ser realizadas, no solo en cuanto a su nmero sino,
a las condiciones de operacin para cada una de ellas.
c) El anlisis.
Consiste en la recoleccin de resultados, la reduccin de datos y la computacin de ciertos tests
estadsticos, que sern usados para hacer decisiones acerca de los distintos aspectos del
experimento, de acuerdo a los objetivos de este. En el anlisis se incluye el clculo de los tests

"t" y F principalmente para nuestro estudio.


1.7 CUL ES PRIMER REQUISITO DE UN EXPERIMENTO PURO?
El primer requisito es la manipulacin intencional de una o ms variables independientes. La
variable independiente es la que se considera como supuesta causa en una relacin entre
variables; es la condicin antecedente, y al efecto provocado por dicha causa se le denomina
variable dependiente (consecuentemente).
Causa
(Variable Independiente)
X

Efecto
(Variable Dependiente)
Y

Un experimento se lleva a cabo para analizar si una o ms variables independientes afectan a


una variable dependiente y por qu lo hacen. Por ahora, simplifiquemos el problema de estudio a
una variable independiente y una dependiente. En un autntico experimento, la variable
independiente resulta de inters para el investigador por ser la variable que se hipotetiza, que
ser una de las causas que producen el efecto supuesto. Para obtener evidencia de esta
relacin causal supuesta, el investigador manipula la variable independiente y observa si el
dependiente vara o no.
La variable dependiente se mide
La variable dependiente no se manipula, sino que se mide para ver el efecto que la manipulacin
de la variable independiente tiene en ella. Esto podra esquematizarse de la siguiente manera:
Manipulacin de la variable
Independiente
XA
XB
.
1.8 VARIABLES DE UN PROCESO.

medicin del efecto sobre la variable


dependiente
Y

En general, en un sistema multivariable disponemos de dos tipos de variables, de cuyo


conocimiento depende el control, que sobre el proceso podemos ejercer:
a) Variables de entrada.
Son las variables independientes del proceso, definen las caractersticas de este y segn sus
valores relativos determinan los valores de las otras variables del sistema.
b) Variables de salida
Son, las variables dependientes del proceso y pueden considerarse como efectos o respuestas a
las variables de entrada.
Clasificacin de Variables
I. Variables Independientes

II. Variables Dependientes

A. Controlables
1. Bsicas o primarias
2. Transformadas
B. Incontrolables
1. Materias primas
2. Condiciones ambientales
3. Condiciones de operacin
4. Factores econmicos

A. De rendimiento
1. Econmicas
2. Contreidas
B. 1. Cualitativas
2. Cuantitativas
a) Fsicas
b) Operacionales
C. Intermedias

Como ejemplo de lo dicho anteriormente, tomaremos el caso de un proceso de flotacin, en el


cual se dispone de ciertas variables caractersticas cuya, clasificacin se presenta a continuacin
y la cual puede extenderse, a otros; procesos mineralurgicos.
Clasificacin:
A. Variables incontrolables de entrada
1) Ley de minerales primarios % (fino)
2). Ley de minerales secundarios % (fino)
3) impurezas
4) Ganga
5) Grado de oxidacin
B. Variables controlables de entrada
1) Tonelaje alimentacin
2) Dosificacin de reactivos
o Tiempo
o pH
o Colector.
o Espumante
3) Agua de alimentacin
4) Recirculacin de pulpa,
5) Aireacin
C. Variables de salida
1) Cantidad de concentrado producido
2) Contenido fino del concentrado
3) Granulometra del concentrado
4) Cantidad de relaves producidos
5) Contenido-fino de los relaves
6) Granulometra de los relaves.
7) Concentracin de reactivos residuales
D. Variables de rendimiento
1) Constantes dinmicas de flotacin
2) Recuperacin de minerales tiles
3) Recuperacin de minerales intiles (impurezas)
4) Ley de concentrados.
5) Prdidas en las colas
6) Valor del concentrado producido

7) Consumo por tonelada beneficiada


8) Consumo por da

SESION II
EXPERIMENTOS DE COMPARACIN SIMPLES
Se usan para comparar dos condiciones (a menudo llamadas tratamientos). A menudo, se
denominan experimentos de comparacin simples. Se comienza con un ejemplo de un
experimento realizado para determinar si dos frmulas diferentes de un producto producen
resultados equivalentes.
Los experimentos comparativos son, bsicamente, experimentos en los cuales la muestra se
compara por sus efectos medios sobre una variable respuesta. El objeto principal es determinar
cul de ellos es mejor en algn sentido.
Esta discusin conduce a una revisin de los conceptos bsicos de la estadstica, tales como
variables aleatorias, distribuciones de probabilidad, muestras aleatorias, distribuciones mustrales
y pruebas de hiptesis.
2-1 INTRODUCCION
La resistencia adhesiva a la tensin del mortero de cemento Portland es una caracterstica
importante del producto. Un ingeniero est interesado en comparar la resistencia de una formula
modificada, a la que se han agregado emulsiones de polmeros de latex durante el
mezclado, contra la resistencia de la argamasa hecha con la formula no modificada. El
experimentador ha recolectado 10 observaciones de la resistencia de la formula modificada y
otras 10 de la formula no modificada. Los datos aparecen en la Tabla 2-1. Las dos frmulas
pueden considerarse como dos tratamientos, o dos niveles de las formulaciones de factor.
Los datos de este experimento se grafican en la Fig. 2-1. Esta representacin grfica se denomina
diagrama de puntos. A primera vista, estos datos dan la impresin de que la resistencia del
mortero no modificado es mayor que la del modificado.

Esta impresin se refuerza al comparar los valores medios de la resistencia a la tensin, es decir
1 = 16.76 kgf/cm2, del mortero modificado contra 2 = 17.92 kgf/cm 2, del mortero no,
modificado. Los promedios de la resistencia a la tensin en estas dos muestras difieren en una
cantidad que parece ser significativa. Sin embargo, no es evidente que esta diferencia sea
suficientemente grande como para implicar que las dos frmulas son realmente distintas. Quizs
la diferencia que se observa en el promedio de las resistencias es resultado de las fluctuaciones
en el muestreo, siendo en realidad las dos frmulas idnticas. Posiblemente otras dos muestras
produzcan resultados contrarios, cuando la resistencia de la frmula modificada supera a la de la
frmula original.
Una tcnica de inferencia estadstica llamada prueba de hiptesis (pruebas de significacin),
puede servir para ayudar al experimentador al comparar estas dos frmulas. La prueba de
hiptesis permite que la comparacin de las formulas se realice sobre bases objetivas, con un

conocimiento de los riesgos asociados si se llegara a una conclusin equivocada.


Cada observacin del experimento del cemento portland descrito anteriormente, puede
denominarse una prueba (o corrida). Debe tomarse en cuenta que hay diferencia entre las
pruebas individuales, por lo cual existe fluctuacin o discrepancia en los resultados. Usualmente,
a esta discrepancia se le denomina error experimental o simplemente error. Es un error
estadstico, lo que significa que es producto de una variacin incontrolable y generalmente
inevitable. La presencia del error implica que la variable de respuesta, en este caso la resistencia
a la tensin, es una variable aleatoria. Una variable aleatoria puede ser discreta o continua. La
variable aleatoria es discreta si el conjunto de todos los valores posibles de esta es finito o infinito
numerable; en cambio ser continua si todos los valores posibles de la variable aleatoria
constituyen un intervalo.

2-2 CONCEPTOS ESTADISTICOS BSICOS


Descripcin Grafica de la Variabilidad.- A menudo se utilizan mtodos grficos simples para
facilitar el anlisis de los datos de un experimento.
El diagrama de puntos, es un medio til para representar una serie pequea de datos (hasta de
unas 20 observaciones). El diagrama de puntos permite al experimentador ver rpidamente la
localizacin general o tendencia central de las observaciones y su dispersin.
Por ejemplo, en el experimento sobre la resistencia a la tensin del cemento portland, el diagrama
de puntos revela que las dos formulaciones probablemente difieren en resistencia media pero que
ambos tienen aproximadamente la misma variacin en esta propiedad.

Fig. 2-1. Diagrama de puntos de los datos de la fuerza a la tensin de adhesin

El histograma se utiliza cuando los datos son numeroso, se representa la tendencia central, la
dispersin y la forma general de la distribucin de los datos. Un histograma se construye
dividiendo el eje horizontal en intervalos (por lo regular de la misma longitud) y trazando sobre el j-

esimo intervalo un rectngulo con rea proporcional a n i, el nmero de observaciones que caen en
ese intervalo. A continuacin en la Fig. 2-2 se presenta el histograma de 200 observaciones de la
recuperacin de metal (rendimiento) en un proceso de fundicin.

El diagrama de caja es un medio muy til para representar grficamente datos. En dicho
diagrama, los valores mnimo y mximo, los cuartiles inferior y superior (percentiles 25 y 75,
respectivamente) y la mediana (percentil 50) se representan en una caja rectangular alineada ya
sea horizontal o verticalmente. La caja se extiende del cuartil inferior al superior, y es atravesada
de un lado al otro por la mediana. A partir de los extremos de la caja se extienden lneas
("bigotes") hasta los valores mnimo y mximo.
En la Fig. 2-3 se presentan los diagramas de caja para las dos probetas de resistencia adhesiva a
la tensin del experimento con mortero de cemento portland. Esta representacin revela
claramente la diferencia de resistencia media entre las dos formulaciones. Tambin indica ambas
formulaciones producen distribuciones simtricas de resistencia con similar variabilidad o
dispersin.

Distribucin de Probabilidad
La estructura probabilstica de una variable aleatoria, digamos y, se describe por su distribucin
de probabilidad. A menudo, la distribucin de probabilidad de y, representada por p(y), se
denomina funcin de probabilidad y es discreta. Si y es continua, usualmente la distribucin de
probabilidad de y, es, f(y), se denomina funcin de densidad de probabilidad de y.
En la figura 2-4 se ilustra dos distribuciones de probabilidad hipottica, una discreta y la otra
continua. Obsrvese que en la distribucin de probabilidad discreta es la altura de la funcin p(yj)

la que representa la probabilidad, mientras que en el caso continuo, es el rea bajo la curva f(y)
asociada con un intervalo dado la que representa la probabilidad.

Fig. 2-4. Distribucin de probabilidad continua y discreta

Media, varianza y valores esperados


La media, , de una distribucin de probabilidad es una medida de su tendencia central o
localizacin.
Matemticamente, la media se define como

La varianza, (que es el cuadrado de la desviacin estndar: 2) se define as: Es la media de las


diferencias con la media elevadas al cuadrado.
2-3 MUESTREO Y DISTRIBUCIONES MUESTRALES
Muestras Aleatorias, Media Muestral y Variancia Muestral.
El objetivo de la inferencia estadstica es obtener conclusiones acerca de una poblacin
usando una muestra de la misma. La mayora de los mtodos que se analizaran suponen el uso
de muestras aleatorias. Esto significa que si una poblacin contiene N elementos, y una muestra

es n de ellos ser seleccionada, entonces el procedimiento empleado se denomina muestreo


aleatorio si cada una de la N!/(N-n)!n! posibles muestras tiene la misma probabilidad de ser
elegida.
La inferencia estadstica se utiliza profusamente cantidades calculadas a partir de las
observaciones. Un estadstico se define como cualquier funcin de las observaciones de una
muestra que no contenga parmetros desconocidos. Por ejemplo, supongamos que y1, y2, .yn
representa una muestra. Entonces,
la media muestral
2-1

y la variancia muestral
2-2

son estadsticos. Estas cantidades son medidas de la tendencia central y la dispersin de


muestra, respectivamente. Algunas veces S=S2, llamada desviacin estndar muestral, se
usa como medida de dispersin. A menudo, los ingenieros prefieren el uso de la desviacin
estndar como medida de dispersin porque sus unidades son las mismas que las de la variable
de inters y.
Propiedades de la Media y la Variancia Muestrales.
La media muestral es un estimador puntual de la media poblacional , y la variancia muestral
S2 es un estimador puntual de la varianza poblacional 2. En general, un estimador de un
parmetro desconocido es un estadstico que corresponde con dicho parmetro. Obsrvese que
un estimador puntual es una variable aleatoria. Al valor numrico particular de un estimador,
calculado a partir de los datos muestrales, se le llama una estimacin. Por ejemplo, supngase
que se desea estimar la media y la variancia de la resistencia a la ruptura de un tipo de fibra textil
en particular. Se prueba una muestra aleatoria de n = 25 probetas de la fibra, y la resistencia a la
ruptura es registrada para cada probeta. La media y la varianza muestral se calculan mediante
las ecuaciones 2-1 y 2-2 respectivamente, siendo = 18.6 y S2 = 1.20. Por lo tanto, la estimacin
de es = 18.6 y la estimacin para 2 es S2=1.20
Se requieren ciertas propiedades para tener varios estimadores puntuales. Dos de las ms
importantes son las siguientes:
1. El estimador puntual debe ser insesgado. Es decir, el parmetro que se est estimando
deber ser el promedio o valor esperado a la larga del estimador puntual. Aun cuando la
ausencia de sesgo es deseable, esta propiedad por s sola no siempre hace que un
estimador sea adecuado.
2. El estimador insesgado deber tener variancia mnima. Esta propiedad establece que
el estimador puntual de varianza mnima tiene una varianza que es menor que la
varianza de cualquier otro estimador del parmetro en cuestin.
Se puede demostrar fcilmente que y S2 son estimadores insesgados de y 2,
respectivamente. Considrese primero . Usando las propiedades del valor esperado, se tiene

porque el valor esperado de cada observacin yi, es . Por lo tanto, es un estimador


insesgado
de .
Considere ahora la variancia muestral S2. Se tiene

donde SS = n
Entonces

(yi-)2 es la suma corregida de los cuadrados de las observaciones yi.

i=1

2-3

Por lo tanto,
2-4

Y se observa que S2 es un estimador insesgado de 2.


Grados de Libertad
La cantidad n-1 de la ecuacin 2-4 se denomina grados de libertad de la suma de cuadrados
SS. Este es un resultados muy general; si y es una variable aleatoria con variancia 2 y SS =
n i=1(yi-)2 tiene grados de libertad.
2-5

EI nmero de grados de libertad de una suma de cuadrados es igual al nmero de trminos


independientes en dicha suma. Por ejemplo, en la Ecuacin 2-3, SS = n i=1(yi-)2 consiste en
la suma de cuadrados de los n elementos y1 - , y2 - ,..,yn - . Estos elementos no son todos
independientes, ya que n i=1(yi-)2 = 0, siendo independientes solo n - 1 de ellos. Esto implica
que SS tiene n - 1 grados de libertad.
La Distribucin Normal y Otras Distribuciones Muestrales
A menudo puede determinarse la distribucin de probabilidad de un estadstico particular puede
determinarse si se conoce la distribucin de probabilidad de la poblacin de la que se tom la
muestra. La distribucin de probabilidad de un estadstico se le llama la distribucin de
muestreo. A continuacin se analizan, brevemente, algunas distribuciones muestrales tiles.
Una de las distribuciones de muestreo ms importantes es la distribucin normal. Si y es una
variable aleatoria normal, la distribucin de probabilidad de y es
2-6

donde - < < es la media de la distribucin, y 2> 0 es la variancia. En la figura 2-6 se


ilustra la distribucin normal.
Debido a que las corridas muestrales que difieren, como resultado del error experimental a
menudo se encuentra descritas adecuadamente en la distribucin normal, esta desempea un
papel fundamental en el anlisis de los datos de experimentos diseados. Tambin es posible
definir muchas distribuciones de muestreo importantes en trminos de variable aleatorias
normales. Con frecuencia se usa la notacin y ~ N(,2) para denotar que y sigue una
distribucin normal con media y varianza 2
Un caso especial importante de la distribucin normal es el de la distribucin normal estndar,
es decir =0 y 2= 1. Se observa que s y ~ N(, 2), entonces la variable aleatoria.

..

2-7

sigue una distribucin normal estndar, denotada por z ~ N(0, 1). A la operacin ilustrada en
la Ecuacin 2-7 suele llamarse la estandarizacin de la variable aleatoria normal y.
En muchas tcnicas estadsticas se supone que la variable aleatoria sigue una distribucin
normal. El teorema del lmite central es con frecuencia una justificacin de la normalidad
aproximada.

SESION III
2.4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEOS
ALEATORIZADOS
Estamos preparados ahora para volver al problema del mortero de cemento portland de la seccin
2-1.
Recuerde que se estaban investigando dos formulaciones diferentes para determinar si difieren en
la fuerza de la tensin de adhesin. En esta seccin se examina como pueden realizarse los datos
de este experimento comparativo simple utilizando procedimientos de pruebas de hiptesis e
intervalos de confianza para comparar las medias de dos tratamientos.
A lo largo de esta seccin se supone que se usa un diseo experimental completamente
aleatorizado. En este diseo, los datos se consideran como si fueran una muestra aleatoria de una
distribucin normal.
2.4.1 Prueba de hiptesis
Se retoma ahora al experimento del cemento portland introducido en la seccin 2-1. Recuerde que
el inters se encuentra en comparar la fuerza de dos formulaciones diferentes: una del mortero sin
modificar y una del mortero modificado. En general, estas dos formulaciones pueden considerarse
como dos niveles del factor formulaciones.
Sea que y11, y12,.y1n1 represente las n1 observaciones del primer nivel del factor y que y21,
y22., y2n2 represente las n, observaciones del segundo nivel del factor. Se supone que las
muestras se sacan al azar de dos poblaciones normales independientes. En la figura 2-6 se ilustra
la situacin.

Figura 2.6 La situacin del muestreo para la prueba t de dos muestras

Un modelo de los datos


Con frecuencia los resultados de un experimento se describen como un modelo. Un modelo
estadstico simple que describe los datos de un experimento como el que acaba de describirse es
2.8
donde yij, es la observacin j-esima del nivel i del factor, ; es la media de la respuesta para el
nivel i-esimo del factor, y ij; es una variable aleatoria normal asociada con la observacin ij-esima.
Se supone que las ij son NID(0,2), i = 1, 2. Se acostumbra hacer referencia a ij como el
componente del error aleatorio del modelo. Puesto que las medias 1, y 2, son constantes, se
observa directamente a partir del modelo que las yij son NID(0, 2), i = 1, 2, como se acaba de
suponer arriba.
Hiptesis estadsticas

Una hiptesis estadstica es un enunciado o afirmacin ya sea acerca de los parmetros de una
distribucin de probabilidad o de los parmetros de un modelo. La hiptesis refleja alguna conjetura
acerca de la situacin del problema. Por ejemplo, en el experimento del cemento portland, puede
pensarse que las fuerzas de la tensin de adhesin promedio de las dos formulaciones del mortero
son iguales. Esto puede enunciarse formalmente como

donde 1, es la fuerza de la tensin de adhesin promedio del mortero modificado y, 2, es la


fuerza de tensin de enlace promedio del mortero sin modificar. Al enunciado Ho: 1= 2, se le
llama la hiptesis nula y a H1: 1 2, se le llama la hiptesis alternativa. A la hiptesis
alternativa que se especifica aqu se le llama hiptesis alternativa de dos colas porque sera
verdadera si 1 <2 o si 1 > 2.
Para probar una hiptesis se proyecta un procedimiento para tomar una muestra aleatoria, calcular
un estadstico de prueba apropiado para despus rechazar o no estar en posicin de rechazar la
hiptesis nula Ho. Parte de este procedimiento consiste en especificar el conjunto de valores del
estadstico de prueba que llevan al rechazo de Ho. A este conjunto de valores se le llama la regin
critica o regin de rechazo de la prueba.
Puede cometerse dos tipos de errores cuando se prueban hiptesis. Si la hiptesis nula se rechaza
cuando es verdadera, ha ocurrido un error tipo I. Si la hiptesis nula no se rechaza cuando es falsa
se ha cometido un error tipo II. Las probabilidades de estos dos errores se expresan con smbolos
especiales:

En ocasiones es ms conveniente trabajar con la potencia de la prueba, donde

El procedimiento general en la prueba de hiptesis es especificar un valor de la probabilidad del


error tipo I, llamada con frecuencia el nivel de significacin de la prueba, y despus disear el
procedimiento de prueba de tal modo que la probabilidad del error tipo II tenga un valor
convenientemente pequeo.
La prueba t de dos muestras
Considere que puede suponerse que las varianzas de las fuerzas de la tensin de adhesin fueron
idnticas para ambas formulaciones del mortero. Entonces el estadstico de prueba que deber
usarse para comparar las medias de dos tratamientos en el diseo completamente aleatorizado es

. 2-9
donde 1, y 2, son las medias muestrales, n1 y n2 son dos tamaos de las muestras, S2p es una
estimacin de la varianza comn 21 = 22 = 2 calculada a partir de

2.10

y S21, y S22; son las dos varianzas mustrales individuales. Para determinar si deber rechazarse
Ho: 1= 2, se comparara to con la distribucin t con n1 + n2 - 2 grados de libertad. Si I to I > donde
t/2,n1+n2-2 es el punto porcentual /2 superior de la distribucin t con n 1+n2-2 grados de libertad,
entonces se rechazara Ho y se concluira que las fuerzas promedio de las dos formulaciones del
mortero de cemento portland difieren. A este procedimiento de prueba se le llama generalmente la
prueba t de dos muestras.
Este procedimiento puede justificase de la siguiente manera. Si el muestreo se est haciendo de
distribuciones normales independientes, entonces la distribucin de 1-2 es N[1 - 2,2(1/n1 +
1/n2)]. Por lo tanto, si se conociera 2, y si Ho: 1= 2 fuera verdadera, la distribucin de

Seria N(0,1). Sin embargo, al sustituir con Sp en la ecuacin 2-11, la distribucin de Z o cambia de
la normal estndar a la distribucin t con n 1 +n2- 2 grados de libertad. Ahora bien, si Ho es
verdadera, to de la ecuacin 2-9 se distribuye como t n1+n2-2 y, por consiguiente, se esperara que
100(1- ) por ciento de los valores de t o estn entre - t/2,n1+n2-2 y t/2,n1+n2-2. Una muestra que
produjera un valor de to que estuviera fuera de estos lmites seria inusual si la hiptesis nula fuera
verdadera y es evidente de que Ho deber rechazarse. Por lo tanto, la distribucin t con n1 +n2 - 2
grados de libertad es la distribucin de referencia apropiada para el estadstico de prueba to. Es
decir, describe el comportamiento de to cuando la hiptesis nula es verdadera. Observe que es la
probabilidad del error tipo I de la prueba.
En algunos problemas quiz quiera rechazarse Ho nicamente si una de las medias es mayor que
la otra. Por lo tanto, se especifican a una hiptesis alternativa de una cola H1:1>2 y Ho solo se
rechazara si to > t/2,n1+n2-2. Si se desea rechazar Ho solo si, es menor que 1 entonces la hiptesis
alternativa es H1: 1<2, y Ho se rechazara si to < t/2,n1+n2-2
Para ilustrar el procedimiento, considere los datos del cemento portland de la tabla 2-1. Para estos
datos, se encuentra que

Puesto que las desviaciones estndar muestrales son razonablemente similares, no es


improcedente concluir que las desviaciones estndar (o las varianzas) poblacionales son iguales.
Por lo tanto, puede usarse la ecuacin 2-9 para probar las hiptesis

Adems, n1 + n2- 2 = 10 + 10 - 2 = 18, y si se elige = 0.05, entonces Ho: 1=2 se rechazara si el


valor numrico del estadstico de prueba t o > t0.025, 18 =2.101, o si to < - t 0.025, 18 = -2.101. Estos
lmites de la regin crtica se ilustran en la distribucin de referencia (t con 18 grados de libertad) de
la figura 2-7. AI utilizar la ecuacin 2-10 se encuentra que

y el estadstico de prueba es

Puesto que to = -9.13 < - t0,025, 18 = -2.101, se rechazara Ho y se concluira que las fuerzas de la
tensin de adhesin promedio de las dos formulaciones del mortero de cemento Portland son
diferentes.

El uso de valores P en la prueba de hiptesis


Una manera de reportar los resultados de una prueba de hiptesis es estableciendo que la
hiptesis nula fue rechazada o no para un valor de o nivel de significacin especifico. Por
ejemplo, en el experimento del mortero de cemento portland anterior puede decirse que Ho: 1=2
se rechaz con el nivel de significacin 0.05. Esta enunciacin de las conclusiones es con
frecuencia inadecuada porque no le ofrece al responsable de la toma de decisiones idea alguna
de si el valor calculado del estadstico de prueba apenas rebaso la regin de rechazo a si se
adentr bastante en la misma. Adems, al darse los resultados de esta manera se les impone a
otros usuarios de la informacin el nivel de significacin predefinido. Este enfoque puede ser
insatisfactorio porque algunos responsables de la toma de decisiones podran sentirse incmodos
con los riesgos que implica el valor = 0.05.
Para evitar estas dificultades, en la prctica se ha adoptado extensivamente el enfoque del valor
P. El valor P es la probabilidad de que el estadstico de prueba asuma un valor que sea al menos
tan extremo como el valor observado del estadstico cuando la hiptesis nula Ho es verdadera. Por
lo tanto, un valor P transmite mucha informacin acerca del peso de la evidencia en contra de H o
y, por consiguiente, el responsable de, la toma de decisiones puede llegar a una conclusin con
cualquier nivel de significacin especificado. En trminos ms formales, el valor P se define como
el nivel de significacin menor que llevara a rechazar la hiptesis nula Ho.
Se acostumbra decir que el estadstico de prueba (y los datos) es significativo cuando se rechaza
la hiptesis nula; por lo tanto, el valor P puede considerarse como el menor nivel en el que los
datos son significativos. Una vez que se conoce el valor P, el responsable de la toma de
decisiones puede determinar la medida en que los datos son significativos sin que el analista de
los datos imponga formalmente un nivel de significacin preseleccionado.

No siempre es sencillo calcular el valor P exacto de una prueba. Sin embargo la mayora de los
programas de computacin modernos para realizar anlisis estadsticos reportan valores P y
pueden obtenerse tambin en algunas calculadoras portables. A continuacin se indicara como
obtener una aproximacin del valor P para el experimento del mortero de cemento portland. Por la
tabla II del apndice, para una distribucin t con 18 grados de libertad, la probabilidad menor en el
rea de la cola es 0.0005, para la cual t0.0005,18 = 3.922. Ahora bien, Itol = 9.13 > 3.922, de donde, ya
que la hiptesis alternativa es de dos colas, se sabe que el valor P debe ser menor que 2(0.0005)
= 0.001.
SESION IV
EXPERIMENTOS CON UN SOLO FACTOR: ANLISIS DE VARIANCIA
Este modelo es el ms sencillo del diseo de experimentos, en el cual la variable respuesta puede
depender de la influencia de un nico factor, de forma que el resto de las causas de variacin se
engloban en el error experimental.
Se supone que el experimento ha sido aleatorizado por completo, es decir, todas las unidades
experimentales han sido asignadas al azar a los tratamientos.
En la sesin anterior se consideraron mtodos para comparar dos condiciones o tratamientos. Por
ejemplo, en el experimento de la resistencia adhesiva a la tensin del cemento Portland
participaban dos formulaciones (clases) distintas de mortero. Otra forma de describir este
experimento es como uno unifactorial con dos niveles del factor, donde el factor es formulacin del
mortero y los dos niveles son los dos mtodos distintos de formulacin. Muchos experimentos de
este tipo implican ms de dos niveles del factor.
3.1 UN EJEMPLO
Un ingeniero de desarrollo de productos est interesado en maximizar la resistencia a la tensin
de una nueva fibra sinttica que se empleara en la manufactura de tela para camisas de hombre.
El ingeniero sabe por experiencia que la resistencia es influida por el porcentaje de algodn
presente en la fibra. Adems, el sospecha que elevar el contenido de algodn incrementara la
resistencia, al menos inicialmente. Tambin sabe que el contenido de algodn debe variar aproximadamente entre 10 y 40% para que la tela resultante tenga otras caractersticas de calidad que
se desean (como capacidad de recibir un tratamiento de planchado permanente. El ingeniero
decide probar muestras (o probetas) a cinco niveles de porcentaje de algodn: 15, 20, 25, 30 y
35%. As mismo, decide ensayar cinco muestras a cada nivel de contenido de algodn.
Este es un ejemplo de experimento unifactorial con a = 5 niveles del factor y n = 5 repeticiones.
Las 25 corridas deben hacerse al azar. Para ilustrar la forma en que puede aleatorizarse el orden
de ejecucin, supngase que las corridas se numeran como sigue:

Ahora se elige un nmero aleatorio entre 1 y 25, supngase que este nmero es 8. Entonces la
observacin nmero 8(20% de algodn) se ejecuta (corre) primero. El proceso se repite hasta

que se ha asignado una posicin en la secuencia de prueba a cada una de las 25 observaciones.
Supngase que la secuencia de prueba obtenida es

Esta secuencia de prueba aleatorizada es necesaria para evitar que los resultados sean
contaminados por los efectos de variables inconvenientes desconocidas, que pueden salir de
control durante el experimento. Para ilustrar esta situacin, supngase que se corren las 25
muestras de prueba en el orden no aleatorizado original (esto es, las cinco muestras con 15% de
algodn, se prueban primero, luego las cinco muestras con 20% de algodn, y as
sucesivamente). Si la maquina probadora de la resistencia a la tensin presenta un efecto de
calentamiento tal que a mayor tiempo de funcionamiento menores lecturas de resistencia a la
tensin, entonces dicho efecto potencialmente contaminara los datos de resistencia e invalidara el
experimento.
Supngase ahora que el ingeniero ejecuta la prueba en el orden aleatorio que hemos determinado
Las observaciones que el obtiene acerca de la resistencia a la tensin se presentan en la Tabla 31.
Siempre es una buena idea representar grficamente los datos experimentales. En la Fig. 3-1 se
muestran diagramas de caja para resistencia a la tensin a cada nivel de porcentaje de algodn, y
la Fig. 3-2 es un diagrama de dispersin para resistencia contra porcentaje de algodn. En esta
ltima figura, los crculos negros son Las observaciones individuales, y los blancos son los valores
medios de las resistencias observadas Ambas graficas indican que la resistencia a la tensin
aumenta con el contenido de algodn, hasta un valor aproximado de este ultimo de 30%. Ms all
del 30% de algodn, ocurre un notable decremento en la resistencia. No hay una fuerte evidencia
que sugiera que la variabilidad en la resistencia alrededor del promedio dependa del porcentaje de
algodn. Con base en este sencillo anlisis grfico, sospechamos fuertemente que:
1) el porcentaje de algodn influye en la resistencia y la tensin y

2) un porcentaje aproximado de 30%, de algodn dara por resultado la mxima resistencia.

Supngase que deseamos ser ms objetivos en nuestros anlisis de los datos. Especficamente,
supngase que deseamos probar en busca de diferencias entre las resistencias medias a las a=5

niveles de porcentaje de algodn. Por tanto, nos interesa probar la igualdad de las cinco medias.
Al parecer la solucin a este problema consiste en realizar pruebas t para todos los posibles pares
de medias. Sin embargo, esta solucin no es correcta ya que produce una gran distorsin en el
error tipo I. Por ejemplo, Supongamos que se desea probar la igualdad de 5 medias usando
comparaciones por pares. Existir 10 posibles pares, y si la probabilidad de aceptar correctamente
la hiptesis nula en cada prueba individual es 1- = 0.95, entonces la probabilidad de aceptar
correctamente la hiptesis nula en las 10 pruebas es (0.95)10= 0.60, si estas son independientes.
Es as como se produce un incremento sustancial del error tipo I.
El procedimiento apropiado para probar la igualdad de varias medias es el anlisis de variancia.
Sin embargo, este anlisis tiene aplicaciones adicionales a la del problema descrito con anterioridad. Probablemente es la tcnica ms til en el campo de la inferencia estadstica.
3.2 ANALISIS DE VARIANCIA
Supongamos que se desea comparar a tratamientos o niveles de un solo factor. La
respuesta que se observa en cada uno de los a tratamientos es una variable aleatoria.
Los datos apareceran como en la Tabla 3-2. Una entrada de la citada tabla (por
ejemplo, y ij representa la j-esima observacin del tratamiento i. En general, habr n
observaciones del tratamiento i. Obsrvese que la Tabla 3-2 es el caso general de los
datos del experimento de resistencia a la tensin resumido en la Tabla 3-1.
Es til describir las observaciones mediante el modelo estadstico lineal
. 3-1
en donde y ij , es la ( ij )-sima observacin, , es la media del nivel del factor o
tratamiento i-simo, y ij es un componente del error aleatorio que incorpora todas las
dems fuentes de variabilidad del experimento, incluyendo las mediciones, la
variabilidad que surge de factores no controlados, las diferencias entre las unidades
experimentales (como los materiales de prueba, etc) a las que se aplican los
tratamientos, y el ruido de fondo general en el proceso (ya sean la variabilidad con el
tiempo, los efectos de variables ambientales, etc). Es conveniente considerar que los
errores tienen media cero, de tal modo que E(y ij )= i . A la ecuacin 3-1 se le llama el
modelo de las medias. Una forma alternativa de escribir un modelo de los datos es
definiendo
De tal modo que la ecuacin 3-1 se convierte en
3-2
En esta forma del modelo, es un parmetro comn a todos los tratamientos al que se
llama media global, y i es un parmetro nico del tratamiento i-simo al que se le llama
el efecto del tratamiento i-simo. A la ecuacin 3-2 se le llama por lo general el
modelo de los efectos.
Tanto el modelo de las medias como el de los efectos son modelos estadsticos
lineales; es decir, la variable de respuesta y ij es una funcin lineal de los parmetros del
modelo.
A la ecuacin 3-2 (o a la 3-1) se le llama tambin el modelo del anlisis de varianza
simple o de un solo factor (o direccin), por que nicamente se investiga un factor.

Adems, ser un requisito que el experimento se lleve a cabo en orden aleatorio para
que el ambiente en el que se apliquen los tratamiento (llamados con frecuencia
unidades experimentales) sea lo ms uniforme posible. Por lo tanto, el diseo
experimental es un diseo completamente aleatorizado. Nuestro objetivo ser probar
las hiptesis apropiadas con respecto a los efectos del tratamiento y hacer una
estimacin de ellos. Para probar las hiptesis, se supone que los errores del modelo son
variables aleatorias independientes con distribucin normal, con media cero y variancia
2 Se supone que esta ltima es constante para todos los niveles del factor.

Factor fijo o aleatorio?


El modelo estadstico. Ecuacin 3-1, describe dos situaciones con respecto al efecto de
los tratamientos. Primero, los a tratamientos podran haber sido seleccionados
especficamente por el experimentador. En esta situacin se desea probar las hiptesis
sobre las medias de los tratamientos y las conclusiones se aplican solo a los niveles del
factor considerados en el anlisis. Las conclusiones no pueden hacerse extensivas a
tratamientos similares que no hayan sido considerados, especficamente. Tambin sera
deseable estimar los parmetros del modelo (, i , 2 ). A este modelo se denomina
modelo de efectos fijos.
Alternativamente, los a tratamientos pueden ser una muestra aleatoria de una poblacin
mayor de tratamientos. En esta situacin sera deseable generalizar las conclusiones
(basadas en la muestra de tratamientos), a todos los tratamientos de la poblacin, ya
sea que hayan sido explcitamente considerados, en el anlisis o no. En este caso, las i
son variables aleatorias y resulta relativamente intil conocer sus, valores particulares
para los tratamientos investigados. En su lugar, se prueban hiptesis con referencia a la
variabilidad de las i y se intenta dicha variabilidad. Esto se conoce como modelo de
efectos aleatorios o de componentes de variancia.
3-3 ANALISIS DEL MODELO DE EFECTOS FIJOS
En esta seccin se desarrolla el anlisis de variancia para el modelo de efectos fijos de
clasificacin en un sentido. En este modelo los efectos de tratamiento se definen
usualmente como desviaciones con respecto a la media general, por esta razn

Sea y i el total de las observaciones bajo el i-esimo tratamiento. Y , el promedio de las


observaciones bajo el i-esimo tratamiento. Similarmente sea y la suma de todas las
observaciones y la media general de la, observaciones. Expresado matemticamente

3-3
en donde N=an es el nmero total de observaciones. Entonces, la notacin de "punto en el sub ndice implica la suma sobre el sub ndice que reemplaza.
La media del j-simo tratamiento es E(y ij )= + , i= 1. 2.,a. Por tanto, el valor
medio del j-simo tratamiento consta de la suma de la media general y el efecto del isimo tratamiento. Interesa probar la igualdad de las medias de dos a tratamientos: es
decir hay que observar

que si H 0 es verdadera, todos los tratamientos tienen la media comn . Una forma
equivalente de expresar las hiptesis anteriores es en trminos de los efectos de
tratamiento i , o sea

Por tanto, es posible hablar de probar la igualdad de las medias de los tratamientos,
bien de probar que los efectos de tratamiento (las i ) son cero. El procedimiento
apropiado para probar la igualdad en el nivel medio de a tratamientos en el anlisis de
variancia
3.3.1 Descomposicin do la Suma Total do Cuadrados
La denominacin anlisis de variancia resulta de descomponer la variabilidad total de
los datos en sus partes componentes. La suma total de cuadrados corregida

se usa como medida de la variabilidad total de los datos. Intuitivamente esto parece
razonable, ya que si se divide SS T , entre el nmero apropiado de grados de libertad (en
este caso entre (a.n - 1 = N -1), se obtiene la variancia muestral de y. Obviamente, la
variancia muestral es una medida estndar de la variabilidad.
Debe observarse que la suma total de cuadrados corregida SS T (notacin proveniente
de sum of square, SS) puede escribirse como
.3-4
o bien

..3-5
Sin embargo, el trmino del producto de cruz en la ecuacin 3-5 es cero. ya que

Por tanto, se tiene


..3-6
La Ecuacin 3-6 muestra que la variabilidad total de los datos, medida por la suma total
de cuadrados corregida, puede descomponerse en la suma de cuadrados de las
diferencias entre los promedios de los tratamientos y el promedio general, y en la suma
de cuadrados de las diferencias entre las observaciones dentro del tratamiento y el
promedio del mismo. La diferencia entre los promedios observados de los tratamientos y
el promedio general constituye una medida de la diferencia entre las medias de
tratamiento, mientras que la causa de las diferencias de las observaciones den tro de los
tratamientos con respecto al promedio del tratamiento puede ser solamente el error
aleatorio. Por tanto, simblicamente la ecuaci6n 3-6 puede ser escrita como

en donde SS Tratamiento se denomina suma de cuadrados debida a los tratamientos (es


decir, entre tratamientos) y SS E se llama suma de cuadrados debida al error (es decir,
dentro de los tratamientos). SS T tiene N - 1 grados de libertad porque hay un total de
an=N observaciones. Por otra parte, existen a niveles del factor (y a medias de
tratamiento), de manera que SS Tratamiento tiene a-1 grados de libertad. Finalmente, existen
n replicas dentro de cada tratamiento, las cuales proporcionan n-1 grados de libertad
para estimar el error experimental. Como hay a tratamientos, se tienen a(n-1)=an- a=N-a
grados de libertad para el error.

En esta forma es fcil observar que el termino ubicado entre los parntesis
rectangulares, dividido entre n-1, es la variancia muestral del i-esimo tratamiento, o

Ahora bien, es posible combinar a variancias muestrales para producir una estimacin
de la variancia poblacional comn como se muestra a continuacin:

Por tanto, SS E /(N-a) es una estimacin de la variancia comn a cada uno de los a
tratamientos.

Igualmente, si no hay diferencia entre las medial de los a tratamientos, puede usarse la
variacin de los promedios de los tratamientos con respecto al promedio general para
estimar 2 . Especficamente.

es una estimacin de 2 si las medias de los tratamientos son iguales. Intuitivamente, la


razn de esto se presenta a continuacin: una estimacin para 2/n, la variancia de los
promedios de los tratamientos es a i=1( i .-..) 2 /(a-1); por tanto, n a i=1( i .-..) 2 /(a-1)
debe estimar 2 si no hay diferencia en el nivel medio de los tratamientos.
Puede observarse que la identidad del anlisis de variancia (Ecuacin 3-6), proporcin
dos estimaciones para 2 - una basada en la variabilidad propia e interna de los
tratamientos, y otra en la variabilidad entre los mismos. Si no existe diferencia en el
nivel medio de los tratamientos, estas dos estimaciones deben ser similares; de no ser
as, se sospechara que la diferencia observada puede ser el resultado de una diferencia
entre las medias de los tratamientos. A pesar de haber proporcionado un argumento
intuitivo para desarrollar este resultado, es posible un enfoque ms formal.
Las cantidades

se denominan medias de cuadrados (o cuadrados medios) (MS proviene de mean


squeare). A continuacin, se examinan los valores esperados de estas medias de
cuadrados. Considrese

Sustituyendo el modelo, ecuacin 3-1 en la anterior se obtiene

Ahora bien, cuando se elevan al cuadrado las cantidades entre parntesis rectangulares

y se toma su valor esperado, los trminos que contienen 2 ij y 2 i deben remplazarse por
y n 2 respectivamente, porque E( ij )=0. Ms aun, todos los productos de cruz que
contienen poseen una expectativa igual a 0. Por tanto, al elevar al cuadrado y tomar
valor esperado, la ltima ecuacin se transforma en

O bien
Usando un enfoque similar es posible mostrar que

Por tanto, como se argumenta en forma heurstica, una estimacin para 2 es MS E =SS E /
(N-a); por otra parte, si no hay diferencia en el nivel medio de los tratamientos (lo que
implica que i =0), MS Tratamiento =SS Tratamiento /(a-1) proporciona otra estimacin para 2. Sin
embargo, hay que observar que si existe diferencia en las medias de los tratamientos, el
valor esperado de la media de cuadrados de tratamiento es mayor que 2 .
Resulta claro que una prueba para la hiptesis de la igualdad en el nivel medio de
tratamientos puede efectuarse comparando MS Tratamiento y MS E . A continuacin se muestra
como realizarse tal comparacin.
3-3.2 Anlisis Estadstico
Ahora se investiga cmo puede realizarse una prueba formal de la hiptesis de medias
de los tratamientos (H 0 : 1 = 2 =.= a , o equitativamente, H 0 : 1 = 2 = ..= a =0)
Puesto que se ha supuesto que los errores ij son independientes y estn normalmente
distribuidos con media cero y variancia 2 , las observaciones y ij tambin son
independientes y se encuentran normalmente distribuidos con media + i y variancia 2 .
Es posible demostrar que SS E / 2 tiene una distribucin ji cuadrada con N-1 grados de
libertad porque SS T , es una suma de cuadrados de variables aleatorias normalmente
distribuidas. Tambin se puede mostrar que SS E / 2 tiene una distribucin ji cuadrada
con N-a grados de libertad y que si la hiptesis nula H 0 : i=0 es verdadera, SS Tratamiento / 2
tiene una distribucin ji cuadrada con a-1 grados de libertad. Sin embargo, estas tres
sumas de cuadrados no son independientes ya que SS T es igual a SS Tratamiento ms SS E .
El siguiente teorema, que es un caso particular de otro atribuido a Cochran, es til para
establecer la independencia entre SS E y SS Tratamiento .
TEOREMA 3.1. TEOREMA DE COCHRAN
Sean Z variable aleatorias NID(0,1)para i=1,2,.,v y

en donde Sv y Qi tiene v grados de libertad (i=1, 2,.S). Entonces Q1 , Q 2,.Q z, son


variables aleatorias independientes con distribucin ji-cuadrada y v 1,v 2,.,v s grados de
libertad, si solo si

Como la suma de los grados de libertad de SS Tratamiento y SS E es igual a N-1, es decir, el


total de los grados de libertad, el teorema de Cochran implica que SSTratamiento/ 2 y
SS E / 2 son variables aleatorias independientes con distribucin ji cuadrada. Por tanto, si
la hiptesis nula de igualdad de medias de los tratamientos es verdadera, la razn

..3-7
tiene una distribucin F con a-1 y N-a grados de libertad. La Ecuacin 3-7 es la
estadstica para probar la hiptesis de igualdad de medias de los tratamientos.
Del valor esperado de la media de cuadrados se observa que, en general, MS E es un
estimador insesgado de 2 . Por otra parte, si la hiptesis nula es verdadera, MS Tratamientos
resulta ser un estimador insesgado de 2.Sin embargo, si la hiptesis nula es falsa, el
valor esperado de MS Tratamientos es mayor que 2 .Por tanto, el valor esperado del
numerador en la estadstica de prueba (Ecuacin 3-7), es mayor que el valor esperado
del denominador si la hiptesis alterna es verdadera y en consecuencia, debe
rechazarse H 0 si el valor de tal estadstica es demasiado grande. Esto implica una regin
crtica unilateral superior. En otras palabras, se rechaza H 0 si

Donde F 0 se calcula usando la Ecuacin 3-7.


Es posible obtener frmulas de clculo para las sumas de cuadrados al reescribir y
simplificar las definiciones de SS Tratamientos y SS T en la Ecuacin 3-6. Esto da como
resultado

La suma de cuadrados del error se obtiene por diferencia

El procedimiento de prueba se resume en la tabla 3-3 Esta fabulacin se denomina tabla


de anlisis de variancia.

Ejemplo 3.1
Mas Sobre el Experimento de Resistencia a la Tensin
Para ilustrar el anlisis de variancia, volvamos al ejemplo que se abord por primera vez
en la Sec. 3-1. Recordemos que el ingeniero de desarrollo le interesa determinar si el
peso porcentual del algodn en una fibra sinttica afecta la resistencia a la tensin, y
para ello ha realizado un experimento completamente aleatorizado con cinco niveles de
porcentaje de algodn y cinco repeticiones. Por conveniencia, aqu se reproducen los
datos de la Tabla 3-1:

Las sumas de cuadrados requeridas para el anlisis de variancia se calculan como


sigue:

El anlisis de variancia se resume en la Tabla 3-4. Hay que notar que la media de
cuadrados entre tratamientos (118.941) es mucho mayor que la media de cuadrados
dentro de tratamientos (8.06). Esto indica que es improbable que las medias de
tratamientos sean iguales. Mas formalmente, es posible calcular la razn F, o sea
F o=118.94/8.06=14.76, y compararla con F ,4,20 Como F .01,4,20 = 4.43, debe rechazarse Ho
y concluir que las medias de tratamientos difieren; en otras palabras, el algodn en la
fibra afecta significativamente su resistencia media.

Una Advertencia Acerca de los Clculos: Seguramente el lector alerta habr notado
que aqu se defini la suma de cuadrados en trminos de promedios; esto es, a partir de
la Ecuacin 3-6,

pero que las frmulas para el clculo se dedujeron utilizando totales. Por ejemplo, para
calcular SS Tratamaientos emplearamos la Ecuacin 3-9:

La razn de esto es la exactitud numrica: los totales y i. Y y .. no estn sujetos a error de


redondeo, mientras que si lo estn los promedios i.. y ..

Ejemplo 3.2
Codificacin de Observaciones. A menudo, los clculos del anlisis de variancia
pueden hacerse ms precisos o ser simplificados si se codifican los datos. Por ejemplo
consideremos los datos de la resistencia a la tensin en el Ejemplo 3-1. Supngase que
a cada observacin se le resta 15. Los datos codificados aparecen en la Tabla 3-5.

Es fcil verificar que

y
Al comparar estas sumas de cuadrados con las del Ejemplo 3-1, se observa que no
quedan afectadas si se resta una constante a los datos originales.
Ahora supongamos que se multiplica por 2 cada observacin del Ejemplo 3-1. Es fcil
verificar que las sumas de los cuadrados en los datos transformados son SS T =2547.84,
SS Tratamientos =1903.04, y SS E =644.80. A primera vista parece ser que hay mucha
diferencia entre estas sumas de cuadrados y las calculadas en el Ejemplo 3.1, Sin
embargo, si se las divide entre 4 (en otras palabras, 2 2), los resultados son idnticos.
Por ejemplo, para la suma de cuadrados de tratamiento, 1903.04/40=475.76. Por tanto,
para los datos codificados la razn F es F= (1903.04/4)/(644.80/20)=14.76, resultado
que es idntico al de los datos originales. De esta forma los anlisis de variancia
resultan ser equivalentes.

UNIDAD II
Sesin V: Diseo de Cuadrados Latinos
Sesin VI: Diseo de Bloques aleatorizados
completos
Sesin VII: Diseo de Bloques Aleatorios Incompletos

SESION V
DISEO DE CUADRADO LATINO
En un diseo de bloques completamente aleatorizados se desea controlar una sola fuente de
variacin local. Generalmente es necesario controlar ms de una fuente de variacin. Un diseo
de Cuadrados Latinos es muy similar a un diseo de bloques completamente aleatorizados, pero
con una fuente de variacin adicional.
En el tema anterior se introdujo el diseo aleatorizado por bloques completos como un diseo
para reducir el error de los residuos de experimento, al sustraer la variabilidad debida a las
unidades experimentales. Hay otros diseos que usan el principio de anlisis por bloques. Por
ejemplo, supongamos que un experimentador est estudiando el efecto de cinco formulas
diferentes de la mezcla de dinamita sobre la fuerza explosiva observada. Cada Formula se
prepara usando un lote de materia prima, lo suficientemente grande para solo se haga cinco
mezclas. Ms aun, las mezclas las preparan varios operadores, pudiendo existir una diferencia
sustancial en la habilidad y experiencia entre ellos. Al parecer hay dos efectos extraos que se
deben cancelar en el diseo: lotes de materia prima y operadores. El diseo apropiado para
este problema consiste, en probar, cada frmula exactamente una vez, utilizando cada lote de
materia prima, y en que cada formula sea preparada exactamente una vez por cada uno de cinco
operadores. El diseo que resulta aparece en la Tabla 5-9 y se llama diseo de cuadros latinos.
Hay que notar que este diseo es un arreglo cuadrado y que las cinco formulas (o tratamientos)
se representan mediante las letras latinas A, B, C, D y E. de ah el hombre de cuadrado latino.
Se observa que tanto los lotes de materia prima (renglones) como los operadores (columna) son
ortogonales a los tratamientos.
El diseo de cuadrado latino se usa para eliminar dos fuentes de variabilidad problemtica; en
otras palabras, permite analizar sistemticamente por bloques en dos direcciones. En este
diseo, los reglones y columnas representan, en realidad, dos restricciones a la aleatorizacin.
En general, un cuadrado latino para p factores, o un cuadrado latino p x p, es un cuadrado que
contiene p renglones y p columnas. Cada una de las p 2 celdas contiene una de las p letras que
corresponde a un tratamiento, y cada letra aparece una sola vez en cada regln y columna. A
continuacin, se presenta algunos ejemplos de cuadrados latinos.

El modelo estadstico de cuadrado latino es:


4-22

en donde Yijk es la observacin correspondiente al i-simo regln, k-sima columna y el j-simo


tratamiento: es la media general, i, es el i-simo efecto de rengln, j es el j-simo efecto de
tratamiento, k es el k-simo efecto de columna y ijk es el error aleatorio. El modelo es
completamente aditivo, en otras palabras, no existe interaccin entre los reglones, las columnas
y los tratamientos. Solo 2 de los tres subndices i, j, y k se requieren para especificar una
observacin en particular porque nicamente hay una observacin en cada celda. Por ejemplo,
haciendo referencia al problema de la frmula de la dinamita en la Tabla 4-9, si i = 2 y k = 3,
automticamente j = 4 (formula D), y si i = 1 y j = 3 (formula C), k = 3. Est es una consecuencia
de que cada tratamiento aparece exactamente una vez en cada regln y en cada columna.
El anlisis de variancia consiste en descomponer la suma total de cuadrados de la N = p 2
observaciones en sus componentes de regln, columna, tratamiento y error, por ejemplo.
4-23
Cuyos grados de libertad son

Bajo la suposicin usual de que ijk es NID(0,2), cada una de las sumas de
cuadrados del miembro derecho de la Ecuacin 4-23 son, al dividir entre 2,
variables aleatorias independientes con distribucin ji cuadrada. El estadstico
apropiado para probar la igualdad de medias en los tratamientos

que tiene una distribucin Fp-1,(p-2)(p-1) si la hiptesis nula es verdadera. Es posible probar que no
existen efectos de reglones o de columnas si se toma la razn de MS Reglones y MSColumnas contra la
MSE. Sin embargo, posiblemente estas pruebas no sean apropiadas por que los reglones y las
columnas representan restricciones de aleatorizacin.
El procedimiento de clculo para el anlisis de variancia se muestra en la tabla 4-10. Al analizar
las frmulas para el clculo de la suma de cuadrados, puede observarse que este anlisis es una
simple extensin del diseo aleatorizado por bloques, con la suma de cuadrados de reglones
calculada usando a los totales por reglones.
Ejemplo
'
Considrese el problema de las formulas de la dinamita descrito anteriormente. Se supone que
tanto los lotes de materia prima como los operadores representan restricciones en la
aleatorizacin. El diseo para este experimento mostrado en la tabla 4-9 es un cuadrado latino 5
x 5. Despus de codificar las observaciones, restando 25, se obtuvieron los datos de la tabla 411. Las sumas de cuadrados para los totales, lotes (renglones) y operadores (columnas) se
calculan a continuacin.

Tabla 4-9. Las sumas de cuadrados para los totales, lotes o (renglones) y operadores (colum nas)
se calculan a continuacin.

Los totales de tratamiento (letras Latinas) se presentan a continuacin:

Usando estos, totales se calcula que la suma de cuadrados de las frmulas es

la suma de cuadrados del error se calcula por diferencia,

En la Tabla 4-12 de datos codificado se resume el anlisis de variancia. Se concluye que existe
una diferencia significativa en la fuerza explosiva media debido a las cinco formulas diferentes.
Tambin hay una indicacin de diferencia entre los operadores, por lo tanto, controlar este
factor fue una buena precaucin. No existe una evidencia fuerte de que haya una diferencia entre
los lotes de materia prima, y al parecer, en este experimento hubo una inquietud innecesaria en
cuanto a esta fuente de variabilidad. Sin embargo controlar localmente los lotes de materia prima
siempre resulta adecuado.
El lector debe determinar los residuos del ejemplo y construir las grficas apropiadas.
PROBLEMA 1.
Un Ing. Qumico desea probar el efecto que tienen cuatro agentes qumicos sobre la resistencia
de un tipo particular de tela. Como puede haber variabilidad entre un rollo de tela y otro, decide
utilizar un diseo aleatorizado por bloques, considerando los rollos de tela como bloques. Ella
selecciona cinco rollos y les aplica los cuatro agentes qumicos en orden aleatorio. A
continuacin, se proporcionan los resultados de la resistencia a la tensin.

Se pide:
1.
Analice estos datos y haga las conclusiones apropiadas.
2.
Identificar los Elementos del experimento: variable dependiente, independiente y
variable respuesta, factores bloques, etc.

PROBLEMA 2.
Se encuentra bajo estudio el efecto que tiene cinco reactivos distintos (A, B, C, D y E) sobre el
tiempo de reaccin de un proceso qumico. Cada lote de material nuevo es lo suficientemente
grande para permitir que solo se realice cinco ensayos. Ms an, cada ensayo tarda,
aproximadamente, una hora y media, por lo que solo pueden realizarse cinco ensayos por das,
la investigadora decide efectuar el experimento usando un diseo de cuadrado latino, con el fin
de controlar sistemticamente las variables lote material y da. Ella recolecta los siguientes
datos. Analice y obtenga las conclusiones.

Un ingeniero industrial est investigando el efecto que tienen cuatro mtodos de ensamblaje (A,
B, C y D) sobre el tiempo de ensamblaje de un componente para televisores a color. Se
seleccionan cuatro operadores para realizar este estudio. Por otra parte, el ingeniero sabe que
cada mtodo de ensamblaje produce fatiga, por lo que el tiempo que se tarda en el ltimo
ensamblaje puede ser mayor que el primero, independientemente del mtodo. En otras palabras,
se produce un patrn en el tiempo de ensamblaje. Para controlar esta posible fuente de
variabilidad, el ingeniero utiliza el diseo de cuadrados latinos que aparece a continuacin.
Analice y haga las conclusiones apropiadas.

Se realiza un estudio para comparar los ndices de monxido de carbono en 5 puntos


estratgicos de una ciudad. (N-norte, S-sur, E-este, O-oeste, C-centro). Los conjuntos de
bloques involucrados son determinados das de la semana y distintos horarios del da. El
cuadrado obtenido y los datos (ppm) registrados se presenta a continuacin. Realizar la
comparacin.
08:00
11:00
14:00
17:00
20:00

Lunes
N (124)
E (112)
S (123)
O (118)
C (102)

Mircoles
S (124)
C (100)
N (133)
E (112)
O (122)

Viernes
C (124)
N (130)
O (112)
S (133)
E (118)

Sbado
O (122)
S (131)
E (121)
C (124)
N (131)

Domingo
E (124)
O (114)
C (133)
N (134)
S (133)

Se tiene un experimento para observar el rendimiento de 5 variedades de garbanzo (A, B, C, D y


E). Las filas fueron definidas como niveles de riego cm3/parcela. Las columnas fueron definidas
como gradientes de fertilidad del suelo.

Un investigador quiere evaluar la productividad de cuatro variedades de aguacates y decide


realizar el ensayo en un terreno que posee un gradiente de pendiente de oriente a occidente y
adems, diferencias en la disponibilidad de Nitrgeno de norte a sur, para controlar los efectos
de la pendiente y la disponibilidad de Nitrgeno, utiliz un diseo de cuadrado latino, las
variables son: A, B, C y D, (los datos correspondientes a la produccin a kg/parcela).

SESION VI

BLOQUES ALEATORIZADOS
DISEO ALEATORIZADO POR BLOQUES COMPLETOS
Este es el ms simple y quizs el ampliamente usado de los diseos de bloques al azar que es
definido por Hinkelman (1994) as: El material experimental es dividido en a grupos
de b unidades experimentales (UE) cada uno, donde a es el nmero de tratamientos, tales que
las UE dentro de cada grupo son lo ms homognea posible y las diferencias entre las UE sea
dada por estar en diferentes grupos. Los conjuntos son llamados bloques. Dentro de cada bloque
las UE son asignadas aleatoriamente, cada tratamiento ocurre exactamente una vez en un
bloque.

Si la variacin entre las UE dentro de los bloques es apreciablemente pequea en comparacin


con la variacin entre bloques, un diseo de bloque completo al azar es ms potente que un
diseo completo al azar.
En cualquier experimento, la variabilidad que surge de un factor perturbador puede afectar los
resultados. En general, un factor perturbador puede dividirse como un factor del diseo que
probablemente tenga un efecto sobre la respuesta, pero en el que no existe un inters
especfico. En ocasiones un factor perturbador es desconocido y no controlable; es decir; se
desconoce la existencia de ese factor e incluso puede tener niveles variables mientras se est
realizando el experimento. La aleatorizacin es la tcnica de diseo que se utiliza para
protegerse contra estos factores perturbadores que estn al acecho. En otros casos, el factor
perturbador es conocido pero no controlable. Si por lo menos puede observarse el valor que
asume el factor perturbador en cada corrida del experimento, es posible hacer la compensacin
correspondiente en el anlisis estadstico mediante el uso del anlisis de covarianza. Cuando la
fuente de variabilidad perturbadora es conocida y controlable, puede usarse una tcnica de
diseo llamada formacin de bloques para eliminar de manera sistemtica su efecto sobre las
comparaciones estadsticas entre los tratamientos. La formacin de bloques es una tcnica de
diseo en extremo importante que se utiliza ampliamente en la experimentacin industrial, y es la
materia de esta sesin.
Para ilustrar la idea general, suponga que quiere determinarse si cuatro puntas diferentes
producen o no lecturas diferentes en una mquina para probar la dureza. Un experimento como
este podra ser parte de un estudio de la aptitud en la calibracin de los instrumentos. La
mquina funciona presionando la punta sobre una probeta de metal y determinando la dureza de
la probeta a partir de la profundidad de la marca que se produce. El experimentador ha decidido
obtener cuatro observaciones para cada punta. Solo existe un factor tipo de punta -, y el diseo
de un factor completamente aleatorizado consiste en asignar aleatoriamente cada uno de los 4 x
4 = 16 ensayos a una unidad experimental, o sea a una probeta de metal, y tomar las lecturas
de la dureza correspondientes. Por lo tanto, se requeriran 16 probetas de metal para realizar
este experimento, una para cada ensayo.
En principio existe un problema serio con el diseo completamente aleatorizado en esta
situacin. Si las probetas son ligeramente distintas en cuanto a dureza, como sera el caso si
proviniera de diferentes vaciados, las unidades experimentales (probetas o especmenes)

contribuyen a la variabilidad observada en las lecturas de la dureza Como resultado, el error


experimental reflejara tanto el error aleatorio como la variabilidad entre las probetas.
Se desea que el error experimental sea lo ms pequeo posible; en otras palabras, se busca
sustraer del error experimental la variabilidad producida por las probetas. Un diseo que logre
esto requiere que el experimentador pruebe cada punta, una vez, en cada una de las cuatro probetas diferentes. Este diseo, que aparece en la Tabla 4.1, se conoce coma diseo aleatorizado
por bloques completos. La respuesta observada es la dureza en la escala C de Rockwell menos
40.

La palabra "completo" Indica que todos los tratamientos puntas son probadas en cada bloque
(probetas). Si se usa este diseo, los bloques o probetas forman una unidad experimental ms
homognea con la cual comparar las y puntas. Esta estrategia de diseo mejora efectivamente la
precisin de las comparaciones al eliminar la variabilidad entre las probetas. El orden en que las
cuatro puntas deben ser probadas en cada bloque se determina aleatoriamente. Hay que notar la
similitud que hay entre este diseo y el presentado en el diseo comparacin por pares cuando
se discuti la prueba t de diferencias aparejadas. El diseo aleatorizado por bloques completos
es una generalizacin de aquel concepto.
Dicho diseo es quizs el diseo experimental ms ampliamente utilizado. En la prctica, las
situaciones en las que este diseo se aplica son muy numerosas y pueden detectarse
fcilmente. A menudo, las unidades de equipo de prueba o maquinaria son diferentes en sus
caractersticas de operacin y constituyen un factor tpico que es necesario controlar. Lotes de
materia prima, personas o tiempo, tambin constituyen fuentes de variabilidad en un
experimento, las cuales pueden ser controladas sistemticamente mediante el anlisis por
bloques
Anlisis Estadstico
Supongamos que en general se tienen a tratamientos (que deben ser comparados) y b bloques.
En la Fig. 4.1 aparece el diseo aleatorizado por bloques completos. Se realiza una observacin
por tratamiento en cada bloque, y el orden en que los tratamientos son medidos en cada bloque
se determina aleatoriamente. A menudo, se dice que los bloques representan una restriccin en
la aleatorizacin por que la nica aleatorizacin de los tratamientos ocurre dentro de los bloques.
El modelo estadstico para este diseo es:

.4-1
En donde es una media general, i, es el efecto del i-simo tratamiento, i, es el efecto del jsimo bloque y ij es el termino usual NID(0, 2) de error aleatorio. Inicialmente se considera

que tanto los tratamientos como los bloques son factores fijos. Ms aun, los efectos de
tratamiento y de bloque se consideran como desviaciones de la media general, por lo tanto

Se desea probar la igualdad de las medias de tratamiento. As, la hiptesis nula de inters es.

Como la media del i-simo tratamiento es 1 = (1/b)bi=1(++)= +ij una forma equivalente de
expresar las hiptesis anteriores es en trminos de los efectos de tratamiento.

Sea yi el total de las observaciones del tratamiento i, y.i, el total de las observaciones del bloque j,
y.. el total de todas las observaciones, y N = ab el nmero total de observaciones.
Matemticamente,
4-2
4-3

4-4

Similarmente, i. es el promedio de las observaciones


promedio de las observaciones del bloque j, y i es el
observaciones. Esto significa que
4-5

del tratamiento i, .. es el
promedio de todas las

La suma total de cuadrados corregida puede expresarse como:

.. 4-6
Al desarrollar el segundo miembro de la ecuacin 4-6, se obtiene

Despus de algunos pasos algebraicos simples pero tediosos, se comprueba que los tres
trminos que contienen productos cruzados son iguales a cero. Por lo tanto,

.. 4-7
Representa una descomposicin de la suma total de cuadrados. Expresando simblicamente.
Las sumas de cuadrados de la Ecuacin 4-7, se tiene
4-8
Ya que existen N observaciones, la SS T, tiene N - 1 grados de libertad. La SSTratamientos y la
SSBloques, tienen a - 1 y b - 1 grados de libertad, respectivamente, porque existen a tratamientos y
b bloques. La suma de cuadrados del error no es ms que la suma de cuadrados entre las
celdas, menos la suma de cuadrados de tratamiento y de bloque. Existen ab celdas con ab - 1
grados de libertad entre ellas, por lo tanto, SS E, tiene ab - 1 (a - 1) (b 1) grados de libertad.
Ms aun, la suma de los grados de libertad de los miembros del lado derecho de la Ecuacin 4-8
es igual a la de los miembros del factor Izquierdo. Entonces, usando la suposicin usual de
normalidad de los errores y el Teorema puede mostrarse que SS Tratamientos/2, SSBloques/2, y
SSE/2, son variables aleatorias independientes con distribuciones ji cuadrada. Cada suma de
cuadrados dividida entre sus grados de libertad es igual a una media de cuadrados.
Considerando que los; tratamientos y los bloques son fijos, puede mostrarse que los valores
esperados de las medias de cuadrados son:

Por lo tanto, para probar la igualdad en las medias de tratamiento, hay que usar la estadstica

que tiene una distribucin F ,a-1,(a-1)(b-1) si la hiptesis nula es verdadera. La regin critica es el
extremo superior de la distribucin F y se debera rechazar H o si Fo > F,a-1,(a-1)(b-1).
Tambin puede ser de inters la comparacin entre las medias de los bloques, porque si no hay
gran diferencia entre ellas, el anlisis por bloques quizs no sea necesario en experimentos
futuros. Al analizar los valores esperados de las medias de cuadrados, puede parecer que la
hiptesis Ho: i = 0 puede probarse comparando la estadstica Fo = con F, a-1,(a-1)(b-1).
Sin embargo, debe recordarse que la aleatorizacin fue aplicada solo a los tratamientos dentro
de los bloques; en otras palabras, estos ltimos representan una restriccin para la
aleatorizacin. Qu efecto tiene esto sobre la estadstica F o = MSBloques/MSE? Existen diferentes
respuestas a esta pregunta. Por ejemplo. Box. Hunter y Hunter (1978) argumentan que la prueba
F del anlisis de variancia puede justificarse solamente con base en la aleatorizacin sin
necesidad de usar a su posicin de normalidad. Ellos concluyen que la prueba para comparar
bloques no puede ser incluida bajo este argumento a consecuencia de la restriccin de
aleatorizacin; pero que si los errores son NID(O, 2) la estadstica Fo = MSBloques/MSE, puede
usarse para comparar las medias de bloques.
Tabla 4-2. Anlisis de variancia para un diseo aleatorizado por bloques completos

Por otra parte. Anderson y McLean (1974) argumentan que la restriccin de aleatorizacin
impide que esta estadstica pueda ser til para comparar las medias de los bloques y que la
estadstica F, en realidad, es una prueba para la igualdad de las medias de los bloques ms
la restriccin de aleatorizacin a la que llaman error de restriccin; consltense Anderson y

McLean (1974) para mayores detalles.


Qu hay que hacer, pues, en la prctica? Como la suposicin de normalidad a menudo que da
en tela de juicio, tomar Fo = MSBloques/MSE como una prueba F exacta, en general, no es
conveniente. Por eso, esta prueba se excluye de la tabla de anlisis de variancia. Sin embargo,
ciertamente el examen de la razn entre MS Bloques y MSE puede ser un procedimiento aproximado para investigar el efecto del variable bloque. Un valor grande de esa razn, implica que el
factor bloque tiene un efecto grande y que la reduccin de ruido obtenida al analizar por
bloques probablemente fue til, al mejorar la precisin de las comparaciones entre las media
de tratamiento.
Usualmente el procedimiento se resume en una tabla de anlisis de variancia como la que
aparece en la Tabla 4-2. Las frmulas para calcular las sumas de cuadrados pueden obtenerse
para los trminos de la ecuacin 4-7, expresndolas en funcin de los totales de los
tratamientos; y de los bloques. Las frmulas para estos clculos son
4-9
4-10

4-11

y la suma de cuadrados del error se obtiene por diferencia


4-12

Ejemplo 1
Considerar el experimento sobre la lectura de la dureza descrita en la Secc.
Hay cuatro puntas y estn disponibles cuatro probetas de metal. Cada
es probada una vez en cada probeta, resultando un diseo aleatorizado por
bloques completos. Recordar en el orden en que se prueban las puntas
una probeta en particular se determina aleatoriamente.

4-1.
punta
sobre

Para simplificar los clculos, se codifican los datos originales restando 9.5 de cada observacin
y multiplicando despus por 10.

La suma de cuadrados tiene la siguiente manera.

En la tabla 4-5 se presenta el anlisis de varianza. Utilizando = 0.05, el valor critico de F es


F0.05,3,9 =3.86. Puesto que 14.44 > 3.86 se concluye que el tipo de punta afecta la lectura de la
dureza media. El valor P para la prueba tambin es muy pequeo. Adems, al parecer los
ejemplares (bloques) difieren de manera significativa, ya que el cuadrado medio de los bloques
es grande en relacin con el error.
Es interesante observar los resultados. Suponga que se usaran cuatro ejemplares, asignado al
azar las puntas a cada una de ellos, y que resultara (por casualidad) el mismo diseo que el de
la tabla 4-3. El anlisis incorrecto de estos datos como un diseo completamente aleatorizado de
un solo factor se presenta en la tabla 4-6

Puesto que F0.05,3,12 = 3.49, no puede rechazarse la hiptesis de la igualdad de las mediciones de
la dureza media de las cuatro puntas. Por lo tanto, el diseo de bloques aleatorizados reduce lo
suficiente la cantidad de ruido en los datos para que las diferencias entre las cuatro puntas sean
detectadas. Esto ilustra un punto muy importante. Si un experimentador no recurre a la formacin
de bloques cuando debera haberlo hecho, el efecto puede ser inflar el error experimental a tal
grado que las diferencias importantes entre las medias de los tratamientos sean indetectables.
Desarrollar el ejercicio propuesto
1. Supongamos que queremos determinar si cuatro laboratorios miden la misma resistencia
caracterstica del hormign a compresin. Para ello se han considerado 5 amasadas
diferentes que han sido analizadas por cada uno de los laboratorios. A los 28 das, se han
roto las probetas a compresin simple y los resultados son los que hemos recogido en la
tabla que sigue.

En este caso, la variable de respuesta es la resistencia caracterstica del hormign a


compresin (MPa), el factor es el laboratorio (4 niveles), el bloque es la amasada (no son
objeto directo de motivo del estudio).
Por otra parte, se considera que no existe interaccin entre el laboratorio y la amasada
(factor y bloque).
En este tipo de experimento, la medicin ser el resultado del efecto del tratamiento
(laboratorio) donde se encuentre, del efecto del bloque al que pertenece (amasada) y de
cierto error que se espera que sea aleatorio. La hiptesis de que las medias son iguales se
va a analizar con el anlisis de la varianza (ANOVA), con dos criterios de clasificacin.
A parte de los supuestos de normalidad, igualdad de varianzas y de independencia, aqu se
aade otro que es que no existe interaccin entre el factor y el bloque.
Para los curiosos, despus de haber analizado los datos, diremos que en este caso, con
una seguridad del 95%, se aprecian diferencias significativas entre las resistencias medidas
por los laboratorios 1 y 3, entre los laboratorios 1 y 4, y entre los laboratorios 2 y 4.
2. Una industria algodonera, interesada en maximizar el rendimiento de la semilla de algodn,
quiere comprobar si dicho rendimiento depende del tipo de fertilizante utilizado para tratar la
planta. A su disposicin tiene 5 tipos de fertilizantes. Como puede haber diferencia entre las
parcelas, el experimentador decide efectuar un diseo en bloques aleatorizados.
Para ello, divide el terreno en 4 bloques y cada bloque en 5 parcelas, fumigando dentro de
cada bloque cada una de las parcelas con un fertilizante. Al recoger la cosecha se mide el
rendimiento de la semilla, obtenindose las siguientes observaciones.
Tabla 4-8. Rendimiento de la semilla de algodn

Especficamente, en este experimento, se han considerado 5 tipos de fertilizantes que se


han aplicado aleatoriamente a las parcelas dentro de cada bloque. La variable de inters o
variable respuesta es el rendimiento de la semilla en peso por unidad de superficie. En este
ejemplo hemos supuesto que el tipo de terreno influye en el rendimiento de la semilla de
algodn y decidimos controlar estadsticamente sus efectos, mediante la formacin de
bloques. Es decir, nuestro propsito es eliminar en el estudio de los efectos del fertilizante la
variabilidad debida al terreno e intentar que de esta forma sean ms patentes las diferencias
entre los fertilizantes, si las hay.
SESION VII
DISEOS POR BLOQUES INCOMPLETOS
Es posible que en algunos experimentos que usan discos aleatorizados por bloques no puedan
realizarse los ensayos de todas las combinaciones de tratamiento dentro de cada bloque.
Situaciones como estas ocurren debido a escasez en los recursos del experimento, o por el
tamao fsico de los bloques. Por ejemplo, supongamos que el tamao fsico de las probetas del
experimento de la lectura de la dureza (Ejemplo 5-1), solo alcanza para probar tres puntas. Por
lo tanto, no puede probarse cada punta en cada probeta. En estos casos es posible usar diseos
aleatorizados por Bloques en los que cada tratamiento no est presente en cada bloque. Estos
diseos se conocen como diseo aleatorizados por bloques incompletos.
7. DISEOS POR BLOOUES INCOMPLETOS BALANCEADOS
Cuando las comparaciones entre todos los tratamientos tienen la misma importancia, estas
deben elegirse de manera que ocurran en forma balanceada dentro de cada bloque. Esto
significa que cualquier par de tratamientos ocurren juntos el mismo nmero de veces que
cualquier otro par. Por lo tanto, un diseo balanceado (o equilibrado) por bloques incompletos es
con diseo por bloques incompletos en el que cualquier par de tratamientos ocurren juntos el
mismo nmero de veces. Supongamos que se tienen a tratamientos y que pueden probarse k(k
< a) tratamientos en cada bloque. Un diseo balanceado por bloques incompletos puede
construirse tomando
bloques y asignando una combinacin de tratamiento, diferente a cada
bloque. Son embargo, frecuentemente es posible obtener un diseo balanceado con menos de
bloques. Tablas de diseos balanceados por bloque, incompleto son presentadas por Fisher
y Yates (1953). Davies (1956), y Cochran y Cox (1957).
Como ejemplo, supngase que con ingeniero qumico cree que el tiempo de reaccin en un
proceso qumico es funcin del catalizador empleado. De hecho cuatro catalizadores estn sien do investigados. El procedimiento experimental consiste en seleccionar un lote de materia prima,
cargar una planta piloto, aplicar cada catalizador a ensayos separados de dicha planta y
observar el tiempo de reaccin. Debido a que las variaciones en los lotes de materia prima
puedan afectar el comportamiento del catalizador, el ingeniero decide controlar este factor por
medio de bloques. Sin embargo, cada lote es lo suficientemente grande para permitir el ensayo
de tres, catalizadores nicamente. Por lo tanto, es necesario utilizar un diseo aleatorizado por
bloques incompletos. El diseo balanceado por bloques incompletos, junto con las
observaciones recopiladas aparece en la Tabla 4.22. El orden en que se ensayan los
catalizadores dentro de cada bloque es aleatorio.

7.1. Anlisis Estadstico


Como es usual, suponemos que existen a tratamientos y b bloques. Se supone adems, que se
prueban k tratamientos en cada bloque, que cada tratamiento sucede r veces en el diseo (o se
repite r veces) y que hay un total de N = ar = bk observaciones. Ms aun, el nmero de veces
que cada par de tratamientos ocurre en el mismo bloque es

Se dice que el diseo es simtrico si a = b.


El parmetro , debe ser un entero. Para deducir la relacin de , considrese cualquier
tratamiento por ejemplo el 1. Como el tratamiento 1 ocurre en r bloques, y hay otros k - 1
tratamientos en cada uno de esos bloques, existen r(k - 1) observaciones en un bloque que
contiene al tratamiento 1, Estas r(k - 1) observaciones deben representar al resto de los a - 1
tratamientos veces. Por lo tanto, (a - 1) = r(k - 1).
El modelo estadstico es
(4-26)
en donde yij es i-esima observacin del j-simo bloque, es la media general, i es el efecto del iesimo tratamiento, j, es el efecto del j-esimo bloque, y ij, es la componente del error aleatorio
NID(O,2). La variacin total en los datos se expresa mediante la suma total de cuadrados
corregidos (o ajustados)
(4-27)
La variabilidad total puede ser descompuesta

en donde se corrige la suma de cuadrados de tratamiento para separar los efectos de


tratamiento y de bloque. Esta correccin es necesaria porque cada tratamiento ocurre en un
conjunto diferente de r bloques. Por esta razn las diferencias entre los totales de tratamiento no
corregidos. y1., y2., ....ya, tambin son afectadas por las diferencias entre los bloques.
La suma de cuadrados de los bloques es
4-28

en donde yij, es el total del i-esimo bloque. La SS Bloques, tiene b - 1 grados de libertad. La suma
de cuadrados de tratamiento corregida (o ajustada) es
4-29

en donde Qi es el total corregido del i-simo tratamiento, el cual se calcula mediante


4-30

con nij = 1 Si el tratamiento i ocurre en el bloque j, y n ij = 0 en otro caso. Por lo tanto. (1/k).n ijy.j
es el promedio de los totales de los bloques en los que se aplica el tratamiento i. La suma de los
totales de tratamiento corregidos siempre ser cero. La SS Tratamientos(ajustados) tiene a -1 grados de
libertad. La suma de cuadrados del error se calcula por diferencia y tiene N - a - b + 1 grados de
libertad.
4-31

La estadstica apropiada para probar la igualdad de los efectos de tratamiento es

En la Tabla 4-231 se presenta un resumen del anlisis de variancia.

Ejemplo 5-1
Considrese los datos de la Tabla 4-23 para el experimento de los catalizadores. Este es un diseo balanceado por bloques incompletos con a = 4, b = 4, k = 3, r = 3, = 2 y N = 12.

El anlisis de estos datos se realiza a continuacin. La suma total de cuadrados es

Usando la Ecuacin 4-28 se encuentra que la suma de cuadrados de bloque es

Para calcular la suma de cuadrados de tratamientos corregida que tome en cuenta los bloques,
primero hay que determinar los totales de tratamientos corregidos usando la Ecuacin 4-30

Al usar la Ecuacin 4-29 se calcula ahora la suma de cuadrados de tratamientos corregida

La suma de cuadrados del error se calcula por diferencia

El anlisis de variancia se muestra en la Tabla 5-3. Como F o > F0.05,3,5 = 5.41, se concluye que el
catalizador empleado tiene un efecto significativo sobre el tiempo de reaccin.

SESION IX
La optimizacin por diseos experimentales de acuerdo a un esquema del mbito del diseo
experimental, es posible distinguir dos grandes rutas excluyentes entre s.

1. Los DISEOS DINAMICOS, que son factoriales secuenciales, entre ellos el EVOP, SSEVOP
y que son pequeas variaciones en el rango de las variables para lograr mejorar resultados
sucesivamente iniciando de un simplejo o prueba con variables codificadas en un tringulo
Descarta en una vez la peor respuesta siguiendo la ruta contrapuesta conformando
nuevamente otro simplejo y as avanzando hasta una respuesta mejorada paulatinamente
(normalmente la secuencia termina en una figura poligonal cerrada) Para lograr resultados
favorables es necesario que la materia prima sea constante, equivalente en mineral a que la
ley de cabeza sea constante y ello es difcil de lograr generalmente.
2. Los DISEOS ESTATICOS que se usan en laboratorio o en escala de pilotaje, en este
esquema del Diseo esttico se distinguen dos grandes etapas recomendablemente

secuenciales y ambas tambin complementarias:


La PRIMERA o de SELECCION DE VARIABLES que es el primer intento de estudiar y
determinar la significancia de cada una de la mayor parte de variables. Si son hasta 3
variables se utiliza diseo factorial 2k, para 4 y 5 variables existe el diseo fraccionado
"mitad" y "un cuarto" respectivamente; ambos de 6 pruebas. Se trata de determinar a
Influencia de las variables sobre la respuesta elegida usando como estadstico de discrecin
el t-student.
La SEGUNDA ETAPA o de OPTIMIZACION, donde con el uso de modelos cuadrticos se
ajusta un modelo en dos variables siendo las ms conocidas el Hexagonal (cuando se quiere
investigar soplo dentro del rango elegido), el Octagonal (si se desea ampliar el rango) o en
tres variables usando el DCC o diseo Compuesto Central. Se estiman finalmente los
mejores valores de las variables para lograr un valor mximo o mnimo en Ia respuesta
elegida, usando como estadstico de discrecin el F de la regresin y F de la falta de Ajuste.
Entonces, la primera etapa descarta variable, qua no son influyentes e identifica dos o tres
sobre las cuales se debe trabajar para modelos de optimizacin generalmente cuadrticos.
PRIMERA ETAPA:
SELECCIN DE VARIABLE
Para esta etapa se cuenta con los DISEOS FACTORIALES 2k si las variables son 2 y 3, al
incrementar el nmero de variables entre 4 y 5 se usan los FACTORIALES
FRACCIONADOS MITAD Y UN CUARTO (son diseos factoriales recortados en bloques y
que evitan hacer un mayor nmero de pruebas como lo indicara un factorial 2k).
Si el nmero de variables crece ms, ser necesario usar plantillas de diseo tipo
PLANCKETT-BURMANN que permiten estudiar hasta 20 variables con un mnimo de 2 2
pruebas, pero el criterio de las plantillas es el mismo: evitar un gran nmero de pruebas de
factorial 2k por bloqueo de columnas codificadas que tienen la misma distribucin de signos
(en el lenguaje tcnico se conoce como aliases). Las plantillas normalmente aparecen en
variable codificada siendo 1 el rango real inferior elegido y +1 el rango superior, 0 expresa
el punto central y la relacin entre variable real y codificada es la siguiente:

Donde:
Vcod = es el valor codificado
Vreal = valor de la variable en unidades reales elegidas
Valor Central = el centro del rango real elegido
Radio = distancia en el rango del centro a un extremo en valor real.
Se reconoce una plantilla porque cada columna correspondiente a cada variable suma
siempre CERO. El anexo II muestra plantillas de diseos a los que nos estamos refiriendo.
PLANTILLAS MAS CONOCIDAS EN LA SELECCIN DE VARIABLES
En el caso de un diseo factorial 2n, es econmico usarlo solo hasta 3 variables con un mximo de 8
pruebas, constituyndose una plantilla en variable codificada del siguiente modo

Para 2 variables.
Variable
X1
X2

Rango
< 6 - 12 >
<3-7>

Central
9
5

Los rangos reales elegidos al ser codificados serian -1, 0, +1 para el rango mnimo, valor central y valor
mximo respectivamente en cada una de las variables. Despus, un juego de experimentos 22 tendra 4
pruebas, cuya secuencia y orden seria:
Prueba
1
2
3
4

X1
+
+

X2
+
+

Se confecciona intercalando en la primera columna valores -1 y +1; para la otra columna se hace el doble
de la anterior y as sucesivamente hasta, completar el nmero de, pruebas indique el diseo 2 en n.

Para 3 variables: 23 = 8 pruebas.


La plantilla a considerar seria la siguiente
Prueba
1
2
3
4
5
6
7
8

X1
+
+
+
+

X2
+
+
+
+

X3
+
+
+
+

Si:
X1 = A
X2 = B
X3 = C
Existe una manera de representar estas plantillas con solo letras minsculas figurando la
correspondiente en la prueba en que la variable participa con signo +. En caso contrario se entiende que
participa con el valor mnimo del rango
Por lo tanto:
1
(1)

2
A

3
ab

4
ab

5
c

6
Ac

7
bc

8
abc

El termino (1) indica que todas las variables participan con el rango mnimo.
Cuando son ms de cuatro variables se usan diseos factoriales fraccionados para evitar hacer un
mayor nmero de pruebas:
Prueba

X1

X2

X3

X4

1
2
3
4
5
6
7
8

+
+
+
+

+
+
+
+

+
+
+
+

+
+
+
+

Para 5 variables.
El factorial 25 = 32 pruebas se fracciona en un diseo fraccionado (1/4 (2) 5) = 8 pruebas, cuya plantilla es
la-que sigue:

Prueb
a
1
2
3
4
5
6
7
8

X1

X2

X3

X4

X5

+
+
+
+
-

+
+
+
+
-

+
+
+
+
-

+
+
+
+
-

+
+
+
+
-

MS DE SEIS VARIABLES se aplica el diseo Planckett Burmann


PLANTILLA CON 8 PRUEBAS
Anlisis por regresin hasta 6 variables:
Prueba
1
2
3
4
5
6
7
8

X1
+1
+1
+1
-1
+1
-1
-1
-1

PLANTILLA CON 8 PRUEBAS


Prueba X1
X2
1
+1 +1
2
+1
-1

X2
+1
+1
-1
+1
-1
-1
+1
-1

X3
+1
-1
+1
-1
-1
+1
+1
-1

X3
-1
+1

X4
+1
+1

X4
-1
+1
-1
-1
+1
+1
+1
-1

X5
+1
+1

X5
+1
-1
-1
+1
+1
+1
-1
-1

X6
+1
-1

X6
-1
-1
+1
+1
+1
-1
+1
-1

X7
-1
-1

X7
-1
+1
+1
+1
-1
+1
-1
-1

X8
-1
-1

X9
-1
+1

3
4
5
6
7
8
9
10
11
12

-1
+1
+1
+1
-1
-1
-1
+1
-1
-1

+1
+1
+1
-1
-1
-1
+1
-1
+1
-1

+1
+1
-1
-1
-1
+1
-1
+1
+1
-1

+1
-1
-1
-1
+1
-1
+1
+1
-1
-1

-1
-1
-1
+1
-1
+1
+1
-1
+1
-1

-1
-1
+1
-1
+1
+1
-1
+1
+1
-1

-1
+1
-1
+1
+1
-1
+1
+1
+1
-1

+1
-1
+1
+1
-1
+1
+1
+1
-1
-1

-1
+1
+1
-1
+1
+1
+1
-1
-1
-1

PLANTILLA CON 12 PRUEBAS


Prueba X1
X2
X3
1
+1 +1
-1
2
+1
-1
+1
3
-1
+1 +1
4
+1 +1 +1
5
+1 +1
-1
6
+1
-1
-1
7
-1
-1
-1
8
-1
-1
+1
9
-1
+1
-1
10
+1
-1
+1
11
-1
+1 +1
12
-1
-1
-1

X4
+1
+1
+1
-1
-1
-1
+1
-1
+1
+1
-1
-1

X5
+1
+1
-1
-1
-1
+1
-1
+1
+1
-1
+1
-1

X6
+1
-1
-1
-1
+1
-1
+1
+1
-1
+1
+1
-1

X7
-1
-1
-1
+1
-1
+1
+1
-1
+1
+1
+1
-1

X8
-1
-1
+1
-1
+1
+1
-1
+1
+1
+1
-1
-1

X9
-1
+1
-1
+1
+1
-1
+1
+1
+1
-1
-1
-1

X10
+1
-1
+1
+1
-1
+1
+1
+1
-1
-1
-1
-1

X11
-1
+1
+1
-1
+1
+1
+1
-1
-1
-1
+1
-1

DISEO FACTORIAL 2k
Los diseos factoriales son ampliamente utilizados en experimentos en los que intervienen varios
factores para estudiar el efecto conjunto de estos sobre una respuesta. Sin embargo, existen
varios casos especiales del diseo factorial general que resultan importantes porque se usan
ampliamente en el trabajo de investigacin, y porque constituyen la base para otros diseos
de gran valor practico.
El ms importante de estos casos especiales ocurre cuando se tienen k factores, cada uno con
dos niveles. Estos niveles pueden ser cuantitativos como sera el caso de dos valores de
temperatura, presin o tiempo. Tambin pueden ser cualitativos como sera el caso de dos
mquinas, dos operadores, los niveles "superior a "inferior" de un factor o, quizs, la ausencia o
presencia de un factor. Una rplica completa de tal diseo requiere que se recopilen 2 x 2
x..... x 2 = 2k observaciones y se conoce como diseo factorial 2k. El segundo caso especial es el
de k factores con tres niveles cada uno, conocido como diseo factorial 3 k.
En este captulo se presentan mtodos especiales para el anlisis de estas dos tiles series de
diseos Se supone. 1) que los factores son fijos. 2) que los diseos son completamente aleatorizados, y 3) que se satisface la suposicin usual de normalidad.
El diseo 2k es particularmente til en las primeras fases del trabajo experimental, cuando es
probable que haya muchos factores por investigar. Conlleva el menor nmero de corridas con los
cuales pueden estudiarse k factores en un diseo factorial completo. Debido a que solo hay
dos niveles para cada factor, debe suponerse que la respuesta es aproximadamente lineal en
el intervalo de los niveles elegidos de los factores.
Como Diseo Factorial se entiende a todas las posibles combinaciones: de los niveles de los factores en
cada prueba completa o replica investigada. Los niveles son los diferentes valores que pueden tomar las
variables. Si se considera dos niveles, el diseo se denomina Diseo Factorial a dos niveles, o diseo
factorial 2n, el cual se emplea en el presente trabajo, por lo que detallaremos este modelo.
El nmero necesario de pruebas a realizar viene definido por la relacin:

COMBINACIN

PUNTO
N
n
N

X1
+
+

1
2
3
4

X2
+
+

= 2n ..2
Donde:
= Numero de variables.
= Nmero de experimentos.

DISEO FACTORIAL 22

SIMPLE
Se estudian dos factores a dos niveles (22 = 4), con sus combinaciones respectivas:

Figura 1. Grfico de puntos del Diseo Factorial 2 n

Se quiere evaluar de una manera directa cul de los factores tiene mayor significancia
(influencia) en un proceso y si estos interactan (uno depende del otro) entre s.
Ejemplo 1 se estudian dos factores (concentracin y temperatura) a dos niveles
Factores
A: Concentracin (%)
B: Temperatura (C)

Niveles
5
35

10
70

Establecido la cantidad de pruebas se desarrolla experimento por experimento, obtenindose al


vector respuesta para cada prueba, el anlisis que se desee efectuar depender si se desea
maximizar o minimizar, edemas si el vector respuesta es cualitativo o cuantitativo (calidad,
rendimiento, eficiencia).
Una vez desarrollado prueba por prueba se obtiene el vector respuesta, el cual se adjunta al
cuadro:

Para evaluar cualquier proceso de una manera directa deber desarrollarse los siguientes pasos.
Primero: visualizamos los valores numricos de los niveles y establecemos si existe interaccin
entre los valores de los diferentes factores,

Prueba
A
B
Y
1
5
35
39.3
5 1010
35
70
2
35
40.9
5
70
40.0
Vemos que no existe 3
interseccin con los
10
70
41.5
valores numricos, sin 4
importar la magnitud
de cada uno de ellos, por lo tanto en el anlisis resultara que no existe interaccin.
Nota: Con este anlisis preliminar no establecemos la direccin de la mxima, ni tampoco la
orientacin de cada variable.
Segundo: Analizamos los efectos de los factores principales a fin de direccionar la orientacin de
la ptima y la influencia de estos en el proceso, se desarrolla el clculo de los efectos con la
siguiente relacin:
Calculo de efectos:

Interpretacin de los efectos


Si visualizamos los signos de los efectos A y B, notamos que ambos son positivos, por lo tanto
estn en su nivel mnimo, por lo cual debern ser maximizado, es decir que ambos factores son
variables, y debern ser optimizados y establecidos sus rangos de trabajo ptimo

Grficamente podemos visualizar que el efecto medio del vector respuesta nos indica que en el
orden de mayor significancia est el factor de concentracin, seguido de la temperatura (por la
pendiente ms pronunciada).
En este caso solamente estamos evaluando y no as optimizando, para desarrollar la
optimizacin deber seguirse otro camino, el cual ser desarrollado en el prximo acpite.
Nota: Anlisis de signos de los coeficientes de los efectos, segn el caso:
a)
(+)

Caso Maximizacin:
Indica que la variable se encuentra al nivel mnimo y (+) debe ser maximizado hasta el
ptimo y establecer su rango de trabajo.

(-)

Indica, que el factor ya no es una variable, por lo tanto viene a ser una constante en el
proceso, por lo que se encuentra en el nivel mximo y debe mantenerse como tal.

b)

Caso Minimizacin
Indica que el factor ya no es una variable, por lo tanto viene a ser una constante en el
proceso por lo que se encuentra en el nivel mximo y debe mantenerse como tal.

(+)
(-)

Indica que la variable se encuentra al nivel mnimo y debe ser maximizado hasta el ptimo
y establecer, su rango de trabajo.

Tercero: a fin de ver la influencia de los factores, se analiza la interaccin de los factores, quiere
decir si, existe cruce de informacin entre los factores y a la vez estos puedan controlarse de
una manera independiente a fin de manipular el proceso.
Interpretacin de la interaccin:
Notamos que el signo de la interaccin AB es negativo, esto nos indica que no existe
interaccin, lo cual lo hemos deducido al visualizar que no existe interseccin entre los valores
numricos, por lo tanto no existe significancia entre los factores en estudio.
Nota: Anlisis de signos de los coeficientes de las interacciones, segn el caso:
a)
(+)
(-)

Caso Maximizacin:
Indica que si existe interaccin entre las variables, uno depende del otro.
Indica que no existe interaccin entre las variables.

b)
(+)
(-)

Caso Minimizacin:
Indica que no existe interaccin entre las variables.
Indica que si existe interaccin entre las variables, uno depende del otro.

Como notara en este tipo de diseo no se han corrido pruebas centrales, en este caso se asume
que la interaccin representa el error acumulativo del proceso desarrollado, siempre y cuando
no exista interaccin o que el valor de significancia sea muy pequeo.
Para corroborar los anlisis desarrollados es que aplicamos el Anlisis de Varianza del proceso
(ANAVA, ANOVA, ANVA).
Para desarrollar la Suma de Cuadrados de los factores e Interacciones se deber desarrollar la
siguiente relacin:

Obtenindose los valores, los cuales estn incluidos en la tabla.

Del Cuadro de Analysis of Variance for Y


El que tiene mayor significancia es la concentracin, seguido de la temperatura para un
coeficiente de correlacin del 100%.
En el mismo cuadro notamos el valor del Mean Square del Error (0.0025), el cual viene a ser la
varianza del error, dicho valor es menor que uno por lo cual la variabilidad de los datos es
adecuado para el trabajo realizado.
El clculo de la Suma de Cuadrados del Total se desarrolla mediante la siguiente relacin:

La suma de cuadrados del total nos sirve para comprobar que los valores: suma de cuadrados
de los factores e interacciones, ms el error deben ser igual a dicho valor numrico.
Tal como se visualiza en el presente ejemplo, en donde se asume que el error experimental es
la interaccin por no ser significativo dentro del proceso.
El valor de F de tabla para un 95% de significancia es 161, vemos que el F-Ratio de los factores
principales son mayores por lo tanto ambos factores son significativos, por lo que corroboramos
que los efectos principales estn en su mnimo debiendo ser maximizados y a la vez son
variables en el proceso.
Siendo el modelo matemtico para el presente anlisis:

Del Cuadro Regression coeffs for Y


La constante del modelo matemtico, viene a ser el promedio de los valores del vector respuesta,
as mismo es el valor inicial del proceso en estudio, el signo positivo de la constante nos indica
que est en el mnimo y puede ser maximizado, para llegar hasta el valor ptimo depende del
factor concentracin ya que el valor de la pendiente es mayor que el de la temperatura.
Nota: Anlisis de signos de la constante del modelo matemtico, segn el caso:
a)
(+)
(-)
b)
(+)
(-)

Caso Maximizacin:
Indica que dicho valor es el inicio del proceso y se encuentra en su mnimo y debe ser
maximizado hasta el ptimo.
Indica que es el mximo valor del vector respuesta, no se puede subir sobre dicho valor,
ms al contrario se puede bajar.
Caso Minimizacin
Indica que es el mximo valor del vector respuesta, no se puede subir sobre dicho valor,
ms al contrario se puede bajar.
Indica que dicho valor es el inicio del proceso y se encuentra en su mnimo y debe ser
maximizado hasta el ptimo.

En el modelo matemtico tambin podemos visualizar que la interaccin es negativa, o sea que no
tiene influencia en el proceso. Adems podemos visualizar que los factores principales son
positivos tal como se visualiz en el anlisis de los factores principales.
Interpretacin del modelo matemtico:
Si la concentracin y la temperatura son iguales a cero, entonces el modelo ser igual a la
constante, si visualizamos el signo de dicha constante notamos que es positivo, lo cual nos indica
que est en su mnimo y puede maximizarse. Notamos que la pendiente de la concentracin es
mayor que el de la temperatura, por lo tanto la concentracin es ms significativa que la
temperatura.

El punto ptimo del presente proceso viene establecido por la tendencia de la hiptesis planteada
en un principio, siendo estos que estn en el mnimo debiendo maximizarse, sea que son
variables y su tendencia es subir de nivel y avanzar al mximo, obtenindose un valor ptimo de
41,5 en l vector respuesta.

En el grfico podemos visualizar que no existe interaccin de los factores en el proceso por lo que
cada variable es independiente.
Nota: Es importante que no exista interaccin, y de esa manera podamos trabajar con los factores
principales.
La superficie respuesta nos indica que las pendientes son negativas por lo que visualizando el
grfico (isolineas), podemos interpretar lo siguiente: el valor ptimo de 41,5 est a una
concentracin de 10 y una Temperatura de 70.

La superficie respuesta a nivel espacial nos muestra la forma en que estn ubicados los puntos
experimentales, as mismo la direccin en la cual se orienta el proceso.
Notamos que la zona de mayor recuperacin se ubica a la mxima concentracin y temperatura.

DISEO FACTORIAL 2K CON REPLICA EN TODOS LOS PUNTOS DE DISEO


A modo de ejemplo considere una investigacin llevada a cabo para estudiar el efecto que tienen

la concentracin de un reactivo y la presencia de un catalizador sobre el tiempo de reaccin de un


proceso qumico. Sea la concentracin del reactivo el factor A con dos niveles de inters, 15 y 20
%. El catalizador constituye al factor B; el nivel alto (o superior denota el uso de dos sacos de
catalizador y el nivel bajo (o inferior) denota el uso de solo un saco. El experimento se realiza
(replica o repite) tres veces, y los datos son como sigue:

Otra manera de presentar los datos de este diseo es:

Diseo factorial con variables codificada:

En la Figura 6-1 se presentan grficamente las combinaciones de tratamientos para este diseo.
Por convencin, el efecto de un factor se denota por la letra latina mayscula. De este modo, "A"
se refiere al efecto del factor A, "B" se refiere al efecto del factor B, y "AB" se refiere a la
interaccin AB. En el diseo 22, los niveles bajo y alto de A y B se denotan por -" y "+ ", respectivamente, en los ejes A y B. As, (-) en el eje A representa el nivel bajo de concentracin
(15%), mientras que (+) representa el nivel alto (25%), y (-) en el eje B representa el nivel bajo de
catalizador mientras que (+) denota el nivel alto.
Las cuatro combinaciones de tratamientos en el diseo suelen representarse por letras
minsculas, como se muestra en la Fig. 6-1. En esta figura se aprecia que el nivel superior de
cualquier factor de una combinacin de tratamientos est representado por la presencia de la letra
minscula correspondiente, mientras que la ausencia de esta ltima representa el nivel inferior del
factor. As a representa la combinacin de tratamientos, en la que A se encuentra en el nivel
superior y B en el inferior; b representa aquella en la que A se halla en el nivel inferior y B en el
superior, y ab representa a ambos factores en el nivel superior. Por convencin (1) se usa para
representar a ambos factores en el nivel inferior. Esta notacin se usara a lo largo de toda la serie
2k.
El efecto promedio de un factor se define como el cambio en la respuesta producida por un
cambio en el nivel de ese factor, promediado sobre los niveles del otro factor. Como se ilustra en la
Figura 6-1, las letras minsculos (1), a, b y ab tambin se usan para representar los totales de las

n rplicas de las combinaciones de tratamientos correspondientes. Ahora bien,

El efecto de A en el nivel inferior de B es [a -(1) ]/n, mientras que en el nivel superior de B es [ab
-b]/n.
Tomando el promedio de estas dos cantidades se obtiene

6-1
El efecto promedio de B se determina a partir de su efecto en el nivel inferior de A (esto es [b (1)]/n, y de su efecto en el nivel superior de A (que es igual a [ab a]/n) obtenindose

6-2
El efecto de interaccin AB se define como la diferencia promedio entre el efecto de A en el nivel
superior de B y su efecto en el nivel inferior de B. As,

6-3
Por otro lado se puede definir AB como la diferencia promedio entre el efecto de B en el nivel
superior de A y el efecto de B en el nivel inferior de A. Esto conduce a la misma Ecuacin 6-3.
Las frmulas para los efectos de A, B y AB pueden deducirse por otro mtodo. El efecto de A
puede hallarse como la diferencia en la respuesta promedio de las dos combinaciones de tratamientos en la mitad derecha de la Fig. 6-1 (que llamaremos A+, puesto que es la respuesta promedio para, las combinaciones de tratamientos a las que A se encuentra en el nivel alto) y las dos
combinaciones de tratamientos en la mitad izquierda (o A-). Esto es,

Este es exactamente el mismo resultado que en la Ecuacin 6-1. El efecto de B (Ecuacin 6-2) se
encuentra como la diferencia mire el promedio de las dos combinaciones de tratamientos en la
parte superior del cuadrado ( B+) y el promedio de las dos combinaciones de tratamiento en la
parte inferior ( B-), 0

Finalmente, el efecto de interaccin AB es el promedio de las combinaciones de tratamientos en la


diagonal de derecha a izquierda del cuadrado [ab y (1)] menos el promedio de las combinaciones
de tratamientos en la diagonal de izquierda a derecha (a y b), o

que es una expresin idntica a la Ecuacin 6-3.


Con los datos que aparecen en la Fig. 9-1, las estimaciones de los efectos promedio son

El efecto de A (concentracin de reactivo) es positivo esto sugiere que elevar A del nivel bajo

(15%) al nivel alto (25%) incrementara el rendimiento. El efecto de B (catalizador) es negativo;


esto sugiere que elevarla cantidad de catalizador agregada al proceso reducir el rendimiento. Al
parecer, el efecto de interaccin AB es pequeo comparado con los dos efectos principales.
En muchos experimentos que implican diseos 2 k se examina la magnitud y la direccin de los
efectos de los factores para determinar cules variables es probable que sean importantes. Por lo
general puede emplearse el anlisis de variancia para confirmar esta interpretacin. En el diseo
2k existen algunos mtodos rpidos especiales para realizar los clculos del anlisis de variancia.
Consideremos la suma de cuadrados para A, B y AB. Obsrvese a partir de la Ecuacin 6-1 que
se utiliza un contraste para estimar A; esto es,
6-4
Este contraste suele llamarse efecto total de A. A partir de las ecuaciones 6-2 y 6-3, puede apreciarse que tambin se usan contrastes para estimar B y AB. Adems, estos tres contrastes son
ortogonales. La suma de cuadrados de cualquiera de ellos puede calcularse usando la Ecuacin
3-29. Esta ecuacin establece que la suma de cuadrados de un contraste es igual al contraste elevado al cuadrado entre el producto del nmero de las observaciones de cada total del contraste
por la suma de los cuadrados de los coeficientes del mismo. En consecuencia, se obtiene que las
sumas de cuadrados de A, B y AB son
6-5
6-6
6-7
Con los datos de la Fig. 9-1, las sumas de cuadrados se pueden calcular aplicando las Ecuaciones 6-5, 6-6 y 6-7, obtenindose

6-8

La suma total de cuadrados se determina de la manera usual mediante


6-9
En general SST tiene 4n - 1 grados de libertad. La suma de cuadrados del error, con 4(n - 1)
grados de libertad, se puede calcular en la forma usual, por diferencia mediante
610
Con los datos de la Fig. 6-1 y los resultados de la Ecuacin 6-8 se obtiene

al utilizar SSA, SSB y SSAB de la ecuacin 6-8. En la tabla 6-1 se resume el anlisis de varianza
completo. Con base en los valores P, se concluye que los efectos principales son
estadsticamente significativos al 1% y que no hay interaccin entre estos factores. Esto confirma
la interpretacin de los datos que se hizo originalmente con base en las magnitudes de los efectos
de los factores.

Con frecuencia resulta conveniente escribir las combinaciones de los tratamientos en el orden (1),
a, b, ab. Se hace referencia a esto como el orden estndar (u orden de Yates, por el Dr. Frank
yates). Al utilizar este orden estndar, se observa que los coeficientes de los contrastes usados
para estimar los efectos son

Observe que los coeficientes de los contrastes par estimar el efecto de la interaccin son solo el
producto de los coeficientes correspondientes de los dos efectos principales. El coeficiente de un
contraste es siempre +1 o -1, y puede usarse una tabla de signos positivos y negativos como la
tabla 6-2 para determinar el signo correcto para cada combinacin de tratamientos. Los
encabezados de las columnas de la tabla 6-2 son los efectos principales (A y B), la interaccin AB
e I, que representa el total o promedio del experimento completo. Obsrvese que la columna que
corresponde a I incluye nicamente signos positivos. Las etiquetas de los reglones son las
combinaciones de los tratamientos. Para encontrar el contraste para estimar cualquier efecto,
simplemente se multiplican los signos de la columna apropiada de la tabla por la combinacin de
tratamientos correspondientes y se hace la suma. Por ejemplo, para estima A, el contraste es (1)
+ a b + ab, que concuerda con la ecuacin 6-1.
El modelo de regresin
En el diseo factorial 2k es sencillo expresar los resultados del experimento en trminos de un
modelo de regresin. Puesto que 2k es tan slo un diseo factorial, podra usarse un modelo de
los efectos o del as medias, pero el enfoque del modelo de regresin es mucho ms natural e
intuitivo.

Para el experimento del proceso qumico de la figura 6-1, el modelo de regresin es

Donde x1 es una variable codificada que representa la concentracin del reactivo y x 2 es una
variable codificada que representa la cantidad del catalizador y las son los coeficientes de
regresin. La relacin entre las variables naturales la concentracin del reactivo y la cantidad de
catalizador y las variables codificadas es

Cuando las variables naturales slo tienen dos niveles, esta codificacin producir la familiar
notacin para los niveles de las variables codificadas. Para ilustras esto en el ejemplo, observe
que

Por tanto, si la concentracin est en el nivel alto (Concentracin = 25%), entonces x 1 = +1; si la
concentracin est en el nivel bajo (Concentracin = 15%), entonces x1 = -1. Adems,

Por tanto, si el catalizador estas en el nivel alto (Catalizador = 2 libras), entonces x 2 = +1; si el
catalizador est en el nivel bajo (Catalizador = 1 libra), entonces x2 = -1.
El modelo de regresin ajustado es

DEL ANLISIS DE VARIANCIA


Ahora bien, un efecto o interaccin es significativa si se cumple la siguiente relacin

Donde F,f1,f2, es lo que denomina F de tablas, siendo a el nivel de confiabilidad o significancia


(generalmente al 0.01 0.05). El anlisis de variancia para el ejemplo se muestra en la tabla 6-1
Ahora bien, el valor de F para = 0.01, f 1 =1 y f2=8 es 11.3; cmo podemos observar X 1 y X2 son
significativos, mientras que la interaccin X1X2 no es significativa.
Modelo matemtico
Una vez determinados los efectos, por lo tanto, las influencias que resultan significativas. El siguiente
paso es obtener un modelo matemtico, que represente al proceso investigado, con el diseo factorial a
dos niveles. nicamente podemos estimar modelos matem6ticos lineales de la siguiente forma:
6-12
Para estimar los coeficientes bj, buj, se hace uso de la formula matricial utilizada para la estimacin de
los coeficientes del modelo.
6-13
La propiedad de ortogonalidad de la tabla de indicadores de nivel reduce la dificultad en la estimacin de
los coeficientes del modelo matemtico 13 porque el producto [X]T[X] es igual a una matriz cuyos
elementos de la diagonal es igual al nmero de experimentos (N). As los elementos de la diagonal de la
matriz inversa ([X]T[X])-1 son:
6-14

Como consecuencia, los coeficientes del modelo matemtico son definidos como el producto escalar de
la columna Y por la respectiva columna X1, dividida entre el nmero de experimentos (N) del diseo:
6-15
Otra relacin importante, resulta de comparar las ecuaciones 5.5 con 15 de lo cual resulta:
6-16
Utilizando la ltima relacin procedemos a calcular los coeficientes de modelo lineal

Por lo tanto, el modelo matemtico en escala codificada sin considerar la interaccin X1X2, que

result no significativa, es:


Como se recuerda, definimos un modelo como una representacin matemtica de un proceso o de
algn fenmeno que se investiga. Por lo tanto, el objetivo de hallar un modelo matemtico es predecir
satisfactoriamente el fenmeno estudiado. Es decir, que reemplazando valores de X 1 y X2 en el rango
investigado (-1 a +1), prediga valores similares a los datos observados, lo que puede ser calculado
matricialmente:
6-17
Siendo la matriz [X], la matriz de variables independientes menos la columna X 1X2 que resulto no
significativa y el vector [B] son los coeficientes del modelo matemtico. Siendo Y los valores predichos
por el modelo, llamado tambin Yestimado, o simplemente Yest.

Podemos hacer en este punto un anlisis de residuos, es decir, saber cuan distanciados estn las
predicciones de los valores iniciales mediante la diferencia (Y- Yest.) denotado comnmente como ei.

Con estos elementos podemos calcular la suma de cuadrados de residual del modelo, mediante la
siguiente ecuacin:
18
Donde:
Y = Yest.
Y = Yobservado
Nr = Nmero total de experimentos
I = Numero de parmetros del modelo matemtico.
La diferencia (Nr- I) se denomina grados de libertad del residual, el cual denotaremos como f4.
Aplicando la ecuacin 18 a los datos de la ltima tabla:

Ahora bien, para saber estadsticamente si el modelo matemtico hallado representa adecuadamente a
los datos experimentales mediante el test F.
20
Donde:

= es el nivel de confianza, generalmente del 95% (0.05).


De la tabla de Anlisis de Variancia, SCME = 3.92; por lo tanto Fo ser: Fo= 4.40/3.92 = 1.12
Para un nivel de confianza del 95% (0.05), para 9 y 8 grados de libertad F de tabla es 3.39. Por lo tanto,
el modelo matemtico representa adecuadamente al fenmeno investigado.
Descodificacin del modelo matemtico a escala natural
Es importante decodificar el modelo matemtico hallado a escala natural, especialmente cuando se
desea graficar a travs de un grficador o para aplicar la etapa siguiente de optimizacin (escalamiento).
Se he deducido frmulas para la decodificacin que son las siguientes:
- Para el trmino independiente

- Para el trmino lineal:

- Para el trmino interaccin:

Donde:
Zj
Zj

: Centro del diseo para la variable j (Zmax + Zmin)/2


: Radio del diseo para la variable j (Zmax - Zmin)/2
: Resultado de la divisin de Zj entre Zj

EI modelo matemtico a escala codificado es:


Reemplazando los datos a las formulas anteriores, tenemos
ao = 27.5 - 4.165* (7) -(- 2.5)*(3) = 5.846
a1 = (4.165/2.5) = 1.666
a2 = (-2.510.5) = -5
El modelo matemtico a escala natural es:

Representacin grfica de un modelo lineal


La representacin grfica del modelo matemtico lineal, se puede observar en la matriz de diseo. La
Matriz sealada es un plano en el espacio con pendiente positiva, los mejores resultados se encuentran
cuando el consumo de catalizador es bajo y el consumo de reactivo es alto.

EL DISEO 23
Suponga que se encuentran en estudio tres factores A, B y C, cada uno con dos niveles. Este diseo se
conoce como diseo factorial 23, y las ocho combinaciones de tratamientos pueden representarse
grficamente mediante un cubo, tal como se muestra en la Fig 6-4a. El orden estndar de las
combinaciones de tratamientos seria (1), a, b, ab, c, ac, bc y abc. Se debe recordar que las letras
minsculas tambin representan los totales de la n observaciones recopiladas bajo la combinacin
particular de tratamientos.
Existen en realidad tres notaciones distintas que se usan ampliamente para las corridas o ejecuciones en
el diseo 2k. La primera es la notacin "+, -", a menudo llamada "notacin geomtrica". La segunda
consiste en el uso de letras minsculas para identificar las combinaciones de tratamientos. En la tercera
notacin se utilizan los dgitos 1 y 0 para denotar los niveles alto y bajo del factor, respectivamente, en %
es de los signos + y -. Estas distintas notaciones se ilustran enseguida para el diseo 23

Existen siete grados de libertad entre las ocho combinaciones de tratamientos en el diseo 2 3. Tres de
esos grados de libertad se asocian con los principales efectos de A, B y C. Cuatro se asocian con
interacciones (AB, AC, BC y ABC), uno para cada una.
Consideremos que se estiman los efectos principales, primeramente el de A. El efecto de A cuando B y C
estn en el nivel bajo es [a - (1)]/n. De modo similar, el efecto de A cuando B est en el nivel alto y C en el
bajo es [ab - b]/n. El efecto de A cuando C est en el nivel alto

y B en el bajo es [ac - c]/n. Por ltimo, el efecto de A cuando B y C estn ambos en el nivel alto es [abcbc]/n. De este modo, el efecto promedio de A es simplemente el promedio de estos cuatro efectos, o sea.

Esta ecuacin tambin puede deducirse como un contraste entre las cuatro combinaciones de
tratamientos en la cara derecha del cubo de la Fig. 9-4a (donde A se halla en el nivel alto) y las cuatro de
la izquierda (donde A se encuentra en el nivel bajo). Es decir, el efecto de A es simplemente el promedio
de las cuatro corridas en que A se encuentra en el nivel alto A+ menos el promedio de las cuatro corridas
en que A esta en el nivel bajo A- , o

Esta ecuacin puede agruparse como sigue

que es idntica a la ecuacin 1


En forma similar, el efecto de B es un contraste entre las cuatro combinaciones de tratamientos de la
cara anterior del cubo y las de la cara posterior. Esto conduce a

El efecto de C es un contraste entre las cuatro combinaciones de tratamientos en la cara superior del
cubo y las de la cara inferior; esto es

Los efectos de la interaccin de dos factores pueden calcularse fcilmente. Una media de la interaccin
AB es la diferencia entre los efectos promedio de A a los dos niveles de B. Por convencin, la mitad de
esta diferencia se denomina interaccin AB. En trminos matemticos,

Dado que la interaccin AB es la mitad de esta diferencia,

Podramos expresar la Ecuacin 9-14 como sigue:

De esta forma es fcil ver que la interaccin AB es la diferencia de promedios entre corridas en dos
planos diagonales del cubo de la Fig. 9-4. Aplicando un razonamiento similar y haciendo referencia a la
Fig. 9-4b, las interacciones AC y BC son

La interaccin ABC se define como la diferencia promedio entre la interaccin AB para dos niveles
distintos de C. De este modo,

Como antes, la interaccin ABC puede considerarse la diferencia de dos promedios. Si las corridas de
los dos promedios se aslan, definen los vrtices de los dos tetraedros que comprenden el cubo de la Fig.
9-4c.
En las Ecuaciones 1 al 7, las cantidades entre parntesis son contrastes entre las combinaciones de
tratamientos. En la Tabla 9-3 aparece una tabla de signos positivos y negativos desarrollada a partir de

las constantes de los contrastes. Los signos de los efectos principales se determinan asignando un signo
positivo con el nivel superior y uno negativo con el inferior. Una vez que se han establecido estos signos,
los de las columnas restantes pueden obtenerse multiplicando rengln por rengln las columnas
apropiadas que le preceden. Por ejemplo, los signos de la columna AB corresponden al producto de los
signos de las columnas A y B en cada uno de los renglones. Fcilmente se puede determinan el
contraste de cualquier efecto a partir de esta tabla.
La Tabla 9-3 tiene algunas propiedades interesantes.
1) Excepto por la columna cada columna tiene un nmero igual de signos positivos v negativos.
2) La suma de los productos de los signos de cualquier par de columnas siempre es cero.
3) El producto de la columna por cualquier otra columna dela a dicha columna sin cambios. En otras
palabras, es el elemento de identidad.
4) El producto de cualquier par de columnas produce otra columna que pertenece a la tabla. Por
ejemplo, A x B = AB, y
Es posible apreciar que los exponentes de los productos se forman usando aritmtica. mdulo 2
(el exponente solo puede ser cero o uno; si es mayor que uno se reduce mediante mltiplos de
dos hasta que sea cero o uno). Todas estas propiedades son consecuencia de la ortogonalidad
de los contrastes usados para estimar los efectos.
Fcilmente se puede determinar las sumas de cuadrados de los efectos, porque a cada una le
corresponde un contraste de un solo grado de libertad. En el diseo 2 3 con n replicas, la suma de
cuadrados de cualquier efecto es

Ejemplo N 1
Un ingeniero est interesado en el efecto que tiene la rapidez de corte X 1, la configuracin X2 y el
ngulo de corte X3 sobre la duracin de una herramienta. Se eligen dos niveles de cada factor y
se realiza un diseo 23 con tres replicas. Los resultados se muestran a continuacin. Analice los
datos de este experimento.

a) Estime los efectos de los factores. Cules de esos efectos resultan ser mayores?

b) Utilice el anlisis de variancia a fin de confirmar sus conclusiones para en caso (a).
c) Analice el modelo matemtico obtenido.
d) Cules de los niveles de X1, X2 y X3 recomendara el lector?
Solucin.
La matriz de variables independientes se muestra en la siguiente tabla. Como se mencion
anteriormente, la formula matricial ecuacin 7 es muy cmodo para hallar los efectos y ayuda
al anlisis de variancia. La parte inferior de la tabla muestra el producto de la matriz [X] T[Y]
seguidamente el efecto a cada variable correspondiente a la columna indicada. Los efectos de
las variables e interacciones estn divididas entre 12 ((N/2)r =(8/2)*3 = 12).

La suma de cuadrados de los efectos a interacciones est definida por la ecuacin 9.


Observando que el vector del producto [X] T[Y], elevado al cuadrado y dividido
La suma de cuadrados de los efectos e interacciones, o llamado de tratamientos, es

La suma de cuadrados de los efectos e interacciones, o llamado de tratamientos, es:


SSEfectos = 0.667+770.7+280.2+16.67+468.2+48.17+28.17= 1612.8
Por lo tanto, la suma de cuadrados del error ser:
SSError = 2096 - 1612.8 = 483.2
La tabla siguiente resume el anlisis de variancia:

El valor de F es tabulado pare un nivel de significancia del 99% y para f 1=1 y f2=16 tenemos:
Por lo tanto podemos hacer las siguientes conclusiones:
a) La variable X2 (la configuracin) y X 3 (ngulo de corte) resultaron significativas al 1 % por lo
que la variacin del rival inferior al rival superior elevan significativamente en la duracin
de la herramienta, especialmente la configuracin de corte (X 2).
b) La interaccin es X 1X3 tambin resultaron significativas. En esta parte es importante notar
que la variable X1 (rapidez de corte) por s misma no es significativa pero solo es
conjuntamente con X3; esto significa que la rapidez de corte si es significativo y que
depende de ngulo de corte. Como en el problema se analiza la duracin de la herramienta
de corte, aparentemente la rapidez de corte no le afecta individualmente, pero si se cambia
de ngulo de corte la herramienta en mencin podra fallar y disminuir su duracin.

Tabla de anlisis de residuales

Aplicando la ecuacin 18, calculamos la suma de cuadrados de residuales

La suma de cuadrado medio del error es 30.3 con 16 grados de libertad. As el valor de F o es:
Comparando Fo, con el F de tabla a un nivel de significancia de 0.05, 19 y 16 grados de libertad,
respectivamente, (Ftabla = 2.28). Lo que significa que el modelo matemtico hallado ajusta o
representa adecuadamente al fenmeno.
Para poder visualizar el modelo matemtico, procedemos a hacer un corte pare X 2 = 0,
obteniendo

Como puede observarse en la figura 1, el termino interaccin le da cierta curvatura al modelo,


por lo que, un modelo en el cual el trmino interaccin est presente se le puede considerar
como un modelo matemtico de segundo orden,

Fig. 1 Representacin grfica de un modelo lineal con interaccin

SESIN XI

DISEO FACTORIAL 2K CON REPLICA EN EL PUNTO CENTRAL DEL DISEO.


Como sabemos, en el diseo factorial a dos niveles, asume que la relacin entre las variables y la
respuesta es representada por un modelo matemtico lineal. De ser cierta dicha linealidad, el modelo
debe predecir adecuadamente todos los puntos del diseo, inclusive el punto central del diseo. Por
supuesto, es innecesaria la linealidad perfecta y el sistema 2 k funcionara bastante bien incluso cuando la
suposicin de linealidad se cumple solo de manera aproximada. De no ser cierta esta hiptesis, es decir
que no prediga adecuadamente, especialmente el punto central del diseo, podemos afirmar que el
modelo matemtico lineal no es suficiente para explicar las respuestas en dicha regin experimental y
podemos asumir una posible existencia de curvatura. Para ello la adicin de pruebas en el punto central
del diseo nos sirve para dar una estimacin promediada del efecto curvatura.
El clculo de los efectos e interacciones es el mismo que en el aplicado en la seccin 5.1 (diseo
factorial 2k con replica en todos los puntos del diseo, siendo r=1) excepto para el clculo de la suma
de cuadrados del error (SSE), el cual est definido por:

21
Donde:
SSE = Suma de cuadrados del error
Yo = Replicas en el punto central del diseo
no = Numero de rplicas en el centro del diseo.
Y = Promedio de todas las rplicas.
La suma de cuadrados para la curvatura este dada por:
22
Donde:
Yo = Promedio de los puntos exteriores del diseo
Ejemplo 1
Un ingeniero qumico se encuentra estudiando el rendimiento de un proceso. Existen dos variables de
inters, tiempo y temperatura de reaccin. Debido a que tiene duda de la suposicin de la linealidad en
la regin que explore, ella decide realizar un diseo 2 2 (con una Sola replica en cada corrida)
aumentada con cinco puntos centrales. El diseo y los datos de rendimiento se muestran en figura 2.

Fig. 2
En la matriz de variables independientes que se muestra en la siguiente tabla, ntese que los puntos
replicados en el centro del diseo no entran en el clculo de los efectos e interacciones, pero si para
hallar la suma de cuadrados del error.

Segn la ecuacin 21, calculamos la suma de cuadrados del error:

Tabla de Anlisis de Variancia.

A un nivel de significancia de 0.05, 1 y 4 grados de libertad, respectivamente, el valor de F=7.71. Por lo


tanto, El tiempo y la temperatura afectan beneficiosamente la recuperacin del proceso qumico;
mientras la interaccin entre las variables es muy poco significativo, como lo es tambin la curvatura,
indicando que la evidencia de curvatura en la respuesta de la regin explorada es nula.
Modelo Matemtico.

A un nivel de significancia de 0.05, (95% de confianza) 1 y 4 grados de libertad, respectivamente, el


valor de F = 7.71. Por lo tanto, el modelo lineal hallado representa o ajusta adecuadamente a los datos
experimentales.
Grfica del modelo matemtico
Utilizando las frmulas de decodificacin del problema anterior, el modelo matemtico decodificado es:

La grfica del modelo puede observarse en la figura 3.

Fig. 3

SESION XII
DISEO FACCTORIAL FRACCIONADO
Los diseos factoriales simples requieren cantidades excesivas de tiempo, material, conviene encontrar
otros diseos que requieran menores pruebas de diseo, pero que no desdear una gran cantidad de
informacin sobre la naturaleza del vector respuesta que se expresa con los experimentos.
Los diseos factoriales fraccionados permiten lograr este objetivo. Si se est dispuesto a conformarse con
una investigacin algo menos completa, incluyendo los efectos principales y las interacciones de dos
factores y excluyendo los efectos de tres factores o interacciones de alto orden.
Los diseos factoriales fraccionadas se usan principalmente para la depuracin o seleccin, es decir, para
identificar la variable ms importante que influye en la respuesta.
En cualquier diseo que utilice menos pruebas de los que requiera uno de tipo factorial completo, se
tendrn los mismos efectos de confusin.
Por ejemplo, un efecto principal se puede confundir con uno o ms efectos de interaccin de alto orden,
esto es, la estadstica que mide un ejemplo principal puede ser igual a la estadstica que determina
algunos de los efectos de las interacciones. Por lo tanto, la estadstica en cuestin puede indicar que
existe algn efecto, pero no sealar si est presente el efecto principal, el de interaccin o alguna
combinacin aditiva de efectos.
Todos los diseos, proporcionan estimaciones confusas. Por ejemplo, si los efectos cuadrticos y cbicos,
se confunden las estimaciones de la media y los efectos principales, respectivamente, siempre que no
emplee un diseo factorial de dos niveles, las tendencias y otros efectos confunden las estimaciones.
Cualquier fenmeno emitido en un modelo ajustado confunde ciertos parmetros estimados en el modelo,
sea cual fuere el tipo de diseo empleado. Los buenos diseos factoriales fraccionadas se arreglan
cuidadosamente de tal manera que la estimacin de los efectos que se piensa es importantes, se
confunden por accin de los efectos que se consideran no importantes.
DISEO FACTORIAL 2 k-P
Este tipo de diseo es uno de los ms tiles desde el punto de vista prctico, pues permite obtener una
informacin de varios factores o variables a la vez, realizando un mnimo de experiencias (fraccionando
un diseo factorial completo). Es particularmente til cuando:
a)

Se tiene poca materia prima para realizar las experiencias o cuando estas son costosas, lo cual
obliga a realizar pocas pruebas experimentales.
b)
Se requiere informacin rpida.
c)
Existe escasez de recursos humanos y materiales.
Un diseo factorial fraccionada est definido por:
2k-P
Donde:
k: Es el nmero de factores a estudiar.
p: Es el nmero de factores a confundir.
De esta manera es posible estudiar por ejemplo el efecto de cuatro o ms factores, realizando un mnimo
de ocho experiencias. Para esto se requiere que algunas de las interacciones de orden superior sean
nulas o despreciables.

MEDIA FRACCIN DEL DISEO 2k-p


Se estudia a partir de k=3 factores en dos niveles cada uno, para lo cual utilizaremos un diseo factorial
fraccionado del tipo (1/2)n2k, donde n es la cantidad que debe disminuirse la fraccin. Mediante esta
ecuacin se puede generar factoriales de , 1/8, 1/16 etc.
Ejemplo 5: se desea evaluar un diseo 2 3=8 pero queremos una media fraccin, por lo tanto tendremos
(1/2)123=4 combinaciones de tratamiento.

Notase que el diseo 23-1 se forma al seleccionar slo las combinaciones de tratamiento que producen la
multiplicacin de signos, donde C=AB.
Es posible construir la combinacin de tratamientos del diseo 2 k-1 completo igualando el factor C por la
interaccin AB, de amplia aplicacin cuando los efectos principales son negativos pero tienen una gran
influencia en el proceso.

Ecuacin Generatriz (I= X1X2X3)


En un diseo 23 = 8 experiencias, existe una interaccin de tercer orden, X 1X2X3 que puede considerarse
nula o despreciable y lo cual puede ser utilizado para examinar otro factor como X 4, igualando X4 a X1X2X3
(lo que puede hacerse como X4 =+/- X1X2X3). Si se tiene conocimiento previo de la no existencia de
interacciones entre los factores X1 X2 se puede suponer, por ejemplo, que la interaccin X 1X2 es nula o
despreciable y puede utilizarse para estimar el efecto de un quinto factor X5, igualando X5 = +/- (X1X2) y
as sucesivamente.
De este modo un diseo factorial fraccional con ocho observaciones puede ser til para:
Estimar los efectos de tres factores y todas las interacciones entre ellos (diseo 23 completo).
Estimar los efectos de cuatro factores y tres interacciones de segundo orden, todas las restantes
se consideran nulas o despreciables.
c)
Estimar los efectos de cinco factores y 2 interacciones de segundo orden, todas las restantes se
consideran nulas o despreciables.
d)
Estimar los efectos de seis factores y una interaccin de segundo orden, todos las restantes se
consideran nulas o despreciables.
e)
Estimar los efectos de los siete factores, todas las interacciones se consideran nulas o
despreciables.
a)
b)

Ley de Multiplicacin de Factores


Para dos efectos principales X1 y X2 la interaccin es denotada por X1X2 , para las interacciones X1X2 X3X4
la interaccin entre ellos se denota por : X1X2X3X4. Pero dos interacciones con un elemento comn, por
ejemplo X1X2X3 Y X3X4X5 su producto es X1X2X32X4X5 = X1X2X4X5, esto deja implcito que el cuadrado de
cualquier efecto es igual a la unidad (tal como X12= X22 = =1).
Sistema para un diseo factorial fraccionado

Supongamos que queremos buscar una aproximacin lineal, para una pequea rea de una superficie
respuesta con cuatro variables independientes.

Un diseo factorial con ocho observaciones puede ser suficiente (por ejemplo un diseo 2 3). Como
mencionamos arriba, podemos asumir que la interaccin de tercer orden X 1X2X3 es aproximadamente
igual a cero o despreciable, e igualando a un cuarto factor o variable obtenemos:
X 4 = X 1 X 2X 3
El cual es conocido como relacin de generacin ver tabla

Matriz para un diseo factorial fraccionado


Aplicando la ley de multiplicacin de factores, multiplicando ambos lados de la relacin de generacin por
X. obtenemos:

La ltima relacin es conocida como contraste de definicin.


Seguidamente, para ver cul es lo que estamos midiendo y que efectos estamos perdiendo, se construye
una tabla denominada Tabla de aliases, esto es, multiplicando la definicin de contraste con la
combinacin de factores del diseo base (23), como puede observarse en la tabla. Por ejemplo:

Los parmetros del modelo matemtico estn definidos como:

En la prctica las interacciones de tercer orden son aproximadamente iguales a cero, ms frecuentes que
las interacciones de segundo orden.
La interpretacin que puede deducirse es la siguiente: si estimamos el coeficiente b1 lo que realmente
vemos es la suma de 1 y 234, es decir que se encuentran confundidos. Pero, como mencionamos
anteriormente, que las interacciones de tercer orden son aproximadamente cero, lo que obtenemos es un
buen estimado de los trminos lineales del modelo matemtico, mas no as de los trminos con
interaccin, que estn confundidos.
Por lo tanto, la relacin de generacin escogida (X 4 = X1X2X3) es apropiada para la estimacin de efectos
principales o trminos lineales del modelo matemtico.
Si seleccionamos ahora una nueva relacin de generacin:
X4 = X1X2
Aplicando la ley de multiplicacin de factores, obtenemos la definicin de contraste:

La tabla muestra la matriz de diseo factorial fraccionada para este caso.


La tabla de aliases se muestra en la tabla siguiente, se obtiene multiplicando la definicin de contraste por
la columna correspondiente al diseo base.

Los parmetros del modelo matemtico estn definidos como:

Interpretacin: Utilizando la relacin de generacin (X4 = X1X2), obtenemos es un buen estimado de los
coeficientes de los trminos de interaccin doble del modelo matemtico, lo que puede utilizarse si el
inters es investigar las interacciones dobles entre las variables.
Existen numerosas alternativas para el fraccionamiento de un diseo. La tabla (*) resume las distintas
posibilidades de investigar ms de 3 variables, tomando diferentes combinaciones de definicin de
contrataste, utilizando la siguiente notacin:

N
de
Observaci
ones

N
de
Factores

Fraccin del
diseo
Factorial

Relacin
Generacin

Completo

--

Todos los efectos principales e interacciones se obtienen


en forma independiente.

1/2

Igualar C con
-AB

Completo

--

Todos los efectos principales estn confundidos con


interacciones de segundo orden, dan efectos principales
cuando todas las interacciones se suponen
despreciables.
Todos los efectos principales e interacciones se obtienen
en forma independiente.

D = ABC

Todos los efectos principales se obtienen en forma


independiente de las interacciones de segundo orden.
Las restantes interacciones de segundo orden son
confundidas unas a otras, dan efectos principales y las
interacciones de segundo orden. Las restantes
interacciones se suponen despreciables.

1/4

Igualar D=ABC
y E=-BC

Completo

--

Todos los efectos principales estn confundidos con


interacciones de segundo. Las restantes interacciones
de segundo orden estn confundidas unas con otras;
dan efectos principales y las interacciones de segundo
orden. Las restantes interacciones se suponen
despreciables.
Todos los efectos principales e interacciones se obtienen
en forma independiente.

Igualar E=ABC
y
F=BCD

1/8

16

de

Igualar E= ABC
y F=BCD y
G=ABD

Confundido de Efectos principales e Interaccin de


segundo Orden

Todos los efectos principales se obtienen en forma


independiente de las interacciones de segundo orden,
pero las interacciones de segundo orden estn
confundidas unas a otras; dan todos los efectos y a lo
ms siete (no siempre siete) interacciones de segundo
orden. Todas las otras interacciones se consideran
despreciables.
Todos los efectos principales se obtienen en forma
independiente de las interacciones de segundo orden,
pero las interacciones de segundo orden estn
confundidas unas a otras; dan todo los efectos
principales y a lo ms siete (no siempre siete)
interacciones de segundo orden. Todas las otras
interacciones
se
suponen
despreciables
satisfactoriamente si las nicas interacciones de
segundo orden entre cuatro de los factores.

Tabla Fraccionamiento de diseos Factoriales (*)


EJEMPLO

En la primera etapa de optimizacin se investiga la influencia de cuatro factores, tiempo de molienda, pH,
dosificacin del colector y espumante en la recuperacin de cobre en un proceso de flotacin de un
mineral sulfurado de cobre. La tabla siguiente muestra, los niveles a considerar durante el experimento,
para cada uno de los factores.

Como colector se us Z-200 y como espumante Dowfroth-200.


Podemos estudiar cuatro variables (k=4) utilizando 8 pruebas experimentales, es decir, que podemos
fraccionar para p=1:
Como mencionamos anteriormente, podemos elegir como relacin de generacin a: X 4=X1X2X3 si nuestro
inters fundamental es investigar el efecto de cada una de las variables independientemente.
La programacin de las pruebas experimentales y las respuestas pare el diseo factorial fraccionado se
muestra en la tabla 1

Tabla 1 Programacin de pruebas para un diseo fraccionado


La matriz de variables independientes se muestra en la tabla 6.7.

Tabla 2. Matriz de variables independientes D.F.F.


Los clculos para hallar los efectos principales e interacciones de las variables son los mismos que se
usan para el anlisis de un diseo factorial completo.
Calculo de Efectos

F de tabla para un nivel de significancia de 0.01 y para 1 y 2 grados de libertad es 98.5. Por lo tanto, las
variables en forma independiente, tempo de molienda y dosificacin de colector son significativas,
mientras que el pH y la adicin de espumante resultaron insignificantes
Modelo Matemtico
Yest. = 87.65 + 1.6 X1 - 1.75 X3
Reemplazando los valores codificadas de X1 y X2 en el modelo matemtico obtenemos valores
estimados (Yest.). Luego podemos hacer un anlisis de residuales

Aplicando la ecuacin, calculamos la suma de cuadrados de residuales:

SCMR= 0.748
La suma del cuadrado medio del error as 0.04 con 2 grados de libertad. As el valor de Fo es:
Fo = 0.748 / 0.04 = 18.7
Comparando Fo con el F de tabla a un nivel de significancia de 0.05 y para 4 y 2 grados de libertad,
respectivamente, (Ftabla = 19.30). Este valor es mayor que F de tabla, por lo tanto el modelo matemtico
hallado ajusta o representa adecuadamente al fenmeno.
Como ya se analiz, las variables principales X1 y X3 son significativas. Ahora analicemos que factores
estn confundidos y que es lo que estamos midiendo:

Como mencionamos anteriormente, en la prctica los trminos de interaccin de tercer orden son iguales
a cero, por lo que tendremos un buen estimado de las variables o factores principales X1 y X3, as decir:
Grafica del modelo matemtico:
Utilizando las frmulas de decodificacin del captulo anterior, el modelo matemtico a escala natural es:
YEST = 85.967 + 1.067 Z1 - 35 Z3
La representacin grfica del modelo matemtico se puede observar en le figura 3

Figura 3 Representacin grafico del ejemplo


Ejemplo diseo Factorial 23
Un ingeniero est interesado en el efecto que tienen la rapidez de corte X 1, la configuracin X2 y el
ngulo de corte X3 sobre la duracin de una herramienta. Se eligen dos niveles de cada factor y se
realiza un diseo 23 con tres replicas. Los resultados se muestran a continuacin. Analice los datos
de este experimento.

a) Estime los efectos de los factores. Cules de esos efectos resultan ser mayores?
b) Utilice el anlisis de variancia a fin de confirmar sus conclusiones.
c) Analice el modelo matemtico obtenido.
d) Cules de los niveles de X1, X2 y X3 recomendara el lector?
Solucin.
La matriz de variables independientes se muestra en la siguiente tabla. Como se mencion
anteriormente, la formula matricial ecuacin 7 es muy cmodo para hallar los efectos y ayuda al anlisis
de variancia. La parte inferior de la tabla muestra el producto de la matriz [X] T[Y] seguidamente el efecto
a cada variable correspondiente a la columna indicada. Los efectos de las variables e interacciones
estn divididas entre 12 ((N/2)r =(814)*3 = 12).

La suma de cuadrados de los efectos a interacciones est definida por la ecuacin 9. Observando que
el vector del producto [X]T[Y], elevado al cuadrado y dividido
La suma de cuadrados de los efectos e interacciones, o llamado de tratamientos, es

La suma de cuadrados de los efectos e interacciones, o llamado de tratamientos, es:


SSEfectos = 0.667+770.7+280.2+16.67+468.2+48.17+28.17= 1612.8
Por lo tanto, la suma de cuadrados del error ser:
SSError = 2096 - 1612.8 = 483.2
La tabla siguiente resume el anlisis de variancia:

El valor de F es tabulado para un nivel de significancia del 99% y para f 1=1 y f2=16 tenemos:
Por lo tanto podemos hacer las siguientes conclusiones:
a) La variable X2 (la configuracin) y X 3 (ngulo de corte) resultaron significativas al 1 % por lo que la
variacin del rival inferior al rival superior elevan significativamente en la duracin de la
herramienta, especialmente la configuracin de corte (X2).

b) La interaccin es X1X3 tambin resultaron significativas. En esta parte es importante notar que la
variable X1 (rapidez de corte) por si misma no es significativa pero solo es conjuntamente con X 3;
esto significa que la rapidez de corte si es significativo y que depende de ngulo de corte. Como en
el problema se analiza la duracin de la herramienta de corte, aparentemente la rapidez de corte no
le afecta individualmente, pero si se cambia de ngulo de corte la herramienta en mencin podra
fallar y disminuir su duracin.

Tabla de anlisis de residuales

Aplicando la ecuacin 18, calculamos la suma de cuadrados de residuales

La suma de cuadrado medio del error es 30.3 con 16 grados de libertad. As el valor de F o es:

Comparando F, con el F de tabla a un nivel de significanca de 0.05, 19 y 16 grados de libertad,


respectivamente, (Ftabla = 2.28). Lo que significa que el modelo matemtico hallado ajusta o representa
adecuadamente al fenmeno.
Para poder visualizar el modelo matemtico, procedemos a hacer un corte para X2 = 0, obteniendo

Como puede observarse en la figura 1, el termino interaccin le da cierta curvatura al modelo, por lo
que, un modelo en el cual el trmino interaccin esta presente se le puede considerar como un modelo
matemtico de segundo orden,

Fig. 1 Representacin grfica de un modelo lineal con interaccin

SESION 13
DISEO PLACKETT Y BURMAN
Este es un tipo de diseo de experimentos muy importante, desafortunadamente hay solamente pocas
referencias de aplicacin prctica en procesamiento de minerales y en metalurgia. Esto se debe
probablemente a que los Ingenieros no han reconocido todava la verdadera utilidad de este diseo,
especialmente en la etapa de Screening, para la determinacin de las variables ms importantes que
afectan la respuesta o respuestas de un proceso bajo estudio.
El diseo Plackett y Burman es un tipo especial del diseo factorial fraccionado, donde se puede construir
diseos apropiados para el estudio de k variables en N pruebas experimentales, donde N>k. Como
pueden estudiarse con N experimentos hasta N-1 variables, la diferencia se asigna a variables
denominadas ficticias (no representan a ninguna variable experimental), cuya utilidad bsica es la
determinacin de la variancia del error experimental, como veremos ms adelante. Por esta razn es
conveniente que se apliquen o empleen al menos 02 variables ficticias.
Existen modelos para 8, 12, 16, 20, 24,...100 en mltiplos de 4. Las experiencias de estos arreglos se
definen en la primera fila y a partir de estos se construye el conjunto de arreglos experimentales, rotando
en forma cclica cada columna anterior.
Por ejemplo para k=4, el nmero de pruebas es 8, como se muestra en la matriz de diseo de la tabla 6.8
Podemos escoger arbitrariamente que las variables a investigar son X1, X2, X4, X7 y las variables
ficticias pueden ser X3, X5, X6. La ltima fila (8) se completa con (-).
La primera fila de arreglos para otros diseos es:
N=8 :+++-+--

Por ejemplo, supongamos que deseamos investigar 8 variables, segn lo anterior tendramos que elegir 12
pruebas experimentales y designar 3 variables ficticias para evaluar el error experimental, como se

muestra en la tabla.

Matriz de diseo P&B k=4

Matriz de diseo P& B. Para k = 8


De la misma manera que los diseos factoriales, la matriz del diseo cumple las mismas propiedades:
Estimacin de efectos y anlisis de variancia
De igual manera que los diseos factoriales, en los diseos plackett y Burman el clculo de los efectos
viene definido por:

Para la estimacin de la suma de cuadrados del error del sistema se emplean las variables ficticias. Para
ello, se hace una estimacin de sus efectos, los cuales en teora deben ser nulos; de no ser as, es de
suponer que su valor se debe puramente al error experimental. La suma de cuadrados del error est
dado por la siguiente ecuacin:
Donde:
Ef: Son los efectos mostrados por las variables ficticias la suma de cuadrados medios est definida por:

Donde:
nf = Numero de variables ficticias.
Modelo Matemtico
Con un modelo P&B se puede estimar modelos de primer orden, solamente para los trminos lineales,
mas no para evaluar interacciones entre las variables. Como todo diseo de primer orden, la evaluacin
de los coeficientes del modelo sigue el mismo procedimiento. El siguiente modelo podr ser estimado
para un diseo P&B.

La matriz de correlacin (XTX)-1 en este diseo tiene la siguiente forma.

Como consecuencia, los coeficientes bj vienen definidos por:

Cabe sealar que solamente formaran parte del modelo matemtico final los coeficientes que resulten
significativas al proceso bajo estudio. La validez del modelo se prueba siguiendo el mismo mtodo del
diseo factorial.
Ejemplo del diseo Plackett y Burman
En el estudio de la separacin de Cu-Mo por flotacin de un concentrado bulk se parte de las siguientes
premisas:

Investigo el efecto del NaHS como depresor del Cu (CuFeS 2), la influencia de esta variable se
estima en trminos de estabilidad de HS-, por lo cual fue necesario controlar el potencial redox,
segn el diagrama Eh-pH.

Asimismo, se evalu el uso del N 2 como gas de flotacin, no solo porque reduce el consumo de
NaHS sino tambin, para averiguar si tena algn efecto en la eficiencia de separacin.

Adems se evalu otras dos variables tpicas de la flotacin como son el tiempo de
acondicionamiento y el tiempo de flotacin.
Antes de realizar la experimentacin se defini la funcin objetivo o lo que es lo mismo, el criterio o los
criterios de optimizacin; en este caso se consider tres:
a) Eficiencia de separacin.
b) Eficiencia de concentracin.
c) consumo de NaHS.
Los niveles para [as variables consideradas, incorporando dos variables ficticias en el estudio, se
muestran en la tabla siguiente:

Una vez definido, los niveles para cada factor, y considerando dos variables ficticias, se procedi a
efectuar las pruebas; para cada prueba se midi los tres criterios de optimizacin como se muestra en la
tabla siguiente:

Y 1 = Eficiencia de separacin
Y2 = Eficiencia de concentracin de MoS2
Y 3 = Consumo de NAHS.
a)

Caso N 1: Criterio de optimizacin es la eficiencia de separacin (Y1) Calculo de Efectos

Nota: El factor ms importante en la primera evaluacin es el potencial redox, como puede observarse al
pasar de un valor inferior de (-400 v) a un valor superior de (- 200 v), la eficiencia de separacin disminuye
en 49.48%. Esto puede interpretarse de una manera opuesta, o sea que, al pasar de un nivel inferior de
(-200v) a otro superior de (-400 v) la eficiencia de separacin aumenta en 49.48%. Por consiguiente,
podemos afirmar que valores ms negativos del potencial redox mejoran la eficiencia de separacin.

Para un nivel de significancia de 99% y para 1 y 2 grados de libertad, respectivamente, F de tabla es


98.50. Como podemos observar, para el nivel de significancia indicado solamente el potencial redox es
significativo. Considerando ahora un nivel de significancia menor (97.5%) F de tabla, para este caso es
38.51, consiguientemente el potencial redox, adicin de carbn activado y el tiempo de flotacin, resultaron
significativos.
Modelo Matemtico
Yest = 36.34 - 24.74 X1 + 8.64 X2 + 9.59 X5

F = 53.81/11.14=4.82
Para un nivel de significancia del 95% el valor de F de tabla es 18.5, y esta es mayor que 4.82. Por lo
tanto, el modelo matemtico ajusta o representa adecuadamente a los datos experimentales.
Grafica del modelo matemtico
El modelo matemtico obtenido anteriormente es:
Yest = 36.34 - 24.74 X1 + 8.64 X2 + 9.59 X5
Como puede observarse, hay en total 4 variables, para poder visualizar necesitamos hacer cortes en uno
de los ejes
Para X5= 0: Yest = 36.34 - 24.74 X, + 8.64 X 2 (1)
Para X2= 0: Yest = 36.34 - 24.74 X, + 9.59 X 5 (2)
Para X1= 0: Yest = 36.34 - 8.64 X1 + 9.59 X5 (3)
Para (1) el modelo matemtico decodificado es:
YEST = -46.52 -0.247 Z 1 + 8.64 Z2
La representacin grfica puede apreciarse en la figura 6.2.
Para (2) el modelo matemtico decodificado es:
YEST = -66.65 -0.247 Z1 + 3.836 Z5
La representacin grfica puede apreciarse en la figura 6.3.
Para (3) el modelo matemtico decodificado es:
YEST = -1.07 + 8.64 Z2 + 3.836 Z5
La representacin grfica puede apreciarse en la figura 6.4

Figura 6.2: Representacin grfica de/ modelo matemtico para X5=0

Figura 6.3: Representacin grfica para el modelo matemtico para X2=0

b)

6.4 Representacin grfica del modelo matemtico para X1=0


CASO N2: Criterio de optimizacin es la eficiencia de concentracin de MoS 2 Clculo de
Efectos

Anlisis de variancia
SSError = (-1.44)2 + (1.11)2 = 3.32
SSM = 3.32/2 = 1.66

A un nivel de significancia de 97.5% y para 1 y 2 grados de libertad el F de tabla es 38.51, por lo cual
el potencial redox, adicin de carbn activado y tiempo de flotaci6n, son significativas.
Modelo matemtico
Yest = 6.63 - 5.77 X, + 3.65 X 2 + 3.70 X 5

SSR = (0.67)2+ + (0.08) 2 = 21.77


MSR=21.77/4=5.44
F= 5.44/1.66=3.28
F de tabla para un nivel del 95% y 4 y 2 grados de libertad, respectivamente es 18.5, por tanto 3.28 es
menor que 18.5 y por lo cual, el modelo matemtico estimado ajusta o representa adecuadamente a los
datos experimentales.
c)

CASO N3: Criterio de optimizacin es el consumo de NaHS Clculo de Efectos

Anlisis de variancia
SSERROR= (2.35) 2 + (-0.40) 2 = 5.68
SSM =5.68 / 2 = 2.84

A un nivel de significancia de 97.5% y Para 1 y 2 grados de libertad el F de tabla es 38.51, por lo cual
ninguna de las variables es significativa. Por lo tanto, no podemos estimar un modelo matemtico que sea
vlido para el estudio.
Pero algo importante, que debemos observar es que el use de nitrgeno como gas disminuye el consumo
de NaHS en 6.40 lb/tn siendo esencial en la reduccin de costos del proceso.

Conclusin
En las tres corridas experimentales un factor importante es el potencial redox, que en valores ms
negativos a 400 mv es beneficiosa para la eficiencia de separacin, as como para la eficiencia de
concentracin del MoS2, siendo su efecto en el consumo de NaHS de regular importancia. Otra
conclusin, es que el uso del gas nitrgeno es beneficioso porque reduce el consumo de NaHS y esto
puede redundar en mejoras econmicas para el proceso.
Ejemplo: Plackett y Burman
Tostacin- Segregacin para la recuperacin de cobre proveniente de residuos de gas de
chimenea en la fundicin de cobre
El estudio consiste en recuperar cobre de los residuos de gas de chimenea en la fundicin de cobre por el
mtodo de Tostacin-Segregacin. El material contiene, adems del cobre, otras impurezas como el
arsnico, bismuto, etc.
El objetivo del estudio consiste en recuperar al menos el 85% de cobre presente en el material inicial y
eliminar en lo posible el 75% de impurezas en el residuo. Otros estudios previos a este trabajo, lograron
una recuperacin mxima de cobre de 60%.
Basados en estudios previos de tostacin-segregacin se defini las siguientes variables controlables:
En el estudio aplicaremos el diseo P&B.

La tabla muestra los resultados del diseo de Plackett y Burman, considerando tres variables ficticias.

Como podemos observar, los efectos ms grandes son la adicin de cal, adicin de coque X2, tiempo de
segregacin y temperatura. El efecto de la adicin de cal X1 es negativo, lo que significa que en su nivel
inferior ( - ) esta variable resulta significativa.
Anlisis de Varianza
SSERROR = (8.53)2 + (1.17)2 + (-1.67)2 = 76.966
SSM = 76.966 / 3 = 25.652

Para un nivel de significancia del 95% y para 1 y 3 grados de libertad respectivamente, Ftablas = 18.5 Por lo
cual, la adicin de cal, la adicin de coque, tiempo de segregacin y temperatura de segregacin son
significativos.
Modelo Matemtico
Yest =19.87 10.07X1 + 6.82X5 + 6.77X7 + 14.32X8
Nota: El modelo matemtico incluye solamente las variables que resultaron significativas. As:

SSR = (5.63)2 + + (2.45)2 = 863.25


MSR = 863.25 / 7 = 123.3219
F = 123.3219 / 25.655 = 4.81
Para un nivel de significancia del 95%, para 7 y 3 grados de libertad, respectivamente, FTablas = 8.89. Por lo
tanto, 4.81 es menor que 8.89, entonces el modelo representa adecuadamente a los datos
experimentales. Es importante tener para la etapa de escalamiento, en el prximo tema, el modelo
matemtico obtenido.
Conclusin
Como puede observarse en los resultados obtenidos, la mayor recuperacin de cobre en esta etapa fue
de 67% de cobre, lo cual nos indica que an estamos lejos del objetivo trazado (recuperacin mnima
85% de cobre). Por lo que la aplicacin de la etapa de escalamiento se hace necesaria.
Tambin podemos concluir que las variables: adicin de cal en su nivel inferior mejoran la recuperacin de
cobre; en tanto que, la cantidad de coque, tiempo de segregacin y temperatura de segregacin en su
nivel superior mejoran notablemente la recuperacin de cobre.

SESION 14
OPTIMIZACIN
DISEOS ROTABLES
Un diseo experimental rotable es aquel en el cual se tiene igual facultad de prediccin en todas las
direcciones a partir de un punto experimental central y donde los otros puntos experimentales estn a una
distancia constante del punto central. Esto significa que la variancia (Se2) depende solamente de la
distancia del punto (X1X2,...Xk) al punto central del diseo (X o). El hecho de que la variancia dependa
solamente de la distancia, significa que el diseo permanece inalterado si este es rotado a un ngulo
arbitrario tomando como eje de rotacin el punto central. Esta caracterstica es muy til cuando las
unidades de las variables controlables estn dadas en escala natural, en este caso, evidentemente, la
distancia depender de las unidades en las cuales las variables controlables son las medidas, y que
cambios en la magnitud de estas unidades cambiaran la localizacin de los puntos a una distancia
constante del origen.
En general los diseos rotables que estudiaremos son:
a) Diseo pentagonal.
b) Diseo hexagonal.
c) Diseo octogonal.
Los cuales son presentados como polgonos regulares inscritos en una circunferencia cuyo centro es el
origen del sistema de coordenadas, de radio unitario o de radio (2)1/2.
Diseo Pentagonal
Este modelo se utiliza para estimar modelos matemticos de segundo orden, consiste en cinco puntos de
un pentgono ms los puntos necesarios replicados en el centro del diseo para estimar la variancia del
error experimental.

La matriz del diseo puede deducirse de la figura, tal como se observa en la tabla.

Diseo Hexagonal
Es el diseo ms popular utilizado por los investigadores, muy til para estimar modelos de segundo
orden, el cual consiste en seis puntos experimentales correspondientes a un hexgono regular, ms los
puntos necesarios replicados en el centro para estimar la variancia del error experimental. Este diseo se
muestra grficamente en la figura.

La matriz del diseo hexagonal puede deducirse de la figura, cuyos resultados se muestran en la tabla.

Diseo Octogonal
Este diseo es el ms confiable, debido a que utiliza un mayor nmero de observaciones (nmero de
pruebas experimentales). Este diseo consiste en ocho vrtices correspondientes a un octgono regular,
ms los puntos centrales necesarios para estimar la variancia de error experimental. El diseo

esquemticamente se muestra en la figura.

La matriz del diseo octogonal puede deducirse de la figura anterior, el cual se muestra en la tabla

Ejemplo: Para Diseo de la matriz de los Diseos Rotables


Analizaremos, para este propsito, el ejemplo que venimos tratando (recuperacin de cobre por tostacinsegregacin). En las etapas anteriores, Screening y escalamiento, se identific las variables que son
significativas para el proceso, y se ubic la regin donde se encuentra, el ptimo.
En esta etapa, de optimizacin final, vamos a describir la regin experimental donde se ubican las
condiciones ptimas, utilizando uno de los diseos rotarles. Para lo que se considera las dos variables
ms significativas, como son:
Adicin de cal y Temperatura de segregacin.
Se tiene los siguientes niveles para las variables consideradas:

Una de las formas ms adecuadas, para pasar de la escala codificada (matriz de diseo X j) a la escala
natural Zj, es utilizando las ecuaciones siguientes:

Donde:
Zj: Centro del diseo
Zj: El radio del diseo queda definido por

Por lo tanto, los valores de las variables en escala natural quedan definidos por la ecuacin siguiente:
Utilizando las formulas anteriores se obtiene la siguiente tabla:

Utilizando la formula bj*Zj y la tabla anterior se confecciona la matriz de diseo a escala codificado y a
escala natural para los diseos rotables descritos.
a) Diseo Pentagonal:
N
1
2
3
4
5
6
7

CODIFICADO
X1
X2

1
0.309
-0.809
-0.809
0.309
0
0

0
0.951
0.588
-0.588
-0.951
0
0

NATURAL
Z1

Z2

90
67.5425
31.2075
31.2075
67.5425
57.5
57.5

750
845.1
808.8
691.2
654.9
750
750

b) Diseo Hexagonal:
N
1
2
3
4
5
6
7
8
9

CODIFICADO
X1
X2

1
0.5
-0.5
-1
-0.5
0.5
0
0
0

0
0.866
0.866
0
-0.866
-0.866
0
0
0

NATURAL
Z1
Z2

90
73.75
41.25
25
41.25
73.75
57.5
57.5
57.5

750
836.6
836.6
750
663.4
663.4
750
750
750

c) Diseo Octogonal
N

CODIFICADO
X1
X2

2 0.707
3
0

0
0.707
1

4 -0.707 0.707
5
-1
0
6 -0.707
-

NATURAL
Z1
Z2

90
80.477
5
57.5
34.522
5
25
34.522

750
820.7
850
820.7
750
679.3

8 0.707
9
0
1
0
0
1
1
0
1
2
0

0.707
-1
0.707
0

5
57.5
80.477
5
57.5

679.3
750

57.5

750

57.5

750

57.5

750

650

ESTIMACION DEL MODELO MATEMATICO PARA DISENOS ROTABLES


Los diseos rotables y compuestos son diseos que tienen tres niveles en cada variable, por lo cual
podemos estimar modelos matemticos de segundo orden, segn la serie de Taylor estudiada
anteriormente.
k

i=1

uj=1

j=1

=b0 + bi X i + bu X u X j + b j X 2j
Los coeficientes del modelo matemtico de segundo orden pueden ser estimados por varios mtodos,
entre los que podemos mencionar a la tcnica de regresin mltiple por mnimos cuadrados, tanto en la
forma ecuaciones normales, forma matricial y el mtodo de correlacin mltiple. En cuanto a otras
tcnicas podemos mencionar a la tcnica de bsqueda directa (por ejemplo la tcnica de Nelder y Mead),
o tambin a la tcnica conocida como los polinomios de Chevyshev, entre otras ms. Desde el punto de
vista de la facilidad, para poder programar en computadoras, el mtodo matricial es el ms recomendable,
y que est definido por la siguiente frmula matricial:
Donde:
X: Matriz de diseo.
XT: Transpuesta de la matriz de diseo.
Y: Los datos observados (respuestas).
Veamos numricamente esta tcnica, resolviendo el problema planteado en el ejemplo.
(Recuperacin de cobre a partir de residuos de gas de chimenea por tostacin-segregacin).
N
1
2
3
4
5
6
7
8
9

CODIFICADO
X1
X2

1
0.5
-0.5
-1
-0.5
0.5
0
0
0

0
0.866
0.866
0
0.866
0.866
0
0
0

NATURAL
Z1
Z2

90
73.75
41.25
25

750
836.6
836.6
750

41.25

663.4

64.1
61.8
55.3
77.3
63.2
39.1

73.75
57.5
57.5
57.5

663.4
750
750
750

87.9
89.9
88.3

La matriz X y el vector Y estn definidos como:

La transpuesta XT est definida por:

El producto de las matrices XTX es la siguiente matriz:

La inversa de la matriz (XTX)-1, denominada tambin matriz de correlacin, es la siguiente matriz:

El producto XTY es el vector siguiente:

Los coeficientes bj (B) estn definidas por el producto (XTX)-1(X.Y).

As, el modelo matemtico para el diseo hexagonal propuesto en escala codificada es la siguiente.

El modelo matemtico sirve para predecir los valores de la recuperacin de cobre, reemplazando valores
codificados de las variables en el rango de (-1 a +1). Sin embargo, en muchos casos es preferible
expresar el modelo matemtico en escala natural, especialmente cuando se desea graficar el modelo
usando cualquier software, para ello se debe proceder a decodificar el modelo segn las ecuaciones
siguientes.
Para el trmino independiente:
k

i=1

i ,u=1

j=1

a0 =b0 bi i biu i u b j 2 j
Donde:
i: es el cociente de dividir el centro del diseo (Zi ) y el radio del diseo (Zj).
ao: termino independiente del modelo matemtico en escala natural.
Para los trminos cuadrticos:

ai Z j =

bi
b ij
b ju
2
j
j=u=1 ..k1
Zi Zi
Zi j u

ao : es el coeficiente de los trminos lineales del modelo en escala natural.


El tercer trmino de la ecuacin anterior, por comodidad asignaremos la siguiente notacin para tres
variables: cuando i=1, los valores de j, u son (1,2) y (1,3), cuando i=2 j, u son (1,2) y (2,3) y cuando i=3 j,
u son (1,3) y (2,3). Se puede extender para ms de tres variables, haciendo en anlisis correspondiente.
Para los trminos lineales:

aii x 2i =

bii
Z 2i

aij : es el coeficiente del termino cuadrtico del modelo en escala natural.


Para los trminos interaccin

aij Z i Z j=

b ij
i j=1. k
Zi Z j

aij : son los coeficientes del termino interaccin del modelo en escala natural.
Aplicando las ecuaciones para el modelo, al ejemplo que venimos analizando, tenemos la siguiente tabla
de datos:
N
Z1
Z2

(-)
( +)
Z
Z

25
90
57.5
32.5
1.769

650
850
750
100
7.5

Remplazando los valores en el modelo matemtico.


2

a0 =b0b1 X 1b 2 X 2 +b 3 X 1+b4 X 2 +b 5 X 1 X 2
Termino independiente

a0 =88.7 (7.33 x1.769 ) ( 4.27 x7.5 )+ ( 18x 1.7692 ) +(39x 7.52 ) +[ 17.66 ( 1.769 )( 7.5 ) ]

a0 =1833.48
Trminos lineales

17.67
7.5=2.349
32.5
17.67
1.769=5.5996
100

( ) ( )
( ) ( )

7.5
18
2
1.769
32.5
32.5
4.27
39.13
a2 =
2
7.5
100
100
a1 =

Trmino cuadrticos

18
=0.017
32.52
39
a22= 2 =0.0039
100
a11 =

Termino Interaccin

a12=

17.67
=0.0054
( 32.5 x100 )

Por lo tanto, el modelo matemtico en escala natural es:


Y = -1833.48 - 2.349 Z1 + 5.599 Z2 - 0.017 Z12 - 0.003 Z22 + 0.0054 Z1Z2
El modelo debe predecir valores de Y (% de recuperacin de cobre), reemplazando valores naturales de
las variables, del mismo que el modelo matemtico codificado, reemplazando valores codificados de las
variables. Sin embargo, se espera un poco de variacin en los valores, principalmente debido a la
exactitud de los clculos durante la decodificacin.

ANALISIS DE VARIANCIA PARA DISEOS ROTABLES Y COMPUESTOS


Anlisis de significancia de los coeficientes
Los coeficientes de los modelos matemticos son evaluados para analizar su significancia mediante el test
de Student, definido por:

(8.8)
La variancia asociada a cada coeficiente es:
(8.9)
Donde:
Sbj : Desviacin standard asociado a los coeficientes
Cjj : Son los elementos de la diagonal de la matriz de correlacin (X TX)-l.
En el ejemplo anterior los elementos de la diagonal de la matriz de correlacin son:

Se: Desviacin standard del error experimental, que se estima de acuerdo a las ecuaciones 8.10:
N0

Y 0i

= i=1
N0
N0

(8.10)

SS E = ( Y 0i 0 )

i=1

MS E =

SC E
f2

S e = SM E
Las respuestas en el centro del diseo del ejemplo que venimos tratando son:

Aplicando la frmula se obtiene:


Y = (87.9+89.9+88.3)/3 =88.7
SSE = (87.9 -88.7) 2 + (89.9 - 88.7)2 + (88.3 - 88.7)2 = 2.24
Los grados de libertad f2 para el error experimental es: 3-1 = 2
Por lo tanto: MS E = 2.24/2=1.12
Se = (1.12)1/2 = 1.058
Aplicando las ecuaciones 8.8 y 8.9 obtenemos la siguiente tabla:
F.V.

Se

(Cij)1/2

Sbj

bj

tj

Signf.

X1
X2
X12
X22
X1X2

1.058
1.058
1.058
1.058
1.058

0.577
0.577
0.912
0.912
1.1547

0.610
0.610
0.966
0.966
1.2217

-7.33
4.27
-18.00
-39.14
17.67

-12.02
7.00
-18.633
-40.506
14.463

Si
Si
Si
Si
Si

Para analizar la significancia de los coeficientes se compara el test t-calculado, con el T tablas, para un nivel de
significancia de 95% (p=0.05) y dos grados de libertad (f=2), el valor de T0.05,2 = 4.3; si T-calculado es
mayor que el t-tabla (Tc >Tt), la variable en cuestin es significativa para el proceso estudiado. Como
puede observarse, en la tabla anterior todos los coeficientes del termino independiente, trminos lineales,
trminos cuadrticos y el termino interaccin resultaron significativos.
Evaluacin del Modelo Matemtico
De la misma manera el modelo matemtico, derivada de los diseos rotables y compuestos, es avaluado
estadsticamente para ver el grado de ajuste a los datos experimentales, de la siguiente manera:
Se comienza con la suma de cuadrados del residual, que est definido por:
N

(8.11)

SS R = ( Y i )

i=1

Para el cual el nmero de grados de libertad (f1) est definido por:

f 1 =NI=N

( k+2 )( k+1 )
2

(8.12)

De las observaciones repetidas en el punto central del diseo encontramos la suma de cuadrados del error:
N0

SS E = ( Y 0i 0 )

(8.13)

i=1

Para lo cual el nmero de grados de libertad est definido por:

f 2=N1

(8.14)

El paso siguiente es hallar la Falta de Ajuste de la suma de cuadrados, tanto del error como del residual.
Definido por:

SS FA =SS R SS E

(8.15)

Para este ltimo los grados de libertad estn definidos por:


Para ver como la ecuacin de regresin (modelo matemtico) se ajusta a los

f 3 =f 1 f 2

(8.16)

Datos experimentales, usamos la prueba de Fisher (Test-Fisher). Definida por

SS FA
f3
F=
SS E
f2

(8.17)

La ecuacin de regresin estimada se ajusta a los datos experimentales si:

FO <F 95 f f

(8.18)

3 2

Aplicando las frmulas para ver la falta de ajuste del modelo matemtico, seguiremos los siguientes pasos:
a) Calculo de los valores predichos o estimados de la regresin, mediante la frmula matricial

b) Calculo de residuales:

SSR = (0.73)2+ (-0.73)2++ (-0.40)2 = 5.466


MSR = 5.466/ (9-6) = 1.822
La suma de cuadrados de la falta de ajuste es:
SSFA = 5.466 2.24 = 3.226
MSFA = 3.226 / (3-1) = 1.613
La suma de cuadrado medio del error es 1.12 (Ver seccin 8.1.4), por lo tanto el valor de F del modelo
es:
Fo =3.226/1.12 = 2.88
El valor de F de tablas, para un nivel de significancia del 95% y para 1 y 2 grados de libertad,
respectivamente es:
F0.05, 1, 2= 18.5
Por lo tanto, F del modelo es menor que F de tablas, entonces el modelo ajusta o representa
adecuadamente a los datos experimentales.
La tabla siguiente muestra los clculos involucrados en esta seccin.

GRAFICA DEL DISEO


Para poder graficar el modelo matemtico hacemos uso del modelo matemtico en escala codificada:
Y = -1833.48 - 2.349 Z1 + 5.599 Z2 - 0.017 Z12 - 0.003 Z22 + 0.0054 Z1Z2
Podemos graficar el modelo en el espacio como se muestra en la figura 8.5, o a manera de contornos o
curvas de nivel, como se puede apreciar en la figura 8.6.

Figura 8.5: Efecto de la cal y temperatura de segregacin en la recuperacin de Cu

Fig. 8.6 Efecto de la cal y T de segregacin. En la recuperacin de Cu (2D)

SESIN 16
DISEO OCTOGONAL
Este diseo utiliza un mayor nmero de pruebas experimentales. Este diseo consiste en ocho
vrtices correspondientes a un octgono regular, ms los puntos centrales para estimar la
varianza de error experimental. Los puntos experimentales se muestran esquemticamente en la
fig. 12.3, se sabe que la suma de los ngulos exteriores de un polgono es de 360 y podemos
calcular su ngulos central segn la siguiente ecuacin.

C=

360
n

Para n=8 lados, el valor del ngulo central es de 45, haciendo coincidir uno de los lados que
forma el ngulo central con el eje de las abscisas y los vrtices del octgono correspondera a
los puntos experimentales

La matriz del diseo puede deducirse a partir de la figura 12.3


h) El punto experimental (1)
Como el radio (R=1), tenemos el par ordenado (X 1, X2)= (1,0)
i) EI punto experimental (2)

Luego al punto experimental 2 le corresponde al par ordenado (0.7071, 0.7071)


j) Los puntos experimentales 3 ,4 5, 6, 7,3. Le correspondern el mismo valor que el punto 2 por
poseer el mismo ngulo central (45) y ser simtricos, pero variando el signo de acuerdo a la
posicin del cuadrante la matriz del diseo se resume en la tabla 12.3
N
X1
X2
1
1.0000
0.0000
2
0.7071
0.7071
3
0.0000
1.0000
4
-0.7071
0.7071
5
-1.0000
0.0000
6
-0.7071
-0.7071
7
0.0000
-1.0000
8
0.7071
-0.7071
9
0.0000
0.0000
10
0.0000
0.0000
11
0.0000
0.0000
12
0.0000
0.0000
Tabla 13.2 Matriz del Diseo Octogonal
Ejemplo, de aplicacin
En un proceso de flotacin de un mineral sulfurado de cobre, despus de las etapas de
screening y escalamiento se determin que las variables ms significativas son la dosificacin
del colector y el porcentaje de slidos, se desea determinar el mximo porcentaje de
recuperacin de cobre: La siguiente tabla muestra los rangos de operacin.

El centro de diseo Zj se calcula con la (Ec. 67)


El radio del diseo Zj se calcula con la siguiente ecuacin (Ec 68)

Aplicando las ecuaciones (Ec.67) y (Ec. 68) hallamos el centro y radio del diseo hexagonal

En la planificacin de las pruebas experimentales, se tiene que encontrar el valor de las variables
en escala natural por medio de la siguiente ecuacin:

1
2
3
4
5
6
7
8
9
10
11
12

Codificado
X1
X2
1.0000
0.0000

Natural
Z1
Z2
0.0350 27.500
0
0.7071
0.7071 0.0320 29.267
7
0.0000
1.0000 0.0250 30.000
0
-0.7071
0.7071 0.0179 29.267
3
7
-1.0000
0.0000 0.0150 27.500
0
-0.7071 -0.7071 0.0179 25.732
2
0.0000
-1.0000 0.0250 25.000
0
0.7071
-0.7071 0.0320 25.732
2
0.0000
0.0000 0.0250 27.500
0
0.0000
0.0000 0.0250 27.500
0
0.0000
0.0000 0.0250 27.500
0
0.0000
0.0000 0.0250 27.500
0
Tabla 12.3 Planificacin de las pruebas

Y
92.2
94.0
93.6
93.5
90.9
92.2
92.8
93.3
94.1
94.3
93.9
94.0

12.1.3.1 Modelo matemtico


EL modelo matemtico del diseo octagonal es of siguiente:
.70
Los coeficientes del modelo matemtico de segundo orden pueden ser estimados por varios
mtodos entre los que podemos mencionar la tcnica de regresin mltiple por mnimos
cuadrados, tanto en forma de ecuaciones normales, forma matricial y el mtodo de correlacin

mltiple, desde el punto de vista de facilidad, para poder programar en computadoras, el mtodo
matricial es el ms recomendable, y el cual est definida por la (Ec. 70 )
La matriz [X] est definida por los valores de las variables codificadas, que corresponden a sus
respectivos coeficientes de regresin segn el modelo matemtico. La matriz completa del
diseo octagonal es el siguiente:

La matriz transpuesta de X est definida por

El producto de [X]T[X] se muestra a continuacin:

El clculo de la matriz inversa ([X] T* [X])-1 denominada tambin matriz de correlacin es constante
en el diseo octagonal siempre y cuando tenga doce pruebas experimentales es decir cuatro
repeticiones en el punto central del diseo, la diagonal de esta matriz inversa es importante en la
determinacin del anlisis de significancia de los coeficientes del modelo matemtico, luego la
matriz es la siguiente:

El producto de la matriz transpuesta de [X] T por el vector de respuestas [Y] es equivalente a la


sumatorias del producto escalar de la matriz [X] por el vector [Y], recordando que el mtodo
matricial es el ms conveniente por su facilidad de clculo:

Luego aplicando la (Ec.70) encontramos los coeficientes del modelo matemtico

El modelo matemtico para el diseo octogonal propuesto a escala codificada es la siguiente

El modelo matemtico sirve para predecir los valores de recuperacin de cobre, reemplazando
valores codificados de las variables en el rango de (-1 a +1).En muchos casos es preferible
expresar el modelo en escala natural, especialmente cuando se desea graficar, para ello se debe
proceder a decodificar el modelo segn las ecuaciones descritas para los diseos de segundo
orden.
Para el trmino independiente: Segn la (Ec.72)

Donde j: Es el cociente de dividir el centro del diseo y el radio del diseo


ao: Es el termino independiente del modelo a escala natural.
Antes de proseguir aplicando las actuaciones para la decodificacin del modelo es necesario
conocer los siguientes datos, que se resumen en la siguiente tabla:

El modelo matemtico a escala natural es:

12.1.3.2 Anlisis de varianza para diseos rotables y compuestos


Los coeficientes del modelo matemtico son evaluados para analizar su significancia mediante el
test de Student, definido por:

La varianza asociada a cada coeficiente es:


Donde:
Sbj : Desviacin estndar asociado a los coeficientes
Se: Es la desviacin estndar del error experimental.
Cij : Son los elementos de la diagonal de la matriz de correlacin ([X] T [X])-1
Para los datos del problema del diseo octogonal para doce pruebas experimentales su diagonal
siempre ser:

Para calcular el error experimental se hace a partir de las respuestas en el centro del diseo
cuyos valores se dan en la tabla siguiente:

c) calculamos primer o el promedio delas respuestas en el centro del diseo, empleando la (Ec.
82 )

La sumatoria de cuadrados del error experimental se calcula, con la (Ec. 83)

SSE = (94.1-94.075)2+ (94.3-94.075)2+ (93.9-94.075)2+ (94.0-94.075)2 = 0.0875


La media de cuadrados del Error experimental
Donde f2 son los grados de libertad para el error experimental, como hubo 4 repeticiones: f 2=N-1
= 4- 1 = 3 aplicando la (Ec. 84) tenemos:

MS E =

0.0875
=0.029167
3

La desviacin estndar del error experimental es:

A hora podemos calcular la Desviacin estndar asociada a los coeficientes, mediante la (Ec.86):

Calculo de la significancia de los coeficientes, aplicando la (Ec. 80)

En la siguiente tabla se muestran el resumen para los dems coeficientes:

Para analizar la significancia de los coeficientes se compara el test calculado, con el t de tablas
para un nivel de confianza del 95% y 3 grados de libertad, para dos colas =0.025 t (0.975,3)=3.18
Si (t) calculado es mayor que el (t) de tablas si (-t ) es menor que (- t )de tablas el coeficiente
de la variable es significativa

12.1.3.3 Evaluacin del modelo matemtico


Se evala estadsticamente el modelo matemtico para ver el grado de ajuste de los datos
experimentales, es decir que tanto difieren los Y observados con Los Y estimados. Para la
aplicacin de las frmulas descritas anteriormente es necesario conocer los siguientes datos:
a) Clculo de los valores predichos por el modelo [Y] (valor de la variable respuesta estimada),
hallaremos sus valores mediante la frmula matricial:

b) Calculo de los residuales:

Para llenar el cuadro de anlisis de varianza de Evaluacin del modelo matemtico se sigue el
mismo procedimiento que el realizado con el diseo hexagonal, ya que el modelo matemtico
tambin es de segundo orden.
La media de cuadrados del residual se calcula aplicando la (Ec. 88), teniendo en cuenta que los
parmetros del modelo son seis y se hizo doce pruebas experimentales por lo tanto los grados
de libertad son (12 - 6 = 6)

La suma de cuadrados de la falta de ajuste se calcula aplicando la (Ec. 91).


SSFA = 1.7202 0.0875 = 1.6327
Recordando que la suma de cuadrados del error experimental se calcula cuando se determina la
significancia de los coeficientes, su valor es (SSE = 0.0875) y su media de cuadrados
MSE = 0.0291667.
La media de cuadrados de la falta de ajuste se calcula con la (Ec. 93), y sus grados de libertad f 3
es la diferencia de los grados de libertad del residual (f 1) menos los grados de libertad del error
experimental (f2), luego:
f3 = (6 3 = 3)

Por ultimo calculamos el Fo del modelo, aplicando la (Ec. 94).

Este valor los comparamos con el F de tablas, para un nivel de confianza del 95% es decir un
nivel de significacin = 5% para 3,3 grados de libertad es: F (3,3)99% = 29.46
Por lo tanto aplicando la (Ec. 95) vemos si el modelo es aceptado o rechazado.

Cumple la condicin por lo tanto el modelo matemtico ajusta o representa adecuadamente los
datos experimentales.
El siguiente cuadro se resume el anlisis de Varianza del modelo matemtico.

12.1.3.4 Anlisis de Mximos y Mnimos


Teniendo en cuenta los coeficientes cuadrticos (bjj) del modelo matemtico de segundo orden
tendr un mximo y un mnimo, o no tendr un extremo.
Analizando el modelo matemtico del problema.

Vemos que el coeficiente b11 y b22 son negativos, por lo tanto, su curva se asemeja a un Elipse.

Remplazando estos valores en la matriz Hessiana tenemos.

Luego H22 = [(-4.175)(-0.875)] - [(0.3)(0.3) ] = +3.563


Como podemos observar, el signo de las determinantes es alternativo (H 11 = -4.175) (H22 =
+3.563).
Esto indica que el modelo matemtico tiene un mximo en el rango investigado.
12.1.3.5 Soluciones ptimas Sin Restricciones
Los valores ptimos de las variables estudiadas se encuentran por mtodos analticos de
optimizacin, para ello hacemos uso de las derivadas parciales, es decir derivando la funcin Y
con respecto a cada una de las variables independientes involucradas en el modelo matemtico
y luego lo igualamos a cero:

Continuando con el ejemplo del problema que se est desarrollando, vamos a encontrar los
valores ptimos para las variables: (X 1: dosificacin de colector) y (X2: % de slidos). Y encontrar

la mxima respuesta (% de recuperacin de cobre), se puede trabajar con el modelo a escala


codificada o a escala natural.

Ordenando los coeficientes de las variables y colocndolas en el miembro de la izquierda,


definimos su matriz como [A] y el miembro de la derecha trminos constantes como el vector
matriz [B].
Luego empleamos la ecuacin siguiente para el clculo de las variables X 1 y X2 y lo
resolveremos matricialmente:

Aplicando las ecuaciones (Ec. 67) y (Ec. 68) hallamos el centro y radio del diseo Octogonal.

El valor de las variables en escala natural se halla por medio de la (Ec. 69)

Las condiciones ptimas son:


Dosificacin de colector 0.026 (Lb/tn)
% de slidos 28.9936
Remplazando estos valores en el modelo matemtico a escala natural o a escala codificado se
obtiene la mxima recuperacin que corresponde a 94.27%
Y =94.075+0.6078 (0.1026)+0.5536 (0.5975)2.0875(0.1026)20.4375(0.5975)2 0.3(0.1026)(0.5975)