DISEO DE EXPERIMENTOS
Teora
OBJETIVO
Objetivo general del mdulo. Que los asistentes actualicen los conocimientos
necesarios para disear, analizar y obtener inferencias sobre experimentos
conducentes a la mejora de productos y procesos en la industria y que sean capaces de
aplicar la mejor estrategia experimental para resolver un problema de desarrollo de
productos, o de calidad en los productos.
Contenido
1. INTRODUCCIN AL DISEO DE EXPERIMENTOS .......................................................... 4
1.1 Aplicaciones del diseo de experimentos .............................................................. 5
Definicin de experimento, diseo de experimentos y eficiencia de un
experimento ............................................................................................................. 7
1. 2 Principios bsicos del diseo de experimentos ..................................................... 7
1.3. Metodologa general para realizar un experimento ........................................... 9
1.4. Aplicaciones del diseo de experimentos. .......................................................... 13
2. ANALISIS DE VARIANZA DE UN FACTOR (ANOVA 1 VIA) ............................................ 15
2.1 Introduccin.......................................................................................................... 15
2.2 Tipos de variacin y sumas de cuadrados ............................................................ 16
2.3 Uso de Excel: ......................................................................................................... 18
2.4 Uso de Minitab ..................................................................................................... 19
2.5 Grafica de residuos contra el valor ajustado de yij .............................................. 20
2.6 Ejercicios ............................................................................................................... 21
3. ANALISIS DE VARIANZA DE DOS VAS o DIRECCIONES (ANOVA 2 VIAS)..................... 23
3.1 Introduccin.......................................................................................................... 23
3.2 Ejemplos con clculo manual ............................................................................... 23
3.3 Procedimiento en Excel ........................................................................................ 24
3.4 ANOVA en Minitab ............................................................................................... 25
4. DISEOS FACTORIALES ............................................................................................... 29
4.1 Principios y definiciones bsicas........................................................................... 29
Ventajas de los diseos factoriales ........................................................................ 31
4.2 Diseo factorial de dos niveles (2^K) ................................................................... 32
5. DISEOS DE EXPERIMENTOS FRACCIONALES DE DOS NIVELES ................................. 40
5.1 Concepto de replicacin fraccionada ................................................................... 40
Pgina 2 de 71
5.2 Fraccin un medio del diseo 2k .......................................................................... 41
5.3 Resolucin del diseo ........................................................................................... 44
6. DISEOS DE EXPERIMENTOS FACTORIALES COMPLETOS .......................................... 46
6.1 Diseo factorial completo de 2 factores .............................................................. 46
6.2 Anlisis Estadstico del Modelo de Efectos Fijos .................................................. 48
7. DISEO DE EXPERIMENTOS TAGUCHI ........................................................................ 56
7.1 Introduccin.......................................................................................................... 56
7.2 Arreglos ortogonales para experimentos a dos niveles ....................................... 57
7.3 Caso menor es mejor ............................................................................................ 59
8. REGRESIN Y CORRELACIN LINEAL .......................................................................... 64
8.1 Introduccin.......................................................................................................... 64
8.2 Ejemplo manual .................................................................................................... 66
8.3 Uso de Excel .......................................................................................................... 68
8.4 Uso de Minitab ..................................................................................................... 69
8.5 Ejercicios: .............................................................................................................. 71
Pgina 3 de 71
1. INTRODUCCIN AL DISEO DE EXPERIMENTOS
O bien: es una prueba o una serie de pruebas en las cuales se inducen cambios
deliberados en las variables de entrada de un proceso o sistema, de manera que sea
posible observar e identificar las causas de los cambios en la respuesta de salida.
El proceso o sistema bajo estudio puede representarse por medio del modelo de la
figura 1.1.
Factores controlables
x1 x2 x3 x4 ... xp
Entradas Salida
Proceso
y
z1 z2 z3 z4 ... zq
Factores incontrolables
Figura 1. Modelo general de un proceso o sistema
Algunas de las variables del proceso x1, x2,..., xk son controlables, mientras que otras z1,
z2,...,zk son incontrolables (aunque pueden ser controlables para los fines de prueba).
Entre los objetivos del experimento pueden incluirse:
Pgina 4 de 71
Lo mtodos de diseo experimental tiene un propsito que puede ser desarrollar un
proceso consistente o robusto; esto es, un proceso que no sea afectado por fuentes
de variabilidad externas o ruido (las zi).
1. Son estas dos soluciones los nicos medios para lograr la respuesta de
inters?
2. Existen otros factores que pueden afectar la respuesta de las muestras y que
deban ser investigados o controlados?
3. Cuntas muestras deben ser sometidas a cada solucin de templado?
4. En que forma debe asignarse cada muestra a los tratamientos, y en qu orden
deben realizarse las mediciones?
5. Qu mtodo de anlisis debe utilizarse?
6. Qu diferencia en los niveles promedio de respuesta entre los dos
tratamientos debe considerarse como significativa?
Pgina 5 de 71
El uso del diseo de experimentos en estas reas puede dar por resultado productos
con mayor confiabilidad y mejor funcionamiento en el campo, menores costos, y
menor tiempo de diseo y desarrollo del producto.
F2 F1
F11
F21
F22 F12
CARACTERISTICA
DE CALIDAD
F41
F31
F32
F42
F4 F3
Mediante un experimento podemos inducir cambios en uno varios factores (F 2l. F33 y
F11 por ejemplo) y analizar estadsticamente si el cambio en los factores afecta o no el
resultado o efecto del proceso.
Pgina 6 de 71
Definicin de experimento, diseo de experimentos y eficiencia de un
experimento
Experimento
Escomprender
un conjunto de pruebas estructurado y coherente que son analizadas a fin de
la operacin del proceso.
Diseo de experimentos
Esapropiados
el proceso de planear, ejecutar y analizar el experimento de manera que los datos
sean recolectados, y que estos tengan validez estadstica para obtener
conclusiones validas y tiles. Se entiende por validez estadstica, el que los resultados
se puedan repetir consistentemente sobre todo en la operacin a gran escala o
masiva.
Eficiencia de un experimento
Esto es, un experimento eficiente debe ser lo ms simple y econmico posible pero
efectivo. Las tcnicas del diseo de experimentos pretenden que los experimentos
sean eficientes.
Pgina 7 de 71
La reproduccin por lo tanto es importante por al menos dos razones:
Anlisis por bloques. Es una tcnica que se usa para incrementar la precisin del
experimento. Un bloque es una porcin del material experimental que sea ms
homognea que el total del material o cuando las condiciones son ms
homogneas. Al realizar un experimento por bloques se hacen las
Pgina 8 de 71
comparaciones entre las condiciones de inters del experimento dentro de cada
bloque.
En este paso es necesario definir que tipo de informacin es exactamente la que nos
interesa, ya que no podemos medir o variar todos y cada uno de los componentes de
un experimento.
En conclusin como resultado de este paso, la hiptesis a probar debe quedar bien
definida. Un diagrama causa-efecto es una buena ayuda en este paso.
Cuantitativa
Precisa.
Que tenga algn significado fsico.
Pgina 9 de 71
Las variables independientes o factores representan aquellas causas o factores cuyo
efecto sobre la variable dependiente se quiere analizar. Cada uno de estos factores se
deber probar al menos a dos valores diferentes para evaluar su efecto, a cada uno de
estos valores o niveles se les llama tratamientos. Por ejemplo, si queremos conocer el
efecto de la temperatura sobre la dureza de un material y para ello se realizan pruebas
a 70, 80 y 90C se dice que tenemos un experimento de un solo factor con tres
tratamientos. Otra vez es de vital importancia la participacin del personal involucrado
en el problema a fin de seleccionar apropiadamente los factores o variables
independientes y los niveles de cada factor o tratamiento de inters.
Cmo seleccionar los diferentes niveles de un factor?, En general un factor puede ser
cualitativo (proveedor, turno, operario, etc), o cuantitativo (temperatura, presin,
altura, tiempo, etc.). Los niveles especficos en cualquier caso se pueden seleccionar ya
sea aleatoriamente dentro de un cierto rango o a un nivel fijo definido por el
experimentador previamente, esto nos lleva a cuatro situaciones generales:
Este caso es similar al anterior excepto que el factor es cuantitativo, por ejemplo:
temperatura, presin, tiempo, concentracin de un componente, etc. Para este caso es
recomendable que los diferentes niveles o tratamientos se tomen equiespaciados,
esto es, por ejemplo 10, 20, 30 y 40 C: 5, 10, 15, 20 y 25 psi; 8, 12, 16 y 20 minutos,
etc.
En este caso los niveles o tratamientos se seleccionan al azar de entre varios posibles.
Por ejemplo: se tienen varios lotes de un mismo proveedor, se selecciona al azar cules
de ellos analizar, en este caso la conclusin del experimento se extiende para cubrir
todos los posibles niveles..
Pgina 10 de 71
D. Factor aleatorio, cuantitativo.
Igual que en el caso anterior los diferentes niveles o tratamientos son seleccionados al
azar.
Este punto pudiera parecer obvio; sin embargo, en la prctica no es sencillo darse
cuenta de que existe un problema que requiere experimentacin, ni disear un
planteamiento claro y aceptable del mismo. Es necesario desarrollar todas las ideas
sobre los objetivos del experimento. Suele ser importante solicitar la opinin de todas
las partes implicadas. Un planteamiento claro del problema contribuye a menudo en
forma sustancial a un mejor conocimiento del fenmeno y de la solucin final del
problema.
Pgina 11 de 71
2. Eleccin de factores y niveles.
Pgina 12 de 71
es fcil subestimar los aspectos logsticos y de planeacin de la realizacin de un
experimento diseado.
6. Anlisis de datos.
Deben emplearse mtodos estadsticos para analizar los datos, de modo que los
resultados y conclusiones sean objetivos ms que apreciativos. Existen muchos
excelentes paquetes de software para el anlisis de datos, y varios mtodos grficos
sencillos son importantes en la interpretacin de tales datos. El anlisis de residuos y la
verificacin de la idoneidad del modelo son tambin tcnicas de anlisis de gran
utilidad.
Hay que recordar que los mtodos estadsticos slo proporcionan directrices para la
veracidad y validez de los resultados. Los mtodos estadsticos, aplicados
adecuadamente, no permiten probar algo experimentalmente, slo hacen posible
obtener el probable error de una conclusin, o asignar un nivel de confiabilidad a los
resultados. La principal ventaja de los mtodos estadsticos es que agregan objetividad
al proceso de toma de decisiones. Las tcnicas estadsticas, aunadas aun buen
conocimiento tcnico o del proceso y al sentido comn, suelen llevar a conclusiones
razonables.
7. Conclusiones y recomendaciones.
Una vez que se han analizado los datos, l experimentador debe extraer conclusiones
prcticas de los resultados y recomendar un curso de accin. En esta fase a menudo
son tiles los mtodos grficos, en especial al presentar los resultados a otras
personas. Tambin deben realizarse corridas de seguimiento y pruebas de
confirmacin para validar las conclusiones del experimento.
Pgina 13 de 71
Si la temperatura de recocido afecta o no alguna propiedad mecnica del producto.
Si diferentes cabezales de una misma mquina producen productos similares.
Si un nuevo mtodo de ensamble incrementa o no la productividad en una lnea de
produccin.
Cul es el factor que ms influye en la variabilidad de alguna caracterstica de
calidad.
Es necesario tener claros y en todo caso revisar los siguientes conceptos estadsticos
antes de seguir:
Pgina 14 de 71
2. ANALISIS DE VARIANZA DE UN FACTOR (ANOVA 1
VIA)
2.1 Introduccin
El anlisis de la varianza de un factor (ANOVA) es una metodologa para analizar la
variacin entre muestras y la variacin al interior de las mismas mediante la
determinacin de varianzas. Es llamado de una va porque analiza un variable
independiente o Factor ejemplo: Velocidad. Como tal, es un mtodo estadstico til
para comparar dos o ms medias poblacionales. El ANOVA de un criterio nos permite
poner a prueba hiptesis tales como:
H 0 1 2 3 .... k
H1 : Al menos dos medias poblacionales son diferentes.
Los supuestos en que se basa la prueba t de dos muestras que utiliza muestras
independientes son:
sb2
Fc
sw2
F , ( k 1), k ( n 1))
Donde el nmero de grados de libertad para el numerador (Sb^2 > Sw^2) es k-1 y para
el denominador es k(n-1), siendo el nivel de significancia.
k = nmero de muestras.
Por ejemplo:
Pgina 15 de 71
Como los empleados se seleccionan aleatoriamente para cada programa
el diseo se denomina DISEO COMPLETAMENTE ALEATORIZADO
Se observa el aprovechamiento de los empleados en los programas:
TRATAMIENTOS
1. Variacin total entre los 14 empleados, su puntuacin no fue igual con todos
VARIACIN TOTAL RESPECTO A LA MEDIA GENERAL
r c 2
SCT ( Xij X )
i 1 j 1
r
SCTR rj ( X j X ) 2
j 1
Pgina 16 de 71
3. Variacin dentro de un tratamiento o muestra o programa dado que no todos los
empleados dentro de un mismo programa obtuvieron los mismos puntajes. Se
denomina Variacin dentro de los tratamientos.
r c
SCE (X ij X j )2
i 1 j 1
4. Grados de libertad
Pgina 17 de 71
ZONA DE
NO RECHAZAR RECHAZO
Distr. F
7. Valor de P Fc
TABLA DE ANOVA
Regla: No rechazar si la F de la muestra es menor que la F de Excel para una cierta alfa
Pgina 18 de 71
RESUMEN Anlisis de varianza de un factor
Grupos Cuenta Suma Promedio Varianza
Programa 1 4 320 80 32.666667
Programa 2 5 405 81 5
Programa 3 5 425 85 17
Grados
ANLISIS DE VARIANZA de Promedio de
Suma
Variaciones cuadrados libertad Cuadrados Fc Probabilidad F crtica
Entre grupos 65.71428571 2 32.85714286 1.9431644 0.18937731 3.98229796
Dentro de
grupos 186 11 16.90909091
Total 251.7142857 13
Source DF SS MS F P
Factor 2 65.7 32.9 1.94 0.189
Error 11 186.0 16.9
Total 13 251.7
Pgina 19 de 71
NOTA: Si los Intervalos de confianza se traslapan, las
medias son iguales estadsticamente
Pgina 20 de 71
Grafica de residuos contra valores ajustados
2.6 Ejercicios
Catalizador
A B C D
58.2 56.3 50.1 52.9
57.2 54.5 54.2 49.9
58.4 57 55.4 50
55.8 55.3 51.7
54.9
Pgina 21 de 71
2. Para determinar si existe diferencia significativa en el nivel de Matemticas de 4
grupos de estudiantes de Ingeniera se realiz un examen aleatorio a 6 individuos por
grupo. Determine cuales son los grupos en los cuales existen diferencias a un 95% de
nivel de confianza.
A B C D
75 78 55 64
93 91 66 72
78 97 49 68
71 82 64 77
63 85 70 56
76 77 68 95
A B C
85 71 59
75 75 64
82 73 62
76 74 69
71 69 75
85 82 67
Pgina 22 de 71
3. ANALISIS DE VARIANZA DE DOS VAS o
DIRECCIONES (ANOVA 2 VIAS)
3.1 Introduccin
En este caso las frmulas son parecidas a la del ANOVA de una va pero ahora
agregando el clculo por renglones adicional al de columnas donde se incluye la
variable de bloqueo. El bloqueo es completamente al azar.
Los tratamientos se asignan a las columnas y los bloques a los renglones. Un bloque
indica condiciones similares de los sujetos al experimentar con diferentes
tratamientos.
Ejemplo 1.
Suponiendo que se quiere investigar si la produccin de tres diferentes mquinas es
igual, tomando en cuenta la experiencia de los operadores a un nivel de significancia
del 5%.
Experiencia Mquinas
de ops. En aos Maq 1 Maq 2 Maq 3 Promedios
1 27 21 25 24.33333
2 31 33 35 33
3 42 39 39 40
4 38 41 37 38.66667
Pgina 23 de 71
5 45 46 45 45.33333
Promedios 36.6 36 36.2 36.26667
TABLA ANOVA
SS GL CM Fc Falfa
SCTR= 0.933333 2 CMTR= 0.466667 Ftr = 0.09 4.46
Fbl =
SCBL= 764.9333 4 CMBL= 191.2333 37.25 3.84
SCE = 41.06667 8 CME= 5.133333
SCT = 806.9333 14 CMT= 57.6381
Pgina 24 de 71
Anlisis de varianza de dos factores con una sola muestra por grupo
RESUMEN Cuenta Suma Promedio Varianza
Fila 1 5 353 70.6 9.3
Fila 2 5 357 71.4 9.3
Fila 3 5 362 72.4 19.3
Fila 4 5 363 72.6 6.8
ANLISIS DE VARIANZA
Grados F
Fuente de Suma de de Cuadrados Fc Probabilidad tablas
variacin Cuadrados libertad medios Valor P
Filas 12.95 3 4.32 2.38 0.12 3.49
Columnas 157 4 39.25 21.61 2.06E-05 3.26
Error 21.8 12 1.82
Total 191.75 19
Total 231 24
Utilice 0.05 para calcular si hay diferencias entre los efectos de las columnas y los
renglones.
Introducir los datos arreglados con las respuestas en una sola columna e indicando a
que rengln y columna pertenece cada uno de estos, como sigue:
Pgina 25 de 71
68 2 1
67 2 2
68 2 3
71 2 4
74 3 1
75 3 2
78 3 3
75 3 4
71 4 1
72 4 2
73 4 3
75 4 4
67 5 1
70 5 2
68 5 3
69 5 4
Instrucciones:
Graphs
Seleccionar Normal plot of residuals
OK
Resultados:
La grfica normal de residuos debe mostrar los residuos aproximados por una recta
para validar el modelo:
Los residuos se aproximan a la distribucin normal por lo cual se concluye que se est
utilizando un modelo vlido.
Pgina 26 de 71
Normal Probability Plot of the Residuals
(response is Resp)
99
95
90
80
70
Percent
60
50
40
30
20
10
1
-3 -2 -1 0 1 2 3
Residual
Source DF SS MS F P
Agente Qumico 3 12.95 4.3167 2.38 0.121
Rollo 4 157.00 39.2500 21.61 0.000
Error 12 21.80 1.8167
Total 19 191.75
Pgina 27 de 71
5 68.50 (-----*-----)
--+---------+---------+---------+-------
67.5 70.0 72.5 75.0
Pgina 28 de 71
4. DISEOS FACTORIALES
Muchos experimentos se llevan a cabo para estudiar los efectos producidos por dos
o ms factores. Puede mostrarse que en general los diseos factoriales son los
ms eficientes para este tipo de experimentos. Por diseo factorial se entiende aquel
en el que se investigan todas las posibles combinaciones de los niveles de los factores
en cada ensayo completo o rplica del experimento. Por ejemplo, si existen a niveles
del factor A y b niveles del factor B, entonces cada rplica del experimento contiene
todas las ab combinaciones de los tratamientos. A menudo, se dice que los factores
estn cruzados cuando stos se arreglan en un diseo factorial.
Factor B
B1 B2
A1 20 30
Factor A
A2 40 52
40 52 20 30
A 21
2 2
30 52 20 40
B 11
2 2
Pgina 29 de 71
Si los factores tienen ms de dos niveles, el procedimiento anterior debe ser
modificado ya que las diferencias entre las respuestas promedio pueden expresarse de
muchas formas.
Factor B
B1 B2
A1 20 40
Factor A
A2 50 12
Puede observarse que existe una interaccin entre los factores A y B porque el efecto
de A depende del nivel elegido de B.
60
B2
50
B1
Respuesta
40
30 B2
20
B1
10
A1 A2
Factor A
Figura 1 Un experimento factorial sin interacciones
Pgina 30 de 71
En este caso se ve que las rectas B1 y B2 no son paralelas. Esto muestra que existe una
interaccin entre A y B. Sin embargo, no debe ser la nica tcnica para analizar los
datos, porque su interpretacin es subjetiva y su apariencia, a menudo, es engaosa.
60 B1
50
B2
Respuesta
40
30
20
B1
10 B2
A1 A2
Factor A
Hay que notar que cuando una interaccin es grande los correspondientes efectos
principales tienen poco significado prctico. Una estimacin del efecto principal de A
de los datos de la Tabla 2 es:
50 12 20 40
A 1
2 2
El cual resulta ser muy pequeo corrindose el riesgo de concluir que no existe un
efecto debido a A. Sin embargo, cuando se examin el efecto de A en niveles
diferentes de B se concluy que ste no era el caso. El factor A tiene un efecto, pero
depende del nivel del factor B. En otras palabras, es ms til conocer la interaccin AB
que el efecto principal. Una interaccin significativa oculta a menudo el significado de
los efectos principales.
Las ventajas de los diseos factoriales pueden ilustrarse fcilmente. Supongamos que
se tienen dos factores, A y B, cada uno con dos niveles. Estos niveles se representan
mediante A1, A2, B1 y B1. La informacin acerca de ambos factores puede obtenerse
variando un factor a la vez como aparece en la tabla 3. El efecto de variar el factor A
est dada por A2B1 -A1B2. A causa de que existe error experimental, es conveniente
realizar, por ejemplo, dos observaciones de cada combinacin de tratamientos y hacer
una estimacin de los efectos de los factores usando las respuestas promedio. Por lo
tanto, se requiere un total de seis observaciones.
Pgina 31 de 71
Factor B
B1 B2
A1 A1B1 A1B2
Factor A
A2 A2B1 12
Los diseos factoriales son necesarios cuando alguna interaccin puede estar
presente, para evitar hacer conclusiones engaosas.
Ejemplo 1 Considrese una investigacin llevada a cabo para estudiar el efecto que
tiene la concentracin de un reactivo y la presencia de un catalizador sobre el tiempo
de reaccin de un proceso qumico. Sea la concentracin del reactivo el factor A con
dos niveles de inters, 15% y 20%. El catalizador constituye el factor B; el nivel alto o
superior denota el uso de dos sacos de catalizador y el nivel bajo o inferior denota el
uso de un solo saco. El experimento se realiza (replica o repite) tres veces, y los
datos son como sigue:
Pgina 32 de 71
Combinacin de Replica
tratamientos I II III Total
A baja, B baja 28 25 27 80
A alta, B baja 36 32 32 100
A baja, B alta 18 19 23 60
A alta, B alta 31 30 29 90
b = 60(18+19+23) ab = 90(31+30+19)
Cantidad de catalizador B
Alto (2 sacos) +
bajo (1 saco) -
(1) = 80(28+25+27) a = 100(36+32+32)
- +
bajo (15%) alto (20%)
Concentracion de reactivo A
Figura
Fig. 3 1: Combinaciones de tratamiento en el diseo factoriall
As
Pgina 33 de 71
ab representa a ambos factores en el nivel superior.
Por convencin (1) se usa para representar a ambos factores en el nivel inferior.
El efecto promedio de un factor se define como el cambio en la respuesta
producida por un cambio en el nivel de ese factor, promediado sobre los niveles
del otro factor.
Como se ilustra en la figura 3, las letras minsculas (1), a, b y ab tambin se usan para
representar los totales de las n replicas de las combinaciones de tratamientos
correspondientes. Ahora bien, el efecto de A en el nivel B es {a-(1)}/n. Mientras que el
nivel superior B es {ab-b}/n. Tomando el promedio de estas dos cantidades se obtiene:
1 1
A ab b a (1) ab a b (1)
2n 2n
B
1
ab a b (1) 1
ab b - a (1)
2n 2n
AB
1
ab b a (1) 1
ab (1) a (b)
2n 2n
Por otro lado se puede definir AB como la diferencia promedio entre el efecto de B en
el nivel superior de A y el efecto de B en el nivel inferior de A.
Las formulas para los efectos de A, B y AB pueden deducirse por otro mtodo. El efecto
de A puede hallarse como la diferencia en la respuesta promedio de las dos
combinaciones de tratamiento en la mitad derecha (que llamaremos Y A+, puesto que
es la respuesta promedio para las combinaciones de tratamientos a las que A que se
encuentra en el nivel alto) y las dos combinaciones de tratamientos en la mitad
izquierda (o Y A). Esto es,
Pgina 34 de 71
A YA YA
ab a b (1)
2n 2n
1
ab a b (1)
2n
B YB YB
ab b a (1)
2n 2n
1
ab b a (1)
2n
ab (1) ab
AB
2n 2n
1
ab (1) a b
2n
Pgina 35 de 71
Con los datos que aparecen en la figura 1, las estimaciones de los efectos promedio
son:
A
1
90 100 60 80 8.33
2(3)
B
1
90 60 100 80 5.00
2(3)
AB
1
90 80 100 60 1.67
2(3)
ContrasteA ab a b (1)
SSc 1
aciyi. 2 na ci2
a .
Esta ecuacin establece que la suma de cuadrados de contraste es igual al contraste
elevado al cuadrado entre el producto del nmero de las observaciones de cada total
Pgina 36 de 71
del contraste por la suma de cuadrados de los coeficientes del mismo. En
consecuencia, se obtiene que las sumas de cuadrados de A, B y AB sean:
SSA
ab a b (1)
2
n*4
SSB
ab b a (1)
2
n*4
SSAB
ab (1) a b
2
n*4
Con los datos de la figura 3, las sumas de cuadrados se pueden calcular aplicando las
ecuaciones anteriores, obtenindose:
2
50
SSA 208.33
4(3)
2
30
SSB 75.00
4(3)
2
10
SSAB 8.33
4(3)
2
2 2 n 2 Y ...
SST i1 j1 k 1 Y ijk
4n
En general SST tiene 4n 1 grados de libertad. La suma de cuadrados del error, con 4(n-
1) G.L. se puede calcular en la forma usual, por diferencia, mediante.
2
2 2 3 2 Y
SS E Yijk 9398.00 9075.00 323.00
i1j1k 1 4(3)
Pgina 37 de 71
SS E SS T SS A SS B SS AB
Efectos (1) a b Ab
A: -1 +1 -1 +1
B: -1 -1 +1 +1
AB: +1 -1 -1 +1
Fuente de
variacin SS G.L. MS Fo
A 208.33 1 208.33 53.15a
B 75.00 1 75.00 19.13a
AB 8.33 1 8.33 2.13
Error 31.34 8 3.92
Total 323.00 11
a significativo al 1%
(1) + - - +
a + + - -
b + - + -
ab + + + +
Observe que los coeficientes de los contrastes usados para estimar la interaccin son
iguales al producto de los coeficientes correspondientes a los dos efectos principales.
Pgina 38 de 71
Los coeficientes de los contrastes siempre son +1 o 1 y se puede usar una tabla de
signos positivos y negativos como la mostrada en la de signos algebraicos para
determinar el signo apropiado de cada combinacin de tratamientos. En el encabezado
de las columnas de tabla y se encuentran los efectos principales (A y B), la interaccin
AB, e I, que representa el total el total o el promedio de todo el experimento. Se
observa que la columna encabezada por I se compone de solo de signos positivos. Los
renglones corresponden a las combinaciones de tratamientos.
A
1
ab b a (1) 1
ab a b (1)
2n 2n
Los tipos ms sencillos de diseos factoriales implican slo dos factores o conjuntos de
tratamientos. Haya a niveles del factor A y b niveles del factor B, dispuestos en un
diseo factorial; esto es, cada A repeticin o rplica del experimento contiene todas las
combinaciones de tratamiento ab. En general, hay n repeticiones.
Pgina 39 de 71
5. DISEOS DE EXPERIMENTOS FRACCIONALES DE
DOS NIVELES
As por ejemplo cuando se tienen siete factores, existen 128 posibles condiciones
experimentales, lo que implica que al hacer una replicacin por celda de todo el
experimento requiere un total de 128 observaciones. Si se decide tomar dos replicas
por celda, entonces serian necesarias 256 observaciones, lo cual es una cantidad
excesiva de pruebas para fines prcticos.
Por otro lado, se necesitan 128 observaciones para un experimento con 7 factores por
que se deben evaluar 127 posibles efectos (que son los grados de libertad totales en
128 observaciones) de estos efectos 7 son los factores principales, 21 interacciones de
2 factores, 35 de tres, 35 de cuatro, 27 de cinco en cinco, 7 de seis en seis y una
interaccin de 7 factores. En general el nmero de interacciones de k factores tomados
r en r es:
K!
r! (k r)!
El concepto de replicacin fraccionada parte de las siguientes hiptesis:
Pgina 40 de 71
1. Las interacciones de tres o ms factores son sumamente raras en la prctica,
por lo que en general se pueden suponer como no existentes.
Lo anterior implica que por ejemplo para siete factores son necesarios probablemente
solo 28 grados de libertad (7 factores principales y 21 interacciones de dos factores), y
esto equivale a solo 29 unidades de informacin y no 128 como en el experimento
original. Esto quiere decir que no es necesario el correr una replicacin completa de
todo el experimento cuando el nmero de factores crece, sino solamente algunas
casillas o condiciones experimentales.
Cuando solamente una parte de las posibles casillas se prueban, se dice que se tiene
una replicacin fraccionada del experimento.
Las preguntas que surgen son:
Considrese el caso en el que se estudian tres factores de dos niveles cada uno, pero
en el que los experimentadores no pueden costear las 23 = 8 combinaciones de
tratamientos, sin embargo, si se puede costear 4 observaciones. Esto sugiere una
fraccin un medio, de un diseo 23. la fraccin un medio del diseo 23 se conoce
tambin como un diseo 23-1 porque tiene 23-1 = 4 combinaciones de tratamiento.
En la tabla 1 aparecen signos positivos y negativos del diseo 23. Supngase que para
componer la fraccin un medio, se seleccionan las combinaciones de tratamientos se
usa indistintamente la notacin convencional (a,b,c,...) y la de signos positivos y
negativos. La equivalencia de las dos notaciones se muestra a continuacin.
Pgina 41 de 71
Notacin 1 Notacin 2
a + - -
b - + -
c - - +
abc + + +
c ac
b ab
C
B
A
a (1 )
Pgina 42 de 71
Las combinaciones de tratamientos del diseo 23-1 producen 3 G.L. que pueden usase
para estimar los efectos principales. En la tabla 1 se muestra que las combinaciones
lineales de las observaciones que se utilizan para estimar los efectos principales A, B, y
C son:
LA 1/2(a b c abc)
LB 1/2( a b c abc)
LC 1/2( a b c abc)
LBC 1/2(a b c abc)
LAC 1/2( a b c abc)
LAB 1/2( a b c abc)
LA A BC,
LB B AC
LC C AB
A = BC
Pgina 43 de 71
B*I = B*ABC = AB2C = AC
C*I = C*ABC = ABC2 = AB
Esta fraccin un medio o semifraccin, con I = +ABC, suele llamarse fraccin principal.
Ahora supngase que se eligi la otra mitad de la rplica. Esta se compone de las
combinaciones de tratamientos de la tabla 1 que tiene signo negativo asociado con
ABC. Esta fraccin un medio o alterna que consta de las siguientes corridas:
Notacin 1 Notacin 2
(1) ---
ab ++-
ac +-+
abc -++
L' A A BC
L' B B AC
L' C C AB
El diseo anterior 23-1 se conoce como diseo de resolucin III. En tal diseo los alias
de los efectos principales son interacciones de dos factores. Un diseo es resolucin R
si ningn efecto de p factores es alias de otro efecto que tenga menos R p factores.
Usualmente, se emplea el numeral romano como subndice para indicar la resolucin
Pgina 44 de 71
del diseo. As, la fraccin un medio del diseo 23 definido por la relacin I = ABC (o
3 1
bien I = - ABC) constituye un diseo 2III .
1. Diseo con resolucin III: stos son diseos en los que ningn efecto principal es
alias de otro, pero si lo son de las interacciones de dos factores; a su vez, estas
ltimas son alias entre s. El diseo 23-1 de la tabla 4.1 es de resolucin III.
2. Diseo con resolucin IV: En estos diseo ningn efecto principal es alias de otro
efecto principal, o bien, de alguna interaccin de dos factores. Las interacciones
de dos factores son alias entre s. Un diseo 24-1 con I = ABCD es de resolucin
4 1
IV ( 2IV ).
3. Diseos resolucin V: Estos son diseos en los que ningn efecto principal o
interaccin de dos factores es alias de ningn efecto principal o interacciones
entre dos factores, un diseo 25-1 con I = ABCDE es de resolucin V ( 2 5V1 ).
Pgina 45 de 71
6. DISEOS DE EXPERIMENTOS FACTORIALES
COMPLETOS
Un ingeniero decide probar los tres materiales de la cubierta, nico factor controlable
a tres niveles de temperatura (15, 70 y 125 F) consistentes en el entorno de uso final
del producto. Se prueban cuatro bateras a cada combinacin de material de la
cubierta y temperatura, y las 36 pruebas se ejecutan al azar.
Temperatura F
Tipo de material 15 70 125
1 130 155 34 40 20 70
74 180 80 75 82 58
3 150 188 126 122 25 70
159 126 106 115 58 45
3 138 110 174 120 96 104
168 160 150 139 82 60
Pgina 46 de 71
Este diseo es un ejemplo especfico del caso general de un diseo con dos factores
(bifactorial). Para pasar al caso general, sea Yijk la respuesta observada cuando el
factor A se encuentra en el i-simo nivel (i -1, 2,..., n). En general, los datos observados
se vern como en la tabla 2. El orden en el cual se toman las abn observaciones es
aleatorio, de modo que ste es un diseo completamente aleatorizado.
i 1,2,..., a
Yijk i j ij ijk j 1,2,...,b
k 1,2,...,n
En donde es el efecto medio general, i es el efecto del i-simo nivel del factor
rengln A, j es el efecto del j-simo nivel del factor columna B, ()ij es el efecto de la
interaccin entre i y j, ijk es el componente del error aleatorio. Inicialmente se
supone que ambos factores son fijos y que los efectos de tratamiento se definen como
desviaciones de la media general, por lo tanto. ia1i 0; bj1j 0 Se supone que los
Pgina 47 de 71
Ho : 1 2 ...a 0
H1 : al menos una i 0
Ho : 1 2 ...b 0
H1 : al menos una j 0
Sea Yi..; el total de las observaciones bajo el i-simo nivel del factor A; Y.j. El total de
las observaciones bajo el j-simo nivel del factor B, Yij. El total de las observaciones de
la ij-sima celda, e Y... el total general de todas las observaciones. Se definen
Yi..; Y.j. y Yij. y Y... como los promedios de rengln, columna, celda y general,
respectivamente, matemticamente:
b n Yi..
Yi.. Yijk Yi.. ; i 1,2,..., a
j1k 1 bn
a n Y.j.
Y.j. Yijk Y.j. ; j 1,2,...,b
i1k 1 an
n Y... i 1,2,...,a
Yij. Yijk Yij. ;
k 1 n j 1,2,...,b
a b n Y...
Y... Yijk Y...
i1j1k 1 abn
Pgina 48 de 71
La suma total de cuadrados corregida puede expresarse mediante:
n
b Yijk Y...
k 1
2
j1
a
i1
a b n Yi.. Y...
Y.j. Y... Yij. Y... Y.j Y...
2
i1j1 k 1
Yijk Yij.
a b n
Yijk Y...
i1j1 k 1
2
a 2 b 2 a b 2
bn Yi.. Y... an Y.j. Y... n Yij. Yi.. Y.j. Y...
i1 j1 i1j1
a b n
Yijk - Yij.
i1j1 k 1
2
Dado que los seis productos cruzados del segundo miembro de la ecuacin anterior
son iguales a cero. Se observa que la suma total de cuadrados se ha descompuesto en
una suma de cuadrados debida a los renglones o al factor A (SSA) en una suma de
cuadrados debida a las "columnas" o al factor B (SSB), en una suma de cuadrados
debida a la interaccin entre A y B (SSAB), y en una suma de cuadrados debida al error
(SSE): Analizando el ltimo trmino del miembro derecho de la Ecuacin anterior es
posible observar que es necesario tener al menos dos rplicas (n 2) para poder
obtenerla suma de cuadrados del error.
Pgina 49 de 71
Esta descomposicin del total de abn -1 grados de libertad para las sumas de
cuadrados se puede justificar como sigue: Los efectos principales de A y B tienen a y b
niveles, respectivamente, por lo tanto, tienen a -1 y b -1 grados de libertad como se
muestra.
Se observa que la suma de los grados de libertad de los trminos del miembro derecho
de la ecuacin anterior es igual al total de los grados de libertad.
Cada suma de cuadrados dividida entre sus grados de libertad produce una media de
cuadrados.
Si se considera que el modelo estadstico es adecuado y que los trminos del error ijk
son independientes con distribuciones normales con variancia constante 2, entonces
las razones de las medias de cuadrados MSA/MSE, MSB/MSE y MSAB/MSE tienen
distribucin F con a -1, b- 1 y (a -1)(b -1) grados de libertad en el numerador,
respectivamente, y ab(n -1) grados de libertad en el denominador. Las regiones crticas
corresponden al extremo superior de la distribucin F. Usualmente la prueba se
presenta en una tabla de anlisis de variancia como la que aparece en la tabla 2.
Fuente de
Variacin SS G.L. MS Fo
Tratamientos A SSA a - 1 MS A MSA
SS A MSE
a 1
Tratamientos B SSB b - 1 MSB MSB
SSB MSE
b 1
Pgina 50 de 71
Interaccin SSAB (a - 1)(b - 1) MSAB MSAB
SSAB MSE
(a 1)(b 1)
Error SSE ab(n-1) MSB
SSE
ab(n 1)
Total SST abn - 1
Es posible obtener las frmulas para calcular las sumas de cuadrados de la ecuacin
anterior. La suma total de cuadrados se calcula en forma usual mediante:
2
a b n 2 Y ...
SST Y ijk
i1j1k 1 abn
2 2
a Y i.. Y ...
SSA
i1 bn abn
2 2
b Y .j. Y ...
SSB
j1 an abn
2 2
a b Y ij. Y ...
SSsubtotales
i1j1 n abn
Esta suma de cuadrados contiene a la SSA y SSB. Por lo tanto, la segunda etapa consiste
en calcular SSAB mediante:
Pgina 51 de 71
La SSE se calcula por diferencia:
Pgina 52 de 71
2
a b n 2 Y ...
SST Y ijk
i1j1 k 1 abn
2
2 2 2 2 3799
130 155 74 ... 60 77,646.97
36
2 2
a Y i.. Y ...
SSmaterial
i1 bn abn
2 2 2 2
998 1300 1501 3799
10,683.72
(3)(4) 36
2 2
b Y .j. Y ...
SStemperat ura
j1 an abn
2 2 2 2
1738 1291 770 3799
39,118.72
(3)(49 36
2 2
a b Y ij. Y ...
SSinteraccion
i1j1 n abn
2 2 2 2
539 229 ... 342 3799
10,683.72
4 36
39,118.72 9,613.78
18,230.75
Pgina 53 de 71
Fuente de variacin SS G.L. MS Fo
Tipo de material 10,683.72 2 5,341.86 7.91
Temperatura 39,118.72 2 19,558.36 28.97
Interaccin 9,613.78 4 2,403.44 3.56
Error 18,230.75 27 675.21
Total 77,646.97 35
175
150
Duracion promedio
125
Yij. 100
Material tipo 3
75
50 Material tipo 1
Material tipo 2
25
15 70 125
Tempera tura
El hecho de que las rectas no sean paralelas indica una interaccin significativa. En
general, a menor temperatura mayor duracin, independientemente del tipo de
material.
Pgina 54 de 71
Al variar la temperatura de baja a intermedia, la duracin aumenta con el material tipo
3, mientras que disminuye con los materiales tipo 1 y 2,
Pgina 55 de 71
7. DISEO DE EXPERIMENTOS TAGUCHI
7.1 Introduccin
Taguchi ha propuesto una alternativa no del todo diferente que se que conoce como:
Arreglos Ortogonales y las Grficas Lineales.
Pgina 56 de 71
La (b)C
Donde:
a = Representa el nmero de pruebas o condiciones experimentales que se tomarn.
Esto es el nmero de renglones o lneas en el arreglo.
b = Representa los diferentes niveles a los que se tomar cada factor.
c = Es el nmero de efectos independientes que se pueden analizar, esto es el
nmero de columnas.
F A C T O R E S (c)
No. (a) A B C Resultado
1 1 1 1 Y1
2 1 2 2 Y2
3 2 1 1 Y3
4 2 2 1 Y4
tenemos el siguiente:
De acuerdo con la notacin empleada por Taguchi al arreglo mostrado como
ejemplo, se le llama un arreglo L4, por tener cuatro renglones.
En general, para un arreglo a dos niveles, el nmero de columnas (efectos o factores)
que se pueden analizar, es igual al nmero de renglones menos 1.
Taguchi ha desarrollado una serie de arreglos para experimentos con factores a dos
niveles, los ms utilizados y difundidos segn el nmero de factores a analizar son:
Pgina 57 de 71
El arreglo ortogonal ms popular es el arreglo L8, que se muestra a continuacin
junto con sus grficas lineales:
Matriz o
tabla de
interacciones
Columnas 1 2 3 4 5 6 7
1 (1) 3 2 5 4 7 6
2 (2) 1 6 7 4 5
3 (3) 7 6 5 4
4 (4) 1 2 3
5 (5) 1 2
6 (1) 6
7 (7)
1 3 2
3 5
1
.7 5 4
6
2 6 4
(a)
(b) 7
Grficas lineales
Pgina 58 de 71
Los pasos para un diseo de experimentos de parmetros en el caso de menor es
mejor son:
Pgina 59 de 71
El factor de ruido introducido artificialmente es permanganato de potasio.
Factores de ruido Nivel 1 Nivel 2 Nivel 3
N Conc. De KMnO4 0.00375 0.0375 0.075
Se asume que no hay interacciones por lo que se puede utilizar un arreglo L9,
realizando los experimentos se obtienen los datos siguientes con dos rplicas en cada
nivel del factor de ruido:
1 n
S / N 10 log yi2
n i1
A1 = Y1 + Y2 + Y3
A2 = Y4 + Y5 + Y6
A3 = Y7 + Y8 + Y9
Pgina 60 de 71
B1 = Y1 + Y4 + Y7
B2 = Y4 + Y5 + Y8
B3 = Y3 + Y6 + Y9
B12 B22 B33
SSB CF
3
(Y1 Y2 .... Y9 ) 2
CF
9
S = *
Pgina 61 de 71
Total 8 2276.21
S = *
Pgina 62 de 71
Main Effects Plot (data means) for SN ratios
A B
-10
-20
Mean of SN ratios
-30
-40
1 2 3 1 2 3
C D
-10
-20
-30
-40
1 2 3 1 2 3
Signal-to-noise: Smaller is better
45
30
15
Mean of Means
0
1 2 3 1 2 3
C D
60
45
30
15
0
1 2 3 1 2 3
5.70044 -10.5261
Factor levels for predictions
A B C D
1 1 3 2
Pgina 63 de 71
8. REGRESIN Y CORRELACIN LINEAL
8.1 Introduccin
Son dos herramientas para investigar la dependencia de una variable dependiente Y en
funcin de una variable independiente X. Y = f(X)
Regresin lineal - La relacin entre X y Y se representa por medio de una lnea recta
Regresin curvilinea - La relacin entre X y Y se representa por medio de una curva.
Y * *
** * * * *
* * * *
* b1 * * * *
* * * *
* * * * * *
b0
Correlacin positiva Correlacin negativa X
Sin correlacin
Y 0 1 X .........Con.base.en.la. poblacin
Y b0 b1 X e...........Con.base.en.datos.de.la.muestra
*
Y b0 b1 X ................Modelo.de.regresin .estimada
El trmino de error es la diferencia entre los valores reales observados Yi y los valores
estimados por la ecuacin de la recta. Se trata de que estos sean mnimos, para lo cual
se utiliza el mtodo de mnimos cuadrados.
Pgina 64 de 71
*
Y Error Re siduo (Yi Yi )
*
X
Se trata de minimizar la suma de todos los errores o residuos:
Pgina 65 de 71
Y
Yest = 4.4 + 1.08 X
Yi = 23 * Desviacin no explicada
Error = (Yi - Yest) = 1.32
Variacin total
(Yi-media)=5.13 Desviacin explicada
(Yest-Ymedia) = 3.81
Ymedia =17.87
X = 16 X
Pgina 66 de 71
1 10.30 135.625472 52.4176 350.9178 8.0172 5.2111
10 34.93 10.379072 3.0976 34.7770 34.1416 0.6216
15 46.59 118.686672 45.6976 308.2553 48.6551 4.2646
15 44.88 107.127072 45.6976 251.1337 48.6551 14.2512
16 54.12 194.676672 60.2176 629.3676 51.5578 6.5649
17 56.63 241.751472 76.7376 761.6054 54.4605 4.7068
6 22.13 15.462272 5.0176 47.6486 22.5307 0.1606
5 21.15 25.540272 10.4976 62.1385 19.6280 2.3164
206 725.82 2,027.7132 698.5600 6,105.9447 220.0926
SX SY Sxy Sxx Syy = SST SSE
X promedio Y Promedio SXi-X)*(Yi-Y) S(Xi-X)^2 S(Yi-Y)^2
Sxy Sxx Syy
Si todos los puntos estuvieran completamente sobre la recta la ecuacin lineal sera y =
a + bx. Como la correlacin no siempre es perfecta, se calculan a y b de tal forma que
se minimice la distancia total entre puntos y la recta. Los clculos tomando las sumas
de cuadrados siguientes se muestran a continuacin:
Sxy = 2027.71
Sxx = 698.56
Syy = 6105.94
b1 1
( Xi X )(Yi Y ) S XY
= 2.902704421
( Xi X ) 2
S XX
b0 0
Y i 1 X i
Y X = 5.114515575
n
Pgina 67 de 71
SSE ( SST SSE ) SSR
r2 1 = 0.9639
SST SST SST
r r 2 = 0.9816
Resumen
Estadsticas de la regresin
Coeficiente de
correlacin mltiple 0.981811778
Coeficiente de
determinacin R^2 0.963954368
R^2 ajustado 0.962387167
Error tpico 3.093419627
Observaciones 25
Pgina 68 de 71
ANLISIS DE VARIANZA Suma de Promedio de
Grados de Valor crtico
libertad Cuadrados cuadrados F de F
Regresin 1 5885.852069 5885.852069 615.0800898 4.24118E-18
Residuos 23 220.0926348 9.569244992
Total 24 6105.944704
80.00
70.00
60.00 Y Tiempo
Y Tiempo
50.00
Pronstico Y Tiempo
40.00
30.00 Lineal (Pronstico Y
20.00 Tiempo)
10.00
0.00
0 5 10 15 20 25
X Servicios
Pgina 69 de 71
En Options: seleccionar Display Confidence (para media en X) y Prediction Intervals
para X.
En Graphs: Seleccionar Residual for plots Standardized y Normal Plot of residuals
La grfica de residuos debe apegarse a la recta y tener siempre un valor P value
>0.05.
40
30
20
10
0
0 5 10 15 20
X Servicios
1 ( Xi X ) 2
Sy Se 1 ( Xi X ) 2
n SCx Syi Se 1
*
n SCx
IC. para. y!x Y est tSy *
IP . para .Yx Y est tSyi
Pgina 70 de 71
8.5 Ejercicios:
2. En base al porcentaje de puntualidad se trata de ver si hay correlacin con las quejas
en una lnea area. Las quejas son por cada 100000 pasajeros.
%puntos Quejas
Aerolinea X Y
A 81.8 0.21
B 76.6 0.58
C 76.6 0.85
D 75.7 0.68
E 73.8 0.74
F 72.2 0.93
G 70.8 0.72
H 68.5 1.22
Pgina 71 de 71