OBJETIVO
Objetivo general del módulo. Que los asistentes actualicen los conocimientos
necesarios para diseñar, analizar y obtener inferencias sobre experimentos conducentes a
la mejora de productos y procesos en la industria y que sean capaces de aplicar la mejor
estrategia experimental para resolver un problema de desarrollo de productos, o de
calidad en los productos.
Contenido
1. INTRODUCCIÓN AL DISEÑO DE EXPERIMENTOS..................................... 3
Página 2 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
El diseño de experimentos es una técnica estadística que nos ayuda a identificar qué
factores o variables afectan El comportamiento de un proceso productivo y de esta
manera poder mejorarlo.
O bien: es una prueba o una serie de pruebas en las cuales se inducen cambios
deliberados en las variables de entrada de un proceso o sistema, de manera que sea
posible observar e identificar las causas de los cambios en la respuesta de salida.
El proceso o sistema bajo estudio puede representarse por medio del modelo de la figura
1.
Factores controlables
x1 x2 x3 x4 ... xp
Entradas Salida
Proceso
y
z1 z2 z3 z4 ... zq
Factores incontrolables
Figura 1. Modelo general de un proceso o sistema
Algunas de las variables del proceso x1, x2,..., xk son controlables, mientras que otras z1,
z2,...,zk son incontrolables (aunque pueden ser controlables para los fines de prueba).
Entre los objetivos del experimento pueden incluirse:
Página 3 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
2. Determinar el mejor valor de las x que influyen en y, de modo que y tenga casi
siempre un valor cercano a valor nominal deseado.
3. Determinar el mejor valor de las x que influyen en y, de modo que la variabilidad de
y sea pequeña.
4. Determinar el mejor valor de las x que influyen en y, de modo que se minimicen los
efectos de las variables no controlables z1, z2,...zq.
1. ¿Son estas dos soluciones los únicos medios para lograr la respuesta de interés?
2. ¿Existen otros factores que pueden afectar la respuesta de las muestras y que
deban ser investigados o controlados?
3. ¿Cuántas muestras deben ser sometidas a cada solución de templado?
4. ¿En qué forma debe asignarse cada muestra a los tratamientos, y en qué orden
deben realizarse las mediciones?
5. ¿Qué método de análisis debe utilizarse?
6. ¿Qué diferencia en los niveles promedio de respuesta entre los dos tratamientos
debe considerarse como significativa?
Estas, y quizá muchas otras preguntas, deberán ser contestadas satisfactoriamente antes
de llevar a cabo el experimento.
Página 4 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
4. Menores costos totales.
El uso del diseño de experimentos en estas áreas puede dar por resultado productos con
mayor confiabilidad y mejor funcionamiento en el campo, menores costos, y menor tiempo
de diseño y desarrollo del producto.
F2 F1
F11
F21
F22 F12
CARACTERISTICA
DE CALIDAD
F41
F31
F32 Página 5 de 96
F42
F4 F3
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Mediante un experimento podemos inducir cambios en uno varios factores (F 2l. F33 y F11
por ejemplo) y analizar estadísticamente si el cambio en los factores afecta o no el
resultado o efecto del proceso.
Página 6 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Definición de experimento, diseño de experimentos y eficiencia de un experimento
Experimento
Diseño de experimentos
Eficiencia de un experimento
Esto es, un experimento eficiente debe ser lo más simple y económico posible pero
efectivo. Las técnicas del diseño de experimentos pretenden que los experimentos sean
eficientes.
Para que un experimento pueda tener validez estadística se deben de observar al menos
tres principios:
Página 7 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
La diferencia observada como resultado de un experimento es real, o se debe a simple
error aleatorio, o aún más a otro factor como por ejemplo diferente tipo del material. Para
aclarar esto, es necesario repetir el experimento y cuantificar si se presenta
consistentemente o no la variación detectada.
Página 8 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
puede "confundir" o anular el efecto de estos factores no controlables al efectuar las
pruebas siguiendo un orden aleatorio o al azar.
Análisis por bloques. Es una técnica que se usa para incrementar la precisión del
experimento. Un bloque es una porción del material experimental que sea más
homogénea que el total del material o cuando las condiciones son más
homogéneas. Al realizar un experimento por bloques se hacen las comparaciones
entre las condiciones de interés del experimento dentro de cada bloque.
En este paso es necesario definir qué tipo de información es exactamente la que nos
interesa, ya que no podemos medir o variar todos y cada uno de los componentes de un
experimento.
Página 9 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
En conclusión como resultado de este paso, la hipótesis a probar debe quedar bien
definida. Un diagrama causa-efecto es una buena ayuda en este paso.
Cuantitativa
Precisa.
Que tenga algún significado físico.
¿Cómo seleccionar los diferentes niveles de un factor?, En general un factor puede ser
cualitativo (proveedor, turno, operario, etc), o cuantitativo (temperatura, presión, altura,
tiempo, etc.). Los niveles específicos en cualquier caso se pueden seleccionar ya sea
aleatoriamente dentro de un cierto rango o a un nivel fijo definido por el experimentador
previamente, esto nos lleva a cuatro situaciones generales:
Página 10 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
En este caso, de entre los diferentes niveles o tratamientos posibles para el factor, el
experimentador esta interesado en el efecto que ciertos niveles seleccionados por él
previamente tienen sobre la variable de respuesta. Además, el factor es del tipo
cualitativo. Por ejemplo tres proveedores, tres turnos, dos procesos diferentes, etc.
Este caso es similar al anterior excepto que el factor es cuantitativo, por ejemplo:
temperatura, presión, tiempo, concentración de un componente, etc. Para este caso es
recomendable que los diferentes niveles o tratamientos se tomen equiespaciados, esto
es, por ejemplo 10, 20, 30 y 40 °C: 5, 10, 15, 20 y 25 psi; 8, 12, 16 y 20 minutos, etc.
En este caso los niveles o tratamientos se seleccionan al azar de entre varios posibles.
Por ejemplo: se tienen varios lotes de un mismo proveedor, se selecciona al azar cuáles
de ellos analizar, en este caso la conclusión del experimento se extiende para cubrir todos
los posibles niveles..
Igual que en el caso anterior los diferentes niveles o tratamientos son seleccionados al
azar.
En este material, a menos que se especifique lo contrario, los factores se consideran fijos.
Página 11 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
3. Definir el diseño del experimento. Esto imp1ica definir de qué manera se efectuaran las
pruebas y qué modelo matemático describe mejor el experimento. En el resto de este
material se describen varios tipos de experimentos de los cuales se tomará el que mejor
se ajuste a la situación particular.
Este punto pudiera parecer obvio; sin embargo, en la práctica no es sencillo darse cuenta
de que existe un problema que requiere experimentación, ni diseñar un planteamiento
claro y aceptable del mismo. Es necesario desarrollar todas las ideas sobre los objetivos
del experimento. Suele ser importante solicitar la opinión de todas las partes implicadas.
Un planteamiento claro del problema contribuye a menudo en forma sustancial a un mejor
conocimiento del fenómeno y de la solución final del problema.
El experimentador debe elegir los factores que variarán en el experimento, los intervalos
de dicha variación y los niveles específicos de interés a los cuales se hará el experimento.
También debe considerarse la forma en que se controlarán estos factores para
Página 12 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
mantenerlos en los valores deseados, y cómo se les medirá. Para ello es necesario
conocer el proceso de manera práctica y teórica.
Página 13 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
fácil subestimar los aspectos logísticos y de planeación de la realización de un
experimento diseñado.
6. Análisis de datos.
Deben emplearse métodos estadísticos para analizar los datos, de modo que los
resultados y conclusiones sean objetivos más que apreciativos. Existen muchos
excelentes paquetes de software para el análisis de datos, y varios métodos gráficos
sencillos son importantes en la interpretación de tales datos. El análisis de residuos y la
verificación de la idoneidad del modelo son también técnicas de análisis de gran utilidad.
Hay que recordar que los métodos estadísticos sólo proporcionan directrices para la
veracidad y validez de los resultados. Los métodos estadísticos, aplicados
adecuadamente, no permiten probar algo experimentalmente, sólo hacen posible obtener
el probable error de una conclusión, o asignar un nivel de confiabilidad a los resultados.
La principal ventaja de los métodos estadísticos es que agregan objetividad al proceso de
toma de decisiones. Las técnicas estadísticas, aunadas a un buen conocimiento técnico o
del proceso y al sentido común, suelen llevar a conclusiones razonables.
7. Conclusiones y recomendaciones.
Una vez que se han analizado los datos, él experimentador debe extraer conclusiones
prácticas de los resultados y recomendar un curso de acción. En esta fase a menudo son
útiles los métodos gráficos, en especial al presentar los resultados a otras personas.
También deben realizarse corridas de seguimiento y pruebas de confirmación para validar
las conclusiones del experimento.
Página 14 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Es necesario tener claros y en todo caso revisar los siguientes conceptos estadísticos
antes de seguir:
Página 15 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
2. ANÁLISIS DE VARIANZA DE UN FACTOR (ANOVA 1 VÍA)
2.1 Introducción
El análisis de la varianza de un factor (ANOVA) es una metodología para analizar la
variación entre muestras y la variación al interior de las mismas mediante la
determinación de varianzas. Es llamado de una vía porque analiza un variable
independiente o Factor ejemplo: Velocidad. Como tal, es un método estadístico útil
para comparar dos o más medias poblacionales. El ANOVA de un criterio nos permite
poner a prueba hipótesis tales como:
H 0 1 2 3 .... k
H1 : Al menos dos medias poblacionales son diferentes.
Los supuestos en que se basa la prueba t de dos muestras que utiliza muestras
independientes son:
sb2
Fc
sw2
F , ( k 1), k ( n 1))
Donde el número de grados de libertad para el numerador (Sb2 > Sw2) es k-1 y para el
denominador es k(n-1), siendo el nivel de significancia.
k = número de muestras.
Página 16 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Por ejemplo:
TRATAMIENTOS
1. Variación total entre los 14 empleados, su puntuación no fue igual con todos
VARIACIÓN TOTAL RESPECTO A LA MEDIA GENERAL
r c 2
SCT ( Xij X )
i 1 j 1
Página 17 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
2. Variación entre los diferentes tratamientos o Variación entre muestras o
variación entre programa 1, programa 2 y programa 3
r
SCTR rj ( X j X ) 2
j 1
r c
SCE (X ij X j )2
i 1 j 1
4. Grados de libertad
Página 18 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
5. Cuadrados medios (Suma Cuadrados/ Grados libertad)
CMT = Cuadrado medio total = SCT / (n-1) = 19.4
CMTR = Cuadrado medio del tratamiento = SCTR / (c -1) = 32.9
CME = Cuadrado medio del error = SCE/ gle.= 16.9
Gráfica de distribución
F, df1=2, df2=11
1.0
0.8
Densidad
0.6
0.4
Región de Rechazo
0.2
0.05
0.0
0 3.98
X
Región de Aceptación
7. Valor de P Fc
Página 19 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
TABLA DE ANOVA
Regla: No rechazar si la F de la muestra es menor que la F de Excel para una cierta alfa
Página 20 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Grados
ANÁLISIS DE VARIANZA de Promedio de
Suma Probabilida
Variaciones cuadrados libertad Cuadrados Fc d F crítica
32.8571428 1.943164 3.9822979
Entre grupos 65.71428571 2 6 4 0.18937731 6
Dentro de 16.9090909
grupos 186 11 1
Total 251.7142857 13
2.4 Uso de Minitab
Estadística > ANOVA > Un solo factor (Desapilado)
en Respuestas (en columnas separadas) (‘Programa 1’-‘Programa 3’)
En Nivel de confianza 95.0
Seleccionar Comparisons Tukey 5
Aceptar
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Página 23 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Página 24 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Se restó Programa 1 a:
--------+---------+---------+---------+-
Programa 2 (------------*-----------)
Programa 3 (-----------*------------)
--------+---------+---------+---------+-
-6.0 0.0 6.0 12.0
Se restó Programa 2 a:
--------+---------+---------+---------+-
Programa 3 (-----------*----------)
--------+---------+---------+---------+-
-6.0 0.0 6.0 12.0
Página 25 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Página 26 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Página 27 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
ANOVA de un factor
ANOVA
Programa
Suma de Media
gl F Sig.
cuadrados cuadrática
Inter-
65,714 2 32,857 1,943 ,189
grupos
Intra-
186,000 11 16,909
grupos
Total 251,714 13
Página 28 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
ŷij (debe recordarse que para el modelo en un sentido ŷij - yi. , el promedio del tratamiento
i-ésimo). En esta grafica no debe revelarse ningún patrón obvio en la siguiente figura se
grafican los residuos contra los valores ajustados de los datos de la resistencia a la
tensión del ejemplo 2.3 Ningún patrón inusual es evidente.
residuos aumenta a medida que Yij lo hace, y la gráfica de los residuos contra Yij
parecerá un embudo que se ensancha o un altavoz. La varianza variable también ocurre
en casos cuyos datos no tienen distribución normal y están sesgados, porque en las
distribuciones sesgadas la varianza tiende a ser función de la media.
Página 29 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
2.6 Ejercicios
A B C D
75 78 55 64
93 91 66 72
78 97 49 68
71 82 64 77
63 85 70 56
76 77 68 95
A B C
85 71 59
75 75 64
Página 30 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
82 73 62
76 74 69
71 69 75
85 82 67
Página 31 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
3.1 Introducción
En este caso las fórmulas son parecidas a la del ANOVA de una vía pero ahora
agregando el cálculo por renglones adicional al de columnas donde se incluye la
variable de bloqueo. El bloqueo es completamente al azar.
Los tratamientos se asignan a las columnas y los bloques a los renglones. Un bloque
indica condiciones similares de los sujetos al experimentar con diferentes
tratamientos.
Ejemplo 1.
Suponiendo que se quiere investigar si la producción de tres diferentes máquinas es igual,
tomando en cuenta la experiencia de los operadores a un nivel de significancia del 5%.
Experiencia Máquinas
de ops. En Maq 1 Maq 2 Maq 3 Promedios
Página 32 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
años
1 27 21 25 24.33333
2 31 33 35 33
3 42 39 39 40
4 38 41 37 38.66667
5 45 46 45 45.33333
Promedios 36.6 36 36.2 36.26667
TABLA ANOVA
SS GL CM Fc Falfa
SCTR= 0.933333 2 CMTR= 0.466667 Ftr = 0.09 4.46
SCBL= 764.9333 4 CMBL= 191.2333 Fbl = 37.25 3.84
SCE = 41.06667 8 CME= 5.133333
SCT = 806.9333 14 CMT= 57.6381
Rollo
Agente Químico 1 2 3 4 5
1 73 68 74 71 67
2 73 67 75 72 70
Página 33 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
3 75 68 78 73 68
4 73 71 75 75 69
Página 34 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Análisis de varianza de dos factores con una sola muestra por grupo
RESUMEN Cuenta Suma Promedio Varianza
Fila 1 5 353 70.6 9.3
Fila 2 5 357 71.4 9.3
Fila 3 5 362 72.4 19.3
Fila 4 5 363 72.6 6.8
ANÁLISIS DE VARIANZA
Grados F
Fuente de Suma de de Cuadrados Fc Probabilidad tablas
variación Cuadrados libertad medios Valor P
Filas 12.95 3 4.32 2.38 0.12 3.49
Columnas 157 4 39.25 21.61 2.06E-05 3.26
Error 21.8 12 1.82
Total 191.75 19
Total 231 24
En la tabla observamos que el estadístico de prueba Fc es menor al valor crítico para F
2.38<3.49, por lo cual no rechazamos al Hipótesis nula H 0. No tenemos evidencia
estadística para afirmar que el agente químico tenga influencia en la respuesta.
Utilice 0.05 para calcular si hay diferencias entre los efectos de las columnas y los
renglones.
Introducir los datos arreglados con las respuestas en una sola columna e indicando a que
renglón y columna pertenece cada uno de estos, como sigue:
Instrucciones:
Página 37 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Gráficas
Seleccionar Gráfica normal de residuos
OK
Página 38 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Resultados:
La gráfica normal de residuos debe mostrar los residuos aproximados por una recta para
validar el modelo:
Los residuos se aproximan a la distribución normal por lo cual se concluye que se está
utilizando un modelo válido.
Página 39 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
95
90
80
70
Percent
60
50
40
30
20
10
1
-3 -2 -1 0 1 2 3
Residual
Source DF SS MS F P
Agente Químico 3 12.95 4.3167 2.38 0.121
Rollo 4 157.00 39.2500 21.61 0.000
Error 12 21.80 1.8167
Total 19 191.75
Página 40 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
---+---------+---------+---------+------
69.6 70.8 72.0 73.2
Página 41 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
4. DISEÑOS FACTORIALES
Muchos experimentos se llevan a cabo para estudiar los efectos producidos por dos o
más factores. Puede mostrarse que en general los diseños factoriales son los más
eficientes para este tipo de experimentos. Por diseño factorial se entiende aquel en el
que se investigan todas las posibles combinaciones de los niveles de los factores en
cada ensayo completo o réplica del experimento. Por ejemplo, si existen “a” niveles
del factor A y “b” niveles del factor B, entonces cada réplica del experimento contiene
todas las “ab” combinaciones de los tratamientos. A menudo, se dice que los factores
están cruzados cuando éstos se arreglan en un diseño factorial.
Factor B
B1 B2
A1 20 30
Factor A
A2 40 52
40 52 20 30
A 21
2 2
Página 42 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
30 52 20 40
B 11
2 2
Si los factores tienen más de dos niveles, el procedimiento anterior debe ser modificado
ya que las diferencias entre las respuestas promedio pueden expresarse de muchas
formas.
Factor B
B1 B2
A1 20 40
Factor A
A2 50 12
Puede observarse que existe una interacción entre los factores A y B porque el efecto de
A depende del nivel elegido de B.
Página 43 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
que no hay interacción entre los factores. De manera similar, en la Fig. 2 se presenta una
gráfica de la respuesta de los datos de la Tabla 2.
60
B2
50
B1
Respuesta
40
30 B2
20
B1
10
A1 A2
Factor A
En este caso se ve que las rectas B1 y B2 no son paralelas. Esto muestra que existe una
interacción entre A y B. Sin embargo, no debe ser la única técnica para analizar los datos,
porque su interpretación es subjetiva y su apariencia, a menudo, es engañosa.
60 B1
50
B2
Respuesta
40
30
20
B1
10 B2
A1 A2
Factor A
Hay que notar que cuando una interacción es grande los correspondientes efectos
principales tienen poco significado práctico. Una estimación del efecto principal de A de
los datos de la Tabla 2 es:
Página 44 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
50 12 20 40
A 1
2 2
El cual resulta ser muy pequeño corriéndose el riesgo de concluir que no existe un efecto
debido a A. Sin embargo, cuando se examinó el efecto de A en niveles diferentes de B se
concluyó que éste no era el caso. El factor A tiene un efecto, pero depende del nivel del
factor B. En otras palabras, es más útil conocer la interacción AB que el efecto principal.
Una interacción significativa oculta a menudo el significado de los efectos principales.
Las ventajas de los diseños factoriales pueden ilustrarse fácilmente. Supongamos que se
tienen dos factores, A y B, cada uno con dos niveles. Estos niveles se representan
mediante A1, A2, B1 y B1. La información acerca de ambos factores puede obtenerse
variando un factor a la vez como aparece en la tabla 3. El efecto de variar el factor A está
dada por A2B1 -A1B2. A causa de que existe error experimental, es conveniente realizar,
por ejemplo, dos observaciones de cada combinación de tratamientos y hacer una
estimación de los efectos de los factores usando las respuestas promedio. Por lo tanto, se
requiere un total de seis observaciones.
Página 45 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Factor B
B1 B2
A1 A1B1 A1B2
Factor A
A2 A2B1 12
Los diseños factoriales son necesarios cuando alguna interacción puede estar
presente, para evitar hacer conclusiones engañosas.
Ejemplo 1 Considérese una investigación llevada a cabo para estudiar el efecto que tiene
la concentración de un reactivo y la presencia de un catalizador sobre el tiempo de
reacción de un proceso químico. Sea la concentración del reactivo el factor A con dos
niveles de interés, 15% y 20%. El catalizador constituye el factor B; el nivel alto o superior
denota el uso de dos sacos de catalizador y el nivel bajo o inferior denota el uso de un
solo saco. El experimento se realiza (“replica o repite”) tres veces, y los datos son como
sigue:
Página 46 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Combinación de Replica
tratamientos I II III Total
A baja, B baja 28 25 27 80
A alta, B baja 36 32 32 100
A baja, B alta 18 19 23 60
A alta, B alta 31 30 29 90
b = 60(18+19+23) ab = 90(31+30+19)
Cantidad de catalizador B
Alto (2 sacos) +
bajo (1 saco) -
(1) = 80(28+25+27) a = 100(36+32+32)
- +
bajo (15%) alto (20%)
Concentracion de reactivo A
Fig. 3
Página 47 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Así
Por convención (1) se usa para representar a ambos factores en el nivel inferior.
El efecto promedio de un factor se define como el cambio en la respuesta
producida por un cambio en el nivel de ese factor, promediado sobre los niveles del
otro factor.
Como se ilustra en la figura 3, las letras minúsculas (1), a, b y ab también se usan para
representar los totales de las n replicas de las combinaciones de tratamientos
correspondientes. Ahora bien, el efecto de A en el nivel B es {a-(1)}/n. Mientras que el
nivel superior B es {ab-b}/n. Tomando el promedio de estas dos cantidades se obtiene:
1 1
A ab b a (1) ab a b (1)
2n 2n
B
1
ab a b (1) 1
ab b - a (1)
2n 2n
AB
1
ab b a (1) 1
ab (1) a (b)
2n 2n
Página 48 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Por otro lado se puede definir AB como la diferencia promedio entre el efecto de B en el
nivel superior de A y el efecto de B en el nivel inferior de A.
Las formulas para los efectos de A, B y AB pueden deducirse por otro método. El efecto
de A puede hallarse como la diferencia en la respuesta promedio de las dos
combinaciones de tratamiento en la mitad derecha (que llamaremos Y A+, puesto que es la
respuesta promedio para las combinaciones de tratamientos a las que A que se encuentra
en el nivel alto) y las dos combinaciones de tratamientos en la mitad izquierda (o Y A). Esto
es,
A YA YA
ab a b (1)
2n 2n
1
ab a b (1)
2n
B YB YB
ab b a (1)
2n 2n
Página 49 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
1
ab b a (1)
2n
ab (1) ab
AB
2n 2n
1
ab (1) a b
2n
Con los datos que aparecen en la figura 1, las estimaciones de los efectos promedio son:
A
1
90 100 60 80 8.33
2(3)
B
1
90 60 100 80 5.00
2(3)
AB
1
90 80 100 60 1.67
2(3)
Página 50 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
ContrasteA ab a b (1)
Este contraste suele llamarse efecto total de A. A partir de la segunda y tercera ecuación,
puede apreciarse que también se utilizan contraste para estimar B y AB. Además, estos
tres contrastes son ortogonales. La suma de cuadrados de cualquiera de ellos puede
calcularse usando la siguiente ecuación:
SSc 1 a
aciyi. 2 na ci2
.
SSA
ab a b (1)
2
n*4
SSB
ab b a (1)
2
n*4
SSAB
ab (1) a b
2
n*4
Página 51 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Con los datos de la figura 3, las sumas de cuadrados se pueden calcular aplicando las
ecuaciones anteriores, obteniéndose:
2
50
SSA 208.33
4(3)
2
30
SSB 75.00
4(3)
2
10
SSAB 8.33
4(3)
2
2 Y ...
SST i21 2j1 n
k 1 Y ijk
4n
En general SST tiene 4n –1 grados de libertad. La suma de cuadrados del error, con 4(n-
1) G.L. se puede calcular en la forma usual, por diferencia, mediante.
2
2 2 3 2 Y
SS E Yijk 9398.00 9075.00 323.00
i1j1k 1 4(3)
SS E SS T SS A SS B SS AB
Página 52 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Efectos (1) a b Ab
A: -1 +1 -1 +1
B: -1 -1 +1 +1
AB: +1 -1 -1 +1
Fuente de
variación SS G.L. MS Fo
A 208.33 1 208.33 53.15a
B 75.00 1 75.00 19.13a
AB 8.33 1 8.33 2.13
Error 31.34 8 3.92
Total 323.00 11
a significativo al 1%
(1) + - - +
a + + - -
b + - + -
ab + + + +
Observe que los coeficientes de los contrastes usados para estimar la interacción son
iguales al producto de los coeficientes correspondientes a los dos efectos principales. Los
Página 53 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
coeficientes de los contrastes siempre son +1 o –1 y se puede usar una tabla de signos
positivos y negativos como la mostrada en la de signos algebraicos para determinar el
signo apropiado de cada combinación de tratamientos. En el encabezado de las columnas
de tabla y se encuentran los efectos principales (A y B), la interacción AB, e I, que
representa el total el total o el promedio de todo el experimento. Se observa que la
columna encabezada por I se compone de solo de signos positivos. Los renglones
corresponden a las combinaciones de tratamientos.
A
1
ab b a (1) 1
ab a b (1)
2n 2n
Los tipos más sencillos de diseños factoriales implican sólo dos factores o conjuntos de
tratamientos. Haya “a” niveles del factor A y “b” niveles del factor B, dispuestos en un
diseño factorial; esto es, cada A repetición o réplica del experimento contiene todas las
combinaciones de tratamiento ab. En general, hay n repeticiones.
Página 54 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Así por ejemplo cuando se tienen siete factores, existen 128 posibles condiciones
experimentales, lo que implica que al hacer una replicación por celda de todo el
experimento requiere un total de 128 observaciones. Si se decide tomar dos replicas por
celda, entonces serian necesarias 256 observaciones, lo cual es una cantidad excesiva de
pruebas para fines prácticos.
Por otro lado, se necesitan 128 observaciones para un experimento con 7 factores por
que se deben evaluar 127 posibles efectos (que son los grados de libertad totales en 128
observaciones) de estos efectos 7 son los factores principales, 21 interacciones de 2
factores, 35 de tres, 35 de cuatro, 27 de cinco en cinco, 7 de seis en seis y una
interacción de 7 factores. En general el número de interacciones de k factores tomados r
en r es:
Página 55 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
K!
r! (k r)!
El concepto de replicación fraccionada parte de las siguientes hipótesis:
1. Las interacciones de tres o más factores son sumamente raras en la práctica, por
lo que en general se pueden suponer como no existentes.
Lo anterior implica que por ejemplo para siete factores son necesarios probablemente
solo 28 grados de libertad (7 factores principales y 21 interacciones de dos factores), y
esto equivale a solo 29 unidades de información y no 128 como en el experimento
original. Esto quiere decir que no es necesario el correr una replicación completa de todo
el experimento cuando el número de factores crece, sino solamente algunas casillas o
condiciones experimentales.
Cuando solamente una parte de las posibles casillas se prueban, se dice que se tiene una
replicación fraccionada del experimento.
Las preguntas que surgen son:
Página 56 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Considérese el caso en el que se estudian tres factores de dos niveles cada uno, pero en
el que los experimentadores no pueden costear las 2 3 = 8 combinaciones de tratamientos,
sin embargo, si se puede costear 4 observaciones. Esto sugiere una fracción un medio,
de un diseño 23. la fracción un medio del diseño 23 se conoce también como un diseño 23-
1 porque tiene 23-1 = 4 combinaciones de tratamiento.
En la tabla 1 aparecen signos positivos y negativos del diseño 23. Supóngase que para
componer la fracción un medio, se seleccionan las combinaciones de tratamientos se usa
indistintamente la notación convencional (a,b,c,...) y la de signos positivos y negativos. La
equivalencia de las dos notaciones se muestra a continuación.
Página 57 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Notación 1 Notación 2
a + - -
b - + -
c - - +
abc + + +
Efecto factorial
Combinación de
Tratamientos
I A B C AB AC BC ABC
a + + - - - - + +
b + - + - - + - +
c + - - + + - - +
abc + + + + + + + +
ab + + + - + - - -
ac + + - + - + - -
bc + - + + - - + -
(1) + - - - + + + -
Nótese que el diseño 23-1 se forma al seleccionar solo las combinaciones de tratamientos
que producen un signo positivo sobre la columna ABC. Por esto ABC se denomina
generador de una fracción particular. Además, la columna identidad I siempre es positiva,
por lo cual:
I = ABC
abc bc
c ac
b Página 58 de 96 ab
C
B
A
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Las combinaciones de tratamientos del diseño 23-1 producen 3 G.L. que pueden usase
para estimar los efectos principales. En la tabla 1 se muestra que las combinaciones
lineales de las observaciones que se utilizan para estimar los efectos principales A, B, y C
son:
LA 1/2(a b c abc)
LB 1/2( a b c abc)
LC 1/2( a b c abc)
LBC 1/2(a b c abc)
LAC 1/2( a b c abc)
LAB 1/2( a b c abc)
LA A BC,
LB B AC
LC C AB
Página 59 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
La estructura de los alias de este diseño pueden determinarse fácilmente con la relación I
= ABC, multiplicando cualquier efecto por la relación que define al diseño, modulo 2, da
como resultado los alias de dicho efecto. En el ejemplo anterior, los alias son:
A = BC
Esta fracción un medio o semifracción, con I = +ABC, suele llamarse fracción principal.
Ahora supóngase que se eligió la otra mitad de la réplica. Esta se compone de las
combinaciones de tratamientos de la tabla 1 que tiene signo negativo asociado con ABC.
Esta fracción un medio o alterna que consta de las siguientes corridas:
Notación 1 Notación 2
(1) ---
ab ++-
ac +-+
abc -++
Usando la fracción alterna, las combinaciones lineales de las observaciones, L’A, L’B y
L’C, son:
Página 60 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
L' A A BC
L' B B AC
L' C C AB
El diseño anterior 23-1 se conoce como diseño de resolución III. En tal diseño los alias de
los efectos principales son interacciones de dos factores. Un diseño es resolución R si
ningún efecto de p factores es alias de otro efecto que tenga menos R – p factores.
Usualmente, se emplea el numeral romano como subíndice para indicar la resolución del
diseño. Así, la fracción un medio del diseño 23 definido por la relación I = ABC (o bien I = -
3 1
ABC) constituye un diseño 2III .
1. Diseño con resolución III: éstos son diseños en los que ningún efecto principal es
alias de otro, pero si lo son de las interacciones de dos factores; a su vez, estas
últimas son alias entre sí. El diseño 23-1 de la tabla 4.1 es de resolución III.
2. Diseño con resolución IV: En estos diseño ningún efecto principal es alias de otro
efecto principal, o bien, de alguna interacción de dos factores. Las interacciones de
dos factores son “alias” entre sí. Un diseño 24-1 con I = ABCD es de resolución IV (
4 1
2IV ).
Página 61 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
3. Diseños resolución V: Estos son diseños en los que ningún efecto principal o
interacción de dos factores es alias de ningún efecto principal o interacciones entre
dos factores, un diseño 25-1 con I = ABCDE es de resolución V ( 2 5V1 ).
Página 62 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Un ingeniero decide probar los tres materiales de la cubierta, único factor controlable a
tres niveles de temperatura (15, 70 y 125 °F) consistentes en el entorno de uso final del
producto. Se prueban cuatro baterías a cada combinación de material de la cubierta y
temperatura, y las 36 pruebas se ejecutan al azar.
Temperatura F
Tipo de material 15 70 125
1 130 155 34 40 20 70
74 180 80 75 82 58
3 150 188 126 122 25 70
159 126 106 115 58 45
3 138 110 174 120 96 104
168 160 150 139 82 60
Página 63 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
ejemplo del uso del diseño experimental estadístico para el diseño de un producto robusto
(o consistente), un importante problema de ingeniería.
Este diseño es un ejemplo específico del caso general de un diseño con dos factores
(bifactorial). Para pasar al caso general, sea Yijk la respuesta observada cuando el factor
A se encuentra en el i-ésimo nivel (i -1, 2,..., n). En general, los datos observados se
verán como en la tabla 2. El orden en el cual se toman las abn observaciones es aleatorio,
de modo que éste es un diseño completamente aleatorizado.
i 1,2,..., a
Yijk μ τi βj τβ ij εijk j 1,2,...,b
k 1,2,...,n
En donde es el efecto medio general, i es el efecto del i-ésimo nivel del factor renglón
A, j es el efecto del j-ésimo nivel del factor columna B, ()ij es el efecto de la interacción
entre i y j, ijk es el componente del error aleatorio. Inicialmente se supone que ambos
factores son fijos y que los efectos de tratamiento se definen como desviaciones de la
media general, por lo tanto. ia1τi 0; bj1βj 0 Se supone que los efectos de interacción
Página 64 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
son fijos y que se definen dé manera que: i1τβ ij 0 . Hay un total de abn
a
En un diseño factorial de dos factores, tanto los factores (o tratamientos) de renglón como
de columna tienen la misma importancia, específicamente el interés consiste en probar
hipótesis acerca de la igualdad de los efectos de tratamiento de renglón, es decir:
Ho : τ1 τ2 ...τa 0
H1 : al menos una τi 0
Ho : β1 β2 ...βb 0
H1 : al menos una βj 0
Sea Yi..; el total de las observaciones bajo el i-ésimo nivel del factor A; Y.j. El total de las
observaciones bajo el j-ésimo nivel del factor B, Yij. El total de las observaciones de la ij-
ésima celda, e Y... el total general de todas las observaciones. Se definen
Yi..; Y.j. y Yij. y Y... como los promedios de renglón, columna, celda y general,
respectivamente, matemáticamente:
Página 65 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
b n Yi..
Yi.. Yijk Yi.. ; i 1,2,..., a
j1k 1 bn
a n Y.j.
Y.j. Yijk Y.j. ; j 1,2,...,b
i1k 1 an
n Y... i 1,2,...,a
Yij. Yijk Yij. ;
k 1 n j 1,2,...,b
a b n Y...
Y... Yijk Y...
i1j1k 1 abn
n
b Yijk Y...
k 1
2
j1
a
i1
a b n Yi.. Y...
Y.j. Y... Yij. Y... Y.j Y...
2
i1j1 k 1
Yijk Yij.
a b n
Yijk Y...
i1j1 k 1
2
a 2 b 2 a b 2
bn Yi.. Y... an Y.j. Y... n Yij. Yi.. Y.j. Y...
i1 j1 i1j1
a b n
Yijk - Yij.
i1j1 k 1
2
Dado que los seis productos cruzados del segundo miembro de la ecuación anterior son
iguales a cero. Se observa que la suma total de cuadrados se ha descompuesto en una
suma de cuadrados debida a los “renglones” o al “factor” A (SS A) en una suma de
cuadrados debida a las "columnas" o al factor B (SSB), en una suma de cuadrados
debida a la interacción entre A y B (SSAB), y en una suma de cuadrados debida al error
Página 66 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Esta descomposición del total de abn -1 grados de libertad para las sumas de cuadrados
se puede justificar como sigue: Los efectos principales de A y B tienen a y b niveles,
respectivamente, por lo tanto, tienen a -1 y b -1 grados de libertad como se muestra.
Se observa que la suma de los grados de libertad de los términos del miembro derecho de
la ecuación anterior es igual al total de los grados de libertad.
Cada suma de cuadrados dividida entre sus grados de libertad produce una media de
cuadrados.
Página 67 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Por lo tanto, para probar el significado de ambos efectos principales, así como de su
interacción, simplemente deben dividirse las medias de cuadrados correspondientes entre
la media de cuadrados del error. Valores grandes de estas razones implican que los datos
no concuerdan con las hipótesis nulas.
Si se considera que el modelo estadístico es adecuado y que los términos del error ijk
son independientes con distribuciones normales con variancia constante 2, entonces las
razones de las medias de cuadrados MSA/MSE, MSB/MSE y MSAB/MSE tienen distribución
F con a -1, b- 1 y (a -1)(b -1) grados de libertad en el numerador, respectivamente, y ab(n
-1) grados de libertad en el denominador. Las regiones críticas corresponden al extremo
superior de la distribución F. Usualmente la prueba se presenta en una tabla de análisis
de variancia como la que aparece en la tabla 2.
Fuente de
Variación SS G.L. MS Fo
Tratamientos A SSA a-1 MS A MSA
SS A MSE
a 1
Tratamientos B SSB b-1 MSB MSB
SSB MSE
b 1
Interacción SSAB (a - 1)(b - 1) MSAB MSAB
SSAB MSE
(a 1)(b 1)
Error SSE ab(n-1) MSB
SSE
ab(n 1)
Total SST abn - 1
Página 68 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Es posible obtener las fórmulas para calcular las sumas de cuadrados de la ecuación
anterior. La suma total de cuadrados se calcula en forma usual mediante:
2
a b n 2 Y ...
SST Y ijk
i1j1k 1 abn
2 2
a Y i.. Y ...
SSA
i1 bn abn
2 2
b Y .j. Y ...
SSB
j1 an abn
2 2
a b Y ij. Y ...
SSsubtotales
i1j1 n abn
Esta suma de cuadrados contiene a la SSA y SSB. Por lo tanto, la segunda etapa consiste
en calcular SSAB mediante:
Página 69 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Mat.
15 70 125 Yi..
3799
Página 70 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
2
a b n 2 Y ...
SST Y ijk
i1j1 k 1 abn
2
2 2 2 2 3799
130 155 74 ... 60 77,646.97
36
2 2
a Y i.. Y ...
SSmaterial
i1 bn abn
2 2 2 2
998 1300 1501 3799
10,683.72
(3)(4) 36
2 2
b Y .j. Y ...
SStemperat ura
j1 an abn
2 2 2 2
1738 1291 770 3799
39,118.72
(3)(49 36
2 2
a b Y ij. Y ...
SSinteraccion
i1j1 n abn
2 2 2 2
539 229 ... 342 3799
10,683.72
4 36
39,118.72 9,613.78
18,230.75
Página 71 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
175
150
Duracion promedio
125
Yij. 100
Material tipo 3
75
50 Material tipo 1
Material tipo 2
25
15 70 125
Tempera tura
Página 72 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
El hecho de que las rectas no sean paralelas indica una interacción significativa. En
general, a menor temperatura mayor duración, independientemente del tipo de material.
Página 73 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
7.1 Introducción
De estas tres etapas, la más importante es el diseño de parámetros cuyos objetivos son:
a) Identificar qué factores afectan la característica de calidad en cuanto a su magnitud y
en cuanto a su variabilidad.
b) Definir los niveles “óptimos” en que debe fijarse cada parámetro o factor, a fin de
optimizar la operación del producto y hacerlo lo más robusto posible.
c) Identificar factores que no afectan substancialmente la característica de calidad a fin
de liberar el control de estos factores y ahorrar costos de pruebas.
Taguchi ha propuesto una alternativa no del todo diferente que se que conoce como:
Arreglos Ortogonales y las Gráficas Lineales.
Página 74 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
La (b)C
Donde:
a = Representa el número de pruebas o condiciones experimentales que se tomarán.
Esto es el número de renglones o líneas en el arreglo.
b = Representa los diferentes niveles a los que se tomará cada factor.
c = Es el número de efectos independientes que se pueden analizar, esto es el número
de columnas.
F A C T O R E S (c)
No. (a) A B C Resultado
1 1 1 1 Y1
2 1 2 2 Y2
3 2 1 1 Y3
4 2 2 1 Y4
tenemos el siguiente:
De acuerdo con la notación empleada por Taguchi al arreglo mostrado como ejemplo,
se le llama un arreglo L4, por tener cuatro renglones.
En general, para un arreglo a dos niveles, el número de columnas (efectos o factores) que
se pueden analizar, es igual al número de renglones menos 1.
Página 75 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Taguchi ha desarrollado una serie de arreglos para experimentos con factores a dos
niveles, los más utilizados y difundidos según el número de factores a analizar son:
El arreglo ortogonal más popular es el arreglo L8, que se muestra a continuación junto
con sus gráficas lineales:
Matriz o tabla
de
interacciones
Columnas 1 2 3 4 5 6 7
1 (1) 3 2 5 4 7 6
Página 76 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
2 (2) 1 6 7 4 5
3 (3) 7 6 5 4
4 (4) 1 2 3
5 (5) 1 2
6 ¡(1) 6
7 (7)
1 3 2
3 5
1
.7 5 4
6
2 6 4
(a)
(b) 7
Gráficas lineales
Página 77 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
6. Realizar análisis estadístico con base en S/N para identificar los niveles de los factores de
control óptimos Algunas veces ayuda realizar un estudio de la interacción entre factores
de control y de ruido.
7. Realizar análisis estadístico con base en las medias para identificar los niveles de los
factores de control óptimos que ajustan a la respuesta promedio en el nivel deseado. Si
hay conflicto entre los niveles de los factores para maximizar la relación S/N y ajustar la
media, dar prioridad a los que sirven para maximizar la relación S/N.
8. Predecir el desempeño de salida óptimo con base en una combinación óptima de niveles
de factores de control y realiza un experimento confirmatorio.
Las aguas residuales que contienen iones metálicos es muy riesgoso por su toxicidad y
no biodegradable. Se propone utilizar óxidos de hierro hidratados con un pH adecuado
para remover los metales dañinos. La característica de salida es la concentración
remanente de metales en mg/L, con una respuesta menor es mejor.
Página 78 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Se asume que no hay interacciones por lo que se puede utilizar un arreglo L9, realizando
los experimentos se obtienen los datos siguientes con dos réplicas en cada nivel del factor
de ruido:
1 n
S / N 10 log yi2
n i1
A1 = Y1 + Y2 + Y3
Página 79 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
A2 = Y4 + Y5 + Y6
A3 = Y7 + Y8 + Y9
B1 = Y1 + Y4 + Y7
B2 = Y4 + Y5 + Y8
B3 = Y3 + Y6 + Y9
B12 B22 B33
SSB CF
3
(Y Y .... Y9 ) 2
CF 1 2
9
Taguchi Analysis: Rep. 1, Rep. 2, Rep. 1_1, Rep. 2_1, ... versus A, B, C, D
Term Coef
Constant -19.6915
A1 1.8735
Página 80 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
A2 1.6687
B1 4.9386
B2 2.0970
C1 -18.6078
C2 4.3499
D1 -7.8678
D2 4.3221
S=*
Term Coef
Constant 25.2281
A1 -5.8598
A2 0.2819
B1 -6.1548
B2 -8.3748
C1 33.5124
C2 -9.6215
D1 8.4707
D2 0.1513
Página 81 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
S=*
Level A B C D
1 -17.818 -14.753 -38.299 -27.559
2 -18.023 -17.595 -15.342 -15.369
3 -23.234 -26.727 -5.434 -16.146
Delta 5.416 11.974 32.866 12.190
Rank 4 3 1 2
Level A B C D
1 19.368 19.073 58.741 33.699
2 25.510 16.853 15.607 25.379
3 30.806 39.758 1.337 16.606
Delta 11.438 22.904 57.403 17.093
Rank 4 2 1 3
Página 82 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
-10
-20
Mean of SN ratios
-30
-40
1 2 3 1 2 3
C D
-10
-20
-30
-40
1 2 3 1 2 3
Signal-to-noise: Smaller is better
45
30
15
Mean of Means
0
1 2 3 1 2 3
C D
60
45
30
15
0
1 2 3 1 2 3
Predicted values
5.70044 -10.5261
Factor levels for predictions
A B C D
Página 83 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
1 1 3 2
Página 84 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
8.1 Introducción
Son dos herramientas para investigar la dependencia de una variable dependiente Y en
función de una variable independiente X. Y = f(X)
Regresión lineal - La relación entre X y Y se representa por medio de una línea recta
Regresión curvilinea - La relación entre X y Y se representa por medio de una curva.
Y * *
** * * * *
* * * *
* b1 * * * *
* * * *
* *
* * * *
b0
Y 0 1 X .........Con.base.en.la. población
Y b0 b1 X e...........Con.base.en.datos.de.la.muestra
´*
Página 85 de 96
Y b0 b1 X ................Modelo.de.regresión .estimada
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
El término de error es la diferencia entre los valores reales observados Yi y los valores
estimados por la ecuación de la recta. Se trata de que estos sean mínimos, para lo cual
se utiliza el método de mínimos cuadrados.
Página 86 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
*
Error Re siduo (Yi Yi )
Y
*
X
Se trata de minimizar la suma de todos los errores o residuos:
Página 87 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Y
Yest = 4.4 + 1.08
X
Yi = Desviación no
23 * explicada
Error = (Yi - Yest)
= 1.32
Variación
total
(Yi- Desviación
media)=5.13 explicada
(Yest-Ymedia) =
3.81
Ymedia =17.87
X = 16 X
Página 88 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Si todos los puntos estuvieran completamente sobre la recta la ecuación lineal sería y = a
+ bx. Como la correlación no siempre es perfecta, se calculan a y b de tal forma que se
Página 89 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
minimice la distancia total entre puntos y la recta. Los cálculos tomando las sumas de
cuadrados siguientes se muestran a continuación:
Sxy = 2027.71
Sxx = 698.56
Syy = 6105.94
b1 ̂1
( Xi X )(Yi Y ) S XY
= 2.902704421
( Xi X ) 2
S XX
b0 ˆ0
Y i ˆ1 X i
Y ˆX = 5.114515575
n
r r 2 = 0.9816
Página 90 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
El coeficiente de correlación proporciona el nivel de ajuste que tienen los puntos a la línea
recta indicando el nivel de influencia de una variable en la otra. El factor de correlación r
es un número entre –1 (correlación negativa evidente) y +1 (correlación positiva evidente),
y r = 0 indicaría correlación nula.
Resumen
Estadísticas de la regresión
Coeficiente de 0.98181177
correlación múltiple 8
Coeficiente de 0.96395436
determinación R^2 8
0.96238716
R^2 ajustado 7
3.09341962
Error típico 7
Observaciones 25
Página 91 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Promedio
ANÁLISIS DE VARIANZA Suma de de
Grados de Valor crítico
libertad Cuadrados cuadrados F de F
5885.85206 5885.85206 615.080089 4.24118E-
Regresión 1 9 9 8 18
220.092634 9.56924499
Residuos 23 8 2
6105.94470
Total 24 4
Coeficiente Probabilida
s Error típico Estadístico t d Inferior 95%
5.11451557 1.14580412 4.46369100 0.00017721 2.74423916
Intercepción 5 7 4 5 1
2.90270442 0.11704071 24.8008082 4.24118E- 2.66058724
XServicios 1 9 5 18 9
80.00
70.00
60.00 Y Tiempo
Y Tiempo
50.00
Pronóstico Y Tiempo
40.00
30.00 Lineal (Pronóstico Y
20.00 Tiempo)
10.00
0.00
0 5 10 15 20 25
X Servicios
Página 92 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
Para obtener la línea de mejor ajuste de la regresión, se procede como sigue en Minitab:
Stat >Fitted Line Plot ... Indicar la columna de Respuestas Y y la de predictores X,
seleccionar si se quiere ajustar con los datos con una línea, una función cuadrática
o cúbica y aceptar con OK. Observar el mayor valor del coeficiente de correlación
que indica el mejor ajuste.
En Options: seleccionar Display Confidence (para media en X) y Prediction Intervals
para X.
En Graphs: Seleccionar Residual for plots Standardized y Normal Plot of residuals
La gráfica de residuos debe apegarse a la recta y tener siempre un valor P value
>0.05.
40
30
20
10
0
0 5 10 15 20
X Servicios
Página 93 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
1 ( Xi X ) 2
Sy Se 1 ( Xi X ) 2
n SCx Syi Se 1
* n SCx
IC. para. y!x Y est ± tSy *
IP . para .Yx Y est ± tSyi
Página 94 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
8.5 Ejercicios:
2. En base al porcentaje de puntualidad se trata de ver si hay correlación con las quejas
en una línea aérea. Las quejas son por cada 100000 pasajeros.
%puntos Quejas
Aerolinea X Y
A 81.8 0.21
B 76.6 0.58
C 76.6 0.85
D 75.7 0.68
E 73.8 0.74
Página 95 de 96
ESTADÍSTICA APLICA MG. MIGUEL ANGEL MACETAS HERNÁNDEZ
F 72.2 0.93
G 70.8 0.72
H 68.5 1.22
Página 96 de 96