Anda di halaman 1dari 95

ESTADSTICA APLICA

MG. MIGUEL ANGEL


MACETAS HERNNDEZ

OBJETIVO

Objetivo general del mdulo. Que los asistentes actualicen los conocimientos
necesarios para disear, analizar y obtener inferencias sobre experimentos conducentes a
la mejora de productos y procesos en la industria y que sean capaces de aplicar la mejor
estrategia experimental para resolver un problema de desarrollo de productos, o de
calidad en los productos.
Contenido
1. INTRODUCCIN AL DISEO DE EXPERIMENTOS......................................3
1.1 Aplicaciones del diseo de experimentos...................................................4
Definicin de experimento, diseo de experimentos y eficiencia de un experimento
.......................................................................................................................7
1. 2 Principios bsicos del diseo de experimentos.........................................7
1.3. Metodologa general para realizar un experimento.................................9
1.4. Aplicaciones del diseo de experimentos................................................14
2. ANALISIS DE VARIANZA DE UN FACTOR (ANOVA 1 VIA)..........................16
2.1 Introduccin...............................................................................................16
2.2 Tipos de variacin y sumas de cuadrados................................................17
2.3 Uso de Excel:............................................................................................20
2.4 Uso de Minitab..........................................................................................23
2.5 Grafica de residuos contra el valor ajustado de y ij ..................................27
2.6 Ejercicios...................................................................................................32
3. ANALISIS DE VARIANZA DE DOS VAS o DIRECCIONES (ANOVA 2 VIAS)34
3.1 Introduccin...............................................................................................34
3.2 Ejemplos con clculo manual...................................................................34
3.3 Procedimiento en Excel............................................................................36
3.4 ANOVA en Minitab.....................................................................................38

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

4. DISEOS FACTORIALES..............................................................................44
4.1 Principios y definiciones bsicas..............................................................44
Ventajas de los diseos factoriales.............................................................47
4.2 Diseo factorial de dos niveles (2^K)........................................................48
5. DISEOS DE EXPERIMENTOS FRACCIONALES DE DOS NIVELES.......57
5.1 Concepto de replicacin fraccionada........................................................57
5.2 Fraccin un medio del diseo 2k...............................................................58
5.3 Resolucin del diseo...............................................................................63
6. DISEOS DE EXPERIMENTOS FACTORIALES COMPLETOS..................65
6.1 Diseo factorial completo de 2 factores....................................................65
6.2 Anlisis Estadstico del Modelo de Efectos Fijos......................................67
7. DISEO DE EXPERIMENTOS TAGUCHI.....................................................76
7.1 Introduccin...............................................................................................76
7.2 Arreglos ortogonales para experimentos a dos niveles............................77
7.3 Caso menor es mejor................................................................................79
8. REGRESIN Y CORRELACIN LINEAL......................................................87
8.1 Introduccin...............................................................................................87
8.2 Ejemplo manual........................................................................................90
8.3 Uso de Excel.............................................................................................93
8.4 Uso de Minitab..........................................................................................95
8.5 Ejercicios:..................................................................................................97

Pgina 2 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

1. INTRODUCCIN AL DISEO DE EXPERIMENTOS

El diseo de experimentos es una tcnica estadstica que nos ayuda a identificar qu


factores o variables afectan El comportamiento de un proceso productivo y de esta
manera poder mejorarlo.
O bien: es una prueba o una serie de pruebas en las cuales se inducen cambios
deliberados en las variables de entrada de un proceso o sistema, de manera que sea
posible observar e identificar las causas de los cambios en la respuesta de salida.
Experimento: es una prueba o ensayo.
El proceso o sistema bajo estudio puede representarse por medio del modelo de la figura
1.

Pgina 3 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Algunas de las variables del proceso x1, x2,..., xk son controlables, mientras que otras z1,
z2,...,zk son incontrolables (aunque pueden ser controlables para los fines de prueba).
Entre los objetivos del experimento pueden incluirse:
1. Determinar cules variables tiene mayor influencia en la respuesta, y.
2. Determinar el mejor valor de las x que influyen en y, de modo que y tenga casi
siempre un valor cercano a valor nominal deseado.
3. Determinar el mejor valor de las x que influyen en y, de modo que la variabilidad de
y sea pequea.
4. Determinar el mejor valor de las x que influyen en y, de modo que se minimicen los
efectos de las variables no controlables z1, z2,...zq.
Lo mtodos de diseo experimental tiene un propsito que puede ser desarrollar un
proceso consistente o robusto; esto es, un proceso que no sea afectado por
fuentes de variabilidad externas o ruido (las zi).
En el diseo de experimentos se plantean varias preguntas importantes:
1. Son estas dos soluciones los nicos medios para lograr la respuesta de inters?
2. Existen otros factores que pueden afectar la respuesta de las muestras y que
deban ser investigados o controlados?
3. Cuntas muestras deben ser sometidas a cada solucin de templado?
4. En qu forma debe asignarse cada muestra a los tratamientos, y en qu orden
deben realizarse las mediciones?
5. Qu mtodo de anlisis debe utilizarse?

Pgina 4 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

6. Qu diferencia en los niveles promedio de respuesta entre los dos tratamientos


debe considerarse como significativa?
Estas, y quiz muchas otras preguntas, debern ser contestadas satisfactoriamente antes
de llevar a cabo el experimento.
1.1 Aplicaciones del diseo de experimentos
El diseo de experimentos puede servir para mejorar el rendimiento de un proceso de
manufactura, desarrollo de nuevos procesos con lo que se logra:
1. Mejorar el rendimiento del proceso.
2. Menor variabilidad y mayor apego a los requerimientos nominales y objetivos.
3. Menor tiempo de desarrollo.
4. Menores costos totales.
Los mtodos de diseo de experimentos tambin se aplican al diseo de productos como
sigue:
1. Evaluacin y comparacin de conceptos de diseo bsicos.
2. Evaluacin de materiales alternativos.
3. Seleccin de parmetros de diseo de modo que el producto funcione bien desde una
amplia variedad de condiciones de uso real; Esto es, de modo que el producto sea
consistente (robusto).
El uso del diseo de experimentos en estas reas puede dar por resultado productos con
mayor confiabilidad y mejor funcionamiento en el campo, menores costos, y menor tiempo
de diseo y desarrollo del producto.
El diseo estadstico de experimentos es el proceso de planear un experimento para
obtener datos apropiados, que pueden ser analizados mediante mtodos estadsticos, con
objeto de producir conclusiones vlidas y objetivas.

Pgina 5 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Cuando se identifican los factores y su influencia en un sistema productivo, se pueden


tomar decisiones que efectivamente mejoren la

calidad del producto o servicio. Se

pueden identificar las fuentes de variacin reales para su reduccin en la bsqueda de la


mejora continua.
Cuando se usan experimentos pretendemos analizar el efecto de cambios que nosotros
inducimos ms que analizar variaciones al azar. Por ejemplo, mediante un diagrama
causa-efecto podemos identificar las posibles causas o factores que inciden en un efecto
o respuesta especifica tal y como s muestra en la figura 2

F1

F2

F11

F21
F12

F22

CARACTERISTICA
DE C ALIDAD

F41
F31
F32

F42
F4

F3

Figura 1.2 Diagrama de Causa Efecto

Mediante un experimento podemos inducir cambios en uno varios factores (F 2l. F33 y F11
por ejemplo) y analizar estadsticamente si el cambio en los factores afecta o no el
resultado o efecto del proceso.

Pgina 6 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Definicin de experimento, diseo de experimentos y eficiencia de un experimento


Experimento
Es un conjunto de pruebas estructurado y coherente que son analizadas a fin de
comprender la operacin del proceso.
Diseo de experimentos
Es el proceso de planear, ejecutar y analizar el experimento de manera que los datos
apropiados sean recolectados,

y que estos tengan validez estadstica para obtener

conclusiones vlidas y tiles. Se entiende por validez estadstica, el que los resultados se
puedan repetir consistentemente sobre todo en la operacin a gran escala o masiva.
Eficiencia de un experimento
Un experimento es eficiente cuando:
1. Se obtiene la informacin requerida.
2. Con el mnimo consumo de recursos.
Esto es, un experimento eficiente debe ser lo ms simple y econmico posible pero
efectivo. Las tcnicas del diseo de experimentos pretenden que los experimentos sean
eficientes.
1. 2 Principios bsicos del diseo de experimentos

ara que un experimento pueda tener validez estadstica se deben de observar al


menos tres principios:
Reproduccin. Esto significa que el experimento se pueda llevar a cabo o repetir
bajo las mismas condiciones en ms de una ocasin.

Pgina 7 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

La diferencia observada como resultado de un experimento es real, o se debe a simple


error aleatorio, o an ms a otro factor como por ejemplo diferente tipo del material. Para
aclarar esto, es necesario repetir el experimento y cuantificar si se presenta
consistentemente o no la variacin detectada.
La reproduccin por lo tanto es importante por al menos dos razones:
i)

Permite cuantificar el error aleatorio inherente al proceso y

ii)

Permite una mejor estimacin de los parmetros.

Aleatoriedad. Esto significa que tanto el material asignado a un experimento en


particular, como el orden en que se efectan las pruebas se efectu de una manera
aleatoria.

Suponga por ejemplo, que se desea saber si la temperatura influye en el nivel de


contaminacin de un producto, medida en mgms/lt, para esto primero efecta cuatro
pruebas a una temperatura de 80C y enseguida cuatro pruebas a 90C, los Resultados
son:
80C
90C

2.2
3.4

A primera vista con la

2.8
3.9

3.2
4.3

3.6
4.7

2.95
4.07

temperatura de 80C se ve que tiene menor nivel de

contaminacin, sin embargo, algo raro se observa, el nivel de contaminacin siempre


aumenta, esto se debe a que los residuos que

quedan en el equipo aumentan

constantemente la contaminacin del producto. Esto se puede

evitar lavando

perfectamente el material, lo cual puede no ser fsicamente posible. "En lugar de esto
podemos confundir, anular o igualar este efecto, realizando las pruebas en orden
aleatorio bajo las dos temperaturas.
En una diagrama causa-efecto con un gran nmero de factores afectando la caracterstica
de calidad, si se desea analizar el efecto de uno o varios factores, se debera controlar y
medir todos los otros factores y aun as no eliminara el error aleatorio, en lugar de esto se
puede "confundir" o anular el efecto de estos factores no controlables al efectuar las
pruebas siguiendo un orden aleatorio o al azar.
Pgina 8 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

La aleatoriedad por lo tanto es importante por al menos dos razones


i)

Confunde el efecto de factores no controlables y

ii)

Valida las pruebas estadsticas al hacer que los errores experimentales sean
estadsticamente independientes.

Anlisis por bloques. Es una tcnica que se usa para incrementar la precisin
del experimento. Un bloque es una porcin del material experimental que sea ms
homognea que el total del material o cuando las condiciones son ms
homogneas. Al realizar un experimento por bloques se hacen las comparaciones
entre las condiciones de inters del experimento dentro de cada bloque.

1.3. Metodologa general para realizar un experimento


Se sugieren varias metodologas en la literatura, la siguiente es una de ellas:

1. Identifique claramente el problema o situacin a resolver. Antes de poder planear un


experimento necesitamos definir claramente que es la que estamos buscando, aun
cuando esto puede parecer trivial en ocasiones es tanta la presin para tomar decisiones
que corremos a experimentar sin por lo menos definir claramente nuestros objetivos.
En este paso es necesario definir qu tipo de informacin es exactamente la que nos
interesa, ya que no podemos medir o variar todos y cada uno de los componentes de un
experimento.
En ocasiones escuchamos que el experimento fue un xito pero la calidad no mejor.
Antes de planear un experimento se debe de investigar y. analizar el conocimiento y datos
que ya se tengan sobre este problema. La participacin activa del personal involucrado
en el problema es de vital importancia en este paso.
En conclusin como resultado de este paso, la hiptesis a probar debe quedar bien
definida. Un diagrama causa-efecto es una buena ayuda en este paso.

Pgina 9 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

2. Identificar variables. En este paso dos tipos de variables se deben de identificar,


variables dependientes y factores o variables independientes.
La variable dependiente o variable de respuesta es la

caracterstica de calidad que

queremos mejorar y cuyo comportamiento deseamos conocer, ejemplos de esta son:


porcentaje de contaminacin, satisfaccin de un cliente, desgaste de una herramienta,
tiempo, de falla, etc.
Es deseable que una variable dependiente rena las caractersticas siguientes:

Cuantitativa

Precisa.

Que tenga algn significado fsico.

Las variables independientes o factores representan aquellas causas o factores cuyo


efecto sobre la variable dependiente se quiere analizar. Cada uno de estos factores se
deber probar al menos a dos valores diferentes para evaluar su efecto, a cada uno de
estos valores o niveles se les llama tratamientos. Por ejemplo, si queremos conocer el
efecto de la temperatura sobre la dureza de un material y para ello se realizan pruebas a
70, 80 y 90C se dice que tenemos un experimento de un solo factor con tres
tratamientos. Otra vez es de vital importancia la participacin del personal involucrado en
el problema a fin de seleccionar apropiadamente los factores o variables independientes y
los niveles de cada factor o tratamiento de inters.
Cmo seleccionar los diferentes niveles de un factor?, En general un factor puede ser
cualitativo (proveedor, turno, operario, etc), o cuantitativo (temperatura, presin, altura,
tiempo, etc.). Los niveles especficos en cualquier caso se pueden seleccionar ya sea
aleatoriamente dentro de un cierto rango o a un nivel fijo definido por el experimentador
previamente, esto nos lleva a cuatro situaciones generales:
A. Factor fijo, cualitativo.
En este caso, de entre los diferentes niveles o tratamientos posibles para el factor, el
experimentador esta interesado en el efecto que ciertos niveles seleccionados por l

Pgina 10 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

previamente tienen sobre la variable de respuesta. Adems, el

factor es del tipo

cualitativo. Por ejemplo tres proveedores, tres turnos, dos procesos diferentes, etc.

B. Factor fijo, cuantitativo.


Este caso es similar al anterior excepto que el factor es cuantitativo, por ejemplo:
temperatura, presin, tiempo, concentracin de un componente, etc. Para este caso es
recomendable que los diferentes niveles o tratamientos se tomen equiespaciados, esto
es, por ejemplo 10, 20, 30 y 40 C: 5, 10, 15, 20 y 25 psi; 8, 12, 16 y 20 minutos, etc.
La conclusin a que se puede llegar con este caso es si la variable de respuesta es
diferente para cada uno de los tratamientos que se seleccionaron y de ser as el tipo de
relacin que existe entre el factor y la variable de respuesta (lineal, cuadrtica, etc.).
C. Factor aleatorio, cualitativo.
En este caso los niveles o tratamientos se seleccionan al azar de entre varios posibles.
Por ejemplo: se tienen varios lotes de un mismo proveedor, se selecciona al azar cules
de ellos analizar, en este caso la conclusin del experimento se extiende para cubrir todos
los posibles niveles..
D. Factor aleatorio, cuantitativo.
Igual que en el caso anterior los diferentes niveles o tratamientos son seleccionados al
azar.
Por ejemplo para la temperatura si el rango de inters es de 0 a 100. Se puede al azar
seleccionar 5 niveles 7, 36, 46, 80 y 8 C. La conclusin que se puede obtener en este
caso es similar al caso c.
En este material, a menos que se especifique lo contrario, los factores se consideran fijos.

Pgina 11 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

3. Definir el diseo del experimento. Esto imp1ica definir de qu manera se efectuaran las
pruebas y qu modelo matemtico describe mejor el experimento. En el resto de este
material se describen varios tipos de experimentos de los cuales se tomar el que mejor
se ajuste a la situacin particular.
4. Efectuar el experimento. Esto de acuerdo a lo que se defina en el paso 3.
5. Anlisis de los datos. Estos son bsicamente anlisis estadsticos.
6. Conclusiones y toma de decisiones.
Una metodologa (alterna) desarrollada por Douglas C. Montgomery es la siguiente:
Para usar un enfoque estadstico al disear y analizar un experimento se requiere que
todos los participantes en l tengan de antemano una idea clara de qu es exactamente lo
que se va a estudiar, cmo se van a recopilar los datos y, al menos, una idea cualitativa
de cmo se van a analizar. A continuacin, se ofrece una gua del procedimiento
recomendado:
1. Comprensin y planteamiento del problema.
Este punto pudiera parecer obvio; sin embargo, en la prctica no es sencillo darse cuenta
de que existe un problema que requiere experimentacin, ni disear un planteamiento
claro y aceptable del mismo. Es necesario desarrollar todas las ideas sobre los objetivos
del experimento. Suele ser importante solicitar la opinin de todas las partes implicadas.
Un planteamiento claro del problema contribuye a menudo en forma sustancial a un mejor
conocimiento del fenmeno y de la solucin final del problema.
2. Eleccin de factores y niveles.
El experimentador debe elegir los factores que variarn en el experimento, los intervalos
de dicha variacin y los niveles especficos de inters a los cuales se har el experimento.
Tambin debe considerarse la forma en que se controlarn estos factores para

Pgina 12 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

mantenerlos en los valores deseados, y cmo se les medir. Para ello es necesario
conocer el proceso de manera prctica y terica.
3. Seleccin de la variable de respuesta.
Al seleccionar la respuesta o variable dependiente, el experimentador debe estar seguro
de que la respuesta que se va a medir realmente provea informacin til acerca del
proceso de estudio. Con mayor frecuencia, el promedio o la desviacin estndar (o
ambos) de la caracterstica medida sern la variable de respuesta. No son raras las
respuestas mltiples. La capacidad de medicin (o el error de medicin) tambin es un
factor importante. Si la capacidad de medicin es deficiente, slo puede esperarse que el
experimento detecte efectos relativamente grandes de los factores; en caso contrario
deben hacerse repeticiones.
4. Eleccin del diseo experimental.
Para elegir el diseo es necesario considerar el tamao muestral (nmero de
repeticiones), seleccionar un orden adecuado para los ensayos experimentales, y
determinar si hay implicado bloqueo u otras restricciones de aleatorizacin.
Es importante tener presente los objetivos experimentales al seleccionar el diseo, se
tiene inters en identificar qu factores causan diferencias en estimar la magnitud del
cambio de la respuesta. En otras situaciones habr ms inters en verificar la
uniformidad. Por ejemplo, pueden compararse dos condiciones de produccin A y 8,
siendo A la estndar y B una alternativa de menor costo. El investigador estar interesado
en demostrar que no hay diferencia en cuanto a la productividad (por ejemplo), entre las
dos condiciones.
5. Realizacin del experimento.
Cuando se realiza el experimento, es vital vigilar el proceso cuidadosamente para
asegurar que todo se haga conforme a lo planeado. En esta fase, los errores en el
procedimiento suelen anular la validez experimental. La planeacin integral es decisiva
para el proceso. En un complejo entorno de manufactura o investigacin y desarrollo, es

Pgina 13 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

fcil subestimar los aspectos logsticos y de planeacin de la realizacin de un


experimento diseado.
6. Anlisis de datos.
Deben emplearse mtodos estadsticos para analizar los datos, de modo que los
resultados y conclusiones sean objetivos ms que apreciativos. Existen muchos
excelentes paquetes de software para el anlisis de datos, y varios mtodos grficos
sencillos son importantes en la interpretacin de tales datos. El anlisis de residuos y la
verificacin de la idoneidad del modelo son tambin tcnicas de anlisis de gran utilidad.
Hay que recordar que los mtodos estadsticos slo proporcionan directrices para la
veracidad

validez

de

los

resultados.

Los

mtodos

estadsticos,

aplicados

adecuadamente, no permiten probar algo experimentalmente, slo hacen posible obtener


el probable error de una conclusin, o asignar un nivel de confiabilidad a los resultados.
La principal ventaja de los mtodos estadsticos es que agregan objetividad al proceso de
toma de decisiones. Las tcnicas estadsticas, aunadas a un buen conocimiento tcnico o
del proceso y al sentido comn, suelen llevar a conclusiones razonables.
7. Conclusiones y recomendaciones.
Una vez que se han analizado los datos, l experimentador debe extraer conclusiones
prcticas de los resultados y recomendar un curso de accin. En esta fase a menudo son
tiles los mtodos grficos, en especial al presentar los resultados a otras personas.
Tambin deben realizarse corridas de seguimiento y pruebas de confirmacin para validar
las conclusiones del experimento.

1.4. Aplicaciones del diseo de experimentos.


En muchas ocasiones l termino experimento se considera asociado exclusivamente para
cuestiones cientficas y tericas; sin embargo tienen varias aplicaciones prcticas.
Algunos ejemplos son:

Pgina 14 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Si la materia prima que es entregada por tres diferentes

proveedores producen

caractersticas diferentes en el producto

Si diferentes marcas de herramienta tienen o no vida diferente.

Si la temperatura de recocido afecta o no alguna propiedad mecnica del producto.

Si diferentes cabezales de una misma mquina producen productos similares.

Si un nuevo mtodo de ensamble incrementa o no la productividad en una lnea de


produccin.

Cul es el factor que ms influye en la variabilidad de alguna caracterstica de calidad.

Es necesario tener claros y en todo caso revisar los siguientes conceptos estadsticos
antes de seguir:

Qu es una prueba de hiptesis?

Qu e s un error tipo I y Qu es un error tipo II?

Qu es una prueba t para comparar dos medias?

Qu es la potencia de una prueba de hiptesis?

Qu es control estadstico?.

Qu es nivel de significancia?.

Pgina 15 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

2. ANLISIS DE VARIANZA DE UN FACTOR (ANOVA 1 VA)

2.1 Introduccin
El anlisis de la varianza de un factor (ANOVA) es una metodologa para analizar la
variacin entre muestras y la variacin al interior de las mismas mediante la
determinacin de varianzas. Es llamado de una va porque analiza un variable
independiente o Factor ejemplo: Velocidad. Como tal, es un mtodo estadstico til
para comparar dos o ms medias poblacionales. El ANOVA de un criterio nos permite
poner a prueba hiptesis tales como:

H 0 1 2 3 .... k
H 1 : Al menos dos medias poblaciona les son diferentes.
Los supuestos en que se basa la prueba t de dos muestras que utiliza muestras
independientes son:
1. Ambas poblaciones son normales.
2
2
2. Las varianzas poblacionales son iguales, esto es, 1 2 .

El estadstico tiene una distribucin muestral resultando:

Fc

sb2
sw2

El valor crtico para la prueba F es:

F , ( k 1), k ( n 1))
Donde el nmero de grados de libertad para el numerador (Sb 2 > Sw2) es k-1 y para el
denominador es k(n-1), siendo el nivel de significancia.
k = nmero de muestras.

Pgina 16 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Por ejemplo:
Ejemplo: Se tienen 14 empleados seleccionados al azar que se someten a
3 diferentes cursos de entrenamiento: Programa 1, Programa 2 y Programa 3.
Como los empleados se seleccionan aleatoriamente para cada programa
el diseo se denomina DISEO COMPLETAMENTE ALEATORIZADO
Se observa el aprovechamiento de los empleados en los programas:
TRATAMIENTOS
I

r=1
r=2
r=3
r=4
r=5
Medias

c=1

c=2
Programa

c=3

Programa 1 2
Programa 3
85
80
82
72
84
80
83
81
85
80
78
90
**
82
88
80.00
81.00
85.00
Xj
Media de medias o media
total

82.14

2.2 Tipos de variacin y sumas de cuadrados


1. Variacin total entre los 14 empleados, su puntuacin no fue igual con todos
VARIACIN TOTAL RESPECTO A LA MEDIA GENERAL
r

SCT
i 1

( Xij X )

j 1

SCT = (85-82.14)2 + (72-82.14)2+(83-82.14)2+.....+(88-82.14)2


SCT = 251.7

Pgina 17 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

2. Variacin entre los diferentes tratamientos o Variacin entre muestras

variacin entre programa 1, programa 2 y programa 3


EFECTO DE LA MEDIA DE CADA TRATAMIENTO RESPECTO A LA MEDIA GENERAL
r

SCTR rj ( X j X ) 2
j 1

SCTR = 4(79.5 - 81.3333)2 + 5(81 - 81.3333)2 + 5(85 - 81.333)2


SCTR = 65.71
3. Variacin dentro de un tratamiento o muestra o programa dado que no todos los
empleados dentro de un mismo programa obtuvieron los mismos puntajes. Se denomina
Variacin dentro de los tratamientos.
VARIACIN DENTRO DEL TRATAMIENTO O VARIACIN DEL ERROR
CADA VALOR RESPECTO A LA MEDIA DE SU TRATAMIENTO
r

SCE
i 1

(X
j 1

ij

SCE = SCT - SCTR =

X j )2

186

4. Grados de libertad
Grados de libertad totales = n - 1 = 14-1 = 13
Grados de libertad de los tratamientos = c - 1 = 3 - 1 = 2
Grados de libertad del error = gl. Totales - gl. Tratamientos = 13 - 2 = 11
gl SCT = gl SCTR + gl SCE
gl SCE = gl SCT - gl SCTR = (n -1) - (c - 1) = n -c

Pgina 18 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

5. Cuadrados medios (Suma Cuadrados/ Grados libertad)


CMT =

Cuadrado medio total = SCT / (n-1) =

19.4

CMTR = Cuadrado medio del tratamiento = SCTR / (c -1) = 32.9


CME =

Cuadrado medio del error = SCE/ gle.=

16.9

6. Estadstico de prueba Fc y estadstico F crtico de alfa


Fc = CMTR / CME=

1.946745562

Falfa, gl.numerador, gl.deno min ador F ,c 1,n c

Clculo de F con Excel


=DISTR.F.INV(ALFA, GL. TR, GL. ERR)

=DISTR.F.INV(0.05, 2, 11) = 3.982297957

Grfica de distribucin
F, df1=2, df2=11
1.0

Densidad

0.8

0.6

0.4

Regin de

0.2

0.0

0.05
0

3.98

Regin de
Como Fc es menor a F no se rechaza Ho y las medias son iguales.
7. Valor de P Fc
P = distr.f(Fc, gl. SCTr, gl. SCE) = distr.f(1.946, 2, 11) = 0.18898099
Como P es mayor a alfa no se rechaza Ho
CONCLUSION: NO HAY SUFICIENTE EVIDENCIA PARA RECHAZAR HO, LAS MEDIAS
DE LOS TRATAMIENTOS SON IGUALES

Pgina 19 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

TABLA DE ANOVA
FUENTE DE VARIACIN SUMA DE

GRADOS DE

CUADRADOS

LIBERTAD

Entre muestras (tratam.) SCTR

c-1

CMTR

Dentro de muestras (err.) SCE

n-c

CME

Variacin total

n-1

CMT

SCT

CUADRADO
MEDIO

VALOR F

CMTR/CME

Regla: No rechazar si la F de la muestra es menor que la F de Excel para una cierta alfa
2.3 Uso de Excel:

En el men herramientas seleccione la opcin Anlisis de datos, en funciones


para anlisis seleccione Anlisis de varianza de un factor.

En Rango de entrada seleccionar la matriz de datos (todas las columnas a la vez).

Alfa = 0.05

En Rango de salida indicar la celda donde se iniciar la presentacin de resultados.

Uso de Excel: Anlisis de varianza de un factor

Pgina 20 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

RESUMEN Anlisis de varianza de un factor


Grupos
Cuenta
Suma Promedio
Programa 1
Programa 2
Programa 3

4
5
5

320
405
425
Grado

Varianza
32.66666

80
81
85

7
5
17

Promedio

ANLISIS DE VARIANZA s de
de
Suma
liberta
Variaciones
Entre
grupos
Dentro de
grupos
Total

cuadrados
65.7142857

Probabilid

Cuadrados
Fc
ad
F crtica
32.857142 1.943164 0.1893773 3.9822979

86
16.909090

186
251.714285

11

91

13

Pgina 21 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

2.4 Uso de Minitab


Estadstica > ANOVA > Un solo factor (Desapilado)
en Respuestas (en columnas separadas) (Programa 1-Programa 3)
En Nivel de confianza 95.0
Seleccionar Comparisons Tukey 5
Aceptar

Pgina 22 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

ANOVA unidireccional: Programa 1, Programa 2, Programa 3


Fuente GL

SC

MC

Factor 2 65.7 32.9 1.94 0.189


Error 11 186.0 16.9
Total 13 251.7
S = 4.112 R-cuad. = 26.11% R-cuad.(ajustado) = 12.67%
ICs de 95% individuales para la media
basados en Desv.Est. agrupada
Nivel

N Media Desv.Est. ----+---------+---------+---------+-----

Programa 1 4 80.000

5.715 (------------*------------)

Programa 2 5 81.000

2.236

Programa 3 5 85.000

4.123

(----------*-----------)
(-----------*----------)

----+---------+---------+---------+----77.0

80.5

84.0

87.5

Desv.Est. agrupada = 4.112


Intervalos de confianza simultneos de Tukey del 95%
Todas las comparaciones en parejas

Pgina 23 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Nivel de confianza individual = 97.94%


Se rest Programa 1 a:
Inferior Centro Superior
Programa 2

-6.451 1.000

8.451

Programa 3

-2.451 5.000

12.451

--------+---------+---------+---------+Programa 2

(------------*-----------)

Programa 3

(-----------*------------)

--------+---------+---------+---------+-6.0

0.0

6.0

12.0

Se rest Programa 2 a:
Inferior Centro Superior
Programa 3

-3.025 4.000

11.025

--------+---------+---------+---------+Programa 3

(-----------*----------)

--------+---------+---------+---------+-6.0

0.0

6.0

12.0

NOTA: Si el cero se encuentra en el intervalo de confianza de la diferencia entre medias,


este par de medias no son diferentes.

Pgina 24 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Uso de PASW Statistics


Se realiza una modificacin
TRATAMIENTOS
Programa
r=1
r=2
r=3
r=4
r=5

Programa 1
85
72
83
80
**

2
80
84
81
78
82

Programa 3
82
80
85
90
88

Los tratamientos (Programa 1, Programa 2 y Programa 3) se escriben en una sola


columna y a los factores se le asigna una letra (A =1, B= 2 y C =3)

Analizar > Comparar medias>ANOVA de un solo factor


en Lista de dependientes: (Programa)
En Factor: (Factor)
Aceptar
Pgina 25 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Pgina 26 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

SAVE OUTFILE='C:\Users\MIGUELITO\Desktop\anova.sav' /COMPRESSED.


ONEWAY Programa BY Factor
/PLOT MEANS
/MISSING ANALYSIS
/POSTHOC=LSD ALPHA(0.05).
ANOVA de un factor
ANOVA
Programa
Suma de
cuadrados
Intergrupos
Intragrupos
Total

gl

Media
cuadrtica

65,714

32,857

186,000

11

16,909

251,714

13

Pgina 27 de 95

Sig.

1,943

,189

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

2.5 Grafica de residuos contra el valor ajustado de y ij

i el modelo es correcto y las suposiciones se satisfacen, los residuos no deben


tener algn patrn, ni deben estar relacionados con alguna variable, incluyendo
la respuesta Yij. Una comprobacin sencilla consiste en graficar los residuos

contra los valores ajustados y ij (debe recordarse que para el modelo en un sentido y ij - yi. ,
el promedio del tratamiento i-simo). En esta grafica no debe revelarse ningn patrn
obvio en la siguiente figura se grafican los residuos contra los valores ajustados de los
datos de la resistencia a la tensin del ejemplo 2.3 Ningn patrn inusual es evidente.

Grafica de residuos contra valores ajustados


Un efecto que en ocasiones revela la grfica es el de una varianza variable. Algunas
veces la varianza de las observaciones lo hace. Esto resulta cuando el error es
proporcional a la magnitud de la observacin (comnmente esto sucede en instrumentos
de medicin el error es proporcional a la escala de la lectura). Si este es el caso, los
residuos aumenta a medida que Yij lo hace, y la grfica de los residuos contra Yij
parecer un embudo que se ensancha o un altavoz. La varianza variable tambin ocurre
en casos cuyos datos no tienen distribucin normal y estn sesgados, porque en las
distribuciones sesgadas la varianza tiende a ser funcin de la media.

Pgina 28 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

2.6 Ejercicios
1. Cuatro catalizadores que pueden afectar la concentracin de un componente en una
mezcla lquida de tres componentes estn siendo investigado.
Se obtienen las siguientes concentraciones:
Catalizado
A
58.2
57.2
58.4
55.8
54.9

r
B
56.3
54.5
57
55.3

C
50.1
54.2
55.4

D
52.9
49.9
50
51.7

2. Para determinar si existe diferencia significativa en el nivel de Matemticas de 4 grupos


de estudiantes de Ingeniera

se realiz un examen aleatorio a 6 individuos por grupo.

Determine cuales son los grupos en los cuales existen diferencias a un 95% de nivel de
confianza.
A
75
93
78
71
63
76

B
78
91
97
82
85
77

C
55
66
49
64
70
68

D
64
72
68
77
56
95

3. Las calificaciones en el examen a 18 empleados de tres unidades de negocio


Se muestran a continuacin:
Probar si no hay diferencia entre las unidades a un 5% de nivel de significancia.
A
85
75
82
76
71
85

B
71
75
73
74
69
82

C
59
64
62
69
75
67

Pgina 29 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

4. Probar si hay diferencia en los tiempos de servicio de 4 unidades de negocio para el


mismo servicio a un nivel de significancia del 5%.
A
5.4
7.8
5.3
7.4
8.4
7.3

B
8.7
7.4
9.4
10.1
9.2
9.8

C
11.1
10.3
9.7
10.3
9.2
8.8

D
9.9
12.8
12.1
10.8
11.3
11.5

Pgina 30 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

3. ANLISIS DE VARIANZA DE DOS VAS o DIRECCIONES (ANOVA 2 VAS)

3.1 Introduccin
En este caso las frmulas son parecidas a la del ANOVA de una va pero ahora
agregando el clculo por renglones adicional al de columnas donde se incluye la
variable de bloqueo. El bloqueo es completamente al azar.
Se trata de bloquear un factor externo que probablemente tenga efecto en la
respuesta pero que no hay inters en probar su influencia, slo se bloquea para
minimizar la variabilidad de este factor externo, evitando que contamine la prueba de
igualdad entre los tratamientos.
Los tratamientos se asignan a las columnas y los bloques a los renglones. Un bloque
indica condiciones similares de los sujetos al experimentar con diferentes
tratamientos.
Las hiptesis son:
Ho: No hay diferencia en las medias del factor de columna
Ha: Al menos una media del factor de columna es diferente
Ho: No hay diferencia en las medias de la variable de rengln
Ha: Al menos una media de la variable de rengln es diferente
3.2 Ejemplos con clculo manual
Ejemplo 1.
Suponiendo que se quiere investigar si la produccin de tres diferentes mquinas es igual,
tomando en cuenta la experiencia de los operadores a un nivel de significancia del 5%.
Experiencia
de ops. En
aos

Mquinas
Maq 1

Maq 2

Maq 3

Pgina 31 de 95

Promedios

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

1
2
3
4
5
Promedios

27
31
42
38
45
36.6

21
33
39
41
46
36

25
35
39
37
45
36.2

24.33333
33
40
38.66667
45.33333
36.26667

TABLA ANOVA
SCTR=
SCBL=
SCE =
SCT =

SS
0.933333
764.9333
41.06667
806.9333

GL
2
4
8
14

CM
CMTR= 0.466667
CMBL= 191.2333
CME= 5.133333
CMT= 57.6381

Fc
Ftr = 0.09
Fbl = 37.25

Falfa
4.46
3.84

Conclusin: No hay diferencia entre mquinas a pesar de la diferencia en experiencia de


los operadores.
Ejemplo 2 (Problema 4.1 del Texto de Montgomery, Anlisis y diseo de
experimentos)
Un qumico quiere probar el efecto de 4 agentes qumicos sobre la resistencia de un tipo
particular de tela. Debido a que podra haber variabilidad de un rollo de tela a otro, el
qumico decide usar un diseo de bloques aleatorizados, con los rollos de tela
considerados como bloques. Selecciona 5 rollos y aplica los 4 agentes qumicos de
manera aleatoria a cada rollo. A continuacin se presentan las resistencias a la tencin
resultantes. Analizar los datos de este experimento (utilizar =0.05) y sacar las
conclusiones apropiadas.
Agente Qumico
1
2
3
4

1
73
73
75
73

2
68
67
68
71

Rollo
3
74
75
78
75

Pgina 32 de 95

4
71
72
73
75

5
67
70
68
69

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

3.3 Procedimiento en Excel

En el men herramientas seleccione la opcin Anlisis de datos, en funciones para


anlisis seleccione Anlisis de varianza de dos factores con una sola muestra por
grupo.

En Rango de entrada seleccionar la matriz de datos.

Alfa = 0.05

En Rango de salida indicar la celda donde se iniciar la presentacin de resultados.

Pgina 33 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Uso de Excel: Anlisis de varianza de dos vas

Pgina 34 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Anlisis de varianza de dos factores con una sola muestra por


grupo
Varianz
RESUMEN Cuenta Suma Promedio
Fila 1
5
353
70.6
Fila 2
5
357
71.4
Fila 3
5
362
72.4
Fila 4
5
363
72.6

Columna 1
Columna 2
Columna 3
Columna 4
Columna 5

1
3
3
2.92
1.67

4
4
4
4
4

294
274
302
291
274

73.5
68.5
75.5
72.75
68.5

9.3
9.3
19.3
6.8

ANLISIS DE VARIANZA
F
Fuente
de

Grados Cuadrado
Suma de
Cuadrado

variacin
Filas
Columna

de

s
libertad
12.95
3

s
medios
4.32

Probabilida tabla
Fc

2.38

d
Valor P
0.12

3.49

s
157
4
39.25
21.61
2.06E-05 3.26
Error
21.8
12
1.82
Total
191.75
19
Total
231
24
En la tabla observamos que el estadstico de prueba Fc es menor al valor crtico para F
2.38<3.49, por lo cual no rechazamos al Hiptesis nula H 0. No tenemos evidencia
estadstica para afirmar que el agente qumico tenga influencia en la respuesta.
Sin embargo observamos que el rollo si tiene influenza significativa en la respuesta
(P<0.05).
3.4 ANOVA en Minitab
Utilice 0.05 para calcular si hay diferencias entre los efectos de las columnas y los
renglones.

Pgina 35 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Introducir los datos arreglados con las respuestas en una sola columna e indicando a que
rengln y columna pertenece cada uno de estos, como sigue:
Column
Resp
73
73
75
73
68
67
68
71
74
75
78
75
71
72
73
75
67
70
68
69

a
1
1
1
1
2
2
2
2
3
3
3
3
4
4
4
4
5
5
5
5

Fila
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4

Instrucciones:
Estadstica > ANOVA > Dos factores
Respuesta Respuesta,

indicar Factor fila y Factor de la columna, Seleccionar

Mostrar
Medias Seleccionar Almacenar Residuos

Almacenar ajustes

95%
Grficas
Seleccionar Grfica normal de residuos
OK

Pgina 36 de 95

Nivel de confianza

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Pgina 37 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Resultados:
La grfica normal de residuos debe mostrar los residuos aproximados por una recta para
validar el modelo:
Los residuos se aproximan a la distribucin normal por lo cual se concluye que se est
utilizando un modelo vlido.
Normal Probability Plot of the Residuals
(response is Resp)
99

95
90

Percent

80
70
60
50
40
30
20
10
5

-3

-2

-1

0
Residual

Pgina 38 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Two-way ANOVA: Resistencia versus Agente Qumico, Rollo


Source

DF

SS

MS

Agente Qumico 3 12.95 4.3167 2.38 0.121


Rollo

4 157.00 39.2500 21.61 0.000

Error

12 21.80 1.8167

Total

19 191.75

S = 1.348 R-Sq = 88.63% R-Sq(adj) = 82.00%


Como el valor de P es menor a 0.05 el Rollo tiene influencia significativa en la resistencia.
Individual 95% CIs For Mean Based on
Agente

Pooled StDev

Qumico Mean ---+---------+---------+---------+-----1

70.6 (----------*----------)

71.4

72.4

72.6

(----------*----------)
(----------*----------)
(----------*----------)

---+---------+---------+---------+-----69.6

70.8

72.0

73.2

Individual 95% CIs For Mean Based on


Pooled StDev
Rollo Mean --+---------+---------+---------+------1

73.50

(-----*-----)

68.50 (-----*-----)

75.50

72.75

68.50 (-----*-----)

(-----*-----)
(-----*-----)

--+---------+---------+---------+------67.5

70.0

72.5

75.0

Pgina 39 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Se seleccionaran en 2 y 5 rollo ya que tienen los valores ms pequeos.

Pgina 40 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

4. DISEOS FACTORIALES

4.1 Principios y definiciones bsicas


Muchos experimentos se llevan a cabo para estudiar los efectos producidos por dos o
ms factores. Puede mostrarse que en general los diseos factoriales son los ms
eficientes para este tipo de experimentos. Por diseo factorial se entiende aquel en el
que se investigan todas las posibles combinaciones de los niveles de los factores en
cada ensayo completo o rplica del experimento. Por ejemplo, si existen a niveles
del factor A y b niveles del factor B, entonces cada rplica del experimento contiene
todas las ab combinaciones de los tratamientos. A menudo, se dice que los factores
estn cruzados cuando stos se arreglan en un diseo factorial.
El efecto de un factor se define como el cambio en la respuesta producida por un
cambio en el nivel del factor. Con frecuencia, ste se conoce como efecto principal
porque se refiere a los factores de inters primordial del experimento. Por ejemplo,
consideremos los datos de la tabla 1. El efecto principal del factor A podra
interpretarse como la diferencia entre la respuesta promedio en el primer y segundo
nivel de ese factor. Numricamente:

Factor B
B1

B2

A1

20

30

A2

40

52

Factor A

Tabla 1 Un experimento factorial

40 52
2

20 30
2

21

Pgina 41 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

En otras palabras incrementar el factor A del nivel 1 al 2 produce un cambio en la


respuesta promedio de 21 unidades. Similarmente, el efecto principal de B es:

30 52
2

20 40

11

Si los factores tienen ms de dos niveles, el procedimiento anterior debe ser modificado
ya que las diferencias entre las respuestas promedio pueden expresarse de muchas
formas.
En algunos experimentos puede encontrarse que la diferencia en la respuesta entre los
niveles de un factor no es la misma en todos los niveles de los otros factores. Cuando
esto ocurre existe una interaccin entre los factores. Por ejemplo, considrense los datos
de la Tabla 2.
Factor B
B1

B2

A1

20

40

A2

50

12

Factor A

Tabla 2. Un experimento factorial con interaccin


En el primer nivel del factor B, el efecto de A es:
A = 50 - 20 = 30
Mientras que en el segundo nivel de B, el efecto de A es:
A = 12 - 40 = 28
Puede observarse que existe una interaccin entre los factores A y B porque el efecto de
A depende del nivel elegido de B.
Estas ideas pueden ilustrarse grficamente. En la Fig. 1 se muestra una grfica de la
respuesta de los datos de la Tabla 1 contra los niveles del factor A para ambos niveles del
factor B. Se observa que las rectas B 1 y B2 son, aproximadamente, paralelas. Esto indica

Pgina 42 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

que no hay interaccin entre los factores. De manera similar, en la Fig. 2 se presenta una
grfica de la respuesta de los datos de la Tabla 2.

60

B2

50

B1

40
30
20
10

B2
B1
A1

Factor A

A2

Figura 1 Un experimento factorial sin interacciones


En este caso se ve que las rectas B1 y B2 no son paralelas. Esto muestra que existe una
interaccin entre A y B. Sin embargo, no debe ser la nica tcnica para analizar los datos,
porque su interpretacin es subjetiva y su apariencia, a menudo, es engaosa.

60
50
40

B1
B2

30
20
10

B1
A1

B2
Factor A

A2

Figura 2 Un experimento factorial con interacciones


Hay que notar que cuando una interaccin es grande los correspondientes efectos
principales tienen poco significado prctico. Una estimacin del efecto principal de A de
los datos de la Tabla 2 es:

Pgina 43 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ
A

50 12
2

20 40
2

MG. MIGUEL ANGEL


1

El cual resulta ser muy pequeo corrindose el riesgo de concluir que no existe un efecto
debido a A. Sin embargo, cuando se examin el efecto de A en niveles diferentes de B se
concluy que ste no era el caso. El factor A tiene un efecto, pero depende del nivel del
factor B. En otras palabras, es ms til conocer la interaccin AB que el efecto principal.
Una interaccin significativa oculta a menudo el significado de los efectos principales.

Ventajas de los diseos factoriales

as ventajas de los diseos factoriales pueden ilustrarse fcilmente. Supongamos


que se tienen dos factores, A y B, cada uno con dos niveles. Estos niveles se
representan mediante A1, A2, B1 y B1. La informacin acerca de ambos factores

puede obtenerse variando un factor a la vez como aparece en la tabla 3. El efecto de


variar el factor A est dada por A2B1 -A1B2. A causa de que existe error experimental, es
conveniente realizar, por ejemplo, dos observaciones de cada combinacin de
tratamientos y hacer una estimacin de los efectos de los factores usando las respuestas
promedio. Por lo tanto, se requiere un total de seis observaciones.

Pgina 44 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL


Factor B
B1

B2

A1

A1B1

A1B2

A2

A2B1

12

Factor A

Tabla 3 El mtodo de un factor a la vez


Los diseos factoriales poseen algunas ventajas.

Son ms eficientes que los experimentos de un factor a la vez.

Los diseos factoriales son necesarios cuando alguna interaccin puede estar
presente, para evitar hacer conclusiones engaosas.

Los diseos factoriales permiten estimar los efectos de un factor en diversos


niveles de los otros factores, produciendo conclusiones que son vlidas sobre toda
la extensin de las condiciones experimentales.

4.2 Diseo factorial de dos niveles (2K)

l primer diseo de la serie 22 es aquel en el que solo dos factores, A y B, cada


uno con dos niveles. Este diseo se conoce como diseo factorial 2 2.
Arbitrariamente, los niveles del factor pueden llamarse bajo y alto.

Ejemplo 1 Considrese una investigacin llevada a cabo para estudiar el efecto que tiene
la concentracin de un reactivo y la presencia de un catalizador sobre el tiempo de
reaccin de un proceso qumico. Sea la concentracin del reactivo el factor A con dos
niveles de inters, 15% y 20%. El catalizador constituye el factor B; el nivel alto o superior
denota el uso de dos sacos de catalizador y el nivel bajo o inferior denota el uso de un
solo saco. El experimento se realiza (replica o repite) tres veces, y los datos son como
sigue:

Pgina 45 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Combinacin de

Replica

tratamientos

I
28
36
18
31

A baja, B baja
A alta, B baja
A baja, B alta
A alta, B alta

II
25
32
19
30

III
27
32
23
29

Total
80
100
60
90

En la figura 3 siguiente se presentan grficamente las combinaciones de tratamiento para


este diseo, el efecto de un factor se denota por la letra latina minscula. De este modo,
A se refiere al efecto del factor A, y B se refiere al efecto del factor B, y AB se
refiere a la interaccin entre AB. En el diseo 2 2 los niveles bajo y alto de A y B se denotan
por - y + respectivamente, en los ejes A y B. As en el eje B representa el nivel bajo
de catalizador mientras que + denota el nivel alto.

Alto (2 sacos) +

bajo (1 saco) -

b = 60(18+19+23)

ab = 90(31+30+19)

(1) = 80(28+25+27)

a = 100(36+32+32)

bajo (15%)

+
alto (20%)

Concentracion de reactivo A
Figura 1: Combinaciones de tratamiento en el diseo factoriall

Fig.
3
Las cuatro combinaciones de tratamientos en el diseo pueden representarse por letras
minsculas, cono se muestra en la figura 3. En esta figura se aprecia que el nivel superior
de cualquier factor de una combinacin de tratamientos est representado por la
presencia de la letra minscula correspondiente, mientras que la ausencia de esta ultima
representa el nivel inferior del factor.
As
Pgina 46 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

a representa la combinacin de tratamientos, en la que A se encuentra en el nivel

superior y B en el nivel inferior;

b representa aquella en la que A se halla en el nivel inferior y B en el superior, y

ab representa a ambos factores en el nivel superior.

Por convencin (1) se usa para representar a ambos factores en el nivel inferior.

El efecto promedio de un factor se define como el cambio en la respuesta


producida por un cambio en el nivel de ese factor, promediado sobre los niveles del
otro factor.

Como se ilustra en la figura 3, las letras minsculas (1), a, b y ab tambin se usan para
representar los totales de las n replicas de las combinaciones de tratamientos
correspondientes. Ahora bien, el efecto de A en el nivel B es {a-(1)}/n. Mientras que el
nivel superior B es {ab-b}/n. Tomando el promedio de estas dos cantidades se obtiene:

1
2n

ab b a (1)

ab a b (1)

2n

El efecto promedio de B se determina a partir de su efecto en el nivel inferior de A (esto


es, {b-(1)}/n, y de su efecto en el nivel superior de A (que es igual a [ab-a]/n obtenindose:

1
2n

ab a b (1)

1
2n

ab b - a (1)

El efecto de la interaccin AB se define como la diferencia promedio entre el efecto de A


en el nivel superior de B y su efecto en el nivel inferior de B, as:

AB

1
2n

ab b a (1)

1
2n

ab (1) a (b)

Pgina 47 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Por otro lado se puede definir AB como la diferencia promedio entre el efecto de B en el
nivel superior de A y el efecto de B en el nivel inferior de A.

Las formulas para los efectos de A, B y AB pueden deducirse por otro mtodo. El efecto
de A puede hallarse como la diferencia en la respuesta promedio de las dos
combinaciones de tratamiento en la mitad derecha (que llamaremos Y A+, puesto que es la
respuesta promedio para las combinaciones de tratamientos a las que A que se encuentra
en el nivel alto) y las dos combinaciones de tratamientos en la mitad izquierda (o Y A). Esto
es,

A YA YA

ab a
2n
1
2n

b (1)
2n

ab a b (1)

Este es exactamente el mismo resultado, el efecto de B se encuentra como la diferencia


entre el promedio de las dos combinaciones de tratamientos en la parte superior del
cuadrado ( Y B+) y el promedio de las dos combinaciones de tratamientos en la parte inferior
( Y B-), o

B YB YB

ab b
2n

a (1)
2n

Pgina 48 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

2n

MG. MIGUEL ANGEL

ab b a (1)

Finalmente el efecto de interaccin AB es el promedio de las combinaciones de


tratamientos en la diagonal de derecha a izquierda del cuadrado ab y (1) menos el
promedio de las combinaciones de tratamientos en la diagonal de izquierda a derecha (a y
b), o

ab (1)

AB

2n

1
2n

ab
2n

ab (1) a b

Con los datos que aparecen en la figura 1, las estimaciones de los efectos promedio son:

1
2(3)
1
2(3)

AB

90 100 60 80 8.33

90 60 100 80 5.00

1
2(3)

90 80 100 60 1.67

El efecto de A (concentracin de reactivo) es positivo; esto sugiere que al elevar A del


nivel bajo (15%) al nivel alto (25%) incrementar el rendimiento. El efecto de B
(catalizador) es negativo; esto sugiere que elevar la cantidad del catalizador agregada al
proceso reducir el rendimiento. Al parecer, el efecto de interacciones es pequeo
comparado con los dos efectos principales.

Pgina 49 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

En muchos experimentos que implican diseos 2 K se examina la magnitud y la direccin


de los efectos de los factores para determinar cuales variables es probable que sean
importantes. Por lo general puede emplearse el anlisis de varianza para confirmar esta
interpretacin. En el diseo 2 k existen algunos mtodos rpidos especiales para realizar
los clculos del anlisis de varianza.
Consideremos la suma de cuadrados para A, B y AB. Obsrvese la primera ecuacin que
se utiliza un contraste para estimar A; esto es,

ContrasteA ab a b (1)
Este contraste suele llamarse efecto total de A. A partir de la segunda y tercera ecuacin,
puede apreciarse que tambin se utilizan contraste para estimar B y AB. Adems, estos
tres contrastes son ortogonales. La suma de cuadrados de cualquiera de ellos puede
calcularse usando la siguiente ecuacin:

aciyi. 2
SSc 1

2
n a
a ci

Esta ecuacin establece que la suma de cuadrados de contraste es igual al contraste


elevado al cuadrado entre el producto del nmero de las observaciones de cada total del
contraste por la suma de cuadrados de los coeficientes del mismo. En consecuencia, se
obtiene que las sumas de cuadrados de A, B y AB sean:

ab a b (1)
SSA
n*4

ab b a (1)
SSB
n*4

ab (1) a b
SSAB
n*4

Pgina 50 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Con los datos de la figura 3, las sumas de cuadrados se pueden calcular aplicando las
ecuaciones anteriores, obtenindose:

SSA

SSB

50

2
208.33

4(3)
30

SSAB

4(3)
10

75.00

4(3)

8.33

La suma total de cuadrados se determina de la manera usual mediante:

SS T i21 2j1 n
k 1 Y ijk

2
Y ...
4n

En general SST tiene 4n 1 grados de libertad. La suma de cuadrados del error, con 4(n-1)
G.L. se puede calcular en la forma usual, por diferencia, mediante.
2
2 2 3
Y
2
SS E Yijk
9398.00 9075.00 323.00
i1j1k 1
4(3)

SS E SS T SS A SS B SS AB

323.00 208.33 75.00 8.33 31.34


El anlisis de varianza completo se presenta en la tabla siguiente. Ambos efectos
principales son significativos al 1%.

A menudo se es conveniente escribir las combinaciones de tratamientos en el orden (1),


a, b, y ab. Este orden se conoce como orden estndar. Cuando se utiliza es posible
apreciar que los coeficientes de los contrastes usados para estimar los efectos son
Pgina 51 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Efectos
A:

(1)
-1

a
+1

b
-1

Ab
+1

B:

-1

-1

+1

+1

AB:

+1

-1

-1

+1

Tabla ANOVA para los datos del ejemplo 1 es la siguiente:


Fuente de
variacin
A

SS
208.33

B
AB
Error
Total

G.L.
1

MS
208.33

Fo

75.00

75.00

19.13a

8.33

8.33

2.13

31.34

3.92

53.15a

323.00
11
significativo al 1%

Signos algebraicos para calcular los efectos en un diseo 2 2


Combinacin

Efecto Factorial

De
Tratamientos

I A B AB

(1)

+ - - +

+ + - -

+ - + -

ab

+ + + +

Observe que los coeficientes de los contrastes usados para estimar la interaccin son
iguales al producto de los coeficientes correspondientes a los dos efectos principales. Los
coeficientes de los contrastes siempre son +1 o 1 y se puede usar una tabla de signos
positivos y negativos como la mostrada en la de signos algebraicos para determinar el
signo apropiado de cada combinacin de tratamientos. En el encabezado de las columnas
de tabla y se encuentran los efectos principales (A y B), la interaccin AB, e I, que
representa el total el total o el promedio de todo el experimento. Se observa que la

Pgina 52 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

columna encabezada por I se compone de solo de signos positivos. Los renglones


corresponden a las combinaciones de tratamientos.

Para encontrar un contraste con el fin de estimar cualquier efecto, simplemente se


multiplican los signos de la columna apropiada de la tabla por la correspondiente
combinacin de tratamientos, y se suma. Por ejemplo, el contraste para estimar A es (1)
+ a b + ab, lo cual concuerda con la ecuacin.

1
2n

ab b a (1)

1
2n

ab a b (1)

Los tipos ms sencillos de diseos factoriales implican slo dos factores o conjuntos de
tratamientos. Haya a niveles del factor A y b niveles del factor B, dispuestos en un
diseo factorial; esto es, cada A repeticin o rplica del experimento contiene todas las
combinaciones de tratamiento ab. En general, hay n repeticiones.

Pgina 53 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

5. DISEOS DE EXPERIMENTOS FRACCIONALES DE DOS NIVELES

5.1 Concepto de replicacin fraccionada


Conforme el nmero de factores del experimento crece, el nmero de casillas o
condiciones experimentales (y por lo tanto el nmero de lecturas o pruebas
necesarias), crece exponencialmente en un experimento factorial. El nmero de
efectos a evaluar (interacciones principalmente) crece exponencialmente tambin. El
nmero de efectos y casillas vara con el nmero de factores en una relacin como se
muestra en la tabla siguiente para un experimento factorial 2 k.

As por ejemplo cuando se tienen siete factores, existen 128 posibles

condiciones

experimentales, lo que implica que al hacer una replicacin por celda de todo el
experimento requiere un total de 128 observaciones. Si se decide tomar dos replicas por
celda, entonces serian necesarias 256 observaciones, lo cual es una cantidad excesiva de
pruebas para fines prcticos.
Por otro lado, se necesitan 128 observaciones para un experimento con 7 factores por
que se deben evaluar 127 posibles efectos (que son los grados de libertad totales en 128
observaciones) de estos efectos 7 son los factores principales, 21 interacciones de 2
factores, 35 de tres, 35 de cuatro, 27 de cinco en cinco, 7 de seis en seis y una
interaccin de 7 factores. En general el nmero de interacciones de k factores tomados r
en r es:

Pgina 54 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

K!

r! (k r)!
El concepto de replicacin fraccionada parte de las siguientes hiptesis:
1. Las interacciones de tres o ms factores son sumamente raras en la prctica, por
lo que en general se pueden suponer como no existentes.
2. En un experimento de varios factores lo ms probable es que solo algunos de ellos
sean relevantes para la variable de respuesta.
3. La mayor parte del efecto se debe a los factores principales y algunas
interacciones de dos factores.
Lo anterior implica que por ejemplo para siete factores son necesarios probablemente
solo 28 grados de libertad (7 factores principales y 21 interacciones de dos factores), y
esto equivale a solo 29 unidades de informacin y no 128 como en el experimento
original. Esto quiere decir que no es necesario el correr una replicacin completa de todo
el experimento cuando el nmero de factores crece, sino solamente algunas casillas o
condiciones experimentales.
Cuando solamente una parte de las posibles casillas se prueban, se dice que se tiene una
replicacin fraccionada del experimento.
Las preguntas que surgen son:
1. Cuntas y cuales casillas probar?
2. Cmo analizar los resultados?
3. Qu informacin se pierde?
El responder a estas preguntas es uno de los objetivos de la replicacin fraccionaria.
5.2 Fraccin un medio del diseo 2k

Pgina 55 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

onsidrese el caso en el que se estudian tres factores de dos niveles cada uno,
pero en el que los experimentadores no pueden costear las 2 3 = 8
combinaciones de tratamientos, sin embargo, si se puede costear 4

observaciones. Esto sugiere una fraccin un medio, de un diseo 2 3. la fraccin un medio


del diseo 23 se conoce tambin como un diseo 2 3-1 porque tiene 23-1 = 4 combinaciones
de tratamiento.
En la tabla 1 aparecen signos positivos y negativos del diseo 2 3. Supngase que para
componer la fraccin un medio, se seleccionan las combinaciones de tratamientos se usa
indistintamente la notacin convencional (a,b,c,...) y la de signos positivos y negativos. La
equivalencia de las dos notaciones se muestra a continuacin.

Pgina 56 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Notacin 1
a
b
c
abc

Notacin 2
+ - - + - - +
+ + +

Efecto factorial

Combinacin de
Tratamientos

I
+
+
+
+
+
+
+
+

a
b
c
abc
ab
ac
bc
(1)

A
+
+
+
+
-

B
+
+
+
+
-

C
+
+
+
+
-

AB
+
+
+
+

AC
+
+
+
+

BC
+
+
+
+

ABC
+
+
+
+
-

Tabla 1 Signos positivos para el diseo 2 3


Ntese que el diseo 2 3-1 se forma al seleccionar solo las combinaciones de tratamientos
que producen un signo positivo sobre la columna ABC. Por esto ABC se denomina
generador de una fraccin particular. Adems, la columna identidad I siempre es positiva,
por lo cual:
I = ABC
Se denominara relacin definitoria de nuestro diseo, en general, la relacin definitoria de
un factorial fraccionario siempre es el conjunto de todas las columnas que son iguales a la
columna identidad I.
abc

bc

ac

ab

B
A

(a) Fraccin principal I = ABC

(1 )

(b) Fraccin alterna I = -ABC

Pgina 57 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Las combinaciones de tratamientos del diseo 2 3-1 producen 3 G.L. que pueden usase
para estimar los efectos principales. En la tabla 1 se muestra que las combinaciones
lineales de las observaciones que se utilizan para estimar los efectos principales A, B, y C
son:

LA 1/2(a b c abc)
LB 1/2( a b c abc)
LC 1/2( a b c abc)
LBC 1/2(a b c abc)
LAC 1/2( a b c abc)
LAB 1/2( a b c abc)
Por lo tanto LA = LBC, LB = LAC y LC = LAB. En consecuencia, es imposible distinguir
entre A y BC, entre B y AC y entre C y AB. De hecho, es posible mostrar que cuando se
estima A, B y C, en realidad, lo que s esta haciendo es estimar A + BC, CB + AC y C +
AB, respectivamente. Dos o ms efectos que tienen esta propiedad se conoce como
alias. En este ejemplo, A y BC, B y AC y C y AB son alias. Esto se indica empleando la
notacin:

LA A BC,
LB B AC
LC C AB
La estructura de los alias de este diseo pueden determinarse fcilmente con la relacin I
= ABC, multiplicando cualquier efecto por la relacin que define al diseo, modulo 2, da
como resultado los alias de dicho efecto. En el ejemplo anterior, los alias son:
A*I = A*ABC = A2BC

Pgina 58 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

O dado que el cuadrado de cualquier columna es simplemente la identidad I.


A = BC
De modo similar, se encuentra que los alias de B y C son:
B*I = B*ABC = AB2C = AC
C*I = C*ABC = ABC2 = AB
Esta fraccin un medio o semifraccin, con I = +ABC, suele llamarse fraccin principal.
Ahora supngase que se eligi la otra mitad de la rplica. Esta se compone de las
combinaciones de tratamientos de la tabla 1 que tiene signo negativo asociado con ABC.
Esta fraccin un medio o alterna que consta de las siguientes corridas:
Notacin 1

Notacin 2
(1)
ab
ac
abc

--+++-+
-++

La relacin definitoria de este diseo es:


I = -ABC
Usando la fraccin alterna, las combinaciones lineales de las observaciones, LA, LB y
LC, son:

L' A A BC
L' B B AC
L' C C AB
Por lo tanto, en realidad se est estimando A BC, B AC y C AB al estimar A, B y C
con esta fraccin. En la prctica, no importa cual de las dos fracciones se utilice.
Generalmente la fraccin asociada con I = +ABC se denomina fraccin principal. Ambas

Pgina 59 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

fracciones pertenecen a la misma familia; en otras palabras, estas dos fracciones forman
el diseo 23 completo.
5.3 Resolucin del diseo

l diseo anterior 23-1 se conoce como diseo de resolucin III. En tal diseo los
alias de los efectos principales son interacciones de dos factores. Un diseo es
resolucin R si ningn efecto de p factores es alias de otro efecto que tenga

menos R p factores. Usualmente, se emplea el numeral romano como subndice para


indicar la resolucin del diseo. As, la fraccin un medio del diseo 2 3 definido por la
3 1

relacin I = ABC (o bien I = - ABC) constituye un diseo

2III

Los diseos de resolucin III, IV y V son de importancia primordial. A continuacin, se


presenta la definicin de estos diseos junto con un ejemplo.

1. Diseo con resolucin III: stos son diseos en los que ningn efecto principal es
alias de otro, pero si lo son de las interacciones de dos factores; a su vez, estas
ltimas son alias entre s. El diseo 23-1 de la tabla 4.1 es de resolucin III.
2. Diseo con resolucin IV: En estos diseo ningn efecto principal es alias de otro
efecto principal, o bien, de alguna interaccin de dos factores. Las interacciones de
dos factores son alias entre s. Un diseo 24-1 con I = ABCD es de resolucin IV (
4 1

2IV ).

3. Diseos resolucin V: Estos son diseos en los que ningn efecto principal o
interaccin de dos factores es alias de ningn efecto principal o interacciones entre
5 1

dos factores, un diseo 25-1 con I = ABCDE es de resolucin V ( 2 V ).


En general, la resolucin de un diseo factorial fraccionario de dos niveles es igual al
mnimo nmero de letras de cualquier palabra de la relacin que define al diseo. En
consecuencia, los diseos anteriores, a menudo, se conocen como diseos de 3, 4 y 5
letras, respectivamente. Por lo general se deben usar diseos fraccionarios con la mayor
Pgina 60 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

resolucin posible congruentes con el fraccionamiento requerido. A mayor resolucin, las


suposiciones relativas a las interacciones que deben despreciarse con el propsito de
hacer una interpretacin nica de los datos son menos restrictivas.

Pgina 61 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

6. DISEOS DE EXPERIMENTOS FACTORIALES COMPLETOS

6.1 Diseo factorial completo de 2 factores


Un ingeniero decide probar los tres materiales de la cubierta, nico factor controlable a
tres niveles de temperatura (15, 70 y 125 F) consistentes en el entorno de uso final del
producto. Se prueban cuatro bateras a cada combinacin de material de la cubierta y
temperatura, y las 36 pruebas se ejecutan al azar.

En la tabla 1 se presentan el experimento y los datos resultantes de duracin observada


de las bateras.

En este problema, el ingeniero desea contestar las siguientes preguntas:


1. Qu efecto tienen el tipo de material y la temperatura sobre la duracin de la batera?
2. Existe una eleccin del material que d por resultado una duracin uniformemente
larga sin importar la temperatura?

Tipo de material
1
3
3

130
74
150
159
138
168

15
155
180
188
126
110
160

Temperatura F
70
34
40
80
75
126
122
106
115
174
120
150
139

20
82
25
58
96
82

125
70
58
70
45
104
60

Tabla 1. Duracin en horas para el ejemplo del diseo de una batera


Esta ltima pregunta reviste particular importancia. Existe la posibilidad de hallar un
material que no sea muy afectado por la temperatura. De ser as, el ingeniero puede
hacer que la batera sea robusta a la variacin de temperatura en el campo. ste es un
ejemplo del uso del diseo experimental estadstico para el diseo de un producto robusto
(o consistente), un importante problema de ingeniera.

Pgina 62 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Este diseo es un ejemplo especfico del caso general de un diseo con dos factores
(bifactorial). Para pasar al caso general, sea Yijk la respuesta observada cuando el factor
A se encuentra en el i-simo nivel (i -1, 2,..., n). En general, los datos observados se vern
como en la tabla 2. El orden en el cual se toman las abn observaciones es aleatorio, de
modo que ste es un diseo completamente aleatorizado.

Tabla 2. Disposicin general para un diseo bifactorial


Las observaciones pueden describirse mediante el modelo estadstico lineal:

i 1,2,..., a

Yijk i j ij i jk j 1,2,..., b

k 1,2,...,n

En donde es el efecto medio general, i es el efecto del i-simo nivel del factor rengln
A, j es el efecto del j-simo nivel del factor columna B, ()ij es el efecto de la interaccin
entre i y j, ijk es el componente del error aleatorio. Inicialmente se supone que ambos
factores son fijos y que los efectos de tratamiento se definen como desviaciones de la
media general, por lo tanto.

ia1 i 0; bj1j 0

Se supone que los efectos de interaccin

son fijos y que se definen d manera que:

ia1 ij 0

observaciones porque se realizan n rplicas.

Pgina 63 de 95

. Hay un total de abn

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

En un diseo factorial de dos factores, tanto los factores (o tratamientos) de rengln como
de columna tienen la misma importancia, especficamente el inters consiste en probar
hiptesis acerca de la igualdad de los efectos de tratamiento de rengln, es decir:
Ho : 1 2 ...a 0
H1 : al menos una i 0

Y de la igualdad de los efectos de tratamiento de columna:


Ho : 1

2 ...b 0
H1 : al menos una j 0
Tambin es interesante determinar s los tratamientos de rengln y columna
interaccionan. En otras palabras, resulta conveniente probar:
Ho : ()i 0 para toda i, j
H1 : al menos una ()i 0

A continuacin, se muestra cmo pueden probarse estas hiptesis usando un anlisis de


variancia bifactorial o bidireccional (de dos factores o en dos sentidos).
6.2 Anlisis Estadstico del Modelo de Efectos Fijos

ea Yi..; el total de las observaciones bajo el i-simo nivel del factor A; Y.j. El total
de las observaciones bajo el j-simo nivel del factor B, Yij. El total de las
observaciones de la ij-sima celda, e Y... el total general de todas las

observaciones. Se definen Yi..; Y.j. y Yij. y Y... como los promedios de rengln, columna,
celda y general, respectivamente, matemticamente:

Pgina 64 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

b n
Yi.. Yijk
j1k 1

Yi..

a n
Y.j. Yijk
i1k 1

Y.j.

Yij.
Yijk
k 1

Yij.

Yi..
bn
Y.j.

; j 1,2,...,b

an

Y...
n

a b n
Y... Yijk
i1j1k 1

; i 1,2,..., a

i 1,2,..., a

j 1,2,...,b

Y...

Y...
abn

La suma total de cuadrados corregida puede expresarse mediante:

i1

2
n
b Yijk Y...

k 1
j1

Yi .. Y... Y.j. Y... Yij. Y... Y.j Y...


a b n

i1j1 k 1
Yijk Yi j.

2
a b n
Yijk Y...

i1j1 k 1

2
2
2
a
b
a b
bn Yi.. Y... an Y.j. Y... n Yi j. Yi .. Y.j. Y...
i1
j1
i1j1

2
a b n
Yijk - Yi j.
i1j1 k 1

Dado que los seis productos cruzados del segundo miembro de la ecuacin anterior son
iguales a cero. Se observa que la suma total de cuadrados se ha descompuesto en una
suma de cuadrados debida a los renglones o al factor A (SS A) en una suma de
cuadrados debida a las "columnas" o al factor B (SSB), en una suma de cuadrados debida
a la interaccin entre A y B (SSAB), y en una suma de cuadrados debida al error (SS E):

Pgina 65 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Analizando el ltimo trmino del miembro derecho de la Ecuacin anterior es posible


observar que es necesario tener al menos dos rplicas (n 2) para poder obtenerla suma
de cuadrados del error.
Simblicamente, la Ecuacin anterior puede expresarse mediante:

SST

SSA SSB SSAB SSE

Los grados de libertad asociados a cada suma de cuadrados son:


Efecto
A
B
Interaccin AB
Error
Total

Grados de libertad
a-1
b-1
(a-1)(b-1)
ab(n-1)
abn-1

Esta descomposicin del total de abn -1 grados de libertad para las sumas de cuadrados
se puede justificar como sigue: Los efectos principales de A y B tienen a y b niveles,
respectivamente, por lo tanto, tienen a -1 y b -1 grados de libertad como se muestra.
Los grados de libertad de la interaccin simplemente corresponden a los grados de
libertad de cada celda (los cuales son iguales a ab -1) menos los grados de libertad de los
dos efectos principales A y B en otras palabras, ab -1 -(a -1) -(b -1) -(a- 1)(b -1). Dentro de
cada una de las ab celdas hay n -1 grados de libertad entre las n rplicas, por lo tanto,
hay ab(n -1) grados de libertad del error.
Se observa que la suma de los grados de libertad de los trminos del miembro derecho de
la ecuacin anterior es igual al total de los grados de libertad.
Cada suma de cuadrados dividida entre sus grados de libertad produce una media de
cuadrados.
Por lo tanto, para probar el significado de ambos efectos principales, as como de su
interaccin, simplemente deben dividirse las medias de cuadrados correspondientes entre

Pgina 66 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

la media de cuadrados del error. Valores grandes de estas razones implican que los datos
no concuerdan con las hiptesis nulas.
Si se considera que el modelo estadstico es adecuado y que los trminos del error ijk
son independientes con distribuciones normales con variancia constante 2, entonces las
razones de las medias de cuadrados MSA/MSE, MSB/MSE y MSAB/MSE tienen distribucin
F con a -1, b- 1 y (a -1)(b -1) grados de libertad en el numerador, respectivamente, y ab(n
-1) grados de libertad en el denominador. Las regiones crticas corresponden al extremo
superior de la distribucin F. Usualmente la prueba se presenta en una tabla de anlisis
de variancia como la que aparece en la tabla 2.

Fuente de
Variacin
Tratamientos A

SS
SSA

G.L.
a-1

MS
MSA

SSA

Fo

MSA
MSE

a 1
Tratamientos B

Interaccin

SSB

SSAB

b-1

(a - 1)(b - 1)

MSB

MSB

SSB

MSE

b 1
MSAB

MSAB

SSAB

MSE

(a 1)(b 1)
Error

SSE

ab(n-1)

MSB
SSE
ab(n 1)

Total

SST

abn - 1

Tabla 2 ANOVA para el modelo bifactorial de efectos fijos


Es posible obtener las frmulas para calcular las sumas de cuadrados de la ecuacin
anterior. La suma total de cuadrados se calcula en forma usual mediante:

Pgina 67 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

2
a b n
Y ...
2
SST Y ijk
i1j1k 1
abn

Las sumas de cuadrados para los efectos principales son:

2
2
a Y i.. Y ...
SSA

i1 bn
abn
2
2
b Y .j. Y ...
SSB

j1 an
abn
Es conveniente obtener SSAB en dos etapas. Primero se calcula la suma de cuadrados
entre los totales de las ab celdas, conocida como la suma de cuadrados debido a los
"subtotales":

2
2
a b Y ij. Y ...
SSsubtotales

i1j1 n
abn
Esta suma de cuadrados contiene a la SSA y SSB. Por lo tanto, la segunda etapa consiste
en calcular SSAB mediante:

SSAB SSsubtotales SSA SSB


La SSE se calcula por diferencia:

SSE

SST SSAB SSA SSB

o bien :

SSE

SST SSSubtotales

Pgina 68 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Ejemplo: Ms sobre el experimento de diseo de una batera. En la tabla 3 se presenta la


duracin efectiva (en horas) observada en el ejemplo de diseo de una batera descrito en
la anterior Los totales de rengln y de columna se indican en los mrgenes de la tabla; los
nmeros subrayados son los totales de celda.

Ti

Temperatura (F)

po
de

15

70

125

Yi.

at.
1

1 1

3 4

3 5

4 0

0 5

539 4

7 1

134.758
0

4 8

7
5

2 7
2
2
9

0 0
8 5
2 8

2
3
0

99
8

0
2

1 1

1 1

5 8

3 2

0 8

6 2

1 1

623

1 1

5 2

0 1

9 6

6 5

1 1

1 1

3 1

7 2

8 0

4 0

1 1

576

1 1

6 6

5 3

8 0

0 9

Y.j 1738

1291

2 7
4
7
9

5 0
5 4
8 5

1
9
8

13
00

9 1
5
8
3

6 0
4
8 6
2 0
770

.=

3
4
2

15
01

Y..
.=
37
99

Pgina 69 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Tabla 3. Duracin (en horas) para el experimento de diseo de una batera

Las sumas de cuadrados se calculan a continuacin:

2
a b n 2
Y ...
SST Y i jk

i1j1 k 1
abn
130

2
2
2
2 3799
155 74 ... 60
77,646.97
36

2
2
a Y i.. Y ...
SSmaterial

i1 bn
abn
2
2
2
2
998 1300 1501
3799

10,683.72
(3)(4)
36
2
2
b Y .j. Y ...
SStemperat ura

j1 an
abn
2
2
2
2
1738 1291 770
3799

39,118.72
(3)(49
36
2
2
a b Y ij. Y ...
SSinteraccion

i1j1 n
abn
2
2
2
2
539 229 ... 342
3799

10,683.72
4
36
39,118.72 9,613.78

SSE SST SSmaterial SStemperatur a SSinteraccion


SSE 77,646.97 10,638.72 39,118.72 9,613.78
18,230.75

Pgina 70 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

El anlisis de variancia aparece en la tabla 4. Se concluye que existe una interaccin


significativa entre el tipo de material y la temperatura porque F 0.05,4.27 = 2.73. Adems,
tambin son significativos los efectos principales del tipo de material y de la temperatura,
porque FO.O5.2.27 = 3.35.

Pgina 71 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Fuente de variacin
Tipo de material
Temperatura
Interaccin
Error
Total

SS
10,683.72
39,118.72
9,613.78
18,230.75
77,646.97

G.L.
2
2
4
27
35

MS
5,341.86
19,558.36
2,403.44
675.21

Fo
7.91
28.97
3.56

Tabla 4. ANOVA para los datos de la duracin de la batera

Como auxiliar en la interpretacin de los resultados de este experimento resulta til la


construccin de una grfica de las respuestas promedio de cada combinacin de
tratamiento. Esta grfica se muestra en la figura 1.

175
150
125

Yij. 100

Material tipo 3

75

Material tipo 1
Material tipo 2

50
25
15

70
Tempera tura

125

Figura 1. Grfica de respuesta vs temperatura

El hecho de que las rectas no sean paralelas indica una interaccin significativa. En
general, a menor temperatura mayor duracin, independientemente del tipo de material.

Pgina 72 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Al variar la temperatura de baja a intermedia, la duracin aumenta con el material tipo 3,


mientras que disminuye con los materiales tipo 1 y 2,

Cuando la temperatura vara de intermedia a alta, la duracin disminuye con los


materiales tipo 2 y 3, mientras que con el tipo 1 esencialmente permanece sin cambio. Al
parecer, el material tipo 3 da los mejores resultados si lo que se desea es menor perdida
de duracin efectiva al cambiar la temperatura.

Para comprobar si el modelo es adecuado, se analizan los residuos que tengan un


comportamiento aleatorio y normal.

Pgina 73 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

7. DISEO DE EXPERIMENTOS TAGUCHI

7.1 Introduccin
La parte fundamental de la metodologa ideada por el matemtico japons G. Taguchi es
la optimizacin de productos y procesos, a fin de asegurar productos robustos, de alta
calidad y bajo costo.
La metodologa Taguchi consta de tres etapas:

a) Diseo del sistema


b) Diseo de parmetros
c) Diseo de tolerancias
De estas tres etapas, la ms importante es el diseo de parmetros cuyos objetivos son:
a) Identificar qu factores afectan la caracterstica de calidad en cuanto a su magnitud y
en cuanto a su variabilidad.
b) Definir los niveles ptimos en que debe fijarse cada parmetro o factor, a fin de
optimizar la operacin del producto y hacerlo lo ms robusto posible.
c) Identificar factores que no afectan substancialmente la caracterstica de calidad a fin
de liberar el control de estos factores y ahorrar costos de pruebas.
Para lograr lo anterior se ha manejado una serie de herramientas estadsticas conocida
como diseo de experimentos, tratadas anteriormente.
Taguchi ha propuesto una alternativa no del todo diferente que se que conoce como:
Arreglos Ortogonales y las Grficas Lineales.
La herramienta utilizada normalmente son diseos Factoriales fraccionados, sin embargo
cuando el nmero de factores se ve incrementado, las posibles interacciones aumentan,
as como la complicaciones para identificar cules son las condiciones especficas a
experimentar.

Pgina 74 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Un arreglo ortogonal se puede comparar con una replicacin factorial fraccionada, de


manera que conserva el concepto de ortogonalidad y contrastes. Un experimento factorial
fraccionado es tambin un arreglo ortogonal .
Taguchi desarroll una serie de arreglos particulares que denomin:

La (b)C

Donde:
a = Representa el nmero de pruebas o condiciones experimentales que se tomarn.
Esto es el nmero de renglones o lneas en el arreglo.
b = Representa los diferentes niveles a los que se tomar cada factor.
c = Es el nmero de efectos independientes que se pueden analizar, esto es el nmero
de columnas.

7.2 Arreglos ortogonales para experimentos a dos niveles


En esta seccin, se analiza qu son, cmo se usan y cules son los arreglos ortogonales
ms importantes para experimentos en los que cada factor toma dos niveles.

No. (a)
1
2
3
4
1 , 2

A
1
1
2
2
=

F A C T O R E S (c)
B
C
1
1
2
2
1
1
2
1

Resultado
Y1
Y2
Y3
Y4

Niveles de los Factores (b)

Un
arreglo ortogonal es una tabla de nmeros. Como ejemplo de un arreglo ortogonal
tenemos el siguiente:
De acuerdo con la notacin empleada por Taguchi al arreglo mostrado como ejemplo,
se le llama un arreglo L4, por tener cuatro renglones.

Pgina 75 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

En general, para un arreglo a dos niveles, el nmero de columnas (efectos o factores) que
se pueden analizar, es igual al nmero de renglones menos 1.
Taguchi ha desarrollado una serie de arreglos para experimentos con factores a dos
niveles, los ms utilizados y difundidos segn el nmero de factores a analizar son:
No.

de

factores

a Arreglo

analizar
Entre 1 y 3
Entre 4 y 7
Entre 8 y 11
Entre 12 y 15
Entre 16 y 31
Entre 32 y 63

a No. de condiciones a probar

utilizar
L4
L8
L12
L16
L32
L64

4
8
12
16
32
64

El arreglo ortogonal ms popular es el arreglo L8, que se muestra a continuacin junto


con sus grficas lineales:

L8
Exp. No.
1
2
3
4
5
6
7
8

Col.

Col.

Col.

Col.

Col.

Col.

Col.

1
1
1
1
2
2
2
2

1
1
2
2
1
1
2
2

1
1
2
2
2
2
1
1

1
2
1
2
1
2
1
2

1
2
1
2
2
1
2
1

1
2
2
1
1
2
2
1

1
2
2
1
2
1
1
2

Matriz

tabla

de

interaccione
s
Columna
s
1
2
3
4

1
(1)

2
3
(2)

3
2
1
(3)

4
5
6
7
(4)

5
4
7
6
1

6
7
4
5
2

Pgina 76 de 95

7
6
5
4
3

ESTADSTICA APLICA
MACETAS HERNNDEZ

5
6
7

MG. MIGUEL ANGEL

(5)

1
(1)

1
3

2
6
(7)

5
1
.7

6
2

(a)
(b)

Grficas lineales
Los pasos para un diseo de experimentos de parmetros en el caso de menor es
mejor son:
7.3 Caso menor es mejor
1. Seleccionar una caracterstica de calidad de salida a ser optimizada.
2. Seleccionar factores de control y sus niveles, identificando sus posibles interacciones.
3. Seleccionar los factores de ruido y sus niveles; si son demasiados combinarlos en dos o
tres factores combinados.
4. Seleccionar los arreglos interno y externo adecuados; asignar los factores de control al
arreglo interno y los factores de ruido al arreglo externo.
5. Realizar los experimentos.
6. Realizar anlisis estadstico con base en S/N para identificar los niveles de los factores de
control ptimos Algunas veces ayuda realizar un estudio de la interaccin entre factores
de control y de ruido.
7. Realizar anlisis estadstico con base en las medias para identificar los niveles de los
factores de control ptimos que ajustan a la respuesta promedio en el nivel deseado. Si

Pgina 77 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

hay conflicto entre los niveles de los factores para maximizar la relacin S/N y ajustar la
media, dar prioridad a los que sirven para maximizar la relacin S/N.
8. Predecir el desempeo de salida ptimo con base en una combinacin ptima de niveles
de factores de control y realiza un experimento confirmatorio.
Ejemplo: Disminucin de la contaminacin
Optimizacin de un mtodo de purificacin para drenajes contaminados con metales.
Las aguas residuales que contienen iones metlicos es muy riesgoso por su toxicidad y
no biodegradable. Se propone utilizar xidos de hierro hidratados con un pH adecuado
para remover los metales dainos. La caracterstica de salida es la concentracin
remanente de metales en mg/L, con una respuesta menor es mejor.

Los factores de control son los siguientes:


A
B

Factores de control
Nivel 1
Contaminacin de FeII 2
Temperatura C
25
Tiempo de aejamiento

Nivel 2
7
50

Nivel 3
15
75

C
D

h
pH

2
10

3
12

1
8

Pgina 78 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

El factor de ruido introducido artificialmente es permanganato de potasio.


N

Factores de ruido
Conc. De KMnO4

Nivel 1
0.00375

Nivel 2
0.0375

Nivel 3
0.075

Se asume que no hay interacciones por lo que se puede utilizar un arreglo L9, realizando
los experimentos se obtienen los datos siguientes con dos rplicas en cada nivel del factor
de ruido:

L9

Col.

1
Exp A

Col.

Col Col.

2
B

.3
C

4
D

N1

N1

N2

N2

N3

N3

Rep. Rep. Rep. Rep.

No.
1
1

Rep. 1 Rep. 2 promedio S/N


155.0 166.2

2
3
4
5
6

2
3
1
2
3

2
3
2
3
1

2
3
3
1
2

2.24
1.75
5.32
0.37
7.2
39.1

0.59
5.07
0.65
0.32
0.49
27.0

5.29
1.05
0.4
0.34
0.48
46.5

1.75
0.41
1.07
0.68
0.44
25.7

4
0.38
0.51
4.31
0.8
138.0

7
0.48
0.36
0.65
0.88
165.6

55.20
1.52
1.39
1.11
1.72

-39.36
-7.05
-7.05
-5.19
-9.54

7
0.57

5
1.26

4
0.61
22.7

7
0.7
36.3

8
0.91

1
1.42
120.3

73.70
0.91

-39.34
0.28

3.88
15.4

7.85
25.5

4
35.2

3
48.6

92.8

47.32

-36.20

67.56

72.73

44.19

-33.79

7
8
9

1
1
2
2
2
3
3
3

1
2
3

3
1
2

2
3
1

1 n 2
yi
n i1

S / N 10 log

Las sumas de cuadrados son las siguientes:


Para el arreglo L9 con nueve respuestas Y1 a Y9 se tiene:
La suma de cuadrados del factor A es:

A1 = Y1 + Y2 + Y3
Pgina 79 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

A2 = Y4 + Y5 + Y6
A3 = Y7 + Y8 + Y9

A12 A22 A33


CF
3
(Y Y .... Y9 ) 2
CF 1 2
9
SSA

La suma de cuadrados del factor B es:


B1 = Y1 + Y4 + Y7
B2 = Y4 + Y5 + Y8
B3 = Y3 + Y6 + Y9
B12 B22 B33
CF
3
(Y Y .... Y9 ) 2
CF 1 2
9
SSB

De la misma forma se calculan las sumas de cuadrados para los factores C y D:


La suma de cuadrados total es:

SST = SSA + SSB + SSC + SSD

Haciendo los clculos en Minitab se obtiene:

Taguchi Analysis: Rep. 1, Rep. 2, Rep. 1_1, Rep. 2_1, ... versus A, B, C, D
Linear Model Analysis: SN ratios versus A, B, C, D

Estimated Model Coefficients for SN ratios


Term

Coef

Constant -19.6915
A1

1.8735
Pgina 80 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

A2

1.6687

B1

4.9386

B2

2.0970

C1

-18.6078

C2

4.3499

D1

-7.8678

D2

4.3221

MG. MIGUEL ANGEL

S=*

Analysis of Variance for SN ratios


Source

DF Seq SS Adj SS Adj MS F P Porcentaje de contribucin

56.52

2 234.86 234.86 117.428 * *

10.32%

2 1705.37 1705.37 852.685 * *

74.91%

2 279.46 279.46 139.732 * *

12.28%

Residual Error 0
Total

56.52 28.261 * *

2.49%

8 2276.21

Linear Model Analysis: Means versus A, B, C, D


Estimated Model Coefficients for Means
Term

Coef

Constant 25.2281
A1

-5.8598

A2

0.2819

B1

-6.1548

B2

-8.3748

C1

33.5124

C2

-9.6215

D1

8.4707

D2

0.1513

Pgina 81 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

S=*

Analysis of Variance for Means


Source

DF Seq SS Adj SS Adj MS F P

2 196.59 196.59

2 957.39 957.39 478.69 * *

2 5359.29 5359.29 2679.65 * *

2 438.35 438.35 219.17 * *

Residual Error 0
Total

98.30 * *

8 6951.62

Response Table for Signal to Noise Ratios


Smaller is better
Level

-17.818 -14.753 -38.299 -27.559

-18.023 -17.595 -15.342 -15.369

-23.234 -26.727 -5.434 -16.146

Delta
Rank

5.416 11.974 32.866 12.190


4

Response Table for Means


Level

19.368 19.073 58.741 33.699

25.510 16.853 15.607 25.379

30.806 39.758 1.337 16.606

Delta 11.438 22.904 57.403 17.093


Rank

Pgina 82 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Las grficas factoriales son las siguientes:


Main Effects Plot (data means) for SN ratios
A

-10

Mean of SN ratios

-20
-30
-40
1

2
C

2
D

-10
-20
-30
-40

Signal-to-noise: Smaller is better

Los niveles seleccionados son A en 1, B en 1, C en 3 y D en 2


Main Effects Plot (data means) for Means
A

60

45

Mean of Means

30
15
0
1

2
C

2
D

60
45
30
15
0

La respuesta estimada es:


Predicted values
S/N Ratio

Mean

5.70044 -10.5261
Factor levels for predictions
A B C D

Pgina 83 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

1 1 3 2

Pgina 84 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

8. REGRESIN Y CORRELACIN LINEAL

8.1 Introduccin
Son dos herramientas para investigar la dependencia de una variable dependiente Y en
funcin de una variable independiente X. Y = f(X)
Y = Variable dependiente que se desea explicar o predecir, tambin se llama regresor o
respuesta
X = Variable independiente, tambin se llama variable explicativa, regresor o predictor
Regresin lineal - La relacin entre X y Y se representa por medio de una lnea recta
Regresin curvilinea - La relacin entre X y Y se representa por medio de una curva.

*
**

*
*

*
*

*
*

b1

* *

*
*

b0
Correlacin positiva

Correlacin negativa

X
Sin
correlacin

La ecuacin de la recta es la siguiente:

Pgina 85 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

El trmino de error es la diferencia entre los valores reales observados Yi y los valores
estimados por la ecuacin de la recta. Se trata de que estos sean mnimos, para lo cual
se utiliza el mtodo de mnimos cuadrados.

Pgina 86 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Error Re siduo (Yi Yi )


Y
*

*
X
Se trata de minimizar la suma de todos los errores o residuos:
Las frmulas resultado de la minimizacin de lo cuadrados del error se aplicarn en el
siguiente ejemplo por claridad. Se tienen los siguientes supuestos:
1. Los errores o residuos se distribuyen normalmente alrededor de la recta de regresin
poblacional
2. Las varianzas de los errores son las mismas en todos los valores de X
(Homoscedasticidad)

en caso contrario se tiene (Heteroscedasticidad)

3. Los errores o residuos son independientes: No se muestra algn patrn definido.


El coeficiente de Correlacin r desarrollado por Carl Pearson es un indicador de la fuerza
de la relacin entre las variables X y Y, puede asumir valores entre -1 y 1 para correlacin
negativa y positiva perfecta respectivamente. Por ejemplo si se encuentra que la variable
presin tiene una correlacin positiva con el rendimiento de una caldera, se deben buscar
soluciones al problema mediante acciones asociadas con la variable presin; de lo
contrario, sera necesario buscar la solucin por otro lado.
Se identifican tres medidas de desviacin como sigue:

Pgina 87 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

Y
Yest = 4.4 + 1.08
X
Yi =
23

Desviacin no
*

explicada
Error = (Yi - Yest)
= 1.32

Variacin
total
(Yimedia)=5.1

Desviacin

explicada
(Yest-Ymedia) =
3.81

Ymedia =17.87

X = 16

8.2 Ejemplo manual


Se sospecha que el tiempo requerido para hacer un mantenimiento preventivo est
relacionado con su nmero. Calcular el coeficiente de correlacin y graficar. Los datos de
tiempo tomados para n = 25 servicios se muestran a continuacin:
X Servicios
2
8
11
10
8
4
2
2
9

Y Tiempo
9.95
24.45
31.75
35.00
25.02
16.86
14.38
9.60
24.35

(Xi-X)*(Yi-Y)
119.076672
1.099872
7.499472
10.502272
0.963072
51.612672
91.433472
121.260672
-3.558928

(Xi-X)^2
38.9376
0.0576
7.6176
3.0976
0.0576
17.9776
38.9376
38.9376
0.5776

Pgina 88 de 95

(Yi-Y)^2
364.1533
21.0021
7.3832
35.6075
16.1026
148.1771
214.7045
377.6337
21.9286

Yest
10.9199
28.3362
37.0443
34.1416
28.3362
16.7253
10.9199
10.9199
31.2389

Error
0.9408
15.1022
28.0292
0.7369
10.9969
0.0181
11.9721
1.7422
47.4563

ESTADSTICA APLICA
MACETAS HERNNDEZ

8
4
11
12
2
4
4
20
1
10
15
15
16
17
6
5
206

MG. MIGUEL ANGEL

27.50
17.08
37.00
41.95
11.66
21.65
17.89
69.00
10.30
34.93
46.59
44.88
54.12
56.63
22.13
21.15
725.82

0.367872
50.679872
21.989472
48.568672
108.406272
31.303072
47.245472
470.014272
135.625472
10.379072
118.686672
107.127072
194.676672
241.751472
15.462272
25.540272
2,027.7132
Sxy

0.0576
2.3495
28.3362 0.6991
17.9776 142.8694 16.7253 0.1258
7.6176
63.4763
37.0443 0.0020
14.1376 166.8541 39.9470 4.0121
38.9376 301.8142 10.9199 0.5477
17.9776
54.5057
16.7253 24.2523
17.9776 124.1620 16.7253 1.3564
138.2976 1,597.3771 63.1686 34.0052
52.4176 350.9178
8.0172
5.2111
3.0976
34.7770
34.1416 0.6216
45.6976 308.2553 48.6551 4.2646
45.6976 251.1337 48.6551 14.2512
60.2176 629.3676 51.5578 6.5649
76.7376 761.6054 54.4605 4.7068
5.0176
47.6486
22.5307 0.1606
10.4976
62.1385
19.6280 2.3164
698.5600
6,105.9447
220.0926
Sxx
Syy = SST
SSE

X
promedio

Y Promedio

Sxy

Sxx

Syy

Si todos los puntos estuvieran completamente sobre la recta la ecuacin lineal sera y = a
+ bx. Como la correlacin no siempre es perfecta, se calculan a y b de tal forma que se
minimice la distancia total entre puntos y la recta. Los clculos tomando las sumas de
cuadrados siguientes se muestran a continuacin:
Sxy = 2027.71
Sxx

= 698.56

Syy

= 6105.94

Las ecuaciones para el clculo manual son las siguientes:

b1 1

b0 0

( Xi X )(Yi Y ) S
S
( Xi X )

XY

1 X i
n

XX

Y X

= 2.902704421

= 5.114515575

Las sumas de cuadrados son:


Pgina 89 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

SST (Yi Y ) 2

MG. MIGUEL ANGEL

6,105.9447

SSE (Yi Yi ) 2 (Yi (bo b1 * X i )) 2

220.0926

SSR SST SSE 5,885.8521


El coeficiente de determinacin r2 y el coeficiente de correlacin r se calculan a
continuacin:

r2 1

SSE ( SST SSE ) SSR

SST
SST
SST = 0.9639

El coeficiente de determinacin indica el porcentaje de la variacin total que es explicada


por la regresin.

r r 2 = 0.9816
El coeficiente de correlacin proporciona el nivel de ajuste que tienen los puntos a la lnea
recta indicando el nivel de influencia de una variable en la otra. El factor de correlacin r
es un nmero entre 1 (correlacin negativa evidente) y +1 (correlacin positiva evidente),
y r = 0 indicara correlacin nula.
El coeficiente de correlacin r = 0.98 por lo cual tenemos suficiente evidencia estadstica
para afirmar que el tiempo de atencin esta relacionado con el nmero de servicios
atendidos.
8.3 Uso de Excel
1. En el men Herramientas seleccione la opcin Anlisis de datos. Datos de
ejemplo 6.
2. Seleccione la opcin Regresin.

Pgina 90 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

3. Seleccione el rango de entrada, estos corresponden a los datos numricos de la


tabla.
4. Seleccione Resumen de estadsticas.
5. En opciones de salida seleccione en Rango de salida, una celda de la hoja de
clculo que este en blanco (a partir de esta celda sern insertados los resultados).

Resumen
Estadsticas de la regresin
Coeficiente de
0.9818117
correlacin mltiple
78
Coeficiente de
0.9639543
determinacin R^2

68
0.9623871

R^2 ajustado

67
3.0934196

Error tpico
Observaciones

27
25
Promedio

ANLISIS DE VARIANZA

Suma de

de
Valor

Grados de Cuadrado
libertad

cuadrado

crtico de

s
s
F
F
5885.8520 5885.8520 615.08008 4.24118E-

Regresin

Residuos

23

48
6105.9447

Total

24

04

Coeficient

69
69
220.09263 9.5692449

Error

98

18

92

Estadstic

Probabilid

Inferior

es
tpico
ot
ad
95%
5.1145155 1.1458041 4.4636910 0.0001772 2.7442391
Intercepcin
XServicios

75
27
04
15
61
2.9027044 0.1170407 24.800808 4.24118E- 2.6605872
21

19

Pgina 91 de 95

25

18

49

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

En la grfica observamos que al aumentar el nmero de servicios el tiempo de atencin


aumenta.

8.4 Uso de Minitab


Para determinar la funcin de regresin y correlacin en Minitab se siguen los pasos
siguientes (despus de cargar los datos correspondientes a X y a Y en las columnas C1 y
C2):
Stat >Regresin ... Indicar la columna de Respuestas Y y la de predictores X y
aceptar con OK. Observar el valor del coeficiente de correlacin y de
determinacin.
Para obtener la lnea de mejor ajuste de la regresin, se procede como sigue en Minitab:
Stat >Fitted Line Plot ... Indicar la columna de Respuestas Y y la de predictores X,
seleccionar si se quiere ajustar con los datos con una lnea, una funcin cuadrtica
o cbica y aceptar con OK. Observar el mayor valor del coeficiente de correlacin
que indica el mejor ajuste.
En Options: seleccionar Display Confidence (para media en X) y Prediction Intervals
para X.
En Graphs: Seleccionar Residual for plots Standardized y Normal Plot of residuals
La grfica de residuos debe apegarse a la recta y tener siempre un valor P value
>0.05.

Pgina 92 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL


Fitted Line Plot

Y Tiempo = 5.115 + 2.903 X Servicios


Regression
95% CI
95% PI

70
60

S
R-Sq
R-Sq(adj)

Y Tiempo

50

3.09342
96.4%
96.2%

40
30
20
10
0
0

10
X Servicios

15

20

Regression Analysis: Y Tiempo versus X Servicios


The regression equation is
Y Tiempo = 5.115 + 2.903 X Servicios
S = 3.09342 R-Sq = 96.4% R-Sq(adj) = 96.2%
Analysis of Variance
Source

DF

SS

MS

Regression 1 5885.85 5885.85 615.08 0.000


Error

23 220.09

Total

24 6105.94

9.57

La regresin tiene una r^2 de 96.4% y la influencia de una variable X en Y es significativo.


Los intervalos de confianza para la media y el intervalo de prediccin para un punto
especfico X son los siguientes:

Pgina 93 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

8.5 Ejercicios:
1. La energa consumida en un proceso depende del ajuste de mquinas, realizar una
regresin cuadrtica con los datos siguientes y responder las preguntas.
Cons_energ

Ajuste

Mq.
X
11.15
15.7
18.9
19.4
21.4
21.7
25.3
26.4
26.7
29.1

Y
21.6
4
1.8
1
1
0.8
3.8
7.4
4.3
36.2

a) Trazar un diagrama de dispersin


b) Obtener la ecuacin de regresin lineal y cuadrtica y comparar
c) Estimar el consumo de energa para un ajuste de mquina de 20 con regresin
cuadrtica
d) Obtener los intervalos de prediccin y de confianza para un ajuste de mquina de 20
e) Obtener el coeficiente de correlacin y de determinacin
2. En base al porcentaje de puntualidad se trata de ver si hay correlacin con las quejas
en una lnea area. Las quejas son por cada 100000 pasajeros.
%puntos Quejas
Aerolinea
X
Y
A
81.8
0.21
B
76.6
0.58
C
76.6
0.85
D
75.7
0.68
E
73.8
0.74
F
72.2
0.93
G
70.8
0.72
H
68.5
1.22
a) Trazar un diagrama de dispersin
b) Obtener la ecuacin de regresin lineal
c) Estimar las quejas para un porcentaje de puntualidad de 80%
d) Obtener los intervalos de prediccin y de confianza para una altura de 63"
Pgina 94 de 95

ESTADSTICA APLICA
MACETAS HERNNDEZ

MG. MIGUEL ANGEL

e) Obtener el coeficiente de correlacin y de determinacin

Pgina 95 de 95

Anda mungkin juga menyukai