Anda di halaman 1dari 13

2.

EL DISEO
TRATAMIENTOS)

UNIFACTORIAL

(COMPARACION

DE

La idea principal en este capitulo es el inicio a planear los diseo experimentales y su correspondiente anlisis
estadstico. En este caso iniciaremos con el diseo de un solo factor, que como su nombre lo indica es el
estudio de un solo factor con respecto a una variable de respuesta.

2.1 EJEMPLO DE UN DISEO DE UN SOLO FACTOR


En el desarrollo de un nuevo producto alimenticio se desea comparar el efecto del tipo de envase
sobre la vida de anaquel del producto. Para ello existen tres tipos de envases: Envase A, Envase B,
y Envase C. En el experimento se realizaron 10 replicas en cada tipo de envase y al final se mide
los das de duracin del producto. Los datos obtenidos se muestran en la tabla No. 2.1.

Factor:
Tipo de envase

Respuesta: Das de duracin

Media

23 28 21 27 35 41 37 30 32 36

31

35 36 29 40 43 49 51 28 50 52

41.3

50 43 36 34 45 52 52 43 44 34

43.3

Tabla No.2.1 Resultados del experimento de la comparacin de envases


En el ejemplo, podemos ver que:
LA VARIABLE DE RESPUESTA: Das de duracin del producto alimenticio.
EL FACTOR CONTROLADO: Tipo de envase (se tienen tres variantes).
LOS NIVELES DEL FACTOR: 3 Tipos de envase

21

2.2 MODELO MATEMTICO O MODELO ESTADSTICO

El modelo matemtico del diseo unifactorial se expresa as,

Donde

ij

es das de duracin;

efecto del tipo de envase;

ij

ij

ij

media global o media general;

efecto del factor o

error aleatorio.

2.3 HIPOTESIS DEL EXPERIMENTO


El planteamiento estadstico corresponde al contrastar las siguientes Hiptesis:
Hiptesis Nula:

: No influye el tipo de envase en la duracin de un producto alimenticio

Hiptesis Alternativa:

: El tipo de envase influye en la duracin de un producto alimenticio

2.4 ANALISIS ESTADISTICO DEL DISEO DE UN SOLO FACTOR (ANOVA)


El Anlisis de Varianza (ANOVA) es una tcnica estadstica muy poderosa para el estudio del
efecto de uno o ms factores sobre la media de una variable (y la varianza de la variable). La Idea
bsica es Descomponer la variabilidad total observada de los datos en dos partes; una debido a las
diferencias de los tratamientos y otra debido a un error aleatorio.

22

2.4.1 DESCOMPOSICION
DE LA SUMA
(DESCOMPOSICION DE LA VARIABILIDAD)

TOTAL

DE

CUADRADOS

La variabilidad total de los datos se obtiene mediante la Suma de Cuadrados Totales (SCTOTALES),
el cual a su vez se descompone en dos elementos: 1. La Suma de Cuadrados de Tratamientos
(SCTRATAMIENTOS), 2. La Suma de Cuadrados del Error (SCerror).

Considerando los datos del ejemplo,

Suma de Cuadrados Total (SCTOTAL): mide la variabilidad total en los datos, y matemticamente
se obtiene as,
(23-38.53)2+(34-38.53)2+ ...... +(34-38.53)2= 2409.5
Donde el 38.53 es el promedio general de los treinta datos. Los Grados de libertad totales, se
obtienen restndole uno al total de los datos (30-1=29).
Suma de Cuadrados de Tratamientos (SCTRATAMIENTOS): mide la variabilidad en los datos
asociada a los tratamientos, que en este caso seria asociada a cada tipo de envase, su clculo se
efecta de la siguiente manera:
10x(31-38.53)2+10x(41.3-38.53)2+10x(43.3-38.53)2= 871.3
Donde el 10 representa el numero de replicas por tratamiento (o tipo de envase); el 31 es el
promedio del envase A, el 41.3 es el promedio del envase B y el 43.3 es el promedio del envase C.
Los grados de libertad son el numero de tratamientos menos uno, es decir cada tipo de envase es un
tratamiento por consiguiente son 3 le restamos uno y obtenemos dos grados de libertad (3-1=2).
Suma de Cuadrados Del Error (SCERROR): mide la variabilidad que no es debida a las diferencias
entre tipo de envase o tratamientos es la variabilidad interna en los tratamientos o envases, en esta
variabilidad se incluye la variabilidad de errores de medicin, de experimentador o cualquier fuente
externa al experimento. Los clculos se efectan de la siguiente manera,
(23-31)2+.+(36-31)2 +(35-41.3)2++(52-41.3)2 +(50-43.3)2+ ... + (34-43.3)2 = 1538.2

23

El calculo de sus grados de libertad son el total de datos menos el numero de tratamientos, en este
caso, es 30-3=27.
Finamente, notemos que SCTOTAL= SCTRATAMIENTO + SCRESIDUAL, es decir
2409.5 = 871.3 + 1538.2

2.4.2 CUADRADOS MEDIOS


Una vez obtenidos las sumas de cuadrados se procede a obtener los cuadrados medios, el primero es
el Cuadrado Medio de los Tratamientos (CMTRATAMIENTOS), el cual se obtiene dividiendo la
SCTRATAMIENTOS entre sus grados de libertad, como se muestra a continuacin

CM

TRATAMIENT OS

SC

TRATAMIENT OS

a 1

871.3
435.65
2

Donde a es el numero de tratamientos o envases.


El segundo es el Cuadrado Medio del Error (CMerror), que se obtiene dividiendo la suma de
cuadrados del error entre sus grados de libertad, su clculo se efecta as,

CM

ERROR

SC

ERROR

N a

1538.2
56.97
27

Donde N es el total de datos y a es el numero de tratamientos.


2.4.3 OBTENCION DE LA F CALCULADA O DE LA

La F-calculada o la F0, se obtiene al dividir el cuadrado medio del tratamiento en tre el cuadrado
medio del error, como se muestra a continuacin,

CM TRATAMIENT O

CM

ERROR

435.65
7.6
56.97

24

2.4.4 OBTENCION DE LA F DE TABLAS F(tablas)


En las tablas de la distribucin F de Fisher (apndice) podemos ver que para un 0.05 con 2
grados de libertad en el numerador y 27 grados de libertad en el denominador se tiene que el valor
de la F(tablas) es 3.35.
2.4.5COMPARACION DE LA Fo CON LA F(tablas)
Si el valor de la Fo es mayor que el valor de la F(tablas) entonces se rechaza la hiptesis nula, en los
resultados se puede ver que Fo=7.647>F(tablas)=3.35, entonces podemos concluir que si existen
diferencias en los tipos de envase. En otras palabras el tipo de envase si influye en la duracin de un
producto alimenticio. Todos los resultados anteriores se pueden ver en la tabla 2.2, llamada Tabla
de Anlisis de Varianza.

Fuente
EFECTOS
PRINCIPALES
A:ENVASE
RESIDUOS

Suma de
Cuadrados

Cuadrado
Medio

Gl

Razn-F

Valor-P
P(F=7.65)

871.267
1538.2

2
27

435.633
56.9704

7.65

0.0023

TOTAL
(CORREGIDO)
2409.47
29
Tabla 2.2 Tabla de Anlisis de Varianza, usando el programa Statgraphics Centurion XV
Ntese que el anlisis de varianza (Tabla 2.2) solo indica que si existen diferencias entre los
envases, pero no establece, ni propone, cual es mejor envase de los tres. Para ello se requiere
hacer un anlisis complementario conocido como Prueba de Rangos Mltiples. La prueba de
rangos mltiples, es un conjunto de mtodos, los cuales consisten en comparacin de pares de
medias de los tratamientos. Entre esos mtodos, se pueden mencionar, el Mtodo de la Mnima
Diferencia Significativa (LSD), el mtodo de la Mxima Diferencia significativa (HSD), y el
mtodo de Duncan, entre otros.
2.5 COMPARACIN DE PAREJAS DE MEDIAS DE TRATAMIENTOS
Existen varios mtodos de comparacin de tratamientos, los cuales consisten en comparar todas las
medias de tratamientos, uno de los ms usuales es Mtodo de la Mnima Diferencia Significativa
25

(LSD, del ingls least significant difference). Supongamos que despus de haber rechazado la
hiptesis nula, con base en una prueba F de anlisis de varianza, se desea probar todas las posibles
comparaciones de medias de los tratamientos. Para ello se realizan el siguiente procedimiento
1. Se calcula el valor del LSD mediante la siguiente formula, cuando el numero de replicas por
nivel o tratamiento es el mismo, es decir n1=n2=n

LSD = t/2,N -a

2 CM ERROR
n

Donde t/2(N-a) es la t-student con un nivel de confianza y N-a grados de libertad; CMerror es el
cuadrado medio del error del anlisis de varianza. En el ejemplo el valor del LSD es,

LSD= t (

2 , N a )

2CM Error
2(56.97)
2.052
6.9265
n
10

Donde el valor de t/2(N-a) se obtuvo analizando las tablas de la distribucin t-student, para un
nivel de confianza =0.05 y 27 grados de libertad.

2. Se calculan las medias de los tratamientos


Tipo de envase
A
B
C

Media
31
41.3
43.3

3. Se calculan el valor absoluto de las diferencias de medias de todos los tratamientos


El envase A con el envase B

31 413
. 10.3
El envase A con el envase C

31 43.3 12.3
El envase B con el envase C
26

413
. 43.3 2
4. Comparacin del valor absoluto de la diferencia las medias de los tratamientos con el valor
del LSD
* 31 413
. 10.3 > 6.92, por lo tanto el tipo de envase A es diferente al tipo de envase B
* 31 43.3 12.3 >6.92, por lo tanto el tipo de envase A es diferente al tipo de envase C
* 413
. 43.3 2 <6.92, por consiguiente no hay diferencias entre los envases B y el C

5. Conclusin: De acuerdo a los resultados anteriores podemos concluir que el tipo de envase A
es el menos recomendable, ya que presenta menor promedio que los otros dos, por consiguiente
se puede decidir por cualquiera de los dos tipos de envase restantes, es decir el tipo B o el tipo C,
ya que en ellos no se encontraron diferencias. La salida de los resultados usando el programa de
estadstica Statgraphics versin Centurion, se puede ver en la tabla 2.3,
ENVASE
A
B
C

Casos
10
10
10

Media
31.0
41.3
43.3

Grupos Homogneos
X
X
X

Contraste Sig. Diferencia +/- Lmites


A-B
*
-10.3
6.92599
A-C
*
-12.3
6.92599
B-C
-2.0
6.92599
* indica una diferencia significativa.
Tabla 2.3 Prueba de comparacin LSD

Una grfica representativa de esto resultados es la grfica de medias. En la figura 2.1 se puede
ver la grafica de medias de ejemplo del tipo de envase.
Ntese que esta grfica, se puede establecer que no hay diferencias entre el tipo de envase B y el
envase C. De hecho, si se opta por usar el envase C se esperaran promedios entre 39.83 y 46.76,
mientras que si se decide por el envase B se esperaran promedios entre 37.83 y 44.76. (ver tabla
2.4).

27

Medias y 95.0% de Fisher LSD


47

DIAS

43
39
35
31
27
A

ENVASE

Figura 2.1 Graficas de medias, mtodo LSD

ENVASE Casos Media


A
10
31.0
B
10
41.3
C
10
43.3
Total
30
38.5333
Tabla 2.4 Tabla de medias

Error Est.
(s agrupada)
2.38685
2.38685
2.38685

Lmite Inferior
27.537
37.837
39.837

Lmite Superior
34.463
44.763
46.763

2.6 SUPUESTOS
Algo fundamental en el anlisis de varianza son los supuestos de los residuales, los cuales deben
cumplir con tres:
1.- Los residuales deben ser independientes
2.- Los residuales deben tener varianza constante
3.- Los residuales se distribuyen normal.
Si alguno de esos tres no se cumple es suficiente para invalidar el Anlisis de Varianza. Para checar
estos tres supuestos se deben calcular primeramente los residuales mediante la siguiente formula:

eij y ij y i .
Donde

y
yi. i.

n es el promedio del i-simo tratamiento.

Los residuales para el ejemplo de los envases estn en la tabla 2.5,

28

Envase A
23-31=-8
28-31=-3
21-31=-10
27-31=-4
35-31=4
41-31=10
37-31=6
30-31=-1
32-31=1
36-31=5

Envase B
35-41.3=-6.3
36-41.3=-5.3
29-41.3=-12.3
40-41.3=-1.3
43-41.3=1.7
49-41.3=7.7
51-41.3=9.7
28-41.3=-13.3
50-41.3=8.7
52-41.3=10.7

Envase C
50-43.3=6.7
43-43.3=-0.3
36-43.3=-7.3
34-43.3=-9.3
45-43.3=1.7
52-43.3=8.7
52-43.3=8.7
43-43.3=-0.3
44-43.3=0.7
34-43.3=-9.3

Tabla 2.5 Residuales para el ejemplo de los envases

2.6.1 SUPUESTO DE VARIANZA CONSTANTE (PRUEBA GRAFICA)


Para checar el supuesto de varianza constante, es necesario realizar una grafica tipo x-y, en la cual
en el eje x se colocan los niveles o tratamientos y en el eje y los residuales correspondientes a cada
tratamiento como se ilustra en la grafica de la figura 2.2,

Residual Plot for DURACION


16

residual

11
6
1
-4
-9
-14
A

ENVASE
Figura 2.2 Grafica de verificacin de la varianza constante
En la figura 2.2 se presentan grficamente los niveles del factor contra los residuales. La
interpretacin de esta grfica consiste en analizar los patrones o tendencias de comportamiento en
los puntos graficados. La variacin de los puntos para cada uno de los niveles A, B y C no debe
presentarse diferencias. No se debe distinguir la presencia de un embudo. En la figura 2.2 no se
29

presenta patrn inusual por lo que podemos concluir que si se cumple el supuesto de varianza
constante.

2.6.1. 1 VERIFICACION DE VARIANZA CONSTANTE (PRUEBA ESTADISTICA)


Existen varias pruebas estadsticas para verificar la igualdad de varianzas, en el statgraphics
podemos encontrar 4 pruebas, entre las que destacan las siguientes:

Prueba de Cochran: Compara la varianza mxima dentro de la muestra a la varianza promedio


dentro de la muestra.
Prueba de Bartlett: Compara un promedio ponderado de las varianzas dentro de la muestra a su
media geomtrica.
Prueba de Harley: Calcula la proporcin de la varianza muestral ms grande a la varianza
muestral ms pequea.
Prueba de Levene: Ejecuta un anlisis de varianza en desviaciones absolutas de las
observaciones de sus medias muestrales.

Los resultados usando la Prueba de Levene, se pueden observar en la tabla 2.6, donde se
puede ver que el valor de p=0.2705 es menor que un valor de significancia dado 0.05 ,
indicando con esto, que no existen diferencias significativas entre las varianzas, con lo que
comprobamos la varianza constante.

Verificacin de Varianza
Prueba
Valor-P
Levene's 1.37284
0.270512

Tabla 2.6 Verificacin de la varianza de los tratamientos

30

2.6.2 SUPUESTO DE INDEPENDENCIA


Para checar el supuesto de independencia se requiere tener el orden de corrida experimental, como
se muestra a continuacin:
ORDEN DE
CORRIDA
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

ENVASE
A
B
C
A
B
B
C
A
C
B
B
A
C
A
B
C
C
A
C
B
A
C
B
A
C
B
A
C
B
A

RESIDUAL
-8
-6.3
6.7
-3
-12.3
-1.3
-0.3
-10
-7.3
1.7
7.7
-4
-9.3
4
9.7
1.7
8.7
10
8.7
-13.3
6
-0.3
8.7
-1
0.7
10.7
1
-9.3
-5.3
5

Y en seguida graficarlos como se muestra a continuacin:

31

Residual Plot for DIAS


16

residual

11
6
1
-4
-9
-14
0

10

15

20

25

30

row number

RESIDUALES VS ORDEN DE CORRIDA (O SECUENCIA DE TIEMPO)


Figura 2.3 Verificacin de la independencia de los residuales
En la figura 2.3 se presenta grficamente el nmero de corrida contra el valor del residual. En esta
grfica no se debe presentar ningn tipo de patrn de comportamiento, los puntos deben verse
completamente dispersos. De acuerdo a esta grfica se puede concluir que si se cumple el supuesto
de independencia.
2.6.3 SUPUESTO DE NORMALIDAD
Un procedimiento til consiste en construir una grfica de probabilidad normal de los residuos. Una
grfica de este tipo es la representacin de la distribucin acumulada de los residuos sobre papel de
probabilidad normal, en otras palabras, es papel para grficas cuya escala de ordenadas es tal que la
distribucin normal acumulada sea una recta. Para construir una grfica de probabilidad normal se
hace el siguiente procedimiento:
1. Se ordenan los residuos en orden ascendente:

-13.3
-12.3
-10
-9.3
-8
-6.3
-5.3

RESIDUALES
ORDENADOS
-1.3
-1
-0.3
0.3
0.7
1.7
1.7

6.7
7.3
7.7
8.7
8.7
8.7
9.3
32

-4
-4
-3

4
5
6

9.7
10
10.7

2. A cada residuo se le calcula su punto de probabilidad acumulada mediante la siguiente formula:

( k 0.5 )
N
K e
( k 0.5 )
ij

Pk
K e
ij
1
2
3
4
5
6
7
8
9
10

Pk

-13.3
-12.3
-10
-9.3
-8
-6.3
-5.3
-4
-4
-3

( k 0.5 ) K
30

0.016
0.05
0.083
0.116
0.15
0.183
0.21
0.25
0.283
0.316

11
12
13
14
15
16
17
18
19
20

eij

Pk

( k 0.5 )
30

-1.3
-1
-0.3
0.3
0.7
1.7
1.7
4
5
6

0.35
0.383
0.416
0.45
0.483
0.516
0.55
0.583
0.616
0.65

3. Se grafican eij en el eje de las X's y los

Pk

21 6.7
22 7.3
23 7.7
24 8.7
25 8.7
26 8.7
27 9.3
28 9.7
29
10
30 10.7

Pk

30
0.683
0.716
0.75
0.783
0.816
0.85
0.883
0.916
0.95
0.983

( k 0.5 )
30

en el eje de las Y's, como se muestra la

figura 2.4

Normal Probability Plot for RESIDUALS


99.9

percentage

99
95
80
50
20
5
1
0.1
-14

-9

-4

11

RESIDUALS
Figura 2.4 Grafico de probabilidad normal para los residuos
En est grfica se puede ver que la mayora de los puntos se ajustan a la lnea recta, lo que
significa que los residuales si cumplen el supuesto de normalidad.
33

Anda mungkin juga menyukai