Anda di halaman 1dari 22

Universidad de Mendoza

Ing. Jess Rubn Azor Montoya

ANLISIS DE VARIANZA
Se supone el caso de un fabricante y tres consumidores de latas cuyo fondo
tengan al menos 0.25 libras de recubrimiento de estao. Mediante un tratamiento
qumico, se puede medir el peso de este recubrimiento, pero desgraciadamente no se
puede repetir la experiencia con la misma muestra en lo cuatro laboratorios.
Un ensayo experimental puede consistir en cortar discos a enviar a cada
laboratorio, pero puede haber diferencias en el promedio debido: a) diferencias
sistemticas en la tcnica de medicin, b) variabilidad aleatoria.
Por otro lado, est la incgnita de cuntos discos deberan cortarse para enviar a
cada laboratorio. Una forma de determinar este valor es utilizando la desviacin
estndar de la distribucin muestral entre dos medias. Se supondr que este nmero est
en el orden de 12 por laboratorio (en total 48 discos).
La pregunta ahora es cmo seleccionar esos 48 discos de una chapa, la primera
que viene a la mente es enviar segn este formato:

Si las medias de las mediciones realizadas por cada uno de los laboratorios estn
muy dispersas, indica falta de consistencia en las mediciones. Esto puede ser porque
todos miden distinto o quiz porque la distribucin del depsito en la chapa es irregular.
Es decir, se confunde la inconsistencia de los laboratorios con la cantidad de estao
depositado en la tira.
Una solucin posible para esto sera numerar aleatoriamente los discos, por
medio de una Tabla de Nmeros Aleatorios o con una computadora, destinando a cada
uno de los laboratorios los siguientes discos:
Laboratorio A: 3, 10, 22 .
Laboratorio B: 33, 42, 8 .
Laboratorio A: 15, 12, 28 .
Laboratorio A: 45, 21, 35 .
Esta alternativa disuelve el patrn de la disposicin de estao sobre la chapa
(por ejemplo, ms espesor en el centro que en los bordes). Al aleatorizar el total de los
48 discos slo queda atribuir a variacin aleatoria las causas extraas.
Otra solucin podra ser entregar los 48 de una misma tira (experimentacin
controlada), pero los resultados seran slo aplicables a distancias fijas del extremo de la
lmina.
Rara vez se fijan todos o la mayora de los factores extraos a lo largo de un
experimento, se consigue as una estimacin de la variacin aleatoria que no est
inflada por variaciones debidas a otras causas.

Ctedra Estadstica II

Universidad de Mendoza

Ing. Jess Rubn Azor Montoya

En la prctica, los experimentos debern planearse de tal manera que las fuente
conocidas de variabilidad sean deliberadamente consideradas sobre un rango tan
amplio como sea necesario. Ms an, debern variarse en tal forma que su variabilidad
pueda eliminarse en la estimacin de la variable aleatoria.
Un modo es repetir el experimento en varios bloques en los que la fuente
conocida de variabilidad (esto es, variables extraas) se mantienen fijas en cada bloque,
pero variando de bloque en bloque:
Tira 1
8, 4, 10
2, 6, 12
1, 5, 11
7, 3, 9

Laboratorio A
Laboratorio B
Laboratorio C
Laboratorio D

Tira 2
23, 24, 19
21, 15, 22
16, 20, 13
17, 18, 14

Tira 3
26, 29, 35
34, 33, 32
36, 29, 30
28, 31, 25

Tira 4
37, 44, 48
45, 43, 46
41, 38, 47
39, 40, 42

De este modo, las diferencias entre medias obtenidas por los 4 laboratorios, no
pueden atribuirse a variaciones entre tiras.
DISEOS COMPLETAMENTE ALEATORIOS
Se supone que el experimentador cuenta con los resultados de k muestras
aleatorias independientes, cada una de tamao n, de k diferentes poblaciones (datos
relativos a k tratamientos, k grupos, k mtodos de produccin, etc.). Interesa probar la
hiptesis de que las medias de esas k poblaciones son todas iguales.
Se denota a la j-sima observacin de la i-sima muestra por yij. El esquema
general para un criterio de clasificacin es:
Medias
Muestra 1
Muestra 2
.
Muestra i
.
Muestra k

y11
y21

yi1

yk1

y12
y22

yi2

yk2

y1j
y2j

yij

ykj

y1n
y 2n

yin

ykn

Bajo este esquema experimental, en referencia al ejemplo tratado, yij (i=1,2,..,4;


j=1,2,, 12) es la j-sima medicin del peso del revestimiento del isimo laboratorio, e
es la media global (o gran media) de las 48 observaciones.
Para pruebas de hiptesis (medias iguales) se supondr estar trabajando con
poblaciones normales de la misma 2.
Si i es la media de la poblacin i-sima y 2 es la varianza comn de las k
poblaciones, se puede expresar cada observacin yij como i ms el valor del
componente aleatorio:
y i j = i + i j

para i=1,2,..,k; j=1,2,, n

i j es una variable aleatoria con distribucin normal, = 0 y 2 comn.


Para dar uniformidad a las ecuaciones, se reemplaza i por + i , donde es la
media de las i y i es el efecto del i-simo tratamiento, de aqu que:

Ctedra Estadstica II

Universidad de Mendoza

Ing. Jess Rubn Azor Montoya

i 1

esto surge de:

1
k

i 1

1
k

i 1

1
k

i 1

luego, la expresin de yij queda:


y i j = i + i j

para i=1,2,..,k; j=1,2,, n

Por lo tanto, la Hiptesis Nula (las medias de las k poblaciones iguales) se


reemplaza por la Hiptesis Nula de que 1 = 2 = = k = 0. La Hiptesis Alterna
de que al menos dos de las medias son distintas equivale a que i < > 0 para alguna i.
Para probar la Hiptesis Nula, se comparan las estimaciones de 2 (una en base a
la observacin de las medias muestrales y la otra con la variacin dentro de la muestra).
cuatro laboratorios de un Ya que cada muestra viene de una poblacin con varianza 2 , la varianza se
edias obtenidas por
cada estimar
uno de cualquiera de las muestras:
puede
uir una Tabla de anlisis de
2
si

1
n 1

yij yi

j 1

y entonces tambin por su media:

cada una de las varianzas muestrales si2 est basada en (n-1) grados de libertad y
entonces
est basada en k.(n-1) grados de libertad.
Por otro lado, la varianza de las k medias muestrales est dada por:

y si la hiptesis es verdadera, esta expresin da una estimacin de 2/n y as una


estimacin de 2 , pero basada en la diferencia entre las medias, est dada por:

Ctedra Estadstica II

Universidad de Mendoza

Ing. Jess Rubn Azor Montoya

basada en (k-1) grados de libertad.


Si Ho es cierta, se puede demostrar que
independientes de 2 y por ello:
F=

son estimaciones

es una variable aleatoria con distribucin F con = k-1 y = k.(n-1) grados de


libertad.
Cabe esperar que la varianza entre muestras,

, exceda la varianza dentro de

las muestras,
, cuando la Hiptesis Nula es falsa, por eso Ho ser rechazada si
F>F.
Con el argumento anterior se ha indicado cmo la prueba de las k medias se
puede fundamentar en la comparacin de dos estimaciones de varianzas.
Es notable el hecho de que las dos estimaciones en cuestin [excepto para los
divisores (k-1) y k.(n-1)] pueden obtenerse partiendo o analizando la varianza total de
las n.k observaciones en dos partes. La varianza muestral de las n.k observaciones est
dada por:

se puede probar el siguiente teorema respecto del numerador, llamado Suma de


Cuadrados Total:

Demostracin:
k

i1 j1
k
n

i1 j1

y y 2
ij i

y y y y
ij i i .

i1 j1

i1

2

2

y y 2 y y y y y y
ij i
ij i i . i .

y y
i .

j1

y y n
ij i

i1

y y
i .

y como:
n

j1

y y
ij i

se verifica la relacin anterior:


Se acostumbra a denotar:
a) Suma de Cuadrados Total, SST:
Ctedra Estadstica II

Universidad de Mendoza

Ing. Jess Rubn Azor Montoya

yij y.

SST

i 1 j 1
b) Suma de Cuadrados de Error, SSE:

c) Suma de Cuadrados de Tratamiento SS(Tr):

Luego, F se puede escribir as:


SS ( T r)
k1

SSE
k ( n1)

los resultados obtenidos son resultados en la siguiente tabla:


Fuentes
de
Variacin
Tratamientos
Error
Total

Grados de
Libertad
k-1
k.(n-1)
n.k-1

Suma
de Media Cuadrada
Cuadrados
SS(Tr)
MS(Tr)=SS(Tr)/(k-1)
SSE
MSE=SSE/k.(n-1)
SST

F
MS(Tr)/MSE

Ejemplo: A fin de utilizar el Anlisis de Varianza para un criterio de clasificacin,


suponer el siguiente esquema de mediciones de cuatro laboratorios de un parmetro
determinado (revestimiento de estao de 12 discos) cuyos resultados son:
Total
Lab. A
Lab. B
Lab. C
Lab. D
Total

.25
.18
.19
.23

.27
.28
.25
.30

.22
.21
.27
.28

.30
.23
.24
.28

.27
.25
.18
.24

.28
.20
.26
.34

.32
.27
.28
.20

.24
.19
.24
.18

.31
.24
.25
.24

.26
.22
.20
.28

.21
.29
.21
.22

.28
.16
.19
.21

3.21
2.72
2.76
3.00
11.69

del que se quiere probar que las medias obtenidas por cada uno de ellos es
significativamente igual (Hiptesis Nula) con =0.05. Construir una Tabla de anlisis
de varianza.
Para facilitar clculos, se utilizan las frmulas:
k

SST

i 1 j 1

yij

SS ( Tr)

1
n

Ti C

i 1

Demostracin:

Ctedra Estadstica II

Universidad de Mendoza

Ing. Jess Rubn Azor Montoya


n

y y
ij i

Para Suma de Cuadrados totalj 1


k

SST

ij
y

i1 j1
k
n

2
yij 2yijy. y.

y y
ij .

i1 j1
k
n

i1 j 1
k

1
2 y ( k n )

.
( k n )

2
y k n y

ij

i1 j 1

2
yij k n y.

i1 j1

n
k

y
ij

i1 j1

( k n )

2
k n y

.
k

( k n )

k
n

y
ij
k n
i 1 j 1

2
yij C

SST

i1 j1

Para Suma de Cuadrados de Tratamientos:


k

i1

i
k

SS( Tr)

i 1

1
n

y 2 y
.
i

y C
ij
n

i1 j1

SS( Tr)

i1

y y
i .

1 n


n
y C
ij
n
i1 j1

2
2
y ( n k) y

2
y k y
i

i1

2
Ti C

i1

donde C (llamado Trmino de Correccin) y Ti es:

k
n

yij
k n

i 1 j 1

Ti

yij

j 1

donde Ti es el nmero total de n observaciones de la i-esima muestra, Mientras que T es


el Gran Total de las k.n observaciones. Luego, SSE se obtiene de:
SSE = SST SS(Tr)
Para el ejemplo:
T = 11.69

Ctedra Estadstica II

C = T2/(k.n) = 11.692/(4.12) = 2.8470

Universidad de Mendoza

Ing. Jess Rubn Azor Montoya

SST= 0.252 + 0.272 ++0.212 - 2.8740 = 0.0809


SS(Tr) = (3.212 + 2.722 + 2.762 + 3.002 ) / 12 - 2.8740 = 0.0130
SSE = 0.809 0.0130 = 0.0679
la Tabla queda:
Fuentes
de
Variacin
Laboratorios
Error
Total

Grados de
Libertad
3
44
47

Suma
de Media Cuadrada
Cuadrados
0.0130
0.0043
0.0679
0.0015
0.0809

F
2.87

Conforme a las tablas de la funcin F, se puede encontrar el valor


correspondiente de la abscisa que deja a la derecha un rea de 0.05 siendo adems los
grados de libertad para el numerador y denominador 3 y 44, respectivamente, como lo
indica el siguiente grfico

Ya que F (2.87) excede a F0.05= 2.82, se rechaza la Hiptesis Nula, luego los
laboratorios no estn logrando resultados consistentes.
Un segmento de programa Matlab que realiza esta prueba trabajando sobre una
matriz experimental, se describe a continuacin:
function anova1
% Determinacion del estadistico F para un diseo completamente aleatorio
% con datos presentes en el archivo ascii cuadro.txt
% Entradas: u, matriz, obtenida del archivo ascii "cuadro.txt"
%
% Salida: F, real, Estadistico
%
load cuadro.txt;u=cuadro';n=size(u,1);k=size(u',1);
% Calculo de las medias de cada tratamiento (filas)
for i=1:k, m=0;
for j=1:n, m=m+u(j,i); end
med(i)=m;
end
gran_media=mean(med);
% Calculo de la correccion

Ctedra Estadstica II

Universidad de Mendoza

Ing. Jess Rubn Azor Montoya

C=0; for i=1:k,


for j=1:n,C=C+u(j,i); end
end
C=1/(k*n)*C^2;
% Suma de cuadrados total (SST)
SST=0; for i=1:k,
for j=1:n,SST=SST+u(j,i)^2; end
end
SST=SST-C;
% Calculo de la suma de cuadrados de tratamientos (SSTr)
SSTr=0; for i=1:k,
SSTr=SSTr+(med(i))^2;
end
SSTr=1/n*SSTr-C;
SSE=SST-SSTr;
% Calculo de los cuadrados medios
MSTr=floor(SSTr/(k-1)*10000);MSE=floor(SSE/(k*(n-1))*10000);
F=MSTr/MSE

Luego ejecutando:
>> anova1
F=
2.8667
Para estimar los parmetros , 1, 2, 3 y 4 se puede emplear mnimos
cuadrados minimizando:
k

yij i2

i 1 j 1

con respecto a y a las i , sujetas a la restriccin

Esto se puede hacer por el mtodo de los Multiplicadores de Lagrange.


Derivando la penltima expresin respecto de e igualando a cero:
k

2 yij i

i 1 j 1
k
n

yij

yij k n 0

i 1 j 1
k
n

i 1 j 1

i 1 j 1

i 1 j 1

Ctedra Estadstica II

Universidad de Mendoza

Ing. Jess Rubn Azor Montoya

para un i dado:
n

2 yij i

j 1

j 1

yij

j 1

j 1

Ejemplo: Estimar los parmetros del modelo con un criterio de clasificacin para los
revestimientos de estao del ejemplo anterior.

11.69

1
3

0.244
48
3.21 11.69

12
48
2.76 11.69

12
48

0.024

0.0135

2.72
12
3.00
12

11.69
48
11.69
48

0.017
0.006

TAMAOS MUESTRALES DISTINTOS


El Anlisis de Varianza descripto, se aplica a criterios de clasificacin en que
cada muestra tiene el mismo nmero de observaciones. Si no es as, y los tamaos
muestrales son n1, n2, , nk se tiene que sustituir N = ni por n.k en todo lo anterior,
quedando el siguiente esquema de partida:
Medias
Muestra 1
Muestra 2
.
Muestra i
.
Muestra k

y11
y21

yi1

yk1

y12
y22

yi2

yk2

y1j
y2j

yij

ykj

Se obtiene la varianza dentro de la muestra:


ni

si

1
ni 1

y y
ij

Ctedra Estadstica II

Universidad de Mendoza

Ing. Jess Rubn Azor Montoya

la varianza de las k medias muestrales es:

con lo cual se determina:

La varianza muestral de las N observaciones est dada por:

se puede demostrar que:

SST = SSE + SS(Tr)


Con:
k

SST

ni

yij

Ti 2

SS ( Tr)

i 1 j 1

ni

i 1

siendo:

ni
k

yij

N
i 1 j 1

Ti

yij

i 1

Problema: El contenido de aflatoxina, en partes por milln, de algunas muestras de


crema de man se prueba y se consiguen los siguientes resultados:

Marca A

Ctedra Estadstica II

0.5

0.0

3.2

1.4

0.0

1.0

8.6

2.9

Total
17.6

10

Universidad de Mendoza

Marca B
Total

Ing. Jess Rubn Azor Montoya

4.7

6.2

0.0

10.5 2.1

0.8

24.3
41.9

a) Emplear Anlisis de Varianza para probar si las dos marcas difieren en en contenido
de aflatoxina, con un nivel de significancia a=0.05.
b) Probar la misma hiptesis usando la prueba t-bimuestral.
Respuesta:
a)

y1 2.2

y2 4.05

SST

y1j 3

SS ( Tr)

y. 2.2

y2j 3 2

146.25

ni yi 3

8 ( 2.2 3) 6 ( 4.05 3)

11.74

i 1
SSE = SST SS(Tr) = 146.25 11.74 = 134.51

Fuentes de
Variacin
Tratamientos
Error
Total

Grados de Suma
de Media Cuadrada
F
Libertad Cuadrados
1
11.74
11.74
12
134.51
11.21
13
146.25

1.05

Dado que 1.05 < 4.75 (valor de F, de Tablas, con =0.05, =1 y =12) se rechaza
la Hiptesis de que las dos marcas difieren en el contenido de aflatoxina.
b) El estadstico para esta prueba es:

x1 x2

n1 1 s12 n2 1 s22
2

s1
t

8.15

s2

n1 n2 n1 n2 2

n1 n2

15.48

2.2 4.05
( 8 1) 8.15 ( 6 1) 15.48

8 6 ( 8 6 2)
8 6

1.0234

siendo t0.025= -2.18 con = n1 + n2 2 = 8 + 6 - 2=12 grados de libertad, se aprecia que


t > t0.025 por lo tanto se rechaza la Hiptesis de que las dos marcas difieren en el
contenido de aflatoxina.
Puede comprobarse que el estadstico t con grados de libertad y el estadstico F
con grados de libertad estn relacionados por:
F(1,t

Ctedra Estadstica II

11

Universidad de Mendoza

Ing. Jess Rubn Azor Montoya

lo se puede verificar para este caso:

DISEO EN BLOQUES ALEATORIOS


Se supondr que el experimentador tiene a su disposicin mediciones relativas a
a tratamientos distribuidos en b bloques. Primero se observar el caso en que hay
exactamente una observacin de cada tratamiento en cada bloque (para el caso anterior,
cada laboratorio probar un disco de cada tira). Si yij denota la observacin relativa al
i-esimo tratamiento y al j-simo bloque,
la media de las b observaciones para el
i-simo tratamiento,
la media de las a observaciones en el j-simo bloque e
la
gran media de las a.b observaciones, se emplea el siguiente esquema en esta clase de
clasificacin con dos criterios:

Tratamiento 1
Tratamiento 2
.
Tratamiento i
.
Tratamiento k
Medias

B1
y11
y21

yi1

ya1

B2
y12
y22

yi2

ya2

Bj
y1j
y2j

yij

Yaj

Bb
Medias
.
y1b
.
y 2b

.
yib

.
Yab

Al esquema se lo llama aleatorio, siempre que los tratamientos sean asignados al


azar dentro de cada bloque.
Cuando se usa un punto en lugar de un subndice, esto significa que la media se
obtiene sumando sobre l.
El modelo que se supondr para el anlisis con una observacin por celda est
dado por:
y i j = i + j + i j

para i=1,2,..,a; j=1,2,, b

aqu es la gran media, i es el efecto de i-simo tratamiento, i el efecto del j-simo


bloque y los i j son valores de variables aleatorias independientes normalmente
distribuidas que tienen media cero y varianza comn 2 . Se restringen los parmetros
imponiendo las condiciones que:
a

i 1

j 1

En el anlisis de clasificacin con dos criterios, cada tratamiento es representado


una vez dentro de cada bloque, el objetivo principal consiste en probar la significancia
de las diferencias entre las , o sea, probar la Hiptesis Nula: 1 = 2 = = k = 0.

Ctedra Estadstica II

12

Universidad de Mendoza

Ing. Jess Rubn Azor Montoya

Ms an, quizs convenga probar si la divisin en bloques ha sido eficaz, esto es


probar que la Hiptesis Nula: 1 = 2 = = k = 0 puede rechazarse.
En cualquier caso, la Hiptesis alterna establece que al menos uno de los efectos
no es cero.
Como en el anlisis con un criterio, se fundar la prueba de significancia
mediante comparaciones de 2 (una basada en la variacin entre tratamientos, la otra
basada en la variacin entre bloques y la ltima que mide el error experimental ). Ntese
que slo el ltimo es una estimacin de 2 cuando cualquiera (o ambas) las Hiptesis
Nulas no son vlidas.
Las sumas de cuadrados requeridas estn dadas por el siguiente teorema:

SST = SSE + SS(Tr) + SS(Bl)


En la prctica se usan las siguientes frmulas:

donde:
C es el trmino de correccin
es la suma de las b observaciones para el i-simo tratamiento
es la suma de las a observaciones para el j-simo bloque
es la suma de todas las observaciones
Empleando esta sumas de cuadrados, se puede rechazar la Hiptesis Nula de que
las i son todas nulas, con un nivel de significancia si:
SS ( T r)

F Tr

MS( Tr)

a1

MSE

SSE
( a1) ( b1)

excede F con (a-1) y (a-1).(b-1) grados de libertad. La Hiptesis Nula de que todas las
i son todas nulas, con un nivel de significancia si:

Ctedra Estadstica II

13

Universidad de Mendoza

Ing. Jess Rubn Azor Montoya

SS ( Bl)

F Bl

MS( Bl)

b1

MSE

SSE
( a1) ( b1)

excede F con (b-1) y (a-1).(b-1) grados de libertad. Ntese que las medias de los
cuadrados MS(Tr), MS(Bl) y MSE se definen otra vez como las correspondientes sumas
de cuadrados divididas entre sus grados de libertad.
La siguiente tabla resume todo el procedimiento:

Fuentes de
Variacin
Tratamientos
Bloques
Error
Total

Grados de
Libertad
a-1
b-1
(a-1).(b-1)
a.b-1

Suma de
Cuadrados
SS(Tr)
SS(Bl)
SSE
SST

Media Cuadrada

MS(Tr)=SS(Tr)/(a-1)
MS(Bl)=SS(Bl)/(b-1)
MSE=SSE/(a-1).(b-1)

FTr = MS(Tr)/MSE
FBl = MS(Bl)/MSE

Ejemplo: Se dise un experimento para estudiar el rendimiento de cuatro detergentes


diferentes. Las siguientes lecturas de blancura se obtuvieron con un equipo
especialmente diseado para 12 cargas de lavado , distribuidas en tres modelos de
lavadoras:

Detergente A
Detergente B
Detergente C
Detergente D
Totales

Lavadora 1
45
47
48
42
182

Lavadora 2
43
46
50
37
176

Lavadora 3
51
52
55
49
207

Totales
139
145
153
128
565

Considerando los detergentes como tratamientos y las lavadoras como bloques, obtener
la Tabla de Anlisis de Varianza y probar, con un nivel de significacin 0.01, si existen
diferencias entre los detergentes y/o entre las lavadoras.
1
23-

Hiptesis Nula: 12 = 3 =4 = 0, 12 = 3 = 0
Hiptesis Alternativa: no todas las y tampoco las iguales a 0.
Nivel de significancia: =0.01.
Se rechaza Ho si F > 9.78 (este valor corresponde a F0.01 con 1y2
O si F > 10.9 (este valor corresponde a F0.01 con 1y2

4 Clculos:
a = 4 b = 3 T1. = 139 T2. = 145 T3. = 153 T4. = 128
T.1 = 182 T.2 = 176 T.3 = 203 T. . = 565

yij2 = 26867

C = 5652 / 12 = 26602
SST = 452 + 432 ++ 492 - 26602 = 265

Ctedra Estadstica II

14

Universidad de Mendoza

Ing. Jess Rubn Azor Montoya

SS(Tr) = ( 1392 + 1452 +1532 + 1282 ) / 3 - 26602 = 111


SS(Bl) = ( 1822 + 1762 +1282 ) / 4 - 26602 = 135
SST = 265 111 135 = 19
la Tabla queda:
Fuentes de
Variacin
Detergentes
Lavadoras
Error
Total

Grados de Suma
de Media Cuadrada
F
Libertad Cuadrados
3
111
37.0
2
135
67.5
6
19
3.2
11
265

11.6
21.1

5- Dado que FTr = 11.6 > 9.78 se Rechaza la primera Hiptesis Nula, por lo tanto hay
diferencia significativa entre la eficacia de los detergentes, y dado que FBl = 21.1 > 10.9
tambin hay diferencia significativa entre la eficacia de las lavadoras.
Un segmento de programa Matlab que realiza esta prueba trabajando sobre una
matriz experimental, se describe a continuacin:
function bloques
% Determinacion del estadistico F para un diseo en bloques aleatorios
% con datos presentes en el archivo ascii cuadro1.txt
% Entradas: u, matriz, obtenida del archivo ascii "cuadro1.txt"
%
% Salida: FTr, real, Estadistico
%
FBl, real, Estadistico
%
load cuadro1.txt;u=cuadro1';b=size(u,1);a=size(u',1);
% Calculo de la suma de todas las observaciones
T=0; for i=1:a, for j=1:b, T=T+u(j,i); end, end
C=T^2/(a*b);
% Calculo de la Suma de cuadrados total
SST=0; for i=1:a, for j=1:b, SST=SST+u(j,i)^2; end, end
SST=SST-C;
% Calculo de la Suma de cuadrados de tratamientos
SSTr=0; for i=1:a, ss=0; for j=1:b, ss=ss+u(j,i); end
SSTr=SSTr+ss^2 ;
end
SSTr=SSTr/b-C;
% Calculo de la Suma de cuadrados de bloques
SSBl=0; for j=1:b, ss=0; for i=1:a, ss=ss+u(j,i); end
SSBl=SSBl+ss^2 ;
end
SSBl=SSBl/a-C;
% Calculo de la Suma de cuadrados de error
SSE=SST-SSBl-SSTr;
FTr=SSTr/(a-1)/(SSE/((a-1)*(b-1)))
FBl=SSBl/(b-1)/(SSE/((a-1)*(b-1)))

Luego ejecutando:
>> bloques
Ctedra Estadstica II

15

Universidad de Mendoza

Ing. Jess Rubn Azor Montoya

FTr =
11.7788
FBl =
21.5310
COMPARACIONES MLTIPLES
Con las pruebas F empleadas se demostraba si las diferencias entre varias
medias eran significativas, pero no informaban si una media en particular (o medias)
difieren en forma significativa de otra media considerada (o grupo de medias). En el
caso de los pesos de los recubrimientos puede ser importante que los laboratorios
difieran unos de los otros.
Si un experimentador tiene ante s k medias, parece razonable probar entre todos
los pares posibles, esto es efectuar k.(k-1)/2 pruebas t bimuestrales. Esto no es eficiente.
Para ello se utilizan Pruebas de Comparaciones Mltiples, y entre ellas la Prueba del
Rango Mltiple de Duncan.
Las suposiciones bsicas son, en esencia, las del anlisis de la varianza en una
dimensi para tamaos muestrales iguales.
La prueba compara el Rango de Mnima Significancia, Rp, dado por:
Rp

aqu

s r p
x

es una estimacin de:

x
n

y puede calcularse como:


s

MSE

donde MSE es la media de los cuadrados de error en el Anlisis de Varianza. El valor de


rp depende del valor deseado de significancia y del nmero de grados de Libertad
correspondiente a la MSE, que se obtienen de tablas existentes en la bibliografa (Miller
y Freund, Estadstica para Ingenieros, tablas 12a, para =0.05 y 12b, para =0.01,
con p=2,3,,10 y para varios grados de libertad entre 1 y 120).
Ejemplo: Con respecto a los datos de los pesos de los recubrimientos de estao, aplicar
la prueba del Rango Mltiple de Duncan para probar cules medias de los laboratorios
difieren de las otras empleando un nivel de significancia de 0.05.
Para ello se ordenan, en orden creciente, las cuatro medias muestrales:
Laboratorio
Media
luego, se calcula

Ctedra Estadstica II

B
C
D
A
0.227 0.230 0.250 0.268
usando MSE = 0.0015 del Anlisis de Varianza:

16

Universidad de Mendoza

s
x

0.0015
12

Ing. Jess Rubn Azor Montoya

0.011

siendo el nmero de grados de libertad = k.(n-1) = 44. Por interpolacin, en la Tabla


12-a, se obtienen los valores de rp:
p
rp
multiplicando rp por
P
Rp

2
2.85

3
3.00

4
3.09

3
0.033

4
0.034

= 0.011:
2
0.031

El rango de las cuatro medias es 0.268 0.227 = 0.041, que excede a R4 = 0.034,
que es el rango significativo mnimo.
Esto era de esperar, porque la prueba F indic que las diferencias entre las cuatro
medias eran significativas con a = 0.05.
Para probar que hay diferencias significativas entre tres medias adyacentes, se
obtienen los rangos de 0.038 y 0.023 respectivamente para 0.230, 0.250, 0.268 y 0.227,
0.230, 0.250. Puesto que el primero de estos valores sobrepasa a R3 = 0.033, las
diferencias correspondientes no son significativas.
Por ltimo en el caso de parejas adyacentes de medias, ningn par adyacente
tiene rango mayor que el rango significativo mnimo R2 = 0.031. Esto se resume:

donde se ha dibujado una lnea bajo cualquier conjunto de medias adyacentes para las
cuales el rango es menor que un valor correspondiente de Rp , esto es, bajo cualquier
conjunto de medias adyacentes, para las cuales las diferencias no son significativas.
Se concluye as que el Laboratorio A obtiene los pesos medios de
recubrimiento ms alto que los Laboratorios B y C.
OTROS DISEOS EXPERIMENTALES
Para el diseo de Cuadro Latino, se supone que es necesario comparar tres
tratamientos A, B y C en presencia de otras dos fuentes de variabilidad. Por ejemplo, los
tres tratamientos pueden ser tres mtodos de soldadura para conductores elctricos y las
dos fuentes de variabilidad pueden ser:
1) Diferentes operarios
2) La utilizacin de diferentes fundentes para soldar.
Si se consideran tres operarios y tres fundentes, el experimento puede disponerse
as:

Ctedra Estadstica II

17

Universidad de Mendoza

Ing. Jess Rubn Azor Montoya

Fundente 1 Fundente 2
A
B
Operador 1
C
A
Operador 2
B
C
Operador 3

Fundente 3
C
B
A

aqu cada mtodo de soldadura se aplica slo una vez por cada operario junto con cada
fundente.
Un arreglo experimental como el descripto de denomina Cuadro Latino. Un
Cuadro Latino n x n es una arreglo cuadrado de n letras distintas, las cuales aparecen
slo una vez en cada rengln y en cada columna. Ntese que en un experimento en
Cuadro Latino de n tratamientos es necesario incluir n2 observaciones, n por cada
tratamiento.
Un experimento en Cuadro Latino sin repeticin da solo (n-1).(n-2) grados de
libertad para estimar el error experimental. De modo que tales experimentos son
efectuados en contadas ocasiones sin repeticin cuando n es pequeo.
Si existe un total de r repeticiones, el anlisis de los datos presupone el siguiente
modelo, donde yij(k)l es la observacin en el i-simo rengln, en la j-sima columna, de
la l-sima repeticin y el subndice k indica el k-simo tratamiento:
yij(k)l = + i + j + k + l + ij(k)l
0.0015
0.0112
con
12 las restricciones:
n

i 1

j 1

para i, j, k = 1, 2, , n y l = 1, 2, , r

k1

l 1

donde:

i
j
k
l
ij(k)l

es la gran media
es el efecto de la i-sima fila o rengln
es el efecto de la j-sima columna
es el efecto del k-simo tratamiento
es el efecto de la l-sima repeticin
variable aleatoria independiente normal con = 0 y varianza comn 2.

ntese que por los efectos de los renglones y los efectos de las columnas se
entienden los efectos de las dos variables extraas y que se incluyen los efectos de la
repeticin como una tercera variable extraa. k est entre parntesis ya que para un
diseo de Cuadro Latino dado, k es automticamente determinada cuando i y j se
conocen.
La hiptesis principal a probar es la Hiptesis Nula k = 0, para toda k, es decir
la Hiptesis Nula de que no existe diferencia en la eficacia de n tratamientos.
Tambin se puede probar si i = 0, para todo i y j = 0, para todo j con el fin de
comprobar si las dos variables extraas tienen algn efecto sobre el fenmeno que se
est considerando.
Mas an, se puede probar es la Hiptesis Nula l = 0, para toda l, contra la
alternativa que no todas las l son iguales a cero, y esta prueba del efecto de las
repeticiones puede ser importante si las partes del experimento , que representan los
Cuadros Latinos individuales, fueron realizados en distintos das, a diferentes
temperaturas, etc..

Ctedra Estadstica II

18

Universidad de Mendoza

Ing. Jess Rubn Azor Montoya

Las frmula a aplicar son:

SSE = SST SS(Tr) SSR SSC SS(Rep)


donde:
total de las r.n observaciones en todos los i-simos renglones
total de las r.n observaciones en todas las j-simas columnas
total de las n2 observaciones en todos las l-simas repeticiones
total de las r.n observaciones relativas a los j-simos tratamientos
es el gran total de las r.n2 observaciones
lo que lleva al siguiente cuadro de anlisis:
Fuente de
Variacin
Tratamientos
Rengln
Columna
Repeticin
Error
Total

Grados de
libertad
n 1
n 1
n 1
r 1
(n-1)(r.n+r-3)
r.n2 - 1

Suma de
cuadrados
SS(Tr)
SSR
SSC
SS(Rep)
SSE
SST

Cuadrados Medios

MS(Tr)=SS(Tr)/(n-1)
MSR=SSR/(n-1)
MSC=SSC/(n-1)
MS(Rep)=SS(Rep)/(r-1)
MSE=SSE/[(n-1).( r.n+r-3)

MS(Tr)/MSE
MSR/MSE
MSC/MSE
MS(Rep)/MSE

Ejemplo: Suponer que se efectan repeticiones del experimento de soldadura empleando


el siguiente arreglo:

Ctedra Estadstica II

19

Universidad de Mendoza

Ing. Jess Rubn Azor Montoya

Los resultados, que sealan el nmero de kilogramos fuerza de tensin


requeridos para separar los puntos soldados, fueron como se indica a continuacin:

analizar el experimento como un Cuadro Latino y probar con un nivel de significacin


de 0.01 si existen diferencias en los mtodos, en los operadores, los fundentes o las
repeticiones.
1
23-

12 = 3 = 0; 12 = 3 = 0 ; 12 = 3 = 0; 12 = 0
Hiptesis Alternativa: no todas las , , , iguales a 0.
Nivel de significancia: =0.01.
Para tratamientos, renglones y columnas se rechaza Ho si F > 7.56 (este valor
corresponde a F0.01 con 1y2
Para repeticiones se rechaza Ho si F > 10.0 (este valor corresponde a F0.01 con
1y2

4 Clculos:
n = 3 r = 2 T1.. = 81 T2.. = 79.5 T3.. = 75.5 T.1. = 70.0
T.2. = 92.0 T.3 . = 78.0 T..1 = 119.5 T..2 = 120.5 T(A) = 87.5
T(B) = 86.5

T(C) = 66.0

T = 240.0

yij(k)l2 = 3304.5

C = 2402 / 18 = 3200.0
SST = 142 + 16.52 ++ 11.52 3200.0 = 104.5
SS(Tr) = ( 87.52 + 86.52 + 66.02 ) / 6 3200.0 = 49.1
SSR = ( 812 + 79.52 +79.52 ) / 6 3200.0 = 0.2
SSC = ( 702 + 922 +782 ) / 6 3200.0 = 41.2

Ctedra Estadstica II

20

Universidad de Mendoza

Ing. Jess Rubn Azor Montoya

SSE = 104.5 49.1 0.2 - 41.2 = 13.8


la Tabla queda:
Fuentes de
Variacin
Tratamientos
(Mtodos)
Renglones
(Operadores)
Columnas
(Fundentes)
Repeticiones
Error
Total

Grados de Suma de
Libertad Cuadrados

Media Cuadrada

49.1

24.6

17.6

0.2

0.1

0.1

41.3

20.6

14.7

1
10
17

0.1
13.8
104.5

0.1
1.4

0.1

5 En lo que respecta a tratamientos (mtodos) y a columnas (fundentes) dado que


F = 17.6 y 14.7 sobrepasan a 7.56 se rechazan las Hiptesis Nulas correspondientes.
Para renglones (operarios) dado que F = 0.1 no excede a 7.56, no se rechaza Ho.
En otras palabras, se concluye que las diferencias en los mtodos y en los
fundentes, pero no en los operadores y las repeticiones, afectan a la resistencia mecnica
de la soldadura.
Ms an, la prueba del Rango Mltiple de Duncan da el siguiente patrn de
decisin, con = 0.01:
Mtodo C
11.0

Media

Mtodo B
14.4

Mtodo A
14.6

En consecuencia, se concluye que el Mtodo C produce uniones con soldaduras ms


dbiles que los Mtodos A y C.
La eliminacin de tres fuentes extraas de variabilidad puede lograrse mediante
el diseo de Cuadro Grecolatino. En un diseo consistente en un arreglo cuadrado de
n letras latinas y n letras griegas; ms exactamente, cada letra latina aparece slo una
vez al lado de cada letra griega:
A
B
C
D

B
A
D
C

C
D
A
B

D
C
B
A

Tambin se los llama Cuadros Grecolatinos Ortogonales. Como ejemplo,


suponer el caso de las soldaduras, la temperatura es otra fuente de variabilidad. Si tres
temperaturas de soldado, denotadas , yse utilizan junto con los tres mtodos, los
tres operadores (renglones) y tres fundentes (columnas), la repeticin de un experimento
apropiado de Cuadro Grecolatino puede establecerse as:

Operador 1

Ctedra Estadstica II

Fundente 1
A

Fundente 2 Fundente 3
B
C

21

Universidad de Mendoza

Operador 2
Operador 3

Ing. Jess Rubn Azor Montoya

C
B

A
C

B
A

As pues, el Mtodo A sera utilizado por el Operador 1, usando fundente 1, a la


temperatura , por el Operador 2, usando fundente 2, a la temperatura y por el
Operador 3, usando fundente 3, a la temperatura .
En un Cuadro Grecolatino, cada variable (representada por renglones, columnas,
letras latinas o letras griegas) est distribuida equitativamente respecto a las otras
variables.

Ctedra Estadstica II

22

Anda mungkin juga menyukai