Anda di halaman 1dari 15

ANALISIS DE VARIANZA DE UNA VIA

INTRODUCCION
ANOVA, del ingls ANalysis Of VAriance, es un test estadstico ideado por Fisher, gran genio
ingls que pens hace ms de 60 aos como analizar datos simultneamente cuando tenemos varios
grupos y as poder ahorrar tiempo y dinero. Este anlisis por lo tanto permite comprobar si existen
diferencias entre promedios de tres o ms tratamientos y para ello se calcula el valor de F, y es
equivalente al test de Student, salvo que ste ltimo solamente sirve para dos grupos. El problema
que desde ya tenemos que dejar establecido que cuando encontramos el valor de F sabremos si
existen diferencias entre los grupos, pero no no nos dice entre cuales grupos, y por eso debemos
aplicar posteriormente otros tests (en ingls "post hoc tests").
Iniciamos tambin con un ejemplo:
Datos: 4 tratamientos (A, B, C, D) con 3 replicas (ubicados en tres filas) y los valores para el grupo
A son 5, 6 y 7 (los valores adyacentes a dicho grupo son los valores al cuadrado, para obtener la
sumatoria de los cuadrados, igual para los grupos B, C y D).

A
x
2

B
x
2

C
x
2

D
x
2

5
25
5
25
4
16
6
36
6
36
4
16
5
25
4
16
7
49
5
25
3
9
6
36
x

=18
x
2
=110
14
66
12
50
16
88
Nota: suma de valores y suma de valores al cuadrado para cada grupo, en la ltima fila.
f = 3, k = 4, n = 12
Debemos calcular:
1. Suma total de los cuadrados (STC):

STC = x
2
- ( x)
2
/n Factor de correccin (CF): ( x)
2
/n
STC = (110 + 66 + 50 + 88) - (18 + 14 + 12 + 16)
2
/12
STC = 14
2. Suma de cuadrados dentro de los grupos (en ingls: "within sum of squares" WSS):
WSS = x
2
-(x
k
)
2
/n
f

WSS = 314 – ( 18
2
/3 +14
2
/3 +12
2
/3+16
2
/3 )
WSS = 7,34


3. Suma de cuadrados entre los grupos (between sum of squares (BSS):
BSS = (x
k
)
2
/n
f
– CF
BSS = ( 18
2
/3 +14
2
/3 +12
2
/3 +16
2
/3) – 300
BSS = 6,66

4. Construccin de la tabla de Anlisis de Varianza:

Fuente de
Variacin
Suma de
Cuadrados
(SS)
grados de
libertad
(gl)
Cuadrado
medio (MS)
Valor
de F
Entre
(Between)
6,66 3 2,22 2,42
Dentro
(Within)
7,34 8 0,918

Total 14,0 11

De la tabla de valores F, Tabla 1, F
,05
= 4,07
el valor obtenido, con sus grados de libertad, es F
3,8
=2,42, qu hacemos con la hiptesis nula?

Resultados con Systat
Analysis of Variance
Source Sum-of-Squares df Mean-Square F-ratio P
GRUPO 6.667 3 2.222 2.424 0.141
Error 7.333 8 0.917
-------------------------------------------------------------------------
Least squares means.
LS Mean SE N
GRUPO$ =A 6.000 0.553 3
GRUPO$ =B 4.667 0.553 3
GRUPO$ =C 4.000 0.553 3
GRUPO$ =D 5.333 0.553 3
Cmo graficamos tres grupos analizados con Anova de una va ?



ANOVA – ANALISIS DE VARIANZA DE UNA VIA
COMPARACION DE MEDIAS.
TESTS DE SCHEFF Y TUKEY.

Datos: 3 tratamientos con replicas (n) DIFERENTES en cada grupo.
(valor adyacente a cada columna es el valor al cuadrado, para facilitarclculos.
1 2 3

1,0 1 4,5 20,25 1,5 2,25
3,0 9 6,0 36 -2,5 6,25
-1,0 1 3,5 12,25 -0,5 0,25
1,5 2,25 7,5 56,25 1,0 1
0,5 0,25 7,0 49 0,5 0,25
3,5 12,25 6,0 36
5,5 30,25


x

= 8,5 x
2
=25,5 40 240 0 10
x = 1,4166 5,7143 0
f= 6,7,5 k = 3, n = 18
1. Suma total de los cuadrados (SSC):
STC = x
2
- ( x)
2
/n Factor de correccin (CF): ( x)
2
/n
STC = (25,75 + 240 + 10) - (8,5 + 40 + 0)
2
/18
STC = 275,75 - 130,68
STC = 145,07

2. Suma de cuadrados dentro de los grupos (within)
WSS = x
2
-(x
k
)
2
/n
f

WSS = 275,75 - ( 8,5
2
/6 + 40
2
/7 + 0
2
/5)
WSS = 275,75 - ( 12,0416 + 228,57 )
WSS = 35,1384

3. Suma de cuadrados entre los grupos (between)
BSS = (x
k
)
2
/n
f
- CF
BSS = ( 8,5
2
/6 + 40
2
/7 + 0
2
/5 ) - ( 48,5)
2
/18
BSS = 12,0416 + 228,57 - 130,68
BSS = 109,931

4. Construccin de la tabla de Anlisis de Varianza:


Fuente de
Variacin
Suma de
Cuadrados
(SS)
grados de
libertad
(gl)
Cuadrado
medio (MS)
Valor
de F
Entre
(Between)
109,93 2 54,965 23,46
Dentro
(Within)
35,14 15 2,3426

Total 145,07 17

Clculo de los grados de libertad:
gl between = nmero de grupos - 1
gl total = nmero de casos - 1
gl within = gl total - gl between
MS between = SS
between.
/ gl
between.

MS within = SS
within./
gl
within.

Valor F = MS
between.
/MS
within.

F crticos, de la tabla 1: F
2,15;0.01
= 6,36 F
2,15;0.005
= 7,70 por lo tanto: p<0,005
Matriz de Diferencias de los promedios de grupos:
1 2
2 4,2976
3 -1,41667 -5,71429
(Nota: diferencia del promedio del grupo 1 - promedio del grupo 2 =4,2976).

Teste de Scheff:
Dos promedios presentan diferencias significativas si su diferencia excede el valor calculado por:
[(k-1)F
0,05
]
1/2
[(1/n
1
+ 1/n
2
)S
0
2
]
1/2
k = nmero de promedios.


F
2,15;0.05
= 3,68 (valor crtico obtenido de la tabla de valores de F)

S
0
2
= 2,3424 (de cuadrado medio, within)

Comparacin diferencias de x valorde Scheff Dif. para ser significativa


1 vs. 2 4,2976 [(2)3,68]
1/2
[ (1/6 + 1/7)2,3424]
1/2
= 2,310
1 vs. 3 1,4116 [(2)3,68]
1/2
[ (1/6 + 1/5)2,3424]
1/2
= 2,5142
2 vs. 3 5,714 [(2)3,68]
1/2
[ (1/7 + 1/5)2,3424]
1/2
= 2,4312


No hay diferencias significativas entre grupos 1 vs. 3. Las otras dos comparaciones son
significativas con este test de Scheff.

Test de Tukey
Tukey = (y
i
-y
1
)

T mse
Donde T es
T = 1/ n * q
k, n-k,1- a
= 1/

6 (3,01) = 1,2288
El valor de q (en este caso 3,01) se obtiene de tabla devalores para el test de Tukey. Al hacer estos
clculos con software estadstico, se obtiene los valores de p y debe solamente fijarse cuales son
menores de 0,05 para considerarlos significativos, o menor segn la significancia que ud. haya
establecido.
T = 1,2288 * 2,34246
T = 1,2288 * 1,5305
Del ejemplo anterior tenamos que la diferencia entre los grupos 1 vs 2 era de 4,2976 por lo tanto
obtenemos:
4,2976 1,8806
y esta expresin al no contener 0 hay diferencia significativaentre grupos 1 y 2 (p<0,05).
Cuando utilizar el test de Tukey el test de Scheff?
Utilizar Tukey:
Cuando el tamao de las muestras seleccionadas para cada grupo soniguales.
Cuando el inters fundamental es comparar promedios entre dos gruposy son mltiples las
comparaciones que estamos haciendo. Por lo tantoeste test de Tukey es el ms utilizado, y
al parecer, el ms recomendado por los estadsticos, aunque al parecer an nohay acuerdo.
Utilizar Scheff:
El tamao de los grupos seleccionados es diferente ( seaen el ejemplo anterior era mejorr
este test), y
Otras comparaciones, ms que las simples comparaciones de dos promedios son de inters.
A este tipo de comparaciones se les llama tambin contrastes.


Resultados con Systat
Effects coding used for categorical variables in model.
Categorical values encountered during processing are:
GRUPO (3 levels)
1, 2, 3
Dep Var: VALOR N: 18 Multiple R: 0.871 Squared multiple R: 0.758

Analysis of Variance
Source Sum-of-Squares df Mean-Square F-ratio P
GRUPO 109.933 2 54.966 23.465 0.000
Error 35.137 15 2.342
------------------------------------------------------------------------------
Note que la fuente de variacin entre los grupos se denomina en estos resultados con el nombre de
GRUPO, que identifica a cada categora analizada, 3 grupos en este caso lo que da 2 grados de
libertad (df, delingls degree of freedom), y tambin que la fuente de variacin dentro de los grupos
se denomina Error.

COL/
ROW GRUPO
1 1
2 2
3 3
Using least squares means.
Post Hoc test of VALOR
-------------------------------------------------------------------------------
Using model MSE of 2.342 with 15 df.
Matrix of pairwise mean differences:
1 2 3
1 0.000
2 4.298 0.000
3 -1.417 -5.714 0.000
Tukey HSD Multiple Comparisons. Test de Tukey
Matrix of pairwise comparison probabilities:
1 2 3
1 1.000
2 0.000 1.000
3 0.306 0.000 1.000
-------------------------------------------------------------------------------
Using model MSE of 2.342 with 15 df.
Matrix of pairwise mean differences:
1 2 3
1 0.000
2 4.298 0.000
3 -1.417 -5.714 0.000
Scheffe Test.
Matrix of pairwise comparison probabilities:
1 2 3
1 1.000
2 0.001 1.000
3 0.338 0.000 1.000
-------------------------------------------------------------------------------
Tanto con Scheff como con Tukey se encuentran diferencias significativas al comparar grupos 1 vs
2, y 2 vs 3; pero no existan diferencias entre los grupos 1 vs. 3. Analice porqu?
Grficos en Anova.
Cajas para los tres grupos. Interprete los resultados obtenidos y su relacin con el grfico. Ms o
menos las cajas de los grupos 1 y 3 estn a la misma altura, Por qu?

Este grfico lo entrega en forma "automtica" Systat, indicando promedio (el punto) y DE de cada
grupo, no me gusta mucho porque no debieran unirse los distintos grupos ya que no hay
continuidad entre ellos. Preferible el grfico anterior, informa ms y mejor.




Referencias bibliogrficas.

1. Kleinbaum DG, Kupper LL. Applied regression analysis and other multivariable methods.
Duxbury Press, North Scituate, MA, USA, 1978.



ANALISIS DE VARIANZA DE DOS VIAS
En los ejemplos anteriores tenamos un solo factor, pero muchas veces podemos analizar
simultneamente ms de uno, por ejemplo puede interesararnos si existe diferencias entre hombres
y mujeres (factor 1), y nivel socioeconmico (alto, medio y bajo), en el COPD, denios que hemos
seleccionado de la regin metropolitana.
Plantee un problema con dos factores:




Cmo analizar estos datos? Con un ejemplo creemos siempre quese entiende mejor la estadstica.
Ha sido realizado un estudio para demostrar el efecto de tres suplementos de mineral en la dieta de
ratas albinas, machos y hembras. Para demostrar si dicho suplemento tiene algn efecto en el peso
del rin, el rgano fue pesado al momento de sacrificar al animal (da 90 de edad). Se evala si
existe cambio de peso debido a los suplementos, y si existe diferencia por gnero.
Cul es la hiptesis nula?




Control (1) |Alimento A |Alimento B
| |
Machos Hembras |Machos Hembras | Machos Hembras
-------------------------- |-------------------------- |---------------------------
2,30 1,62 | 2,68 1,78 | 2,57 1,67
1,31 1,43 | 2,62 1,78 | 2,97 2,47
3,03 1,48 | 2,32 1,89 | 1,37 1,65
2,45 1,49 | 2,08 1,99 | 2,47 1,72
2,22 1,44 | 2,92 1,79 | 2,85 2,02
2,10 1,41 | 2,52 1,42 | 2,97 1,97
-----------------------------------------------------------------------------------
x = 13,41 8,87 15,14 10,65 15,2 11,5 (sumatoria de los grupos)
x
2
= 31,53 13,14 38,63 19,09 40,35 22,53(suma de cuadrados de cada
grupo)
x = 2,24 1,48 2,52 1,78 2,53 1,92 (promedio de cada grupo)

x
c
= 22,28 x
a
= 25,79 x
b
= 26,7 (sumatoria de valores por grupo)
x
c
2
= 44,67 x
a
2
= 57,72 x
b
2
= 62,88 (sumatoria de valores al cuadrado de cada
grupo)
x
c
= 1,856 x
a
= 2,15 x
b
= 2,225 (promedio de cada grupo, incluye
machos y hembras)
x
m
= 43,75 x
h
= 31,02 (sumatorias de valores en machos, y hembras)
x
m
2
= 110,50 x
h
2
= 54,76 (sumatorias al cuadrado de valores de machos y hembras)
x
m
= 2,43 x
h
= 1,72 (promedios en machos y hembras)
Sumatorias por filas:
x
f1
= 7,55
x
f2
= 6,9
x
f3
= 6,72
x
f4
= 7,00
x
f5
= 7,99
x
f6
= 7,59
x
f7
= 5,07
x
f8
= 5,68
x
f9
= 5,02
x
f10
= 5,2
x
f11
= 5,25
x
f12
= 4,8
n = 36, f = 6, grupos= 3, gneros = 2

1. Suma total de los cuadrados (STC):
STC = x
2
- ( x)
2
/n Factor de correccin (CF): ( x)
2
/n
STC = (44,67+57,72+62,28) - (22,28+25,79+26,7)
2
/36
STC = 164,67 -; 155,293
STC = 9,37
2. Suma de cuadrados entre los grupos de tratamiento (between):
BSS = (x
k
)
2
/n
f
- CF
BSS = ( 22,28
2
/12 +25,79
2
/12 +26,7
2
/12) - 155,293
BSS = 156,20 - 155,293
BSS
t
= 0,911
3. Suma de cuadrados entre los grupos, gnero (between)
BSS = (x
k
)
2
/n
f
- CF
BSS = ( 7,55
2
/3 +6,9
2
/3 +6,72
2
/3 +7
2
/3+7,99
2
/3+7,59
2
/3 +5,07
2
/3 +5,68
2
/3+5,02
2
/3+5,2
2
/3 +5,25
2
/3
+4,8
2
/3 ) - 155,293
BSS
g
= 4,535
4. Suma de cuadrados subtotal:
SSt = (x
g
/n
g
)
2
- CF
=( 13,41
2
/6 +15,14
2
/6 +15,27
2
/6+8,87
2
/6+10,65
2
/6 +11,5
2
/6) - 155,29
= 5,446

5. Suma de cuadrados dentro de los grupos (within)
WSS = x
2
-(x
k
)
2
/n
f

WSS = (44,67+57,72+62,88) - 161,10
WSS = 3,89

Construccin de la tabla de Anlisis de Varianza:


Fuente de
Variacin
Suma de
Cuadrados
(SS)
grados de
libertad
(gl)
Cuadrado
medio (MS)
Valor
de F
Entre
(Between),
tratamientos
0,911 2 0,455 3,273
Entre
(Between)
gneros
4,5 1 4,535 35,15
Interaccin 0,037 2 0,019 0,698
Subtotal 5,446 5 0,918

Dentro (within) 3,89 30 0,129

total 9,377 35

F
3,8
= 2,42, F
,05
= 4,07


ANALISIS DE VARIANZA DE DOS VIAS


La extraccin total de lpidos de los dientes ha sido facilitado mediante la incubacin preliminar de
la muestra en solucin de EDTA al 15% a pH 7.4 a 38C durante 18 hrs. En orden de demostrarsi
este procedimiento pudiera mejorar la extraccin de lpidos desde muestras de alimentos, se realiz
un experimento con tres muestras: A. rbalo fresco, B. rbalo apanado, C. brocolifresco. Cada
anlisis se repiti tres veces obtenindose los siguientes resultados:
Mtodo I Mtodo II
(Incubacin en EDTA) (Incubacin con H
2
O)
--------------------------------------------------------------------
A 0,635 0,642 1
0,634 0,621 2
0,574 0,445 3

B 5,576 5,591 4
5,906 6,343 5
6,059 6,224 6

C 0,812 0,894 7
0,814 0,818 8
0,806 0,922 9


x = 21,816 22,5
x
2
= 105,7903 113,5453
x = 2,424 2,5

x
a
= 3,551 x
b
= 35,699 x
c
= 5,066
x
a
2
= 2,1304 x
b
2
= 212,915 x
c
2
= 4,290

x
a
= 0,592 x
b
= 5,95 x
c
= 0,844 (Promedios de grupos a, b y c)

x
IA
= 1,843
x
IB
= 17,541
x
IC
= 2,432
x
IIA
= 1,708
x
IIB
= 18,158
x
IIC
= 2,634
n = 18, f = 9, grupos = 3, mtodos = 2


1. Suma total de los cuadrados (STC):

STC = x
2
- ( x)
2
/n Factor de correccin (CF): ( x)
2
/n
(21,816+22,5)
2
/18 = 109,106
STC = (105,79 + 113,54) &ndash; (21,816 + 22,5)
2
/36
STC = 110,230
2. Suma de cuadrados entre los mtodos de tratamiento (between):
BSS = (x
k
)
2
/n
f
- CF
BSS = ( 21,816
2
/9 + 22,5
2
/9 ) - 109,106
BSS
t
= 109,6761

3. Suma de cuadrados subtotal:
SSS = (x
g
)
2
/n
g
- CF
SSS = ( 1,843
2
/3 + 1,708
2
/3 + 17,541
2
/3+ 18,158
2
/3 + 2,432
2
/3 + 2,634
2
/3 ) - 109,106
SSS = 218,855 - 109,106
SSS = 109,74932

4. Suma de cuadrados dentro de los grupos (within)
WSS = x
2
-(x
k
)
2
/n
f

WSS = ( 105,79 + 113,5453 ) - ( 1,843
2
/3 + 1,708
2
/3+ 17,541
2
/3 + 18,158
2
/3 + 2,432
2
/3 +
2,634
2
/3)
WSS = 0,4803

Construccin de la tabla de Anlisis de Varianza:


Fuente de
Variacin
Suma de
Cuadrados
(SS)
grados de
libertad
(gl)
Cuadrado
medio (MS)
Valor
de F
Mtodos 0026 1 0,026 0,65
Alimentos 109,67,5 2 54,838 1370,95
Interaccin
Mtodos *
Alim.
0,047 2 0,02361 0,5898
Subtotal 109,74 5

Dentro
(within)
0,480 12 0,04002

F
2,12,0.05
A,B,C = 3,88 F
1,12,0.05
Mtodos I y II = 4,75

Interpretar...
Cules eran las hiptesis de nulidad ?




Se aceptan ? Se rechazan ?





Anlisis estadstico de dos vas, resultados conSystat.
SYSTAT Rectangular file C:\Archivos de programa\SYSTAT 8.0\ANOVA2V.SYD,
created Wed May 26, 1999 at 11:22:38, contains variables:
Categorical values encountered during processing are:
GRUPO$ (3 levels)
A, B, C
METODO$ (2 levels)
I, II
Dep Var: LIPIDOS N: 18 Multiple R: 0.998 Squared multiple R: 0.996

Analysis of Variance
Source Sum-of-Squares df Mean-Square F-ratio P
GRUPO$ 109.644 2 54.822 1372.854 0.000
METODO$ 0.027 1 0.027 0.670 0.429
GRUPO$*METODO$ 0.047 2 0.024 0.591 0.569
Error 0.479 12 0.040

Anda mungkin juga menyukai