Anda di halaman 1dari 36

ANLISIS DE LA VARIANZA (ANOVA)

Notas
ndice
1. OBJETIVOS.....................................................................................................................1
2. INTRODUCCIN.............................................................................................................2
2.1. Modelo de constantes fijas (Modelo I)........................................................................................................ 2
2.2. Modelo de componentes de la varianza (Modelo II) .................................................................................. 2
3. NOMENCLATURA...........................................................................................................3
4. SUPOSICIONES .............................................................................................................3
5. LGICA DEL ANOVA......................................................................................................3
6. MODELOS DE EFECTOS FIJOS Y EFECTOS ALEATORIOS.......................................5
6.1. ANOVA de un factor con efectos fijos ........................................................................................................ 6
6.2. ANOVA de un factor con efectos aleatorios............................................................................................... 7
6.3. Solucin del ANOVA de un factor ............................................................................................................ 11
6.4. Resumen del ANOVA de un factor........................................................................................................... 13
6.5. Diferente tamao muestral: diseos no equilibrados ............................................................................... 15
6.6. Conclusiones estadsticas del ANOVA de un factor ................................................................................ 16
7. CONTRASTES ORTOGONALES PARA DISEOS EQUILIBRADOS..........................17
7.1. Contrastes en diseos aleatorios ............................................................................................................. 18
8. ANOVA DE DOS FACTORES: DISEO COMPLETAMENTE ALEATORIZADO..........19
8.1. Resolucin del ANOVA de dos factores................................................................................................... 22
9. EJEMPLO 1...................................................................................................................27
9.1. Planteamiento........................................................................................................................................... 27
9.2. Diseo....................................................................................................................................................... 27
9.3. Procedimiento........................................................................................................................................... 27
9.4. Anlisis exploratorio (descriptivo)............................................................................................................. 28
9.5. Inferencia estadstica: ANOVA................................................................................................................. 29
9.6. Conclusin................................................................................................................................................ 33
10. EJEMPLO 2.................................................................................................................33
1. Objetivos
Comprender los principios y suposiciones subyacentes al anlisis de la varianza (ANOVA);
Conocer los procedimientos de clculo de las suma de cuadrados, de los cuadrados medios o varianzas
y del estadstico F ;
Conocer los posibles contrastes de hiptesis;
Saber distinguir un diseo equilibrado de un diseo no equilibrado;
Saber distinguir un modelo de efectos fijos de un modelo aleatorio y de un modelo mixto;
Conocer el principio y procedimiento de clculo del estadstico F en cada uno de estos modelos.
2
2. Introduccin
El anlisis de la varianza (ANOVA) es uno de los tests estadsticos ms ampliamente utilizados para probar
la igualdad de ms de dos medias de la poblacin. Es decir:
Hiptesis:
0 1 2
1
:
:
k
H
H por lo menos hay una media diferente al resto
u =u = =u =u

Cuando se trata de comparar varias medias cabe la posibilidad de realizar comparaciones dos a dos
utilizando, por ejemplo el test t. Este procedimiento no es correcto. Si, como es habitual, se utiliza un valor
crtico del 5 % para comprobar la hiptesis de ausencia de diferencias entre las medias de las poblaciones,
el nivel de significacin real ser mucho mayor. Aunque todas las muestras procedieran de la misma
poblacin, una media del 5 % de los valores t superarn el valor crtico. Puede demostrarse que en 10
comparaciones independientes uno o ms valores de t superar el valor crtico t
0,95
en un 40 % de
ocasiones. Es decir, es relativamente fcil rechazar la hiptesis nula por un valor espreo de t a causa de la
reiteracin de comparaciones. Una segunda razn es la prdida de precisin al estimar la varianza comn
cada dos grupos. Claro est que este problema se soluciona utilizando la varianza global, pero sigue en pie
el problema de la significacin.
2.1. Modelo de constantes fijas (Modelo I)
2.1.1. Clasificacin simple
Corresponde al caso de que un investigador desea comprobar la hiptesis nula de igualdad de las medios
de k poblaciones
{ }
1 2
, , ,
k
u u u Cada observacin o individuo se ha clasificado en una de las k
posibles categoras, grupos o poblaciones, todas ellas sometidas a anlisis. Por ejemplo:
Un laboratorio dispone de cuatro mtodos para determinar paratirina en plasma. Se desea comparar la
media de los resultados de una poblacin de referencia a la que se ha realizado las cuatro
determinaciones.
En un centro urbano existen tres laboratorios hospitalarios que realizan determinaciones de colesterol.
Se desea saber si la media anual de determinaciones diarias es la misma en los tres centros.
Se desea comparar la media de determinaciones de hematimetria solicitadas el pasado mes de enero
por los siete diferentes servicios quirrgicos de un hospital de tercer nivel.
2.1.2. Clasificacin mltiple
Cada observacin o individuo se ha clasificado en una de las k r s posibles categoras, grupos o
poblaciones (y nicamente en una de ellas), todas ellas sometidas a anlisis. Por ejemplo:
Un laboratorio dispone de cuatro mtodos para determinar paratirina en plasma y tres instrumentos
analticos donde implementarlos. Se desea comparar la media de los resultados de una poblacin de
referencia a la que se ha realizado las cuatro determinaciones en los tres instrumentos diferentes.
En un centro urbano existen tres laboratorios hospitalarios que realizan determinaciones de colesterol.
Se desea saber si la media anual de determinaciones diarias ha sido la misma en los tres centros
durante los ltimos cinco aos.
Se desea comparar la media de determinaciones de hematimetria solicitadas el pasado mes de enero
por los turnos de maana, tarde y noche de siete diferentes servicios quirrgicos de un hospital de
tercer nivel.
2.2. Modelo de componentes de la varianza (Modelo II)
El modelo de componentes de la varianza corresponde al caso de que un investigador desea comprobar la
hiptesis nula de igualdad de las medios de k poblaciones
{ }
1 2
, , ,
k
u u u cuando k puede ser
tericamente infinito, pero que en cualquier caso slo incluye en el estudio una muestra de las posibles
categoras, aunque esta seleccin sea aleatoria y representativa. Por supuesto, las observaciones
individuales pertenecen exclusivamente a una y solo una de las k posibles categoras, grupos o
poblaciones, todas ellas sometidas a anlisis. Aunque los procedimientos de clculo son idnticos, la
3
interpretacin conceptual es radicalmente diferente. En este caso se trata de generalizar las conclusiones a
todas las posibles categoras sin restringirse exclusivamente a las incluidas en el estudio, como sucede en
el modelo I. Por ejemplo:
Un laboratorio desea demostrar que la determinacin de un constituyente bioqumico se afecta por la
temperatura de conservacin. Prepara una serie de alcuotas de especmenes biolgicos a los que
pretende someter un perodo de tiempo variable a diferentes temperaturas. Obviamente, no puede
disponer de todas las temperaturas posibles ni de todos los perodos temporales posibles. Por tanto
elige como representativos de forma aleatoria cinco temperaturas y cinco perodos de tiempo. El
diseo corresponde a un experimento de dos factores analizable mediante un modelo II de ANOVA
cuyas hiptesis nulas seran ni la temperatura, ni el tiempo ni la combinacin de ambos influyen en la
conservacin del constituyente. Si se analizara desde la ptica del modelo I de ANOVA, la conclusin
sera la concentracin de constituyente no se afecta a 7 C, 17 C, 25 C, 30 C, ni a 32 C etc.
3. Nomenclatura
i j
x es la i-sima observacin en el j-simo tratamiento;
k es el nmero de tratamientos, grupos o poblaciones estudiadas 2, , 3, k = ;
j
n es el nmero de individuos en la jsima muestra. Si todas las k muestras tuvieran el mismo
contingente, se simplificar a n ;
1
k
j
j
N n
=
=

es el nmero total de observaciones o individuos:


1 2
1
k
j k
j
N n n n n
=
= = + + +


j
x
i
es la suma de todas las observaciones en el j-simo tratamiento;
i
x
i
es la suma de todas las observaciones del i-simo individuo;
j
x
i
es la media del j-simo tratamiento;
x
i i
es la media global de todas las observaciones;
j
S
i
SCi es la suma de los cuadrados de la diferencia entre las observaciones y la media;
2
b
s CMB es la estimacin de la varianza entre grupos (b de between); CM indica cuadrados
medios o media de los cuadrados;
2
w
s CMW es la estimacin de la varianza dentro de los grupos (w de within).
4. Suposiciones
1. Las k poblaciones son independientes;
2. El muestreo de cada una de las ( ) 2 k > poblaciones bajo estudio se hizo aleatoriamente;
3. Se trata de poblaciones normales o muestras grandes
( )
30 1, 2, ,
j
n j k = ;
4. Las variaciones poblacionales son iguales
2 2 2 2
1 2 k
= = = = .
5. Lgica del ANOVA
Cuando se desea contrastar la equivalencia de varios tratamientos o grupos, se efectan observaciones en
muestras de poblaciones (grupos) caracterizadas por haber experimentado un tratamiento o proceder de un
grupo especfico. Las propiedades estadsticas de estas observaciones (localizacin, dispersin, forma)
son analizadas para extraer conclusiones acerca de la significacin del efecto. El contraste de las medias de
los subgrupos se realiza con el ANOVA.
4
Al final de estas notas se ejemplifica una aplicacin sencilla del ANOVA. Un escenario tpico del
laboratorio clnico es el expuesto en dicho ejemplo: un investigador desea conocer el efecto que tienen
varios tratamientos con frmacos sobre una magnitud bioqumica. Para ellos selecciona grupos de
individuos sometidos a estos tratamientos y realiza en cada uno de ellos una medicin de dicha magnitud
bioqumica. Si los tratamientos no afectan a la concentracin de la magnitud es de esperar que las medias
aritmticas de todos los grupos de individuos tratados sean iguales. Si un frmaco influye significativamente
sobre dicha magnitud, el test estadstico detectar esta diferencia como significativa. Es la misma situacin
que cuando se desea comparar diferentes grupos de diagnsticos, poblaciones, instrumentos o
procedimientos analticos, etc. Adems de la variable aleatoria concentracin del constituyente
(habitualmente continua), se asocia una variable clasificadora (habitualmente discreta y que no contiene
error). Esta variable clasificadora se denomina genricamente factor o tratamiento y los diferentes
valores que puede adoptar se denominan niveles o tratamientos. Los modelos ms sencillos contienen
un nico factor de clasificacin (modelos unifactoriales, o de una va one way). Sin embargo no son
excepcionales los modelos que contienen dos (bifactoriales o de dos factores) o ms factores (modelos
multifactoriales). La presencia de ms factores complica obviamente los clculos. En estas notas slo se
estudiarn los modelos con uno y dos factores.
La distribucin de una poblacin de datos se caracteriza completamente con unos parmetros estadsticos
que sintetizan toda la informacin que contiene dicha poblacin. En el caso de una distribucin normal,
media y varianza (o media y desviacin tpica) bastan para caracterizarla por completo. La inferencia
realizada con estos parmetros se denomina paramtrica en oposicin a la que se puede realizar sin
utilizarlos, la inferencia no paramtrica. Por lo general, cuando la distribucin subyacente es normal, la
inferencia paramtrica es ms potente y por tanto ms recomendable que la no paramtrica. sta debe
reservarse para cuando no se puede satisfacer los requisitos de los tests paramtricos.
Media y varianza son pues los dos parmetros que definen una distribucin normal. La varianza es el
parmetro de dispersin o escala de una poblacin que se estima en una muestra a partir de las conocidas
frmulas:
( )
( )
( )
2
2
2
1
2 2
1
2
2 2
1
1
1
1
1 1
N
i
i
N
i
i
n
i
i
x
y
N
y
N
n
s x x x
n n
=
=
=
= u
= u
| |
= u
|
\ .
=

E

donde:
i
y son las observaciones en la poblacin;
i
x son las observaciones en una muestra;
2
es la varianza poblacional;
s es la estimacin de la varianza en una muestra;
N es el nmero de observaciones;
n es el nmero de observaciones en una muestra;
u es la media poblacional; y
x es la media observada en la muestra.
(a) Si la variabilidad es aproximadamente la misma en cada grupo, su media ser un valor razonablemente
representativo de la variabilidad global. Por lo tanto, disponiendo de las k varianzas y calculando su
media se estima la varianza de la poblacin. Esta estimacin se denomina dentro de los grupos.
2 2
1
1
k
w j
j
s s
k
=
=

(b) Otro procedimiento de estimar la variabilidad global es calculando el error estndar de la las k medias
de cada uno de los k grupos que el investigador considera. Si las medias se calculan como:
5
1
1
k
n
k k i
i
k
x x
n
=
=

donde:
j i
x es la i-sima observacin del grupo j ;
j
n es el nmero de observaciones efectuadas en el grupo j ;
j
x es la media de las observaciones efectuadas en el grupo j .
El error estndar de la media, ( ) es x , es el parmetro que se utiliza para definir la calidad de la
estimacin ya que relaciona el nmero de casos con la variabilidad. Se define como la desviacin tpica
de las medias de los k diferentes grupos, y se calcula como:
( )
s
es x
n
=
de donde se deduce:
( ) ( )
2
2
b
s n es x =
A esta estimacin de la varianza global se denomina entre grupos
Parece razonable pensar que si los grupos han sido extrados de la misma poblacin, o que si el tratamiento
aplicado a cada uno de ellos no produce efectos significativamente diferentes, ambos procedimientos de
estimacin proporcionarn estimaciones de la varianza muy parecidas:
2 2
2
2
1
w b
b
w
s s
s
s

Si por el contrario, algn grupo estudiado procede de otra poblacin o algn tratamiento aplicado produce
una respuesta distinta de las otras, estas estimaciones diferirn entre ellas y
2 2
2
2
1
w b
b
w
s s
s
s

El test ANOVA se fundamenta en el clculo de este cociente, denominado estadstico F y su contraste con
el valor tabulado. La distribucin de F depende de los grados de libertad del numerador y del denominador
del cociente. Esencialmente, los grados de libertad son una forma de relacionar el nmero de observaciones
o grupos los datos con las entradas en las tablas estadsticas.
6. Modelos de efectos fijos y efectos aleatorios
El investigador puede utilizar todos los elementos posibles de la variable clasificadora (cuando sea,
lgicamente, un conjunto finito: por ejemplo, gnero que contiene slo dos elementos masculino o
femenino) o una parte de estos de criterios (por ejemplo, edad y limitarse a pacientes de menos de 20
aos, pacientes entre 20 y 50 aos y pacientes de ms de 50 aos, aunque es obvio que puede haber
ms grupos refinando el criterio edad). Como consecuencia existen dos modelos de ANOVA: el modelo fijo
y el modelos aleatorio.
En los modelos de efectos fijos los grupos de tratamiento bajo estudio (por ejemplo tres medicaciones
capaces de producir hepatotoxicidad) representan todos los tratamientos en que el investigador est
interesado. En las conclusiones puede llegarse a la evidencia de que existen (o no) diferencias significativas
entre la hepatotoxicidad marcada por una magnitud bioqumica, a causa del efecto producido por los
diferentes tratamientos estudiados.
En los modelos de efectos aleatorios, se seleccionan al azar los tratamientos para investigar entre un
conjunto de tratamientos mucho ms amplio. Supngase que se dispone de cientos de posibles
tratamientos farmacolgicos capaces de inducir hepatotoxicidad. Por las razones que sean, el investigador
6
se limita a seleccionar aleatoriamente tres de ellos. La conclusin a la que pretende llegar el investigador es
poder afirmar que existen (o no) pruebas significativas de diferencias entre las medias entre los efectos
inducidos por los tratamientos farmacolgicos en general sobre el hgado aunque de hecho slo se haya
estudiado un subconjunto. Bsicamente se trata de generalizar los resultados al conjunto de tratamientos ya
que para ello se ha seleccionado aleatoriamente un subconjunto para la investigacin.
En el modelo de efectos fijos las conclusiones aplican al tratamiento estudiado. Para los efectos aleatorios,
se requiere otra lgica, como se ver mas adelante.
6.1. ANOVA de un factor con efectos fijos
6.1.1. Suma de cuadrados
Para toda observacin
i j
x se pueden determinar las siguientes diferencias:
(a) diferencia de esta observacin a la media global:
i j i j
x x x =
(b) diferencia de esta observacin a la media de su grupo
i j i j j
x x x =
Restando ambas:
( ) ( )
i j i j i j i j j
j
j
x x x x x x
x x
d
=
=
=
y
j i j i j
i j j i j
d x x
x d x
=
= +
elevando al cuadrado
( ) ( )
( )
2 2
2
2
2
i j j i j
j i j j i j
x d x
d x d x
= +
= + +
y generalizando
( ) ( )
2 2
2
1 1 1
2
k k k
i j j i j j i j
j j j
x nd x d x
= = =
= + +

Como que
1
0
k
i j
j
x
=
=

se tiene:
( ) ( )
2 2
2
1 1
k k
i j j i j
j j
x nd x
= =
= +

y generalizando
( ) ( )
( ) ( ) ( )
2 2
2
1 1 1 1 1
2 2 2
1 1 1 1 1
k n k k n
i j j i j
j i j j i
k n k k n
i j j i j j
j i j j i
x n d x
x x n x x x x
SCT SCB SCW
= = = = =
= = = = =
= +
= +
= +


7
donde:
( )
2
1 1
k n
i j
j i
x
= =

( )
2
1 1
k n
i j
j i
x x
= =

SCT expresa la variacin total de los sujetos que


intervienen en torno a la media;
2
1
k
j
j
n d
=

( )
2
1
k
j
j
n x x
=

SCB expresa la variacin grupo a grupo, es decir de las


medias de cada grupo con relacin a la media
global.
( )
2
1 1
k n
i j
j i
x
= =

o
( )
2
1 1
k n
i j j
j i
x x
= =

SCW expresa la variacin intragrupo, en torno a la media


del grupo;
6.1.2. Grados de libertad
suma de
cuadrados
grados de
libertad
SCT
( ) 1 N
la nica condicin fija que han de respetar las N observaciones es el valor
de la media total. Sus grados de libertad, ( ) 1 N , pueden traducirse por el
clculo de la media total implica la prdida de un grado de libertad con
relacin al conjunto de las N puntuaciones
SCB
( ) 1 k
ya que existen tantas medias de grupos como grupos, el conjunto de k
puntuaciones nicamente tendr como condicin fija el valor de la media total
SCW
( ) N k
en el clculo de la media de cada grupo se pierde un grado de libertad. Por
tanto se perdern tantos grados de libertad como grupos
Entre los grados de libertad se establece la misma relacin que para la suma de cuadrados:
( ) ( ) ( )
. . . . . .
1 1
T B W
g l g l g l
N k N k
= +
= +
6.1.3. Cuadrados medios o varianzas
Dividiendo las sumas de cuadrados por sus respectivos grados de libertad, se obtienen las varianzas.
La estimacin de la varianza total del modelo se har mediante:
(a) La varianza intergrupo,
2
B
, cuadrado medio intergrupo o cuadrado medio de los tratamientos es:
2
. . 1
B
B
SCB SCB
g l k
= =

(b) La varianza intragrupo,


2
W
, cuadrado medio intragrupo, cuadrado medio del error experimental es:
2
. .
W
W
SCW SCW
g l N k
= =

6.2. ANOVA de un factor con efectos aleatorios


Diseo completamente aleatorizado es aquel en que los tratamientos son asignados al azar a las unidades
experimentales o viceversa. En el modelo unifactorial la variable analizada (dependiente) se hace depender
de un solo factor (variable independiente). El resto de causas de variacin se engloban en el componente
aleatorio del error experimental.
Una variable sobre la que acta un factor que se presenta bajo un nmero de k niveles o tratamientos y
con n unidades experimentales por grupo.
8
Suposiciones bsicas (similares a la regresin)
Aditividad;
Linealidad;
Normalidad;
Independencia;
Homogeneidad de varianzas.
La variable dependiente
i j
x puede ser representada por el modelo estadstico lineal:
i j j i j
x = u + +
donde:
i j
x es el valor de la variable dependiente X del sujeto i para el tratamiento j ;
1, 2, ,
1, 2, ,
i n
j k
=
=

u es el efecto medio verdadero;


j
es el efecto verdadero del j-simo tratamiento o nivel del factor A (la variable independiente
incluida en el modelo);
i j
efecto verdadero de la i-sima unidad del j-simo tratamiento (incluir los efectos de
variables extraas). Es una variable aleatoria
( )
2
0, N .
6.2.1. Suposiciones bsicas del modelo general
(a)
i j
se distribuye idnticamente y normal:
( )
2
0,
i j
DNI . Esto implica mutuamente (y viceversa)
que
( )
2
,
i j i
x DNI u
(b)
j
:en el caso que el investigador est interesado en los k tratamientos o niveles del factor presentes
en el experimento se tendr
1
0
k
j
j =
=

y el modelo se denominar modelo de efectos fijos o


modelo I. Si por el contrario, el investigador est interesado en una poblacin de niveles del factor e
los que nicamente est presente en el experimento una muestra aleatoria, entonces
( )
2
0,
j
DNI

y se denomina modelo de efectos aleatorios, modelo de componentes de la
varianza o modelo II;
(c) u: el efecto total y verdadero producido por el nivel o tratamiento j es:
j j
u = u +
donde
j
u es la media poblacional de todas las observaciones de cada uno de los grupos
si
i j j i j
i j j i j
x
x
= u + +
= u +
por tanto:
i j i j j
x = u
y de
j j
= u u
se obtiene:
9
( ) ( )
( ) ( ) ( )
i j j i j
i j j i j j
i j j i j j
x
x x
x x
= u + +
= u + u u + u
u = u u + u
que se estima:
( ) ( ) ( )
i j j i j j
x x x x x x = +
j j
x x x =
i j i j i
x x =
( )
1 1
1 1
n n
j i j i i j i i j
j j
x x x
n n
= =
= = u+ + = u+ +

1 1
1 1
N n k k
i j i i i i
j j
N n
x x x
N N N N
= =
u
= = u+ + = + +

( )

j j j
a x x = =
La mejor estimacin de
( ) ( ) ( )
i j j i j j
x x u = u u + u
se obtendr substituyendo las medias por la estimacin muestral:
( ) ( ) ( )
i j j i j j
x x x x x x = +
Y las estimaciones de
j
y
i j
son:

j j
x x =
1

ij i j j
x x =
( )
1 1 1
1 1

N k n k
i j j i j j
j i j
n
x x
N N N
= = =
= = u+ + = u+ +

( ) ( )
1

k
j j j ij j i
j
n
x x
N
=
| |
= = u+ + u+ +
|
\ .

( ) ( )
1

k
j j i
j
n
N
=
= u+ +

E E
donde:
( )
0
i
= E ,ya que
( )
1

k
j j
j
n
N
=
= u+

E y por tanto, para que


( )

j j
= E es preciso
que:

1
Para que la estimacin sea insesgada debe cumplir: ( )
1 1
1 1
n n
j i j j i j
j j
x x
n n
= =
= = = u + +

10
1
1
0
0
k
j
j
k
j
j
n
N
=
=
=
=

Por lo tanto se requiere que


1
0
k
j
j =
=

para estimar insesgadamente el parmetro


j
como
j

(condicin para el modelo de efectos fijos).


Generalizando (y sumando) los cuadrados de
( ) ( ) ( )
i j j i j j
x x x x x x = +
( ) ( ) ( )
2 2 2
1 1 1 1 1
k n k k n
i j j i j j
j i j j i
x x n x x x x
SCT SCB SCW
total tratamientos error experimental
= = = = =
= +
= +
= +

Teorema fundamental del ANOVA
Este teorema permite dividir la variacin total asociada a un conjunto de datos en dos componentes de
variabilidad:
(a) la asociada a los efectos de los tratamientos; y
(b) la asociada a otras fuentes de variacin (error experimental)
Se demuestra que son independientes los trminos de la suma:
( ) ( )
2 2
,
1 1 1
k k n
j i j j
j j i
n x x x x
= = =
+

y que divididos por
2
siguen una distribucin
2
1, k n k
. El cociente de dos
2
independientes, divididas
por sus respectivos grados de libertad, se distribuye como:
1 2
,
F

donde:
1
es el nmero de grados de libertad del numerador; y
2
es el nmero de grados de libertad del denominador.
2
1 2
2
2
k
N k
SCB
SCW

luego:
( )
( )
2
1,
2
1
1
,
k N k
SCB
cuadrado medio intergrupos de tratamientos
grados de libertad k
k
F
SCW cuadrado medio intragrupo o error experimental
grados de libertad N k
N k

F permite contrastar la
0
H que puede ser:
11
0 1 2
0 1
:
: 0
k
H x x x
H
= = =
=

es decir, no hay diferencias en trminos estadsticos entre las medias de distintos grupos, tratamientos o
niveles.
6.3. Solucin del ANOVA de un factor
6.3.1. Tabulacin
Recapitulando, la tabla original de datos aparecer como:
datos 1 2 k
11
x
2 1
x

1 k
x
1 2
x
2 2
x

2 k
x

1 n
x
2 n
x

k n
x
totales de grupo
1
1
n
i
i
x
=
2
1
n
i
i
x
=


1
n
k i
i
x
=

medias de grupo
1
x
2
x

k
x
6.3.2. Clculos
Recordando que
( ) ( )
( ) ( ) ( )
2 2
2
1 1 1 1 1
2 2 2
1 1 1 1 1
k n k k n
i j j i j
j i j j i
k n k k n
i j j i j j
j i j j i
x n d x
x x n x x x x
SCT SCB SCW
= = = = =
= = = = =
= +
= +
= +


se proceder ahora a calcular SCT , SCB , y SCW
(a) Suma de cuadrados totales SCT
Se vio como la SCT era:
( )
2
1 1
k n
i j
j i
SCT x x
= =
=

desarrollando el segundo trmino:


12
( ) ( )
2
2 2
1 1 1 1
2 2
1 1 1 1
2
1 1 1 1 2
1 1 1 1
2
1 1
2
1 1
2
2
2
2
k n k n
i j i j i j
j i j i
k n k n
i j i j
j i j i
k n k n
i j i j
k n k n
j i j i
i j i j
j i j i
k n
i j
k n
j i
i j
j i
x x x x x x
x N x x x
x x
x N x
N N
x x
x
N
= = = =
= = = =
= = = =
= = = =
= =
= =
= +
= +
| | | |
| |
| |
= +
| |
| |
\ . \ .
| |
|
\ .
= +



2
1 1
2
1 1
2
1 1
k n
i j
j i
k n
i j
k n
j i
i j
j i
N
x
x
N
= =
= =
= =
| |
|
\ .
| |
|
\ .
=

(b) Suma de cuadrados totales SCB


Se vio como la SCB era:
( )
2
1
k
j
j
SCB n x x
=
=

desarrollando el segundo trmino:


( ) ( )
2
2 2
1 1
2 2
1 1
2 2
1 1 1 1 1 1
1 1
2
1 1
1
2
2
2
k k
j j j
j j
k k
j j
j j
n k n k n n
i j i j i j i j
k k
i j i j i i
j j
j
n n
i j i j
k
i i
j
n x x n x x x x
n x k n x x n x
x x x x
n k n n
n N N n
x x
n
= =
= =
= = = = = =
= =
= =
=
= +
= +
| | | | | | | |
| | | |
| | | |
= +
| | | |
| | | |
\ . \ . \ . \ .
| |
|
\ .
= +



2
1 1 1 1 1
2 2
1 1 1
1
2
k k n k n
i j i j
j j i j i
n k n
i j i j
k
i j i
j
x x
N N
x x
n N
= = = = =
= = =
=
| | | | | |
| | |
\ . \ . \ .

| | | |
| |
\ . \ .
=

ya que:
1
1 1 1
n
i j
k k n
i
i j
j j i
x
n x
n
=
= = =
| |
|
|
=
|
|
\ .


y k n N =
13
(c) Suma de cuadrados totales SCW
Se vio como la SCW era:
SCT SCB SCW = +
(d) Determinacin de grados de libertad
Total: 1 N
Tratamientos: 1 k
Error experimental: N k
(e) Clculo de los cuadrados medios de los tratamientos ( ) CMB y del error experimental ( ) CMW
1
suma de cuadrados de los tratamientos SCB
CMB
grados de libertad de los tratamientos k
suma de cuadrados del error experimental SCW
CMW
grados de libertad del error experimental N k
= =

= =

(f) Clculo de F
CMB
F
CMW
=
que se interpretar frente a
1 , k N k
F

6.3.3. Tabla de ANOVA
Todos estos clculos se agrupan habitualmente en forma de tabla (de ANOVA) que tiene la siguiente forma:
fuente de
variacin
suma de
cuadrados
grados de
libertad
cuadrados
medios
F
intergrupo o
intertratamiento
SCB 1 k CMB
CMB
F
CMW
=
intragrupo o error
experimental
SCW
N k
CMW
total SCT 1 N
6.3.4. interpretacin del estadstico F
La interpretacin del estadstico F calculado se comparar con el tabulado con ( ) 1 k y ( ) N k grados
de libertad al nivel de significacin elegido. Si el valor F obtenido es menor que el tabulado se acepta la
0
H de que no existen diferencias en la media de los grupos o tratamientos (al menos en alguna de ellas).
6.4. Resumen del ANOVA de un factor
6.1.1. Modelo de efectos fijos
Cuando el investigador se interesa solamente por los niveles presentes en el experimento.
Restricin:
1
k
j
j =

0
H : toda variacin es debida al error experimental. Si se cumple, la media de los cuadrados (la varianza)
que depende de la fuente de variacin, los tratamientos, ser igual al error experimental y F=1. En caso
contrario los tratamientos aadirn variabilidad al error experimental.
Los cuadrados medios sern:
14
(a) Media de cuadrados totales. No intervendr en los clculos de F, pero por coherencia se la menciona:
( )
2
2 2
,
1 1 1
1 1
1 1
n k k
i j j
i j j
x x n
N N
= = =
| |
= +
|

\ .

(b) Media de cuadrados esperada de los tratamientos, numerador en el clculo de F :


( )
2
2 2
1 1
1 1
1 1
k k
j j j
j j
n x x n
k n
= =
| |
= +
|

\ .

(c) Media de cuadrados esperada del error experimental, denominador en el clculo de F :


( )
2
2
,
1 1
1
n k
i j j
i j
x x
N k
= =
| |
=
|

\ .

6.4.2. Modelo de efectos aleatorios


Cuando el investigador se interesa solamente por una poblacin de niveles (tericamente infinita) de la que
slo una muestra aleatoria est presente en el experimento. Es decir:
( )
2
0, N


0
H : toda variacin es debida al error experimental. Si se cumple, la media de los cuadrados (la varianza)
que depende de la fuente de variacin, los tratamientos, ser igual al error experimental y 1 F = , porque el
CMB ser igual al CMW . En caso contrario, los tratamientos aadirn variabilidad al error experimental y
1 F > .
Los cuadrados medios sern:
(a) Media de cuadrados esperada de los tratamientos, CMB , numerador en el clculo de F :
( )
2
2 2
1
1
1
k
j j j
j
n x x n
k
=
| |
= +
|

\ .

Bajo la
0
H el CMB est formado por dos componentes: el error experimental y el error debido al
tratamiento, es decir al factor en estudio. En el trmino de la derecha, el primer sumando
corresponde al efecto de los tratamientos y el segundo al experimental.
(b) Media de cuadrados esperada del error experimental, CMW , denominador en el clculo de F :
( )
2
2
,
1 1
1
n k
i j j
i j
x x
N k
= =
| |
=
|

\ .

Por tanto hay dos componentes: el error experimental y el error debido al tratamiento, es decir al factor
en estudio.
CM bajo
modelo fuente de variacin H
0
H
1
(en todos) intragrupos (experimental)
2

efectos fijos tratamiento


2

2 2
1
1
1
k
j
j
n
k
=
+


efectos
aleatorios
tratamiento
2

2 2
n

+
15
6.5. Diferente tamao muestral: diseos no equilibrados
Hasta ahora se han considerado diseos en que cada tratamiento consta de un mismo nmero de
observaciones experimentales. Esto es deseable porque simplifica los clculos pero no siempre es posible.
El modelo general ser:
, , i j j i j
x = u + +
donde: 1, 2, , j k = son los tratamientos;
1, 2, ,
k
i n = son los casos en cada grupo o tratamiento; y
1 2
1
k
k j
j
N n n n n
=
= + + + =

es el nmero total de observaciones.
Las tablas sern similares:
CM bajo
fuente de
variacin
suma de cuadrados
g. de
l.
CM
H
0
H
1
F
entre grupos
2 2
1 1 1
1
j j
n n
k
i j i j
k
i j i
j i
x x
SCB
n N
= = =
=
| | | |
| |
| |
\ . \ .
=

1 k
1
SCB
CMB
k
=

2
1 2
1
k
j
j
k
=

+

CMB
F
CMW
=
dentro de los
grupos o
error
experimental
SCW SCT SCB =
N k
1
SCW
CMW
k
=

total
2
1 1
2
1 1
j
j
n
k
i j
n
k
j i
i j
j i
x
SCT x
N
= =
= =
| |
|
|
\ .
=

1 N
Tabla de ANOVA para el modelo de efectos fijos en diseo no equilibrado
CM bajo la
fuente de
variacin
suma de cuadrados
g. de
l.
CM
H
0
H
1
F
entre grupos
2 2
1 1 1
1
j j
n n
k
i j i j
k
i j i
j i
x x
SCB
n N
= = =
=
| | | |
| |
| |
\ . \ .
=

1 k
1
CMB
CMB
k
=

2 2
0
n

+
2
CMB
F
CMW
=
dentro de los
grupos o
error
experimental
SCW SCT SCB = N k
1
SCW
CMW
k
=

total
2
1 1
2
1 1
j
j
n
k
i j
n
k
j i
i j
j i
x
SCT x
N
= =
= =
| |
|
|
\ .
=

1 N
Tabla de ANOVA para el modelo de efectos aleatorios en diseo no equilibrado

2
donde:
( )
2 2 2
1 1
0
1
1
1
1 1
k k
j j
k
j j
j k
j
j
j
n N n
n n
k N k
n
= =
=
=
| |

|
|
= =
|
|
\ .

( ) ( )
2
2 2
1
1
k
j
j
SCE SCW N k
N n

=

=

16
Es decir, la nica diferencia est en que bajo la
1
H , la media de cuadrados es diferente.
6.6. Conclusiones estadsticas del ANOVA de un factor
Se pueden extraer tres tipos de conclusiones:
(a) hiptesis acerca del efecto de los tratamientos;
(b) estimaciones de los componentes de la varianza;
(c) estimacin de los efectos medios de los tratamientos (intervalos de confianza para las medias de los
tratamientos.
6.6.1. Hiptesis acerca del efecto de los tratamientos
La
0
H : no hay diferencias entre los efectos de los k tratamientos.
En el modelo de efectos fijos:
1
0
media de cuadrados de los tratamientos
F
media de cuadrados del error experimental
= =
frente a ( )
1, t N t
F

.
Si ( )
1, t N t
F F

< no se rechaza la
0
H ; si ( )
1, t N t
F F

> se rechaza la
0
H y se puede afirmar que
hay diferencias entre algunas medias.
Para investigar qu medias son diferentes se procede al estudio de comparaciones de contrastes entre
medias posteriores al ANOVA. Entre los tests ms populares estn:
(a) test del recorrido mltiple de Duncan para diseos equilibrados;
(b) test de la diferencia honestamente significativa de Tukey (HSD) o diferencia mnima significativa,
basado en la distribucin t ;
(c) test de Scheff que permite contrastar diferencias entre medias y entre combinaciones lineales, incluso
en diseos no equilibrados;
(d) test de comparaciones mltiples de Tukey, como el anterior permite contrastar diferencias entre medias
y entre combinaciones lineales, pero requiere que el diseo sea equilibrado.
1. Contrastes directos de medias
2. Contrastes de combinaciones lineares de medias
Las combinaciones lineares son sumas ponderadas cuyos pesos, ponderaciones o coeficientes no son
iguales. De forma genrica:
1 1 2 2 m k k
C w x w x w x = + + +
donde:
m
C es el valor de una determinada comparacin entre medias;
1 2
, , ,
k
w w w son las k ponderaciones para una determinacin dada, con el requisito de que
1
0
k
j
j
w
=
=

;
1 2
, , ,
k
x x x son las k medias de cada grupo.
Por ejemplo, en un experimento con tres grupos o tratamientos ( ) , , A B C donde el ANOVA ha demostrado
que existen medias significativamente diferentes, se desea investigar las posibles (combinaciones) de
diferencias entre los mencionados tres grupos o tratamientos:
17
1
w
2
w
3
w
m
C
1 A vs B 1 1 0 ( )
1 1 2 3
1 1 0 C x x x = + +
2 A vs C 1 0 1 ( )
2 1 2 3
1 0 1 C x x x = + +
3 B vs C 0 1 1 ( )
3 1 2 3
0 1 1 C x x x = + +
4 A vs B vs C 1 ( )
4 1 2 3
1 1
1
2 2
C x x x = + +
La interpretacin estadstica de la inferencia sobre diferencias entre medias viene dada por un test t :
( )
1 2
1
1
d
m
d
t x x
s
C
s
=
=
donde:
2 2 2
1 2
1 2
k
d
k
w w w
s CMW
n n n
| |
= + + +
|
|
\ .
que cuando se trata de un diseo equilibrado equivale a
2
1
k
j
j
d
w
s CMW
n
=
=

y se compara con una ( )
. . g del dew
t .
7. Contrastes ortogonales para diseos equilibrados
Ortogonal significa aqu independiente y representa que la suma de los coeficientes de dos comparaciones
es nula. Los contrastes con combinaciones lineales de medias cuya suma de coeficientes sean cero, se
denominan contrastes ortogonales.
Pueden realizarse a partir de las observaciones de los tratamientos porque la suma de cuadrados del
ANOVA se puede descomponer en 1 k sumas: tantas como grados de libertad de forma que a cada
componente le corresponde un grado de libertad.
Para comprobar la significacin de un contraste, se calculan:
m
C
1
1 2
1 11 1 1 2 2 1
1 1 1
k
n n n
i i k i k
i i i
C w x w x w x
= = =
= + + +

2
1 2
2 2 1 2 2 2 2 2
1 1 1
k
n n n
i i k i k
i i i
C w x w x w x
= = =
= + + +

k
1 2
1 2
1 1 1
k
n n n
k k i k k i k k k i k
i i i
C w x w x w x
= = =
= + + +

Dos contrastes sern ortogonales cuando:


1 2
1
0
k
i i
j
w w
=
=

18
en general los contrastes sern ortogonales cuando:
1
0
k
i r i s
j
w w
=
=

En diseos equilibrados se denomina suma de cuadrados del contraste ( ) SCC al valor


2
2
1
j
k
i j
j
C
SCC
w
=
=

donde:
2
j
C es un componente de la suma de cuadrados de los tratamientos con un grado de libertad.
Cada contraste es un componente de la varianza de la suma de cuadrados de los tratamientos debiendo
verificar:
1 2 1 k
SCB SCC SCC SCC

= + + +
Y puesto que el nmero de grados de libertad es uno, el valor de la media de cuadrados es el mismo que el
de la suma de cuadrados.
El valor del estadstico F correspondiente a un contraste es:
1
2
1
1
2
1
k
C
C
k
C
CMC
F
CMWE
CMC
F
CMWE
CMC
F
CMWE

=
=
=

que son interpretados de la forma habitual comparando las F observadas con


1, 1 k
F

.
7.1. Contrastes en diseos aleatorios
La
0
H es no hay diferencias entre los efectos medios de todos los tratamientos de la poblacin de la que
se obtienen al azar una muestra de k tratamientos incluidos en el estudio. Se trata, pues, de contrastar:
2
0
: 0 H

=
siguiendo los mismos clculos.
Diferencias entre modelos:
Ms conceptual que operativo;
Las conclusiones se refieren a poblaciones diferentes: en el modelo de efectos aleatorios permite mayor
generalizacin
En diseos ms complicados (bifactoriales, etc.) las F sern diferentes.
Estimacin de los componentes de la varianza
En ambos modelos, equilibrados o no, la mejor estimacin de la variabilidad de poblacin,
2
, es el error
experimental CMW. En el modelo de efectos aleatorios es posible estimar
2

como:
2
2

CMB CMW
coeficiente de en CMB

denominador que vara segn est o no equilibrado.


19
7.1.1. Intervalos de confianza de las medias
La estimacin puntual de la media
i
u de cada grupo es
i
x :
s
x n

=
Y que CMW es una estimacin no sesgada de
2
:
x
CMW
s
n
=
de donde:
i
CMW
x t
n

donde: t depende del nivel de significacin y de los grados de libertad de w.


8. ANOVA de dos factores: diseo completamente aleatorizado
Hasta este punto el modelo unifactorial aleatorizado con k tratamientos era:
1, 2, ,
1, 2, ,
i j j i j
i n
x
j k
=
= u + +

=

Supngase que hay dos factores ( ) , A B cada uno de ellos con a y b niveles respectivamente. El modelo
pasa a ser ahora:
( )
1, 2, ,
1, 2, ,
1, 2, ,
i pq p q p q i pq
i n
x p a
q b
=

= u + + + + =

donde:
i pq
x es el i-simo resultado de la unidad experimental con n observaciones, sometida a los
tratamientos A y B para la combinacin de tratamientos ab;
u es el efecto medio verdadero;
p
es el efecto (verdadero) del p-simo tratamiento o nivel del factor A (primera variable
independiente introducida en el modelo);
q
es el efecto (verdadero) del q-simo tratamiento o nivel del factor B (segunda variable
independiente introducida en el modelo);
p q
es el efecto (verdadero) de la interaccin entre el p-simo tratamiento o nivel del factor A
y el q-simo tratamiento o nivel del factor B ;
i p q
es el efecto (verdadero) de la i-sima unidad experimental en la p,q-sima combinacin de
tratamientos.
Asumiendo que:
u es una constante

( )
2
0,
i p q
DNI
Suponiendo el modelo
( )
i pq p q p q i pq
x = u + + + +
Las condiciones de
i p q
implican a su vez que:
20
( )
2
,
i p q pq
x DNI u ,
donde:
pq
u es la media global (verdadera) producida por la accin de A y B , la media de puntuacin
de cada casilla.
Se tiene, por tanto:
( )
( )
pq p q
p q
i pq pq p q i pq
p q
x
u = u + + +
= u + + + +
Definicin de los efectos principales y error experimental:
p p p p
q q q q
i pq i pq pq
x
= u u u = u+
= u u u = u+
= u
Teniendo en cuenta:
( )
i pq p q i pq
p q
x = u + + + +
y
p p
q q
u = u+
u = u+
se tiene:
( ) ( ) ( ) ( )
i pq p q i pq pq
pq
x x = u + u u + u u + + u
Para que sea realmente una identidad, deber verificarse que:
( )
pq pq p q
= u + u u u
que definen la p,q-sima interaccin:
( )
( ) ( ) ( )
( ) ( )
pq p q
pq
pq p p
pq
p p
pq p p
q q
= u + u u u

= u + u u u


u = u+
`
= u + u +

u = u+

)
Es decir, la interaccin ( )
pq
es el resultado de restar al efecto
( )
pq
u + u de las casillas o celdas p q
los efectos principales
p
y
q
.
Volviendo al modelo general
( ) ( ) ( ) ( )
i pq p q pq p q i pq pq
x x = u + u u + u u + u + u u u + u
cuya mejor estimacin se obtendr substituyendo las medias poblaciones por la medias muestrales:
( ) ( ) ( ) ( )
i pq p q pq p q i pq pq
x x x x x x x x x x x x = + + + + +
es decir,
( ) ( ) ( ) ( ) ( )
i pq p q pq p q i pq pq
x x x x x x x x x x x x = + + + +
se tiene que
21
( ) ( )



p p p p
q q q q
pq p q pq p q
pq pq
a x x
b x x
ab x x x x
= u u =
= u u =
= u + u u u = +
Como quiera que se desea que tales estimaciones sean insesgadas, se tiene:
( )
( )
( ) ( )
( )
( )
( )
( )
1 1
1 1
1 1
1 1
0 0
0 0
0 0
0 0
a a
p p
p p
b b
p p
q q
q q
q q
a a
pq pq
pq pq
p p
b b
pq pq
q q
a
a
b
b
ab
ab
ab
= =
= =
= =
= =

= =


=
= =


=
` ` `

= =
=

)


= =

) )




E
E
E
Elevando al cuadrado y sumando la expresin
( ) ( ) ( ) ( ) ( )
i pq p q pq p q i pq pq
x x x x x x x x x x x x = + + + +
y teniendo en cuenta que la suma de los productos cruzados se anula, se tiene
( )
( )
( )
( )
( )
2
2
1
2
1
2
1 1
2
1 1 1
i pq
a
p
p
b
q
q
a b
pq p q
p q
n a b
i pq pq
i p q
x x suma de cuadrados totales
bn x x variacin debida al factor A
a n x x variacin debida al factor B
n x x x x variacin debida a la interaccin
x x error experiment
=
=
= =
= = =
=
= +
+ +
+ + +
+

al
Cada una de las sumas de cuadrados es independiente de las restantes;
Cada una de las sumas de cuadrados, divida por
2
se distribuye como una
2

donde son los


grados de libertad:
( )
2
1 2
2
1 2
2
1, 1 2
2
2
a
b
a b
N ab
SCA
SCB
SC AB
SCW

22
Por tanto,
( )
( )
( )( )
1
1
1 1
SCA
CMA
a
SCB
CMB
b
SC AB
CM AB
a b
SCW
CMW
N ab
=

=

=

y como:
2
2
. .
. . , . . 2
. . 2
. .
. .
g de l de A
g de l de A g de l de B
g de l de B
SCA
g de l de A
F
SCB
g de l de B

= =

se tiene:
( )
( )
( )
( )
1 ,
1,
1
1
a N ab
b N ab
SCA
a
CMA
F
SCW
CMW
N ab
SCB
b
CMB
F
SCW
CMW
N ab

8.1. Resolucin del ANOVA de dos factores


En este punto, la descomposicin de la suma de cuadrados es en tres partes:
(a) Los factores;
(b) La interaccin entre factores;
(c) El error experimental.
Es decir,
( ) ( )
( )
( )
2
2 2
1 1 1
1 1 1 1 1 1
2
2
2
1 1 1
1 1 1 1
2
n a b
i pq
n a b n a b
i p q
i pq i pq
i p q i p q
n a b
i pq
a b a b
i pq i p q
pq
p q p q
x
SCW x x x
N
x
x
SCT n x x
N
SCB SCW SCT
= = =
= = = = = =
= = =
= = = =
| |
|
\ .
= =
| |
|
\ .
= =
=


donde:
1 1 1
n a b
i pq
i p q
N x
= = =
=

Con lo que la tabla de ANOVA adquiere este nuevo aspecto (por ejemplo, en el caso en que el factor A
tiene dos niveles y el B tres niveles:
23
p
a
1
a
2
a
totales de grupo
por efectos B
q
b
1
b
2
b
3
b
1
b
2
b
3
b
111
x
1 2 1
x
1 31
x
2 11
x
2 2 1
x
2 31
x
11 2
x
1 2 2
x
13 2
x
2 1 2
x
2 2 2
x
2 3 2
x

11 n
x
1 2 n
x
13 n
x
2 1 n
x
2 2 n
x
2 3 n
x
totales de
grupo
11
1
n
i
i
x
=
2 1
1
n
i
i
x
=
1
1 1
a n
p i
p i
x
= =

1 2
1
n
i
i
x
=
2 2
1
n
i
i
x
=
2
1 1
a n
p i
p i
x
= =

1 3
1
n
i
i
x
=
2 3
1
n
i
i
x
=
3
1 1
a n
p i
p i
x
= =

totales de
grupo por
efectos A
1
1 1
b n
q i
q i
x
= =
2
1 1
b n
q i
q i
x
= =

medias de
grupo
11
x
1 2
x
13
x
2 1
x
2 2
x
2 3
x
En los totales de grupo figuran los resultados de sumar los valores de todas las observaciones para cada
combinacin de tratamientos.
El objetivo de los diseos factoriales es determinar qu parte de la variacin entre grupos (o tratamientos)
es atribuible a cada uno de los factores en estudio y que parte a la interaccin.
Los efectos conjuntos del factor A y del factor B (que aqu se representa como ( ) A B + )no deben ser
confundidos con el efecto de la interaccin (que aqu se representa como ( ) AB ). La suma de los
cuadrados que cuantifica los efectos debidos a cada uno de los factores y a la interaccin entre ellos ser:
( )
2 2
1 1 1 1 1 1
1 1
n a b n a b
i pq i pq
a b
i p q i p q
p q
x x
SC A B
n N
= = = = = =
= =
| |
| | | |
|
| |
|
\ . \ .
+ =
|
|
|
\ .

La suma de cuadrados que cuantifica los efectos de los factores principales A y B ser, respectivamente:
( )
2 2
1
1 1 1 1 1
1
b n n a b
q i i pq
a
q i i p q
p
x x
SC A
b n N
= = = = =
=
| |
| | | |
|
| |
|
\ . \ .
=
|
|
|
\ .

y
24
( )
2 2
1
1 1 1 1 1
1
a n n a b
q i i pq
b
p i i p q
q
x x
SC B
a n N
= = = = =
=
| |
| | | |
|
| |
|
\ . \ .
=
|
|
|
\ .

Restando estas dos sumas de cuadrados a la correspondiente a los efectos conjuntos se obtendr la suma
de cuadrados de la interaccin entre A y B :
( ) ( ) ( ) ( )
( ) SC AB SC A B SC A SC B = + +
Hasta ahora los grados de libertad asociados a cada fuente de variacin eran:
fuente de variacin
entre grupos o tratamientos 1 ab
error experimental (intragrupo) N ab
total 1 N
Verificndose que
( ) ( ) 1 1 N ab N ab = +
Cuando aparece la interaccin entre A y B , hay que descomponer tambin los grados de libertad
correspondientes a la fuente de variacin entre grupos o tratamientos entre los factores principales y la
interaccin:
fuente de variacin
grupo o tratamiento A
1 a
grupo o tratamiento B
1 b
interaccin ( ) AB ( )( ) 1 1 a b
total entre grupos o tratamientos 1 ab
Verificndose que
( ) ( ) ( )( ) ( )
1 1 1 1 1 ab a b a b = + +
Con la suma de cuadrados y los grados de libertad pueden calcularse las medias de cuadrados y elaborarse
la tabla de ANOVA completa
fuente de
variacin
SC CM
entre grupos grupo o tratamiento A ( ) SC A 1 a ( ) CM A
grupo o tratamiento B ( ) SC B 1 b ( ) CM B
interaccin ( ) AB ( ) SC AB ( )( ) 1 1 a b ( ) CM AB
total entre grupos o tratamientos 1 ab
intragrupos
(experimental)
SCW N ab CMW
total SCT 1 N
Las suposiciones respecto a los parmetros en un diseo factorial de dos factores pueden adoptar las
siguientes formas:
ambos efectos son fijos (modelo I);
ambos efectos son aleatorios (modelo de componentes de la varianza o modelo II);
un efecto es fijo y el otro aleatorio (modelo mixto o modelo III).
25
En el de efectos fijos (modelo I), el investigador est interesado en comprobar la significacin de los a
niveles del factor o tratamiento A y los b niveles del factor o tratamiento B (todos ellos presentes en el
experimento u observacin) adems de la interaccin ( ) AB entre ambos factores.
En el de efectos aleatorios (modelo de componentes de la varianza o modelo II), el investigador est
interesado en comprobar la significacin de los efectos del tratamiento A a travs de una muestra de a
niveles de este factor o tratamiento escogidos aleatoriamente entre todos los posibles (tericamente
infinitos) y los efectos del tratamiento B a travs de una muestra de b niveles de este factor o tratamiento
escogidos aleatoriamente entre todos los posibles (tericamente infinitos), adems de la interaccin ( ) AB
entre ambos factores.
En el modelo de efectos mixtos (modelo III), el investigador est interesado en comprobar la significacin de
los efectos de un tratamiento (por ejemplo, el A) cuyos niveles estn todos ellos presentes en el
experimento u observacin y los efectos de otro tratamiento (por ejemplo, el B ) a travs de una muestra de
b niveles de este factor o tratamiento escogidos aleatoriamente entre todos los posibles (tericamente
infinitos), adems de la interaccin ( ) AB entre ambos factores.
Si se cumple la
0
H , la varianza esperada de todas las fuentes de variacin
( ) ( ) ( )
( )
2 2 2
, , ,
A B AB
ser igual
a la varianza del error experimental
( )
2
. Si no se cumple la
0
H , se debe a que alguno de los factores
principales o su interaccin aaden una variacin adicional a
2
. Segn cada modelo, estas varianzas o
cuadrados medios bajo la
0
H o bajo la hiptesis alternativa
1
H son:
CM bajo
modelo fuente de variacin
H
0
H
1
(en todos) intragrupos (experimental)
2

efectos fijos entre grupos grupo o tratamiento A


2

2
2
1
1
a
p
p
nb
a
=

grupo o tratamiento B
2

2
2
1
1
b
q
q
na
b
=

interaccin ( ) AB
2

( )
( ) ( )
2
2
1 1
1 1
a b
p q
p q
n
a b
= =

efectos
aleatorios
entre grupos grupo o tratamiento A
2

2 2 2
nb n

+ +
grupo o tratamiento B
2

2 2 2
na n

+ +
interaccin ( ) AB
2

2 2
n

+
efectos mixtos
3
entre grupos grupo o tratamiento A
2

2
2 2
1
1
a
p
p
nb n
a

=

+ +

grupo o tratamiento B
2

2 2
na

+
interaccin ( ) AB
2

2 2
n

+
Bajo estos modelos se pueden contrastar las siguientes hiptesis

3
Se considerar nicamente la posibilidad de que por ejemplo sea A el factor de efectos fijos y B el factor
de efectos aleatorios. En caso contrario basta con intercambiar la notacin, cosa que obviamente es trivial,
salvo que exista un factor con preeminencia sobre el otro (modelos jerrquicos).
26
modelo
efectos fijos
2
0
p
=
2
0
q
= ( )
2
0
p q
=
efectos aleatorios
2
0

=
2
0

=
2
0

=
efectos mixtos
2
0
p
=
2
0

=
2
0

=
El cociente entre cuadrado medio estudiado y el cuadrado medio intragrupos o error experimental seala la
importancia relativa de este componente
modelo fuentes de
variacin efectos fijos efectos aleatorios efectos mixtos
factor A
( ) CM A
F
CMW
=
( )
( )
CM A
F
CM AB
=
( ) CM A
F
CMW
=
factor B
( ) CM B
F
CMW
=
( )
( )
CM B
F
CM AB
=
( )
( )
CM B
F
CM AB
=
interaccin ( ) AB
( ) CM AB
F
CMW
=
( )
( )
CM AB
F
CM W
=
( )
( )
CM AB
F
CM W
=
Si en el modelo de efectos fijos el contraste de hiptesis concluye que la interaccin no es significativa,
puede aadirse a la suma de cuadrados de la interaccin la suma de cuadrados del error experimental de
modo que, dividiendo por el nmero de grados de libertad resultante:
( )( ) ( ) 1 1 1 a b N ab N ab + = +
se pueda estimar la variacin experimental ( ) CMW o
2
y reformular el modelo:
i p q p q i p q
x = u + + +
En caso de que no exista interaccin significativa, se complica la interaccin porque el significado de efecto
principal se diluye (de hecho, la interaccin se puede considerar otro efecto ms) y porque el clculo de
F pudiera resultar inapropiado ya que los cuadrados medios pueden estar sesgados.
Si en el modelo de efectos aleatorios el contraste de hiptesis concluye que la interaccin es significativa,
puede estimarse la varianza respectiva de cada factor:
( )
( ) ( )
( )
( ) ( )
( )
( )
2 2 2
2 2 2
2 2
AB A
AB B
AB
SC A s n s bn s
SC B s n s a n s
SC AB s n s
= + +
= + +
= +
donde:
( )
( )
2
AB
SC AB SCW
s
n

= ;
( )
( )
( )
( ) ( )
2
2
AB
A
SC A SCW n s
SC A SC AB
s
bn bn


= = ;
( )
( )
( )
( ) ( )
2
2
AB
B
SC B SCW n s
SC B SC AB
s
a n a n


= = .
27
Por ltimo, si en el modelo de efectos mixtos, el contraste de hiptesis concluye que la interaccin es
significativa, puede estimarse la varianza respectiva de cada factor (teniendo en cuenta en el caso que se
considera que el factor A es fijo y por tanto no tiene variabilidad):
( )
( )
( )
( )
2 2
2 2
B
AB
SC B s a n s
SC AB s n s
= +
= +
donde:
( )
2
AB
s tiene el mismo valor de antes; y:
( )
( )
2
B
SC B SCW
s
a n

= .
9. Ejemplo 1
9.1. Planteamiento
Se desea comparar las diferencias en las concentraciones de un marcador de hepatopata (AST) en
pacientes sometidos a cuatro tratamientos mdicos.
El investigador plantea realizar un experimento consistente en medir este constituyente del plasma en
cuatro grupos de pacientes afectados de una determinada enfermedad a los que se ha tratado con sendos
frmacos que se identificarn como A, B , C y D.
9.2. Diseo
El investigador decide utilizar un diseo de anlisis de la varianza de efectos fijos, unifactorial y equilibrado.
9.3. Procedimiento
Para verificar o rechazar la hiptesis de que los tratamientos no afectan a la concentracin de AST, se
selecciona un total de 100 N = pacientes a los que asigna 25
j
n = (diseo equilibrado) a cada uno de los
cuatro grupos de forma aleatoria y procede a la determinacin en cada paciente la concentracin cataltica
de AST.
A efectos de este ejemplo se asumir que los valores analticos se distribuyen segn la ley normal. Los
resultados (ficticios) obtenidos son:
n A B C D
1 26,589 16,127 14,567 33,168
2 43,612 28,982 16,095 32,435
3 26,349 34,015 40,438 11,454
4 17,307 46,446 25,171 34,995
5 20,943 45,859 52,711 25,977
6 19,471 24,438 45,328 25,151
7 31,357 14,570 40,628 18,511
8 31,792 11,693 27,844 47,200
9 31,567 24,439 32,657 31,339
10 15,326 44,798 21,342 34,920
11 28,888 18,366 20,344 34,085
12 12,096 28,361 32,478 5,385
13 22,201 34,189 19,800 8,735
14 29,285 21,264 22,725 27,345
15 39,556 32,307 26,718 32,120
28
n A B C D
16 28,875 32,479 37,659 25,232
17 27,510 27,120 31,658 22,046
18 28,356 11,047 20,548 35,406
19 18,327 32,268 35,363 21,375
20 27,052 10,966 27,480 26,263
21 25,377 22,431 12,639 18,562
22 40,554 34,271 21,196 22,184
23 1,487 39,297 17,529 28,235
24 27,422 26,474 34,848 38,872
25 29,795 34,551 14,616 16,642
9.4. Anlisis exploratorio (descriptivo)
El estudio estadstico descriptivo realizado con el programa MS-Excel

es:
A B C D
Media 26,044 27,870 27,695 26,306
Error tpico 1,816 2,100 2,093 1,949
Mediana 27,422 28,361 26,718 26,263
Moda #N/A #N/A #N/A #N/A
Desviacin estndar 9,078 10,500 10,466 9,745
Varianza de la muestra 82,408 110,240 109,539 94,968
Curtosis 1,338 -0,673 -0,237 0,119
Coeficiente de asimetra -0,530 0,027 0,593 -0,267
Rango 42,125 35,480 40,072 41,815
Mnimo 1,487 10,966 12,639 5,385
Mximo 43,612 46,446 52,711 47,200
Suma 651,093 696,759 692,380 657,640
Cuenta 25 25 25 25
Nivel de confianza (95,0%) 3,747 4,334 4,320 4,023
La misma informacin proporcionada por el paquete estadstico R es:
A B C D
Min. : 1.487 Min. :10.97 Min. :12.64 Min. : 5.385
1st Qu.:20.943 1st Qu.:21.26 1st Qu.:20.34 1st Qu.:21.375
Median :27.422 Median :28.36 Median :26.72 Median :26.263
Mean :26.044 Mean :27.87 Mean :27.70 Mean :26.305
3rd Qu.:29.795 3rd Qu.:34.19 3rd Qu.:34.85 3rd Qu.:33.168
Max. :43.612 Max. :46.45 Max. :52.71 Max. :47.200
La representacin grfica, el diagrama de cajas es el grfico que proporciona ms informacin y ms visual,
utilizando el paquete estadstico R es la siguiente. Los grupos A a D se identifican como 1 a 4. En
ordenadas se representa el valor numrico de la variable medida, AST.
29
1 2 3 4
0
1
0
2
0
3
0
4
0
5
0
Del grfico de cajas y del anlisis descriptivo se deduce que la media es prcticamente idntica en todos los
grupos, as como la dispersin a pesar de ser considerablemente amplia.
9.5. Inferencia estadstica: ANOVA
En ANOVA se desea comprobar la siguiente hiptesis:
0 1 2 3 4
1
:
:
0, 05
H
H las medias no son todas iguales al menos hay una que no lo es
u =u =u =u

=
Si las medias son iguales (si es cierta la
0 1 2
:
k
H u =u = =u =u ) se interpretar como que todos los
pacientes proceden de la misma poblacin, que no existen diferencias significativas entre los cuatro cuadros
patolgicos, que pueden combinarse entre ellos, etc.
El ANOVA compara la variacin dentro de las muestras con la variacin entre las muestras para evaluar la
igualdad de las medias de la poblacin. Si las observaciones dentro de una muestra son de valores
similares (poca variacin interna) y las medias son diferentes a travs de muestras (gran variacin
intermuestral) entonces se dice que existe una diferencia significativa entre las medias de la poblacin.
Para demostrar la
0
H se calculan dos estimaciones de la varianza global de la poblacin
2
:
(a) Una estimacin de la varianza dentro de los tratamientos que es independiente de
0
H : no hay que
suponer que las medias son iguales y se tratan por separado.
(b) Una estimacin de la varianza entre tratamientos que se basa en suponer que la
0
H es cierta(las
medias son iguales) y se hace un pool de datos para estimar la varianza.
9.5.1. Notacin
Antes de proseguir con el ejemplo, conviene repasar la notacin utilizada:
k es el nmero de tratamientos, en este ejemplo, 4 k = ;
j
n es el nmero de observaciones realizadas en cada uno de los k grupos de tratamiento;
30
N es el nmero total de observaciones. Es la suma de las
j
n observaciones realizadas:
1 2
1
k
j k
j
N n n n n
=
= = + + +


i j
x es la i-sima observacin en el j-simo tratamiento. Por ejemplo: la tercera observacin del
cuarto tratamiento es 11,454
j
x
i
es la suma de todas las observaciones en el j-simo tratamiento, por ejemplo
4
657,6400085 x =
i
i
x
i
es la suma de todas las observaciones del i-simo individuo;
j
x
i
es la media del j-simo tratamiento, por ejemplo
3
27,695 x =
i
;
x
i i
es la media global de todas las observaciones, en el ejemplo: 425,403 x =
i i
;
j
S
i
SCi es la suma de los cuadrados de la diferencia entre las observaciones y la media;
2
b
s CMB es la estimacin de la varianza entre grupos (b de between); CM indica cuadrados
medios o media de los cuadrados;
2
w
s CMW es la estimacin de la varianza dentro de los grupos (w de within)
9.5.2. Suposiciones
1. Las muestras son aleatorias de cada una de las tres poblaciones bajo estudio;
2. La distribucin de la AST es aproximadamente normal;
3. Las tres poblaciones son independientes;
4. Las varianzas de las poblaciones son iguales:
2 2 2
1 2 k
= = =
9.5.3. Seleccin del estadstico
El estadstico a calcular es F , la proporcin entre la varianza entre grupos y la varianza dentro de los
grupos:
2
2
b b
w w
s CM
F
s CM
= =
Los grados de libertad del numerador (
1
. . g de l ) y del denominador (
2
. . g de l ):
. . 1
. .
b b
w w
g de l k
g de l N k
= =
= =
es decir,
. . 1 3
. . 96
b b
w w
g de l k
g de l N k
= = =
= = =
9.5.4. Regla de decisin
En ANOVA se rechaza la
0
H (no hay diferencias entre las medias de las subpoblaciones) si el estadstico
es mayor que el valor crtico ( )
1 2
,
F

que se encuentra en las correspondientes tablas.
La regla de decisin es:
31
Rechazar
0
H si ( )
1 2
,
F F

y, alternativamente, no rechazar
0
H si ( )
1 2
,
F F


9.5.5. Procedimiento de clculo
Si se deseara realizar los clculos manualmente, utilizando por ejemplo una hoja de clculo, se dispondrn
tantas filas como casos y las columnas que corresponden a los clculos intermedios:
n A B C D
x x x
( )
2
x x x x x
( )
2
x x x x x
( )
2
x x x x x
( )
2
x x
1 26,59 0,546 0,298 16,13 -11,743 137,896 14,57 -13,128 172,341 33,17 6,862 47,090
2 43,61 -38,796 1505,138 28,98 -81,258 6602,815 16,10 -93,443 8731,643 32,43 -62,534 3910,452
3 26,35 26,349 694,286 34,02 34,015 1157,041 40,44 40,438 1635,218 11,45 11,454 131,201
4 17,31 -2680,57 7185428,8 46,45 46,446 2157,273 25,17 25,171 633,557 34,99 34,995 1224,626
5 20,94 -6,035 36,425 45,86 45,859 2103,040 52,71 52,711 2778,417 25,98 25,977 674,830
6 19,47 19,471 379,109 24,44 24,438 597,239 45,33 45,328 2054,582 25,15 25,151 632,584
7 31,36 31,357 983,252 14,57 14,570 212,283 40,63 40,628 1650,638 18,51 18,511 342,653
8 31,79 31,792 1010,712 11,69 11,693 136,715 27,84 27,844 775,276 47,20 47,200 2227,880
9 31,57 31,567 996,461 24,44 24,439 597,251 32,66 32,657 1066,509 31,34 31,339 982,153
10 15,33 15,326 234,882 44,80 44,798 2006,868 21,34 21,342 455,481 34,92 34,920 1219,387
11 28,89 28,888 834,526 18,37 18,366 337,294 20,34 20,344 413,878 34,08 34,085 1161,768
12 12,10 12,096 146,304 28,36 28,361 804,329 32,48 32,478 1054,808 5,39 5,385 29,002
13 22,20 22,201 492,867 34,19 34,189 1168,909 19,80 19,800 392,049 8,73 8,735 76,299
14 29,29 29,285 857,621 21,26 21,264 452,162 22,72 22,725 516,403 27,35 27,345 747,774
15 39,56 39,556 1564,658 32,31 32,307 1043,723 26,72 26,718 713,865 32,12 32,120 1031,710
16 28,87 28,875 833,742 32,48 32,479 1054,894 37,66 37,659 1418,194 25,23 25,232 636,666
17 27,51 27,510 756,819 27,12 27,120 735,492 31,66 31,658 1002,236 22,05 22,046 486,045
18 28,36 28,356 804,085 11,05 11,047 122,030 20,55 20,548 422,209 35,41 35,406 1253,613
19 18,33 18,327 335,876 32,27 32,268 1041,215 35,36 35,363 1250,518 21,38 21,375 456,899
20 27,05 27,052 731,825 10,97 10,966 120,253 27,48 27,480 755,163 26,26 26,263 689,755
21 25,38 25,377 643,980 22,43 22,431 503,163 12,64 12,639 159,735 18,56 18,562 344,554
22 40,55 40,554 1644,621 34,27 34,271 1174,530 21,20 21,196 449,258 22,18 22,184 492,121
23 1,49 1,487 2,211 39,30 39,297 1544,262 17,53 17,529 307,249 28,23 28,235 797,209
24 27,42 27,422 751,966 26,47 26,474 700,896 34,85 34,848 1214,407 38,87 38,872 1511,046
25 29,79 29,795 887,713 34,55 34,551 1193,753 14,62 14,616 213,631 16,64 16,642 276,967
Las medias de cada tratamiento son
1
1
i
n
j i j
i
j
x x
n
=
=
i
es decir
A 26,044
B 27,870
C 27,695
D 26,306
suma 2,636
La media global es
1 1
1
j
n
k
i j
j i
x x
N
= =
=
i i
32
es decir:
1 1
1 1
2697,87 26,979
100
j
n
k
i j
j i
x x
N
= =
= = =
i i
Para calcular la suma de cuadrados entre grupos se suman las diferencias al cuadrado entre las medias
de cada tratamiento y la media global
( )
2
1
k
j j
j
SCB n x x
=
=
i i i
que en el ejemplo representan:
( )
2
1
25 2,636 65, 892
k
j j
j
SCB n x x
=
= = =
i i i
La suma de cuadrados dentro de los grupos (tambin denominada cuadrados debidos al error) se calcula
sumando las diferencias al cuadrado de cada observacin y la media de su grupo respectivo:
( )
2
1 1
i
n k
i j j
j i
SCW x x
= =
=
i
De modo que la suma de cuadrados dentro de los grupos ser:
A 1977,8
B 2645,749
C 2628,928
D 2279,242
Suma (SCW) 9531,7
La suma de cuadrados total se calcula sumando las diferencias al cuadrado entre cada observacin y la
media global:
( )
2
1 1
i
n k
i j
j i
SCT x x
= =
=
i i
Pero teniendo en cuenta que:
SCT SCB SCW = +
puede calcularse directamente:
65, 892 9531, 7 9597,6 SCT = + =
9.5.5. Organizacin de los clculos
Con el fin de organizar los clculos se acostumbra a establecer una tabla. Las dos siguientes forman parte
de la respuesta del programa MS Excel

:
RESUMEN
grupos recuento suma promedio varianza
A 25 651,093 26,043 82,407
B 25 696,758 27,870 110,239
C 25 692,380 27,695 109,538
D 25 657,640 26,305 94,968
33
ANLISIS DE VARIANZA
fuente de
variacin
suma de
cuadrados
grados de
libertad
media de
cuadrados
F
probabilidad valor crtico
de F
Entre grupos 65,891 3 21,963 0,221 0,881 2,699
Dentro de los grupos 9531,710 96 99,288
Total 9597,602 99
Por su parte el paquete estadstico R ofrece el siguiente resultado:
Response: z$AST
Df Sum Sq Mean Sq F value Pr(>F)
z$factor 3 65.9 22.0 0.2212 0.8814
Residuals 96 9531.7 99.3
9.6. Conclusin
Se acepta la hiptesis nula
0
H ya que el valor observado de F es inferior al valor crtico para el nivel de
probabilidad fijado, 0, 005 = . En otras palabras, se dispone de suficiente evidencia (evidencia
significativa) para demostrar que la afectacin heptica debida a la influencia de los tratamientos A, B, C no
es la misma.
10. Ejemplo 2
El investigador selecciona otras cuatro entidades patolgicas y realiza idntico experimento. Los resultados
encontrados ahora son:
n E F G H
1 18,76 53,49 30,53 60,81
2 28,66 40,35 21,59 41,92
3 41,34 40,88 13,6 35,65
4 46,39 48,99 38,19 42,75
5 30,84 35,39 37,22 46,25
6 20,51 29,94 30,3 33,42
7 29,94 62,82 22,82 53,77
8 24,12 53,74 21,88 51,35
9 18,52 54,58 12,87 56,53
10 11,10 58,49 29,62 57,73
11 16,37 43,66 23,08 47,09
12 33,93 53,03 44,55 50,58
13 27,30 31,90 27,3 30,44
14 8,58 29,92 28,87 48,74
15 25,90 51,42 19,39 58,63
16 11,82 47,36 39,15 46,41
17 27,18 27,74 44,28 39,43
18 1,35 59,72 28,56 37,36
19 31,82 49,00 21,1 40,24
20 29,55 44,09 22,22 44,39
34
n E F G H
21 19,87 47,21 29,78 45,73
22 22,17 71,33 12,62 47,24
23 34,29 45,10 32,57 50,36
24 21,36 39,17 6,049 54,11
25 21,43 57,10 22,83 50,93
La estadstica descriptiva en el programa MS-Excel es:
E F G H
Media 24,125 47,057 26,439 46,874
Error tpico 2,022 2,210 1,957 1,595
Mediana 24,123 47,359 27,297 47,090
Moda #N/A #N/A #N/A #N/A
Desviacin estndar 10,112 11,048 9,784 7,974
Varianza de la muestra 102,245 122,065 95,718 63,591
Curtosis 0,409 -0,323 -0,229 -0,487
Coeficiente de asimetra -0,052 0,021 0,017 -0,232
Rango 45,041 43,592 38,497 30,371
Mnimo 1,352 27,742 6,049 30,438
Mximo 46,393 71,334 44,546 60,809
Suma 603,113 1176,427 660,982 1171,850
Cuenta 25 25 25 25
Nivel de confianza(95,0%) 4,174 4,561 4,038 3,292
Y en el paquete estadstico R:
E F G H
Min. : 1.35 Min. :27.74 Min. : 6.049 Min. :30.44
1st Qu.:18.76 1st Qu.:40.35 1st Qu.:21.590 1st Qu.:41.92
Median :24.12 Median :47.36 Median :27.300 Median :47.09
Mean :24.12 Mean :47.06 Mean :26.439 Mean :46.87
3rd Qu.:29.94 3rd Qu.:53.74 3rd Qu.:30.530 3rd Qu.:51.35
Max. :46.39 Max. :71.33 Max. :44.550 Max. :60.81
El correspondiente diagrama de cajas es:
35
1 2 3 4
0
1
0
2
0
3
0
4
0
5
0
6
0
7
0
El ANOVA correspondiente, ya en forma de tabla es:
RESUMEN
grupos recuento suma promedio varianza
E 25 603,113 24,125 102,245
F 25 1176,427 47,057 122,065
G 25 660,982 26,439 95,718
H 25 1171,850 46,874 63,591
ANLISIS DE VARIANZA
fuente de
variacin
suma de
cuadrados
grados de
libertad
media de
cuadrados
F probabilidad
valor crtico
de F
Entre grupos 11821,922 3 3940,641 41,1 0,000 2,699
Dentro de los grupos 9206,841 96 95,905
Total 21028,763 99
Analysis of Variance Table

Response: z2$AST2
Df Sum Sq Mean Sq F value Pr(>F)
z2$Factor2 3 11822.5 3940.8 41.091 < 2.2e-16 ***
Residuals 96 9207.0 95.9
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
36
Concluyndose que al ser la F observada (41,09) mayor que la F tabulada (2,70), existen diferencias
significativas entre las medias de los cuatro grupos de patologa considerados en este experimento
unifactorial, de efectos fijos y equilibrado.

Anda mungkin juga menyukai