Anda di halaman 1dari 113

TEMA 04

ANALISIS DE LAS
VARIANZAS

Ing. William Len Velsquez

Suposiciones en el anlisis de la varianza (ANOVA)

Para emplear ANOVA se supone lo siguiente:

Las poblaciones siguen la distribucin


normal.

Las poblaciones tienen desviaciones


estndar iguales ().

Las poblaciones son independientes.


4
Ing. William len Velsquez

El anlisis de la varianza (ANOVA)


ANOVA permite comparar las medias de tratamiento de
forma simultnea y evitar la acumulacin del error tipo I.
ANOVA se desarroll para aplicaciones en agricultura, y an
se emplean muchos de los trminos relacionados con ese
contexto.

En

particular, con el
trmino tratamiento
se
identifican
las
poblaciones diferentes
que se examinan.
5
Ing. William len Velsquez

EJEMPLO DIDACTICO
El gerente de un centro financiero, desea comparar la productividad, medida por
el nmero de clientes atendidos entre tres empleados.
Selecciona cuatro das en forma aleatoria y se registra el nmero de clientes
atendidos por cada empleado.
Los resultados son:

Ing. William len Velsquez

Walter

Willy

Kike

55

66

47

54

76

51

59

67

46

56

71

48

EJEMPLO DIDACTICO
Habr alguna diferencia en el nmero de clientes atendidos?

En la siguiente grfica se ilustrar cmo


pueden aparecer las poblaciones si hubiera
una diferencia en las medias del
tratamiento.

Ing. William len Velsquez

EJEMPLO DIDACTICO
Walter
Kike
Willy

Observe que las poblaciones en la grfica de la


izquierda siguen la distribucin normal y la
variacin en cada poblacin es la misma. Sin
embargo, las medias no son iguales.

Servicio al cliente

Suponer que las poblaciones son iguales es


decir que no hay diferencia en las medias
(tratamiento). Estos se muestra en la grfica de
la derecha. Observe que las poblaciones siguen
la distribucin normal y la variacin en cada
poblacin es la misma.
Ing. William len Velsquez

Walter
Kike
Willy

Servicio al cliente
8

La prueba ANOVA
Si se desea determinar si varias medias muestrales provienen
de una sola poblacin o de poblaciones con medias diferentes.
Lo que se hace en realidad, es que estas medias muestrales se
comparan mediante sus varianzas.

Una de las suposiciones para aplicar la prueba ANOVA es que


la desviacin estndar de las diversas poblaciones normales
tienen que ser las mismas. Se aprovecha este requisito en la
prueba ANOVA.
9
Ing. William len Velsquez

La prueba ANOVA

La estrategia es estimar la varianza de la poblacin de dos formas y


despus determinar la razn de dichos estimados.

Si esta razn es aproximadamente 1, entonces por lgica los dos


estimados son iguales, y se concluye que las medias poblaciones
son iguales.

La distribucin F sirve como un rbitro al indicar en


que instancia la razn de las varianzas muestrales es
mucho mayor que 1 para haber ocurrido por
casualidad.

Ing. William len Velsquez

10

La prueba ANOVA
Se definir algunos conceptos que nos ayudaran a entender mejor en
problemas posteriores, a travs del ejemplo planteado.

VARIACIN TOTAL (SS) Suma de las diferencias elevadas al


cuadrado entre cada observacin y la media global

Ing. William len Velsquez

11

EJEMPLO DIDACTICO

La variacin total del ejemplo:

Se calcula la media global de las 12 observaciones:


(55+54+59+56+66+76+67+71+47+51+46+48)/12 = 58

X G 58
Ing. William len Velsquez

12

EJEMPLO DIDACTICO

Despus, para cada una de las 12 observaciones se encuentra la


diferencia entre el valor particular y la media global. Cada una de
estas diferencias se eleva al cuadrado y estos cuadrados se suman,
este resultado es la variacin total,

SS= (55-58)2+(54-58)2+(59-58)2+(56-58)2+
(66-58)2+(76-58)2+(67-58)2+(71-58)2+
(47-58)2+(51-58)2+(46-58)2+(48-58)2=

SS= 1082.

Ing. William len Velsquez

13

EJEMPLO DIDACTICO
Luego se divide esta variacin total en dos componentes:

la que se debe a los tratamientos y


la que es aleatoria.

SS = SST + SSE

SS: Suma de cuadrados


SST: Suma de cuadrados de los tratamientos
SSE: Suma de cuadrados del error

Para

encontrar estas dos componentes, se determina la


media de cada tratamiento.

La primera fuente de variacin se debe a los tratamientos.

Ing. William len Velsquez

14

La prueba ANOVA
VARIACIN DE TRATAMIENTO (SST) Suma de las diferencias elevadas al
cuadrado entre la media de cada tratamiento y la media global

15
Ing. William len Velsquez

EJEMPLO DIDACTICO

En el ejemplo, la variacin debida a los tratamientos es la suma de las diferencias


al cuadrado entre la media de cada empleado y la media global.
Para calcularlo, primero se encuentra la media de cada uno de los tres
tratamientos.
La media de Walter es 56, determinada por:
(55 + 54 + 59 + 56)/4.
La media de Willy es son 70 determinada por:
(66 + 76 + 67 + 71)/4.
La media de Kike es 48 determinada por:
(47 + 51 + 46 + 48)/4.
16
Ing. William len Velsquez

EJEMPLO DIDACTICO
La suma de los cuadrados debida a los
tratamientos es:

(56 58)2 +(56 58)2 + ..+ (48 58)2 + (48 58)2 =


SST = 992

=4(56 58)2 + 4(70 58)2 + 4(48 58)2 = 992


Si existe una variacin considerable entre las medias de los
tratamientos, es lgico que este trmino sea grande.
El valor ms bajo posible es cero. Esto ocurrir cuando todas las
medias de los tratamientos sean iguales.
17
Ing. William len Velsquez

La prueba ANOVA
La otra fuente de variacin se le conoce como componente aleatoria o
componente de error.

VARIACIN ALEATORIA (SSE) Suma de las diferencias elevadas al cuadrado


entre cada observacin y su media de tratamiento.

Ing. William len Velsquez

18

EJEMPLO DIDACTICO
Las medias de
cada empleado

Walter es 56
Willy es 70
Kike es 48

En el ejemplo, este trmino es la suma de las diferencias al cuadrado


entre cada valor y la media para ese empleado en particular.
SSE=(55 56)2 +(54 56)2 + + (46 48)2+ (48 48)2 = 90
La variacin de error es de 90.
SSE = 90
Ing. William len Velsquez

19

EJEMPLO DIDACTICO
En resumen:
La suma de la diferencia entre el valor particular y la media global elevado al
cuadrado es la variacin total, y es igual 1082.

La suma de los cuadrados debida a los tratamientos es 992


La variacin de error es de 90.
Por lo tanto:
SS = SST + SSE
1082 =
992 +

=
Ing. William len Velsquez

90

+
20

La prueba ANOVA
El estadstico de prueba, es la razn de los dos estimados de la varianza poblacional,
se determina a partir de la siguiente ecuacin:

Ing. William len Velsquez

21

La prueba ANOVA

S 2T m 1
F 2
S E nm

Diferencia entre grupos

m-1

Diferencias dentro de cada


grupos
Ing. William len Velsquez

n -m

22

EJEMPLO DIDACTICO
El primer estimado de la varianza poblacional
entre los tratamientos, es decir, de la diferencia
entre las medias.
ste es 992/2.
Por qu se divide entre 2?
Recuerde que para encontrar una varianza muestral ,
se divide entre el nmero de observaciones menos
uno (n-1).

Entre grupos

En este caso hay 3 tratamientos por lo que se divide


entre 2.
El primer estimado poblacional es 992/2.
Ing. William len Velsquez

23

EJEMPLO DIDACTICO

El estimado de la varianza dentro de los


tratamientos es la variacin aleatoria dividida entre
el nmero total de observaciones menos el nmero
de tratamientos.
Es decir 90 / (12-3).
De aqu, el segundo estimado de la varianza
poblacional es 90/9.

Ing. William len Velsquez

Dentro de cada grupos

24

EJEMPLO DIDACTICO
Por tanto

S 2T m 1
F 2
S E nm

Ing. William len Velsquez

Entre grupos
Dentro de cada grupos

25

EJEMPLO DIDACTICO
Como esta razn es muy distinta a 1, se concluye que las medias de los
tratamientos no son iguales.
Por lo tanto hay una diferencia en el nmero medio de clientes atendidos
por los tres empleados.
Al igual que en la prueba de hiptesis de dos muestras y una muestra se
sigue la regla de los cinco pasos.

Ing. William len Velsquez

26

Comparacin de varias medias

Anlisis de Varianza (ANOVA)


Es la relacin entre una variable cualitativa
(con ms de 2 categoras) y una variable
cuantitativa

Ing. William len Velsquez

27

El problema
Se tiene varias medias muestrales y se desea
saber si realmente son evidencia de una
diferencia entre los diferentes grupos.

Existe una variable cuanlitativa X que podra


explicar los cambios en una variable
cuantitativa Y

Ing. William len Velsquez

28

Esquema ANOVA
Variable Independiente o
Explicativa

Variable dependiente o
Respuesta

Cualitativa

Cuantitativa

FACTOR que incluye varios


posibles tratamientos que
pueden influir en la
respuesta
Ing. William len Velsquez

Y
Medicin que puede
RESPONDER a los varios
posibles tratamientos del
factor estudiado
29

La Hiptesis
Ho: No hay relacin entre X e Y
Ho: Las medias de Y en los diferentes grupos son
iguales
Ho: 1 = 2 = 3

Ha:

Si hay relacin entre X e Y


Ha: Por lo menos una media de Y es diferente en los
grupos definidos por la variable X
Ha: No todas las medias poblacionales son iguales

Ing. William len Velsquez

30

Ilustracin mediante un ejemplo


Se ha calculado la produccin promedio de tres lneas de produccin
de una empresa de productos electrnicos
Lnea 1

Lnea 2

Lnea 3

Produccin promedio
(unidades)

11.1

15.9

22.7

Desviacin estndar
(unidades)

5.6

6.2

5.9

Base n

244

206

139

La muestra seleccionada permite ver que hay diferencias, pero esta


diferencia representa slo en la muestra
Ing. William len Velsquez

31

Si se asume que Ho es cierta


(No hay relacin)
Lnea 1

Lnea 2

Lnea 3

Media
general

Produccin
promedio

15.5

15.5

15.5

15.5

Base (n)

244

206

139

589

En la poblacin las medias deberan ser iguales (Este es el supuesto de Ho)

Ing. William len Velsquez

32

Modelo de ANOVA de un factor

Media general

Y=

Efecto del tratamiento en el


factor analizado

Error aleatorio
Ing. William len Velsquez

33

En el ejemplo
X es el factor analizado:
variable cualitativa
Y : cantidad producida

El efecto sobre la cantidad producida de cada tratamiento (lnea de


produccin) en la muestra no tiene que ser el mismo.

La

hiptesis nula dice que no hay


diferencia en la produccin en los
tratamientos.
La hiptesis alternativa dice que por lo
menos uno de los tratamientos (lnea de
produccin) tiene efecto sobre la cantidad
comprada
Ing. William len Velsquez

34

Resultados de ANOVA
Efecto del factor Lnea de Produccin

Efecto del Error aleatorio

Como el valor de p es casi 0 se rechaza la Ho


Con lo cual se rechaza la hiptesis de igualdad de medias
Por lo tanto al menos una lnea tiene una produccin diferente
En otrasIng.palabras
hay una relacin el factor lnea y la produccin.
William len Velsquez

35

Supuestos de ANOVA
La dispersin debe ser la misma en cada grupo
o categora (igualdad de varianza)
La distribucin de las observaciones en cada
grupo debe ser normal
ANOVA es ms sensible al primer supuesto que la segundo

En casos extremos hay que considerar alternativas no paramtricas

Ing. William len Velsquez

36

Ejemplo 1

Una gran ciudad est dividida en cuatro distritos. El jefe de polica quiere
determinar si hay alguna diferencia en el nmero promedio de infracciones
cometidos en cada distrito.
Se registr el nmero de infracciones reportados en cada distrito en una
muestra de seis das.
Al nivel de significancia 0,05; puede el funcionario concluir que hay diferencia
en el nmero promedio de infracciones?
Distrito 01

Ing. William len Velsquez

Distrito 02

Distrito 03

Distrito 04

37

Ejemplo 1
a) Formulacin de las hiptesis
Ho: 1 = 2 = 3 = 4
H1: Al menos una de las i es diferente

b) Obtencin del valor crtico:


Nivel de significancia=0.05
GL numerador: k-1 = 4-1=3
GL del denominador: n-k = 24-4 =20
Fcrtico= 3.098
Regla de decisin:
Se rechazar la Ho si F> 3.10
Ing. William len Velsquez

38

Ejemplo 1
c) Clculo del valor del estadstico de la prueba:

Distrito 01

x (T)
n
x2

13
15
14
15
14
15
86

x2

Distrito 02

169
225
196
225
196
225

21
13
18
19
18
19
108

x2

Distrito 03

441
169
324
361
324
361

1236

Ing. William len Velsquez

12
14
15
13
12
15
81

x2

Distrito 04

144
196
225
169
144
225

1980

16
17
18
15
20
18
104

total

x2

256
289
324
225
400
324

1103

1818

x
379
x2
6137

39

Ejemplo 1
=


24

= 151.958

(86)2 (108)2
(81)2 (104)2
(379)2
SST=------ + ------ + ------ + -------- - -------6
6
6
6
24

SST= 1232.67

SSTotal= SST+ SSE

+ 1944.00 +

1093.50

1802.67

5985.04

SSE=SSTotal SST
SSE=151.958 87.79 =64.188

Ing. William len Velsquez

40

87.79

Ejemplo 1
Suma de
Cuadrados

G.L.

Media
Cuadrado

Tratamientos
Error

87.770
64.188

3
20

29.256
3.2094

Total

151.958

23

F. Variacin

F
9.118

d) Criterio de decisin

Se rechaza la Ho debido a que el valor del Fcalculado es 9.118 y es mayor al


valor del Fcrtico de 3.10.
Se concluye de que hay diferencia en el nmero promedio de infracciones
entre los distritos citados
Ing. William len Velsquez

41

Ejemplo 2

Una egresada de ingeniera industrial tiene ofertas de trabajo de cuatro empresas.


Para examinar un poco ms las propuestas, solicit a un grupo de personas recin
ingresadas a dichas empresas, que le indiquen cuntos meses trabajaron cada una
para su compaa, antes de recibir un aumento de sueldo.

La informacin muestral fueron lo siguiente:


Empresa1

Empresa2

Empresa3

Empresa4

12

14

18

12

10
14

12
10

12
16

14
16

12

10

Al nivel de significancia de 0,05; existe alguna diferencia entre las cuatro


empresas, en el nmero medio de meses antes de recibir un aumento de sueldo?
Ing. William len Velsquez

42

Ejemplo 2
a) Formulacin de las hiptesis
Ho:1 = 2 = 3 = 4
H1: Al menos una de las i es diferente

b) Obtencin del valor crtico:


Nivel de significancia=0.05
GL numerador: k-1 = 4-1=3
GL del denominador: n-k = 14-4 =10
Fcritico= 3.708
Regla de decisin:
Se rechazar la Ho si F> 3.71
Ing. William len Velsquez

43

Ejemplo 2
C) Obtencin del F de los datos de la muestra
Empresa 01

X2

Ing. William len Velsquez

Empresa 02

X2

Empresa 03

X2

Empresa 04

X2

Total

44

Ejemplo 2

SStotal X

2
X
SST
T c n
n
c

Ing. William len Velsquez

45

Ejemplo 2

Como el valor Fcrtico 3.71 es mayor que el valor Fcalculado de 2.360 no se rechaza
la Ho, y se concluye que no existe alguna diferencia entre las cuatro empresas, en el
nmero medio de meses antes de recibir un aumento de sueldo

Ing. William len Velsquez

46

Ejemplo 3
Los miembros de un equipo ciclista se dividen al azar en tres grupos que

entrenan con mtodos diferentes.


El primer grupo realiza largos recorridos a ritmo pausado, el segundo grupo
realiza series cortas de alta intensidad y el tercero trabaja en el gimnasio con
pesas y se ejercita en el pedaleo de alta frecuencia.

Despus de un mes de entrenamiento se


realiza un test de rendimiento consistente
en un recorrido cronometrado de 9 Km.

Ing. William len Velsquez

47

Ejemplo 3
Los tiempos empleados fueron los siguientes
Mtodo I

Mtodo II

Mtodo III

15
16

14
13

13
12

14
15
17

15
16
14

11
14
11

A un nivel de confianza del 95% Puede considerarse que los tres mtodos producen
resultados equivalentes? O por el contrario Hay algn mtodo superior a los dems?

Ing. William len Velsquez

48

Ejemplo 3
Se calcula los totales y los cuadrados de los totales divididos por el numero de
observaciones

Ing. William len Velsquez

49

Ejemplo 3
X

2984

2940

A partir de estas cantidades bsicas calculamos las Sumas de Cuadrados:


SStotal X
SST
T

SC(total) = 2984 - 2940 = 44


n

nc

SS = SST + SSE
SST = SS -SSE

Ing. William len Velsquez

SC(entre) = 2966,8 2940 = 26,8

SC(intra) = 2984 2966,8 = 17,2

50

Ejemplo 3
Los cuadrados medios sern:

MSA=
CM(entre) = 26,8/2 = 13,4
MSerror= CM(intra) = 17,2/12 = 1,43

Por consiguiente el estadstico de contraste vale:

S m 1
F 2
S E nm
2T

Ing. William len Velsquez

F = 13,4/ 1,43 = 9,37

51

Ejemplo 3

El valor de la F terica con 2 y 12 grados de libertad, a


un nivel de confianza del 95% es
3,89.
Por consiguiente se rechaza la hiptesis nula y
Se concluye que los tres mtodos de
entrenamiento producen diferencias significativas.

Ing. William len Velsquez

52

Ejemplo 4
Un estudio muestra en la pantalla de cuatro computadores una lista de palabras
sin sentido con procedimientos diferentes, asignados aleatoriamente a un grupo
de personas.
Luego se les realiza una prueba de memoria de dichas palabras, obtenindose los
siguientes resultados:

Qu conclusiones pueden obtenerse acerca de las cuatro formas de


presentacin,
con un nivel de significacin del 5%?
Ing. William len Velsquez

53

Ejemplo 4
Solucin:
Calcular los totales y los cuadrados de los totales divididos por el nmero de
observaciones:

Ing. William len Velsquez

54

Ejemplo 4
Luego calcular los cuadrados de las observaciones y su total

Ing. William len Velsquez

55

Ejemplo 4
A partir de estas cantidades bsicas calcular las Sumas de Cuadrados:

=
=

SC(total) = 988 820 = 168

SC(entre) = 902 820 = 82

Los cuadrados medios sern: SC(intra) = 988 902 = 86


CM(entre) = 82/3 = 27,3
CM(intra) = 86/22 = 3,9
Ing. William len Velsquez

56

Ejemplo 4
Por lo tanto el estadstico de prueba ser:

27.3
=7.0
3.9

Clculo del F critico:


El valor de la F terica con 3 y 22 grados de libertad, a un
nivel de confianza del 95% es 3.05.

Conclusin
Como el F calculado es mayor que el Fcritico se rechaza
la hiptesis nula y se concluye que los cuatro
procedimientos de presentacin producen diferencias
significativas.
Ing. William len Velsquez

57

ANOVA de dos factores

Se consideran los efectos de dos factores


simultneamente

Diseo de bloques aleatorios


Cuando una caracterstica puede afectar la
medicin de la variable dependiente, se trata de
controlar o bloquear esta variable, de tal manera
que se pueda comparar mejor la influencia de un
determinado tratamiento

Ing. William len Velsquez

59

ANOVA de dos factores

Media general
Efecto del tratamiento
especfico del primer factor

Y=

Efecto del tratamiento


especfico del segundo factor
Efecto de la interaccin entre
tratamientos
Error aleatorio

Ing. William len Velsquez

60

Diseo de Bloques aleatorios

Media general

Y=

Efecto del tratamiento especfico


del primer factor
Efecto del bloque

Error aleatorio
Ing. William len Velsquez

61

ANOVA P.H. para probar la igualdad de medias de varias


poblaciones con dos factores
Se trata de probar si el efecto de un factor o Tratamiento en la respuesta
de un proceso o sistema es significativo, al realizar experimentos
variando los niveles de ese factor (Temp.1, Temp.2, etc.) por FILAS
Y Considerando los niveles de otro factor que se piensa que tiene

influencia en la prueba FACTOR DE BLOQUEO por COLUMNA

Ing. William len Velsquez

62

ANOVA P.H. para probar la igualdad de medias de varias


poblaciones con dos factores
Para el tratamiento en filas

Ho : 1 2 3 ......... a
Ha : A lg unas. ' s.son.diferentes
Para el factor de bloqueo en columnas

Ho : '1 '2 '3 ......... 'a

Ha : A lg unas. ' s.son.diferentes


Ing. William len Velsquez

63

ANOVA 2 Factores - Ejemplo

Maquinas
Maq 1
Maq 2
Maq 3
Ing. William len Velsquez

Experiencia en aos de los operadores


1
2
3
4
5
27
31
42
38
45
21
33
39
41
46
25
35
39
37
45
64

ANOVA Dos factores o direcciones

La SCTot y SCTr (filas) se determina de la misma forma que para


la ANOVA de una direccin o factor
En forma adicional se determina la suma de cuadrados del factor
de bloqueo (columnas) de forma similar a la de las filas

La SCE = SCT SCTr - SCBl

Ing. William len Velsquez

65

ANOVA de 2 factores
Suma de cuadrados, gl. y Cuadrado medio para el factor de bloqueo (en cols)

SCBl

a( X

X)

j 1

gl.SCBl b 1
CMBl SCBl /( b 1)
Ing. William len Velsquez

66

ANOVA de 2 factores Suma de cuadrados, gl. y


Cuadrado medio para el error

SCE SCT SCTr SCBl


gl.SCE ( n a )(n b)
CME SCBl /( n a )(n b)

Ing. William len Velsquez

67

ANOVA Clculo del estadstico Fc y Ftabla

MCTr
Fc
MCE
Ftabla FALFA , g l. S CTr, g l. S CE

Ing. William len Velsquez

68

ANOVA de 2 factores Clculo del estadstico


Fcbl y Ftabla bloques (columnas)

MCBl
Fc
MCE
Ftabla FALFA , g l. S CBl, g l. S CE

Ing. William len Velsquez

69

Tabla final ANOVA 2 Factores

FUENTE DE VARIACIN

SUMA DE
CUADRADOS

GRADOS DE CUADRADO
LIBERTAD
MEDIO

VALOR F

Entre muestras (tratam.)

SCTR

a-1

CMTR

CMTR/CME

Entre Bloques (Factor Bl)

SCBl

b-1

CMBL

CMBL/CME

Dentro de muestras (error)

SCE

(a-1)(b-1)

CME

Variacin total

SCT

n-1

CMT

Regla: No rechazar si la F de la muestra es menor que la F de tabla para una cierta alfa

Ing. William len Velsquez

70

ANOVA 2 F. Toma de decisin

Distribucin F
Ftabla

Alfa

Zona de no rechazo

Zona de no rechazo de Ho
O de no aceptar Ha

Zona de rechazo
De Ho o aceptar Ha
Fc: Tr o Bl

Ing. William len Velsquez

71

ANOVA 2 F. Toma de decisin

Si Fc (Tr o Bl) es mayor que Ftabla se rechaza Ho


Aceptando Ha donde las medias son diferentes
O si el valor de p correspondiente a Fc (Tr o Bl) es
menor de Alfa se rechaza Ho

Ing. William len Velsquez

72

Ejemplo 1
Se ha diseado una prueba de vocabulario para detectar la afinidad
hacia la mecnica.

La prueba consiste en un cierto nmero de palabras tomadas de una


lista de trminos alusivos a la mecnica y a la maquinaria; y que la
calificacin que una persona puede obtener en esa prueba es,
simplemente, el nmero de palabras que puede definir
correctamente.
Supongamos que se quiere probar si
hay diferencias relativas a dos
caractersticas, sexo y lugar donde
viven, y tambin si se presentan
diferencias atribuibles a la combinacin
de ambas.
Ing. William len Velsquez

73

Ejemplo 1
Las calificaciones (cantidad de palabras bien definidas) de las personas
clasificadas de acuerdo a las dos variables fueron las siguientes:

Urbano
C
p
a
a
n
l
t d a
i e b
d
r
a
a
d
s

Hombre
4
9
9
10
Ing. William len Velsquez

Rural
Mujer
1
4
5
6

Hombre
3
7
7
7

Mujer
4
4
4
8
74

Ejemplo 1

Es posible, llevar a efecto un anlisis de varianza de una sola clasificacin


con estos cuatro grupos de sujetos, sin embargo, si se encuentra una
diferencia significativa entre estos cuatro grupos, Como saber si esas
diferencias deben atribuirse al sexo o al lugar donde viven o a una
combinacin de ambos?
Es por ello que en estos casos se utiliza el mtodo de anlisis de
varianza de doble clasificacin.

Ing. William len Velsquez

75

Pasos
1.- Establecer Hiptesis

Se tiene que establecer hiptesis para cada uno de los tratamientos y para
la interaccin de ambos:
a)

Primer tratamiento:
Ho: Con respecto al sexo no existe diferencia en las calificaciones
obtenidas, que mide la afinidad hacia la mecnica

Ha: Con respecto al sexo existe diferencia en las calificaciones


obtenidas, que mide la afinidad hacia la mecnica

Ing. William len Velsquez

76

Ejemplo 1
1.- Establecer Hiptesis
b) Respecto al segundo tratamiento:
Ho: Con respecto al lugar donde viven no existe diferencia en las
calificaciones obtenidas, que mide la afinidad hacia la mecnica
Ha: Con respecto al lugar donde viven existe diferencia en las
calificaciones obtenidas, que mide la afinidad hacia la mecnica

Ing. William len Velsquez

77

Ejemplo 1

1.- Establecer Hiptesis

c) Respecto a la interaccin de los dos tratamientos


Ho: La combinacin de las circunstancias sexo y lugar de residencia no
afecta de manera significativa el tener ms afinidad hacia la mecnica

Ha:La combinacin de las circunstancias sexo y lugar de residencia


afecta de manera significativa el tener ms afinidad hacia la mecnica

Ing. William len Velsquez

78

Ejemplo 1
2.- Establecer el Criterio de Contraste
a=2

b=2

n=16

gl T1
gl T2
gl Iter
gl Tot
gl SCE

a-1
b-1
(a-1)(b-1)
n-1

1
1
1
15
12

glTot-gl T1 -gl T2 - gl Iter

nivel de significancia de .05

Gl T1 =1
Gl SCE= 12
F= 4 .75

Gl T2 =1
Gl SCE= 12
F= 4 .75

Gl Iter =1
Gl SCE= 12
F= 4 .75

Ing. William len Velsquez

79

Ejemplo 1
3.- Calcular el Estadstico de Prueba
Sumatoria de los totales
Urbano

X =
X =
n

Rural

Hombre

x2

Mujer

x2

Hombre

x2

Mujer

x2

4
9
9
10

16
81
81
100

1
4
5
6

1
16
25
36

3
7
7
7

9
49
49
49

4
4
4
8

16
16
16
64

32

16
278

Ing. William len Velsquez

24
78

20
156

92
112

624
16

4
80

Ejemplo 1

Clculo del Factor de correccin:


( X ) 2
FC
n

FC
Ing. William len Velsquez

92

16

529
81

Ejemplo 1
Clculo de la Suma Total de Cuadrados

SCTotal = X 2 -

FC

= ( 278 + 78 + 156 + 112) - 529 = 95

= 624 - 529 = 95

Ing. William len Velsquez

82

Ejemplo 1
Calcular la suma de cuadrados por cada tipo de tratamiento
SCT1 (por el lugar donde viven)

Ing. William len Velsquez

83

Ejemplo 1
Calcular la suma de cuadrados por cada tipo de tratamiento
SCT2 (por sexo)

Hombre

Ing. William len Velsquez

Mujer

84

Ejemplo 1
Calcular la suma de cuadrados por grupos

*Este valor nos servir para calcular el SCI y SCE


Ing. William len Velsquez

85

Ejemplo 1
Calcular la suma de cuadrados de la interaccin de los dos tratamientos
SCI = SCG SCT1 SCT2 =
= 35 1 25 = 9

Calcular la suma de cuadrados del error


SCE = SCTOT SCG =
= 95 35 = 60

Ing. William len Velsquez

86

Ejemplo 1
Construir la Tabla ANOVA
FUENTE
TRATAMIENTO 1

TRATAMIENTO 2
POR GRUPOS
INTERACCION
ERROR
TOTAL

Ing. William len Velsquez

SC
1.0
25.0
35
9.0
60
95

GL
1
1

MC
1
25

F
0.2
5

1
12
15

9
5

1.8

87

Ejemplo 02
4.- Tomar Decisin y Conclusin
Decisin

FDATOS

Conclusin

FT1= 4 .75

0.2

Se rechaza la Ho

FT2= 4 .75

No se rechaza la Ho

1.8

No se rechaza la Ho

FCRITICO

FCrtico

FINT= 4 .75

Como los Estadsticos de Prueba, en los casos de las variables de localidad (F*1 = 0.2) y la
combinacin de sexo y localidad (F*i =1.8) son mas pequeos que sus respectivos criterios de
contraste (F = 4.75), en estos casos no se rechaza la hiptesis nula,
Mientras que en el caso del sexo el Estadstico de Prueba (F*2 = 5.0) es mas grande que el
Criterio de Contraste (F = 4.75), entonces por lgica inferimos que F* queda dentro de la zona
crtica y por lo tanto se rechaza la hiptesis nula por lo tanto aceptamos la hiptesis alterna
Ing. William len Velsquez

88

Ejemplo 1
y la conclusin :

Hay evidencia suficiente, con un nivel de significancia de .05, para afirmar


que con respecto al sexo existe diferencia en las calificaciones
obtenidas que mide la afinidad hacia la mecnica
Hay evidencia suficiente, con un nivel de significancia de .05, para afirmar
que con respecto al lugar de procedencia no existe diferencia en las
calificaciones que mide la afinidad hacia la mecnica

ni tampoco podemos afirmar que la combinacin de ambas circunstancias


influya en la afinidad hacia la mecnica de las personas.

Ing. William len Velsquez

89

Ejemplo 02
El departamento de nutricin de cierta universidad
lleva a cabo un estudio para determinar si hay
diferencia o no en el contenido de cido ascrbico
entre tres diferentes marcas de concentrado de jugo
de naranja.

Se hacen cuatro pruebas de los tres tipos de


concentrado de jugo de naranja que fue congelado
durante tres periodos de tiempo diferentes (en das)

Ing. William len Velsquez

90

Ejemplo 02
Los resultados, en miligramos de cido ascrbico por litro, son los siguientes:
MARCA
RICA
BUENA
BARATA

0
52.6
49.8
56.0
49.6
52.5
51.8

54.2
46.5
48.0
48.4
52.0
53.6

TIEMPO ( DAS )
3
49.4
49.2
42.8
53.2
48.8
44.0
44.0
42.4
48.0
47.0
48.2
49.6

7
42.7
40.4
49.2
42.0
48.5
45.2

48.8
47.6
44.0
43.2
43.3
47.6

Utilice un nivel de significancia de .05 para probar la hiptesis que:


Los contenidos de cido ascrbico por marca de jugo son diferentes
Los contenidos de cido ascrbico por tiempo de congelamiento son diferentes
Los contenidos de cido ascrbico son diferentes debido a la interaccin de las dos variables.
Ing. William len Velsquez

91

Ejemplo 02
a)

Planteamiento de las hiptesis:


Ho: Los contenidos de cido ascrbico por marca de jugo son iguales
Ha: Los contenidos de cido ascrbico por marca de jugo son diferentes
Ho: Los contenidos de cido ascrbico por tiempo de congelamiento son iguales

Ha: Los contenidos de cido ascrbico por tiempo de congelamiento son diferentes

Ho: Los contenidos de cido ascrbico son iguales debido a la interaccin de las dos variables.
Ha: Los contenidos de cido ascrbico son diferentes debido a la interaccin de las dos
variables.

Ing. William len Velsquez

92

Ejemplo 2
2.-

Establecer el Criterio de Contraste

a
3

b
3

n
36

Gl T1 =2
Gl SCE= 27
F=3.35

gl T1
gl T2
gl Iter
gl Tot
gl SCE

a-1
b-1
(a-1)(b-1)
n-1

2
2
4
35
27

glTot-gl T1 -gl T2 - gl Iter

nivel de significancia de .05

3.35
Gl T2 =2
Gl SCE= 27
F= 3.35
3.35
Gl Iter =4
Gl SCE= 27
F=2.73
2.73

Ing. William len Velsquez

93

Ejemplo 02
Elaborar la tabla ANOVA
n

RICA
BUENA
BARATA

52.6
49.8
56
49.6
52.5
51.8

54.2
46.5
48
48.4
52
53.6

49.4
42.8
48.8
44
48
48.2

7
49.2
53.2
44
42.4
47
49.6

42.7
40.4
49.2
42
48.5
45.2

48.8
47.6
44
43.2
43.3
47.6

Tratamientos

615

566.6

542.5

12

12

12

Ing. William len Velsquez

12

577.2

12

559.6

12

587.3

1724.1

1724.1
36
94

Ejemplo 02
1- Clculo del Factor de correccin

( X )
FC
n
Ing. William len Velsquez

(1724.1) 2 2972520.81
2

2972520.81

FC

----------------

82570.0225

36

FC

82570

95

Ejemplo 02
2- Clculo de la Suma cuadrado de totales

SCTotales X 2 FC
SCTotales=
Ing. William len

Velsquez

83102.01 -

82570 =

531.9875
96

Ejemplo 02
3- Clculos de los tratamientos

X/ n0

2
X
SCT1
FC
n

X/ n3

X/ n7

6152
566.6 2 542.52
SCT1

FC
12
12
12
TIEMPO

SCT1
SCT1=

31518.75

26752.96

24525.52

- 82570.02

2
X

n FC 82797.23 82570.02

SCT1=

82797.23

82570.02

227.212

97

Ejemplo 02
2
X
SCT2
FC
n

3- Clculos de los tratamientos

X/ nBUENA

X/ nRICA

X/ nBARATA

- FC

577.2
559.66
587.3
SCT2

FC
12
12
12
MARCA

SCT2

27763.32

26096.01

2
X

n 82602.77

SCT =

Ing. William len


2 Velsquez

82602.77

82570.02

32.752

28743.44

82570.02

Ejemplo 02
4- Calcular la suma de cuadrados por bloques

SGG

SCG

203.1

=
+
+

Ing. William len Velsquez

FC

41249.61

10312.4
4

10312.40 +
10201 +
11014.50 +

9467.29 +
8028.16 +
9292.96 +

n=4

RICA
BUENA

0
203.1
202

3
194.6
179.2

7
179.5
178.4

BARATA

209.9

192.8

184.6

8055.06 +
7956.64 +
8519.29 -

82570.02 =

277.29

99

Ejemplo 02
5- Calcular la suma de cuadrados de la interaccin de los dos
tratamientos

SCI = SCG SCT1 SCT2 =


SCI =

Ing. William len Velsquez

277.29

227.212

32.752

= 17.322

100

Ejemplo 02
6- Calcular la suma de cuadrados del error

SCE = SCTOT SCG


SCE

Ing. William len Velsquez

531.9875

277.29

254.703

101

Ejemplo 02
Construir la Tabla ANOVA
FUENTE

SC

GL

MC

TRATAMIENTO 1

227.21

113.606

12.0429

TRATAMIENTO 2

32.75

16.376

1.7359

POR GRUPOS
INTERACCION
ERROR
TOTAL

277.29
17.32
254.70
531.99

4
27
35

4.330
9.433

0.4591

Ing. William len Velsquez

102

Ejemplo 02
Conclusin
FDATOS

Conclusin

FT1= 3.35

12.0429

Se rechaza la Ho

FT2= 3.35

1.7359

No se rechaza la Ho

0.4591

No se rechaza la Ho

FCRITICO

FINT= 2.73

FCrtico

Ing. William len Velsquez

103

Ejemplo 03

Una empresa realiza una investigacin para determinar el rendimiento en


millas por galn, caracterstico de tres marcas de gasolina: Como cada
gasolina da rendimientos distintos en automviles de marcas diferentes,

Se eligen cinco marcas de


automviles que se tratan como
bloques en el experimento, es
decir el automviles de cada
marca se prueba con los tres tipos
de gasolina.

Ing. William len Velsquez

104

Ejemplo 03
Los resultados del experimento (en millas por galn) se presenta a
continuacin:

AUTOMOVILES

A
B
C
D
E

MARCA DE GASOLINA
I
18
24
30
22
20

II
21
26
29
25
23

III
20
27
34
24
24

Con un = 0.05 Existir alguna diferencia entre los rendimientos medios en


miles por galn de los tres tipos de gasolina?
Ing. William len Velsquez

105

Ejemplo 03
Utilice un nivel de significancia de .05 para probar la hiptesis de que:
Los consumos de gasolina por marca de automvil son diferentes
Los consumos de gasolina por marca de gasolina son diferentes
Como la relacin entre la marca de gasolina y la marca de automvil es de uno
a uno no existir prueba de interaccin entre las dos variables.

Ing. William len Velsquez

106

Ejemplo 3
2.-

Establecer el Criterio de Contraste


nivel de significancia de .05

a
3

b
5

n
15

gl T1
gl T2

a-1
b-1

2
4

gl Tot
gl SCE

n-1

14
8

glTot-gl T1 -gl T2

T1

Gl T1 =2
Gl SCE= 8
F=4.459

Gl T2 =4
Gl SCE= 8
F= 3.838

T2

4.459
Ing. William len Velsquez

3.838

2.73
107

Ejemplo 02
Elaborar la tabla ANOVA
I

II

III

X2

18

21

20

59

1165

24

26

27

77

1981

30

29

34

93

2897

22

25

24

71

1685

20

23

24

67

1505

114

124

129

367

X2

2684

3112

3437

Ing. William len Velsquez

9233

X2
15 n

108

Ejemplo 02
1- Clculo del Factor de correccin
( X )
FC
n

2
Factor de correccin
FC

(367)2
----------15

8979.267

2- Clculo de la Suma cuadrado de totales


SCTotales X FC
2

Suma total de
cuadrados
SSTot
Ing. William len Velsquez

9233

8979.267 =

253.733
109

Ejemplo 03
3- Clculos de los tratamientos
X

SCT
FC
2

Suma de cuadrados del


tratamiento 1
SST1
=
(114)2
--------5
Suma de cuadrados del
tratamiento 2
SST2
=
(59)2
--------3

(124)2
--------5

(77)2
--------3

Suma de cuadrados del error


SSE
=
253.7333
Ing. William len Velsquez

(129)2
--------5

(93)2
--------3

23.3333

8979.26667

(71)2
--------3

217.067

23.3333

(67)2
--------3

- 8979.26667

13.3333333

217.067

Ejemplo 03
Construir la Tabla ANOVA
FUENTE
T1
T2
ERROR
TOTAL

SS
23.33333
217.0667
13.33333
253.7333

GL
2
4
8
14

SM
11.66667
54.26667
1.666667

F
7
32.56

Conclusin
FCRITICO

FDATOS

Conclusin

FT1= 4.459

Se rechaza la Ho

FT2= 3.838

32.56

Se rechaza la Ho

FCrtico
Ing. William len Velsquez

111

FIN
wjleonv@yahoo.com

Anda mungkin juga menyukai