Anda di halaman 1dari 21

Anlisis de la varianza

Magdalena Cladera Munar


mcladera@uib.es
Departamento de Economa Aplicada
Universitat de les Illes Balears

CONTENIDOS
Anlisis de la varianza de un factor.
Anlisis de la varianza con ms de
un factor.
Anlisis de la covarianza.

Bibliografa:
LVY, J.P. Y VARELA, J. (2003). Anlisis multivariable para
las ciencias sociales. Ed. Pearson Prentice Hall. Madrid.
NEWBOLD, P. (1997). Estadstica para los Negocios y la
Economa. Prentice Hall. Madrid.
PARDO, A. RUZ, M. A. (2001). SPSS 10.0. Gua para el
anlisis de datos. Accesible en:
http://www.uca.es/serv/ai/formacion/spss/Inicio.pdf
PEA, D. (2001) ESTADSTICA. Modelos y Mtodos. Tomo II:
Fundamentos. Ed. Alianza Universidad Textos.Madrid.
PREZ, C. (2001). Tcnicas estadsticas con SPSS. Ed.
Pearson Prentice Hall. Madrid.
PERZ, C. (2004). Tcnicas de Anlisis Multivariante de
Datos. Aplicaciones con SPSS. Pearson Educacin, S. A.
Madrid.
URIEL, E. Y ALDS, J. (2005). Anlisis Multivariante Aplicado.
Thomson. Madrid.

Anlisis de la varianza y la covarianza


Anlisis de la Varianza de un factor
El Anlisis de la Varianza (ANOVA) permite contrastar la igualdad de
medias en k poblaciones.
En cada una de las poblaciones, la variable cuantitativa X tiene la
siguiente distribucin:
Xj N(j, 2) para j = 1, 2, , k
Hiptesis a contrastar:
H0: 1 = 2 = = k =
HA: al menos una media es diferente
La causa de la posible heterogeneidad de las poblaciones se
denomina factor.
Los factores son variables cualitativas cuyas categoras determinan
las diferentes poblaciones que se comparan.

Anlisis de la varianza y la covarianza

Anlisis de la Varianza de un factor


Supuestos:
Las varianzas de todas las poblaciones son iguales
(homocedasticidad).
La variable analizada se distribuye normalmente en
todas las poblaciones.

Incumplimiento de los supuestos:


El ANOVA es una tcnica robusta a la presencia de
heterocedasticidad si el nmero de observaciones de
cada grupo es similar.
El ANOVA es una tcnica robusta al incumplimiento del
supuesto de normalidad si las muestras son grandes.

Anlisis de la varianza y la covarianza

Anlisis de la Varianza de un factor


Informacin muestral:
POBLACIN

Observaciones
muestrales

Medias
Media global

x11

x21

xk1

x12

x22

xk2

x1n

x2n

x1

x2

xkn
xk

Anlisis de la varianza y la covarianza

Anlisis de la Varianza de un factor


Informacin muestral:

Medidas de variabilidad:

POBLACIN
1

- Variabilidad intragrupos:
k

(x

ij

Observaciones
muestrales

Medias
Media global

x11

x21

xk1

x12

x22

xk2

x1n

x2n

xkn

x1

x2

xk

xj )

- Variabilidad entre grupos:

(x

x)

- Variabilidad total:

(x

ij

x)

Anlisis de la varianza y la covarianza

Anlisis de la Varianza de un factor


Estadstico de contraste:

(x x ) (k 1)
F=
(x x ) (n k )

- Variabilidad intragrupos:

Fk 1,n k

ij

Medidas de variabilidad:

(x

ij

Ho cierta

xj )

- Variabilidad entre grupos:


Rho si F > Fk-1, n-k;

(x

x)

- Variabilidad total:

(x

ij

x)

Anlisis de la varianza y la covarianza

Anlisis de la Varianza de un factor


Tabla ANOVA:
Fuentes de
variacin

Sumas de
cuadrados

Entre
grupos

(x

Grados de
libertad

x)

k 1

(x

(x

Intragrupos

(x

xj )

nk

Total

(x

x)

n 1

ij

ij

Medias de
cuadrados

x)

(k 1)

ij

xj )

(n k )

p-valor

p-valor

Anlisis de la varianza y la covarianza

Anlisis de la Varianza de un factor


Ejemplo. Coste en farmacia por CA.
Descriptivos
Costes totales por habitante (poblacin total) en euros

N
Asturias
Cantabria
La Rioja
Murcia
Aragn
Castilla La Mancha
Extremadura
Illes Balears
Madrid
Castilla y Len
Total

75
32
18
71
112
187
97
41
289
232
1154

Media
147,1725
137,7320
142,1683
142,0445
158,8742
161,9665
146,9971
119,8415
102,2012
143,2552
137,0145

Desviacin
tpica
20,10973
24,41170
27,18609
14,08061
35,62395
32,19195
26,83451
26,98319
28,72670
32,54685
36,66620

Error tpico
2,32207
4,31542
6,40782
1,67106
3,36615
2,35411
2,72463
4,21407
1,68981
2,13681
1,07935

Intervalo de confianza para


la media al 95%
Lmite
Lmite inferior
superior
142,5457
151,7993
128,9306
146,5333
128,6489
155,6876
138,7117
145,3773
152,2040
165,5445
157,3223
166,6106
141,5888
152,4055
111,3245
128,3584
98,8753
105,5271
139,0451
147,4653
134,8968
139,1322

Mnimo
99,43
90,88
95,34
116,21
73,30
90,72
89,96
68,96
10,60
59,51
10,60

Mximo
201,90
206,35
185,37
187,43
252,25
290,77
214,83
178,99
226,11
230,20
290,77

Anlisis de la varianza y la covarianza

Anlisis de la Varianza de un factor


Ejemplo. Coste en farmacia por CA.
ANOVA
Costes totales por habitante (poblacin total) en euros

Inter-grupos
Intra-grupos
Total

Suma de
cuadrados
561026,249
989078,878
1550105,1

gl
9
1144
1153

Media
cuadrtica
62336,250
864,579

F
72,100

Sig.
,000

Anlisis de la varianza y la covarianza

Anlisis de la Varianza con ms de un factor


Permite evaluar el efecto individual y conjunto de dos o ms
variables categricas sobre una variable dependiente
cuantitativa.
Hiptesis. Existe una hiptesis nula por cada factor y una por
cada posible combinacin de factores:
La hiptesis nula referida a un factor afirma que las medias de
las poblaciones definidas por los niveles del factor son iguales.
La hiptesis referida al efecto de una interaccin afirma que su
efecto es nulo.
Para contrastar cada hiptesis se utiliza un estadstico F
siguiendo la misma lgica que en el caso del ANOVA de un
factor.

Anlisis de la varianza y la covarianza

Anlisis de la Varianza con ms de un factor


Supuestos:
Se trabaja con tantas poblaciones como casillas resultan de la
combinacin de todas las categoras de los factores.
Todas las poblaciones son normales.
Igualdad de varianzas en todas las poblaciones.

Anlisis de la varianza y la covarianza

Anlisis de la Varianza con ms de un factor


Ejemplo. Coste en farmacia por acreditacin docente y
porcentaje de MIR
Pruebas de los efectos inter-sujetos
Variable dependiente: Costes totales por habitante (poblacin total) en euros

Fuente
Modelo corregido
Interseccin
porc_mir
docencia
porc_mir * docencia
Error
Total
Total corregida

Suma de
cuadrados
tipo III
194018,582a
2240345,702
67997,830
6403,169
11677,475
378099,655
8778802,089
572118,238

gl
6
1
3
1
2
430
437
436

Media
cuadrtica
32336,430
2240345,7
22665,943
6403,169
5838,737
879,302

a. R cuadrado = ,339 (R cuadrado corregida = ,330)

F
36,775
2547,870
25,777
7,282
6,640

Significacin
,000
,000
,000
,007
,001

Anlisis de la varianza y la covarianza

Anlisis de la Varianza con ms de un factor


Ejemplo. Coste en farmacia por acreditacin docente y
porcentaje de MIR

Anlisis de la varianza y la covarianza

Anlisis de la Varianza con ms de un factor


Ejemplo. Coste en farmacia por acreditacin docente y
porcentaje de MIR
Estadsticos descriptivos
Variable dependiente: Costes totales por habitante (poblacin total) en euros
Formacin de mdicos Existencia de
Media
Desv. tp.
N
0
No
182,0577
26,40935
11
Total
182,0577
26,40935
11
inferior al 34%
No
151,1011
30,76412
263
S
118,1513
28,14032
19
Total
148,8811
31,64848
282
entre el 34% y el 66%
No
118,2273
29,65015
68
S
112,2300
24,77521
24
Total
116,6628
28,45036
92
superior al 66%
No
97,1619
28,11215
24
S
101,2119
25,61119
28
Total
99,3427
26,60492
52
Total
No
142,3868
35,42615
366
S
109,4694
26,62058
71
Total
137,0387
36,22427
437

Anlisis de la varianza y la covarianza

Anlisis de la Varianza con ms de un factor


Ejemplo. Coste en farmacia por acreditacin docente y
porcentaje de MIR
Estimaciones de los parmetros
Variable dependiente: Costes totales por habitante (poblacin total) en euros

Parmetro
Interseccin
[porc_mir=0]
[porc_mir=1]
[porc_mir=2]
[porc_mir=3]
[docencia=0]
[docencia=1]
[porc_mir=0] *
[docencia=0]
[porc_mir=1] *
[docencia=0]
[porc_mir=1] *
[docencia=1]
[porc_mir=2] *
[docencia=0]
[porc_mir=2] *
[docencia=1]
[porc_mir=3] *
[docencia=0]
[porc_mir=3] *
[docencia=1]

B
101,212
84,896
16,939
11,018
0a
-4,050
0a
0

37,000
0

10,047
0
0
0

Intervalo de confianza al
95%.
Lmite
superior
Lmite inferior
90,197
112,226
63,675
106,117
-,384
34,263
-5,195
27,231
.
.
-20,263
12,163
.
.

Error tp.
5,604
10,797
8,814
8,249
.
8,249
.

t
18,061
7,863
1,922
1,336
.
-,491
.

Significacin
,000
,000
,055
,182
.
,624
.

10,847

3,411

,001

15,680

58,320

10,845

,926

,355

-11,268

31,363

a. Al parmetro se le ha asignado el valor cero porque es redundante.

Anlisis de la varianza y la covarianza

Anlisis de la Covarianza
El ANCOVA permite eliminar de la variable dependiente el
efecto atribuible a variables no incluidas como factores.
El inters sigue siendo analizar los efectos de los factores,
contrastndose las mismas hiptesis que en el ANOVA.
Adems, se contrasta la hiptesis nula de que el efecto de la
covariable sobre la dependiente es cero.

Anlisis de la varianza y la covarianza

Anlisis de la Covarianza
Ejemplo. Coste en farmacia por acreditacin docente,
porcentaje de MIR, frecuentacin y calidad de la prescripcin.
Pruebas de los efectos inter-sujetos
Variable dependiente: Costes totales por habitante (poblacin total) en euros

Fuente
Modelo corregido
Interseccin
porc_mir
docencia
porc_mir * docencia
frecuent
utb_1998
Error
Total
Total corregida

Suma de
cuadrados
tipo III
272291,773a
269226,479
15153,080
3586,459
4616,142
17504,011
61532,367
265099,886
8562645,903
537391,659

gl
8
1
3
1
2
1
1
410
419
418

Media
cuadrtica
34036,472
269226,479
5051,027
3586,459
2308,071
17504,011
61532,367
646,585

a. R cuadrado = ,507 (R cuadrado corregida = ,497)

F
52,640
416,382
7,812
5,547
3,570
27,071
95,165

Significacin
,000
,000
,000
,019
,029
,000
,000

Anlisis de la varianza y la covarianza

Anlisis de la Covarianza
Ejemplo. Coste en farmacia por acreditacin docente,
porcentaje de MIR, frecuentacin y calidad de la prescripcin.
Estimaciones de los parmetros
Variable dependiente: Costes totales por habitante (poblacin total) en euros

Parmetro
Interseccin
[porc_mir=0]
[porc_mir=1]
[porc_mir=2]
[porc_mir=3]
[docencia=0]
[docencia=1]
[porc_mir=0] *
[docencia=0]
[porc_mir=1] *
[docencia=0]
[porc_mir=1] *
[docencia=1]
[porc_mir=2] *
[docencia=0]
[porc_mir=2] *
[docencia=1]
[porc_mir=3] *
[docencia=0]
[porc_mir=3] *
[docencia=1]
frecuent
utb_1998

B
72,248
47,377
5,390
2,050
0a
-4,135
0a

Intervalo de confianza al
95%.
Lmite
superior
Lmite inferior
61,241
83,254
27,376
67,379
-10,564
21,344
-12,334
16,435
.
.
-19,233
10,963
.
.

Error tp.
5,599
10,175
8,116
7,318
.
7,680
.

t
12,903
4,656
,664
,280
.
-,538
.

Significacin
,000
,000
,507
,779
.
,591
.

27,064

10,179

2,659

,008

7,055

47,074

13,291

9,848

1,350

,178

-6,068

32,649

1,349
3,163

,259
,324

5,203
9,755

,000
,000

,840
2,526

1,859
3,801

a. Al parmetro se le ha asignado el valor cero porque es redundante.

Anlisis de la varianza y la covarianza

Anlisis de la Covarianza
Ejemplo. Coste en farmacia por acreditacin docente,
porcentaje de MIR, frecuentacin y calidad de la prescripcin.
ANOVA

ANCOVA

Anda mungkin juga menyukai