Ejercicio 1:
Marcar la respuesta correcta a cada una de las afirmaciones siguientes, o completar la frase:
1. Con los modelos de ANOVA se pueden comparar ms de dos muestras a la vez. V F
2. Y tambin ms de un factor, con varias muestras a la vez. V F
3. Para poder aplicar los modelos de ANOVA las muestras deben ser: aleatorias, independientes,
normales y de igual varianza.
4. En ANOVA se pueden usar muestras de diferente tamao. V F
5. La distribucin terica del F es una distribucin Chi Cuadrado. V F
6. El coeficiente de correlacin se usa para medir el grado de asociacin de 2 variables. V F
7. La correlacin se usa cuando el investigador busca establecer el grado de asociacin. V F
8. El cuadrado del coeficiente de regresin es el coeficiente de determinacin. V F
9. Para un mismo problema se puede usar Regresin o Correlacin. V F
10. El anlisis de regresin se usa cuando se conoce la relacin terica Y = f (X). V F
11. Para el anlisis de peso y talla se puede usar la regresin. V F
12. El mtodo de los mnimos cuadrados es el usado en regresin. V F
13. Todas las muestras a lo largo de la curva de regresin son homocedsticas. V F
14. La ecuacin de regresin de Y sobre X, es igual a la de X sobre Y. V F
15. El ensayo de hiptesis en regresin se hace con una Tabla de ANOVA. V F
Ejercicio 2:
Se quiere evaluar la eficacia de distintas dosis de un frmaco contra la hipertensin arterial, comparndola
con la de una dieta sin sal. Para ello se seleccionan al azar 25 hipertensos y se distribuyen aleatoriamente
en 5 grupos. Al primero de ellos no se le suministra ningn tratamiento, al segundo una dieta con un
contenido pobre en sal, al tercero una dieta sin sal, al cuarto el frmaco a una dosis determinada y al quinto
el mismo frmaco a otra dosis. Las presiones arteriales sistlicas de los 25 sujetos al finalizar los
tratamientos son:
Grupos
1
180
172
163
158
147
173
158
170
146
152
175
167
158
160
143
182
160
162
171
155
181
175
170
155
160
Descriptivos
Presin sistlica
Control
Poca sal
Sin sal
Frmaco
dosis 1
Frmaco
dosis 2
Total
N Media
5 178,20
5 166,40
5 164,60
Desviacin
tpica
3,962
7,369
5,273
Error
tpico
1,772
3,295
2,358
5 158,00
9,028
4,037
146,79
169,21
146
171
5 151,40
6,656
2,977
143,14
159,66
143
160
25 163,72
11,002
2,200
159,18
168,26
143
182
Mximo
182
175
170
gl1
gl2
4
20
Sig.
,748
Hiptesis:
H0: 21 = 22= 23= 24= 25. Las varianzas de las muestras
son iguales.
Ha: 21 22 23 24 25. Las varianzas de las
muestras son distintas.
Dado que la significacin calculada (0.748) es mayor que el
valor de alfa (0.05), se acepta la hiptesis nula que afirma que
existe
una
homogeneidad
entre
las
varianzas
(homocedsticas). Por lo tanto, se puede aplicar la prueba de
Anova.
La tabla de anova es:
Fuente de variacin
GL
SS
MS
Tratamiento
2010,64
502,66
11,24
Error
20
894,4
44,72
Total
24
2905,04
F0,05(4,20) =2,87
0,05
calculado
= 11.24
(I) Tipo de
Tratamiento
Poca sal
Sin sal
Frmaco dosis 1
Frmaco dosis 2
(J) Tipo de
Tratamiento
Control
Control
Control
Control
Intervalo de confianza al
95%
Lmite
Lmite
superior
inferior
-23,01
-,59
-24,81
-2,39
-31,41
-8,99
-38,01
-15,59
Diferencia de
Error
medias (I-J)
tpico
Sig.
-11,800(*)
4,229 ,037
-13,600(*)
4,229 ,015
-20,200(*)
4,229 ,000
-26,800(*)
4,229 ,000
* La diferencia de medias es significativa al nivel .05.
a Las pruebas t de Dunnett tratan un grupo como control y lo comparan con todos los dems grupos.
(J) Tipo de
Tratamiento
Diferencia de
medias (I-J)
Poca sal
11,800
Sin sal
13,600
Control
Frmaco dosis 1
20,200(*)
Frmaco dosis 2
26,800(*)
Control
-11,800
Sin sal
1,800
Poca sal
Frmaco dosis 1
8,400
Frmaco dosis 2
15,000(*)
Control
-13,600
Poca sal
-1,800
Sin sal
Frmaco dosis 1
6,600
Frmaco dosis 2
13,200
Control
-20,200(*)
Poca sal
-8,400
Frmaco dosis 1
Sin sal
-6,600
Frmaco dosis 2
6,600
Control
-26,800(*)
Poca sal
-15,000(*)
Frmaco dosis 2
Sin sal
-13,200
Frmaco dosis 1
-6,600
* La diferencia de medias es significativa al nivel .05.
Error
tpico
4,229
4,229
4,229
4,229
4,229
4,229
4,229
4,229
4,229
4,229
4,229
4,229
4,229
4,229
4,229
4,229
4,229
4,229
4,229
4,229
Sig.
,142
,068
,003
,000
,142
,996
,438
,037
,068
,996
,661
,081
,003
,438
,661
,661
,000
,037
,081
,661
Intervalo de confianza
al 95%
Lmite
Lmite
superior
inferior
-2,52
26,12
-,72
27,92
5,88
34,52
12,48
41,12
-26,12
2,52
-12,52
16,12
-5,92
22,72
,68
29,32
-27,92
,72
-16,12
12,52
-7,72
20,92
-1,12
27,52
-34,52
-5,88
-22,72
5,92
-20,92
7,72
-7,72
20,92
-41,12
-12,48
-29,32
-,68
-27,52
1,12
-20,92
7,72
Presin sistlica
Scheff
Tipo de Tratamiento
Frmaco dosis 2
Frmaco dosis 1
Sin sal
Poca sal
Control
Sig.
N
5
5
5
5
5
Dnde,
H01a: sin sal= poca sal
H01b: poca sal = control
H01c: sin sal = control
H02a : farm 2 = farm 1
H02b : farm 1 = sin sal
H02c : farm 2 = sin sal
H03a: farm 1 = sin sal
H03b: sin sal = poca sal
H03c: farm 1 = poca sal
Ha1a: sin sal poca sal
Ha1b: poca sal control
Ha1c: sin sal control
Ha2a : farm 2 farm 1
Ha2b : farm 1 sin sal
Ha2c : farm 2 sin sal
Ejercicio 3:
En un estudio sobre la efectividad de 3 mtodos para dejar de fumar se quiere saber si la reduccin media
en el nmero de cigarrillos semanales difiere de un mtodo a otro. Se disea un experimento con 3 grupos
de 15 fumadores cada uno, que consuman la misma cantidad, y se obtienen las siguientes reducciones en
el nmero de cigarrillos que deja de fumar cada uno.
Los resultados fueron los siguientes:
Archivos: fumar.xls o fumar.sav
Cigarrillo que dejaron de fumar
Mtodo 1
Mtodo 2
Mtodo 3
50
41
49
51
40
47
52
39
45
52
40
47
51
40
46
50
39
48
51
41
45
52
41
47
52
39
44
53
41
45
49
41
48
51
40
49
52
41
46
50
41
48
48
38
47
Pablo Salgado EMAIL: estadisticacurso@caicyt.gov.ar
Mtodo1
Mtodo2
N
15
15
Media
50,93
40,13
Desviacin
tpica
1,335
,990
Error
tpico
,345
,256
Lmite inferior
50,19
39,58
Lmite superior
51,67
40,68
Mnimo
48
38
Mximo
53
41
Mtodo3
15
46,73
1,534
,396
45,88
47,58
44
49
Total
45
45,93
4,673
,697
44,53
47,34
38
53
gl1
gl2
2
42
Sig.
,263
Hiptesis:
H0: 21 = 22= 23. Las varianzas de las muestras son iguales.
Ha: 21 22 23. Las varianzas de las muestras son
distintas.
Dado que la significacin calculada (0.263) es mayor que el
valor de alfa (0.05), se acepta la hiptesis nula que afirma que
existe
una
homogeneidad
entre
las
varianzas
(homocedsticas). Por lo tanto, se puede aplicar la prueba de
Anova.
ANOVA
Nmero de cigarrillo que dejo de consumir
Inter-grupos
Intra-grupos
Total
Suma de
cuadrados
889,200
71,600
960,800
gl
2
42
Media
cuadrtica
444,600
1,705
F
260,799
Sig.
,000
44
(J) Mtodos
Mtodo 2
Mtodo 3
Mtodo 2
Mtodo 1
Diferencia de
medias (I-J)
10,800(*)
4,200(*)
Error tpico
,477
,477
Sig.
,000
,000
-10,800(*)
,477
,000
-12,01
-9,59
,477
,477
,477
,000
,000
,000
-7,81
-5,41
5,39
-5,39
-2,99
7,81
Mtodo 3
-6,600(*)
-4,200(*)
6,600(*)
* La diferencia de medias es significativa al nivel .05.
Mtodo 3
Mtodo 1
Mtodo 2
Lmite
superior
Lmite inferior
9,59
12,01
2,99
5,41
N
15
15
2
40,13
15
46,73
50,93
Sig.
1,000
1,000
1,000
Se muestran las medias para los grupos en los subconjuntos homogneos.
a Usa el tamao muestral de la media armnica = 15,000.
Ejercicio 4:
Se quiere saber si hay relacin entre el peso y la talla en nios varones. Para ello se miden las dos
variables y se comparan.
Hay asociacion/correlacin entre las dos variables?
Si la correlacin lineal es alta, calcule la regresin lineal y escriba la funcin que relaciona las dos variables.
Los bases de datos son las siguientes resultados:
Archivos: peso y talla.xls o peso y talla.sav
Los resultados obtenidos son los siguientes:
peso (kg)
talla (cm)
9
10
6
8
10
5
8
7
4
72
76
59
68
60
58
70
65
54
11
7
7
6
8
5
11
5
9
6
10
83
64
66
61
66
57
81
59
71
62
75
Correlaciones
Peso en Kg
Correlacin de Pearson
Peso en Kg
1
Altura en cm
,885(**)
Sig. (bilateral)
,000
N
Altura en cm
Correlacin de Pearson
Sig. (bilateral)
20
20
,885(**)
,000
20
20
80,00
70,00
60,00
4,00
6,00
8,00
10,00
Peso en Kg
Hay una fuerte asociacin entre las dos variables. Dado que el valor
r de correlacin de Pearson es igual a 0.885 (prximo a 1). sta
indica que a medida que aumentan los valores de las variables
altura, aumentan los de peso. En la figura de dispersin se indica
grficamente sta relacin.
Estadsticos descriptivos
Altura en cm
Peso en Kg
Media
66,3500
7,6000
Desviacin
tp.
8,08686
2,13739
N
20
20
Error tp. de la
estimacin
3,86079
Durbin-Watson
2,067
ANOVA (b)
Modelo
1
Regresin
Residual
Suma de
cuadrados
974,247
268,303
gl
1
18
Media
cuadrtica
974,247
14,906
F
65,361
Sig.
,000(a)
Total
1242,550
19
a Variables predictoras: (Constante), Peso en Kg
b Variable dependiente: Altura en cm
Coeficientes
estandarizados
Modelo
B
Error tp.
1 (Constante)
40,888
3,266
Peso en Kg
3,350
,414
a Variable dependiente: Altura en cm
Beta
,885
Sig.
Lmite
inferior
12,521
8,085
Lmite
superior
,000
,000
Intervalo de confianza
para B al 95%
B
34,027
2,480
Error tp.
47,749
4,221
Y
71
74
61
10
8
10
5
8
7
4
11
7
7
6
8
5
11
5
9
6
10
68
60
58
70
65
54
83
64
66
61
66
57
81
59
71
62
75
68
74
58
68
64
54
78
64
64
61
68
58
78
58
71
61
74
Ejercicio 5:
Se realiz una encuesta para saber si las preferencias de los consumidores con respecto a seis marcas
del mismo producto est en relacin con el precio del mismo.
Costo del
producto
muy econmico
Econmico
Muy
mala
0
1
Costo medio
15
17
24
22
18
15
Costo alto
26
19
12
21
22
25
101
90
Total
Mala
8
9
Excelente
Total
18
13
88
75
15
80
72
12
75
16
80
124
82
48
470
De acuerdo con los datos muestrales, existe evidencia suficiente para afirmar que los consumidores
tienen la misma opinin acerca de las seis marcas comerciales?Hay relacin entre el precio y la
preferencia?
Archivos: calidad precio producto.xls o calidad precio producto.sav
Por ser dos variables cualitativas ordinales se realiza la prueba
parmetrica de chi (x2) cuadrado y el coeficiente de contingencias
(C):
Ho: Las variables precio y preferencia son independientes.
Ha: Las variables precio y preferencia estn relacionadas.
- Test de Chi Cuadrado: 78.92
- Grados de libertad: 20
- Chi cuadrado de tabla (20 gl; alfa=0,05) = 31.41
Pablo Salgado EMAIL: estadisticacurso@caicyt.gov.ar
11
12