Anda di halaman 1dari 12

Cuestionario 4: Semana 7 y 8

Ejercicio 1:
Marcar la respuesta correcta a cada una de las afirmaciones siguientes, o completar la frase:
1. Con los modelos de ANOVA se pueden comparar ms de dos muestras a la vez. V F
2. Y tambin ms de un factor, con varias muestras a la vez. V F
3. Para poder aplicar los modelos de ANOVA las muestras deben ser: aleatorias, independientes,
normales y de igual varianza.
4. En ANOVA se pueden usar muestras de diferente tamao. V F
5. La distribucin terica del F es una distribucin Chi Cuadrado. V F
6. El coeficiente de correlacin se usa para medir el grado de asociacin de 2 variables. V F
7. La correlacin se usa cuando el investigador busca establecer el grado de asociacin. V F
8. El cuadrado del coeficiente de regresin es el coeficiente de determinacin. V F
9. Para un mismo problema se puede usar Regresin o Correlacin. V F
10. El anlisis de regresin se usa cuando se conoce la relacin terica Y = f (X). V F
11. Para el anlisis de peso y talla se puede usar la regresin. V F
12. El mtodo de los mnimos cuadrados es el usado en regresin. V F
13. Todas las muestras a lo largo de la curva de regresin son homocedsticas. V F
14. La ecuacin de regresin de Y sobre X, es igual a la de X sobre Y. V F
15. El ensayo de hiptesis en regresin se hace con una Tabla de ANOVA. V F

Ejercicio 2:
Se quiere evaluar la eficacia de distintas dosis de un frmaco contra la hipertensin arterial, comparndola
con la de una dieta sin sal. Para ello se seleccionan al azar 25 hipertensos y se distribuyen aleatoriamente
en 5 grupos. Al primero de ellos no se le suministra ningn tratamiento, al segundo una dieta con un
contenido pobre en sal, al tercero una dieta sin sal, al cuarto el frmaco a una dosis determinada y al quinto
el mismo frmaco a otra dosis. Las presiones arteriales sistlicas de los 25 sujetos al finalizar los
tratamientos son:

Grupos
1

180

172

163

158

147

173

158

170

146

152

175

167

158

160

143

182

160

162

171

155

181

175

170

155

160

Pablo Salgado EMAIL: estadisticacurso@caicyt.gov.ar

Descriptivos
Presin sistlica

Control
Poca sal
Sin sal
Frmaco
dosis 1
Frmaco
dosis 2
Total

Intervalo de confianza para


la media al 95%
Lmite
Lmite
inferior
superior
Mnimo
173,28
183,12
173
157,25
175,55
158
158,05
171,15
158

N Media
5 178,20
5 166,40
5 164,60

Desviacin
tpica
3,962
7,369
5,273

Error
tpico
1,772
3,295
2,358

5 158,00

9,028

4,037

146,79

169,21

146

171

5 151,40

6,656

2,977

143,14

159,66

143

160

25 163,72

11,002

2,200

159,18

168,26

143

182

Mximo
182
175
170

Prueba de homogeneidad de varianzas


Presin sistlica
Estadstico
de Levene
,484

gl1

gl2
4

20

Sig.
,748

Hiptesis:
H0: 21 = 22= 23= 24= 25. Las varianzas de las muestras
son iguales.
Ha: 21 22 23 24 25. Las varianzas de las
muestras son distintas.
Dado que la significacin calculada (0.748) es mayor que el
valor de alfa (0.05), se acepta la hiptesis nula que afirma que
existe
una
homogeneidad
entre
las
varianzas
(homocedsticas). Por lo tanto, se puede aplicar la prueba de
Anova.
La tabla de anova es:
Fuente de variacin

GL

SS

MS

Tratamiento

2010,64

502,66

11,24

Error

20

894,4

44,72

Total

24

2905,04

F0,05(4,20) =2,87

Pablo Salgado EMAIL: estadisticacurso@caicyt.gov.ar

Para determinar la influencia de la variable independiente


(tratamientos) sobre la variable dependiente cuantitativa (presin
arterial), se realiza la prueba de Anova.
Dnde las hiptesis planteadas son las siguientes:
H0: 1 = 2 = 3 = 4 = 5. Las medias de las muestras son iguales,
por lo tanto no existe relacin entre tratamiento y presin.
Ha : 1 2 3 4 5. Las medias de las muestras son
distintas, por lo tanto el valor de presin arterial est relacionado
con el tratamiento realizado.
F

0,05

(4,20) = 2.87 < F

calculado

= 11.24

Se rechaza la H0 porque el valor de F calculado (11.24) es mayor que


el F terico (2.87). Por lo tanto se observan diferencias significativas
al 5% entre los grupos. Esto nos indica que los tratamientos no
tienen el mismo efecto sobre las presiones arteriales de los
pacientes estudiados, por lo tanto la presin es una variable
dependiente del tratamiento.
Comparaciones mltiples
Variable dependiente: Presin sistlica
t de Dunnett (bilateral)

(I) Tipo de
Tratamiento
Poca sal
Sin sal
Frmaco dosis 1
Frmaco dosis 2

(J) Tipo de
Tratamiento
Control
Control
Control
Control

Intervalo de confianza al
95%
Lmite
Lmite
superior
inferior
-23,01
-,59
-24,81
-2,39
-31,41
-8,99
-38,01
-15,59

Diferencia de
Error
medias (I-J)
tpico
Sig.
-11,800(*)
4,229 ,037
-13,600(*)
4,229 ,015
-20,200(*)
4,229 ,000
-26,800(*)
4,229 ,000
* La diferencia de medias es significativa al nivel .05.
a Las pruebas t de Dunnett tratan un grupo como control y lo comparan con todos los dems grupos.

Por medio del t de Dunnett, se concluye que lo 4 tratamientos


presentan diferencias con respecto al grupo de control (sin
tratamiento). Se observa que la mayor diferencia de medias con el
tratamiento de control es el tratamiento con el Frmaco 2.
Siendo el frmaco 2 el tratamiento que ms se aleja de la media de
control (-26,800) y por lo tanto, su administracin resulta la ms
efectiva. Seguido de ste se encuentra el tratamiento del frmaco 1
con una diferencia de media igual a -20,200.

Pablo Salgado EMAIL: estadisticacurso@caicyt.gov.ar

Comparaciones mltiples Scheff


Variable dependiente: Presin sistlica
(I) Tipo de
Tratamiento

(J) Tipo de
Tratamiento

Diferencia de
medias (I-J)

Poca sal
11,800
Sin sal
13,600
Control
Frmaco dosis 1
20,200(*)
Frmaco dosis 2
26,800(*)
Control
-11,800
Sin sal
1,800
Poca sal
Frmaco dosis 1
8,400
Frmaco dosis 2
15,000(*)
Control
-13,600
Poca sal
-1,800
Sin sal
Frmaco dosis 1
6,600
Frmaco dosis 2
13,200
Control
-20,200(*)
Poca sal
-8,400
Frmaco dosis 1
Sin sal
-6,600
Frmaco dosis 2
6,600
Control
-26,800(*)
Poca sal
-15,000(*)
Frmaco dosis 2
Sin sal
-13,200
Frmaco dosis 1
-6,600
* La diferencia de medias es significativa al nivel .05.

Error
tpico
4,229
4,229
4,229
4,229
4,229
4,229
4,229
4,229
4,229
4,229
4,229
4,229
4,229
4,229
4,229
4,229
4,229
4,229
4,229
4,229

Sig.
,142
,068
,003
,000
,142
,996
,438
,037
,068
,996
,661
,081
,003
,438
,661
,661
,000
,037
,081
,661

Intervalo de confianza
al 95%
Lmite
Lmite
superior
inferior
-2,52
26,12
-,72
27,92
5,88
34,52
12,48
41,12
-26,12
2,52
-12,52
16,12
-5,92
22,72
,68
29,32
-27,92
,72
-16,12
12,52
-7,72
20,92
-1,12
27,52
-34,52
-5,88
-22,72
5,92
-20,92
7,72
-7,72
20,92
-41,12
-12,48
-29,32
-,68
-27,52
1,12
-20,92
7,72

Presin sistlica
Scheff
Tipo de Tratamiento
Frmaco dosis 2
Frmaco dosis 1
Sin sal
Poca sal
Control
Sig.

N
5
5
5
5
5

Subconjunto para alfa = .05


2
3
1
151,40
158,00
158,00
164,60
164,60
164,60
166,40
166,40
178,20
,081
,438
,068

Qu conclusiones puede llegar?


Archivos: hipertensin.xls o hipertensin.sav
Para un nivel de significacin de 0.05, se acepta la hiptesis nula en
los tres subconjuntos, siendo ms significativa en el subconjunto 3.
Lo que nos indica que en stos tres tratamientos (frmaco dosis 1,
sin sal, poca sal) tienen comportamientos ms similares entre s que
los que conforman los subconjuntos 1 y 2.

Pablo Salgado EMAIL: estadisticacurso@caicyt.gov.ar

Dnde,
H01a: sin sal= poca sal
H01b: poca sal = control
H01c: sin sal = control
H02a : farm 2 = farm 1
H02b : farm 1 = sin sal
H02c : farm 2 = sin sal
H03a: farm 1 = sin sal
H03b: sin sal = poca sal
H03c: farm 1 = poca sal
Ha1a: sin sal poca sal
Ha1b: poca sal control
Ha1c: sin sal control
Ha2a : farm 2 farm 1
Ha2b : farm 1 sin sal
Ha2c : farm 2 sin sal

Ha3a: farm 1 sin sal


Ha3b: sin sal poca sal
Ha3c: farm 1 poca sal

Ejercicio 3:
En un estudio sobre la efectividad de 3 mtodos para dejar de fumar se quiere saber si la reduccin media
en el nmero de cigarrillos semanales difiere de un mtodo a otro. Se disea un experimento con 3 grupos
de 15 fumadores cada uno, que consuman la misma cantidad, y se obtienen las siguientes reducciones en
el nmero de cigarrillos que deja de fumar cada uno.
Los resultados fueron los siguientes:
Archivos: fumar.xls o fumar.sav
Cigarrillo que dejaron de fumar
Mtodo 1
Mtodo 2
Mtodo 3
50
41
49
51
40
47
52
39
45
52
40
47
51
40
46
50
39
48
51
41
45
52
41
47
52
39
44
53
41
45
49
41
48
51
40
49
52
41
46
50
41
48
48
38
47
Pablo Salgado EMAIL: estadisticacurso@caicyt.gov.ar

Los resultados fueron los siguientes:


Descriptivos
Nmero de cigarrillo que dejo de consumir
Intervalo de confianza para la
media al 95%

Mtodo1
Mtodo2

N
15
15

Media
50,93
40,13

Desviacin
tpica
1,335
,990

Error
tpico
,345
,256

Lmite inferior
50,19
39,58

Lmite superior
51,67
40,68

Mnimo
48
38

Mximo
53
41

Mtodo3

15

46,73

1,534

,396

45,88

47,58

44

49

Total

45

45,93

4,673

,697

44,53

47,34

38

53

A partir de analizar las variables, se puede deducir que el


mtodo que ms efectividad muestra es el n1, con una media
(50.93) 5 puntos superior a la media total (45.93). El mtodo 2
es el que muestra menos efectividad en su tratamiento
(40.13), sin embargo es el que presenta menos dispersin en
sus datos. sto indica que todos los pacientes han respondido
al mtodo 2 de forma ms homognea.
Prueba de homogeneidad de varianzas
Nmero de cigarrillo que dejo de consumir
Estadstico de
Levene
1,380

gl1

gl2
2

42

Sig.
,263

Hiptesis:
H0: 21 = 22= 23. Las varianzas de las muestras son iguales.
Ha: 21 22 23. Las varianzas de las muestras son
distintas.
Dado que la significacin calculada (0.263) es mayor que el
valor de alfa (0.05), se acepta la hiptesis nula que afirma que
existe
una
homogeneidad
entre
las
varianzas
(homocedsticas). Por lo tanto, se puede aplicar la prueba de
Anova.
ANOVA
Nmero de cigarrillo que dejo de consumir

Inter-grupos
Intra-grupos
Total

Suma de
cuadrados
889,200
71,600
960,800

gl
2
42

Media
cuadrtica
444,600
1,705

F
260,799

Sig.
,000

44

Pablo Salgado EMAIL: estadisticacurso@caicyt.gov.ar

Para determinar la influencia de la variable independiente (mtodos)


sobre la variable dependiente cuantitativa (cantidad de cigarrillos),
se realiza la prueba de Anova.
Dnde las hiptesis planteadas son las siguientes:
H0: 1 = 2 = 3. Las medias de los mtodos son iguales, por lo
tanto no existe relacin entre tratamiento y la reduccin de
cigarrillo.
Ha: 1 2 3. Las medias de los mtodos son distintas, por lo
tanto la reduccin de cigarrillos est relacionada con el mtodo
aplicado.
F 0.05 (2,42) = 3.232 < Fcalculado = 260.799
Se rechaza la H0 porque el valor de F calculado (260.799) es mayor
que el F terico (3.232). Por lo tanto se observan diferencias
significativas al 5% entre los grupos. Esto nos indica que los
mtodos aplicados no tienen el mismo efecto sobre las personas
fumadoras estudiadas, por lo tanto la reduccin de cigarrillos es una
variable dependiente del mtodo.
Comparaciones mltiples
Variable dependiente: Nmero de cigarrillo que dejo de consumir
Scheff
Intervalo de confianza al
95%
(I) Mtodos
Mtodo 1

(J) Mtodos
Mtodo 2
Mtodo 3

Mtodo 2

Mtodo 1

Diferencia de
medias (I-J)
10,800(*)
4,200(*)

Error tpico
,477
,477

Sig.
,000
,000

-10,800(*)

,477

,000

-12,01

-9,59

,477
,477
,477

,000
,000
,000

-7,81
-5,41
5,39

-5,39
-2,99
7,81

Mtodo 3

-6,600(*)
-4,200(*)
6,600(*)
* La diferencia de medias es significativa al nivel .05.
Mtodo 3

Mtodo 1
Mtodo 2

Lmite
superior

Lmite inferior
9,59
12,01
2,99
5,41

Nmero de cigarrillo que dejo de consumir


Scheff
Subconjunto para alfa = .05
Mtodos
Mtodo 2
Mtodo 3
Mtodo 1

N
15
15

2
40,13

15

46,73
50,93

Sig.

1,000
1,000
1,000
Se muestran las medias para los grupos en los subconjuntos homogneos.
a Usa el tamao muestral de la media armnica = 15,000.

Explique los resultados y a que conclusiones puede llegar.


Pablo Salgado EMAIL: estadisticacurso@caicyt.gov.ar

La diferencia de medias de cada mtodo respecto a los otros dos son


muy significativa al nivel 0,05. La mayor diferencia de medias es
entre el mtodo n 1 y el mtodo n 2 (10,800).
Las significaciones en los tres mtodos son iguales a cero, por lo
tanto no se pueden agrupar en subconjuntos homogneos. Por lo
tanto la comparacin se d interna entre cada mtodo. Con lo que
se obtiene para un nivel de significacin de 0.05 un valor de
significacin igual a 1, acepto hiptesis nula que afirma que hay
semejanza de medias entre los tres subconjuntos.
Dnde,
H0= Las medias de los mtodos son iguales.
Ha= Las medias de los tratamientos son distintas.

Ejercicio 4:
Se quiere saber si hay relacin entre el peso y la talla en nios varones. Para ello se miden las dos
variables y se comparan.
Hay asociacion/correlacin entre las dos variables?
Si la correlacin lineal es alta, calcule la regresin lineal y escriba la funcin que relaciona las dos variables.
Los bases de datos son las siguientes resultados:
Archivos: peso y talla.xls o peso y talla.sav
Los resultados obtenidos son los siguientes:
peso (kg)

talla (cm)
9
10
6
8
10
5
8
7
4

72
76
59
68
60
58
70
65
54

11
7
7
6
8
5
11
5
9
6
10

83
64
66
61
66
57
81
59
71
62
75

Correlaciones
Peso en Kg

Correlacin de Pearson

Pablo Salgado EMAIL: estadisticacurso@caicyt.gov.ar

Peso en Kg
1

Altura en cm
,885(**)

Sig. (bilateral)

,000

N
Altura en cm

Correlacin de Pearson
Sig. (bilateral)

20

20

,885(**)

,000

20

20

** La correlacin es significativa al nivel 0,01 (bilateral).


1Altura en cm = 40,89 + 3,35 * peso
R-cuadrado = 0,78

80,00

70,00

60,00

4,00

6,00

8,00

10,00

Peso en Kg

Hay una fuerte asociacin entre las dos variables. Dado que el valor
r de correlacin de Pearson es igual a 0.885 (prximo a 1). sta
indica que a medida que aumentan los valores de las variables
altura, aumentan los de peso. En la figura de dispersin se indica
grficamente sta relacin.
Estadsticos descriptivos

Altura en cm
Peso en Kg

Media
66,3500
7,6000

Desviacin
tp.
8,08686
2,13739

N
20
20

Resumen del modelo (b)


R cuadrado
R
R cuadrado
corregida
,885 (a)
,784
,772
a Variables predictoras: (Constante), Peso en Kg
b Variable dependiente: Altura en cm
Modelo
1

Error tp. de la
estimacin
3,86079

Durbin-Watson
2,067

El valor del estadstico de Durbin-Watson (igual a 2,067) es prximo


a 2, lo que confirma la incorrelacin de los residuos.
El hecho de que los residuos sean independientes es consecuencia
directa de que las observaciones lo son tambin. Dnde se supone
que los sujetos observados son independientes entre s.
Pablo Salgado EMAIL: estadisticacurso@caicyt.gov.ar

ANOVA (b)

Modelo
1

Regresin
Residual

Suma de
cuadrados
974,247
268,303

gl
1
18

Media
cuadrtica
974,247
14,906

F
65,361

Sig.
,000(a)

Total

1242,550
19
a Variables predictoras: (Constante), Peso en Kg
b Variable dependiente: Altura en cm

Dnde las hiptesis planteadas son las siguientes:


H0: No existe algn tipo de asociacin entre la variable dependiente
(peso) y la dependiente (altura).
Ha: Existe algn tipo de asociacin entre la variable dependiente
(peso) y la dependiente (altura).
F 0.05 (1,18) = 4.414 < Fcalculado = 65.361
Se rechaza la H0, dado que la variabilidad observada en la variable
respuesta no es producto del azar. El valor de F calculado (65.361)
es mayor que el F terico (4.414). Por lo tanto se observan
diferencias significativas al 5% entre los grupos. Esto nos indica que
la altura es una variable dependiente del peso.
Coeficientes (a)
Coeficientes no
estandarizados

Coeficientes
estandarizados

Modelo
B
Error tp.
1 (Constante)
40,888
3,266
Peso en Kg
3,350
,414
a Variable dependiente: Altura en cm

Beta
,885

Sig.

Lmite
inferior
12,521
8,085

Lmite
superior
,000
,000

Intervalo de confianza
para B al 95%
B
34,027
2,480

Error tp.
47,749
4,221

Funcin de regresin lineal que relaciona las dos variables:


Y=1 X + 0 + e
Talla i =3.35* peso i + 40.888 + e
i=1,2,20

peso (kg) talla (cm)


9
72
10
76
6
59
Pablo Salgado EMAIL: estadisticacurso@caicyt.gov.ar

Y
71
74
61

10

8
10
5
8
7
4
11
7
7
6
8
5
11
5
9
6
10

68
60
58
70
65
54
83
64
66
61
66
57
81
59
71
62
75

68
74
58
68
64
54
78
64
64
61
68
58
78
58
71
61
74

ver ejercicios 4_cuestionario 4.xlsx.

Ejercicio 5:
Se realiz una encuesta para saber si las preferencias de los consumidores con respecto a seis marcas
del mismo producto est en relacin con el precio del mismo.

Costo del
producto

Opinin sobre el producto


Muy
Indiferente Buena
buena
6
30
26
8
27
17

muy econmico
Econmico

Muy
mala
0
1

Costo medio

15

17

24

Costo medio alto

22

18

15

Costo alto

26

19

Costo muy alto

12

21

22

25

101

90

Total

Mala
8
9

Excelente

Total

18
13

88
75

15

80

72

12

75

16

80

124

82

48

470

De acuerdo con los datos muestrales, existe evidencia suficiente para afirmar que los consumidores
tienen la misma opinin acerca de las seis marcas comerciales?Hay relacin entre el precio y la
preferencia?
Archivos: calidad precio producto.xls o calidad precio producto.sav
Por ser dos variables cualitativas ordinales se realiza la prueba
parmetrica de chi (x2) cuadrado y el coeficiente de contingencias
(C):
Ho: Las variables precio y preferencia son independientes.
Ha: Las variables precio y preferencia estn relacionadas.
- Test de Chi Cuadrado: 78.92
- Grados de libertad: 20
- Chi cuadrado de tabla (20 gl; alfa=0,05) = 31.41
Pablo Salgado EMAIL: estadisticacurso@caicyt.gov.ar

11

El valor calculado x2=78.92 es mayor que el valor crtico de la tabla


(31.41) para un Nivel de Confianza de 95% y 20 grados de libertad.
El valor de probabilidad (p=0.00) es menor al valor de =0.05.
Por lo que rechazo Ho y acepto Ha que afirma que existe relacin
entre precio y preferencia de los seis producto estudiados.
Mediante los coeficientes de asociacin para dos variables en escala
nominal se calcula:
- Coeficiente de Contingencia (C)= 0.379
Existe una muy dbil dependencia entre variables debido a que el
coeficiente (=0.379) est muy alejado del valor 1. ver ejercicios
5_cuestionario 4.xlsx.

Pablo Salgado EMAIL: estadisticacurso@caicyt.gov.ar

12

Anda mungkin juga menyukai