Anda di halaman 1dari 64

Fundamentos de Biologa Aplicada I

Cuaderno de Prcticas de Estadstica con SPSS


Curso 2010-2011

Departamento de Estadstica e I.O. Universidad de Granada

Autores:

Ana Mara Lara Porras Javier Esquivel Snchez Nuria Rico Castro M Dolores Huete Ruiz Ismael R. Snchez Borrego Ismael R. Snchez Borrego Diego Torrecillas de Amo Silvia Valenzuela Ruiz

Profesores de la asignatura:

ndice
pg. CONTRASTES DE HIPTESIS PARAMTRICOS Y NO PARAMTRICOS
Ejercicio 1 Ejercicio 2 Ejercicio 3 Ejercicio 4 Ejercicio 5 3 5 6 7 9

ANLISIS DE REGRESIN
Ejercicio 1 Ejercicio 2 Ejercicio 3 Ejercicio 4 Ejercicio 5 10 14 17 19 22

10

DISEO DE EXPERIMENTOS
Ejercicio 1 Ejercicio 2 Ejercicio 3 Ejercicio 4 Ejercicio 5 Ejercicio 6 25 27 28 29 31 33

25

ANLISIS DE LA COVARIANZA
Ejercicio 1 Ejercicio 2 Ejercicio 3 Ejercicio 4 35 37 39 41

35

ANLISIS CLUSTER
Ejercicio 1 Ejercicio 2 Ejercicio 1 Ejercicio 2 Ejercicio 3 43 50

43 54

ANLISIS DE DATOS CUALITATIVOS


54 57 60

Bibliografa

62

FBA I Cuaderno de Prcticas de Estadstica con SPSS

CONTRASTES DE HIPTESIS PARAMTRICOS Y NO PARAMTRICOS


Ejercicio 1:
En un estudio sobre angina de pecho en ratas se dividi aleatoriamente a 18 animales afectados en dos grupos de 9 individuos cada uno. A un grupo se le suministr un placebo y al otro un frmaco experimental FL113. Despus de un ejercicio controlado sobre una cinta sin fin se determin el tiempo de recuperacin de cada rata. Se piensa que el FL113 reducir el tiempo medio de recuperacin. Se dispone de la siguiente informacin: Placebo 203 229 215 220 223 233 208 228 209 FL113 221 207 185 203 187 190 195 204 212 Suponiendo que las distribuciones del tiempo necesario para la recuperacin son normales, comparar las muestras dadas para saber si se puede admitir que ambas muestras provienen de la misma poblacin. Efectuar los correspondientes contrastes (sobre medias y varianzas) al nivel de significacin = 0.05.

X: tiempo de recuperacin de las ratas tratadas con placebo N(1, 1) Y: tiempo de recuperacin de las ratas tratadas con FL113 N(2, 2) Primer contraste Segundo contraste H0: 1= 2 H1: 1 2 H0: 12= 22 H1: 12 22

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

Estadsticos de grupo Error tp. de la media 3,508 4,042

Tiempo de recuperacin

Grupo placebo o FL113 Grupo placebo Grupo FL113

N 9 9

Media 218,67 200,44

Desviacin tp. 10,524 12,126

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

Ejercicio 2:
Se ha realizado un estudio para investigar el efecto del ejercicio fsico en el nivel de colesterol en plasma, en el que participaron 11 sujetos. Antes del ejercicio, se tomaron muestras de sangre para determinar el nivel del colesterol de cada participante. Despus, los individuos fueron sometidos a un programa de ejercicios que se centraba en carreras y marchas diarias. Al final del periodo de ejercicios, se tomaron nuevamente muestras de sangre y se obtuvo una segunda lectura del nivel de colesterol en plasma de los sujetos. Se quiere estimar la diferencia entre el nivel medio de colesterol antes y despus del ejercicio. Se recogieron los siguientes datos Nivel previo mg/dl 182 232 191 200 148 249 276 213 241 480 262 Nivel posterior mg/dl 198 210 194 220 138 220 219 161 210 313 226

Decidir si existen diferencias significativas entre estos niveles antes y despus del ejercicio fsico.

Prueba de muestras relacionadas Diferencias relacionadas 95% Intervalo de confianza para la diferencia DesviacinError tp. de Media la media Inferior Superior tp. Par 1 Colesterol antes d ejercicio - Coleste 33,18 despues del ejerc 51,066 15,397 -1,12 67,49

t 2,155

gl 10

Sig. (bilateral) ,057

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

Ejercicio 3:
En unos laboratorios clnicos se toman muestras de 650 anlisis de sangre y se anota el nmero de eritrocitos por milmetro cbico de sangre. Se puede admitir que el nmero de eritrocitos se distribuye normalmente? Los resultados agrupados en 7 clases son los que figuran en la tabla adjunta N de eritrocitos en millones 0-2,5 2.5-3.5 3.5-4.5 4.5-5.5 5.5-6.5 6.5-7.5 7.5-8.5 N de muestras 8 52 140 210 160 70 10

Prueba de Kolmogorov-Smirnov para una muestra Eritrocitos N Media Parmetros normales(a,b) Diferencias ms extremas Desviacin tpica Absoluta Positiva Negativa Z de Kolmogorov-Smirnov Sig. asintt. (bilateral) a La distribucin de contraste es la Normal. b Se han calculado a partir de los datos. 650 5,0862 1,23238 ,164 ,159 -,164 4,192 ,000

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

Ejercicio 4:
Se realiza una investigacin para determinar si el hecho de contraer hepatitis es independiente de haber sido vacunado contra la enfermedad. Para ello se utilizan 1083 voluntarios varones. De ellos, se eligen aleatoriamente 549 y son vacunados con un nuevo frmaco. Los restantes, 534, no son vacunados. Despus de un cierto tiempo, se observ que 70 de los 534 voluntarios no vacunados contrajeron la hepatitis, mientras que solamente 11 de los 549 vacunados no la contrajeron. Los datos se muestran en la tabla adjunta Vacunacin Hepatitis SI NO SI 11 538 NO 70 464

Contrastar la independencia entre la vacunacin y la enfermedad con =0.05.

Tabla de contingencia HEPATITI * VACUNACI Recuento VACUNACI no HEPATITI Total no si 464 70 534 si 538 11 549 1002 81 1083 Total

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS


Pruebas de chi-cuadrado Sig. asinttica (bilateral) ,000 ,000 ,000 ,000 48,197 1 ,000 Sig. exacta (bilateral) Sig. exacta (unilateral)

Chi-cuadrado de Pearson Correccin por continuidad(a) Razn de verosimilitud Estadstico exacto de Fisher Asociacin lineal por lineal N de casos vlidos

Valor 48,242(b) 46,650 53,194

gl 1 1 1

,000

1083 a Calculado slo para una tabla de 2x2. b 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 39,94.

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

Ejercicio 5:
Se realiza un estudio para investigar la asociacin entre el color de las flores y la fragancia de las azaleas silvestres. Se observan 200 plantas floridas seleccionadas aleatoriamente. Cada una de ellas se clasifica segn el color y la presencia o ausencia de fragancia. Los datos se muestran en la tabla adjunta Color Rosa 60 10

Fragancia SI NO

Blanca 12 50

Naranja 58 10

Pruebas de chi-cuadrado Sig. asinttica (bilateral) ,000 ,000 ,000

Chi-cuadrado de Pearson Razn de verosimilitud Asociacin lineal por lineal N de casos vlidos

Valor 82,293(a) 83,848 59,712 200

gl 2 2 1

a 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 21,70.

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

10

ANLISIS DE REGRESIN Ejercicio 1:


Se realiza un estudio para establecer una ecuacin mediante la cual se pueda utilizar la longitud en cm. de una cierta variedad de planta al cabo de un ao de vida para predecir la longitud de esa variedad de planta en edad adulta:

Longitud en cm. el primer ao 15.3 14.8 12.6 18.4 17.9 15.6 18.4 14.1 20.2 21.7 20.4 16.5 15.9 17.9 16.7 Se pide: a) b) c) d)

Longitud en cm. en edad adulta 30.7 32.5 26.3 35.9 34.3 28.5 37.4 29.7 38.8 40.4 40.9 33.3 30.1 35.7 31.4

Representar el diagrama de dispersin Estimar los parmetros del modelo Coeficientes de correlacin lineal y de determinacin. Interpretacin Plantear y contrastar el test para conocer la significacin de la variable independiente a un nivel de significacin del 5 %

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

11

a) Diagrama de dispersin

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS


42 40 38 36 34 32 30 28 26 12 14 16 18 20 22

12

LONG_ADU

LONG_1

b) Estimacin de los parmetros del modelo

Coeficientesa Coeficientes estandarizad os Beta ,947

Modelo 1

(Constante) LONG_1

Coeficientes no estandarizados B Error tp. 5,296 2,694 1,663 ,156

t 1,965 10,657

Sig. ,071 ,000

a. Variable dependiente: LONG_ADU

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

13

c) Coeficientes de correlacin lineal y de determinacin. Interpretacin


Resumen del modelo R cuadrado corregida ,889 Error tp. de la estimacin 1,4666

Modelo 1

R ,947a

R cuadrado ,897

a. Variables predictoras: (Constante), LONG_1

d) Test de significacin de la variable independiente.


ANOVAb Suma de cuadrados 244,306 27,963 272,269 Media cuadrtica 244,306 2,151

Modelo 1

gl 1 13 14

Regresin Residual Total

F 113,577

Sig. ,000a

a. Variables predictoras: (Constante), LONG_1 b. Variable dependiente: LONG_ADU

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

14

Ejercicio 2:
Se realiza un estudio para establecer una ecuacin mediante la cual se pueda utilizar la concentracin de estrona en la saliva para predecir la concentracin de dicho esteroide en plasma libre. Se tomaron los siguientes datos de 13 varones sanos:

Concentracin de estrona en saliva pg./mL. 7.4 7.5 8.5 9 9 11 13 14 14.5 16 17 18 20 Se pide:

Concentracin de estrona en plasma libre en pg./mL. 30 25 31.5 27.5 39.5 38 43 49 55 48.5 51 64.5 63

a) Representar el diagrama de dispersin b) Plantear el modelo de regresin y estimar los parmetros del modelo. Interprtalos c) Obtener el coeficiente de correlacin lineal de Pearson y el coeficiente de determinacin d) Obtener un intervalo de confianza al 95 % para la pendiente de la recta de regresin e) Contrastar la significacin del coeficiente de regresin a) Diagrama de dispersin
70,0

60,0

50,0

estrona
40,0 30,0 20,0 7,5 10,0 12,5 15,0 17,5 20,0

saliva

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

15

b) Planteamiento del modelo, estimacin de los parmetros y su interpretacin


Coeficientesa Coeficientes no estandarizados B Error tp. 6,887 3,965 2,886 ,297 Coeficientes estandarizad os Beta ,946

Modelo 1

(Constante) saliva

t 1,737 9,705

Sig. ,110 ,000

a. Variable dependiente: plasma

c) Coeficiente de correlacin lineal de Pearson y coeficiente de determinacin

Resumen del modelo Modelo 1 R R cuadrado ,946a ,895 R cuadrado corregida ,886 Error tp. de la estimacin 4,3997

a. Variables predictoras: (Constante), saliva

d) Obtener un intervalo de confianza al 95 % para la pendiente de la recta de regresin

Coeficientesa Coeficientes no estandarizados Modelo 1 B 6,887 2,886 Error tp. 3,965 ,297 Coeficientes estandarizad os Beta ,946 t 1,737 9,705 Sig. ,110 ,000 Intervalo de confianza para B al 95% Lmite Lmite inferior superior -1,841 15,614 2,232 3,541

(Constante) saliva

a. Variable dependiente: plasma

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

16

e) Contrastar la significacin del coeficiente de regresin

ANOVAb Modelo 1 Suma de cuadrados 1823,070 212,930 2036,000 gl 1 11 12 Media cuadrtica 1823,070 19,357 F 94,180 Sig. ,000a

Regresin Residual Total

a. Variables predictoras: (Constante), saliva b. Variable dependiente: plasma

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

17

Ejercicio 3:
Un aficionado a las apuestas en las carreras de caballos desea estudiar la descendencia de una conocida raza de caballos que tiene mucho xito en dichas carreras. Para ello estudia la relacin existente entre el peso en gramos de embriones de caballos y el nmero de das transcurridos de vida de los mismos. Los datos aparecen en la siguiente tabla: Das Peso 7 51.3 8 79.1 9 127.4 10 183.5 11 271.3 12 431.5 13 743.7 14 1143.2 15 1893.8 16 3102.4 17 4702.7 Se pide: a) Representar la nube de puntos b) Plantear el modelo de regresin y obtener la ecuacin del modelo ajustado c) Bondad del ajuste

a) Representar la nube de puntos


5000 4000

3000

2000

1000

PESO

-1000 6 8 10 12 14 16 18

DIAS

b) Plantear el modelo de regresin y obtener la ecuacin del modelo ajustado.

MODEL: MOD_1.

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

18

Lineal
ANOVA Suma de cuadrados 16841317 5932167,3 22773485 gl 1 9 10 Media cuadrtica 16841317 659129,695 F 25,551 Sig. ,001

Regresin Residual Total

La variable independiente esdas.

Resumen del modelo R ,860 R cuadrado ,740 R cuadrado corregida ,711 Error tpico de la estimacin 811,868

La variable independiente esdas.

Exponencial
ANOVA Suma de cuadrados 22,756 ,032 22,789 gl 1 9 10 Media cuadrtica 22,756 ,004 F 6384,193 Sig. ,000

Regresin Residual Total

La variable independiente esdas.

Resumen del modelo R ,999 R cuadrado ,999 R cuadrado corregida ,998 Error tpico de la estimacin ,060

La variable independiente esdas.

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

19

Ejercicio 4:
Una empresa fabricante de cereales para el desayuno desea conocer la ecuacin que permita predecir las ventas (en miles de euros) en funcin de los gastos en publicidad infantil en televisin (en miles de euros), el tiempo diario de aparicin en televisin (en minutos) y los gastos en publicidad en los peridicos (en miles de euros). Se realiza un estudio en el que se renen los datos mensuales correspondientes a los ltimos 20 meses. Estos datos aparecen en la siguiente tabla:

Ventas 10 12 11 13 12 14 16 12 14 11 10 19 8.5 8 9 13 16 18 20 22 Se pide:

Pub. en tv. 1 1.2 1.3 1.4 1.5 1.7 1.75 1.3 1.45 0.9 0.8 0.9 0.8 1 1.7 1.8 1.85 1.9 2 2

Tiempo en tv. 50 57 56 55 60 65 69 67 68 67 97 66 65 60 70 110 75 80 85 90

Pub. en per. 0.4 0.4 0.42 0.5 0.4 0.44 0.4 0.44 0.46 0.46 0.45 1.1 0.3 0.5 0.45 0.4 0.8 0.9 0.9 1.1

a) Ajustar un modelo de regresin lineal mltiple. Obtener una estimacin de los parmetros del modelo y su interpretacin b) Obtener e interpretar el valor de la suma de cuadrados residual c) Contrastar la significacin del modelo propuesto

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

20

a) Ajustar un modelo de regresin lineal mltiple. Obtener una estimacin de los parmetros del modelo y su interpretacin

Coeficientesa Coeficientes estandarizad os Beta ,358 ,006 ,711

Modelo 1

(Constante) PUBL_TV TIEMP_TV PUBL_PER

Coeficientes no estandarizados B Error tp. 2,108 2,055 3,432 1,121 1,477E-03 ,030 11,347 1,802

t 1,026 3,060 ,050 6,298

Sig. ,320 ,007 ,961 ,000

a. Variable dependiente: VENTAS

b) Obtener e interpretar el valor de la suma de cuadrados residual


ANOVAb Suma de cuadrados 247,677 49,960 297,638 Media cuadrtica 82,559 3,123

Modelo 1

gl 3 16 19

Regresin Residual Total

F 26,440

Sig. ,000a

a. Variables predictoras: (Constante), PUBL_PER, TIEMP_TV, PUBL_TV b. Variable dependiente: VENTAS

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS c) Contrastar la significacin del modelo propuesto
ANOVAb Suma de cuadrados 247,677 49,960 297,638 Media cuadrtica 82,559 3,123

21

Modelo 1

gl 3 16 19

Regresin Residual Total

F 26,440

Sig. ,000a

a. Variables predictoras: (Constante), PUBL_PER, TIEMP_TV, PUBL_TV b. Variable dependiente: VENTAS

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

22

Ejercicio 5:
Se desea estudiar la relacin entre la intensidad de regado (medida en litros por metro cuadrado) y la productividad (medida en Kg/Ha) de una huerta de tomates. Se han obtenido los siguientes datos:

Productividad de un cultivo 2500.9 2000.8 3300.4 2500.6 1995.8 3312.3 3409 Se pide:

Intensidad de regado 590.5 540.4 690 605.2 650 724 704.8

a) Podemos afirmar la existencia de relacin lineal entre las variables? b) Coeficiente de correlacin y coeficiente de determinacin. Interpretacin Adems del regado se cree que el empleo de un abono ha influido de forma lineal en la productividad del cultivo. Por tanto se introduce en el modelo de regresin la variable que mide el nmero de Kg. de abono por hectrea. Abono 200.6 160.6 407.6 212.7 145 387.8 355

c) Ajustar un modelo de regresin lineal mltiple d) Interpretacin de los coeficientes del modelo de regresin. Qu variable tiene mayor influencia en la variacin de la productividad? e) Valor de la suma de cuadrados de la regresin. Interpretacin f) Contrastar la significacin del modelo propuesto g) Coeficiente de determinacin mltiple y coeficiente de determinacin mltiple corregido. Interpretacin h) Ha sido til la adicin de la variable abono?

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS a) Muestran los datos una relacin lineal?
3600 3400 3200 3000 2800 2600 2400

23

PRODUCT

2200 2000 1800 500 600 700 800

REGADIO

ANOVAb Suma de cuadrados 1557184,3 743017,305 2300201,6 Media cuadrtica 1557184,3 148603,461

Modelo 1

gl 1 5 6

Regresin Residual Total

F 10,479

Sig. ,023a

a. Variables predictoras: (Constante), REGADIO b. Variable dependiente: PRODUCT

b) Coeficiente de correlacin lineal y coeficiente de determinacin. Interpretacin


Correlaciones PRODUCT 1,000 ,823 , ,012 7 7 REGADIO ,823 1,000 ,012 , 7 7

Correlacin de Pearson Sig. (unilateral) N

PRODUCT REGADIO PRODUCT REGADIO PRODUCT REGADIO

Resumen del modelo R cuadrado corregida ,612 Error tp. de la estimacin 385,491

Modelo 1

R R cuadrado ,823a ,677

a. Variables predictoras: (Constante), REGADIO

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS c) Ajustar un modelo de regresin lineal mltiple
Coeficientesa Coeficient es estandari zados Beta ,073 ,911

24

Modelo 1

(Constante) REGADIO ABONO

Coeficientes no estandarizados B Error tp. 942,755 988,031 ,674 1,897 5,021 1,141

t ,954 ,355 4,402

Sig. ,394 ,740 ,012

a. Variable dependiente: PRODUCT

e) Valor de la suma de cuadrados de la regresin. Interpretacin


ANOVAb Suma de cuadrados 2173045,5 127156,069 2300201,6 Media cuadrtica 1086522,8 31789,017

Modelo 1

gl 2 4 6

Regresin Residual Total

F 34,179

Sig. ,003a

a. Variables predictoras: (Constante), ABONO, REGADIO b. Variable dependiente: PRODUCT

g) Coeficiente de determinacin mltiple y coeficiente de determinacin mltiple corregido


Resumen del modelo R cuadrado corregida ,917 Error tp. de la estimacin 178,295

Modelo 1

R R cuadrado ,972a ,945

a. Variables predictoras: (Constante), ABONO, REGADIO

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

25

DISEO DE EXPERIMENTOS
Ejercicio 1:
Se sabe que el dixido de carbono tiene un efecto crtico en el crecimiento microbiolgico. Cantidades pequeas de CO2 estimulan el crecimiento de muchos microorganismos, mientras que altas concentraciones inhiben el crecimiento de la mayor parte de ellos. Este ltimo efecto se utiliza comercialmente cuando se almacenan productos alimenticios perecederos. Se realiz un estudio para investigar el efecto del CO2 sobre la tasa de crecimiento de Pseudomonas fragi, un corruptor de alimentos. Se administr dixido de carbono a cinco presiones atmosfricas diferentes. La respuesta anotada fue el cambio porcentual en la masa celular despus de un tiempo de crecimiento de una hora. Se utilizaron diez cultivos en cada nivel. Se obtuvieron los siguientes datos:

Nivel del factor (presin de CO2 en atmsferas) 0.0 0.083 0.29 0.5 0.86 62.6 50.9 45.5 29.5 24.9 59.6 44.3 41.1 22.8 17.2 64.5 47.5 29.8 19.2 7.8 59.3 49.5 38.3 20.6 10.5 58.6 48.5 40.2 29.2 17.8 64.6 50.4 38.5 24.1 22.1 50.9 35.2 30.2 22.6 22.6 56.2 49.9 27 32.7 16.8 52.3 42.6 40 24.4 15.9 62.8 41.6 33.9 19.6 8.8 a) Se suponen efectos fijos: qu implica esto respecto de los niveles atmosfricos elegidos? b) Plantear la hiptesis nula a contrastar c) Evaluar el estadstico F utilizado para contrastar H0 d) Puede rechazarse H0? Explicarlo basndose en el p-valor del contraste

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

26

ANOVA CRECIMIE Suma de cuadrados 11274,319 1248,038 12522,357 gl 4 45 49 Media cuadrtica 2818,580 27,734 F 101,628 Sig. ,000

Inter-grupos Intra-grupos Total

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

27

Ejercicio 2:
Una compaa textil utiliza diversos telares para la produccin de telas. Aunque se desea que los telares sean homogneos con el objeto de producir tela de resistencia uniforme se supone que puede existir una variacin significativa en la resistencia de la tela debida a la utilizacin de distintos telares. A su disposicin tiene 5 tipos de telares con los que realiza determinaciones de la resistencia de la tela. Este experimento se realiza en orden aleatorio y los resultados se muestran en la tabla adjunta. Analizar los datos y obtener las conclusiones apropiadas. Telares 1 2 3 4 5 51 56 48 47 43 49 60 50 48 43 Resistencia 50 49 56 56 53 44 49 44 46 47 51 57 45 45 50

46

a) Plantear la hiptesis nula a contrastar b) Puede rechazarse H 0 ? Explicarlo basndose en el p-valor del contraste c) Comprobar la hiptesis de homocedasticidad

ANOVA RESIST Suma de cuadrados 439,885 98,000 537,885 gl 4 21 25 Media cuadrtica 109,971 4,667 F 23,565 Sig. ,000

Inter-grupos Intra-grupos Total

Prueba de homogeneidad de varianzas RESIST Estadstico de Levene 2,367 gl1 4 gl2 21 Sig. ,086

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

28

Ejercicio 3:
En una determinada fbrica de galletas se desea saber si las harinas de sus cuatro proveedores producen la misma viscosidad en la masa. Para ello, produce durante un da 16 masas, 4 de cada tipo de harina y mide su viscosidad. Los resultados obtenidos se muestran en la siguiente tabla:

Proveedor A 98 91 96 95

Proveedor B 97 90 95 96

Proveedor C 99 93 97 99

Proveedor D 96 92 95 98

a) Plantear la hiptesis nula a contrastar b) Puede rechazarse H 0 ? Explicarlo basndose en el p-valor del contraste c) Comprobar la hiptesis de normalidad

ANOVA VISCOSID Suma de cuadrados 14,188 97,750 111,938 gl 3 12 15 Media cuadrtica 4,729 8,146 F ,581 Sig. ,639

Inter-grupos Intra-grupos Total

Normal grfico Q-Q de Residuo para VIS


6

Valor Normal esperado

-2

-4

-6 -6 -4 -2 0 2 4 6

Valor observado

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

29

Ejercicio 4:
Los cientficos comprometidos en el tratamiento del agua residual de arenas asflticas estudiaron tres mtodos de tratamientos para la eliminacin del carbono orgnico (basado en W.R. Pirie, Statistical Planning and Analysis for Treatments of Tar Sand Waste-water, Centro de Informacin Tcnica, Oficina de Informacin Tecnolgica y Cientfica, Departamento de Energa de Estados Unidos). Los tres mtodos de tratamiento utilizados fueron: flotacin de aire (FA), separacin de espuma (SF) y coagulacin ferroclrica (CFC). Las mediciones del material de carbono orgnico para los tres tratamientos arrojaron los siguientes datos: FA 34.6 35.1 35.6 35.8 36.1 36.5 36.8 37.2 37.4 37.7 SE 38.8 39.0 40.1 40.9 41.0 43.2 44.9 46.9 51.6 53.6 CFC 26.7 26.7 27.0 27.1 27.5 28.1 28.1 28.7 30.7 31.2

a) Contrastar H 0 : 1 = 2 = 3 al nivel =0.10 b) Si se rechaza H 0 utilizar los contrastes de Tukey para precisar qu mtodos difieren estadsticamente entre s

ANOVA CARBONO Suma de cuadrados 1251,603 278,172 1529,775 gl 2 27 29 Media cuadrtica 625,801 10,303 F 60,742 Sig. ,000

Inter-grupos Intra-grupos Total

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

30

Comparaciones mltiples Variable dependiente: carbono HSD de Tukey Intervalo de confianza al 90% Lmite superior Lmite inferior -10,7960 -4,6440 5,0240 11,1760 4,6440 10,7960 12,7440 18,8960 -11,1760 -5,0240 -18,8960 -12,7440

(I) metodo 1 2 3

(J) metodo 2 3 1 3 1 2

Diferencia de medias (I-J) Error tpico -7,72000* 1,43546 8,10000* 1,43546 7,72000* 1,43546 15,82000* 1,43546 -8,10000* 1,43546 -15,82000* 1,43546

Sig. ,000 ,000 ,000 ,000 ,000 ,000

*. La diferencia entre las medias es significativa al nivel .1.

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

31

Ejercicio 5:
Se ha realizado un estudio sobre el efecto de las temporadas de caza del ciervo en los hbitos de stos. Se seleccionan cuatro sendas que se sabe utilizan los ciervos. Antes de comenzar la temporada de caza, durante la temporada y al terminar la temporada se determin el promedio de huellas halladas por semana en un rea especfica de cada senda. Las sendas se trataron como bloques y se obtuvieron los siguientes datos:

Senda 1 2 3 4

Antes 62.5 46.5 45 24

Durante 57 53.3 59.3 35.7

Despus 49 50 37 50

a) Contrastar la hiptesis nula de igualdad de medias en los tratamientos al nivel =0.05 b) Contrastar la hiptesis nula de igualdad de medias en los bloques al nivel =0.05

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

32

Pruebas de los efectos inter-sujetos Variable dependiente: HUELLAS Suma de cuadrados tipo III 700,631a 27008,541 98,482 602,149 611,198 28320,370 1311,829 Media cuadrtica 140,126 27008,541 49,241 200,716 101,866

Fuente Modelo corregido Interseccin TEMPORAD SENDA Error Total Total corregida

gl 5 1 2 3 6 12 11

F 1,376 265,137 ,483 1,970

Significacin ,351 ,000 ,639 ,220

a. R cuadrado = ,534 (R cuadrado corregida = ,146)

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

33

Ejercicio 6:
Una industria desea comprobar el efecto que tienen cinco productos qumicos sobre la resistencia de un tipo particular de fibra. Como tambin puede influir la mquina empleada en la fabricacin, decide utilizar un diseo en bloques aleatorizados, considerando las distintas mquinas como bloques. La industria dispone de cuatro mquinas a las que asigna los cinco productos qumicos en orden aleatorio. Los resultados obtenidos se muestran en la tabla adjunta.

Producto qumico 1 2 3 4 5

A 87 85 90 89 99

Tipos de mquinas B C 86 88 87 95 92 95 97 98 96 91

D 83 85 90 88 90

a) Contrastar la hiptesis nula de igualdad de medias en los tratamientos al nivel =0.05 b) Contrastar la hiptesis nula de igualdad de medias en los bloques al nivel =0.05 c) Si se rechaza H 0 en los apartados a) o b), utilizar los contrastes LSD y Tukey, respectivamente, para precisar qu medias difieren estadsticamente entre s

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

34

Comparaciones mltiples Variable dependiente: RESIST DMS Intervalo de confianza al 95%. Lmite Lmite inferior superior -7,09 3,09 -10,84 -,66 -12,09 -1,91 -13,09 -2,91 -3,09 7,09 -8,84 1,34 -10,09 ,09 -11,09 -,91 ,66 10,84 -1,34 8,84 -6,34 3,84 -7,34 2,84 1,91 12,09 -,09 10,09 -3,84 6,34 -6,09 4,09 2,91 13,09 ,91 11,09 -2,84 7,34 -4,09 6,09

(I) PRODUCT 1

(J) PRODUCT 2 3 4 5 1 3 4 5 1 2 4 5 1 2 3 5 1 2 3 4

Diferencia entre medias (I-J) -2,00 -5,75* -7,00* -8,00* 2,00 -3,75 -5,00 -6,00* 5,75* 3,75 -1,25 -2,25 7,00* 5,00 1,25 -1,00 8,00* 6,00* 2,25 1,00

Error tp. 2,336 2,336 2,336 2,336 2,336 2,336 2,336 2,336 2,336 2,336 2,336 2,336 2,336 2,336 2,336 2,336 2,336 2,336 2,336 2,336

Significacin ,409 ,030 ,011 ,005 ,409 ,134 ,054 ,025 ,030 ,134 ,602 ,355 ,011 ,054 ,602 ,676 ,005 ,025 ,355 ,676

Basado en las medias observadas. *. La diferencia de medias es significativa al nivel ,05. *. Se ha detectado el smbolo ,05 donde se esperaba un parntesis de cierre en el subcomando TEST.

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

35

ANLISIS DE LA COVARIANZA
Ejercicio 1:
Un distribuidor de bebidas est estudiando la efectividad de los mtodos de descarga, para lo cual se mide el tiempo de descarga de unas cajas en minutos. Las bebidas se distribuyen en tres tipos distintos de furgonetas (atendiendo a su diferente capacidad de carga y antigedad). Se conoce que el tiempo de descarga guarda una estrecha relacin con el volumen de cajas descargadas. Se obtuvieron los siguientes datos:

1 y 12 19 15 21 11 19 x 20 23 22 30 15 22

Furgoneta 2 y x 70 64 64 62 55 47 77 66 66 50 44 42

3 y 31 28 25 22 29 28 x 27 25 22 26 28 29

a) Planteamiento del modelo b) Contrastar los efectos del factor y de la covariable sobre la variable respuesta c) Indicar el porcentaje de variabilidad explicada por el modelo propuesto SOLUCIN: b) Contrastar los efectos del factor y de la covariable sobre la variable respuesta

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

36

Pruebas de los efectos inter-sujetos Variable dependiente: TIEMPO Suma de cuadrados tipo III 7679,373a 3,758 174,246 592,373 222,627 30374,000 7902,000 Media cuadrtica 2559,791 3,758 87,123 592,373 15,902

Fuente Modelo corregido Interseccin FURGONET VOLUMEN Error Total Total corregida

gl 3 1 2 1 14 18 17

F 160,974 ,236 5,479 37,252

Significacin ,000 ,634 ,017 ,000027

a. R cuadrado = ,972 (R cuadrado corregida = ,966)

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

37

Ejercicio 2:
Se quiere analizar el efecto que tienen tres tipos distintos de terreno en el rendimiento de una determinada plantacin de almendros. Se sospecha que el rendimiento del cultivo (medido en kg.) est relacionado con la cantidad de kg. de abono recibidos. Los datos observados se muestran en la tabla adjunta:

A Y 130,5 144,6 133,9 128,4 119,2 133,8 122,8 119,4 122,7 130,8 Se pide x 20,3 44,9 33,8 20,8 18,2 32,8 33,9 18,3 22,7 29,7

Terreno B y 110,3 100,8 109,6 122,7 97,4 x 15,9 22 16,9 20,2 16,9 y 155,9 149,1 188,9 199,4 185,7

C x 44,9 42,33 58,9 70,8 61,9

a) Indicar el valor de la suma de cuadrados entre tratamientos ajustada. Interpretacin b) Contrastar los efectos del factor y de la covariable sobre la variable respuesta

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

38

Pruebas de los efectos inter-sujetos Variable dependiente: PRODUCC Suma de cuadrados tipo III 14135,521a 10205,154 404,959 1804,347 1080,639 381321,724 15216,159 Media cuadrtica 4711,840 10205,154 202,479 1804,347 67,540

Fuente Modelo corregido Interseccin TERRENO ABONO Error Total Total corregida

gl 3 1 2 1 16 20 19

F 69,764 151,098 2,998 26,715

Significacin ,000 ,000 ,078 ,000

a. R cuadrado = ,929 (R cuadrado corregida = ,916)

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

39

Ejercicio 3:
Una empresa pretende estudiar la resistencia a la ruptura de la fibra de la que est compuesta una cuerda. Se realiza un estudio para determinar si existe diferencia significativa en la resistencia de los tres tipos de cuerdas disponibles (atendiendo al tipo de fibra disponible). Se cree que la temperatura a la que se realiza el experimento puede influir en la resistencia, por lo que se utiliza un diseo en bloques aleatorizados considerando la temperatura como bloque, con 4 niveles. La resistencia de la cuerda a la ruptura (medida en libras) se ve afectada por su grosor (medido en 103 pulgadas). Los datos se presentan en la siguiente tabla:

1 Temperatura 1 2 3 4 Se pide y 33 41 35 42 x 20 25 24 25

Cuerda 2 y 44 23 44 37

3 x 28 22 33 27 y 41 39 37 26 x 23 22 23 21

a) Formular el diseo empleado b) Analizar estos datos y extraer las conclusiones apropiadas

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

40

Pruebas de los efectos inter-sujetos Variable dependiente: Y Suma de cuadrados tipo III 423,966a 55,091 170,503 91,799 358,133 71,701 16776,000 495,667 Media cuadrtica 70,661 55,091 85,251 30,600 358,133 14,340

Fuente Modelo corregido Interseccin CUERDA TEMP X Error Total Total corregida

gl 6 1 2 3 1 5 12 11

F 4,928 3,842 5,945 2,134 24,974

Significacin ,050 ,107 ,048 ,215 ,004

a. R cuadrado = ,855 (R cuadrado corregida = ,682)

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

41

Ejercicio 4:
Se pretende comparar la presin arterial sistlica de un grupo de fumadores segn su nivel de estudios. Para ello se realiza un estudio en el que se controla el nmero de cigarrillos consumidos al da por cada una de estas personas. El nivel de estudios se clasifica en tres niveles: estudios bsicos, estudios de Secundaria y estudios universitarios, codificados por 1, 2 y 3 respectivamente. Adems se cree que la presin arterial que sufren estos individuos podra relacionarse en forma lineal con la edad de los fumadores. Los datos se muestran en la tabla adjunta:

y 153,4 157,5 140,5 162,7 153,5

1 X 24,2 25,6 24,9 57,2 46,3

z 46 55 49 44 64

Nivel de estudios 2 y x z 141,3 18,3 22 133,9 28 51 128,7 12,1 36 144,2 27,4 51 137,4 33,5 35

y 135,5 137,9 140,4 126,9 130,1

3 x 20,3 22,9 33 20,3 11,2

z 35 17 40 39 29

a) Formular el diseo empleado b) Variacin de la presin arterial sistlica que queda sin explicar y suma total de cuadrados de la respuesta ajustada por la covariable c) Contrastar la igualdad de los efectos del factor, as como la significacin de cada covariable d) Proporcin de variacin explicada por el modelo propuesto e) Comprobar que se cumple la hiptesis de homocedasticidad

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

42

Pruebas de los efectos inter-sujetos Variable dependiente: PRESIN Suma de cuadrados tipo III 1294,773a 11452,003 410,072 203,031 24,663 336,176 302361,030 1630,949 Media cuadrtica 323,693 11452,003 205,036 203,031 24,663 33,618

Fuente Modelo corregido Intercept ESTUDIOS N_CIGAR EDAD Error Total Total corregida

gl 4 1 2 1 1 10 15 14

F 9,629 340,655 6,099 6,039 ,734

Significacin ,002 ,000 ,019 ,034 ,412

a. R cuadrado = ,794 (R cuadrado corregida = ,711)

Contraste de Levene sobre la igualdad de las varianzas error Variable dependiente: PRESIN F ,973 gl1 2 gl2 12 Significacin ,406

Contrasta la hiptesis nula de que la varianza error de la variable dependiente es igual a lo largo de todos los grupos.

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

43

ANLISIS CLUSTER
Ejercicio 1:
Se analiza la leche de las hembras de 20 mamferos, obtenindose los porcentajes en agua, protenas, grasa y lactosa siguientes: Mamfero CABALLO BURRO CEBRA HAMSTER RATA OVEJA RENO MULA CERDO CAMELLO BFALO ZORRO CONEJO LLAMA CIERVO BISONTE GATO PERRO FOCA DELFN Agua 90.1 90.3 86.2 81.9 72.5 82.0 64.8 90.0 82.8 87.7 82.1 81.6 71.3 86.5 65.9 86.9 81.6 76.3 46.4 44.9 Protenas 2.6 1.7 3.0 7.4 9.2 5.6 10.7 2.0 7.1 3.5 5.9 6.6 12.3 3.9 10.4 4.8 10.1 9.3 9.7 10.6 Grasa 1.0 1.4 4.8 7.2 12.6 6.4 20.3 1.8 5.1 3.4 7.9 5.9 13.1 3.2 19.7 1.7 6.3 9.5 42.0 34.9 Lactosa 6.9 6.2 5.3 2.7 3.3 4.7 2.5 5.5 3.7 4.8 4.7 4.9 1.9 5.6 2.6 5.7 4.4 3.0 0.0 0.9

Clasificar estos mamferos de forma jerrquica atendiendo a dichas variables realizando el estudio de acuerdo a las siguientes opciones de medidas de asociacin y mtodos de amalgamamiento: a) Distancia eucldea y linkage simple b) Distancia bloque y linkage simple c) Distancia eucldea y mtodo del centroide d) Distancia bloque y mtodo del centroide Para cada uno de las anteriores opciones se pide la matriz de distancias, el dendrograma y la clasificacin resultante si se toman 2, 3, 4 o 5 grupos diferentes.

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

44

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

45

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

46

Historial de conglomeracin Etapa en la que el conglomerado aparece por primera vez Conglom Conglom erado 1 erado 2 0 0 0 0 0 1 0 0 0 0 2 0 5 0 0 7 6 0 0 9 3 8 10 0 0 0 13 0 11 12 15 14 0 0 16 4 18 17

Etapa 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

Conglomerado que se combina Conglom Conglom erado 1 erado 2 2 8 6 12 1 2 7 15 10 14 6 11 10 16 3 10 6 9 4 6 1 3 4 17 5 18 5 13 1 4 1 5 19 20 1 7 1 19

Coeficientes ,911 1,204 1,225 1,292 1,510 1,533 1,797 1,884 1,942 2,512 3,254 3,329 3,969 4,389 5,227 6,352 7,367 8,765 24,733

Prxima etapa 3 6 11 18 7 9 8 11 10 12 15 15 14 16 16 18 19 19 0

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

47

Conglomerado de pertenencia 5 conglome rados 1 1 1 1 2 1 3 1 1 1 1 1 2 1 3 1 1 2 4 5 4 conglome rados 1 1 1 1 1 1 2 1 1 1 1 1 1 1 2 1 1 1 3 4 3 conglome rados 1 1 1 1 1 1 2 1 1 1 1 1 1 1 2 1 1 1 3 3 2 conglome rados 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2

Caso 1:caballo 2:burro 3:cebra 4:hamster 5:rata 6:oveja 7:reno 8:mula 9:cerdo 10:camello 11:bfalo 12:zorro 13:conejo 14:llama 15:ciervo 16:bisonte 17:gato 18:perro 19:foca 20:delfn

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS


* * * * * * H I E R A R C H I C A L * * * * * C L U S T E R

48
A N A L Y S I S *

Dendrogram using Single Linkage Rescaled Distance Cluster Combine C A S E Label burro mula caballo camello llama bisonte cebra oveja zorro bfalo cerdo hamster gato rata perro conejo reno ciervo foca delfn 0 5 10 15 20 25 +---------+---------+---------+---------+---------+

Num 2 8 1 10 14 16 3 6 12 11 9 4 17 5 18 13 7 15 19 20

5 grupos 4 grupos 3 grupos

Departamento de Estadstica e I.O.

2 grupos

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

49

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

50

Ejercicio 2:
Se pretende clasificar un conjunto de 26 animales mamferos en 4 grupos homogneos atendiendo a su configuracin dental. La informacin de la que se dispone es la del nmero de piezas dentales. Los datos de los que se dispone son los siguientes:
Mamfero
Incisivos Sup. Incisivos Inf. Caninos Sup. Caninos Inf. Premolares Inf. Premolares Sup. Molares Sup. Molares Inf.

ALCE ANTLOPE ARDILLA BISONTE BUEY CABRA CASTOR CIERVO COMADREJA HURN JAGUAR LEN LINCE LOBO MARTA MOFETA MURCILAGO NUTRIA OCELOTE OSO OVEJA RATN RENO TEJN VISN ZORRO

0 0 1 0 0 0 1 0 3 3 3 3 3 3 3 3 2 3 3 3 0 1 0 3 3 3

4 4 1 4 4 4 1 4 3 3 3 3 3 3 3 3 3 2 3 3 4 1 4 3 3 3

1 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1

0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 1 1 1

3 3 1 3 3 3 2 3 3 3 3 3 2 4 4 3 1 1 3 4 3 0 3 3 3 4

3 3 1 3 3 3 1 3 3 3 2 2 2 4 4 3 2 2 2 4 3 0 3 3 3 4

3 3 3 3 3 3 3 3 1 1 1 1 1 2 1 1 3 3 1 2 3 3 3 1 1 2

3 3 3 3 3 3 3 3 2 2 1 1 1 3 2 2 3 3 1 3 3 3 3 2 2 3

Clasificar estos mamferos utilizando el mtodo de las k-medias para agrupar a los mamferos en 4 grupos.

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

51

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS


Centros iniciales de los conglomerados Conglomerado 1 Incisivos Superiores Incisivos Inferiores Caninos Superiores Caninos Inferiores Premolares Inferiores Premolares Superiores Molares Superiores Molares Inferiores 3 3 1 1 2 2 1 1 2 0 4 0 0 3 3 3 3 3 1 1 0 0 0 0 3 3 4 3 3 1 1 4 4 2 3

52

Historial de iteraciones(a) Cambio en los centros de los conglomerados Iteracin 1 2 1 1,150 ,000 2 ,250 ,000 3 1,202 ,000 4 ,354 ,000

a Se ha logrado la convergencia debido a que los centros de los conglomerados no presentan ningn cambio o ste es pequeo. El cambio mximo de coordenadas absolutas para cualquier centro es de ,000. La iteracin actual es 2. La distancia mnima entre los centros iniciales es de 3,606. Pertenencia a los conglomerados Nmero de caso 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 MAMIFERO alce antlope ardilla bisonte buey cabra castor ciervo comadrej hurn jaguar len lince lobo marta mofeta murcila nutria ocelote oso oveja ratn reno tejn visn zorro Conglome rado 2 2 3 2 2 2 3 2 1 1 1 1 1 4 4 1 1 1 1 4 2 3 2 1 1 4 Distancia ,750 ,250 ,333 ,250 ,250 ,250 1,054 ,250 ,828 ,828 1,110 1,110 1,150 ,354 1,061 ,828 2,739 2,739 1,110 ,354 ,250 1,202 ,750 ,828 ,828 ,354

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

53

Centros de los conglomerados finales Conglomerado 1 Incisivos Superiores Incisivos Inferiores Caninos Superiores Caninos Inferiores Premolares Inferiores Premolares Superiores Molares Superiores Molares Inferiores 3 3 1 1 3 2 1 2 2 0 4 0 0 3 3 3 3 3 1 1 0 0 1 1 3 3 4 3 3 1 1 4 4 2 3

Distancias entre los centros de los conglomerados finales Conglomerado 1 2 3 4 1 3,974 4,353 2,353 4,417 3,897 5,633 2 3,974 3 4,353 4,417 4 2,353 3,897 5,633

Nmero de casos en cada conglomerado Conglomerado 1 2 3 4 Vlidos Perdidos 11,000 8,000 3,000 4,000 26,000 ,000

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

54

ANLISIS DE DATOS CUALITATIVOS


Ejercicio 1:
Un grupo de bilogos ha opinado acerca del plan de actuacin de la Administracin sobre el Parque Natural de Doana clasificando el mismo como Bueno, Aceptable o Malo. Los resultados de opinin teniendo en cuenta la procedencia laboral de los mismos, segn trabajen para algn organismo pblico o pertenezcan a otros organismos no gubernamentales se muestran a continuacin: Opinin Bueno Aceptable Malo Procedencia Organismo Pblico 67 56 35 Organismo no Gubernamental 12 40 50 a) Clasificar las variables contempladas. b) Introducir la informacin anterior y construir la tabla de contingencia plasmando los porcentajes por columna. Comentar los resultados. c) La procedencia laboral de los bilogos influye en la opinin que expresan sobre el plan de actuacin?

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

55

Tabla de contingencia Procedencia * Opinin Opinin Aceptable 56 58,3% 40 41,7% 96 100,0%

Procedencia

Pblico No Gubernamental

Total

Recuento % de Opinin Recuento % de Opinin Recuento % de Opinin

Bueno 67 84,8% 12 15,2% 79 100,0%

Malo 35 41,2% 50 58,8% 85 100,0%

Total 158 60,8% 102 39,2% 260 100,0%

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

56

Pruebas de chi-cuadrado Valor 33,078a 35,395 32,401 260 gl 2 2 1 Sig. asinttica (bilateral) ,000 ,000 ,000

Chi-cuadrado de Pearson Razn de verosimilitudes Asociacin lineal por lineal N de casos vlidos

a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 30,99.

Medidas simtricas Valor ,357 ,357 ,336 260 i lt ti


Error tp. a asint. ,071 ,083 ,083 ,037 ,019 Sig. aproximada ,069 ,102 ,149 ,000c ,000c Medidas direccionales Valor ,135 ,147 ,128 ,127 ,060 T aproximada 1,816 1,635 1,445
b

Nominal por nominal

Phi V de Cramer Coeficiente de contingencia d l hi t

Sig. aproximada ,000 ,000 ,000

N de casos vlidos a A i

Nominal por nominal

Lambda

Tau de Goodman y Kruskal

Simtrica Procedencia dependiente Opinin dependiente Procedencia dependiente Opinin dependiente

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

57

Ejercicio 2:
Se est llevando a cabo un estudio sobre la raza canina Boxer para investigar el grado de agresividad que presentan los perros de dicha raza. Se supone en principio, que los sntomas de agresividad dependen fundamentalmente del nivel de adiestramiento que han tenido estos perros durante los dos primeros aos de su vida. Por este motivo, se han investigado a 208 perros Boxer ofreciendo los siguientes resultados: Nivel de adiestramiento Grado de agresividad Bajo Medio Alto Bajo Medio Alto 12 28 42 13 34 31 28 15 5

a) Qu tipo de variables son? b) Obtener la distribucin condicionada del grado de agresividad al nivel de adiestramiento. c) Son independientes?.

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

58

Tabla de contingencia Grado de Agresividad * Grado de Adiestramiento Grado de Adiestramiento Bajo Medio Alto 12 13 28 14,6% 28 34,1% 42 51,2% 82 100,0% 16,7% 34 43,6% 31 39,7% 78 100,0% 58,3% 15 31,3% 5 10,4% 48 100,0%

Total 53 25,5% 77 37,0% 78 37,5% 208 100,0%

Grado de Agresividad

Bajo

Medio

Alto

Total

Recuento % de Grado de Adiestramiento Recuento % de Grado de Adiestramiento Recuento % de Grado de Adiestramiento Recuento % de Grado de Adiestramiento

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

59

Pruebas de chi-cuadrado Valor 41,629a 40,522 31,093 208 gl 4 4 1 Sig. asinttica (bilateral) ,000 ,000 ,000

Chi-cuadrado de Pearson Razn de verosimilitudes Asociacin lineal por lineal N de casos vlidos

a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 12,23.

Medidas direccionales Valor -,336 -,338 -,334 Error tp. a asint. ,058 ,058 ,058 T aproximada -5,668 -5,668 -5,668
b

Ordinal por ordinal

d de Somers

Simtrica Grado de Agresividad dependiente Grado de Adiestramiento dependiente

Sig. aproximada ,000 ,000 ,000

a. Asumiendo la hiptesis alternativa. b. Empleando el error tpico asinttico basado en la hiptesis nula.

Medidas simtricas Valor -,336 -,330 -,492 208 Error tp. a asint. ,058 ,058 ,078 T aproximada -5,668 -5,668 -5,668
b

Ordinal por ordinal

Tau-b de Kendall Tau-c de Kendall Gamma

Sig. aproximada ,000 ,000 ,000

N de casos vlidos a. Asumiendo la hiptesis alternativa.

b. Empleando el error tpico asinttico basado en la hiptesis nula.

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

60

Ejercicio 3:
En la siguiente tabla se muestra la informacin de la Unidad de Paritorio de un hospital granadino, donde aparecen las frecuencias observadas de utilizacin de analgesia epidural y realizacin de episiotoma a las mujeres cuyo parto es asistido en dicho centro. Los responsables de esta Unidad creen que la utilizacin de analgesia epidural en el proceso del parto influye en la realizacin de episiotoma. Analgesia Epidural No Episitoma No S S

405 243 239 235

Se pide la realizacin de un estudio de asociacin que de respuesta a los responsables de la Unidad de Paritorio.

Tabla de contingencia Realizacin de Episiotoma * Utilizacin de analgesia epidural Utilizacin de analgesia epidural No S 405 243 62,9% 50,8% 239 235 37,1% 49,2% 644 478 100,0% 100,0%

Realizacin de Episiotoma

NO Si

Total

Total 648 57,8% 474 42,2% 1122 100,0%

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

61

Pruebas de chi-cuadrado Valor 16,332b 15,841 16,316 gl 1 1 1 Sig. asinttica (bilateral) ,000 ,000 ,000 ,000 1122 ,000 Sig. exacta (bilateral) Sig. exacta (unilateral)

Chi-cuadrado de Pearson Correccin por a continuidad Razn de verosimilitudes Estadstico exacto de Fisher N de casos vlidos

a. Calculado slo para una tabla de 2x2. b. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 201,94.

Medidas simtricas Valor ,121 ,121 ,120 1122 Sig. aproximada ,000 ,000 ,000

Nominal por nominal

Phi V de Cramer Coeficiente de contingencia

N de casos vlidos a. Asumiendo la hiptesis alternativa.

b. Empleando el error tpico asinttico basado en la hiptesis nula.

Medidas direccionales Valor ,000 ,000 ,000 Error tp. a asint. ,000 ,000 ,000 T aproximada .c . .
c b

Sig. aproximada .c . .
c

Nominal por nominal

Lambda

Tau de Goodman

Simtrica Realizacin de Episiotoma dependiente Utilizacin Analgesi Epidural dependiente Realizacin de

Departamento de Estadstica e I.O.

Universidad de Granada

FBA I Cuaderno de Prcticas de Estadstica con SPSS

62

Bibliografa Recomendada:
Aguilera del Pino, A. M. (2001). Tablas de Contingencia Bidimensionales. Ed La Muralla, S.A. Garca Leal, J., Lara Porras, A.M., Navarrete lvarez, E., Rico Castro, N., Romn Montoya, Y., Ruiz Castro, E. y Snchez Borrego, I.R. (2007). Tcnicas Estadsticas aplicadas en Biologa con SPSS. Editorial Proyecto Sur. Gutirrez Jimez, R., Gonzlez Carmona, A., Torres Ruiz, F y Gallardo Sansalvador, J.A. (1994). Tcnicas de Anlisis de datos Multivariable. Tratamiento computacional. Universidad de Granada. Lara Porras, A.M. (2001) Diseo Estadstico de Experimentos, Anlisis de la Varianza y Temas relacionados. Tratamiento Informtico mediante SPSS. Ed. Proyecto Sur. Lara Porras, A.M., Snchez Borrego, I.R., Ramos balos, E.M.Raya Miranda, R., Tarifa Blanco, J.A. y Alfonso Ux, A. (2008) Gua Interactiva de Autoaprendizaje de SPSS. versin 2.1 Ed. Proyecto Sur. Visauta Vinacua, B. (1998) Anlisis Estadstico con SPSS para Windows. Volumen II: Estadstica multivariante. McGraw-Hill. Visauta Vinacua, B. (2007) Anlisis Estadstico con SPSS 14. Estadstica Bsica. McGraw-Hill.

Bibliografa General:
Box, G.E.P., Hunter W.G. & Hunter J.S. (1988). Estadstica para Investigadores. Ed. Revert. Canavos, G.C. (1990). Probabilidad y Estadstica. Aplicaciones y Mtodos. Ed. McGraw-Hill. Ferrn Aranaz, M. (1996). SPSS para Windows. Programacin y Anlisis Estadstico. Serie McGraw-Hill de informtica. Garca Leal, J. y Lara Porras, A.M. (1998). Diseo Estadstico de Experimentos. Anlisis de la Varianza. Grupo Editorial Universitario. Lara Porras, A.M. (2010) Estadstica para Biologa y Ciencias Ambientales: Tratamiento Informtico mediante SPSS. Ed. Proyecto Sur. Lara Porras, A.M. y Romn Montoya, Yolanda (2010) Aprender Estadstica analizando datos: Mtodos multimedia. Ed. Proyecto Sur. Lizasoain, L. y Joaristi, L. (1998) SPSS para Windows. Ed Paraninfo. Ludwig, J.A. y Reynolds, J.F. (1988) Statistical Ecology. J. Willey & Sons. Martin Andrs, A., Luna del Castillo, J.D. (2004). Bioestadstica para las Ciencias de la Salud. Ed. Capitel. Mason, R.L., Gunst, R.F. y Hess, J.L. (1989), Statistical Design and Analysis of Experiments. J. Willey & Sons. Milton, J.S. (2007) Estadstica para Biologa y Ciencias de la Salud. Ed. McGraw-Hill. Ollero Hinojosa, J., Garca Leal, J., Lara Porras. A.M., Martnez Andrs, A., Rodrguez, C., Ramos, H. (1997) Diseo y Anlisis Estadstico de Experimentos. Grupo Editorial Universitario. Sharma, S. (1996) Applied Multivariate Techniques. Ed. J. Wiley & Sons.

Departamento de Estadstica e I.O.

Universidad de Granada