Anda di halaman 1dari 8

Práctica 5.

Intervalos de confianza 1

Práctica 5

ANÁLISIS DE UNA MUESTRA


INTERVALOS DE CONFIANZA
CONTRASTE DE HIPÓTESIS

Objetivos:

Ilustrar el grado de fiabilidad de un intervalo de confianza cuando se utiliza para estimar


la media de una población. Análisis de las relaciones entre contrastes de hipótesis e
intervalos de confianza.
Uso del SPSS para el análisis de una muestra: cálculo de intervalos de confianza,
contrastes de hipótesis sobre la media poblacional y pruebas de normalidad.

Índice:
1. Interpretación de los intervalos de confianza y contrastes de hipótesis.
2. Análisis de una muestra con el SPSS
3. Pruebas de normalidad

Prácticas de Bioestadística. Departament d’Estadística i Investigació Operativa. Universitat de València


Práctica 5. Intervalos de confianza 2

1. Interpretación de los intervalos de confianza y contrastes de


hipótesis.
Por conveniencia, supondremos que los datos que aparecen en este apartado proceden
de una población normal.

1.1 Un ejemplo con una muestra.

Supongamos que la colección de 100 círculos que se presenta en la hoja adjunta


representa una población natural del mítico organismo C. ellipticus. Los círculos tienen
números de identificación 00, 01, 02,...., 98, 99 por conveniencia en el muestreo.
Algunos individuos de C. ellipticus son mutantes y son más oscuros.

Vamos a utilizar esta "población" para simular la recogida de datos en un experimento,


para estudiar la relación entre muestra y población y para interpretar las propiedades de
los intervalos de confianza y del Contraste de Hipótesis.

Ejercicio 1:
a) Selección de una muestra aleatoria.

Seleccionar una muestra aleatoria de tamaño 5 de la población de C. ellipticus


(utilizar el método descrito en la Práctica 3) y medir sus diámetros en mm.

b) Calcular la media y la varianza muestral de la muestras obtenida.

c) Comparar los estadísticos obtenidos en el apartado 2 con los que han obtenido
vuestros compañeros.

1. 2. Intervalos de confianza

Evidentemente, en otros estudios no conoceremos el valor de la media poblacional. Sin


embargo, en este ejercicio sabemos que µ = 11, esto nos permitirá saber con seguridad
si los intervalos de confianza que calculemos contienen o no al verdadero valor de µ.

Ejercicio 2:
a) Construir un intervalo de confianza del 95% para µ a partir de la muestra
obtenida en el ejercicio 1. Análogamente para el 80%.

Prácticas de Bioestadística. Departament d’Estadística i Investigació Operativa. Universitat de València


Práctica 5. Intervalos de confianza 3

b). Considerando todos los intervalos de confianza del 95% construidos por
vuestros compañeros, calcular la proporción de ellos que contienen al 11 mm
(valor verdadero de µ). Hacer lo mismo con los intervalos del 80%. ¿Son los
resultados obtenidos los que cabría esperar dado el nivel de confianza utilizado
en cada caso? Comentar la interpretación probabilística de un intervalo de
confianza y relacionar con los resultados obtenidos.

Recordar que en un estudio real no sabemos cuál es el verdadero valor de µ por lo que
nunca estaremos completamente seguros de si el intervalo de confianza que hemos
obtenido contiene o no a este valor. Solamente podemos esperar que lo contenga con
mayor o menor confianza.

1.3. Contraste de Hipótesis: test t.

Ejercicios:
3. Haz el siguiente contraste de hipótesis sobre el valor de la media poblacional
utilizando la muestra anterior: H0 : µ = 11, HA : µ ≠ 11:
a) Utilizar α = 0.05.
b) Utilizar α = 0.20.
¿Qué relación hay entre los resultados obtenidos en los contrastes anteriores y el
hecho de que los intervalos de confianza del ejercicio 4 contengan o no al 11?

4. Si en lugar de observar si el 11 pertenece o no a los intervalos de confianza


nos fijamos en si contienen o no al 8 ¿qué contraste de hipótesis plantearías?

5. Suponed que un experto en C. ellipticus asegura que el diámetro medio de


este organismo es 13 mm. Utilizar un test t de dos colas para contrastar esta
afirmación:
H0 : µ = 13 , HA : µ ≠ 13
a) Utilizar α = 0.05.
b) Utilizar α = 0.20.
c) Teniendo en cuenta que sabemos que µ = 11, ¿es equivocada la conclusión a
que llegamos con el test?

6. Teniendo en cuenta los resultados obtenidos por vuestros compañeros en el


ejercicio anterior, para cada valor de α utilizado:
a) Calcular la proporción de veces en que se produce un resultado erróneo.
b) ¿Cuál es la proporción de veces que se ha producido un error de tipo I?
¿Tiene esta proporción alguna relación con el valor de α?
c) ¿Cuál es la proporción de veces que se ha producido un error de tipo II?
¿Cómo valorarías la potencia del test?

Prácticas de Bioestadística. Departament d’Estadística i Investigació Operativa. Universitat de València


Práctica 5. Intervalos de confianza 4

2. Análisis de una muestra con el SPSS


En este apartado describimos el uso del SPSS para el análisis de una muestra mediante
la obtención de intervalos de confianza y la resolución de contrastes de hipótesis, todos
ellos referidos a la media de la población de la que proviene la muestra.

Una vez abierto un banco de datos, por ejemplo AMBIENTE, podemos invocar el
procedimiento Prueba T para una muestra, eligiendo el menú Analizar/Comparar
medias/Prueba T para una muestra, con lo que aparece la siguiente pantalla:

Esta pantalla nos permitirá obtener intervalos de confianza y resolver contrastes para las
medias de aquellas variables que seleccionemos y, con el puntero, situemos en la
ventana de Contrastar Variables. Por su parte, el Valor de prueba nos permite
introducir el valor que define la hipótesis nula (µ µ0). Por último, si seleccionamos
Opciones aparece una ventana en la que podemos introducir el coeficiente (porcentaje)
de confianza deseado para el intervalo. Por defecto es del 95%.

Se activa, entonces, el botón Aceptar, y al pulsarlo, el SPSS muestra en el Visor de


resultados, bajo el título de Estadísticos para una muestra, el tamaño de la muestra, la
media, la desviación típica y el error estándar de la media. A continuación, bajo el título
de Prueba para una muestra, encontramos el estadístico del contraste (t), los grados de
libertad (gl), el p-valor bilateral ( Sig (bilateral) ), la diferencia de medias y un intervalo
de confianza para la diferencia µ - µ0. (Por ejemplo, los resultados siguientes se
obtienen seleccionando la variable PH con un valor de prueba 7).

Estadísticos para una muestra

Desviación Error típ. de


N Media típ. la media
PH 300 5.923131 .540562 3.121E-02

Prácticas de Bioestadística. Departament d’Estadística i Investigació Operativa. Universitat de València


Práctica 5. Intervalos de confianza 5

Prueba para una muestra

Valor de prueba = 7
95% Intervalo de
confianza para la
Diferencia diferencia
t gl Sig. (bilateral) de medias Inferior Superior
PH -34.505 299 .000 -1.076869 -1.138287 -1.015451

Es importante tener en cuenta que el contraste que realiza el SPSS es el siguiente:

H0: µ = µ 0 

HA: µ ≠ µ 0 

por lo que el p-valor aparece como sig.(bilateral), es decir, corresponde siempre al


contraste bilateral o no direccional. Por tanto, si el problema que queremos resolver
involucra un contraste unilateral o direccional debemos adaptar dicho p-valor.

La Prueba T es válida siempre que el tamaño muestral sea suficientemente grande o, en


caso contrario, cuando la muestra provenga de una población con distribución normal.
En la siguiente Sección veremos cómo comprobar si se satisface esta última condición.

Ejercicio 7:
En estudios previos se concluyó que el nivel medio de sulfato era de 5.1. ¿Confirman
los datos del fichero AMBIENTE las conclusiones de dichos estudios?

3. Pruebas de normalidad
Una de las hipótesis que deben comprobarse para la validez de las Pruebas T es la de
normalidad de los datos cuando el tamaño de las muestras es pequeño. Esta condición
puede comprobarse con la prueba de Kolmogorov-Smirnov y mediante el dibujo de
histogramas, diagramas de cajas o gráficos Q-Q.
Para obtener una prueba de normalidad de los datos, seleccionamos el menú
Analizar/Estadísticos descriptivos/Explorar. Aparece la ventana siguiente:

Prácticas de Bioestadística. Departament d’Estadística i Investigació Operativa. Universitat de València


Práctica 5. Intervalos de confianza 6

En el caso de una muestra situamos la variable en la ventana Dependientes, y


dejamos Factores en blanco. A continuación, debemos pulsar el botón Gráficos y en la
nueva ventana escoger la opción de Histograma y activar la opción de Gráficos con
pruebas de normalidad.

En el Visor de resultados encontramos, junto con algunos estadísticos de la variable a


estudiar, la prueba de Kolmogorov-Smirnov con corrección de Lilliefors para contrastar
la normalidad de la distribución (hipótesis nula) y el histograma.

Ejercicio 8:
Aplicar las pruebas de normalidad a los siguientes datos.
Notas obtenidas por los estudiantes presentados en un examen:

3.30, 6.50, 3.60, 5.00, 3.20, 5.50, 5.00, 5.90, 3.80, 3.70, 2.90, 3.60,
3.90, 6.30, 5.00, 3.50, 3.60

Prácticas de Bioestadística. Departament d’Estadística i Investigació Operativa. Universitat de València


Práctica 5. Intervalos de confianza 7

Utilizando el SPSS de la forma que se ha explicado, se obtienen los siguientes


resultados:

Pruebas de normalidad
a
Kolmogorov-Smirnov Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
NOTAS ,247 17 ,007 ,885 17 ,041
a. Corrección de la significación de Lilliefors

Histograma Gráfico Q-Q normal de NOTAS


7 2,0

6 1,5

1,0
5

,5
4
0,0
3
-,5
Normal esperado

2
-1,0
Frecuencia

Desv. típ. = 1,15


1 -1,5
Media = 4,37
0 N = 17,00 -2,0
3,00 3,50 4,00 4,50 5,00 5,50 6,00 6,50 2 3 4 5 6 7

NOTAS Valor observado

Gráfico Q-Q normal sin tendencias de NOTAS


,6
7

,4
6

,2

5
-,0
Desv. de normal

-,2 4

-,4
3

-,6
2 3 4 5 6 7 2
N= 17

Valor observado NOTAS

Prácticas de Bioestadística. Departament d’Estadística i Investigació Operativa. Universitat de València


Práctica 5. Intervalos de confianza 8

4. Ejercicios complementarios
1.- Las manadas de lobos son territoriales, con territorios de 130 km2 o más. Se piensa
que los aullidos de los lobos, que comunican información tanto de la situación como de
la composición de la manada, están relacionados con la territorialidad. Se obtuvieron los
siguientes valores de la variable X, duración en minutos de una sesión de aullidos de
una determinada manada sometida a estudio. Suponemos que X está normalmente
distribuida.
1.0 1.8 1.6 1.5 2.0 1.8
1.2 1.9 1.7 1.6 1.6
1.7 1.5 1.4 1.4 1.4
Calcular intervalos de confianza al 95% y al 90% para la duración media de una sesión
de aullidos. ¿Confirman estos datos que la duración media es superior a 1.5 minutos?

2.- Se está poniendo a prueba un proceso que en fotobiología se denomina abscisión,


con la esperanza de aumentar la cosecha de fruta en los naranjos. El proceso implica
exponer los árboles a luz coloreada durante quince minutos cada noche. Se recolectó
fruta de 10 árboles experimentales, bajo condiciones normales primero y luego después
del nuevo tratamiento. Se obtuvieron las siguientes observaciones para X, porcentaje en
el que incrementó la recolección de fruto de un año respecto al anterior:
29 37 32 34 39
30 36 35 27 40
El promotor del nuevo proceso pretende que éste incrementa la recolección en promedio
en más de un 35%. ¿Respaldan los datos esta pretensión?.

3.- Cada especie de luciérnagas tiene un modo peculiar de centelleo. Para una
determinada especie, consiste en un destello corto de luz seguido por un período de
reposo que se piensa que tiene una duración media de menos de 4 segundos. Se
obtuvieron los siguientes datos acerca del período de reposo entre centelleos para una
muestra de 16 luciérnagas de esta especie.
3.9 4.1 3.6 3.7 4.0 4.3 3.8 3.2
3.7 4.2 4.0 3.5 3.5 3.8 3.4 3.6
¿Apoya la evidencia el tiempo de reposo medio propuesto, de menos de 4 segundos?

4.- Normalmente las hojas de la Mimosa púdica son horizontales. Si se toca ligeramente
una de ellas, las hojas se pliegan. Se afirma que el tiempo medio desde el contacto hasta
el cierre completo es 2.5 segundos. Se realiza un experimento para comprobar este
valor.
a) Construir la hipótesis apropiada bilateral.
b) Se obtuvieron las siguientes observaciones:
3.0 2.9 2.8 2.7 2.6
2.4 2.5 2.4 2.6 2.7
Hallar el p-valor del contraste. ¿Puede rechazarse H0 con un nivel = 0.10? ¿A
qué tipo de error nos arriesgamos?

Prácticas de Bioestadística. Departament d’Estadística i Investigació Operativa. Universitat de València