Anda di halaman 1dari 11

Pgina 1 de 11

CAPTULO 8: INTERVALOS DE CONFIANZA PARA PROPORCIONES


Y MEDIAS


Intervalos de Confianza para una proporcin
Cuando hacemos un test de hiptesis decidimos sobre un valor hipottico del parmetro.

Qu proporcin de mujeres espera compartir las tareas de la casa con su pareja?
Qu proporcin de la poblacin sufre de fatiga crnica?
Qu proporcin de la poblacin sufre de Cncer?

Cada una de estas preguntas es sobre el valor de la proporcin P . Es decir, queremos
estimar P .

Una proporcin muestral $ p es un estimador puntual (un nmero) de la proporcin en la
poblacin P .

Un estimador de intervalo de confianza de la proporcin en la poblacin P , es un
intervalo, calculado a partir de los datos de la muestra, en el cual nosotros confiamos se
encuentra la proporcin de la poblacin P .

El nivel de confianza es la probabilidad de que el mtodo de estimacin nos d un
intervalo que contiene al parmetro ( P en este caso). El nivel de confianza se denota por
1 , donde valores comunes de son 0,10; 0,05; y 0,01, para una confianza de 90%,
95%, y 99%.

Para construir intervalos de confianza recordemos la distribucin muestral de la proporcin
muestral
$ p
:
)
) 1 (
, ( ~
n
P P
P N p

& , entonces aproximadamente 95% de los valores de
$ p

estarn entre dos desviaciones estndar de P .
)
) 1 (
, (
n
P P
P N

p
p
p - 2
p ( 1 - p )
n
p + 2
p ( 1 - p )
n
9 5
4
%


Pgina 2 de 11

Hacemos un intervalo:
n
P P
p
) 1 (
96 , 1

. Esperamos que el 95% de los intervalos de


confianza formados por
n
P P
p
) 1 (
96 , 1

van a contener al parmetro P y 5% no lo van a


contener. El problema es que si no conocemos el parmetro no conocemos la desviacin
estndar. Solucin: Estimar la desviacin estndar, con el error estndar de $ p:
n
p p
p S
) 1 (
)

(

=


Un intervalo de 95% de confianza para P esta dado por:
|
|

\
|

n
) p - (1 p
1,96 p
En teora esta aproximacin funciona bien si se cumple que: 5 ) 1 ( y 5 P n nP . En la
prctica la comprobamos con: 5 ) 1 ( y 5 p n p n

FUMADORES
Se realiza un estudio para conocer la prevalencia (proporcin) de los factores de riesgo
cardiovasculares en residentes de la ciudad de Talca, adultos de 18 a 74 aos, el ao 2005
(http://pifrecv.utalca.cl/)

Tabaquismo

Total
n (%)
Hombres
n (%)
Mujeres
n (%)
Total 368 (36,5) 134 (39,5) 234 (35,0)

La tabla presenta la prevalencia de fumadores en la muestra de 1007 personas. Se quiere
estimar la proporcin de adultos que fuman.

Obtenga el estimador puntual de la proporcin buscada.

Un intervalo de confianza 95% para la verdadera proporcin de adultos que fuman,
est dado por?


Pensemos:

Sabemos si el intervalo de 95% de confianza contiene a la verdadera proporcin en la
poblacin que fuman?
Este nivel de 95% confianza significa que hay una probabilidad de 95% de que la
verdadera proporcin P est en el intervalo [33,6 ; 39,5]?

Podemos extender estos resultados al resto de la poblacin general de adultos?


Pgina 3 de 11

Interpretacin!
El intervalo que construimos o contiene P o no lo contiene. No es correcto decir que la
probabilidad de que el intervalo [33,6; 39,5] contenga a P es 0,95. El valor del parmetro
P es fijo. No vara.

La interpretacin del nivel de 95% de confianza tiene que ver con la proporcin de veces
que intervalos como el que construimos contiene a P si lo hiciramos muchas veces.
p
m.a.s #1
m.a.s. #2
m.a.s. #3
m.a.s. #4


Si repetimos este procedimiento muchas veces, calculando muchos intervalos de
confianza de 95% para P , podemos esperar que aproximadamente 95% de estos
intervalos contenga P (y aproximadamente 5% no).

Revisemos los percentiles de la tabla N(0,1):

Nivel de Confianza
1
z
1
2


0,80
0,90
0,95
0,98
0,99
0,999





N(0,1)

Z

2 22 2

2 22 2
1 1 1 1
-z
1 1 1 1

2 22 2
+z
1 1 1 1

2 22 2

Pgina 4 de 11


Un intervalo de confianza (1 )*100% para P est dado por:

$
$ $
p
p(1- p)
n

|
\

z
1
2


donde
z
1
2

es un percentil de la distribucin N(0,1)


Este intervalo da valores posibles para la proporcin en la poblacin P basada en slo una
proporcin muestral
$ p.

Esta aproximacin esta basada en el supuesto de que los datos provienen de una muestra
aleatoria de la poblacin y funciona bien si 5 ) 1 ( y 5 P n nP . Esta condicin se
puede corroborar con 5 )

1 ( y 5

p n p n .


Forma general de los Intervalos de Confianza:

|
|

\
|
|
|

\
|
|
|

\
|

estimador del
estndar error
muestral n distribuci
percentil
puntual
estimador



Pensemos:

Si el nivel de confianza aumenta de 95% a 99%, el intervalo de confianza ser:

ms ancho, ms angosto, o el mismo?

Si el tamao muestral aumenta (pero la proporcin muestral es la misma), el intervalo
de confianza ser:

ms ancho, ms angosto, o el mismo?

Si el tamao de la poblacin aumenta, el intervalo de confianza ser:

ms ancho, ms angosto, o el mismo?


Pgina 5 de 11

FUMADORES revisitado

Tabaquismo

Total
n (%)
Hombres
n (%)
Mujeres
n (%)
Total
(n=1007)
368 (36,5) 134 (39,5) 234 (35,0)

La tabla presenta la prevalencia de fumadores en una encuesta realizada en residentes de la
ciudad de Talca, adultos de 18 a 74 aos, el ao 2005 (http://pifrecv.utalca.cl/).
a) Cul es la poblacin bajo estudio?
b) Basado en los resultados del estudio, construya un intervalo de 90% de confianza
para la proporcin de sujetos que fuman.
c) Interprete el intervalo.
d) Construya un intervalo de 95% de confianza para la proporcin de sujetos que
fuman. Es este intervalo ms ancho o ms angosto del calculado en (b)?
e) En la Encuesta Nacional de Salud del 2003 se encontr una prevalencia del 42%.
Comente.
f) Cul es la mitad del ancho del intervalo?

Definicin:

El margen de error para una proporcin es la mitad del ancho del intervalo de confianza, y
est dado por:

E z =
p(1- p)
n 1
2

|
\

$ $


____________________
E = Margen de Error
---------(------------------------------|------------------------------)--------

$
$( $)
p z
p p
n


1
2
1


$
p

$
$( $)
p z
p p
n
+

1
2
1


__________________________________________
Ancho


Se calcula un intervalo de 99% confianza para P que resulta: (0,27 , 0,42)

a) Cul es el valor de la proporcin muestral $ p?

b) Cul es el margen de error?

c) D dos sugerencias para reducir el margen de error.


Pgina 6 de 11

Cul es el tamao de la muestra?

Con la frmula del margen de error podemos conocer cuanto puede ser un tamao muestral
mnimo n.

Tamao de la muestra:
n
z p p
E
=

(

1
2
2
2
1

$( $)


Pero esta frmula contiene a la proporcin muestral p
y todava no tenemos la muestra!

Encontremos el mximo.

Dibuje p versus p (1- p )


Por ejemplo, grafique p = 0,5 vs p (1- p ) = 0,25.




Definicin:

Si desconocemos la variabilidad en la poblacin, el tamao muestral requerido para
estimar la proporcin de una poblacin con nivel de confianza 1 y margen de error E
esta dado por:


2
2
=
2
1
=
2
1
1
2
1
=
2
1
2
2
2
2
1
2
2
2
1
|
|
|

\
| |

\
|
(

\
|

(


E
z
E
z
E
z
n




La Cruz Roja quiere venir a sacar sangre a la Universidad de Talca y nos pide que
estimemos la proporcin de estudiantes y funcionarios que estaran dispuestos a donar
sangre. Con confianza 99% y un 4% de margen de error a cuantas personas debemos
entrevistar?




En la oficina de admisin de la UTal quieren estimar la proporcin de alumnos que
abandona la Universidad despus del primer ao de estudio. A cuantos estudiantes debe
entrevistar para construir un intervalo de confianza para P del 90% con un margen de
error de 2 puntos porcentuales?


0 1 0.5
p
p
p
(1 - )

Pgina 7 de 11

Correccin para poblacin finita (cpf) (Opcional)

La frmula para calcular el tamao muestral supone que el tamao de la poblacin es
grande o es un muestreo con reemplazo. Cuando queremos sacar una muestra de una
poblacin pequea en conveniente usar la cpf

N n
n
n
c
+
=
1


Ejemplo: Crdito universitario.
En el ao 2001 un grupo de alumnos de la recin creada carrera de Psicologa en la UTal,
hizo un trabajo sobre el crdito universitario. Ellos queran conocer la proporcin que tiene
crdito universitario entre los alumnos de Psicologa de la UTal. Con un nivel de confianza
de 95% y un margen de error del 5% a cuantos estudiantes debieron encuestar?

16 , 384
) 05 , 0 ( 2
96 , 1
2
=
2
2
2
1
=
|
|

\
|
|
|
|

\
|
=

E
z
n



Pero en el ao 2001 haba 71 alumnos inscritos!

9 , 59
71 384 1
384
=
+
=
c
n
Finalmente, tuvieron que encuestar a 60 personas.

Pgina 8 de 11

Intervalos de Confianza para la media de una poblacin
Como hemos mencionado la media muestral x basada en una muestra aleatoria, es un
buen estimador puntual de la media poblacional . La pregunta es qu tan buen estimador
es? Ser el valor observado de la media muestral igual a la media poblacional?
Probablemente no. Ser entonces cercano a ? Pero qu tan cercano?

Definiciones:
La media muestral x es un estimador puntual de la media de poblacional .

Un estimador de intervalo de confianza para la media poblacional es un intervalo de
valores, calculados a partir de los datos de la muestra, entre los cuales podemos confiar que
se encuentra la media poblacional .

El nivel de confianza es la probabilidad de que el mtodo de estimacin nos d un
intervalo de confianza que contiene al parmetro ( en este caso).

Para construir un intervalo de confianza para usamos la distribucin muestral de la media
muestral
) , ( ~
n
N x

& , entonces aproximadamente 95% de los valores de estarn a 1,96


desviaciones estndar de .
|

\
|
n
N

,

) (

95%

2 22 2

n

n
+ ++ + 2 22 2
X
x


Un intervalo de confianza (1 )*100% para est dado por:

|

\
|


n
z

x
2
1

donde
z
1
2

es un percentil de la distribucin N(0,1)


Este intervalo ser exacto si los datos provienen de una muestra aleatoria de una
poblacin Normal. Ser aproximado para cualquier otra poblacin y tamaos de muestra
30 > n (Teorema de Lmite Central).


Pgina 9 de 11

Bebidas
Suponga que una mquina de bebidas esta calibrada de tal manera que la cantidad de
lquido entregado es aproximadamente normal con desviacin estndar 0,15 decilitros
(nota: 1 decilitro es 0,1 litro).

a) Calcule un intervalo de 95% de confianza para la media de la cantidad de lquido
entregado basado en una muestra aleatoria de 36 vasos con promedio de 2,25
decilitros.
b) Un intervalo de 90% de confianza ser ms ancho o ms angosto que el calculado
en la parte (a)?
c) Qu tamao de muestra necesitara si quisiera obtener un margen de error para un
intervalo de 95% de confianza sea 0,02?

Una vez ms nos encontramos con el problema de que en general no conocemos la
desviacin estndar de la poblacin (), por lo tanto estimamos con la desviacin estndar
de la muestra seleccionada (s), y tenemos que usar la distribucin t de Student en vez de la
Normal.

Un intervalo de confianza (1 )*100% para est dado por:

( )
|

\
|


n
1
2
- 1
s
t x
n


donde
( ) 1
2
- 1
n
t


es el percentil apropiado de la distribucin t con (n-1) grado de libertad.

Este intervalo nos da valores posibles para la media de la poblacin basados en la media
muestral x . Se basa en el supuesto de que los datos provienen de una muestra aleatoria de
una poblacin con distribucin normal con desviacin estndar desconocida. Si el
tamao de la muestra es grande, el supuesto de normalidad no es crucial, sin embargo
debemos preocuparnos si la distribucin de los datos es sesgada o tiene valores extremos.

El margen de error de la media poblacional es:
( )
|

\
|
=

n
1
2
- 1
s
t E
n

.

Colesterol
Un mdico interesado en conocer la media del colesterol en la poblacin toma una muestra
de tamao 225. Calcule los lmites de confianza de 99% para el promedio de colesterol
sanguneo si en la muestra se encontr un promedio de 190 y una desviacin estndar 15.
Interprete el intervalo de confianza encontrado.


Pgina 10 de 11

Intervalos de confianza y Test de Hiptesis

Se puede docimar la hiptesis
0 1 0 0
: : versus = H H
con un nivel de significacin
usando la siguiente regla de decisin:
Rechazar H
0
si el correspondiente intervalo de confianza (1 )x100% para la media de la
poblacin

no contiene al valor hipottico en H


0
.

Nota: El test tiene que ser de dos colas y el nivel de confianza ms el nivel de significacin
tienen que sumar 100%.


Patrones de sueo en nios
Un estudio de los patrones de sueo de nios de seis meses en Estados Unidos afirma que
un intervalo de 95% de confianza para el promedio de tiempo que los nios duermen (en un
periodo de 24 horas) es (11,5 - 15,2) horas. Suponga que queremos docimar
15 : 15 :
1 0
versus = H H
.

a) Qu decisin tomamos si 05 , 0 = ?

b) Qu decisin tomamos si 01 , 0 = ?


Tabla resumen:

Situacin Parmetro Test Estadstico Intervalo de Confianza


Muestra aleatoria
de una poblacin
normal con
conocida

Media




n
x
z

=


|

\
|


n 2
1

z x


Muestra aleatoria
de una poblacin
normal con
desconocida


Media




n
s
x
t
0

=



( )
|

\
|


n
S
1
2
- 1
n
t x




Muestra aleatoria
de una poblacin

Proporcin

P


n
p p
p p
z
) 1 (

0 0
0

=


$
$ $
p
p(1- p)
n

|
\

z
1
2




Pgina 11 de 11

En resumen, los pasos bsicos para docimar cualquier hiptesis y la forma general de los
intervalos de confianza, para lo que necesitaremos un estimador puntual para el parmetro
y su correspondiente error estndar, son:

Pasos bsicos para docimar una hiptesis acerca de un parmetro:

1. Definir cual es la poblacin y el o los correspondientes parmetros de inters.

2. Establecer las hiptesis (nula y alternativa).

3. Establecer el nivel de significacin .

4. Recoger los datos y verificar los supuestos.

5. Calcular el test estadstico usando los datos. La forma general del test estadstico es:

6. Calcular el valor p.

7. Tomar una decisin e informar la conclusin en trminos del problema establecido por
el investigador.


Forma general de los Intervalos de Confianza:

|
|

\
|
|
|

\
|
|
|

\
|

estimador del
estndar error
muestral n distribuci
percentil
puntual
estimador



estndar error
nulo valor puntual estimador
o Estadstic Test

Anda mungkin juga menyukai