Anda di halaman 1dari 28

Inferencia estadstica: es el proceso de

sacar conclusiones de la poblacin basados


en la informacin de una muestra de esa
poblacin.

Objetivos de la inferencia:
- estimacin de parmetros,
- intervalos de confianza y
- docimasia, test de hiptesis o pruebas de
significacin estadstica.

Intervalos de Confianza para una


proporcin
Cuando hacemos un test de hiptesis
decidimos sobre un valor hipottico del
parmetro.
Qu proporcin de mujeres espera
compartir las tareas de la casa con su
pareja?
Qu proporcin de la poblacin sufre de
cncer?
Cada una de estas preguntas es sobre el
valor de la proporcin P . Es decir,
queremos estimar P .

Una proporcin muestral p es un


estimador puntual de la proporcin en la
poblacin P .

Un estimador de intervalo de confianza de


la proporcin en la poblacin P , es un
intervalo, calculado a partir de los datos de
la muestra, en el cual nosotros confiamos
se encuentra la proporcin de la poblacin
P.

El nivel de confianza es la probabilidad de


que el mtodo de estimacin nos d un
intervalo que contiene al parmetro ( P en
este caso).
El nivel de confianza se denota por 1 .

Nivel de significacin Nivel de confianza

1
0,10 o 10%
0,05 o 5%
0,01 o 1%

90%
95%
99%

Para construir intervalos de confianza recordemos la


distribucin muestral de p$ :

P(1 P)
p ~& N ( P,
)
n
entonces aproximadamente 95% de los valores de p$
estarn entre dos desviaciones estndar de P :
N ( P,

P(1 P)
)
n

95%
4
p-2

p (1 -p)
n

p +2

p (1 - p )
n

P(1 P)
p 1,96
Hacemos un intervalo:
n

Esperamos que 95% de esos intervalos contengan a


P y 5% no.
El problema es que no podemos conocer la
desviacin estndar porque contiene al parmetro
desconocido.
Solucin: Estimar la desviacin estndar, con el
error estndar de p$ :

S ( p ) =

p (1 p )
n

Un intervalo de 95% de confianza para P esta


dado por:

p(1 - p)

p 1,96

En teora esta aproximacin funciona bien si


se cumple que: nP 5 y n(1 P ) 5 .
En la prctica la comprobamos con:
np 5 y n(1 p ) 5

Estudio: Sndrome de fatiga crnica o


encefalopata milgica
Se realiza un estudio para conocer la proporcin de adultos
que sufren del sndrome de fatiga crnica (SFC).
Para este estudio, se eligen al azar 4000 miembros de una
Isapre, a los que se les enva un cuestionario por correo.
En el cuestionario se les pregunta por cualquier fatiga
inusual que haya interferido sus responsabilidades en el
trabajo o en la casa en los ltimos 6 meses.
De las 3066 personas que respondieron (posible sesgo por
no respuesta), 590 afirmaron haber sufrido de fatiga
crnica.
Se quiere estimar la proporcin de adultos que piensan
que sufren de sndrome de fatiga crnica.

De las 3066 respuestas, 590 dicen sufrir fatiga


crnica, un estimador puntual ser:

p = 590
0,192
3066
o 19,2%

Un intervalo de confianza 95% para la


verdadera proporcin de adultos que piensan
que sufren de SFC est dado por:
(590 / 3066)(1 590 / 3066)
590
1,96
3066
3066

0,1924 0,013954

[0,179 ; 0,206]
o una tasa de 179 a 206 por 1.000 adultos.

Este intervalo nos da valores posibles de la


proporcin en la poblacin de personas que
piensan que sufren del SFC basado en una
muestra de tamao n = 3066.

Pensemos:
Sabemos si el intervalo de 95% de
confianza contiene a la verdadera
proporcin en la poblacin que piensan que
sufren de SFC?

Este nivel de 95% confianza significa que


hay una probabilidad de 95% de que la
verdadera proporcin P est en el intervalo
[0,179 ; 0,206]?

Podemos extender estos resultados al resto


de la poblacin general de adultos?

Interpretacin!
El intervalo que construimos o contiene P
o no lo contiene.
No es correcto decir que la probabilidad de
que el intervalo [0,178 ; 0,206] contenga a
P es 0,95.
El valor del parmetro P es fijo. No vara.

La interpretacin del nivel de 95% de


confianza tiene que ver con la proporcin
de veces que intervalos como el que
construimos contiene a P si lo hiciramos
muchas veces.

p
m.a.s #1
m.a.s. #2
m.a.s. #3
m.a.s. #4

Si repetimos este procedimiento muchas


veces, calculando muchos intervalos de
confianza de 95% para P , podemos
esperar que aproximadamente 95% de
P
(y
estos intervalos contenga
aproximadamente 5% no).

Revisemos los percentiles de la Tabla


N(0,1):
Nivel de
Confianza

0,90
0,95
0,98
0,99

0,95
0,975
0,99
0,995

1,645
1,96
2,33
2,575

N(0,1)

-z

1
2

Z
+z 1
2

Un intervalo de confianza (1 ) *100%


para P est dado por:

p$ z

p(1$
$
p)

donde:
z
es un percentil de la distribucin
1
2
N(0,1)

Este intervalo da valores posibles para la


proporcin en la poblacin P basado en
slo una proporcin muestral p$ .
Esta aproximacin esta basada en el
supuesto de que los datos provienen de una
muestra aleatoria de la poblacin y
funciona bien si nP 5 y n(1 P) 5 .
Esta condicin se puede corroborar con
np 5 y n(1 p ) 5 .

Forma general de los Intervalos de


Confianza:

estimador

puntual

error estndar
percentil


distribuci n muestral del estimador

PES revisitado
Recordemos el experimento diseado para
probar si un sujeto tiene PES (poderes
extrasensoriales). De un mazo corriente bien
barajado, se eligen 96 cartas, una por una, con
reemplazo. A la persona en cuestin se le pide
que adivine la pinta de la carta.
Sea P la proporcin de respuestas correctas si
el sujeto no tiene PES.
La persona tiene 35 correctas de las 96 cartas,
entonces la proporcin muestral de respuestas
correctas es:

p$

Construya un intervalo de 95% confianza para


P basado en los resultados observados.
Este intervalo de confianza contiene a 0,25? Si
es as, qu implica? Si no lo contiene, qu
podemos inferir?

Pensemos:
Si el nivel de confianza aumenta de 95% a
99%, el intervalo de confianza ser:
ms ancho, ms angosto, o el mismo?
Si el tamao muestral aumenta (pero la
proporcin muestral es la misma), el
intervalo de confianza ser:
ms ancho, ms angosto, o el mismo?
Si el tamao de la poblacin aumenta, el
intervalo de confianza ser:
ms ancho, ms angosto, o el mismo?

FUMADORES
Tabaquismo

Total
(n=1007)

Total
n (%)

Hombres
n (%)

Mujeres
n (%)

368 (36,5) 134 (39,5) 234 (35,0)

La tabla presenta la prevalencia de fumadores


en una encuesta realizada en residentes de la
ciudad de Talca, adultos de 18 a 74 aos, el ao
2005 (http://pifrecv.utalca.cl/)
a) Cul es la poblacin bajo estudio?
b) Basado en los resultados del estudio,
construya un intervalo de 90% de confianza
para la proporcin de sujetos que fuman.
c) Interprete el intervalo.
d) Construya un intervalo de 95% de confianza
para la proporcin de sujetos que fuman. Es
este intervalo ms ancho o ms angosto del
calculado en (b)?
e) Cul es la mitad del ancho del intervalo?

Definicin:
El margen de error para una proporcin es
la mitad del ancho del intervalo de
confianza, y est dado por:

E= z

p(1$
$
p)

___________________________

E = Margen de Error
---------(------------------------------|------------------------------)-------p$ (1 p$ )
p$ (1 p$ )
p$
p$ + z
p$ z
1
n
n
1
2
2
_______________________________________________________

Ancho

Se calcula un intervalo de 99%


confianza para P que resulta: (0,27 , 0,42)
(a) Cul es el valor de la proporcin
muestral p$ ?

(b) Cul es el margen de error?

(c) D dos sugerencias para reducir el


margen de error.

Cul es el tamao de la muestra?


A partir del margen de error podemos
resolver ahora cuanto puede ser un tamao
muestral mnimo n.
Tamao de la muestra:

n=

( z1 ) 2 p (1 p )
2

Pero esta frmula contiene a la proporcin


muestral p$ y todava no tenemos la
muestra!

Encontremos el mximo.
Dibuje p$ versus p$ (1- p$ )

P P(1-P)
0,0 0,0
0,1 0,09
0,2 0,16
0,3 0,21
0,4 0,24
0,5 0,25
0,6 0,24
0,7 0,21
0,8 0,16
0,9 0,09
1,0 0,0

P(1-P)

0.3
0.25
0.2
0.15
0.1
0.05
0
0

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9


P

Definicin:
Si desconocemos la variabilidad en la
poblacin, el tamao muestral requerido
para estimar la proporcin de una poblacin
con nivel de confianza (1 ) y margen de
error E esta dado por:

1 1
( z ) 1
1
2 2
2
n=
E2
2

z
1 2
n=
2E

La Cruz Roja quiere venir a sacar


sangre a la Universidad de Talca y nos pide
que estimemos la proporcin de estudiantes
y funcionarios que estaran dispuestos a
donar sangre. Con confianza 99% y un 4%
de margen de error a cuantas personas
debemos entrevistar?
Una estimacin conservadora sera:

z
1 2
n=
2E

2
2,576
= 1036,84
=
2(0,04)

Por lo tanto necesitamos entrevistar al


menos 1037 estudiantes y funcionarios.

En la oficina de admisin de la UTal


quieren estimar la proporcin de alumnos
que abandona la Universidad despus del
primer ao de estudio. A cuantos
estudiantes debe entrevistar para construir
un intervalo de confianza para P del 90%
con un margen de error de 2 puntos
porcentuales?

Correccin para poblacin finita (cpf)


(Opcional)
La frmula para calcular el tamao muestral
supone que el tamao de la poblacin es
grande o es un muestreo con reemplazo.
Cuando queremos sacar una muestra de una
poblacin pequea en conveniente usar la
cpf

n
nc =
1 n N
Ejemplo: Crdito universitario.
Supongamos que queremos conocer la
proporcin que tiene crdito universitario
entre los alumnos de Psicologa de la UTal.
Con un nivel de confianza de 95% y un
margen de error del 5% a cuantos
estudiantes debe encuestar?

z
1 2
n=
2E

2
1,96
= 384,16
=
2(0,05)

Pero en el ao 2001 haba slo 71 alumnos


en la carrera!

384
nc =
= 59,9
1 + 384 71
Tienen que encuestar a 60 personas.

Anda mungkin juga menyukai