Anda di halaman 1dari 21

INTERVALO DE CONFIANZA PARA PROPORCIONES

1. PARA UNA PROPORCION


A) FUNDAMENTO TEORICO
Sea X1, X2, , Xn una muestra aleatoria de tamao n escogida de una poblacin de
Bernoulli B(1,p), donde el parmetro p es la proporcin de xitos en la poblacin.
En la muestra cada X1=1, si ocurre xito con probabilidad p, y cada X1=0, si no ocurre
xito en la probabilidad 1-p.
El estimador puntual del parmetro p es la estadstica

p proporcin de xitos en la

muestra definida por:


n

Xi

=X
P
n

= i=1
P
n

Donde, la variable aleatoria:


n

X = X i
i=1

es el nmero de xitos en la muestra y cuya distribucin es binomial B(n,p).

El valor

=X
P
n

que se obtiene de

para una muestra especfica, es la

estimacin puntual del parmetro p.


La estadstica

Su media

Y su varianza

P
tiene las siguientes propiedades:

)= p
P =E ( P

2
) =p (1 p)/n
=Var ( P
P

Adems, si la muestra es grande (n30), entonces, por el teorema del lmite central,

la distribucin de probabilidad de

es aproximadamente la normal, con media p y

con varianza p(1-p)/n.


Luego, la variable aleatoria estandarizada:

Z=

Adems, si hacemos p= P
entonces, el error tpico de

p
P
p(1 p)/ n

N(0,1)

(por estimacin puntual para muestras grandes),

P
es

ET= p x ( 1 p ) / n

Por tanto, la estadstica Z definida por Z= ( p p)/ ET

es la estadstica de pivote

para deducir el intervalo de confianza del parmetro p.

Dada la probabilidad 1-, en la distribucin de Z se halla el valor

Z 0 =Z

; tal

como en la figura 1, tal que:

P [Z 0 Z Z 0 ] =1

Sustituyendo

la

expresin

de

p)/ ET
Z =( P

realizando

operaciones

convenientes se obtiene:

P [ PZ
0 xET p P+Z 0 xET ] =1
Luego:
Si

P
es la proporcin de xitos en una muestra aleatoria de tamao n grande,

entonces, el intervalo de confianza del

pZ 0 xET p p + Z 0 xET

(1 )100 para p es:

Donde,

ET= p x ( 1 p ) /n es el error tpico de

La ilustracin de la figura 1 es:

Intervalo de estimacin del

(1 )100 para p

Donde:

a= p Z 0 xET

b= p +Z 0 xET

Son los lmites de confianza de p, inferior y superior respectivamente.


B) Ejemplos:
B.1) Ejemplo 1
Una encuestadora utiliz una muestra aleatoria de 600 electores que acaban de votar
y encontr que 240 votaron a favor del candidato A.
a) Estimar el porcentaje de electores a favor de A en toda la poblacin, utilizando un
intervalo de confianza del 95%.
b) Si la proporcin a favor del candidato A se estima en 40%, cunto es el error
mximo de la estimacin, si se quiere tener una confianza del 98%'?.
c) Si con la misma muestra la proporcin a favor de B se estima en 38% con una
confianza del 98% que el error no es mayor a 4.62%, Se pueJe proclamar a A como
ganador de las elecciones?.

d) Qu tan grande se requiere que sea la muestra si se desea tener una confianza
del 94% de que el error de estimacin de p no sea superior a 2%?.
SOLUCION
a) La estimacin puntual de la proporcin p a favor de A en la poblacin, es la
proporcin a su favor en la muestra de n = 6 00 electores; esto es.

p = 240/600 = 0.40.
La estimacin del error estndar es

Para 1 - = 0.95 se tiene

=z 0.975 =1.96

Los lmites de confianza de p, inferior y superior, son respectivamente:

p z

^ p =0.40 0.0392

Luego, el intervalo de confianza del 95% para p es de 0.3608 a 0.4392.


Es decir, p [36.08%, 43.92%] con confianza del 95%.
b) Si p se estima por p se tiene una confianza del (1 - ) x 100% que el error de la

estimacin no ser mayor que

Para una confianza del 98%,

p (1 p )/n

=z 0.9 9 =2. 33

,y

p (1 p )/n=2.33 (0.40)(0.60)/600=0.0466

Luego, si con n = 600, p se estima en 0.40, se tiene una confianza del 98% de que el
error de la estimacin a favor de A no ser mayor a 4.66%.

c) El intervalo de confianza del 98% a favor de A es [35.34%, 44.66%].


El intervalo de confianza del 98% a favor de B es [33.38%, 42.62%].
Dado que la interseccin de los intervalos no es vaca, no se puede proclamar a A
como ganador. En este caso se dice que hay un empate tcnico
d) Dado el error mximo e de la estimacin de p con confianza de (1 ) x 100% el
tamao n de la muestra, se puede determinar en dos formas:
d1) Si se tiene el valor de

(de una muestra preliminar o piloto), el error mximo

de estimacin de p es:

e=z

p (1 p )/n
2

p (1 p )
z
(
)
n=
1

De donde resulta;

e2

p =0.60. Para el nivel de confianza 1 - =0.94.

En nuestro ejemplo

Se obtiene:

=z 0.9 7 =1.88

Luego, se tiene una confianza del 94 % que el error al estimar p no ser mayor que
0.02 si el tamao de la muestra es:

n=( 1.88 )2 (0.6)(0.4)/ ( 0.02 )2=2120.64 21.21

d2) Si no se tiene el valor p , entonces, se puede usar el valor mximo


1/2.

En efecto,

Luego de

p q = p (1 p )= p 1 + 1/4 1/4
2

e=z

p (1 p )/n

Resulta:

z
(
)
n
1

4 e2

Para 1 = 0 94,

=z 0.9 7 =1.88

Luego, se tiene una confianza del 94% que el error al estimar p no ser mayor de 0.02
si el tamao de la muestra es,

n=( 1.88 )2 /(4 ( 0.02 )2)=2209


NOTA. Si el muestreo es sin reemplazo en una poblacin (Bernoull de valores 0 y 1)
finita de tamao N, entonces el error estndar de

^ p =

p es:

p (1 p ) Nn
n
N1

y el valor de n se calcula por


2

n= z

Si se desconoce , p

1
2

( )
2

( )
1

N
pq

( N 1 )
pq+e

, se puede utilizar el valor

p =0.5.

B.2) Ejemplo 2
Una empresa va a hacer un estudio de mercado antes de lanzar un nuevo producto
hacia una poblacin de 30,000 consumidores.
a) Qu tamao de muestra deber escoger si quiere tener una confianza del 95% de
que error de la estimacin de la proporcin a favor del producto no sea superior al
4%?.
b) Si con el tamao de la muestra calculado en a) se utiliza

= 0.7 como

estimacin de la proporcin de todos los consumidores que prefieren su producto.

Qu grado de confianza utiliz si estim de 19,783 a 22,217 el total de consumidores


de la poblacin que prefieren su producto?
SOLUCION

a) Para 1 - = 0.95 se tiene

Utilizando el valor

n= z

( )

p (1 p )=1/4

=z 0.975=1.96

y N = 30,000 se tiene

N
pq

( 1.96 )2 (30,000)
=588.49 589
2
2

( N 1 ) (1.96)2+ 4 ( 0.04 )2( 30,0001)


pq+e
1

(12 )

b) El intervalo 19.783Np22.217, resulta de N(

p=

p ( 1 p )
n

), donde

)( NN n
1 )

Para n = 589, N = 30,000 y

De 22.217=N(

p z

p + z

p = 0.70, se obtiene p

) resulta

=2.17

= 0.0187,

, 1 /2 =0.985, donde =0.03 y

1 = .097

2. Intervalos de confianza para 2 proporciones


Vamos a considerar que tenemos dos poblaciones de modo que en cada una de ellas
estudiamos una v.a. dicotmica (Bernoulli) de parmetros respectivos p1 y p2. De
cada poblacin vamos a extraer muestras de tamao n1 y n2

Si las muestras son sucientemente grandes ocurre que una aproximacin para un
intervalo de conanza al nivel 1 para la diferencia de proporciones de dos
poblaciones es:

Ejemplo:
Se cree que la osteoporosis est relacionada con el sexo. Para ello sea elige una
muestra de 100 hombres de ms de 50 aos y una muestra de 200 mujeres en las
mismas condiciones. Se obtiene que 10 hombres y 40 mujeres con algn grado de
osteoporosis. Qu podemos concluir con una conanza del 95 %?
Solucin:
Llamamos p1 a la incidencia de la osteoporosis en las mujeres de ms de 50 aos y
p2 a la de los hombres. Calculemos un intervalo de confianza para la diferencia (p1
p2). Si 0 no forma parte de dicho intervalo con una confianza del 95% podemos decir
que p1 es diferente a p2 (con tal grado de confianza, por supuesto).
La estimacin puntual insesgada que podemos hacer de ambos parmetros a partir de
los datos muestrales son:

Es decir, tenemos una confianza del 95% en la afirmacin de que la diferencia entre la
incidencia de osteoporosis en mujeres y hombres esta entre 0,02 (2 %) y 0,18 (18 %).
Obsrvese que como 0% no es un valor de dicho intervalo puede concluirse con una
confianza del 95% que hay diferente incidencia de osteoporosis en hombres que en
mujeres para las personas de ms de 50 aos. Esta conclusin es algo ms pobre de
lo que hemos obtenido con el intervalo de confianza, pero visto de esta manera, este
ejemplo puede considerarse como una introduccin a los contrastes de hiptesis.

PRUEBA DE HIPTESIS ACERCA DE PROPORCIONES


1. PRUEBA DE HIPOTESIS PARA UNA PROPORCION
A) FUNDAMENTO TERICO
Cuando el objetivo del muestreo es evaluar la validez de una afirmacin con respecto
a la proporcin de una poblacin, es adecuado utilizar una prueba de una muestra. La
metodologa de prueba depende de si el nmero de observaciones de la muestra es
grande o pequeo.Como se habr observado anteriormente, las pruebas de grandes
muestras de medias y proporciones son bastante semejantes. De este modo, los
valores estadsticos de prueba miden la desviacin de un valor estadstico de muestra
a partir de un valor propuesto. Y ambas pruebas se basan en la distribucin normal
estndar para valores crticos. Quiz la nica diferencia real entre las ambas radica en
la forma corno se obtiene la desviacin estndar de la distribucin de muestreo.
Esta prueba comprende el clculo del valor estadstico de prueba Z

Posteriormente este valor es comparado con el valor de Z, obtenido a partir de una


tabla normal a un nivel de significacin seleccionado.
Como ocurri con la prueba de medias de una muestra, las pruebas de proporciones
pueden ser de una o dos colas.

La primera alternativa establece una prueba de cola derecha, la segunda, izquierda y


la tercera, una prueba de dos colas.
EJEMPLO
En un estudio se afirma que 3 de 10 estudiantes universitarios trabajan. Pruebe esta
aseveracin, a un nivel de significacin de 0,025, respecto a la alternativa de que la

proporcin real de los estudiantes universitarios trabajan es mayor de lo que se afirma,


si una muestra aleatoria de 600 estudiantes universitarios revela que 200 de ellos
trabajan. La muestra fue tomada de 10000 estudiantes.
Los datos son:

Como en los datos aparece el tamao de la poblacin, se debe verificar si el tamao


de la nuestra es mayor que el 5%. Se remplaza valores en la siguiente frmula:

Los clculos en Excel se muestran en la siguiente figura:

El grfico elaborado se muestra a continuacin:

2. PRUEBA DE PROPORCIONES DE DOS MUESTRAS


El objetivo de una prueba de dos muestras es determinar si las dos muestras
independientes fueron tomadas de dos poblaciones, las cuales presentan la misma
proporcin de elementos con determinada caracterstica. La prueba se concentra en la
diferencia relativa (diferencia dividida entre la desviacin estndar de la distribucin de
muestreo) entre las dos proporciones muestrales. Diferencias pequeas denotan
nicamente la variacin casual producto del muestreo (se acepta H0), en tanto que
grandes diferencias significan lo contrario (se rechaza H0). El valor estadstico de
prueba (diferencia relativa) es comparado con un valor tabular de la distribucin
normal, a fin de decidir si H0 es aceptada o rechazada. Una vez ms, esta prueba se
asemeja considerablemente a la prueba de medias de dos muestras.
La hiptesis nula en una prueba de dos muestras es

EJEMPLO
Se ponen a prueba la enseanza de la Estadstica empleando Excel y Winstats. Para
determinar si los estudiantes difieren en trminos de estar a favor de la nueva
enseanza se toma una muestra de 20 estudiantes de dos paralelos. De paralelo A 18
estn a favor, en tanto que del paralelo B estn a favor 14. Es posible concluir con un
nivel de significacin de 0,05 que los estudiantes que estn a favor de la nueva
enseanza de la Estadstica es la misma en los dos paralelos?.
Los datos son:

Calculando la proporcin muestral se obtiene:

Los clculos en Excel se muestran en la siguiente figura:

El grfico elaborado se muestra a continuacin:

Decisin:

3. PRUEBA DE PROPORCIONES DE K MUESTRAS

Prueba de proporciones de k muestras

En una muestra se puede dar un conjunto de sucesos, los cuales ocurren con
frecuencias observadas "o"(las que se observa directamente) y frecuencias esperadas
o tericas "e" (las que se calculan de acuerdo a las leyes de probabilidad).

Por lo tanto el valor estadstico de prueba para este caso es la prueba ji cuadrado o
conocida tambin como chi cuadrado
Como sucede con las distribuciones t y F, la distribucin ji cuadrado tiene una forma
que depende del nmero de grados de libertad asociados a un determinado problema.
Para obtener un valor crtico (valor que deja un determinado porcentaje de rea en la
cola) a partir de una tabla de ji cuadrado, se debe seleccionar un nivel de significacin
y determinar los grados de libertad para el problema que se est resolviendo.

EJEMPLO:

Determine el nmero de grados de libertad y obtenga el valores crtico en el niveles


0,05 se significacin.
Solucin:
Los grados de libertad se calculan aplicando la frmula:

Los clculos en Excel se muestran en la siguiente figura:

2) La siguiente tabla muestra las frecuencias observadas y las frecuencias esperadas


al lanzar un dado 60 veces. Contrastar la hiptesis de que el dado es bueno, con un
nivel de significacin de 0,01.

Solucin:

Los clculos en Excel se muestran en la siguiente figura:

El grfico elaborado se muestra a continuacin:

Decisin:

Anda mungkin juga menyukai