Anda di halaman 1dari 32

Intervalos de confianza Prof. Mara B.

Pintarelli

3- Intervalos de confianza
3.1 Introduccin

Se ha visto como construir a partir de una muestra aleatoria un estimador puntual de un parmetro
desconocido. En esos casos necesitbamos dar algunas caractersticas del estimador, como por ejem-
plo si era insesgado o su varianza.
A veces resulta ms conveniente dar un intervalo de valores posibles del parmetro desconocido, de
manera tal que dicho intervalo contenga al verdadero parmetro con determinada probabilidad.
Especficamente, a partir de una muestra aleatoria se construye un intervalo ,
donde los ex-

1 2

tremos y son dos estadsticos, tal que P ,


1 donde es el parmetro des-
1 2 1 2
conocido a estimar y es un valor real entre cero y uno dado de antemano. Por ejemplo si 0.05
, se quiere construir un intervalo
,
tal que P
,
0.95 , o escrito de otra forma

1 2 1 2

P 0.95
1 2

Esta probabilidad tiene el siguiente significado: como 1 y 2 son estadsticos, los valores que
ellos toman varan con los valores de la muestra, es decir si x1 , x2 ,..., xn son los valores medidos de
la muestra entonces el estadstico 1 tomar el valor 1 y el estadstico 2 tomar el valor 2 . Si
medimos nuevamente la muestra obtendremos ahora valores x1 , x2 ,..., xn y por lo tanto 1 tomar
, , ,

el valor 1 y el estadstico 2 tomar el valor 2 , diferentes en general de los anteriores. Esto


, ,

significa que si medimos la muestra 100 veces obtendremos 100 valores diferentes para 1 y 2 y
por lo tanto obtendremos 100 intervalos distintos, de los cuales aproximadamente 5 de ellos no con-
tendrn al verdadero parmetro.
Al valor 1 se lo llama nivel de confianza del intervalo. Tambin se suele definir como nivel de
confianza al 1 100%
La construccin repetida de un intervalo de confianza para se ilustra en la siguiente figura

42
Intervalos de confianza Prof. Mara B. Pintarelli

3.2 Intervalo de confianza para la media de una distribucin normal, varianza conocida.

El mtodo general para construir intervalos de confianza es el siguiente llamado mtodo del pivote:

Supongamos el siguiente caso particular, sea X 1 , X 2 ,..., X n una muestra aleatoria de tamao n de
una v.a. X donde X ~ N ( , 2 ) , 2 conocido, se quiere construir un intervalo de confianza para
de nivel 1 . Supongamos 0.05 .
1- tomamos un estimador puntual de , sabemos que X es un estimador con buenas propieda-
des.
X
2- a partir de X construimos el estadstico Z . Notar que Z (pivote) contiene al verda-

n
dero parmetro y que bajo las condiciones dadas Z ~ N (0,1)
3- como conocemos la distribucin de Z, podemos plantear: hallar un nmero z tal que
P z Z z 0.95
Por la simetra de la distribucin normal estndar podemos escribir
P z Z z z z 2z 1 0.95 z 0.975 z 1.96


X
Por lo tanto P 1.96 Z 1.96 P 1.96 1.96 0.95

n
Despejamos :

X
P 1.96 1.96 P 1.96 X 1.96
n n
n

P 1.96 X 1.96 X P X 1.96 X 1.96 0.95
n n n n

Entonces

P X 1.96 X 1.96 P X 1.96 ; X 1.96 0.95
n n n n


Es decir el intervalo de confianza para es X 1.96 ; X 1.96 y tiene nivel de confianza
n n
0.95 o 95%.
X 1.96 y
Aqu X 1.96
1 2
n n

Repetimos el procedimiento anterior y construimos un intervalo de confianza para con nivel de


confianza 1
1 n
1-Partimos de la esperanza muestral X X i para una muestra aleatoria X1 , X 2 ,..., X n de ta-
n 11
mao n. Sabemos que es un estimador insesgado y consistente de .

43
Intervalos de confianza Prof. Mara B. Pintarelli

2-Construimos el estadstico
X
Z ~ N (0,1)
/ n

La variable aleatoria Z cumple las condiciones necesarias de un pivote


Para construir un intervalo de confianza al nivel de confianza 1- partiendo del pivote Z, comenza-
mos por plantear la ecuacin

P z Z z 1- ,

donde la incgnita es el nmero real z.

Si reemplazamos la v.a. Z por su expresin tenemos:

X
P z z P z X z P X z X z 1-
/ n n n n n

Multiplicando todos los miembros de la desigualdad por -1 (el orden de los miembros se invierte)
llegamos a:

P X z X z 1-
n n
Evidentemente, si definimos

1 X z n


, hemos construido dos estadsticos 1 y 2 tales que P 1 2
1- ,

2 X z
n
es decir hemos construido el intervalo de confianza bilateral deseado ,
. Todos los elementos
1 2

que forman los estadsticos 1 y 2 son conocidos ya que el nmero z verifica la ecuacin anterior,
es decir (ver figura):

z z z
2


2
2

z z
2 2

P z Z z z z =1- donde z es la Fda para la v.a. Z ~ N


(0,1)

Recordando que z 1 z , esta ecuacin queda:

44
Intervalos de confianza Prof. Mara B. Pintarelli

z z = 2z 1 =1- , o bien (ver figura anterior),



z 1 o de otra forma P( Z z ) .
2 2
Al valor de z que verifica esta ecuacin se lo suele indicar z . En consecuencia, el intervalo de
2
confianza bilateral al nivel de significacin 1- queda:

, X z
1 2

, X z


2 n 2 n
En consecuencia:

Si X 1 , X 2 ,..., X n una muestra aleatoria de tamao n de una v.a. X donde X ~ N ( , 2 ) , 2


conocido, un intervalo de confianza para de nivel 1 es

X z , X z (8.1)
2 n 2 n

Ejemplo:
Un ingeniero civil analiza la resistencia a la compresin del concreto. La resistencia est distribuida
aproximadamente de manera normal, con varianza 1000 (psi)2. Al tomar una muestra aleatoria de
12 especmenes, se tiene que x 3250 psi.
a) Construya un intervalo de confianza del 95% para la resistencia a la compresin promedio.
b) Construya un intervalo de confianza del 99% para la resistencia a la compresin promedio.
Compare el ancho de este intervalo de confianza con el ancho encontrado en el inciso a).

Solucin:
La v. a. de inters es Xi: resistencia a la compresin del concreto en un espcimen i
Tenemos una muestra de n 12 especmenes.
Asumimos que X i ~ N ( , 2 ) para i 1,2,3,...,12 con 2 1000
a) Queremos un intervalo de confianza para de nivel 95%. Por lo tanto 0.05

El intervalo a utilizar es X z , X z .
2 n 2 n
Buscamos en la tabla de la normal estndar el valor de z z 0.025 1.96
2
Reemplazando:

1000 1000
3250 1.96 ,3250 1.96 3232.10773, 3267.89227
12 12
b) repetimos lo anterior pero ahora 0.01

El intervalo a utilizar es X z , X z .
2 n 2 n
Buscamos en la tabla de la normal estndar el valor de z z 0.005 2.58
2
Reemplazando:

45
Intervalos de confianza Prof. Mara B. Pintarelli

1000 1000
3250 2.58 ,3250 2.58 3226.44793, 3273.55207
12 12

La longitud del intervalo encontrado en a) es: 35.78454


La longitud del intervalo encontrado en b) es: 47.10414
Notar que la seguridad de que el verdadero parmetro se encuentre en el intervalo hallado es mayor
en el intervalo b) que en el a), pero la longitud del intervalo b) es mayor que la del intervalo a).
Al aumentar el nivel de confianza se perdi precisin en la estimacin, ya que a menor longitud hay
mayor precisin en la estimacin.

En general la longitud del intervalo es L 2 z
2 n
Notar que:
a) si n y estn fijos, a medida que disminuye tenemos que z aumenta, por lo tanto L
2
aumenta.
b) si y estn fijos, entonces a medida que n aumenta tenemos que L disminuye.

Podemos plantearnos la siguiente pregunta relacionada con el ejemplo anterior: qu tamao n de


muestra se necesita para que el intervalo tenga nivel de confianza 99% y longitud la mitad de la
longitud del intervalo hallado en a)?
Solucin: el intervalo hallado en a) tiene longitud 35.78454, y queremos que el nuevo intervalo tenga
longitud 17.89227 aproximadamente. Planteamos:
1000
L 2z 17.89227 2 2.58 17.89227
2 n n

Despejando n :
2
1000
2 2.58 n n 83.170
17.89227

O sea, hay que tomar por lo menos 84 especmenes para que el intervalo tenga la longitud pedida.


En general, si queremos hallar n tal que L 2 z l , donde l es un valor dado, entonces
2 n
despejando n
2z
2


n 2
l

Si estimamos puntualmente al parmetro con X estamos cometiendo un error en la estimacin
L
menor o igual a z , que se conoce como precisin del estimador
2 2 n

46
Intervalos de confianza Prof. Mara B. Pintarelli

Ejemplo: Se estima que el tiempo de reaccin a un estmulo de cierto dispositivo electrnico est
distribuido normalmente con desviacin estndar de 0.05 segundos. Cul es el nmero de medicio-
nes temporales que deber hacerse para que la confianza de que el error de la estimacin de la espe-
ranza no exceda de 0.01 sea del 95%?

L
Nos piden calcular n tal que z 0.01 con 0.05 .
2 2 n
2
0.05
Por lo tanto n z 0.025 .
0.01
2
0.05
Entonces n z 0.975 1.96 5 96.04 .
2
Adems z 0,025 =1.96.
0.01
O sea hay que tomar por lo menos 97 mediciones temporales.

Para muestras tomadas de una poblacin normal, o para muestras de tamao n 30 , de una po-
blacin cualquiera, el intervalo de confianza dado anteriormente en (8.1), proporciona buenos
resultados.
En el caso de que la poblacin de la que se extrae la muestra no sea normal pero n 30 , el ni-
vel de confianza del intervalo (8.1) es aproximadamente 1 .
Pero para muestras pequeas tomadas de poblaciones que no son normales no se puede garanti-
zar que el nivel de confianza sea 1 si se utiliza (8.1).

Ejemplo:
Supongamos que X representa la duracin de una pieza de equipo y que se probaron 100 de esas
piezas dando una duracin promedio de 501.2 horas. Se sabe que la desviacin estndar poblacional
es =4 horas. Se desea tener un intervalo del 95% de confianza para la esperanza poblacional
E X .
Solucin:
En este caso, si bien no conocemos cul es la distribucin de X tenemos que el tamao de la muestra
es n 100 30 (muestra grande) por lo tanto el intervalo buscado es

X z , X z
2 n 2 n


Puesto que 1- =0.95 1 0.95 0.05 0.025
2
De la tabla de la normal estandarizada obtenemos z 0,025 =1.96. Entonces reemplazando:

4 4
X 1.96 , X 1.96
100 100

Para el valor particular x =501.2 tenemos el intervalo

4 4 4 4
x 1.96 , x 1.96 501.2 1.96 10 ,501.2 1.96 10 500.4, 502.0 .
100 n

47
Intervalos de confianza Prof. Mara B. Pintarelli


Al establecer que 500.4, 502.0 es un intervalo al 95% de confianza de estamos diciendo que


la probabilidad de que el intervalo 500.4, 502.0 contenga a es 0.95. O, en otras palabras, la

probabilidad de que la muestra aleatoria X1 , X 2 ,..., X n tome valores tales que el intervalo aleatorio
4 4
X 1.96 , X 1.96 defina un intervalo numrico que contenga al parmetro fijo des-
100 100
conocido es 0.95.

3.2 - Intervalo de confianza para la media de una distribucin normal, varianza desconocida

Nuevamente como se trata de encontrar un intervalo de confianza para nos basamos en la espe-
1 n
ranza muestral X X i que sabemos es un buen estimador de . Pero ahora no podemos usar
n 11
como pivote a
X
Z
/ n
porque desconocemos y una condicin para ser pivote es que, excepto por el parmetro a estimar
( en este caso ), todos los parmetros que aparecen en l deben ser conocidos. Entonces propone-
mos como pivote una variable aleatoria definida en forma parecida a Z pero reemplazando por un
estimador adecuado.
Ya vimos que la varianza muestral definida

X i X ,
1 n
S2
n 1 11
donde X es la esperanza muestral, es un estimador insesgado de la varianza poblacional V X , es

decir, E S 2 V X 2 n . Entonces estimamos con S y proponemos como pivote a la varia-
ble aleatoria

X
T .
S/ n

Pero para poder usar a T como pivote debemos conocer su distribucin.


Se puede probar que la distribucin de T es una distribucin llamada Student con parmetro n-1.

Nota: Una v.a. continua tiene distribucin Student con k grados de libertad, si su f.d.p. es de la
forma
k 1

2
f ( x)
1
k 1
x
k
k x 2 2
2 1
k

48
Intervalos de confianza Prof. Mara B. Pintarelli

Notacin: T ~ t k
La grfica de la f.d.p. de la distribucin Student tiene forma de campana como la normal, pero tiende
a cero ms lentamente. Se puede probar que cuando k la fdp de la Student tiende a la fdp de
la N (0, 1) .
En la figura siguiente se grafica f(x) para diferentes valores de k

k 1

0.4 k 6

0.3
----- k

0.2

0.1

-3 -2 -1 1 2 3

Anotaremos t ,k al cuantil de la Student con k grados de libertad que deja bajo la fdp a derecha un
rea de , y a su izquierda un rea de 1 .

Luego, para construir el intervalo de confianza buscado a partir del pivote T procedemos como en
los casos anteriores:

Comenzamos por plantear la ecuacin

P t T t 1- ,
donde la incgnita es el nmero real t.

Si reemplazamos la v.a. T por su expresin, tenemos sucesivamente (multiplicando por S / n y


restando X ):
X S S S S
P t t P t X t P X t X t 1-
S / n n n n n
Multiplicando todos los miembros de la desigualdad por -1 (el orden de los miembros se invierte)
llegamos a:
S S
P X t X t 1-
n n
Evidentemente, si definimos

49
Intervalos de confianza Prof. Mara B. Pintarelli

S
1 X t n
S
, hemos construido dos estadsticos 1 y 2 tales que P
1
1- ,
2
X t
2 n
veamos quien es el nmero t que verifica la ecuacin, es decir (ver figura):

k 4 grados de libertad



2
2

t t
2 2

P t T t F t F t =1- donde F t es la Fda para la v.a. T t n 1 .

Por la simetra de la distribucin t de Student se deduce fcilmente de la figura anterior que


F t 1 F t , entonces:

F t F t = 2F t 1 =1- , o bien (ver figura anterior),


F t 1 .
2
Al valor de t que verifica esta ecuacin se lo suele indicar t . En consecuencia, el intervalo de
, n 1
2

confianza bilateral al nivel de significacin 1- queda:

S S
X t ,n 1 , X t con F t 1 .
, n 1
2 n 2 n 2 ,n 1 2
En consecuencia:

Si X 1 , X 2 ,..., X n una muestra aleatoria de tamao n de una v.a. X donde X ~ N ( , 2 ) ,


2 desconocido, un intervalo de confianza para de nivel 1 es
S S
X t , X t (8.2)
2 n 2 n

Ejemplo:

50
Intervalos de confianza Prof. Mara B. Pintarelli

Se hicieron 10 mediciones sobre la resistencia de cierto tipo de alambre que dieron valores
1 10 1 10
x1 , x2 ,..., x10 tales que x x i 10.48 ohms y S xi x 2 = 1.36 ohms. Supngase
10 i 1 9 i !
que X~N(,2).
Se desea obtener un intervalo de confianza para la esperanza poblacional al 90 %.

Tenemos que 1 0.90 0.1 / 2 0.05


De la Tabla de la t de Student tenemos que t 0.05,9 1.8331 . Entonces el intervalo de confianza
buscado es:
S S 1.36 1.36
X t ,n 1 , X t 10.48 1.8331 ,10.48 1.8331
2 n 2
, n 1 n 10 10

Esto es: 9.69, 11.27 .

Si 2 es desconocido y el tamao de la muestra grande, entonces se puede probar que al reempla-


zar por S, el estadstico

X
Z N 0,1 aproximadamente
S/ n

y puedo construir el intervalo para como antes:


S S
X z , X z , pero su nivel es aproximadamente 1
2 n 2 n

3.3 Intervalo de confianza para la diferencia de dos medias, varianzas conocidas

Supongamos que tenemos dos variables aleatorias independientes normalmente distribuidas:



X 1 ~ N 1 , 12
y suponemos que las varianzas 12 y 22 son conocidas.

2
X ~ N 2 , 2
2
Sean adems

X 11 , X 12 ,..., X 1n1 una muestra aleatoria de tamao n1 de X 1
X 21 , X 22 ,..., X 2 n2 una muestra aleatoria de tamao n 2 de X 2 .

Deseamos construir un intervalo al nivel de confianza 1 para la diferencia de esperanzas 1 2


.
Ya sabemos cul es la distribucin del promedio de variables aleatorias normales independientes:

51
Intervalos de confianza Prof. Mara B. Pintarelli

1 n1 12
1

X 1i 1 , n
X ~ N
n1 i 1 1

X 1
n2
22
2 n2
X 2i ~ N
2 n
,
i 1 2

Consideremos ahora la diferencia Y X 1 X 2 . Si X 1 y X 2 tienen distribucin normal y son inde-


pendientes, su diferencia tambin es normal, con esperanza igual a la diferencia de las esperanzas y
la varianza es la suma de las varianzas:

2 2
X 1 X 2 ~ N 1 2 , 1 2 .
n1 n2
Por lo tanto

X 1 X 2 1 2
Z ~ N0,1 , es decir, tiene distribucin normal estandarizada.
12 22

n1 n2

La v.a. Z cumple con toda las condiciones para servir de pivote y construiremos nuestro intervalo en
forma anloga a cmo hicimos en los casos anteriores:
Comenzamos por plantear la ecuacin

P z Z z 1- ,
donde la incgnita es el nmero real z.

Reemplazamos la v.a. Z por su expresin y tenemos sucesivamente (multiplicando por



2
y restando X 1 X 2 ):
2

1
2

n1 n2



X X 2 1 2 2 2 2 2
P z 1 z P z 1 2 X 1 X 2 1 2 z 1 2
12 22 n1 n2 n1 n2

n1 n2

2 2 2 2
P X 1 X 2 z 1 2 1 2 X 1 X 2 z 1 2 1
n1 n2 n1 n2

Multiplicando todos los miembros de la desigualdad por -1 (el orden de los miembros se invierte)
llegamos a:
2 2 2 2
P X 1 X 2 z 1 2 1 2 X 1 X 2 z 1 2 1
n1 n2 n1 n2

Evidentemente, si definimos

52
Intervalos de confianza Prof. Mara B. Pintarelli

1 X1 X 2 z 12 22
n1 n2

X1 X 2 z 12 22 ,
2 n1 n2

habremos construido dos estadsticos 1 y 2 tales que P



1- , es decir

1 1 2 2

habremos construido el intervalo de confianza bilateral deseado A1 , A2 . Todos los elementos que
forman los estadsticos 1 y 2 son conocidos ya que el nmero z verifica la ecuacin anterior, es
decir:

P z Z z z z =1- donde z es la Fda para la v.a. Z ~ N (0,1)

o bien, segn vimos:



z 1 que anotamos z
2 2

En consecuencia, el intervalo de confianza bilateral al nivel de significacin 1- queda:

12 22 12 22
X 1 X 2 z , X 1 X 2 z
2
n1 n2 2
n1 n2

Por lo tanto

Si X 1 y X 2 son dos variables aleatorias independientes normalmente distribuidas:


2
2

X 1 ~ N 1 , 1 , X 2 ~ N 2 , 2 y suponemos que las varianzas 12 y 22 son conocidas. Un
intervalo de confianza para la diferencia 1 2 de nivel 1 es

12 22 12 22
X 1 X 2 z , X 1 X 2 z (8.3)
2
n1 n2 2
n1 n2

Ejemplo:
Se utilizan dos mquinas para llenar botellas de plstico con detergente para mquinas lavaplatos.
Se sabe que las desviaciones estndar de volumen de llenado son 1 0.10 onzas de lquido y
2 0.15 onzas de lquido para las dos mquinas respectivamente. Se toman dos muestras aleato-
rias, n1 12 botellas de la mquina 1 y n2 10 botellas de la mquina 2. Los volmenes promedio
de llenado son x1 30.87 onzas de lquido y x2 30.68 onzas de lquido.
Asumiendo que ambas muestras provienen de distribuciones normales
Construya un intervalo de confianza de nivel 90% para la diferencia entre las medias del volumen
de llenado.

Solucin:
Como 1 0.90 entonces 0.10

53
Intervalos de confianza Prof. Mara B. Pintarelli

Por lo tanto z z 0.05 1.65


2

0.10 2 0.15 2 0.10 2 0.15 2


El intervalo ser 30.87 30.68 1.65 ; 30.87 30.68 1.65
12 10 12 10

O sea 0.09837; 0.281620

Si se conocen las desviaciones estndar y los tamaos de las muestras son iguales (es decir
n1 n2 n ), entonces puede determinarse el tamao requerido de la muestra de manera tal que la
longitud del intervalo sea menor que l

2
2z

1 2

2 2

L 2z l n 2 1 2
2 2

2
n n l

Si 1 y 2 son desconocidos, n1 30 y n2 30 , entonces se puede probar que al reemplazar 1


por S1 y 2 por S2, el estadstico
.

X X1

2
( 1

2
)
N (0,1) aproximadamente
2 2
S 1
S 2

n 1 n 2

y puedo construir el intervalo para 1 2 como antes:


2 2 2 2
X X z S1 S 2 , X1 X 2 z
S1 S2 , (8.4)
1 2
2 n1 n2 2 n1 n2

pero su nivel es aproximadamente 1

Para muestras tomadas de dos poblaciones normales, o para muestras de tamao n1 30 y


n2 30 , de dos poblaciones cualesquiera, el intervalo de confianza dado anteriormente en
(8.3), proporciona buenos resultados.
En el caso de que la poblacin de la que se extrae la muestra no sea normal pero n1 30 y
n2 30 , el nivel de confianza del intervalo (8.3) es aproximadamente 1 .

Ejemplo:
De una muestra de 150 lmparas del fabricante A se obtuvo una vida media de 1400 hs y una des-
viacin tpica de 120 hs. Mientras que de una muestra de 100 lmparas del fabricante B se obtuvo
una vida media de 1200 hs. y una desviacin tpica de 80 hs.
Halla los lmites de confianza del 95% para la diferencia las vidas medias de las poblaciones A y B.

Solucin:
Sean las variables aleatorias:

54
Intervalos de confianza Prof. Mara B. Pintarelli

X 1 : duracin en horas de una lmpara del fabricante A


X 2 : duracin en horas de una lmpara del fabricante B
No se dice cul es la distribucin de estas variables, pero como n1 150 y n2 100
podemos usar el intervalo dado en (8.4)

Tenemos que x1 1400 , x2 1200 , s1 120 y s 2 80 .


Adems 1 0.95 z z 0.025 1.96
2
Entonces el intervalo es
2 2 2 2
1400 1200 1.96 120 80 ; 1400 1200 1.96 120 80 175.2077; 224.7922
150 100 150 100

Observacin: como este intervalo no contiene al cero, podemos inferir que hay diferencia entre las
medias con probabilidad 0.95, es ms, podemos inferir que la media del tiempo de duracin de las
lmparas del fabricante A es mayor que la media del tiempo de duracin de las lmparas del fabri-
cante B con probabilidad 0.95 .

3.4 Intervalo de confianza para la diferencia de dos medias, varianzas desconocidas

Nuevamente supongamos que tenemos dos variables aleatorias independientes normalmente distri-
buidas:


X 1 ~ N 1 , 12 y suponemos que las varianzas 12 y 22 son desconocidas .


X 2 ~ N 2 , 2
2

Sean adems

X 11 , X 12 ,..., X 1n1 una muestra aleatoria de tamao n1 de X 1
X 21 , X 22 ,..., X 2 n2 una muestra aleatoria de tamao n 2 de X 2 .
Pero ahora n1 o n 2 no son mayores que 30
Supongamos que es razonable suponer que las varianzas desconocidas son iguales, es decir
1 2
Deseamos construir un intervalo al nivel de confianza 1 para la diferencia de esperanzas 1 2

Sean X 1 y X 2 las medias muestrales y S12 y S 22 las varianzas muestrales. Como S12 y S 22 son los
estimadores de la varianza comn 2 , entonces construimos un estimador combinado de 2 . Este
estimador es

n1 1S12 n2 1S 22
S p2
n1 n2 2
Se puede comprobar que es un estimador insesgado de 2 .
Se puede probar que el estadstico

55
Intervalos de confianza Prof. Mara B. Pintarelli


X 1 X 2 1 2
T tiene distribucin Student con n1 n2 2 grados de libertad
1 1
Sp
n1 n2
Por lo tanto se plantea la ecuacin

P t T t 1
, n1 n2 2 , n1 n2 2
2 2
o



X 1 X 2 1 2
P t
,n n 2
t
, n1 n2 2
1
2 1 2 1 1
Sp 2

n1 n2

Despejamos 1 2 y queda la expresin


1 1 1 1
P X 1 X 2 t
, n1 n2 2 2 S p 1 2 X 1 X 2 t
, n1 n2 2 S p 1
2 n1 n2 2 n1 n2

Entonces

Si X 1 y X 2 son dos variables aleatorias independientes normalmente distribuidas:



X 1 ~ N 1 , 1 , X 2 ~ N 2 , 2
2
2

y suponemos que las varianzas 12 y 22 son desconocidas e igua-
les, es decir 1 2
Un intervalo de confianza para la diferencia 1 2 de nivel 1 es

1 1 1 1
X1 X 2 t
, n1 n2 2 2 S p ; X1 X 2 t
, n1 n2 2 S p
2 n1 n2 2 n1 n2
(8.5)

Ejemplo:
Se piensa que la concentracin del ingrediente activo de un detergente lquido para ropa, es afectada
por el tipo de catalizador utilizado en el proceso de fabricacin. Se realizan 10 observaciones con
cada catalizador, y se obtienen los datos siguientes:
Catalizador 1: 57.9, 66.2, 65.4, 65.4, 65.2, 62.6, 67.6, 63.7, 67.2, 71.0
Catalizador 2: 66.4, 71.7, 70.3, 69.3, 64.8, 69.6, 68.6, 69.4, 65.3, 68.8
a) Encuentre un intervalo de confianza del 95% para la diferencia entre las medias de las concentra-
ciones activas para los dos catalizadores. Asumir que ambas muestras fueron extradas de poblacio-
nes normales con varianzas iguales.
b) Existe alguna evidencia que indique que las concentraciones activas medias dependen del cata-
lizador utilizado?

56
Intervalos de confianza Prof. Mara B. Pintarelli

Solucin:
Sean las variables aleatorias
X 1 : concentracin del ingrediente activo con catalizador 1
X 2 : concentracin del ingrediente activo con catalizador 2
Asumimos que ambas variables tienen distribucin normal con varianzas iguales
Estamos e3n las condiciones para usar (8.5)
Tenemos que x1 65.22 , x2 68.42 , s1 3.444 , s2 2.224 , n1 n2 10

Calculamos S p2
n1 1S12 n2 1S 22 9 3.444 2 9 2.224 2
8.4036
n1 n2 2 10 10 2
Por lo tanto S p 8.4036 2.89890
Buscamos en la tabla de la Student t t 0.025,18 2.060
, n1 n2 2
2

Entonces el intervalo es

65.22 68.42 2.060 2.89890 1 1 1 1
;65.22 68.42 2.060 2.89890
10 10 10 10


5.8706;0.52935
b) Existe alguna evidencia que indique que las concentraciones activas medias dependen del catali-
zador utilizado, pues el 0 no pertenece al intervalo.

En muchas ocasiones no es razonable suponer que las varianzas son iguales. Si no podemos ga-
rantizar que las varianzas son iguales, para construir un intervalo de confianza de nivel 1 para
1 2 utilizamos es estadstico

X X ( )*
1 2 1 2
T 2 2
S S 1 2

n n 1 2

Se puede probar que T tiene aproximadamente una distribucin Student con grados de libertad
*

donde
2
2
S1 S2
n1 2



n2

si no es entero, se toma el entero ms prximo a
2 2

S12 S 22
n1
n 2

n1 1 n2 1

Por lo tanto planteamos la ecuacin


P t T * t 1

2 , 2
,

57
Intervalos de confianza Prof. Mara B. Pintarelli

Y despejando 1 2 el intervalo es
S12 S 22 S12 S 22
X1 X 2 t , X1 X 2 t
2
, n1 n2 2
, n1 n2
Entonces

Si X 1 y X 2 son dos variables aleatorias independientes normalmente distribuidas:



X 1 ~ N 1 , 1 , X 2 ~ N 2 , 2
2 2

y suponemos que las varianzas 12 y 22 son desconocidas
y distintas
Un intervalo de confianza para la diferencia 1 2 de nivel aproximadamente 1 es
S12 S 22 S12 S 22
X1 X 2 t , X1 X 2 t (8.6)
2
, n1 n2 2
, n1 n2
Donde
2
2
S1 S2
n1 n2
2



2 2

S12 S 22
n1
n 2

n1 1 n2 1

Ejemplo:
Una muestra de 6 soldaduras de un tipo tena promedio de prueba final de resistencia de 83.2 ksi y
desviacin estndar de 5.2. Y una muestra de 10 soldaduras de otro tipo tena resistencia promedio
de 71.3 ksi y desviacin estndar de 3.1. Supongamos que ambos conjuntos de soldaduras son mues-
tras aleatorias de poblaciones normales. Se desea encontrar un intervalo de confianza de 95% para
la diferencia entre las medias de las resistencias de los dos tipos de soldaduras.

Solucin:
Ambos tamaos muestrales son pequeos y las muestras provienen de poblaciones normales. No
podemos asumir igualdad de varianzas. Entonces aplicamos (8.6)
Tenemos que x1 83.2 , x2 71.3 , s1 5.2 , s 2 3.1 , n1 6; n2 10


Como 1 0.95 entonces 0.025
2
2
2
Adems S1 S2
n1
2

n2

7.18 7

2

S 12 S2
2
n1

n2

n1 1 n2 1
Entonces buscamos en la tabla de la Student t 0.025,7 2.365
Por lo tanto el intervalo es

58
Intervalos de confianza Prof. Mara B. Pintarelli

S12 S 22 S12 S 22
X 1 X 2 t , X 1 X 2 t
2
, n1 n2 2
, n1 n2
5.2 2 3.12 5.2 2 3.12
83.2 71.3 2.365 ; 83.2 71.3 2.365 6.37, 17.43
6 10 6 10

3.5 Intervalo de confianza para 1 2 para datos pareados

Hasta ahora se obtuvieron intervalos de confianza para la diferencia de medias donde se tomaban
dos muestras aleatorias independientes de dos poblaciones de inters. En ese caso se tomaban n1
observaciones de una poblacin y n 2 observaciones de la otra poblacin.
En muchas situaciones experimentales, existen solo n unidades experimentales diferentes y los datos
estn recopilados por pares, esto es cada unidad experimental est formada por dos observaciones.
Por ejemplo, supongamos que se mide el tiempo en segundos que un individuo tarda en hacer una
maniobra de estacionamiento con dos automviles diferentes en cuanto al tamao de la llanta y la
relacin de vueltas del volante. Notar que cada individuo es la unidad experimental y de esa unidad
experimental se toman dos observaciones que no sern independientes. Se desea obtener un inter-
valo de confianza para la diferencia entre el tiempo medio para estacionar los dos automviles.
En general, supongamos que tenemos los siguientes datos X 11, X 21 ; X 12 , X 22 ;...; X 1n1 , X 2n .
Las variables aleatorias X 1 y X 2 tienen medias 1 y 2 respectivamente.
Sea D j X 1 j X 2 j con j 1,2,..., n .
Entonces
E D j E X 1 j X 2 j E X 1 j E X 2 j 1 2
y

V D j V X 1 j X 2 j V X 1 j V X 2 j 2CovX 1 j , X 2 j 12 22 2Cov X 1 , X 2

Estimamos E D j 1 2 con D
1 n
j nD
1 n
X 1 j X 2 j X 1 X 2
n j 1 j 1

En lugar de tratar de estimar la covarianza, estimamos la V D j con S D D


n
2 1 2

n 1
D j
j 1

Anotamos D 1 2 y 2
D V D j

Asumimos que D j ~ N D , D 2
con j 1,2,..., n

Las variables aleatorias en pares diferentes son independientes, no lo son dentro de un mismo par.
Para construir el intervalo de confianza notar que

D D
T t n 1
SD / n

entonces al plantear la ecuacin P t T t 1- , deducimos que t t


, n 1
2

59
Intervalos de confianza Prof. Mara B. Pintarelli

Por lo tanto el intervalo de confianza para D 1 2 de nivel 1 se obtendr al sustituir T en


la ecuacin anterior y despejar D 1 2
El intervalo resultante es
SD SD
D t ,n 1 ; D t
, n 1

2 n 2 n
Entonces


Cuando las observaciones se dan de a pares X 11, X 21 ; X 12 , X 22 ;...; X 1n1 , X 2n , y las diferen-
cias

D j X 1 j X 2 j son tales que D j ~ N D , D para j 1,2,..., n , un intervalo de confianza
2

de nivel 1 para D 1 2 es
SD SD
D t ,n 1 ; D t
, n 1
(8.7)
2 n 2 n

Ejemplo:
Consideramos el ejemplo planteado al comienzo. Deseamos un intervalo de nivel 0.90
Sean las variables aleatorias
X 1 j : tiempo en segundos que tarda el individuo j en estacionar automvil 1 con j 1,2,..., n
X 2 j : tiempo en segundos que tarda el individuo j en estacionar automvil 2 con j 1,2,..., n
Medimos estas variables de manera que tenemos las siguientes observaciones

Automvil 1 Automvil 2 diferencia


sujeto (observacin x1 j ) (observacin x 2 j ) Dj
1 37.0 17.8 19.2
2 25.8 20.2 5.6
3 16.2 16.8 -0.6
4 24.2 41.4 -17.2
5 22.0 21.4 0.6
6 33.4 38.4 -5.0
7 23.8 16.8 7.0
8 58.2 32.2 26.0
9 33.6 27.8 5.8
10 24.4 23.2 1.2
11 23.4 29.6 -6.2
12 21.2 20.6 0.6
13 36.2 32.2 4.0
14 29.8 53.8 -24.0

A partir de la columna de diferencias observadas se calcula D 1.21 y S D 12.68

Adems t t 0.05,13 1.771 , entonces el intervalo para la diferencia D 1 2 de nivel 0.90


, n 1
2
es

60
Intervalos de confianza Prof. Mara B. Pintarelli

12.68 12.68
1.21 1.771 ; 1.21 1.771 4.79; 7.21
14 14

3.6 Intervalo de confianza para la varianza de una distribucin normal

Supongamos que se quiere hallar un intervalo de confianza para la varianza 2 de una distribucin
normal.
Sea X1 , X 2 ,..., X n una muestra aleatoria de una v.a. X, donde X ~ N ( , 2 ) .
2

X i X
1 n
Tomamos como estimador puntual de a S 2 2

n 1 11

Luego a partir de este estimador puntual construimos el estadstico X


n 1S 2
2
Este estadstico contiene al parmetro desconocido a estimar 2 y tiene una distribucin conocida,
se puede probar que X tiene una distribucin llamada ji-cuadrado con n-1 grados de libertad

Observacin: Si X es una v.a. continua se dice que tiene distribucin ji-cuadrado con k grados de
libertad si su f.d.p. es

1 k 1 x
f ( x) x 2 e 2 x0
k k
2 2
2

Notacin: X~ k
2

La distribucin ji-cuadrdo es asimtrica. En la figura siguiente se grafica la densidad para diferentes


valores de k

0.12
k2
0.1
k 15
0.08
k 30
0.06

0.04

0.02

10 20 30 40 50 60

Anotaremos 2 ,k al cuantil de la ji-cuadrado con k grados de libertad que deja bajo la fdp a derecha
un rea de , y a su izquierda un rea de 1 .
Propiedades:

61
Intervalos de confianza Prof. Mara B. Pintarelli

1- Se puede probar que si X 1 , X 2 ,..., X n son variables aleatorias independientes con distribucin
N (0,1) entonces Z X 1 X 2 ... X n tiene distribucin ji-cuadrado con n grados de libertad.
2 2 2

2- Si X 1 , X 2 ,..., X n son variables aleatorias independientes tal que X i tiene distribucin ji-cuadrado
con k i grados de libertad, entonces Z X 1 X 2 ... X n tiene distribucin ji-cuadrado con k gra-
dos de libertad donde k k1 k 2 ... k n

3- Si X ~ k2 entonces para k grande 2 X ~ N 2k 1, 1 aproximadamente.

Para desarrollar el intervalo de confianza planteamos hallar dos nmeros a y b tales que

Pa X b 1 es decir


P a
n 1S 2
b 1
2

Se puede probar que la mejor eleccin de a y b es: a 2 y b 2


1 , n 1 , n 1
2 2

k 5
1


2
2

2 2
1 , n 1 , n 1
2 2

Por lo tanto

P 2
n 1S 2 2 1
, n 1

1 2 ,n 1 2 2
y despejando 2 se llega a


n 1S 2 n 1S 2
P 2
1
,n 1 2
2
1 , n 1

2 2

Entonces

62
Intervalos de confianza Prof. Mara B. Pintarelli

Si X1 , X 2 ,..., X n es una muestra aleatoria de una v.a. X, donde X ~ N ( , 2 ) , un intervalo de


confianza para 2 de nivel 1 es

n 1S 2 n 1S 2
; (8.8)
,n 1 2
2
1 , n 1

2 2

n 1S 2 ; n 1S 2
Observacin: un intervalo de confianza para de nivel 1 , es
2 2
, n 1 1 , n 1
2 2

Ejemplo:
Un fabricante de detergente lquido est interesado en la uniformidad de la mquina utilizada para
llenar las botellas. De manera especfica, es deseable que la desviacin estndar del proceso de
llenado sea menor que 0.15 onzas de lquido; de otro modo, existe un porcentaje mayor del deseable
de botellas con un contenido menor de detergente. Supongamos que la distribucin del volumen de
llenado es aproximadamente normal. Al tomar una muestra aleatoria de 20 botellas, se obtiene una
varianza muestral S 2 0.0153 . Hallar un intervalo de confianza de nivel 0.95 para la verdadera
varianza del volumen de llenado.

Solucin:
La v.a. de inters es X: volumen de llenado de una botella
Se asume que X ~ N ( , 2 ) con desconocido.
Estamos en las condiciones para aplicar (8.8)

Tenemos que 1 0.95 0.05 2 02.975,19 8.91 y 2 02.025,19 32.85


1 , n 1 , n 1
2 2

Adems S 0.0153
2

Por lo tanto el intervalo es


n 1S 2 n 1S 2 20 1 0.0153 ; 20 1 0.0153 0.00884;
; 0.0326
,n 1 2
2
1 , n 1
32.85 8.91
2 2

Y un intervalo para es 0.00884 ;


0.0326 0.09; 0.1805

Por lo tanto con un nivel de 0.95 los datos no apoyan la afirmacin que 0.15

63
Intervalos de confianza Prof. Mara B. Pintarelli

3.7 Intervalo de confianza para el cociente de varianzas de dos distribuciones normales

Supongamos que se tienen dos poblaciones normales e independientes con varianzas desconocidas
12 y 22 respectivamente. Se desea encontrar un intervalo de nivel 1 para el cociente de las dos
12
varianzas .
22
Se toma una muestra aleatoria de tamao n1 de una de las poblaciones y una muestra de tamao n 2
de la otra poblacin. Sean S12 y S 22 las dos varianzas muestrales.
Consideramos el estadstico
S 22
22
F
S12
12
12 S 22 12
Notar que F contiene al parmetro de inters , pues F
22 S12 22
Se puede probar que F tiene una distribucin llamada Fisher con n2 1 y n1 1 grados de libertad.

Observacin:
Sea X una variable aleatoria continua, se dice que tiene distribucin Fisher con u grados de libertad
en el numerador y v grados de libertad en el denominador si su fdp es de la forma

u
u v u 2 2 1
u
x
f ( x) 2 v 0 x
u v
u v u 2
x 1
2 2 v

En particular si W e Y son variables aleatorias independientes ji-cuadrado con u y v grados de libertad


respectivamente, entonces el cociente
W
F u
Y
v
Tiene una distribucin Fisher con u grados de libertad en el numerador y v grados de libertad en el
denominador.
Notacin: F ~ Fu ,v
La grfica de una distribucin Fisher es
similar a la de una ji-cuadrado, es asi- u 15; v 20
mtrica. Anotamos
f ,u ,v al cuantil que deja a su derecha
un rea de bajo la curva de densidad.

f ,u , v

64
Intervalos de confianza Prof. Mara B. Pintarelli

Existe la siguiente relacin entre los cuantiles de una Fu ,v y de una Fv ,u

1
f1 ,u ,v
f , v ,u

Planteamos la siguiente ecuacin Pa F b 1 y se pede probar que la mejor eleccin de


a y b es : a f y b f
1 , n2 1, n1 1 , n2 1, n1 1
2 2

u 15; v 20


2
2

f
f , n2 1, n1 1
1 , n2 1, n1 1 2
2

S2 2
Entonces P f 22 22 f 1
, n2 1, n1 1
1 2 ,n2 1,n1 1 S1 1 2

12
Despejando el cociente queda:
22
S2 2 S2
P 12 f 12 12 f 1
1 , n2 1, n1 1 , n2 1, n1 1
S 2 2 2 S 2 2

Por lo tanto

Si se tienen dos poblaciones normales e independientes con varianzas desconocidas 12 y 22


12
respectivamente, entonces un intervalo de nivel 1 para el cociente de las dos varianzas 2
2
es
S12 S12
2 f1 ,n 1,n 1 ; 2 f ,n 1,n 1 (8.9)
S2 2
2 1 S2 2 2 1

Ejemplo:
Una compaa fabrica propulsores para uso en motores de turbina. Una de las operaciones consiste
en esmerilar el terminado de una superficie particular con una aleacin de titanio. Pueden emplearse

65
Intervalos de confianza Prof. Mara B. Pintarelli

dos procesos de esmerilado, y ambos pueden producir partes que tienen la misma rugosidad super-
ficial promedio. Interesara seleccionar el proceso que tenga la menor variabilidad en la rugosidad
de la superficie. Para esto se toma una muestra de 12 partes del primer proceso, la cual tiene una
desviacin estndar muestral S1 5.1 micropulgadas, y una muestra aleatoria de 15 partes del se-
gundo proceso, la cual tiene una desviacin estndar muestral S 2 4.7 micropulgadas. Se desea
encontrar un intervalo de confianza de nivel 90% para el cociente de las dos varianzas.
Suponer que los dos procesos son independientes y que la rugosidad de la superficie est distribuida
de manera normal.

Solucin:
Estamos en las condiciones para aplicar (8.9)
1 1
Buscamos en la tabla de la Fisher f f 0.95,14,11 0.39
1 , n2 1, n1 1 f 0.05,11,14 2.58
2

y f f 0.05,14,11 2.74
, n2 1, n1 1
2

Entonces el intervalo es

5.12 5.12
2 0.39; 2
2.74 0.46; 3.23
4.7 4.7

Como este intervalo incluye al 1, no podemos afirmar que las desviaciones estndar de los dos pro-
cesos sean diferentes con una confianza de 90%.

3.8 Intervalo de confianza para una proporcin

Sea una poblacin de tamao N (eventualmente puede ser infinito) de cuyos individuos nos interesa
cierta propiedad A. Supongamos que la probabilidad de que un individuo de la poblacin verifique
A es p P A .El significado del parmetro p es, en consecuencia, el de proporcin de individuos
de la poblacin que verifican la propiedad A. Podemos definir una variable
aleatoria X i que mide a los individuos de la poblacin la ocurrencia o no de la propiedad A .
La variable aleatoria tendr la distribucin:

p1 P X i 1 p

p x
p0 P X i 0 1 p,

es decir, Xi es una v.a. que toma slo dos valores: 1 (si el individuo verifica A) con probabilidad p y
0 (cuando no verifica A) con probabilidad 1-p. Esto es equivalente a decir que Xi tiene una distribu-
cin binomial con parmetros 1 y p: Xi ~ B(1,p).

Supongamos que consideramos una muestra aleatoria X 1 , X 2 ..., X n de tamao n . Si formamos el


estadstico X X 1 X 2 ... X n , es evidente que esta v.a. mide el nmero de individuos de la
muestra de tamao n que verifican la propiedad A. Por lo tanto por su significado X es una v.a. cuya
distribucin es binomial con parmetros n y p: X~B(n,p). De acuerdo con esto, la variable aleatoria

66
Intervalos de confianza Prof. Mara B. Pintarelli

X
P definida: P representa la proporcin de individuos de la muestra que verifican la propiedad
n
A.
Observemos que siendo Xi ~ B(1,p) es E X i p . Y, dado que X~B(n,p), tambin es

X 1
E P E E X np p , es decir P es un estimador insesgado de p . Esto es de esperar
1
n n n
n
X 1
pues P Xi .
n n i 1
Pero adems, es fcil ver que P es estimador consistente de p . En efecto, tenemos que E P p ,
pero tambin es
p1 p
X 1
V P V 2 np1 p .
n n n

Deseamos construir un intervalo de confianza de p. Es razonable basarnos en el estimador insesgado


P . Consideramos como pivote a la variable aleatoria

P p
Z cuya distribucin es, para n suficientemente grande, aproximadamente N(0,1). En
p1 p
n
efecto:
X p1 p
X

n n
X X X
Siendo P 1 2 ... n , es E P E i p y V P V i
n n n i 1 n i 1 n n

Por lo tanto:

P p
Z ~ N 0,1 ,
p1 p n grande

El pivote puede ponerse en una forma ms conveniente si tenemos en cuenta que, segn vimos re-
cin, P es estimador consistente de p y en consecuencia, en el denominador reemplazamos el par-
metro desconocido p por su estimador P , y se puede probar que :

P p
Z N(0,1). aproximadamente si n es grande

P 1 P
n
Partiendo de este pivote podemos seguir los mismos pasos de los casos anteriores para llegar al
siguiente intervalo de confianza al nivel 1 de p:

P z

P 1 P
, P z

P 1 P


con z

1 .
n n 2
2 2 2
Entonces

67
Intervalos de confianza Prof. Mara B. Pintarelli

Si P es la proporcin de observaciones de una muestra aleatoria de tamao n que verifican una


propiedad de inters, entonces un intervalo de confianza para la proporcin p de la poblacin que
cumple dicha propiedad de nivel aproximadamente 1 es


P z

P 1 P
, P z

P 1 P
(8.10)
2
n 2
n

Observaciones:
1- Este procedimiento depende de la aproximacin normal a la distribucin binomial. Por lo tanto el
intervalo (8.10) se puede utilizar si nP 10 y n(1 P ) 10 , es decir, la muestra debe contener un
mnimo de diez xitos y diez fracasos.

2- La longitud del intervalo es L 2 z


P 1 P
, pero esta expresin est en funcin de P
2
n
Si nos interesa hallar un valor de n de manera tal que la longitud L sea menor que un valor determi-
nado, podemos hacer dos cosas:
a) tomar una muestra preliminar, con ella estimar p con P y de la expresin anterior despejar n, lo
que lleva a
2
2z
L 2z

P 1 P
l n 2 P 1 P
2
n l


b) si no tomamos una muestra preliminar, entonces acotamos P 1 P 0.5 1 0.5 , entonces

2
z
L 2z

P 1 P
2z
0.51 0.5
l

n 2


2
n 2
n l

Ejemplo:
Un fabricante de componentes compra un lote de dispositivos de segunda mano y desea saber la
proporcin de la poblacin que estn fallados. Con ese fin experimenta con 140 dispositivos elegidos
al azar y encuentra que 35 de ellos estn fallados.
a) Calcular un intervalo de confianza del 99% para la proporcin poblacional p.
b) De qu tamao deber extraerse la muestra a fin de que la proporcin muestral no difiera de la
proporcin poblacional en ms de 0.03 con un 95% de confianza?

Solucin:
a) El tamao de la muestra es n 140 (muestra grande)
35
La proporcin muestral es P 0.25
140

El nivel de confianza es 1 0.99 0.01 0.005 .
2

68
Intervalos de confianza Prof. Mara B. Pintarelli

De la tabla de la normal estandarizada vemos que z 0.005 2.58 . Entonces el intervalo buscado es:

0.251 0.25 0.251 0.25


0.25 2.58 , 0.25 2.58 0.15558, 0.34441
140 140

b) Buscamos el tamao n de la muestra tal que con un 95% de confianza la proporcin muestral P
est a una distancia 0.03 de la proporcin poblacional p, es decir buscamos n tal que

L
0.03 , por lo tanto como 0.05 0.025 si tomamos la muestra anterior como pre-
2 2
liminar :

2
2z


2 1.96
2

n 2
P 1 P 0.251 0.25 800.3333
l 2 0.03

Por lo tanto hay que tomar una muestra de tamao por lo menos 801. Como ya se tom una muestra
de tamao 140, hay que tomar otra adicional de tamao 801 140 661
Supongamos que no tomamos una muestra inicial, entonces directamente planteamos

2
z
2 1.96
2

n 1067.1111
l 2 0.03

Entonces hay que tomar una muestra de tamao 1068 por lo menos.

3.9 Intervalo de confianza para la diferencia entre dos proporciones

Supongamos que existen dos proporciones de inters p1 y p 2 y es necesario obtener un intervalo


de confianza de nivel 1 para la diferencia p1 p2 .
Supongamos que se toman dos muestras independientes de tamaos n1 y n 2 respectivamente de dos
poblaciones.
Sean las variables aleatorias
X 1 : nmero de observaciones en la primera muestra que tienen la propiedad de inters
X 2 : nmero de observaciones en la segunda muestra que tienen la propiedad de inters
Entonces X 1 y X 2 son variables aleatorias independientes y X1~B(n1,p1) ; X2~B(n2,p2)
X X
Adems P1 1 y P2 2 son estimadores puntuales de p1 y p 2 respectivamente.
n1 n2
p 1 p1 p 2 1 p 2

Vemos que E P1 P2 p1 p2 y V P1 P2 1
n1

n2
Aplicando la aproximacin normal a la binomial podemos decir que

69
Intervalos de confianza Prof. Mara B. Pintarelli

P1 P2 p1 p 2
Z N (0,1) , y como en el caso de intervalo para una proporcin estimamos
p1 1 p1 p 2 1 p 2

n1 n2

p1 1 p1 p2 1 p2
con

P1 1 P1 P2 1 P2
y entonces
n1 n2 n1 n2

P1 P2 p1 p 2
Z N (0,1) aproximadamente.

P1 1 P1
2

P 1 P2

n1 n2

Planteamos la ecuacin P z Z z z z =1- , lo que lleva a
z z , y con una deduccin anloga a las anteriores se llega al intervalo
2

P1 P2 z

P1 1 P1 P2 1 P2


; P1 P2 z

P1 1 P1 P2 1 P2

2
n1 n2 2
n1 n2

Entonces

Si P1 y P2 son las proporciones muestrales de una observacin de dos muestras aleatorias inde-
pendientes de tamaos n1 y n 2 respectivamente que verifican la propiedad de inters, entonces
un intervalo de confianza de nivel 1 aproximadamente es


P1 P2 z

P1 1 P1 P2 1 P2


; P1 P2 z

P1 1 P1 P2 1 P2
(8.11)
2
n1 n2 2
n1 n2

Ejemplo:
Se lleva a cabo un estudio para determinar la efectividad de una nueva vacuna contra la gripe. Se
administra la vacuna a una muestra aleatoria de 3000 sujetos, y de ese grupo 13 contraen gripe.
Como grupo de control se seleccionan al azar 2500 sujetos, a los cuales no se les administra la
vacuna, y de ese grupo 170 contraen gripe. Construya un intervalo de confianza de nivel 0.95 para
la diferencia entre las verdaderas proporciones de individuos que contraen gripe.

Solucin:
Sean las variables aleatorias
X 1 : nmero de personas que contraen gripe del grupo que recibi la vacuna
X 2 : nmero de personas que contraen gripe del grupo que no recibi la vacuna
Entonces X1~B(n1,p1) ; X2~B(n2,p2) donde n1 3000 ; n2 2500
13 170
Adems P1 ; P2
3000 2500
Y 1 0.95 z z 0.025 1.96
2

Entonces

70
Intervalos de confianza Prof. Mara B. Pintarelli


P1 P2 z

P1 1 P1 P2 1 P2

; P1 P2 z

P1 1 P1 P2 1 P2

2
n1 n2 2
n1 n2

13 13 170 170
1 1
13 170 3000 3000 2500 2500
1.96 ;
3000 2500 3000 2500
13 13 170 170
1 1
13 170 3000 3000 2500 2500
1.96 0.0738112; 0.0535222
3000 2500 3000 2500

Prctica

Intervalos de confianza

1) Una empresa de material elctrico fabrica bombitas de luz que tienen una duracin
distribuida de forma normal, con una desviacin estndar de 40 horas.
a) Si una muestra de 20 bombitas tiene una duracin promedio de 780 horas,
encuentre un intervalo de confianza de 96% para la media de la poblacin de
todas las bombitas que produce esta empresa.
b) De qu tamao se necesita una muestra si deseamos tener 96% de confianza de
que nuestra media muestral est dentro de 10 horas de la media real?

2) Se calculan tres intervalos de confianza para la media de la fuerza de corte (en ksi) de pernos de
anclaje de un tipo dado, todos de la misma muestra.
Los intervalos son: ( 4.01, 6.02 ) ; ( 4.20 , 5.83 ) y (3.57 , 6.46 ).
Los niveles de los intervalos son 90%, 95% y 99%. Qu intervalo tiene cada nivel?. Justifique.

3) Un negocio de fotocopiado registra que en n = 64 casos el cartucho de la mquina fotocopiadora


dura un promedio de 18300 copias con una desviacin estndar de 2800 copias.
a) Obtenga un intervalo de confianza del 95 % para la media verdadera del nmero de copias
antes de necesitar un nuevo cartucho para la fotocopiadora.
b) se encuentra en el intervalo que obtuvo en la parte a)?, explique.

4) Una muestra aleatoria de 10 barras de chocolate de cierta marca tiene, en promedio, 230 caloras
con una desviacin estndar de 15 caloras. Construya un intervalo de confianza de 99% para el
contenido medio de caloras real de esta marca de barras de chocolate. Suponga que la distribu-
cin de las caloras es aproximadamente normal.

5) Se prueban dos frmulas diferentes de un combustible oxigenado para motor en cuanto al octa-
naje. La varianza del octanaje para la frmula 1 es 12 1.5, mientras que para la frmula 2 es
2 2 1.2. Se prueban dos muestras aleatorias de tamao n1 15 y n2 20 . Los octanajes pro-
medio observados son x1 89.6 y x2 92.5 .
a) Construya un intervalo de confianza del 95% para la diferencia en el octanaje promedio.

71
Intervalos de confianza Prof. Mara B. Pintarelli

b) Si tomamos n1 = n2 , qu tamao de muestra se necesitara para que la longitud del intervalo


se reduzca a la mitad del encontrado en a)?

6) Un ingeniero elctrico desea comparar las medias de los tiempos de vida de dos tipos de transis-
tores en una aplicacin que implica un desarrollo a alta temperatura. Se prob una muestra de
60 transistores del tipo A y se encontr que tena un promedio de tiempos de vida de 1827 horas
y desviacin estndar de 168 horas. Se prob una muestra de 180 transistores del tipo B y se
encontr que tena un promedio de tiempos de vida de 1658 horas y desviacin estndar de 225
horas. Determine un intervalo de confianza de 95% para la diferencia entre las medias de los
tiempos de vida de los dos tipos de transistores.

7) Al medir especmenes de hilo de nylon, tomados de dos mquinas de hilado, se descubri que 8
especmenes de la primera mquina tenan un denier promedio de 9.67 con una desviacin
estndar de 1.81, en tanto que 10 especmenes de la segunda mquina tenan un denier promedio
de 7.43 con una desviacin estndar de 1.48. Si se supone que las poblaciones muestreadas son
normales y tienen la misma varianza, hallar un intervalo de confianza de nivel 99% para 1 2.

8) Se est considerando un nuevo proceso de produccin para la fabricacin de cojinetes de acero


inoxidable. Mediciones de los dimetros de muestras aleatorias de cojinetes de viejos y nuevos
procesos produjeron los siguientes datos:
Viejo: 16.3 15.9 15.8 16.2 16.1 16.0 15.7 15.8 15.9 16.1 16.3 16.1 15.8 15.7
15.8 15.7
Nuevo: 15.9 16.2 16.0 15.8 16.1 16.1 15.8 16.0 16.2 15.9 15.7 16.2 15.8 15.8
16.2 16.3
Asumiendo que ambas muestras provienen de poblaciones normales, hallar un intervalo de
confianza de nivel de 95% para la diferencia de las medias de los dimetros de los cojinetes.

9) Una muestra de 10 camiones diesel fue operada tanto caliente como fra para calcular la dife-
rencia en el ahorro de combustible. Los resultados, en millas/galn, se presentan en la tabla
siguiente

Camin 1 2 3 4 5 6 7 8 9 10
caliente 4.56 4.46 6.49 5.37 6.25 5.90 4.12 3.85 4.15 4.69
fro 4.26 4.08 5.83 4.96 5.87 5.32 3.92 3.69 3.74 4.19

Determine un intervalo de confianza de 98% para la diferencia en la media del millaje entre
motores calientes y fros. Asuma que la muestra de las diferencias entre motores calientes y
fros es aproximadamente normal

10) Para los datos del ejercicio 4)


a) construya un intervalo de confianza de 99% para la varianza de caloras real de esta marca
de barras de chocolate
b) construya un intervalo de confianza de 99% para la desviacin estndar de caloras real de
esta marca de barras de chocolate

11) Para los datos del ejercicio 8) hallar un intervalo de confianza de nivel de 95% para el cocien-
te de las varianzas de los dimetros de los cojinetes.

12) Una muestra aleatoria de 300 compradores en un supermercado incluye 204 que regularmente
utilizan cupones de descuento. Construya un intervalo de confianza del 98% para la probabili-

72
Intervalos de confianza Prof. Mara B. Pintarelli

dad de que algn comprador en el supermercado, seleccionado al azar, regularmente usar


cupones de descuento.

13) a) Suponga que se quiere estimar qu porcentaje de todos los conductores excede el lmite de
velocidad de 80 km/h en cierto tramo del camino. Qu tan grande debe ser la muestra para
tener al menos 99% de confianza de que el error de su estimacin es a lo sumo de 3.5%?.
b) Cmo se vera afectado el tamao de la muestra requerida, si se sabe que el porcentaje a
estimar es a lo sumo de 40%?.

14) En una prueba del efecto de la humedad en conexiones elctricas, se probaron 100 conexiones
elctricas bajo condiciones hmedas y 150 en condiciones secas. Veinte de las primeras falla-
ron y solo diez de las segundas no pasaron la prueba. Determine un intervalo de confianza de
90% para la diferencia entre las proporciones de las conexiones que fallaron, hmedas y secas.

73

Anda mungkin juga menyukai