Intervalos de Confianza

7 intervalos de confianza
Introduccin
Dado que los estimativos puntuales pocas veces sern iguales a los parmetros que tratan de estimar,
podemos darnos una mayor libertad en su estimacin mediante el uso de la estimacin por intervalos o
intervalos de confianza.
Un intervalo de confianza es un intervalo estimado dentro del cual se espera encontrar el valor de un
parmetro.
Definicin:
Sea 1- una probabilidad especificada alta y sean T1 y T2, dos estadsticos tales que
P[T1 T2] = 1
El intervalo [T1, T2] recibe el nombre de Intervalo de Confianza del 100(1-)% para el parmetro desconocido
. Las cantidades T1, T2 reciben el nombre de Limites de confianza inferior y superior, respectivamente, y
(1-) es el Nivel de Confianza asociado con el intervalo.
En trminos generales la construccin de un intervalo de confianza para un parmetro consiste en encontrar
un estadstico T y relacionarlo con otra variable aleatoria X* = f(t, ), donde X* involucra a , pero la
distribucin de X* no depende de , ni de ningn otro parmetro no conocido. Entonces T1 y T2 son funciones
del estadstico T (estimador de ).
La interpretacin de un intervalo de confianza radica en la interpretacin de una probabilidad de largo plazo, y
es que, si se recopila un nmero grande de muestras aleatorias y se calcula un intervalo de confianza del
100(1-)% para el parmetro para cada una de las muestras, entonces el 100(1- )% de esos intervalos
contienen el valor verdadero de .
Valor del parmetro
De acuerdo con la interpretacin, el nivel de confianza del 100(1-)% no es tanto un enunciado sobre un
intervalo particular sino que pertenece a lo que pasara si se construyera un nmero grande de intervalos
semejantes.
La probabilidad es 1- de que el intervalo aleatorio contenga el verdadero valor del parmetro desconocido .
El parmetro es una constante, aunque desconocida, y los intervalos T1 y T2 son variables aleatorias.
Construccin de un intervalo de confianza
Como ya se mencion, en trminos generales la construccin de un intervalo de confianza para un parmetro
consiste en encontrar un estadstico T y relacionarlo con otra variable aleatoria X* = f(t,), donde X*
involucra a , pero la distribucin de X* no depende de , ni de ningn otro parmetro no conocido. Entonces
T1 y T2 son funciones del estadstico T (estimador de ).
Si denotamos por X1, X2, ...Xn la muestra aleatoria con base en la cual se construir el intervalo de confianza
para el parmetro . Entonces debemos encontrar un estadstico T = t(X1, X2, ...Xn) y relacionarlo con otra
variable aleatoria que cumpla las siguientes condiciones:
Bernardo A. Caldern C. Intervalos de confianza

1)
2)
La variable depende funcionalmente de X1, X2, ...Xn y .

La distribucin de probabilidad de la variable no depende de ni de ningn otro parmetro no conocido.
2
Por ejemplo, si queremos construir un intervalo de confianza para la varianza de una distribucin normal, la
2 2
2
variable aleatoria sera (n-1)S / , que, aunque es funcin de , tiene una distribucin chi cuadrado que no
2
depende de .
Sea T = t(X1, X2, ...Xn) el estadstico que sirve como estimador del parmetro , y sea g(X1, X2, ...Xn,) la
variable aleatoria asociada con el estadstico T, y sean a y b dos valores constantes tales que
P(a < T < b) = 1 -
Haciendo uso de la variable aleatoria asociada con el estadstico T, la anterior probabilidad se puede escribir
como:
P(c < g(X1, X2, ...Xn,) < d) = 1 -
Donde c y d son las constantes que resultan al transformar a y b de acuerdo la variable aleatoria asociada
con el estadstico T. Mediante la manipulacin de la desigualdad planteada en la ecuacin anterior, se puede
despejar el parmetro , de tal forma que la desigualdad tenga como valor central el parmetro , y los lmites
queden en funcin, entre otras variables, del estadstico que sirve como estimador de . De lo anterior se
obtendra una desigualdad equivalente que podramos escribir como:
P(h1(X1, X2, ...Xn) < <h2(X1, X2, ...Xn) = 1 -
Entonces los valores h1(X1, X2, ...Xn) y h2(X1, X2, ...Xn) son los intervalos de confianza para el parmetro , y
corresponderan a las variables T1 y T2 mencionadas previamente.
En resumen, para construir un intervalo de confianza para un parmetro desconocido se deben tener en
cuenta los siguientes pasos:
1)
2)
3)
Encontrar un estimador puntual T para el parmetro , que sea suficiente.

Encontrar una variable aleatoria X* relacionada con el estimador puntual T.
Con base en la distribucin de la variable aleatoria asociada con el estadstico y conociendo su
distribucin muestral se calcula el respectivo intervalo de confianza.
2
Ejemplo. Clculo de un intervalo de confianza para , con varianza conocida.
Debemos encontrar dos estadsticos T1 y T2 tales que P[T1 T2] = 1

El estadstico a usar corresponde a la media muestral
X que es el mejor estimador de la media poblacional .
X se distribuye normalmente con valor esperado y varianza 2, entonces

X
Sabemos que la media muestral

la variable asociada ser
Z=
/ n
tiene una distribucin normal estndar. Por lo tanto, y si a y b son dos
valores constantes tales que:

P(a <
X < b) = 1 -
Conociendo la distribucin de
X la probabilidad anterior se puede expresar como:
a X
b
= 1
P
<
<
/ n / n / n
Como la variable
Z=
X
/ n
tiene una distribucin normal estndar, y la probabilidad es 1-, entonces
queda una probabilidad total de para los dos extremos, la cual podemos dividir en dos partes, 1 y 2 tales
que 1 + 2 = , 1 para el lmite inferior y 2 para el lmite superior. Si denotamos por Z y Z1 2 los
1
valores de la distribucin normal que tienen probabilidades acumuladas de 1 y 1-2, respectivamente,

entonces la probabilidad dada en la ecuacin anterior se puede escribir como:
X
X
P Z11 <
< Z 2 = P Z1 <
< Z 2 =1
/ n
/ n
Manipulando la parte inferior de la desigualdad

que es equivalente a
< X + Z1 / n
<
X
/ n
para expresarla en trminos de obtenemos
. En forma similar, manipulando la parte superior de la
desigualdad obtenemos que > X Z 2 /

anterior de la probabilidad se puede escribir como:
. Combinando los resultados anteriores, la ecuacin
P X Z 2
< < X + Z1
=1
n
n
Por lo general, los valores 1 y 2 son iguales a /2, por lo cual la ecuacin anterior queda como:
P X Z / 2
< < X + Z / 2
=1
n
n
Comparando la ecuacin anterior con la definicin de los intervalos de confianza vemos que los valores
X Z / 2
y X + Z / 2
corresponden a los lmites de los intervalos de confianza T1 y T2
mencionados al definir lo que es un intervalo de confianza. Por lo tanto, el intervalo de confianza est dado
por:
, X + Z / 2
X Z / 2
n
n
Debe observarse que el intervalo de confianza es aleatorio, ya que sus lmites dependen de
variable aleatoria. La longitud del intervalo es constante e igual a
2 Z / 2
X , que es una
, y lo que vara es el punto
medio (se toma la media muestral como pivote). Si para un mismo nivel de confianza queremos reducir el
tamao de intervalo, necesariamente tenemos que usar un tamao de muestra mayor.
El error en la estimacin de la media poblacional, definido como X - es igual a
Z / 2
. Por lo tanto, si
denotamos por el error mximo que estamos dispuestos a admitir en la estimacin de la media poblacional
, el tamao de muestra que debemos usar estar dado por:
n = Z / 2
Una vez tomada la muestra aleatoria (X1, X2, ...Xn), se obtiene los valores (x1, x2, ...xn) y se reemplaza la
variable aleatoria X por su estimativo x calculado a partir de la muestra, se obtiene el intervalo de confianza
para el cual est dado por:
, x + Z / 2
x Z / 2
n
n
Ejemplo. Si representa la longitud media de un eje proveniente de un proceso de produccin normal con
una varianza de 0.01 cm, y se toman muestras de 16 ejes, cual ser el intervalo de confianza del 95% para el
nivel medio del proceso?. Puede considerarse que este proceso tiene un nivel medio de 5.0 cm?
Suponga que se toma la muestra aleatoria y los resultados, en cm, son los siguientes:
4,80
4,78
4,95
4,91
5,02
4,86
5,01
5,07
4,95
4,94
4,75
4,95
4,96
4,90
5,00
4,84
La media de la muestra es igual a 4.92 cm. Tenemos, entonces la siguiente informacin:

n = 16, x = 4.92, = 0.1, Z/2 = Z0.025 = 1.96
El intervalo de confianza est dado por:
(4.92 1.96 x 0.1/4, 4.92 + 1.96 x 0.1/4) = (4.87, 4.97) 4.87 < < 4.97.
De acuerdo con el anterior intervalo de confianza, el nivel medio del proceso es algn valor entre 4.87 cm y
4.97 cm, y como el valor de 5.0 cm no est en el intervalo anterior, puede rechazarse la hiptesis de que el
nivel medio del proceso sea 5.0 cm. La longitud del intervalo de confianza es 0.1 cm, y el error mximo si
estimamos la media poblacional mediante la media muestral sera de 0.05 cm, con un nivel de confianza del
95%. Si quisiramos reducir este error a 0.03 cm, deberamos realizar 43 observaciones, segn se desprende
la siguiente frmula:
( )(
n = Z / 2
1.96 x 0.10 2
= 42.68 = 43
0.03
Se puede afirmar que P(4.87 < < 4.97) = 0.95?

En la afirmacin anterior es un parmetro (un valor constante pero desconocido) y adems, tanto el lmite
inferior como el superior son constantes, por lo cual la afirmacin anterior no tiene ninguna validez. Cuando el
intervalo es aleatorio, la probabilidad es 1- de que el intervalo aleatorio contenga el verdadero valor del
parmetro desconocido , en nuestro caso. Pero una vez se toma la muestra y se calcula el valor de la media,
el intervalo es constante, y dicho intervalo, contiene el verdadero valor de no lo contiene.
De acuerdo con la interpretacin, el nivel de confianza del 100(1-)% no es tanto un enunciado sobre un
intervalo particular sino que pertenece a lo que pasara si se construyeran un nmero grande de intervalos
semejantes.
Ahora, la longitud del intervalo de confianza vara, para un mismo tamao de la muestra, dependiendo del
nivel de confianza. Para el ejemplo anterior, si consideramos, adems del 95%, niveles de confianza del 90%
y del 99%, los respectivos intervalos de confianza seran los siguientes:
Nivel de
Confianza
90%
95%
99%
Valor normal Z
Lmite inferior
Lmite superior
1.645
1.96
2.58
4.877
4,869
4,853
4.959
4.967
4.982
Longitud el
intervalo
0.082
0.0989
0.129
Se observa que para ningn intervalo de confianza, se acepta la hiptesis de que el nivel medio del proceso
sea 5.0.
Para un mismo tamao de muestra, y una misma confiabilidad, el intervalo de confianza no es nico, dado
que la probabilidad que queda en los extremos se puede desagregar de muy diversas maneras (1 y 2
pueden tomar diferentes valores tales que debe 1 + 2 = ). Por ejemplo, = 0.05 podra desagregarse en
0.01 y 0.04, 0.02 y 0.03, 0.04 y 0.01, 0.0 y 0.5, etc. Sin embargo, el intervalo de menor longitud es el
correspondiente a 1 =2 =/2.
Ahora bien, si para un mismo nivel de confianza queremos reducir la longitud del intervalo, necesariamente
tenemos que aumentar el tamao de la muestra.
Observacin
El intervalo de confianza que encontramos para la media est basado en la distribucin de la media X , la
cual sigue una distribucin normal. Por lo tanto, siempre que queramos encontrar el intervalo de confianza
para algn otro parmetro cuyo estimador (estadstico) siga una distribucin normal, podemos usar el
intervalo anterior, cambiando simplemente el estadstico
X por el estadstico apropiado, y cambiando la
/ n por la correspondiente desviacin estndar del estadstico.

Por ejemplo, si queremos calcular un intervalo de confianza para una diferencia de medias 1 2
desviacin estndar de la media dada por
cambiamos
X por X 1X 2 y / n por
1 + 2
n1 n2
y el intervalo de confianza estara dado por:
2
2
2
2
X1 X 2 Z / 2 1 + 2 , X1 X 2 + Z / 2 1 + 2 ,
n1 n 2
n1 n 2
Intervalo de confianza para la media
Al calcular un intervalo de confianza para la media poblacional debe tenerse en cuenta si la varianza
poblacional 2 es conocida o es desconocida. A continuacin se presentan ambos casos.
Si la varianza es conocida, el intervalo de confianza corresponde al que ya hemos calculado.
2.1 Varianza conocida
El intervalo de confianza para la media poblacional cuando la varianza poblacional 2 es conocida
corresponde al caso que acabamos de presentar y que se resume a continuacin.
El intervalo de confianza est basado en la media muestral
distribucin de la variable normal (0,1) dada por:
Z=
X
/ n
X (toma la media muestral como pivote) y en la
N(0,1)
Teorema. Si X es la media muestral de una muestra aleatoria de tamao n de una poblacin con varianza
conocida , un intervalo de confianza para del 100(1-)% est dado por:

X + Z / 2
X Z / 2
n
n
Para muestras tomadas de una poblacin normal, o para muestras de tamao n 30, sin importar la forma
que tenga la poblacin, el intervalo de confianza proporciona buenos resultados. Sin embargo, para muestras
pequeas tomadas de poblaciones que no son normales, no es posible esperar que el nivel de confianza 1
sea exacto.
2.2 varianza desconocida
Cuando la varianza de una variable aleatoria no es conocida, y se tiene una muestra aleatoria, no se puede
usar la distribucin normal, sino que en su lugar se debe emplear la distribucin t. Es decir, la variable T
definida de la siguiente manera sigue una distribucin t con n-1 grados de libertad.
T=
X
S/ n
T(n 1)
Si X y S son la media muestral y la desviacin estndar de una muestra aleatoria tomada de una distribucin
normal con varianza desconocida, entonces un intervalo de confianza (T1,T2) del 100(1-)% para ser
aquel que cumpla que:
P[T1 T2] = 1
De nuevo el estadstico a usar corresponde a la media muestral
T=
X
S/ n
X , entonces la variable asociada ser
que tiene una distribucin t con n-1 grados de libertad. Por lo tanto si a y b son dos valores
constantes tales que

P(a <
X < b) = 1 -
lo cual a su vez puede expresarse como:
a X b
P
<
<
S/ n S/ n S/ n
= 1
Si vamos a considerar intervalos de confianza simtricos ( 1 = 2 =/2), entonces la anterior probabilidad

puede escribirse como:
Manipulando la
obtenemos que
X
P t n 1, / 2 <
< t n 1, / 2 = 1
S/ n
X
parte inferior de la desigualdad t
para expresarla en trminos
<
n 1, / 2 /
S/ n
es equivalente a < X + t n 1, / 2 S / n . En forma similar, manipulando la
superior de la desigualdad obtenemos que
> X t n 1, / 2 S / n .
de
parte
Combinando los resultados
anteriores, la ecuacin anterior de la probabilidad se puede escribir como:
S
S
P X t n 1, / 2
< < X + t n 1, / 2
=1
n
n
Comparando la ecuacin anterior con la definicin de los intervalos de confianza vemos que los valores
X t n 1, / 2
S
n
y X + t n 1, / 2
S
n
corresponden a los lmites de los intervalos de confianza T1 y T2
mencionados al definir lo que es un intervalo de confianza.

Teorema. Si X es la media muestral de una muestra aleatoria de tamao n de una poblacin con varianza
desconocida 2, y S2 es la varianza muestral, el intervalo de confianza para la media poblacional est dado
por:
S
S
X + t n 1, / 2
X t n 1, / 2
n
n
Ejemplo. Considere de nuevo el ejemplo anterior, donde representa la longitud media de un eje proveniente
de un proceso de produccin normal, pero con una varianza desconocida, y se toman muestras de 16 ejes,
con los siguientes valores:
4,80
4,78
4,95
4,91 5,02 4,86 5,01
5,07
4,95
5,00
4,84
4,94
4,75
4,95
4,96
4,90
Cul ser el intervalo de confianza del 95% para el nivel medio del proceso?. Puede considerarse que este
proceso tiene un nivel medio de 5.0 cm?
La media de la muestra es igual a 4.92 cm y la desviacin estndar de 0.0913. Tenemos entonces la siguiente
informacin:
n = 16, x = 4.92, s = 0.0913, tn-1,/2,n-1 = t15,0.025 = 2.131
El intervalo de confianza del 95% est dado por:
(4.92 2.131 x 0.0913/4, 4.92 + 2.131 x 0.0913/4) = (4.871, 4.969) 4.871 < < 4.969
Si consideramos, adems del 95%, niveles de confianza del 90% y del 99%, los respectivos intervalos de
confianza seran los siguientes:
Nivel de
Confianza
Valor
distribucin t
Lmite inferior
Lmite superior
Longitud el
intervalo
90%
95%
99%
1.753
2.131
2.947
4.880
4.871
4.853
4.960
4.969
4.987
0.080
0.098
0.134
Error mximo
X -
0.040
0.049
0.067
De nuevo, se observa que para cualquier intervalo de confianza, no se acepta la hiptesis de que el nivel
medio del proceso sea 5.0.
Observacin
El intervalo de confianza que encontramos para la media cuando la varianza es desconocida est basado en
la distribucin t. Por lo tanto, siempre que queramos encontrar el intervalo de confianza para algn otro
parmetro cuyo estimador (estadstico) siga una distribucin normal y la(s) varianza(s) sea(n) desconocida(s),
X por el estadstico apropiado, y

cambiando el estimativo de la desviacin estndar de la media dada por S / n por la correspondiente
podemos usar el intervalo anterior, cambiando simplemente el estadstico
desviacin estndar del estadstico. Por ejemplo, si queremos calcular un intervalo de confianza para una
diferencia de medias
S / n por Sp
3
1 2
n1 n2
y las varianzas son desconocidas pero iguales, cambiamos X por X1 X2 y
Intervalo de confianza para la diferencia de dos medias
Sean X11, X12, ... X1n1, una muestra aleatoria de n1 observaciones tomadas de una primera poblacin con
valor esperado 1 y varianza 1, y X21, X22, ... X2n2 una muestra aleatoria de n2 observaciones tomada de la
segunda poblacin con valor esperado 2 y varianza 2. Si X 1 y X 2 son las medias muestrales, la
X 1 X 2 es un estimador puntual de 1 - 2, y tiene una distribucin normal si las dos

poblaciones son normales, o aproximadamente normal si cumple con las condiciones del teorema del limite
estadstica
central (tamaos de muestras relativamente grandes). Es decir,

Por lo tanto,
2
2
1 + 2 .
Normal
,
X1 X2
1 2 n n
1
2
Z=
X1 X 2 1 2
N(0,1)
2 2
1 + 2
n1 n 2
Para calcular el intervalo de confianza para la diferencia de dos medias se debe saber si las varianzas
poblacionales son conocidas o desconocidas, y en caso de que sean desconocidas, se debe probar si son
iguales o diferentes. Cada uno de estos tres casos se analizarn por separado.
3.1 varianzas conocidas
Si las varianzas poblacionales son conocidas, los pasos a seguir para encontrar el intervalo de confianza son
los siguientes:
a)
b)
El estadstico usado como estimador puntual de la diferencia de medias 1 - 2 ser T = X1 X2 , que es

un estimador suficiente
La variable aleatoria asociada con el estimador ser la variable normal estndar dada por:
Z=
c)
X 1 X 2 1 2
12 22
+
n1 n 2
N(0,1)
Para calcular el intervalo de confianza se debe tener en cuenta la siguiente probabilidad:
X X (1 2 )
2
P Z / 2 < 1
< Z / 2 =1
2 2
1 + 2
n
n
1
2
Manipulando la expresin anterior en forma similar a como se hizo en los casos de una sola muestra se llega
al siguiente teorema que nos define el intervalo de confianza para la diferencia entre dos medias 1 - 2 con
varianzas conocidas 1 y 2.
Teorema. Si X1 X2 son las medias de dos muestras aleatorias independientes de tamao n1 y n2 tomadas
de poblaciones que tienen varianzas conocidas 1 y 2, respectivamente, entonces un intervalo de confianza
del 100(1-)% para 1 - 2 es:
X1 X 2 Z / 2
12 22
12 22
+
1 2 X1 X 2 + Z / 2
+
n1 n 2
n1 n 2
Ejemplo. Construya un intervalo de confianza del 94% para la diferencia real entre las duraciones de dos
marcas de bombillos, si una muestra de 40 bombillos tomada al azar de la primera marca dio una duracin
media de 418 horas, y una muestra de 50 bombillos de otra marca dieron una duracin media de 402 horas.
Las desviaciones estndares de las dos poblaciones son 26 horas y 22 horas, respectivamente.
Solucin. Tenemos que: x1 = 418 , x1 = 402 , 1 = 26, 2 = 22, n1 = 40, n2 = 50, Z0.03 = 1.88.
El intervalo de confianza es, entonces:
(418 402) 1.88x
26 22
26 22
+
< 1 2 < (418 402) + 1.88x
+
40 50
40 50
6.3 < 1 2 < 25.7
El hecho de que ambos lmites sean positivos, y por lo tanto no contengan el valor cero indican que ambas
marcas no tienen la misma duracin media, y sugiere que pueda pensarse que la primera marca de bombillos
tenga una duracin media superior a la segunda.
2
3.2 varianzas desconocidas e iguales ( 1 =
2 =
Cuando las varianzas son desconocidas, se debe realizar previamente una prueba estadstica para verificar si
stas son iguales o diferentes. Para realizarlo debemos hacer uso de la distribucin F, bien sea mediante el
clculo de la probabilidad de que la muestra tomada provenga de dos poblaciones con varianzas iguales, o
mediante el uso de un intervalo de confianza para la relacin de dos varianzas, segn se estudiar ms
adelante.
Si mediante el uso de la distribucin F se llega a la conclusin de que las varianzas son iguales, el
procedimiento a seguir para el clculo del intervalo de confianza para la diferencia de dos medias ser el
siguiente:
a)
b)

La variable aleatoria asociada con el estimador ser la variable T definida como:
T=
X 1 X 2 (1 2 )
SP
donde
c)
1
1
+
n1 n 2
t n1+n2 2
2
Sp es un estimador combinado de , mejor que S12 o S22 por separado, y
(
n 1 1)S12 + (n 2 1)S 22
2
SP =
n1 + n 2 2
Para calcular el intervalo de confianza se debe tener en cuenta la siguiente probabilidad:
X X (1 2)
2
=1
P t / 2, n + n
< 1
< t / 2, n + n
1 22
1 2 2
1
1
+
Sp
n
n
1
2
De nuevo, manipulando la expresin anterior en forma similar a los casos se llega al siguiente teorema que
nos define el intervalo de confianza para la diferencia entre dos medias 1 - 2 con varianzas desconocidas 1
y 2, pero iguales:
10
Teorema. Si X1, X2 , S2 y S2 son las medias y las varianzas de dos muestras aleatorias de tamaos n1 y
1
2
n2, respectivamente, tomadas de dos poblaciones normales e independientes con varianzas desconocidas
pero iguales, entonces un intervalo de confianza del 100(1-)% para la diferencia entre medias 1 - 2 es:
1
1
1
1
+
1 2 X 1 X 2 + t / 2 , n1 + n 2 2 S P
+
X 1 X 2 t / 2 , n1 + n 2 2 S P
n1 n 2
n1 n 2
Ejemplo. La siguiente tabla presenta los resultados de dos muestras aleatorias para comparar el contenido de
nicotina de dos marcas de cigarrillos.
ni
xi
Si
Marca A
10
3.1
Marca B
8
2.7
0.5
0.7
Suponiendo que los conjuntos de datos provienen de muestras tomadas al azar de poblaciones normales con
varianzas desconocidas, construya un intervalo de confianza del 95% para la diferencia real de nicotina de las
dos marcas.
Solucin. Inicialmente mediante la distribucin F debemos verificar si las varianzas son iguales ( 2 = 2 =
1
2
2 )
S 2 / 2 S 2 0 .7 2
F= 1 1 = 1 =
= 1.96
/ 2 S 2 0 .5 2
S2
2
2 2
Buscando en la tabla de la distribucin F para 7 grados de libertad en el numerador y 9 en el denominador,
vemos que el valor de la probabilidad est entre 0.10 y 0.25 (aproximadamente 0.19, mediante interpolacin
lineal). Como esta probabilidad es muy alta, concluimos que no hay evidencia para rechazar la hiptesis de
que las varianzas sean iguales.
Como las varianzas son iguales, calculamos
2=
Sp
Sp que est dado por:
9 x 0.52 + 7 x 0.72
= 0.355 Sp = 0.596
16
El intervalo de confianza del 95% est dado por (t0.025,16 = 2.12):
3.1 2.7 2.21 x 0.596
1 1
1 1
+ < 1 2 < 3.1 2.7 + 2.21 x 0.596
+ 0.2 < 1 2 < 1.0
10 8
10 8
Debido a que la diferencia real puede ser cero, no se puede concluir que existe una diferencia en el contenido
de nicotina de las dos marcas de cigarrillos.
Ejemplo. El gerente de una refinera piensa modificar el proceso para producir gasolina a partir de petrleo
crudo. El gerente har la modificacin slo si la gasolina promedio que se obtiene por este nuevo proceso
(expresada como un porcentaje del crudo) aumenta su valor con respecto al proceso en uso. Con base en
experimentos de laboratorio y mediante el empleo de dos muestras aleatorias de tamao 12, una para cada
proceso, la cantidad de gasolina promedio del proceso en uso es de 24.6 con una desviacin estndar de 2.3,
y para el proceso propuesto fue de 28.2 con una desviacin estndar de 2.7. El gerente piensa que los
resultados proporcionados por los dos procesos son variables aleatorias independientes normalmente
distribuidas con varianzas iguales. Con base en esta evidencia, debe adoptarse el nuevo proceso?
3.3 varianzas desconocidas y desiguales 1 2
11
Si mediante el uso de la distribucin F se llega a la conclusin de que las varianzas son diferentes, el
procedimiento a seguir para el clculo del intervalo de confianza para la diferencia de dos medias ser el
siguiente:
a)
b)

La variable aleatoria asociada con el estimador ser la variable T definida como:
2
S12 / n1 + S12 / n1
X1 X2 1 2
t , donde =
T=
2
2
S2 / n
S2 / n
S12 S2
2
+
1 1 + 2 2
n1 n2
n2 1
n1 1
c)
El intervalo de confianza esta dado por el siguiente teorema, basado en la distribucin t con grados de
libertad.
Teorema. Si X1, X2 , S2 y S2 son las medias y las varianzas de dos muestras aleatorias de tamaos n1 y
1
2
n2, respectivamente, tomadas de dos poblaciones normales e independientes con varianzas desconocidas y
desiguales, entonces un intervalo de confianza aproximado del 100(1-)% para la diferencia entre medias
1 - 2 es:
S2 S2
S2 S2
1
2
1
2
X1 X 2 t / 2, n + n 1 2 X1 X 2 + t / 2, n + n
1
2
1
2
Problema. Cierto metal se produce, por lo comn, mediante un proceso estndar. Se desarrolla un nuevo
proceso en el que se aade una aleacin a la produccin del metal. Los fabricantes se encuentran interesados
en estimar la verdadera diferencia entre las tensiones de ruptura de los metales producidos por los dos
procesos. Para cada metal se seleccionan 12 ejemplares y cada uno de stos se somete a una tensin hasta
que se rompe. La siguiente tabla muestra las tensiones de ruptura de los ejemplares, en kilogramos por
centmetro cuadrado:
Proceso estndar
Proceso nuevo
446
462
401
448
476
435
421
465
459
429
438
472
481
453
411
459
456
427
427
468
459
452
445
447
Si se supone que el muestreo se llev a cabo sobre dos distribuciones normales e independientes, obtener los
intervalos de confianza estimados del 95 y 99% para la diferencia entre los dos procesos. Interprete los
resultados.
4
Intervalos de confianza para una proporcin
En muchos anlisis debemos obtener proporciones, probabilidades, ndices, tasas, tales como la proporcin
de unidades defectuosas de un proceso, la probabilidad de que un artculo falle, o algn elemento se
descomponga. En estos casos es razonable suponer que el anlisis de cada elemento es similar a la
realizacin de un experimento de Bernoulli, o que el total de eventos sigue una distribucin binomial.
El problema que queremos resolver es encontrar un intervalo de confianza para el parmetro de la
distribucin binomial, que representa la verdadera proporcin de cierto tipo de eventos. El estimativo mximo
verosmil de la proporcin poblacional es la proporcin muestral definida como P = X/n, donde X se
distribuye binomial con los parmetros (n,).
Recordemos que P es un estimador insesgado y suficiente de , con las siguientes caractersticas:
E(P) =
V(P) =
12
(1 )
n
Adems, si el tamao de muestra es lo suficientemente grande, y si no est muy prximo a 0 a 1 la

distribucin de muestreo de la proporcin tiende a la distribucin normal con los parmetros arriba
mencionados. Es decir, P
(1)
Normal ,
cuando n . Por tanto, la distribucin de la variable Z
n
definida a continuacin es aproximadamente una distribucin normal estndar:
Z=
(1 )
n
N(0,1)
El procedimiento para encontrar el intervalo de confianza del 100(1-)% para l a proporcin es el siguiente:
a)
El estimador puntual de la proporcin poblacional es la proporcin muestral dada por P =
X
n
P
(1 )
n
b)
La variable aleatoria asociada es la normal dada por Z =
c)
Para el clculo del intervalo de confianza tenemos en cuenta la siguiente probabilidad:
P Z / 2 <
< Z / 2 =1
(1 )
Manipulado la expresin anterior obtenemos que:
(1 )
(1 )
=1
P P Z / 2
< < P + Z / 2
n
n
= p obtenemos el intervalo de confianza

Si en el clculo de la varianza reemplazamos por su estimativo
que se presenta a continuacin.
Teorema. Si P es la proporcin de observaciones que pertenecen a una clase de inters en una muestra
aleatoria de tamao n, entonces un intervalo de confianza aproximado de 100(1-)% para la verdadera
proporcin de la poblacin que pertenece a esta clase es:
p Z1 / 2
p(1 p )
p(1 p )
p + Z1 / 2
n
n
Ejemplo. Un fabricante asegura a un potencial comprador que el porcentaje defectuoso de su proceso es

mximo el 4%. Para comprobar la afirmacin del productor, el cliente solicita que se le inspeccione una
muestra de 300 artculos de los que hay en el inventario. Al verificar esta muestra se obtienen 18 artculos
defectuosos. Podr el cliente potencial dudar de la afirmacin del proveedor?
Para verificar la afirmacin del productor, construiremos un intervalo de confianza del 95% para la verdadera
fraccin defectuosa, y la sospecha del cliente (de que la verdadera fraccin defectuosa es mayor del 4%)
estar apoyada si el respectivo intervalo de confianza se encuentra completamente a la derecha del valor
afirmado de . Tenemos entonces la siguiente informacin:
p = 18/300 = 0.06,
n = 300, Z/2 = 1.645
0.06 1.645
0.06(1 0.06 )
0.06(1 0.06 )
0.06 + 1.645
300
300
13
0.037 < < 0.083

Como el valor de 0.04 se encuentra dentro del intervalo de confianza, entonces no tenemos razones o
evidencias para sospechar de la afirmacin del productor.
Estimacin del tamao de la muestra n. Si queremos estimar el tamao de muestra que se debe usar para
tener una confiabilidad mnima del 100(1-)% de que el error en la estimacin del parmetro no diferir de
su verdadero valor en una cantidad superior a , tenemos entonces que:
2 (1 )
Z
(1 )
/2
Error = P = Z / 2
n
n
2
Como el tamao de la muestra es una funcin de varianza del estimador y por lo tanto del parmetro , que es
desconocido, y no teniendo ninguna informacin sobre su valor, entonces podemos usar el valor de que
hace mximo la varianza y que corresponde a 1/2, por lo cual el tamao de muestra estar dado por:
n
5
Z / 2
2
4
Intervalos de confianza para la diferencia de dos proporciones 1 - 2
Sea X1 el nmero de eventos de cierto tipo observado en una primera muestra de tamao n1 tomada de una
poblacin binomial, y sea X2 el nmero de eventos observado en otra muestra de tamao n2. Entonces X1 y X2
son variables aleatorias binomiales independientes con parmetros (n1, 1) y (n2, 2), tomadas de dos
poblaciones grandes, y 1 y 2 son sus dos proporciones respectivas. Adems, P1= X1/ n1 y P2= X2/ n2 son
estimadores independientes de 1 y 2, respectivamente, y tienden a distribuirse normalmente. Si los tamaos
de muestra son suficientemente grandes, la siguiente variable tiene una distribucin que es aproximadamente
normal estndar.
Z=
P1 P 2 (1 2 )
N(0,1)
1(1 1 ) 2 (1 2 )
+
n1
n2
Para encontrar un intervalo de confianza para la diferencia de proporciones 1- 2, el estimador puntual estar
dado por P1 - P2, la variable aleatoria asociada ser la normal estndar, de acuerdo a lo explicado antes, y el
intervalo de confianza estar dado por el siguiente teorema.
Teorema. Si P1 y P2 son las proporciones muestrales de dos muestras aleatorias independientes de tamao
n1 y n2 que pertenecen a una clase de inters, entonces un intervalo de confianza aproximado del 100(1-)%
para la diferencia de las proporciones verdaderas 1 - 2 es:
P P Z
1 2
/2
P1 (1 P1 ) P2 (1 P2 )
P1 (1 P1 ) P2 (1 P2 )
,P P + Z
+
+
1
2
/2
n
n
n
n
1
2
1
2
Ejemplo. Considere un proceso de produccin que tiene una fraccin defectuosa 1, desconocida. A este
proceso se le realizan unas mejoras para reducir el porcentaje de defectuosos que est produciendo, y
queremos saber si estos cambios s reducen sustancialmente la proporcin de artculos defectuosos del
proceso. Para ello, se toma una muestra de 200 artculos del proceso original, y se encuentran 12
defectuosos, y se examinan 150 artculos del nuevo proceso y se observan 6 defectuosos. Cree Usted que los
cambios efectuados al proceso han reducido el porcentaje de artculos defectuosos?. Use un nivel de
confianza del 95%.
Tenemos:
n1 = 200, x1 = 12 p1 = 12/200 = 0.06

n2 = 150, x2 = 6 p2 = 6/150 = 0.04
14
El intervalo de confianza del 95% para la diferencia entre las fracciones defectuosas antes y despus de las
mejoras realizadas al proceso est dado por:
0.06 0.04 1.645
0.06 x 0.94 0.04 x0.96

0.06 x 0.94 0.04 x0.96
+
< 1 2 < 0.06 0.04 + 1.645
+
200
150
200
150
0.018 < 1 2 < 0.058
Como la diferencia de cero est incluida en el intervalo de confianza, concluimos que no tenemos evidencia
para afirmar que los cambios efectuados al proceso contribuyen a reducir el porcentaje de artculos
defectuosos.
Cul hubiera sido la conclusin si las muestras y los resultados hubieran sido los siguientes (observe que las
proporciones defectuosas muestrales son las mismas):
Tenemos:
n1 = 1000, x1 = 60 p1 = 60/1000 = 0.06

n2 = 750, x2 = 30 p2 = 30/750 = 0.04
0.008 < 1 2 < 0.0370
El intervalo de confianza del 95% est dado por
En este caso, aunque las proporciones muestrales son las mismas, el tener tamaos de muestra mucho
mayores, nos permite concluir que efectivamente los cambios realizados al proceso redujeron la fraccin
defectuosa (1>2).
Problema. Un artculo del New York Times en 1987 report que se puede reducir el riesgo de sufrir ataques
al corazn ingiriendo aspirina. Para llegar a esta conclusin el cronista se bas en los resultados de un
experimento diseado, en donde participaron dos grupos de personas. A un grupo de 11,034 personas se le
suministr una dosis diaria de una pastilla que no contena ninguna droga (un placebo), y de estos 189
sufrieron posteriormente ataques al corazn, mientras que al otro grupo de 11,037 se les suministr una
aspirina, y slo 104 lo sufrieron.
Considera Usted que el cronista del New York Times estaba en lo correcto?. Use un intervalo de confianza.
Haga explcitas las suposiciones que considere necesarias.
6
Intervalo de confianza para la varianza de una distribucin normal
2
Si X1, X2, Xn es una muestra aleatoria de tamao n tomada de una poblacin normal, y si S es la varianza
2
muestral, entonces S es un estimador puntual razonable de la varianza poblacional . Por otra parte, si la
poblacin es normal, la distribucin muestral de la siguiente variable es una distribucin ji-cuadrado con n - 1
grados de libertad.
(n 1)S2
n21
Por lo tanto, para obtener un intervalo de confianza del 100(1-)% para la varianza 2 nos basamos en el
2
estadstico S y en la distribucin chi cuadrado. Por lo tanto, tenemos la siguiente probabilidad:
(n 1) S2 2
P 12 / 2,n 1 <
< / 2,n 1 = 1
2
Manipulando las expresiones tenemos que:
(n 1) S2
(n 1) S2
P 2
=1
< 2 < 2

1 / 2 , n 1
/ 2,n 1
2
Teorema. Si S es la varianza muestral de una muestra aleatoria de n observaciones tomadas de una
distribucin normal con varianza desconocida , entonces el intervalo de confianza de 100(1-)% para es:
(n 1)S 2
2 / 2,n 1
(n 1)S 2
12 / 2,n 1
15
Ejemplo. Un proceso produce cierta clase de cojinetes de bola cuyo dimetro interior es de 3
seleccionan en forma aleatoria 12 de estos cojinetes y se miden sus dimetros interiores, y los
resultantes son los siguientes: 3.01, 3.05, 2.99, 2.99, 3.02, 3.00, 2.98, 2.99, 2.97, 2.97, 3.02
Suponiendo que el dimetro es una variable aleatoria normal, determine un intervalo de confianza
varianza poblacional
Solucin. Tenemos:
cm. Se
valores
y 3.01.
para la
. Use un intervalo de confianza del 99%.
2
0.995,11
= 2.60, 02.005,11 = 26.71, S2 = 0.0005455 , x = 3.000
El intervalo de confianza estar dado por:
(11)x 0.0005455 2 (11)x0.0005455 0.0002246 2 0.002308

2.60
26.71
En el intervalo de confianza para la varianza, el punto medio del intervalo (0.001266) no coincide con el
estimador puntual, debido a la no simetra de la distribucin chi cuadrado.
7
Intervalo de confianza para la relacin de varianzas de dos distribuciones normales
Se tienen dos poblaciones normales e independientes con varianzas desconocidas 1 y 2, respectivamente.

De este par de poblaciones se tienen disponibles dos muestras .aleatorias de tamaos n1 y n2,
respectivamente; sean S1 y S2 las varianzas muestrales respectivas. Para hallar el intervalo de confianza del
100(1-)% para el cociente de dos varianzas sabemos que la siguiente relacin tiene una distribucin
muestral F con n1-1 y n2-1 grados de libertad:
F=
S 12 / 12
S 22 / 22
S 12 22
S 22 12
Fn1 1,n2 1
Entonces, para construir el intervalo de confianza para la relacin de dos varianzas, nos basamos en la
siguiente probabilidad:
2 2
S1 2
P F1 / 2,n1 1,n 2 1 < 2 2 < F / 2,n1 1,n 2 1 =1
S2 1
2
2
S /S
P F1 / 2,n1 1,n 2 1 < 12 22 < F / 2,n1 1,n 2 1 =1
1 / 2
Si invertimos el trmino central de la desigualdad anterior, obtenemos lo siguiente:
2
2
1
1
1 / 2
P
< 2 2<
=1
F / 2,n1 1,n 2 1 S1 / S2 F1 / 2, 1, 1
n1 n 2
2
2
2
1
1
S1 1
S1
P
< 2<
=1
2
2
F / 2,n1 1,n 2 1 S2 2 F1 / 2, 1, 1 S2
n1 n 2
Usando el hecho de que
F1 / 2,
para la relacin de dos varianzas.
n1
1,
1
2
1
F / 2,
n 2 1,n11
obtenemos el siguiente intervalo de confianza
Teorema. Si
S1
S2
16
son las varianzas de muestras aleatorias independientes tomadas de poblaciones
normales, entonces un intervalo de confianza 100(1-)% para el cociente de dos varianzas est dado por:
2
S1 1
S
< 2 < F / 2,n 2 1,n11 12
2
S2
F / 2,n11,n 2 1 S2 2
Ejemplo. Considere de nuevo el problema del contenido de nicotina de dos marcas de cigarrillos.
ni
xi
Si
Marca A
10
3.1
Marca B
8
2.7
0.5
0.7
Suponiendo que los conjuntos de datos provienen de muestras tomadas al azar de poblaciones normales con
varianzas desconocidas, construya un intervalo de confianza del 98% para la relacin de las dos varianzas de
los contenidos de nicotina de las dos marcas de cigarrillos.
Solucin. Tenemos que: F0.01,9,7 = 6.72, F0.01,7,9 = 5.61
El intervalo de confianza del 99% par la relacin de la varianza de la marca B (la mayor) a la varianza de la
marca A est dado por:
2
0.7 x 1 < B < 0.7 x 6.72 0.349 < B < 13.17

2
2
2
2
0.5 5.61 A 0.5
A
Si se hubiera construido la relacin de la varianza de la marca A a la marca B el intervalo de confianza estara
dado por:
2
0.076 < A2 < 2.862
Como el valor de la relacin uno est comprendido en el intervalo de confianza, no hay evidencia para
rechazar hiptesis sobre la igualdad de las dos varianzas.
8
Intervalo de confianza para observaciones apareadas
Cuando se comparan las medias de dos niveles es deseable que las observaciones dentro de cada nivel sean
lo ms homogneas posibles. Si existe un efecto debido a factores externos stos pueden neutralizarse
mediante la aplicacin del principio de la aleatoriedad. Esto se logra tomando las observaciones en pares. Se
supone que las condiciones exteriores son las mismas para cada par, pero pueden variar de un par a otro. Por
ejemplo, suponga que se tiene un grupo de personas que se someten a una dieta para reduccin de peso, y
para cada persona se lleva el registro del peso, en kgs, antes de la dieta, y un tiempo razonable despus de
haber empezado la dieta. En este caso, el peso de cada persona despus de la dieta no es independiente del
peso de la misma persona antes de la dieta; por lo tanto estas dos variables estn correlacionadas, y si se
quiere examinar el efecto de la dieta, se debe llevar el registro del peso para la misma persona antes y
despus de la dieta.
Sean (X11, X21), (X12, X22),...(X1n,X2n) los datos consistentes de n pares; supondremos que las variables
aleatorias X1 y X2 tienen medias 1 y 2, y varianzas
1 y 2 , respectivamente. Podemos suponer que el
conjunto de datos apareados son observaciones de un conjunto independiente de parejas de variables

aleatorias provenientes de una distribucin normal bivariada (X1 X2) f(x1, x2), y que las diferencias D = X1 - X2
se distribuyen normalmente con valor esperado D y varianza
D .
Sea Dj la diferencia entre las variables aleatorias del j-simo par, es decir, Dj = X1j-X2j. El valor esperado y la
varianza de la diferencia entre las variables est dado por:
17
E(D) = D = E( X1 X2) = 1 2
V(D) = 2 = E( X1 X2) = 2 + 2 2COV( X1, X2)
D
1
2
Si las variables X1 y X2 se distribuyen normalmente, las diferencias estarn distribuidas tambin de manera
2
normal con media D y varianza D

Para estimar la media y la varianza de la diferencia, se debe tomar una muestra aleatoria de tamao n, antes
y despus, calcular la diferencia, y luego la diferencia promedio y la varianza muestral de las diferencias,
como se ilustra en el siguiente cuadro.
Nmero del par
(Persona ) I
Medida 1 (antes)
Media 2 (despus)
X1i
X2i
Diferencia
Di = X1i X2i
1
2
......
I
.......
N
Medida resumen
X11
X12
.......
X1i
X1n
X21
X22
.......
X2i
X2n
X11 - X21
X12 - X22
X1
X2
D,
X1i - X2i
X1n - X2n
2
SD
Dada la muestra aleatoria se calculan los siguientes estadsticos que servirn para estimar la media y la
varianza de la diferencia,
D=
D y 2D , respectivamente:
1 n
D
ni =1 i
1 n
=
( D )2
S2
d n 1 Di
i =1
Sabemos que la siguiente variable aleatoria sigue una distribucin normal estndar:
Z=
D D
d / n
2
Sin embargo, como
no es conocido, lo podemos estimar mediante la varianza muestral
S D , en cuyo
caso la siguiente variable aleatoria sigue una distribucin t con n-1 grados de libertad.
T=
D D
Sd / n
Usando la distribucin t podemos calcular el intervalo de confianza para la media de observaciones pareadas,
el cual est dado por el siguiente teorema.
Teorema. Si
SD
son la media y la desviacin estndar muestrales de la diferencia de n pares
aleatorios de mediciones normalmente distribuidas, entonces un intervalo de confianza del 100(1-)% para la
diferencia de medias D = 1 -2 es:
D t / 2,n 1
Sd
n
D D + t / 2,n 1
Sd
n
Ejemplo. Se est investigando la utilidad de dos lenguajes de diseo para mejorar las tareas de
programacin. Se le ha pedido a 12 programadores expertos, familiarizados con los dos lenguajes, que
codifiquen una funcin estndar con ambos lenguajes, y se registra el tiempo requerido, en minutos, para
realizar estas dos tareas. Los datos obtenidos son los siguientes:

Programador
18
Tiempo empleado, en minutos

Lenguaje No 1
Lenguaje No 1
17
18
16
14
21
19
14
11
18
23
24
21
16
10
14
13
21
19
23
24
13
15
18
20
17.92
17.25
13.17
21.11
1
2
3
4
5
6
7
8
9
10
11
12
Media
Varianza
Diferencia
Leng 1 Leng 2
-1
2
2
3
-5
3
6
1
2
-1
-2
-2
0.67
8.79
Encuentre un intervalo de confianza para la diferencia en los tiempos medios de codificacin. Use un nivel de
confianza del 95%. Existe alguna evidencia que indique una preferencia por alguno de los dos lenguajes?
Tenemos que:
d = 0.67,
sd = 8.79,
2
sd = 2.96,
t 0.025,11 = 2.201
El intervalo de confianza est dado por:
0.67 2.201 x
2.96
2.96
<D < 0.67 + 2.201 x
1.22 <D < 2.55
12
12
Dado que la diferencia puede ser cero, se concluye que no hay evidencia para rechazar la hiptesis de que
ambos lenguajes requieren el mismo tiempo de programacin, y por lo tanto no hay preferencia por ninguno
de los dos lenguajes.
9
Problemas
1
En un artculo de la revista Human Factors se reportan los resultados de un experimento para
comparar caractersticas de maniobra para dos automviles de diferentes longitudes, distancias entre ejes y
radios de giro. Las observaciones se refieren a los tiempos en segundos necesarios por una persona para
estacionar cada automvil en paralelo (con dos vehculos a los lados).
Persona
Automvil A
Automvil B
1
37.0
17.8
2
25.8
20.2
3
16.2
16.8
4
24.2
41.4
5
22.0
21.4
6
33.4
38.4
7
23.8
16.8
8
58.2
32.2
9
33.6
27.8
10
24.4
23.2
11
23.4
29.6
12
21.2
20.6
Cree Usted que el promedio de personas manejar ms fcilmente un automvil que el otro? Use un intervalo
de confianza del 90%. Haga explcitas las suposiciones necesarias.
2
Se recibe un lote grande de artculos proveniente de un proveedor que asegura que el porcentaje de
defectuosos en su proceso de produccin es del 1% o menos. Al seleccionar una muestra aleatoria de 200
artculos e inspeccionarlos se encontraron 8 defectuosos. Obtenga intervalos de confianza del 90 y 95% para
la verdadera proporcin de artculos defectuosos del proceso de manufactura del fabricante. Qu puede
concluir con respecto a la afirmacin del fabricante?
3
En el artculo Selection of a Method to Determine Residual Chlorine in Sewage Effluents, se
reportan los resultados de un experimento en el que se usaron dos mtodos diferentes para determinar el
contenido de cloro en muestras de agua clorada, para varias dosis y tiempos de contacto. Las observaciones
estn dadas en mg/litro.
Muestra
Mtodo 1
Mtodo 2
1
10.92
10.91
2
0.84
1.35
3
7.70
8.33
4
10.52
10.70
5
4.69
5.35
6
1.76
2.56
7
3.35
3.92
8
0.39
0.36
19
Construya un intervalo de confianza del 99% para la diferencia en lecturas del verdadero promedio de cloro
residual entre los dos mtodos. Interprete los resultados
4
Un investigador mdico desea determinar si un remedio experimental tiene el efecto colateral de
aumentar la presin sistlica sangunea. Se seleccionan al azar 12 personas de diferentes edades y
condiciones de salud, y se les mide la presin sangunea antes de aplicar la droga y un tiempo prudencial
despus de aplicarla. Considera Usted, usando intervalos de confianza del 95% y del 98% que el nuevo
remedio tiene efectos colaterales con respecto a la presin sangunea?
Persona
Antes
128
176
110
149
183
136
118
158
150
130
126
162
1
2
3
4
5
6
7
8
9
10
11
12
Media
Varianza
Presin sangunea
Despus
134
174
118
152
187
136
125
168
152
128
130
167
Diferencia
5
Cierto metal se produce, por lo comn, mediante un proceso estndar. Se desarrolla un nuevo proceso
en el que se aade una aleacin a la produccin del metal. Los fabricantes se encuentran interesados en
estimar la verdadera diferencia entre las tensiones de ruptura de los metales producidos por los dos procesos.
Para cada metal se seleccionan 12 ejemplares y cada uno de stos se somete a una tensin hasta que se
rompe. La siguiente tabla muestra las tensiones de ruptura de los ejemplares, en kilogramos por centmetro
cuadrado:
Proceso estndar
Proceso nuevo
446
462
401
448
476
435
421
465
459
429
438
472
481
453
411
459
456
427
427
468
459
452
445
447
Si se supone que el muestreo se llev a cabo sobre dos distribuciones normales e independientes, obtener los
intervalos de confianza estimados del 95 y 99% para la diferencia entre los dos procesos. Interprete los
resultados.
6
La lista electoral final en una eleccin reciente para senador, revel que 11,600 personas de un total
de 22,500 seleccionadas aleatoriamente, tienen preferencia por el candidato A con respecto al candidato B.
6.1 Obtener un intervalo de confianza unilateral inferior del 99% para la verdadera proporcin de votantes a
favor del candidato A. Con base en este resultado, podra usted afirmar que es probable que A gane la
eleccin?.
6.2 Supngase que se selecciona aleatoriamente una muestra de 225 personas con la misma proporcin
muestral a favor del candidato A. Son los resultados diferentes a los del inciso a)?
En este caso, son razonables las suposiciones para los intervalos de confianza aproximados del 99%?
7
Se espera tener una cierta variacin aleatoria nominal en el espesor de las lminas de plstico que
una mquina produce. Para determinar cundo la variacin en el espesor se encuentra dentro de ciertos
limites, cada da se seleccionan en forma aleatoria 12 lminas de plstico y se mide en milmetros su espesor.
Los datos que se obtuvieron son los siguientes: 12.6, 11.9, 12.3, 12.8, 11.8, 11.7, 12.4, 12.1, 12.3, 12.0, 12.5,
12.9. Si se supone que el espesor es una variable aleatoria distribuida normal, obtener los intervalos de
confianza estimados del 90, 95 y 99% para la varianza desconocida del espesor. Si no es aceptable una
varianza mayor de 0.9 mm, existe alguna razn para preocuparse con base en esta evidencia?
Ejercicios tericos. Intervalos de confianza media y diferencia de medias
1
Si x es un valor de una variable aleatoria que tiene una distribucin exponencial, determine k de manera
que el intervalo de 0 a kX sea un intervalo de confianza del (1 - a) 100% del parmetro .
20
2. Si X1 y X2 son los valores de una muestra aleatoria de tamao 2 tomada de una poblacin que tiene una
densidad uniforme con a = 0 y = , determine k de manera que 0 < < k (X1 + X2) sea un intervalo de
confianza del (1 - ) 100% de . (Indicacin: utilice el hecho de que X1 + X2 tiene una densidad triangular.
3. Mediante la aplicacin de los mtodos de la seccin 8.7, puede demostrarse que para una muestra
aleatoria de tamao 2, tomada de la poblacin del ejercicio 2, la distribucin del intervalo de muestra est
dada por
2
( R) para 0< R <
f ( R) = 2
en cualquier otra parte

0
Utilice este resultado para obtener c de modo que R < < cR sea un intervalo de confianza del (1 - a)
100% de .
4. Demuestre que el intervalo de confianza del (1 - a)100%
X z / 2
< < X + z / 2
es ms corto que el intervalo correspondiente dado por
X Z2 / 3
5.
< < X + z / 3
Si X se utiliza como estimacin de , demuestre que podemos tener el (1 -) 100% de confianza en que
X , el valor absoluto de nuestro error, no exceder una cantidad especificada cuando el tamao de
la muestra sea
(Z / 2 )
6. Pruebe que Sp2 es un estimador insesgado de 2 y obtenga su varianza.

Ejercicios aplicados. Intervalos de confianza media y diferencia de media
8.
Mediciones de la presin sangunea de 25 mujeres de edad avanzada tienen una media de X = 140 mm
de mercurio. Si estos datos se pueden considerar como una muestra tomada al azar de una poblacin
normal con = 10 mm de mercurio, construya un intervalo de confianza del 95% de la media de la
poblacin
9. Durante varios aos, se haba aplicado una prueba de nivel de matemticas a todos los alumnos de primer
ingreso de cierta universidad. Si 64 estudiantes, seleccionados al azar en este periodo, tardaron en
promedio 28.5 minutos en resolver la prueba con una varianza de 9.3 minutos2, construya un intervalo de
confianza del 99% del tiempo promedio verdadero que tard un alumno de primer ingreso en resolver el
examen.
10. Un experto en eficiencia desea determinar el tiempo promedio que tarda el personal de un taller de
reparaciones en cambiar un conjunto de cuatro neumticos a un auto de carreras. Determinar el tamao
de la muestra requerida para poder afirmar, con el 95% de confianza, que la media de la muestra no difiere
de la media real en dos segundos o ms. Por estudios realizados antes, se sabe que la desviacin
estndar de la poblacin es 12 segundos.
11. La longitud de los crneos de 10 esqueletos fsiles de una especie de aves extinta tiene una media de
5.68 cm y una desviacin estndar de 0.29 cm Suponiendo que estas mediciones estn normalmente
distribuidas, obtenga un intervalo de confianza del 95% de la longitud media de los crneos de esta
especie de aves.
21
12. Un inspector de alimentos, que examina 12 frascos de cierta marca de mantequilla de cacahuete, obtuvo
los siguientes porcentajes de impurezas: 2.3, 1.9, 2.1, 2.8, 2.3, 3.6, 1.4, 1.8, 2.1, 3.2, 2.0 y 1.9. Suponiendo
que estas determinaciones estn normalmente distribuidas, construya un intervalo de confianza del 99%
del porcentaje promedio de impurezas que hay en esta marca de mantequilla de cacahuete.
12. Una muestra tomada al azar de una poblacin normal de tamao n1 = l6 con 1 = 4.8 tiene la media
X1=
18 y una muestra aleatoria de tamao n2 = 25 tomada de una poblacin normal diferente con 2 = 3.5
tiene la media X 2 = 23. Determine un intervalo de confianza del 90% para 1 - 2.
13. Un estudio de dos tipos de equipo de fotocopiado demuestra que 60 fallas del primer tipo de equipo
tardaron un promedio de 80.7 minutos en ser reparadas, con una desviacin estndar de 19.4 minutos;
mientras tanto, 60 fallas del segundo tipo de equipo tardaron en promedio 88.1 minutos en repararse con
una desviacin estndar de 18.8 minutos. Obtenga un intervalo de confianza del 99% de la diferencia entre
los tiempos promedio reales que se requirieron para reparar fallas de los dos tipos de equipo de
fotocopiado.
15. Doce rboles de frutos ctricos maduros, seleccionados al azar de una variedad de ejemplares, tienen una
altura media de 13.8 pies con una desviacin estndar de 1.2 pies y 15 rboles de frutos ctricos maduros
seleccionados tambin al azar de otra variedad, tienen una altura media 12.9 pies con una desviacin
estndar de 1.5 pies. Suponiendo que las dos muestras aleatorias se seleccionaron de poblaciones
normales con varianzas iguales, construya un intervalo de confianza del 95% de la diferencia en las alturas
promedio reales de los dos tipos de rboles de frutos ctricos.
16. Las siguientes son las capacidades de produccin de calor del carbn extrado de dos minas (en millones
de caloras por tonelada):
Mina A: 8500, 8330, 8480, 7960, 8030
Mina B: 7710, 7890, 7920, 8270, 7860
Suponiendo que los datos constituyen muestras aleatorias independientes tomadas de poblaciones
normales con varianzas iguales, construya un intervalo de confianza del 99% de la diferencia entre el
promedio real de las capacidades de produccin de calor del carbn extrado de ambas minas.
EJERCICIOS TERICOS. PROPORCIONES Y VARIANZAS
1. Resolviendo el siguiente sistema de desigualdades
z / 2 <
X n
n(1 )
X n
n(1 )
< z / 2
demuestre que los limites de confianza del (1 - ) 100% para son (x =nmero de xitos en una muestra
aleatoria de tamao n, p = x/n)
x (n x ) 1 2
1
x + .z2 / 2
+ . z1 / 2
z1 / 2
n
4
2
2
n + z1 / 2
2.
Utilice el intervalo de confianza de muestra grande para para demostrar que podemos tener cuando
menos el (1 - ) 100% de confianza en que
P ,
el valor absoluto del error que cometemos cuando
X
como estimacin
n
2
z / 2
especificada cuando el tamao de la muestra sea n =
4e 2
utilizamos la proporcin de la muestra
P=
de , no exceder una cantidad
3. Modifique el intervalo de confianza de muestra grande para proporciones para considerar la correccin de
continuidad que utilizamos cuando aproximamos una distribucin binomial con una distribucin normal.
4.
Para n grande, la distribucin muestral de S se aproxima algunas veces con una distribucin normal que
22
tiene la media y la varianza 2/2n. Demuestre que esta aproximacin nos conduce al siguiente intervalo
de confianza del (1 - ) 100% de muestra grande para :
S
S
< <
1+ z / 2
1 z / 2
2n
2n
EJERCICIOS APLICADOS
7. Un estudio de muestra realizada en un supermercado demostr que 204 de 300 compradores utilizan con
regularidad cupones de los centavos suprimidos. Utilice el intervalo de confianza de muestra para obtener
un intervalo de confianza del 99% para proporcin verdadera correspondiente.
8. En una muestra aleatoria de 250 televidentes de cierta zona, 190 haban presenciado cierto programa de
debate. Construya un intervalo de confianza del 95% para la proporcin verdadera correspondiente,
mediante el uso de
a) el intervalo de confianza de muestra grande.
b) los lmites de confianza del ejercicio 1.
9. Aplique la teora del ejercicio 2 para obtener el tamao de la muestra mnimo que nos permitir afirmar,
con un grado de confianza de por lo menos 95%, que una proporcin de la muestra (que se utiliza para
obtener el parmetro de la poblacin binomial "falla" cuando mucho en 0.03.
10. Aplique la teora del ejercicio 2 para determinar el tamao de la muestra mnima que nos permitir
aseverar, con un grado de confianza de cuando menos 99%, que una proporcin de la muestra (que se
emplea para calcular el parmetro de una poblacin binomial "falla" cuando mucho en 0.02.
11 - En una muestra aleatoria de personas que visitan un famoso centro turstico, 84 de 250 hombres y 156 de
250 mujeres compraron recuerdos. Construya un intervalo de confianza del 95% para la diferencia entre
las proporciones verdaderas de hombres y mujeres que compran recuerdos en este sitio turstico (e
interprete los resultados).
12. Entre 500 solicitudes de matrimonio, elegidas al azar en 1971, hubo 48 en las cuales las mujeres eran
cuando menos un ao mayores que los hombres y entre 400 solicitudes de matrimonio, elegidas al azar en
1977, hubo 68 en las cuales las mujeres eran cuando menos un ao mayores que los hombres. Construya
un intervalo de confianza del 99% para la diferencia entre las proporciones verdaderas correspondientes
de solicitudes de matrimonio en las cuales las mujeres fueron cuando menos un ao mayores que 105
hombres.
13. Con referencia al eje0rcicio 11 de la seccin anterior, construya un intervalo de confianza del 95% para la
varianza verdadera en la longitud de los crneos de la especie de aves dada.
14. Utilice los datos del ejercicio 9 de la seccin anterior y el intervalo de confianza de muestra grande del
ejercicio 5 con el fin de construir un intervalo de confianza del 99% para la desviacin estndar verdadera
del tiempo que tardan los estudiantes en resolver el examen.
15. Con referencia al ejercicio 15 de la seccin anterior, construya un intervalo de confianza del 98% para la
razn de las dos varianzas de la poblacin.
16. Con referencia al ejercicio 16 de la seccin anterior, construya un intervalo de confianza para la razn de
las dos desviaciones estndar de la poblacin.
23
Distribuciones muestrales e intervalos de confianza. Resumen

1.1 Intervalo de confianza para la media
1.1.1 Varianza conocida
Z=
X
N (0,1) ,

X + Z / 2
X Z / 2
n
n
1.1.2 varianza desconocida
T=
X
T (n 1)
S
n
S
S
X + t / 2,n 1
X t / 2,n 1
n
n
1.2 Intervalo de confianza para la diferencia de dos medias

1.2.1 varianzas conocidas
Z=
X1 X 2
12
n1
X1 X 2 Z / 2
(1 2) N (0,1)
22
n2
12 22
12 22
+
1 2 X1 X 2 + Z / 2
+
n1 n 2
n1 n 2
1.2.2 varianzas desconocidas e iguales 1 = 2 =
T=
X1 X 2 (1 2 )
SP
1
1
+
n1 n 2
S P2 =
t n1+ n 2 2 ,
(n1 1)S12 + (n2 1)S 22

n1 + n2 2
1
1
1
1
+
1 2 X 1 X 2 + t / 2 , n1 + n 2 2 S P
+
X 1 X 2 t / 2 , n1 + n 2 2 S P
n1 n 2
n1 n 2
1.2.3 varianzas desconocidas y desiguales 1 2
X X 2 (1 2 )
T= 1
tv ,
S12 S 22
+
n1
n2
(S12 / n1 + S12 / n1)2
2
2
S2 / n
S2 / n
1 1
2 2
n2 1
n1 1
S2 S2
S2 S2
X 1 X 2 t / 2 , V 1 + 2 1 2 X1 X 2 + t / 2 , V 1 + 2
n1 n 2
n 1 n 2
24
1.3 Intervalos de confianza para una proporcin
P
N (0,1) ,
(1 )
n
Z=
p(1 p )
p(1 p )
p + Z / 2
n
n
p Z1 / 2
1.4
Intervalos de confianza para la diferencia de dos proporciones P1 - P2
P1 P 2 (1 2 )
1(1 1 ) 2 (1 2 )
Z=
n1
P1 P2 Z / 2
N(0,1)
n2
P1 (1 P1 ) P2 (1 P2 )
P (1 P1 ) P2 (1 P2 )
+
1 2 P1 P2 + Z / 2 1
+
n1
n2
n1
n2
1.5
Intervalo de confianza para la varianza de una distribucin normal
(n 1)S 2 2
n 1
2
(n 1)S
2 / 2,n 1
1.6
(n 1)S 2
12 / 2,n 1
Intervalo de confianza para la relacin de dos varianzas de dos distribuciones normales
F=
S12 / 12
S22
1
F / 2,n1 1,n 2 1
/ 22
S12 22
S22 12
Fn1 1,n2 1
S 22 22
S 22
F
/ 2 , n 2 1, n1 1
S12 12
S12
1.7 Intervalo de confianza para observaciones apareadas
T=
D t / 2,n 1
Sd
n
Sd /
D
t n1
D D + t / 2,n 1
Sd
n

Intervalos de Confianza

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Intervalos de Confianza

Diunggah oleh

Hak Cipta:

Format Tersedia

7 intervalos de confianza

Bernardo A. Caldern C. Intervalos de confianza

La variable depende funcionalmente de X1, X2, ...Xn y .

Encontrar un estimador puntual T para el parmetro , que sea suficiente.

Debemos encontrar dos estadsticos T1 y T2 tales que P[T1 T2] = 1

X que es el mejor estimador de la media poblacional .

X se distribuye normalmente con valor esperado y varianza 2, entonces

Sabemos que la media muestral

tiene una distribucin normal estndar. Por lo tanto, y si a y b son dos

valores constantes tales que:

X la probabilidad anterior se puede expresar como:

Bernardo A. Caldern C. Intervalos de confianza

tiene una distribucin normal estndar, y la probabilidad es 1-, entonces

valores de la distribucin normal que tienen probabilidades acumuladas de 1 y 1-2, respectivamente,

Manipulando la parte inferior de la desigualdad

para expresarla en trminos de obtenemos

. En forma similar, manipulando la parte superior de la

desigualdad obtenemos que > X Z 2 /

. Combinando los resultados anteriores, la ecuacin

corresponden a los lmites de los intervalos de confianza T1 y T2

, y lo que vara es el punto

Bernardo A. Caldern C. Intervalos de confianza

La media de la muestra es igual a 4.92 cm. Tenemos, entonces la siguiente informacin:

Se puede afirmar que P(4.87 < < 4.97) = 0.95?

Bernardo A. Caldern C. Intervalos de confianza

X por el estadstico apropiado, y cambiando la

/ n por la correspondiente desviacin estndar del estadstico.

y el intervalo de confianza estara dado por:

Intervalo de confianza para la media

X (toma la media muestral como pivote) y en la

Bernardo A. Caldern C. Intervalos de confianza

X , entonces la variable asociada ser

constantes tales que

lo cual a su vez puede expresarse como:

Si vamos a considerar intervalos de confianza simtricos ( 1 = 2 =/2), entonces la anterior probabilidad

superior de la desigualdad obtenemos que

Combinando los resultados

anteriores, la ecuacin anterior de la probabilidad se puede escribir como:

corresponden a los lmites de los intervalos de confianza T1 y T2

mencionados al definir lo que es un intervalo de confianza.

Bernardo A. Caldern C. Intervalos de confianza

X por el estadstico apropiado, y

y las varianzas son desconocidas pero iguales, cambiamos X por X1 X2 y

Intervalo de confianza para la diferencia de dos medias

X 1 X 2 es un estimador puntual de 1 - 2, y tiene una distribucin normal si las dos

central (tamaos de muestras relativamente grandes). Es decir,

Bernardo A. Caldern C. Intervalos de confianza

El estadstico usado como estimador puntual de la diferencia de medias 1 - 2 ser T = X1 X2 , que es

Para calcular el intervalo de confianza se debe tener en cuenta la siguiente probabilidad:

Bernardo A. Caldern C. Intervalos de confianza

(418 402) 1.88x

6.3 < 1 2 < 25.7

3.2 varianzas desconocidas e iguales ( 1 =

El estadstico usado como estimador puntual de la diferencia de medias 1 - 2 ser T = X1 X2 , que es

Para calcular el intervalo de confianza se debe tener en cuenta la siguiente probabilidad:

Bernardo A. Caldern C. Intervalos de confianza

Sp que est dado por:

El intervalo de confianza del 95% est dado por (t0.025,16 = 2.12):

3.1 2.7 2.21 x 0.596

Bernardo A. Caldern C. Intervalos de confianza

El estadstico usado como estimador puntual de la diferencia de medias 1 - 2 ser T = X1 X2 , que es

Intervalos de confianza para una proporcin

Bernardo A. Caldern C. Intervalos de confianza

Adems, si el tamao de muestra es lo suficientemente grande, y si no est muy prximo a 0 a 1 la