Introduccin
Dado que los estimativos puntuales pocas veces sern iguales a los parmetros que tratan de estimar,
podemos darnos una mayor libertad en su estimacin mediante el uso de la estimacin por intervalos o
intervalos de confianza.
Un intervalo de confianza es un intervalo estimado dentro del cual se espera encontrar el valor de un
parmetro.
Definicin:
Sea 1- una probabilidad especificada alta y sean T1 y T2, dos estadsticos tales que
P[T1 T2] = 1
El intervalo [T1, T2] recibe el nombre de Intervalo de Confianza del 100(1-)% para el parmetro desconocido
. Las cantidades T1, T2 reciben el nombre de Limites de confianza inferior y superior, respectivamente, y
(1-) es el Nivel de Confianza asociado con el intervalo.
En trminos generales la construccin de un intervalo de confianza para un parmetro consiste en encontrar
un estadstico T y relacionarlo con otra variable aleatoria X* = f(t, ), donde X* involucra a , pero la
distribucin de X* no depende de , ni de ningn otro parmetro no conocido. Entonces T1 y T2 son funciones
del estadstico T (estimador de ).
La interpretacin de un intervalo de confianza radica en la interpretacin de una probabilidad de largo plazo, y
es que, si se recopila un nmero grande de muestras aleatorias y se calcula un intervalo de confianza del
100(1-)% para el parmetro para cada una de las muestras, entonces el 100(1- )% de esos intervalos
contienen el valor verdadero de .
Valor del parmetro
De acuerdo con la interpretacin, el nivel de confianza del 100(1-)% no es tanto un enunciado sobre un
intervalo particular sino que pertenece a lo que pasara si se construyera un nmero grande de intervalos
semejantes.
La probabilidad es 1- de que el intervalo aleatorio contenga el verdadero valor del parmetro desconocido .
El parmetro es una constante, aunque desconocida, y los intervalos T1 y T2 son variables aleatorias.
Construccin de un intervalo de confianza
Como ya se mencion, en trminos generales la construccin de un intervalo de confianza para un parmetro
consiste en encontrar un estadstico T y relacionarlo con otra variable aleatoria X* = f(t,), donde X*
involucra a , pero la distribucin de X* no depende de , ni de ningn otro parmetro no conocido. Entonces
T1 y T2 son funciones del estadstico T (estimador de ).
Si denotamos por X1, X2, ...Xn la muestra aleatoria con base en la cual se construir el intervalo de confianza
para el parmetro . Entonces debemos encontrar un estadstico T = t(X1, X2, ...Xn) y relacionarlo con otra
variable aleatoria que cumpla las siguientes condiciones:
2
Por ejemplo, si queremos construir un intervalo de confianza para la varianza de una distribucin normal, la
2 2
2
variable aleatoria sera (n-1)S / , que, aunque es funcin de , tiene una distribucin chi cuadrado que no
2
depende de .
Sea T = t(X1, X2, ...Xn) el estadstico que sirve como estimador del parmetro , y sea g(X1, X2, ...Xn,) la
variable aleatoria asociada con el estadstico T, y sean a y b dos valores constantes tales que
P(a < T < b) = 1 -
Haciendo uso de la variable aleatoria asociada con el estadstico T, la anterior probabilidad se puede escribir
como:
P(c < g(X1, X2, ...Xn,) < d) = 1 -
Donde c y d son las constantes que resultan al transformar a y b de acuerdo la variable aleatoria asociada
con el estadstico T. Mediante la manipulacin de la desigualdad planteada en la ecuacin anterior, se puede
despejar el parmetro , de tal forma que la desigualdad tenga como valor central el parmetro , y los lmites
queden en funcin, entre otras variables, del estadstico que sirve como estimador de . De lo anterior se
obtendra una desigualdad equivalente que podramos escribir como:
P(h1(X1, X2, ...Xn) < <h2(X1, X2, ...Xn) = 1 -
Entonces los valores h1(X1, X2, ...Xn) y h2(X1, X2, ...Xn) son los intervalos de confianza para el parmetro , y
corresponderan a las variables T1 y T2 mencionadas previamente.
En resumen, para construir un intervalo de confianza para un parmetro desconocido se deben tener en
cuenta los siguientes pasos:
1)
2)
3)
2
Ejemplo. Clculo de un intervalo de confianza para , con varianza conocida.
Z=
/ n
X < b) = 1 -
Conociendo la distribucin de
a X
b
= 1
P
<
<
/ n / n / n
Como la variable
Z=
X
/ n
queda una probabilidad total de para los dos extremos, la cual podemos dividir en dos partes, 1 y 2 tales
que 1 + 2 = , 1 para el lmite inferior y 2 para el lmite superior. Si denotamos por Z y Z1 2 los
1
X
X
P Z11 <
< Z 2 = P Z1 <
< Z 2 =1
/ n
/ n
< X + Z1 / n
<
X
/ n
P X Z 2
< < X + Z1
=1
n
n
Por lo general, los valores 1 y 2 son iguales a /2, por lo cual la ecuacin anterior queda como:
P X Z / 2
< < X + Z / 2
=1
n
n
Comparando la ecuacin anterior con la definicin de los intervalos de confianza vemos que los valores
X Z / 2
y X + Z / 2
mencionados al definir lo que es un intervalo de confianza. Por lo tanto, el intervalo de confianza est dado
por:
, X + Z / 2
X Z / 2
n
n
Debe observarse que el intervalo de confianza es aleatorio, ya que sus lmites dependen de
variable aleatoria. La longitud del intervalo es constante e igual a
2 Z / 2
X , que es una
medio (se toma la media muestral como pivote). Si para un mismo nivel de confianza queremos reducir el
tamao de intervalo, necesariamente tenemos que usar un tamao de muestra mayor.
El error en la estimacin de la media poblacional, definido como X - es igual a
Z / 2
. Por lo tanto, si
denotamos por el error mximo que estamos dispuestos a admitir en la estimacin de la media poblacional
, el tamao de muestra que debemos usar estar dado por:
n = Z / 2
Una vez tomada la muestra aleatoria (X1, X2, ...Xn), se obtiene los valores (x1, x2, ...xn) y se reemplaza la
variable aleatoria X por su estimativo x calculado a partir de la muestra, se obtiene el intervalo de confianza
para el cual est dado por:
, x + Z / 2
x Z / 2
n
n
Ejemplo. Si representa la longitud media de un eje proveniente de un proceso de produccin normal con
una varianza de 0.01 cm, y se toman muestras de 16 ejes, cual ser el intervalo de confianza del 95% para el
nivel medio del proceso?. Puede considerarse que este proceso tiene un nivel medio de 5.0 cm?
Suponga que se toma la muestra aleatoria y los resultados, en cm, son los siguientes:
4,80
4,78
4,95
4,91
5,02
4,86
5,01
5,07
4,95
4,94
4,75
4,95
4,96
4,90
5,00
4,84
( )(
n = Z / 2
1.96 x 0.10 2
= 42.68 = 43
0.03
Valor normal Z
Lmite inferior
Lmite superior
1.645
1.96
2.58
4.877
4,869
4,853
4.959
4.967
4.982
Longitud el
intervalo
0.082
0.0989
0.129
Se observa que para ningn intervalo de confianza, se acepta la hiptesis de que el nivel medio del proceso
sea 5.0.
Para un mismo tamao de muestra, y una misma confiabilidad, el intervalo de confianza no es nico, dado
que la probabilidad que queda en los extremos se puede desagregar de muy diversas maneras (1 y 2
pueden tomar diferentes valores tales que debe 1 + 2 = ). Por ejemplo, = 0.05 podra desagregarse en
0.01 y 0.04, 0.02 y 0.03, 0.04 y 0.01, 0.0 y 0.5, etc. Sin embargo, el intervalo de menor longitud es el
correspondiente a 1 =2 =/2.
Ahora bien, si para un mismo nivel de confianza queremos reducir la longitud del intervalo, necesariamente
tenemos que aumentar el tamao de la muestra.
Observacin
El intervalo de confianza que encontramos para la media est basado en la distribucin de la media X , la
cual sigue una distribucin normal. Por lo tanto, siempre que queramos encontrar el intervalo de confianza
para algn otro parmetro cuyo estimador (estadstico) siga una distribucin normal, podemos usar el
intervalo anterior, cambiando simplemente el estadstico
cambiamos
X por X 1X 2 y / n por
1 + 2
n1 n2
2
2
2
2
X1 X 2 Z / 2 1 + 2 , X1 X 2 + Z / 2 1 + 2 ,
n1 n 2
n1 n 2
Al calcular un intervalo de confianza para la media poblacional debe tenerse en cuenta si la varianza
poblacional 2 es conocida o es desconocida. A continuacin se presentan ambos casos.
Si la varianza es conocida, el intervalo de confianza corresponde al que ya hemos calculado.
2.1 Varianza conocida
El intervalo de confianza para la media poblacional cuando la varianza poblacional 2 es conocida
corresponde al caso que acabamos de presentar y que se resume a continuacin.
El intervalo de confianza est basado en la media muestral
distribucin de la variable normal (0,1) dada por:
Z=
X
/ n
N(0,1)
Teorema. Si X es la media muestral de una muestra aleatoria de tamao n de una poblacin con varianza
conocida , un intervalo de confianza para del 100(1-)% est dado por:
X + Z / 2
X Z / 2
n
n
Para muestras tomadas de una poblacin normal, o para muestras de tamao n 30, sin importar la forma
que tenga la poblacin, el intervalo de confianza proporciona buenos resultados. Sin embargo, para muestras
pequeas tomadas de poblaciones que no son normales, no es posible esperar que el nivel de confianza 1
sea exacto.
2.2 varianza desconocida
Cuando la varianza de una variable aleatoria no es conocida, y se tiene una muestra aleatoria, no se puede
usar la distribucin normal, sino que en su lugar se debe emplear la distribucin t. Es decir, la variable T
definida de la siguiente manera sigue una distribucin t con n-1 grados de libertad.
T=
X
S/ n
T(n 1)
Si X y S son la media muestral y la desviacin estndar de una muestra aleatoria tomada de una distribucin
normal con varianza desconocida, entonces un intervalo de confianza (T1,T2) del 100(1-)% para ser
aquel que cumpla que:
P[T1 T2] = 1
De nuevo el estadstico a usar corresponde a la media muestral
T=
X
S/ n
que tiene una distribucin t con n-1 grados de libertad. Por lo tanto si a y b son dos valores
X < b) = 1 -
a X b
P
<
<
S/ n S/ n S/ n
= 1
Manipulando la
obtenemos que
X
P t n 1, / 2 <
< t n 1, / 2 = 1
S/ n
X
parte inferior de la desigualdad t
para expresarla en trminos
<
n 1, / 2 /
S/ n
es equivalente a < X + t n 1, / 2 S / n . En forma similar, manipulando la
> X t n 1, / 2 S / n .
de
parte
S
S
P X t n 1, / 2
< < X + t n 1, / 2
=1
n
n
Comparando la ecuacin anterior con la definicin de los intervalos de confianza vemos que los valores
X t n 1, / 2
S
n
y X + t n 1, / 2
S
n
S
S
X + t n 1, / 2
X t n 1, / 2
n
n
Ejemplo. Considere de nuevo el ejemplo anterior, donde representa la longitud media de un eje proveniente
de un proceso de produccin normal, pero con una varianza desconocida, y se toman muestras de 16 ejes,
con los siguientes valores:
4,80
4,78
4,95
4,91 5,02 4,86 5,01
5,07
4,95
5,00
4,84
4,94
4,75
4,95
4,96
4,90
Cul ser el intervalo de confianza del 95% para el nivel medio del proceso?. Puede considerarse que este
proceso tiene un nivel medio de 5.0 cm?
La media de la muestra es igual a 4.92 cm y la desviacin estndar de 0.0913. Tenemos entonces la siguiente
informacin:
n = 16, x = 4.92, s = 0.0913, tn-1,/2,n-1 = t15,0.025 = 2.131
El intervalo de confianza del 95% est dado por:
(4.92 2.131 x 0.0913/4, 4.92 + 2.131 x 0.0913/4) = (4.871, 4.969) 4.871 < < 4.969
Si consideramos, adems del 95%, niveles de confianza del 90% y del 99%, los respectivos intervalos de
confianza seran los siguientes:
Nivel de
Confianza
Valor
distribucin t
Lmite inferior
Lmite superior
Longitud el
intervalo
90%
95%
99%
1.753
2.131
2.947
4.880
4.871
4.853
4.960
4.969
4.987
0.080
0.098
0.134
Error mximo
X -
0.040
0.049
0.067
De nuevo, se observa que para cualquier intervalo de confianza, no se acepta la hiptesis de que el nivel
medio del proceso sea 5.0.
Observacin
El intervalo de confianza que encontramos para la media cuando la varianza es desconocida est basado en
la distribucin t. Por lo tanto, siempre que queramos encontrar el intervalo de confianza para algn otro
parmetro cuyo estimador (estadstico) siga una distribucin normal y la(s) varianza(s) sea(n) desconocida(s),
desviacin estndar del estadstico. Por ejemplo, si queremos calcular un intervalo de confianza para una
diferencia de medias
S / n por Sp
3
1 2
n1 n2
Sean X11, X12, ... X1n1, una muestra aleatoria de n1 observaciones tomadas de una primera poblacin con
valor esperado 1 y varianza 1, y X21, X22, ... X2n2 una muestra aleatoria de n2 observaciones tomada de la
segunda poblacin con valor esperado 2 y varianza 2. Si X 1 y X 2 son las medias muestrales, la
estadstica
2
2
1 + 2 .
Normal
,
X1 X2
1 2 n n
1
2
Z=
X1 X 2 1 2
N(0,1)
2 2
1 + 2
n1 n 2
Para calcular el intervalo de confianza para la diferencia de dos medias se debe saber si las varianzas
poblacionales son conocidas o desconocidas, y en caso de que sean desconocidas, se debe probar si son
iguales o diferentes. Cada uno de estos tres casos se analizarn por separado.
3.1 varianzas conocidas
Si las varianzas poblacionales son conocidas, los pasos a seguir para encontrar el intervalo de confianza son
los siguientes:
a)
b)
Z=
c)
X 1 X 2 1 2
12 22
+
n1 n 2
N(0,1)
X X (1 2 )
2
P Z / 2 < 1
< Z / 2 =1
2 2
1 + 2
n
n
1
2
Manipulando la expresin anterior en forma similar a como se hizo en los casos de una sola muestra se llega
al siguiente teorema que nos define el intervalo de confianza para la diferencia entre dos medias 1 - 2 con
varianzas conocidas 1 y 2.
Teorema. Si X1 X2 son las medias de dos muestras aleatorias independientes de tamao n1 y n2 tomadas
de poblaciones que tienen varianzas conocidas 1 y 2, respectivamente, entonces un intervalo de confianza
del 100(1-)% para 1 - 2 es:
X1 X 2 Z / 2
12 22
12 22
+
1 2 X1 X 2 + Z / 2
+
n1 n 2
n1 n 2
Ejemplo. Construya un intervalo de confianza del 94% para la diferencia real entre las duraciones de dos
marcas de bombillos, si una muestra de 40 bombillos tomada al azar de la primera marca dio una duracin
media de 418 horas, y una muestra de 50 bombillos de otra marca dieron una duracin media de 402 horas.
Las desviaciones estndares de las dos poblaciones son 26 horas y 22 horas, respectivamente.
Solucin. Tenemos que: x1 = 418 , x1 = 402 , 1 = 26, 2 = 22, n1 = 40, n2 = 50, Z0.03 = 1.88.
El intervalo de confianza es, entonces:
26 22
26 22
+
< 1 2 < (418 402) + 1.88x
+
40 50
40 50
El hecho de que ambos lmites sean positivos, y por lo tanto no contengan el valor cero indican que ambas
marcas no tienen la misma duracin media, y sugiere que pueda pensarse que la primera marca de bombillos
tenga una duracin media superior a la segunda.
2
2 =
Cuando las varianzas son desconocidas, se debe realizar previamente una prueba estadstica para verificar si
stas son iguales o diferentes. Para realizarlo debemos hacer uso de la distribucin F, bien sea mediante el
clculo de la probabilidad de que la muestra tomada provenga de dos poblaciones con varianzas iguales, o
mediante el uso de un intervalo de confianza para la relacin de dos varianzas, segn se estudiar ms
adelante.
Si mediante el uso de la distribucin F se llega a la conclusin de que las varianzas son iguales, el
procedimiento a seguir para el clculo del intervalo de confianza para la diferencia de dos medias ser el
siguiente:
a)
b)
T=
X 1 X 2 (1 2 )
SP
donde
c)
1
1
+
n1 n 2
t n1+n2 2
2
Sp es un estimador combinado de , mejor que S12 o S22 por separado, y
(
n 1 1)S12 + (n 2 1)S 22
2
SP =
n1 + n 2 2
X X (1 2)
2
=1
P t / 2, n + n
< 1
< t / 2, n + n
1 22
1 2 2
1
1
+
Sp
n
n
1
2
De nuevo, manipulando la expresin anterior en forma similar a los casos se llega al siguiente teorema que
nos define el intervalo de confianza para la diferencia entre dos medias 1 - 2 con varianzas desconocidas 1
y 2, pero iguales:
10
Teorema. Si X1, X2 , S2 y S2 son las medias y las varianzas de dos muestras aleatorias de tamaos n1 y
1
2
n2, respectivamente, tomadas de dos poblaciones normales e independientes con varianzas desconocidas
pero iguales, entonces un intervalo de confianza del 100(1-)% para la diferencia entre medias 1 - 2 es:
1
1
1
1
+
1 2 X 1 X 2 + t / 2 , n1 + n 2 2 S P
+
X 1 X 2 t / 2 , n1 + n 2 2 S P
n1 n 2
n1 n 2
Ejemplo. La siguiente tabla presenta los resultados de dos muestras aleatorias para comparar el contenido de
nicotina de dos marcas de cigarrillos.
ni
xi
Si
Marca A
10
3.1
Marca B
8
2.7
0.5
0.7
Suponiendo que los conjuntos de datos provienen de muestras tomadas al azar de poblaciones normales con
varianzas desconocidas, construya un intervalo de confianza del 95% para la diferencia real de nicotina de las
dos marcas.
Solucin. Inicialmente mediante la distribucin F debemos verificar si las varianzas son iguales ( 2 = 2 =
1
2
2 )
S 2 / 2 S 2 0 .7 2
F= 1 1 = 1 =
= 1.96
/ 2 S 2 0 .5 2
S2
2
2 2
Buscando en la tabla de la distribucin F para 7 grados de libertad en el numerador y 9 en el denominador,
vemos que el valor de la probabilidad est entre 0.10 y 0.25 (aproximadamente 0.19, mediante interpolacin
lineal). Como esta probabilidad es muy alta, concluimos que no hay evidencia para rechazar la hiptesis de
que las varianzas sean iguales.
Como las varianzas son iguales, calculamos
2=
Sp
9 x 0.52 + 7 x 0.72
= 0.355 Sp = 0.596
16
1 1
1 1
+ < 1 2 < 3.1 2.7 + 2.21 x 0.596
+ 0.2 < 1 2 < 1.0
10 8
10 8
Debido a que la diferencia real puede ser cero, no se puede concluir que existe una diferencia en el contenido
de nicotina de las dos marcas de cigarrillos.
Ejemplo. El gerente de una refinera piensa modificar el proceso para producir gasolina a partir de petrleo
crudo. El gerente har la modificacin slo si la gasolina promedio que se obtiene por este nuevo proceso
(expresada como un porcentaje del crudo) aumenta su valor con respecto al proceso en uso. Con base en
experimentos de laboratorio y mediante el empleo de dos muestras aleatorias de tamao 12, una para cada
proceso, la cantidad de gasolina promedio del proceso en uso es de 24.6 con una desviacin estndar de 2.3,
y para el proceso propuesto fue de 28.2 con una desviacin estndar de 2.7. El gerente piensa que los
resultados proporcionados por los dos procesos son variables aleatorias independientes normalmente
distribuidas con varianzas iguales. Con base en esta evidencia, debe adoptarse el nuevo proceso?
3.3 varianzas desconocidas y desiguales 1 2
11
Si mediante el uso de la distribucin F se llega a la conclusin de que las varianzas son diferentes, el
procedimiento a seguir para el clculo del intervalo de confianza para la diferencia de dos medias ser el
siguiente:
a)
b)
2
S12 / n1 + S12 / n1
X1 X2 1 2
t , donde =
T=
2
2
S2 / n
S2 / n
S12 S2
2
+
1 1 + 2 2
n1 n2
n2 1
n1 1
c)
El intervalo de confianza esta dado por el siguiente teorema, basado en la distribucin t con grados de
libertad.
Teorema. Si X1, X2 , S2 y S2 son las medias y las varianzas de dos muestras aleatorias de tamaos n1 y
1
2
n2, respectivamente, tomadas de dos poblaciones normales e independientes con varianzas desconocidas y
desiguales, entonces un intervalo de confianza aproximado del 100(1-)% para la diferencia entre medias
1 - 2 es:
S2 S2
S2 S2
1
2
1
2
X1 X 2 t / 2, n + n 1 2 X1 X 2 + t / 2, n + n
1
2
1
2
Problema. Cierto metal se produce, por lo comn, mediante un proceso estndar. Se desarrolla un nuevo
proceso en el que se aade una aleacin a la produccin del metal. Los fabricantes se encuentran interesados
en estimar la verdadera diferencia entre las tensiones de ruptura de los metales producidos por los dos
procesos. Para cada metal se seleccionan 12 ejemplares y cada uno de stos se somete a una tensin hasta
que se rompe. La siguiente tabla muestra las tensiones de ruptura de los ejemplares, en kilogramos por
centmetro cuadrado:
Proceso estndar
Proceso nuevo
446
462
401
448
476
435
421
465
459
429
438
472
481
453
411
459
456
427
427
468
459
452
445
447
Si se supone que el muestreo se llev a cabo sobre dos distribuciones normales e independientes, obtener los
intervalos de confianza estimados del 95 y 99% para la diferencia entre los dos procesos. Interprete los
resultados.
4
En muchos anlisis debemos obtener proporciones, probabilidades, ndices, tasas, tales como la proporcin
de unidades defectuosas de un proceso, la probabilidad de que un artculo falle, o algn elemento se
descomponga. En estos casos es razonable suponer que el anlisis de cada elemento es similar a la
realizacin de un experimento de Bernoulli, o que el total de eventos sigue una distribucin binomial.
El problema que queremos resolver es encontrar un intervalo de confianza para el parmetro de la
distribucin binomial, que representa la verdadera proporcin de cierto tipo de eventos. El estimativo mximo
verosmil de la proporcin poblacional es la proporcin muestral definida como P = X/n, donde X se
distribuye binomial con los parmetros (n,).
Recordemos que P es un estimador insesgado y suficiente de , con las siguientes caractersticas:
E(P) =
V(P) =
12
(1 )
n
(1)
Normal ,
cuando n . Por tanto, la distribucin de la variable Z
n
Z=
(1 )
n
N(0,1)
El procedimiento para encontrar el intervalo de confianza del 100(1-)% para l a proporcin es el siguiente:
a)
X
n
P
(1 )
n
b)
c)
P Z / 2 <
< Z / 2 =1
(1 )
(1 )
(1 )
=1
P P Z / 2
< < P + Z / 2
n
n
p Z1 / 2
p(1 p )
p(1 p )
p + Z1 / 2
n
n
0.06 1.645
0.06(1 0.06 )
0.06(1 0.06 )
0.06 + 1.645
300
300
13
2 (1 )
Z
(1 )
/2
Error = P = Z / 2
n
n
2
Como el tamao de la muestra es una funcin de varianza del estimador y por lo tanto del parmetro , que es
desconocido, y no teniendo ninguna informacin sobre su valor, entonces podemos usar el valor de que
hace mximo la varianza y que corresponde a 1/2, por lo cual el tamao de muestra estar dado por:
n
5
Z / 2
2
4
Sea X1 el nmero de eventos de cierto tipo observado en una primera muestra de tamao n1 tomada de una
poblacin binomial, y sea X2 el nmero de eventos observado en otra muestra de tamao n2. Entonces X1 y X2
son variables aleatorias binomiales independientes con parmetros (n1, 1) y (n2, 2), tomadas de dos
poblaciones grandes, y 1 y 2 son sus dos proporciones respectivas. Adems, P1= X1/ n1 y P2= X2/ n2 son
estimadores independientes de 1 y 2, respectivamente, y tienden a distribuirse normalmente. Si los tamaos
de muestra son suficientemente grandes, la siguiente variable tiene una distribucin que es aproximadamente
normal estndar.
Z=
P1 P 2 (1 2 )
N(0,1)
1(1 1 ) 2 (1 2 )
+
n1
n2
Para encontrar un intervalo de confianza para la diferencia de proporciones 1- 2, el estimador puntual estar
dado por P1 - P2, la variable aleatoria asociada ser la normal estndar, de acuerdo a lo explicado antes, y el
intervalo de confianza estar dado por el siguiente teorema.
Teorema. Si P1 y P2 son las proporciones muestrales de dos muestras aleatorias independientes de tamao
n1 y n2 que pertenecen a una clase de inters, entonces un intervalo de confianza aproximado del 100(1-)%
para la diferencia de las proporciones verdaderas 1 - 2 es:
P P Z
1 2
/2
P1 (1 P1 ) P2 (1 P2 )
P1 (1 P1 ) P2 (1 P2 )
,P P + Z
+
+
1
2
/2
n
n
n
n
1
2
1
2
Ejemplo. Considere un proceso de produccin que tiene una fraccin defectuosa 1, desconocida. A este
proceso se le realizan unas mejoras para reducir el porcentaje de defectuosos que est produciendo, y
queremos saber si estos cambios s reducen sustancialmente la proporcin de artculos defectuosos del
proceso. Para ello, se toma una muestra de 200 artculos del proceso original, y se encuentran 12
defectuosos, y se examinan 150 artculos del nuevo proceso y se observan 6 defectuosos. Cree Usted que los
cambios efectuados al proceso han reducido el porcentaje de artculos defectuosos?. Use un nivel de
confianza del 95%.
Tenemos:
14
El intervalo de confianza del 95% para la diferencia entre las fracciones defectuosas antes y despus de las
mejoras realizadas al proceso est dado por:
Como la diferencia de cero est incluida en el intervalo de confianza, concluimos que no tenemos evidencia
para afirmar que los cambios efectuados al proceso contribuyen a reducir el porcentaje de artculos
defectuosos.
Cul hubiera sido la conclusin si las muestras y los resultados hubieran sido los siguientes (observe que las
proporciones defectuosas muestrales son las mismas):
Tenemos:
En este caso, aunque las proporciones muestrales son las mismas, el tener tamaos de muestra mucho
mayores, nos permite concluir que efectivamente los cambios realizados al proceso redujeron la fraccin
defectuosa (1>2).
Problema. Un artculo del New York Times en 1987 report que se puede reducir el riesgo de sufrir ataques
al corazn ingiriendo aspirina. Para llegar a esta conclusin el cronista se bas en los resultados de un
experimento diseado, en donde participaron dos grupos de personas. A un grupo de 11,034 personas se le
suministr una dosis diaria de una pastilla que no contena ninguna droga (un placebo), y de estos 189
sufrieron posteriormente ataques al corazn, mientras que al otro grupo de 11,037 se les suministr una
aspirina, y slo 104 lo sufrieron.
Considera Usted que el cronista del New York Times estaba en lo correcto?. Use un intervalo de confianza.
Haga explcitas las suposiciones que considere necesarias.
6
2
Si X1, X2, Xn es una muestra aleatoria de tamao n tomada de una poblacin normal, y si S es la varianza
2
muestral, entonces S es un estimador puntual razonable de la varianza poblacional . Por otra parte, si la
poblacin es normal, la distribucin muestral de la siguiente variable es una distribucin ji-cuadrado con n - 1
grados de libertad.
(n 1)S2
n21
Por lo tanto, para obtener un intervalo de confianza del 100(1-)% para la varianza 2 nos basamos en el
2
estadstico S y en la distribucin chi cuadrado. Por lo tanto, tenemos la siguiente probabilidad:
(n 1) S2 2
P 12 / 2,n 1 <
< / 2,n 1 = 1
2
(n 1) S2
(n 1) S2
P 2
=1
< 2 < 2
1 / 2 , n 1
/ 2,n 1
2
Teorema. Si S es la varianza muestral de una muestra aleatoria de n observaciones tomadas de una
distribucin normal con varianza desconocida , entonces el intervalo de confianza de 100(1-)% para es:
(n 1)S 2
2 / 2,n 1
(n 1)S 2
12 / 2,n 1
15
Ejemplo. Un proceso produce cierta clase de cojinetes de bola cuyo dimetro interior es de 3
seleccionan en forma aleatoria 12 de estos cojinetes y se miden sus dimetros interiores, y los
resultantes son los siguientes: 3.01, 3.05, 2.99, 2.99, 3.02, 3.00, 2.98, 2.99, 2.97, 2.97, 3.02
Suponiendo que el dimetro es una variable aleatoria normal, determine un intervalo de confianza
varianza poblacional
Solucin. Tenemos:
cm. Se
valores
y 3.01.
para la
2
0.995,11
26.71
En el intervalo de confianza para la varianza, el punto medio del intervalo (0.001266) no coincide con el
estimador puntual, debido a la no simetra de la distribucin chi cuadrado.
7
F=
S 12 / 12
S 22 / 22
S 12 22
S 22 12
Fn1 1,n2 1
Entonces, para construir el intervalo de confianza para la relacin de dos varianzas, nos basamos en la
siguiente probabilidad:
2 2
S1 2
P F1 / 2,n1 1,n 2 1 < 2 2 < F / 2,n1 1,n 2 1 =1
S2 1
2
2
S /S
P F1 / 2,n1 1,n 2 1 < 12 22 < F / 2,n1 1,n 2 1 =1
1 / 2
2
2
1
1
1 / 2
P
< 2 2<
=1
F / 2,n1 1,n 2 1 S1 / S2 F1 / 2, 1, 1
n1 n 2
2
2
2
1
1
S1 1
S1
P
< 2<
=1
2
2
F / 2,n1 1,n 2 1 S2 2 F1 / 2, 1, 1 S2
n1 n 2
F1 / 2,
n1
1,
1
2
1
F / 2,
n 2 1,n11
Teorema. Si
S1
S2
16
normales, entonces un intervalo de confianza 100(1-)% para el cociente de dos varianzas est dado por:
2
S1 1
S
< 2 < F / 2,n 2 1,n11 12
2
S2
F / 2,n11,n 2 1 S2 2
Ejemplo. Considere de nuevo el problema del contenido de nicotina de dos marcas de cigarrillos.
ni
xi
Si
Marca A
10
3.1
Marca B
8
2.7
0.5
0.7
Suponiendo que los conjuntos de datos provienen de muestras tomadas al azar de poblaciones normales con
varianzas desconocidas, construya un intervalo de confianza del 98% para la relacin de las dos varianzas de
los contenidos de nicotina de las dos marcas de cigarrillos.
Solucin. Tenemos que: F0.01,9,7 = 6.72, F0.01,7,9 = 5.61
El intervalo de confianza del 99% par la relacin de la varianza de la marca B (la mayor) a la varianza de la
marca A est dado por:
2
Como el valor de la relacin uno est comprendido en el intervalo de confianza, no hay evidencia para
rechazar hiptesis sobre la igualdad de las dos varianzas.
8
Cuando se comparan las medias de dos niveles es deseable que las observaciones dentro de cada nivel sean
lo ms homogneas posibles. Si existe un efecto debido a factores externos stos pueden neutralizarse
mediante la aplicacin del principio de la aleatoriedad. Esto se logra tomando las observaciones en pares. Se
supone que las condiciones exteriores son las mismas para cada par, pero pueden variar de un par a otro. Por
ejemplo, suponga que se tiene un grupo de personas que se someten a una dieta para reduccin de peso, y
para cada persona se lleva el registro del peso, en kgs, antes de la dieta, y un tiempo razonable despus de
haber empezado la dieta. En este caso, el peso de cada persona despus de la dieta no es independiente del
peso de la misma persona antes de la dieta; por lo tanto estas dos variables estn correlacionadas, y si se
quiere examinar el efecto de la dieta, se debe llevar el registro del peso para la misma persona antes y
despus de la dieta.
Sean (X11, X21), (X12, X22),...(X1n,X2n) los datos consistentes de n pares; supondremos que las variables
aleatorias X1 y X2 tienen medias 1 y 2, y varianzas
D .
Sea Dj la diferencia entre las variables aleatorias del j-simo par, es decir, Dj = X1j-X2j. El valor esperado y la
varianza de la diferencia entre las variables est dado por:
17
E(D) = D = E( X1 X2) = 1 2
V(D) = 2 = E( X1 X2) = 2 + 2 2COV( X1, X2)
D
1
2
Si las variables X1 y X2 se distribuyen normalmente, las diferencias estarn distribuidas tambin de manera
2
Medida 1 (antes)
Media 2 (despus)
X1i
X2i
Diferencia
Di = X1i X2i
1
2
......
I
.......
N
Medida resumen
X11
X12
.......
X1i
X1n
X21
X22
.......
X2i
X2n
X11 - X21
X12 - X22
X1
X2
D,
X1i - X2i
X1n - X2n
2
SD
Dada la muestra aleatoria se calculan los siguientes estadsticos que servirn para estimar la media y la
varianza de la diferencia,
D=
D y 2D , respectivamente:
1 n
D
ni =1 i
1 n
=
( D )2
S2
d n 1 Di
i =1
Sabemos que la siguiente variable aleatoria sigue una distribucin normal estndar:
Z=
D D
d / n
2
S D , en cuyo
caso la siguiente variable aleatoria sigue una distribucin t con n-1 grados de libertad.
T=
D D
Sd / n
Usando la distribucin t podemos calcular el intervalo de confianza para la media de observaciones pareadas,
el cual est dado por el siguiente teorema.
Teorema. Si
SD
aleatorios de mediciones normalmente distribuidas, entonces un intervalo de confianza del 100(1-)% para la
diferencia de medias D = 1 -2 es:
D t / 2,n 1
Sd
n
D D + t / 2,n 1
Sd
n
Ejemplo. Se est investigando la utilidad de dos lenguajes de diseo para mejorar las tareas de
programacin. Se le ha pedido a 12 programadores expertos, familiarizados con los dos lenguajes, que
codifiquen una funcin estndar con ambos lenguajes, y se registra el tiempo requerido, en minutos, para
realizar estas dos tareas. Los datos obtenidos son los siguientes:
18
1
2
3
4
5
6
7
8
9
10
11
12
Media
Varianza
Diferencia
Leng 1 Leng 2
-1
2
2
3
-5
3
6
1
2
-1
-2
-2
0.67
8.79
Encuentre un intervalo de confianza para la diferencia en los tiempos medios de codificacin. Use un nivel de
confianza del 95%. Existe alguna evidencia que indique una preferencia por alguno de los dos lenguajes?
Tenemos que:
d = 0.67,
sd = 8.79,
2
sd = 2.96,
t 0.025,11 = 2.201
0.67 2.201 x
2.96
2.96
<D < 0.67 + 2.201 x
1.22 <D < 2.55
12
12
Dado que la diferencia puede ser cero, se concluye que no hay evidencia para rechazar la hiptesis de que
ambos lenguajes requieren el mismo tiempo de programacin, y por lo tanto no hay preferencia por ninguno
de los dos lenguajes.
9
Problemas
1
En un artculo de la revista Human Factors se reportan los resultados de un experimento para
comparar caractersticas de maniobra para dos automviles de diferentes longitudes, distancias entre ejes y
radios de giro. Las observaciones se refieren a los tiempos en segundos necesarios por una persona para
estacionar cada automvil en paralelo (con dos vehculos a los lados).
Persona
Automvil A
Automvil B
1
37.0
17.8
2
25.8
20.2
3
16.2
16.8
4
24.2
41.4
5
22.0
21.4
6
33.4
38.4
7
23.8
16.8
8
58.2
32.2
9
33.6
27.8
10
24.4
23.2
11
23.4
29.6
12
21.2
20.6
Cree Usted que el promedio de personas manejar ms fcilmente un automvil que el otro? Use un intervalo
de confianza del 90%. Haga explcitas las suposiciones necesarias.
2
Se recibe un lote grande de artculos proveniente de un proveedor que asegura que el porcentaje de
defectuosos en su proceso de produccin es del 1% o menos. Al seleccionar una muestra aleatoria de 200
artculos e inspeccionarlos se encontraron 8 defectuosos. Obtenga intervalos de confianza del 90 y 95% para
la verdadera proporcin de artculos defectuosos del proceso de manufactura del fabricante. Qu puede
concluir con respecto a la afirmacin del fabricante?
3
En el artculo Selection of a Method to Determine Residual Chlorine in Sewage Effluents, se
reportan los resultados de un experimento en el que se usaron dos mtodos diferentes para determinar el
contenido de cloro en muestras de agua clorada, para varias dosis y tiempos de contacto. Las observaciones
estn dadas en mg/litro.
Muestra
Mtodo 1
Mtodo 2
1
10.92
10.91
2
0.84
1.35
3
7.70
8.33
4
10.52
10.70
5
4.69
5.35
6
1.76
2.56
7
3.35
3.92
8
0.39
0.36
19
Construya un intervalo de confianza del 99% para la diferencia en lecturas del verdadero promedio de cloro
residual entre los dos mtodos. Interprete los resultados
4
Un investigador mdico desea determinar si un remedio experimental tiene el efecto colateral de
aumentar la presin sistlica sangunea. Se seleccionan al azar 12 personas de diferentes edades y
condiciones de salud, y se les mide la presin sangunea antes de aplicar la droga y un tiempo prudencial
despus de aplicarla. Considera Usted, usando intervalos de confianza del 95% y del 98% que el nuevo
remedio tiene efectos colaterales con respecto a la presin sangunea?
Persona
Antes
128
176
110
149
183
136
118
158
150
130
126
162
1
2
3
4
5
6
7
8
9
10
11
12
Media
Varianza
Presin sangunea
Despus
134
174
118
152
187
136
125
168
152
128
130
167
Diferencia
5
Cierto metal se produce, por lo comn, mediante un proceso estndar. Se desarrolla un nuevo proceso
en el que se aade una aleacin a la produccin del metal. Los fabricantes se encuentran interesados en
estimar la verdadera diferencia entre las tensiones de ruptura de los metales producidos por los dos procesos.
Para cada metal se seleccionan 12 ejemplares y cada uno de stos se somete a una tensin hasta que se
rompe. La siguiente tabla muestra las tensiones de ruptura de los ejemplares, en kilogramos por centmetro
cuadrado:
Proceso estndar
Proceso nuevo
446
462
401
448
476
435
421
465
459
429
438
472
481
453
411
459
456
427
427
468
459
452
445
447
Si se supone que el muestreo se llev a cabo sobre dos distribuciones normales e independientes, obtener los
intervalos de confianza estimados del 95 y 99% para la diferencia entre los dos procesos. Interprete los
resultados.
6
La lista electoral final en una eleccin reciente para senador, revel que 11,600 personas de un total
de 22,500 seleccionadas aleatoriamente, tienen preferencia por el candidato A con respecto al candidato B.
6.1 Obtener un intervalo de confianza unilateral inferior del 99% para la verdadera proporcin de votantes a
favor del candidato A. Con base en este resultado, podra usted afirmar que es probable que A gane la
eleccin?.
6.2 Supngase que se selecciona aleatoriamente una muestra de 225 personas con la misma proporcin
muestral a favor del candidato A. Son los resultados diferentes a los del inciso a)?
En este caso, son razonables las suposiciones para los intervalos de confianza aproximados del 99%?
7
Se espera tener una cierta variacin aleatoria nominal en el espesor de las lminas de plstico que
una mquina produce. Para determinar cundo la variacin en el espesor se encuentra dentro de ciertos
limites, cada da se seleccionan en forma aleatoria 12 lminas de plstico y se mide en milmetros su espesor.
Los datos que se obtuvieron son los siguientes: 12.6, 11.9, 12.3, 12.8, 11.8, 11.7, 12.4, 12.1, 12.3, 12.0, 12.5,
12.9. Si se supone que el espesor es una variable aleatoria distribuida normal, obtener los intervalos de
confianza estimados del 90, 95 y 99% para la varianza desconocida del espesor. Si no es aceptable una
varianza mayor de 0.9 mm, existe alguna razn para preocuparse con base en esta evidencia?
Ejercicios tericos. Intervalos de confianza media y diferencia de medias
1
Si x es un valor de una variable aleatoria que tiene una distribucin exponencial, determine k de manera
que el intervalo de 0 a kX sea un intervalo de confianza del (1 - a) 100% del parmetro .
20
2. Si X1 y X2 son los valores de una muestra aleatoria de tamao 2 tomada de una poblacin que tiene una
densidad uniforme con a = 0 y = , determine k de manera que 0 < < k (X1 + X2) sea un intervalo de
confianza del (1 - ) 100% de . (Indicacin: utilice el hecho de que X1 + X2 tiene una densidad triangular.
3. Mediante la aplicacin de los mtodos de la seccin 8.7, puede demostrarse que para una muestra
aleatoria de tamao 2, tomada de la poblacin del ejercicio 2, la distribucin del intervalo de muestra est
dada por
2
( R) para 0< R <
f ( R) = 2
X z / 2
< < X + z / 2
X Z2 / 3
5.
< < X + z / 3
Si X se utiliza como estimacin de , demuestre que podemos tener el (1 -) 100% de confianza en que
X , el valor absoluto de nuestro error, no exceder una cantidad especificada cuando el tamao de
la muestra sea
(Z / 2 )
Mediciones de la presin sangunea de 25 mujeres de edad avanzada tienen una media de X = 140 mm
de mercurio. Si estos datos se pueden considerar como una muestra tomada al azar de una poblacin
normal con = 10 mm de mercurio, construya un intervalo de confianza del 95% de la media de la
poblacin
9. Durante varios aos, se haba aplicado una prueba de nivel de matemticas a todos los alumnos de primer
ingreso de cierta universidad. Si 64 estudiantes, seleccionados al azar en este periodo, tardaron en
promedio 28.5 minutos en resolver la prueba con una varianza de 9.3 minutos2, construya un intervalo de
confianza del 99% del tiempo promedio verdadero que tard un alumno de primer ingreso en resolver el
examen.
10. Un experto en eficiencia desea determinar el tiempo promedio que tarda el personal de un taller de
reparaciones en cambiar un conjunto de cuatro neumticos a un auto de carreras. Determinar el tamao
de la muestra requerida para poder afirmar, con el 95% de confianza, que la media de la muestra no difiere
de la media real en dos segundos o ms. Por estudios realizados antes, se sabe que la desviacin
estndar de la poblacin es 12 segundos.
11. La longitud de los crneos de 10 esqueletos fsiles de una especie de aves extinta tiene una media de
5.68 cm y una desviacin estndar de 0.29 cm Suponiendo que estas mediciones estn normalmente
distribuidas, obtenga un intervalo de confianza del 95% de la longitud media de los crneos de esta
especie de aves.
21
12. Un inspector de alimentos, que examina 12 frascos de cierta marca de mantequilla de cacahuete, obtuvo
los siguientes porcentajes de impurezas: 2.3, 1.9, 2.1, 2.8, 2.3, 3.6, 1.4, 1.8, 2.1, 3.2, 2.0 y 1.9. Suponiendo
que estas determinaciones estn normalmente distribuidas, construya un intervalo de confianza del 99%
del porcentaje promedio de impurezas que hay en esta marca de mantequilla de cacahuete.
12. Una muestra tomada al azar de una poblacin normal de tamao n1 = l6 con 1 = 4.8 tiene la media
X1=
18 y una muestra aleatoria de tamao n2 = 25 tomada de una poblacin normal diferente con 2 = 3.5
tiene la media X 2 = 23. Determine un intervalo de confianza del 90% para 1 - 2.
13. Un estudio de dos tipos de equipo de fotocopiado demuestra que 60 fallas del primer tipo de equipo
tardaron un promedio de 80.7 minutos en ser reparadas, con una desviacin estndar de 19.4 minutos;
mientras tanto, 60 fallas del segundo tipo de equipo tardaron en promedio 88.1 minutos en repararse con
una desviacin estndar de 18.8 minutos. Obtenga un intervalo de confianza del 99% de la diferencia entre
los tiempos promedio reales que se requirieron para reparar fallas de los dos tipos de equipo de
fotocopiado.
15. Doce rboles de frutos ctricos maduros, seleccionados al azar de una variedad de ejemplares, tienen una
altura media de 13.8 pies con una desviacin estndar de 1.2 pies y 15 rboles de frutos ctricos maduros
seleccionados tambin al azar de otra variedad, tienen una altura media 12.9 pies con una desviacin
estndar de 1.5 pies. Suponiendo que las dos muestras aleatorias se seleccionaron de poblaciones
normales con varianzas iguales, construya un intervalo de confianza del 95% de la diferencia en las alturas
promedio reales de los dos tipos de rboles de frutos ctricos.
16. Las siguientes son las capacidades de produccin de calor del carbn extrado de dos minas (en millones
de caloras por tonelada):
Mina A: 8500, 8330, 8480, 7960, 8030
Mina B: 7710, 7890, 7920, 8270, 7860
Suponiendo que los datos constituyen muestras aleatorias independientes tomadas de poblaciones
normales con varianzas iguales, construya un intervalo de confianza del 99% de la diferencia entre el
promedio real de las capacidades de produccin de calor del carbn extrado de ambas minas.
EJERCICIOS TERICOS. PROPORCIONES Y VARIANZAS
1. Resolviendo el siguiente sistema de desigualdades
z / 2 <
X n
n(1 )
X n
n(1 )
< z / 2
demuestre que los limites de confianza del (1 - ) 100% para son (x =nmero de xitos en una muestra
aleatoria de tamao n, p = x/n)
x (n x ) 1 2
1
x + .z2 / 2
+ . z1 / 2
z1 / 2
n
4
2
2
n + z1 / 2
2.
Utilice el intervalo de confianza de muestra grande para para demostrar que podemos tener cuando
menos el (1 - ) 100% de confianza en que
P ,
X
como estimacin
n
2
z / 2
especificada cuando el tamao de la muestra sea n =
4e 2
utilizamos la proporcin de la muestra
P=
3. Modifique el intervalo de confianza de muestra grande para proporciones para considerar la correccin de
continuidad que utilizamos cuando aproximamos una distribucin binomial con una distribucin normal.
4.
Para n grande, la distribucin muestral de S se aproxima algunas veces con una distribucin normal que
22
tiene la media y la varianza 2/2n. Demuestre que esta aproximacin nos conduce al siguiente intervalo
de confianza del (1 - ) 100% de muestra grande para :
S
S
< <
1+ z / 2
1 z / 2
2n
2n
EJERCICIOS APLICADOS
7. Un estudio de muestra realizada en un supermercado demostr que 204 de 300 compradores utilizan con
regularidad cupones de los centavos suprimidos. Utilice el intervalo de confianza de muestra para obtener
un intervalo de confianza del 99% para proporcin verdadera correspondiente.
8. En una muestra aleatoria de 250 televidentes de cierta zona, 190 haban presenciado cierto programa de
debate. Construya un intervalo de confianza del 95% para la proporcin verdadera correspondiente,
mediante el uso de
a) el intervalo de confianza de muestra grande.
b) los lmites de confianza del ejercicio 1.
9. Aplique la teora del ejercicio 2 para obtener el tamao de la muestra mnimo que nos permitir afirmar,
con un grado de confianza de por lo menos 95%, que una proporcin de la muestra (que se utiliza para
obtener el parmetro de la poblacin binomial "falla" cuando mucho en 0.03.
10. Aplique la teora del ejercicio 2 para determinar el tamao de la muestra mnima que nos permitir
aseverar, con un grado de confianza de cuando menos 99%, que una proporcin de la muestra (que se
emplea para calcular el parmetro de una poblacin binomial "falla" cuando mucho en 0.02.
11 - En una muestra aleatoria de personas que visitan un famoso centro turstico, 84 de 250 hombres y 156 de
250 mujeres compraron recuerdos. Construya un intervalo de confianza del 95% para la diferencia entre
las proporciones verdaderas de hombres y mujeres que compran recuerdos en este sitio turstico (e
interprete los resultados).
12. Entre 500 solicitudes de matrimonio, elegidas al azar en 1971, hubo 48 en las cuales las mujeres eran
cuando menos un ao mayores que los hombres y entre 400 solicitudes de matrimonio, elegidas al azar en
1977, hubo 68 en las cuales las mujeres eran cuando menos un ao mayores que los hombres. Construya
un intervalo de confianza del 99% para la diferencia entre las proporciones verdaderas correspondientes
de solicitudes de matrimonio en las cuales las mujeres fueron cuando menos un ao mayores que 105
hombres.
13. Con referencia al eje0rcicio 11 de la seccin anterior, construya un intervalo de confianza del 95% para la
varianza verdadera en la longitud de los crneos de la especie de aves dada.
14. Utilice los datos del ejercicio 9 de la seccin anterior y el intervalo de confianza de muestra grande del
ejercicio 5 con el fin de construir un intervalo de confianza del 99% para la desviacin estndar verdadera
del tiempo que tardan los estudiantes en resolver el examen.
15. Con referencia al ejercicio 15 de la seccin anterior, construya un intervalo de confianza del 98% para la
razn de las dos varianzas de la poblacin.
16. Con referencia al ejercicio 16 de la seccin anterior, construya un intervalo de confianza para la razn de
las dos desviaciones estndar de la poblacin.
23
Z=
X
N (0,1) ,
X + Z / 2
X Z / 2
n
n
T=
X
T (n 1)
S
n
S
S
X + t / 2,n 1
X t / 2,n 1
n
n
Z=
X1 X 2
12
n1
X1 X 2 Z / 2
(1 2) N (0,1)
22
n2
12 22
12 22
+
1 2 X1 X 2 + Z / 2
+
n1 n 2
n1 n 2
T=
X1 X 2 (1 2 )
SP
1
1
+
n1 n 2
S P2 =
t n1+ n 2 2 ,
1
1
1
1
+
1 2 X 1 X 2 + t / 2 , n1 + n 2 2 S P
+
X 1 X 2 t / 2 , n1 + n 2 2 S P
n1 n 2
n1 n 2
X X 2 (1 2 )
T= 1
tv ,
S12 S 22
+
n1
n2
2
2
S2 / n
S2 / n
1 1
2 2
n2 1
n1 1
S2 S2
S2 S2
X 1 X 2 t / 2 , V 1 + 2 1 2 X1 X 2 + t / 2 , V 1 + 2
n1 n 2
n 1 n 2
24
P
N (0,1) ,
(1 )
n
Z=
p(1 p )
p(1 p )
p + Z / 2
n
n
p Z1 / 2
1.4
P1 P 2 (1 2 )
1(1 1 ) 2 (1 2 )
Z=
n1
P1 P2 Z / 2
N(0,1)
n2
P1 (1 P1 ) P2 (1 P2 )
P (1 P1 ) P2 (1 P2 )
+
1 2 P1 P2 + Z / 2 1
+
n1
n2
n1
n2
1.5
Intervalo de confianza para la varianza de una distribucin normal
(n 1)S 2 2
n 1
2
(n 1)S
2 / 2,n 1
1.6
(n 1)S 2
12 / 2,n 1
F=
S12 / 12
S22
1
F / 2,n1 1,n 2 1
/ 22
S12 22
S22 12
Fn1 1,n2 1
S 22 22
S 22
F
/ 2 , n 2 1, n1 1
S12 12
S12
T=
D t / 2,n 1
Sd
n
Sd /
D
t n1
D D + t / 2,n 1
Sd
n