6. Intervalos de Confianza 1
6.1. Planteamiento del problema . . . . . . . . . . . . . . . . . . . . . . . . . 1
6.2. Concepto general de Intervalo de Confianza . . . . . . . . . . . . . . . . 3
6.3. Método de la cantidad pivotal para la construcción de intervalos de con-
fianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
6.4. Método de Neyman para la construcción de Intervalos de Confianza . . . 10
6.5. Intervalos de Confianza para parámetros de distribuciones normales . . . 14
6.6. Intervalos de confianza basados en distribuciones asintóticas. . . . . . . . 19
6.7. Intervalos de confianza bayesianos. . . . . . . . . . . . . . . . . . . . . . 20
6.7.1. Distribución a posteriori . . . . . . . . . . . . . . . . . . . . . . . 21
1
Capı́tulo 6
Intervalos de Confianza
Ejemplo 6.1.
Sea (X1 , X2 , . . . , Xn ) una m.a.s. de una población N (θ, σ) con σ conocida y θ descono-
cida. Sabemos que el estadı́stico
X −θ
T = σ
√
n
sigue una distribución N (0, 1). Por consiguiente, consultando las tablas de la N (0, 1),
podemos afirmar que
Pθ (−1,96 < T < 1,96) = 0,95.
La desigualdad −1,96 < T < +1,96 equivale a
σ σ
X − 1,96 √ < θ < X + 1,96 √
n n
1
Capı́tulo 6. Intervalos de Confianza 2
de manera que es
! "
σ σ
Pθ X − 1,96 √ < θ < X + 1,96 √ = 0,95
n n
cualquiera que sea θ.
La interpretación es clara: Hay una probabilidad de 0.95 de obtener una muestra
tal que el intervalo de extremos aleatorios
σ σ
X − 1,96 √ , X + 1,96 √
n n
incluya al valor de θ con el que se han producido las observaciones muestrales; y ello
independientemente de cual sea ese valor θ.
Una vez utilizada la distribución en el muestreo de X para establecer la con-
clusión anterior, se puede hacer efectivo el muestreo; obtener unos resultados concretos:
σ σ
x1 , x2 , . . . , xn y con ellos x y determinar el intervalo numérico (x−1,96 √ , x+1,96 √ ).
n n
Desde luego, ahora no tiene sentido afirmar que hay probabilidad 0.95 de que
el intervalo numérico contenga a θ con el que se han producido las observaciones, no
obstante 0.95 expresa el margen de confianza (nivel de confianza) que tenemos en que el
valor θ esté entre los márgenes del intervalo; en el sentido de que repitiendo el muestreo
un gran número de veces, se obtendrı́an resultados distintos, entre los cuales, muy apro-
ximadamente, el 95 % contendrı́an al valor concreto de θ.
El intervalo numérico
σ σ
(x − 1,96 √ , x + 1,96 √ )
n n
se denomina intervalo de confianza para θ con nivel de confianza 0,95 (ó del 95 %).
Por supuesto el procedimiento puede repetirse con cualquier nivel de confianza.
Por ejemplo,
σ σ
con 0,9 → (x − 1,645 √ , x + 1,645 √ )
n n
σ σ
con 0,99 → (x − 2,576 √ , x + 2,576 √ )
n n
2
Capı́tulo 6. Intervalos de Confianza 3
=⇒ f (b) = f (a) =⇒ a = −b
por ser f simétrica respecto al origen.
De una población descrita por una variable aleatoria X cuya distribución teórica
pertenece a una familia paramétrica
# $
F = Fθ /θ ∈ Θ ⊂ Rk
se considera una muestra aleatoria (X1 , X2 , . . . , Xn ) con distribución Pθ . Sea g(θ) una
función del parámetro con valores reales y T1 ≤ T2 dos estadı́sticos unidimensionales
tales que
Pθ {T1 (X1 , X2 , . . . , Xn ) ≤ g(θ) ≤ T2 (X1 , X2 , . . . , Xn )} ≥ 1 − α ∀θ ∈ Θ
Entonces para cualquier muestra concreta (x1 , x2 , . . . , xn ), el intervalo
[T1 (x1 , x2 , . . . , xn ), T2 (x1 , x2 , . . . , xn )] se denomina intervalo de confianza para g(θ), de
nivel de confianza 1 − α.
Observación 6.1.
3
Capı́tulo 6. Intervalos de Confianza 4
mientras que la definición es más imprecisa, puesto que sólo exige que dicha pro-
babilidad sea ≥ 1 − α. La razón es la continuidad de la distribución N (0, 1), que
además hace inútil incluir los extremos del intervalo [T1 , T2 ]. Pero en general la
distribución podrı́a ser discreta y no ser posible alcanzar exactamente el valor 1−α
y aconseja incluir los extremos T1 y T2 para aumentar la probabildiad de que [T1 , T2 ]
contenga g(θ) sin incrementar la longitud del intervalo; se trata de garantizar que
el intervalo [T1 , T2 ] incluya al valor g(θ) con probabilidad al menos 1 − α (por ello
la desigualdad). Y dentro de los que cumplan ≥ 1 − α, tomar el más corto posible
y de nivel de confianza menor ya que un intervalo de nivel 0,99 también lo serı́a
de 0,95.
Pθ (S(X1 , X2 , . . . , Xn ) ∋ θ) ≥ 1 − α ∀θ ∈ Θ
4
Capı́tulo 6. Intervalos de Confianza 5
Pθ {c1 ≤ T (X1 , X2 , . . . , Xn ; θ) ≤ c2 } ≥ 1 − α ∀θ
c1 ≤ T (X1 , X2 , . . . , Xn ; θ) y T (X1 , X2 , . . . , Xn ; θ) ≤ c2
Ejemplo 6.2.
Consideremos una población con distribución U (0, θ)
⎧
⎨ 0 x<0
x
Fθ (x) = 0≤x<θ
⎩ θ
1 x≥θ
De las ecuaciones
X(n) 1/n X(n)
= α1 y = (1 − α2 )1/n
θ θ
5
Capı́tulo 6. Intervalos de Confianza 6
resulta
−1/n
θ = X(n) α1 y θ = X(n) (1 − α2 )−1/n
la segunda de las cuales es menor que la primera. Luego
* +
−1/n −1/n
(1 − α2 ) x(n) , α1 x(n)
La longitud esperada:
2 1
n n
E[T ] = yny n−1 dy = E[X(n) ] = θ
0 n+1 n+1
n
luego la longitud esperada = [α−1/n − 1]E[X(n) ] = [α−1/n − 1]θ .
n+1
La determinación de un estadı́stico que permita emplear el método de la cantidad
pivotal puede llevarse a cabo, en ocasiones, gracias al hecho siguiente: Si (X1 , X2 , . . . , Xn )
es una m.a.s. de una población de distribución F = {Fθ ; θ ∈ Θ ⊂ R} cuyos elementos
son funciones continuas de x entonces el estadı́stico
n
3
T (X1 , X2 , . . . , Xn ; θ) = − logFθ (Xi )
i=1
Pθ {−log Fθ (Xi ) ≤ y} = Pθ {logFθ (Xi ) ≥ −y} = Pθ (Fθ (Xi ) ≥ e−y } = Pθ {Xi ≥ Fθ−1 (e−y )} =
n
3
=1− Fθ (Fθ−1 (e−y )) =1−e −y
⇒− log Fθ (Xi ) : γ(n, 1)
i=1
6
Capı́tulo 6. Intervalos de Confianza 7
Observación 6.2.
V du 1
Si U : γ(n, 1) ⇒ 2 U : χ22n pues V = 2U, U= , = ,
2 dv 2
1 1
f (v) = v n−1 2n−1 e−v/2 v > 0
2 (n − 1)!
Aunque este método es general, pero a veces da lugar a cálculos inviables. En
cambio en otras ocasiones el método es operativo.
Ejemplo 6.3.
Sea (X1 , X2 , . . . , Xn ) una m.a.s. de una población con distribución teórica
⎧
⎨ 0 x<0
Fθ (x) = xθ 0 ≤ x < 1
⎩
1 1≤x
En consecuencia ⎛ ⎞
⎜ ⎟
⎜ c1 c2 ⎟
⎜ , ⎟
⎜ n
3 n
3 ⎟
⎝ ⎠
− log xi − log xi
i=1 i=1
7
Capı́tulo 6. Intervalos de Confianza 8
Ejemplo 6.4.
En la distribución Uniforme U (0, θ), como 0 < x1 , x2 , . . . xn < θ
n
3 n
3 3 n
xi
Y =− log Fθ (xi ) = − log =− log xi + n log θ
i=1 i=1
θ i=1
8
Capı́tulo 6. Intervalos de Confianza 9
1 x X
2.- f( ) escala
σ σ σ
1 x−µ X −µ X −µ
3.- f( ) posición escala ,
σ σ S σ
Prueba:
dx
1. Sea X ′ = X − µ ⇒ X = X ′ + µ ⇒ =1
dx′
g(x′ ) = f (x′ ) independiente de µ, X ′ = X − µ: distribución independiente de µ.
Ejemplo de parámetro de posición: µ en N (µ, σ) con σ conocida.
X dx
2. Sea X ′ = ⇒ X = σX ′ ⇒ ′ = σ
σ dx
1 X
g(x′ ) = f (x′ )σ = f (x′ ) independiente de σ, X ′ = distribución independiente
σ σ
de σ.
1
Ejemplo de parámetro de escala: λ en Exp( )
λ
X −µ dx
3. Sea Y = ⇒ X = σY +µ ⇒ = σ.
σ dy
1
g(y) = f (y)σ = f (y) distribución independiente de µ y σ .
σ
X −µ
Y = distribución independiente de µ y σ.
σ
n
3
(Yi − Y )2 n = >2
i=1 1 3 Xi − µ (X − µ)
SY2 = = − =
n−1 n − 1 i=1 σ σ
n
1 3 (Xi − X)2 1 2
= 2
= 2 SX
n − 1 i=1 σ σ
Y X −µ
= distribución independiente de µ y σ
SY SX
Ejemplo de parámetro de posición - escala: (µ, σ) en N (µ, σ).
9
Capı́tulo 6. Intervalos de Confianza 10
con lo cual
es decir que las desigualdades c1 (θ) ≤ T ≤ c2 (θ) determinan en el plano (θ, T ) una región
R cuyas secciones verticales, correspondientes a cada valor fijo de θ, tienen probabilidad
Pθ superior a 1 − α.
10
Capı́tulo 6. Intervalos de Confianza 11
y por tanto
[θ1 (T (x1 , x2 , . . . , xn )), θ2 (T (x1 , x2 , . . . , xn ))]
es un intervalo de confianza de nivel 1 − α para θ.
Observación 6.3.
11
Capı́tulo 6. Intervalos de Confianza 12
Ejemplo 6.5.
Sea (X1 , . . . , Xn ) una m.a.s. de una U (0, θ). Consideremos el estadı́stico T (X1 , . . . , Xn ) =
X(n) = M axi=1,2,...,n {Xi } cuya distribución en el muestreo es
⎧
⎨ 0 si t < 0
t n
Hθ (t) = Pθ (X(n) ≤ t) = ( ) 0≤t<θ
⎩ θ
1 t≥θ
1/n
c1 (θ) = α1 θ y c2 (θ) = (1 − α2 )1/n θ
1/n
α1 θ = t, (1 − α2 )1/n θ = t
−1/n
θ1 (t) = (1 − α2 )−1/n t, θ2 (t) = α1 t
Por tanto
−1/n
Pθ {(1 − α2 )−1/n X(n) < θ < α1 X(n) } = 1 − α
−1/n
resulta el mismo intervalo de confianza ((1 − α2 )−1/n x(n) , α1 x(n) ) que el obtenido por
el método de la cantidad pivotal.
12
Capı́tulo 6. Intervalos de Confianza 13
Ejemplo 6.6.
Sea (X1 , X2 , . . . , Xn ) una m.a.s. de una población con función de densidad
2x
fθ (x) = 0<x<θ
θ2
Determinar por el método de Neyman un intervalo de confianza para θ con nivel 1 − α.
La función de distribución de la población es
⎧
⎪ 0 x<0
⎨ 2
x
Fθ (x) = 0≤x<θ
⎪
⎩ θ2
1 θ≤x
Como θ es el extremo superior parece razonable considerar el estadı́stico X(n) de función
de distribución ⎧
⎪ 0 y<0
⎨ 2n
n y
Gθ (y) = (Fθ (y)) = 0≤y<θ
⎪
⎩ θ2n
1 y≥θ
13
Capı́tulo 6. Intervalos de Confianza 14
Notación:
Si Z, Y, t y U son v.a. respectivamente N (0, 1), χ2n , tn y Fn,m se designará por Zα , χ2n,α , tn,α , Fn,m,α
los valores tales que
P {Z > Zα } = α P {t > tn,α } = α
2
P {Y > χn,α } = α P {U > Fn,mα } = α
14
Capı́tulo 6. Intervalos de Confianza 15
B.- Intervalo de Confianza para la media (µ) con varianza poblacional desconocida
(S 2 cuasivarianza).
X −µ
Cantidad pivotal: T (X1 , ..., Xn , µ) = √ : tn−1
S/ n
X −µ
Pµ,σ {−tn−1;α/2 < √ < tn−1;α/2 } = 1 − α
S/ n
S S
{(x − tn−1,α/2 √ , x + tn−1,α/2 √ )}
n n
es un intervalo de confianza para µ con σ desconocida a nivel 1 − α.
15
Capı́tulo 6. Intervalos de Confianza 16
X −µ S2
y (n − 1) con S 2 cuasivarianza .
√σ σ 2
n
tiene probabilidad (1 − α)(1 − β). Las dos desigualdades definen en el plano (µ, σ 2 )
una región Σ limitada por la parábola
σ2 (n − 1)S 2 (n − 1)S 2
(X − µ)2 = Zα/2 y por las rectas σ 2 = 2 , σ2 = 2
n χn−1,β/2 χn−1,1−β/2
16
Capı́tulo 6. Intervalos de Confianza 17
Otra posibilidad para encontrar región de confianza para (µ, σ 2 ) es: Teniendo en
cuenta P (A ∩ B) = P (A) − P (A ∩ B c ) ≥ P (A) − P (B c ) = P (A) − (1 − P (B)) =
P (A)+P (B)−1, si P (A) = 1−α y P (B) = 1−β, P (A∩B) ≥ 1−α+1−β −1 =
1−α−β
! "
S S (n − 1)S 2 2 (n − 1)S 2
P X − √ tn−1,α/2 < µ < X + √ tn−1,α/2 ; <σ < ≥
n n χn−1,β/2 χn−1,1−β/2
1−α−β =1−γ
Resulta como región de confianza un rectángulo en el plano (µ, σ 2 ).
X − Y − (µ1 − µ2 )
C
Cantidad pivotal: T (X1 , ..., Xn , Y1 , ..., Ym , µ1 −µ2 ) = : N (0, 1)
σ12 σ22
+
n m
C C
σ12 σ22 σ12 σ22
{(x − y − Zα/2 + , x − y + Zα/2 + )}
n m n m
es un intervalo de confianza a nivel 1 − α para µ1 − µ2 .
17
Capı́tulo 6. Intervalos de Confianza 18
S12 /σ12
P {Fn−1,m−1;1−α/2 < 2 2 < Fn−1,m−1;α/2 } = 1 − α
S2 /σ2
y por tanto
S12 σ22
Fn−1,m−1;1−α/2 < < Fn−1,m−1;α/2
S22 σ12
entonces
S12 /S22 S12 /S22
{ , }
Fn−1,m−1,α/2 Fn−1,m−1,1−α/2
σ12
es un intervalo de confianza al nivel 1 − α para el cociente de varianzas 2 .
σ2
I.- Intervalo de confianza para la diferencia de medias de dos poblaciones normales
no independientes.
Si (X1 , Y1 ), (X2 , Y2 ), . . . , (Xn , Yn ) es una m.a.s. de una población normal bidimen-
sional de medias (µ1 , µ2 ) y covarianza σ11 ̸= 0 tenı́amos que
n
√ X − Y − (µ1 − µ2 ) ∗2 13
n−1 , S = (Xi − Yi )2 − (X − Y )2
S∗ n i=1
18
Capı́tulo 6. Intervalos de Confianza 19
19
Capı́tulo 6. Intervalos de Confianza 20
Ejemplo 6.8.
Dadas dos poblaciones independientes N (µ1 , σ1 ), N (µ2 , σ2 ) con los 4 parámetros desco-
nocidos y σ12 ̸= σ22 vimos que
(X − Y ) − (µ1 − µ2 )
C 2 → N (0, 1)
S1 S22
+
n1 n2
y el Intervalo de confianza aproximado para (µ1 − µ2 ) si n1 y n2 son grandes
E E
S12 S22 S12 S22
((x − y) − Zα/2 + , (x − y) + Zα/2 + )
n1 n2 n1 n2
Hasta ahora suponemos para la población una función de densidad f (x, θ) su-
poniendo conocida la función f (·, ·). Además se supone que θ tiene un valor fijo aunque
desconocido. En muchas situaciones reales puede haber cierta información sobre θ (hasta
ahora sólo era θ ∈ Θ).
Ası́ el experimentador puede tener la evidencia de que θ actúa como variable aleatoria
para la cual se puede suponer cierta función de densidad. Por ejemplo, en un proceso de
producción se examina la producción de piezas defectuosas que resultan. En un cierto
dı́a se examinan 10 piezas con observaciones x1 , x2 , . . . , x10 donde x1 = 1 si es defectuosa,
xi = 0 si no es defectuosa. Aquı́ f (x; θ) = θx (1 − θ)1−x I0,1 (x) 0 ≤ θ ≤ 1. La distribución
conjunta de los 10 valores es
n
<
!n !n
xi 10− xi
θ i=1 (1 − θ) i=1 I0,1 (xi ) 0 ≤ θ ≤ 1
i=1
20
Capı́tulo 6. Intervalos de Confianza 21
En este caso f (·; θ) se debe interpretar como f (x/θ) una densidad condicionada
(densidad si θ = θ), indicable también por fX/θ=θ (x/θ). Si gΘ es conocida, gΘ se llama
distribución a priori, contiene la información que tenemos sobre θ a priori es decir antes
de tomar la muestra x1 , x2 , . . . , xn .
Introducimos ahora la distribución que contiene la información sobre Θ después
de observada la muestra.
Definición 6.2. La distribución condicionada de θ dada la muestra X1 = x1 , X2 =
x2 , . . . , Xn = xn indicada por π(θ/x1 , x2 , . . . , xn ) = πθ/X1 =x1 ,X2 =x2 ,...Xn =xn (θ/x1 , x2 , . . . xn )
se llama distribución a posteriori de θ
Observación 6.4.
Fn
f (x1 , x2 , . . . , xn /θ)g(θ) f (xi /θ)g(θ)
π(θ/x1 , x2 , . . . , xn ) = = Fni=1
G
f (x1 , x2 , . . . , xn ) ( i=1 f (xi /θ))g(θ)dθ
21
Capı́tulo 6. Intervalos de Confianza 22
Ejemplo 6.9.
Sea X1 , X2 , . . . , Xn una m.a.s. de N (θ, 1), θ : N (0, 1)
n
1 1 3
√ n+1 exp{− ( (xi − θ)2 + θ2 )}
2π 2 i=1
π(θ/x1 , x2 , . . . , xn ) = 2 n
1 1 3
√ exp{− ( (xi − θ)2 + θ2 )}dθ
( 2π)n+1 2 i=1
n
3 n
3 n
3
2 2
(xi − θ) + θ = x2i − 2θ xi + (n + 1)θ2
i=1 i=1 i=1
⎛ n ⎞
3
⎜ xi ⎟ n
⎜ 2 ⎟ 3
= (n + 1) ⎜
⎜θ − 2 θ i=1 ⎟+
⎟ x2i
⎝ n + 1 ⎠ i=1
⎛ n ⎞2 n
3 3
⎜ xi ⎟ ( xi ) 2 n
⎜ ⎟ 3
⎜
= (n + 1) ⎜θ − i=1 ⎟ i=1
x2i
n + 1 ⎟ − (n + 1) +
⎝ ⎠ i=1
⎧ ⎛ ⎞2 ⎫ n
⎧ ⎛ n ⎞⎫
⎪ ⎪ 3 ⎪ 3 ⎪
⎪
⎪ xi ⎟ ⎪ ⎪ ⎪
⎪ ( x ) 2 ⎪
⎪
⎪
⎨ ⎜ ⎪
⎬ ⎪
⎨ ⎜ n i ⎟⎪
⎬
⎜ ⎟ ⎜ 3 ⎟
exp − 2 (n + 1) ⎜
1
⎜ θ − i=1 ⎟ exp − 1 ⎜ x 2
− i=1 ⎟
⎪
⎪ ⎝ n+1⎟ ⎠⎪ ⎪ ⎪
⎪
2 ⎜
⎝ i=1
i
n+1 ⎟ ⎠⎪
⎪
⎪
⎪ ⎪
⎪ ⎪
⎪ ⎪
⎪
⎩ ⎭ ⎩ ⎭
π(θ/x1 , x2 , . . . , xn ) = ⎧ ⎛ n ⎞⎫
⎪ 3 ⎪ Hn
⎪
⎪ 2 ⎪
⎪ ⎜ ( x i ) ⎟⎪⎪ 2 i=1 xi 2
⎨ ⎜3 n
⎟⎬ − 12 (n+1)(θ− )
1⎜ 2 i=1 ⎟ n + 1 dθ
exp − 2 ⎜ xi − ⎟ e
⎪
⎪ ⎝ i=1 n + 1 ⎠⎪ ⎪
⎪
⎪ ⎪
⎪
⎩ ⎭
= Hn >
xi
i=1 1
θ/x1 , x2 , . . . , xn : N ,σ = √
n+1 n+1
Intervalo de Confianza
= = Hn > >
X i √
P −Zα/2 < θ − i=1 n + 1 < Zα/2 = 1 − α ⇒
n+1
22
Capı́tulo 6. Intervalos de Confianza 23
=I Hn I >
I I
i=1 Xi I 1
I
P Iθ − < Zα/2 √ =1−α
n+1 I n+1
y por tanto el intervalo es:
= Hn Hn >
i=1 xi 1 i=1 xi 1
− Zα/2 √ , + Zα/2 √
n+1 n+1 n+1 n+1
El intervalo No Bayesiano era:
= Hn Hn >
i=1 xi 1 i=1 xi 1
− Zα/2 √ , + Zα/2 √
n n n n
23