Tema 6. Intervalos de Confianza

Índice general
6. Intervalos de Confianza 1
6.1. Planteamiento del problema . . . . . . . . . . . . . . . . . . . . . . . . . 1
6.2. Concepto general de Intervalo de Confianza . . . . . . . . . . . . . . . . 3
6.3. Método de la cantidad pivotal para la construcción de intervalos de con-
fianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
6.4. Método de Neyman para la construcción de Intervalos de Confianza . . . 10
6.5. Intervalos de Confianza para parámetros de distribuciones normales . . . 14
6.6. Intervalos de confianza basados en distribuciones asintóticas. . . . . . . . 19
6.7. Intervalos de confianza bayesianos. . . . . . . . . . . . . . . . . . . . . . 20
6.7.1. Distribución a posteriori . . . . . . . . . . . . . . . . . . . . . . . 21
1
Capı́tulo 6
Intervalos de Confianza
6.1. Planteamiento del problema
El estudio de las distribuciones en el muestreo ha puesto de relieve un gran

número de casos en que un determinado estadı́stico T se distribuye con escasa varia-
bilidad alrededor de algún parámetro poblacional θ. Cabe esperar que el valor de T ,
observado en una muestra concreta, sea relativamente próximo a θ ó equivalentemente
que θ esté relativamente próximo del valor observado de T .
La distribución en el muestreo de T va a permitir diseñar un método para dar
unos márgenes de variación en que es previsible que se encuentre θ. Tal método se conoce
como estimación confidencial ó estimación por intervalos de confianza.
Ejemplo 6.1.
Sea (X1 , X2 , . . . , Xn ) una m.a.s. de una población N (θ, σ) con σ conocida y θ descono-
cida. Sabemos que el estadı́stico
X −θ
T = σ
√
n
sigue una distribución N (0, 1). Por consiguiente, consultando las tablas de la N (0, 1),
podemos afirmar que
Pθ (−1,96 < T < 1,96) = 0,95.
La desigualdad −1,96 < T < +1,96 equivale a
σ σ
X − 1,96 √ < θ < X + 1,96 √
n n
1
Capı́tulo 6. Intervalos de Confianza 2
de manera que es
! "
σ σ
Pθ X − 1,96 √ < θ < X + 1,96 √ = 0,95
n n
cualquiera que sea θ.
La interpretación es clara: Hay una probabilidad de 0.95 de obtener una muestra
tal que el intervalo de extremos aleatorios
σ σ
X − 1,96 √ , X + 1,96 √
n n
incluya al valor de θ con el que se han producido las observaciones muestrales; y ello
independientemente de cual sea ese valor θ.
Una vez utilizada la distribución en el muestreo de X para establecer la con-
clusión anterior, se puede hacer efectivo el muestreo; obtener unos resultados concretos:
σ σ
x1 , x2 , . . . , xn y con ellos x y determinar el intervalo numérico (x−1,96 √ , x+1,96 √ ).
n n
Desde luego, ahora no tiene sentido afirmar que hay probabilidad 0.95 de que
el intervalo numérico contenga a θ con el que se han producido las observaciones, no
obstante 0.95 expresa el margen de confianza (nivel de confianza) que tenemos en que el
valor θ esté entre los márgenes del intervalo; en el sentido de que repitiendo el muestreo
un gran número de veces, se obtendrı́an resultados distintos, entre los cuales, muy apro-
ximadamente, el 95 % contendrı́an al valor concreto de θ.
El intervalo numérico
σ σ
(x − 1,96 √ , x + 1,96 √ )
n n
se denomina intervalo de confianza para θ con nivel de confianza 0,95 (ó del 95 %).
Por supuesto el procedimiento puede repetirse con cualquier nivel de confianza.
Por ejemplo,
σ σ
con 0,9 → (x − 1,645 √ , x + 1,645 √ )
n n
σ σ
con 0,99 → (x − 2,576 √ , x + 2,576 √ )
n n
a mayor nivel de confianza mayor longitud del intervalo.

Observemos que también si T : N (0, 1)
Pθ (−1,74 < T < 2,37) = 0,95
2
de donde saldrı́a otro intervalo de confianza a nivel 0.95

σ σ
(x − 2,37 √ , x + 1,74 √ )
n n
σ σ σ
pero la longitud 4,11 √ es mayor que 2 · 1,96 √ = 3,92 √ .
n n n
σ
Si P (a < T < b) = 0,95 la longitud (b − a) √ es mı́nima para a = −b
n
En efecto hay que minimizar (b − a) sujeto a F (b) − F (a) = 0,95.
L = (b − a) − λ(F (b) − F (a) − 0,95)
∂L
= 1 − λf (b) = 0
∂b
∂L
= −1 + λf (a) = 0
∂a
=⇒ f (b) = f (a) =⇒ a = −b
por ser f simétrica respecto al origen.
6.2. Concepto general de Intervalo de Confianza
De una población descrita por una variable aleatoria X cuya distribución teórica
pertenece a una familia paramétrica
# $
F = Fθ /θ ∈ Θ ⊂ Rk
se considera una muestra aleatoria (X1 , X2 , . . . , Xn ) con distribución Pθ . Sea g(θ) una
función del parámetro con valores reales y T1 ≤ T2 dos estadı́sticos unidimensionales
tales que
Pθ {T1 (X1 , X2 , . . . , Xn ) ≤ g(θ) ≤ T2 (X1 , X2 , . . . , Xn )} ≥ 1 − α ∀θ ∈ Θ
Entonces para cualquier muestra concreta (x1 , x2 , . . . , xn ), el intervalo
[T1 (x1 , x2 , . . . , xn ), T2 (x1 , x2 , . . . , xn )] se denomina intervalo de confianza para g(θ), de
nivel de confianza 1 − α.
Observación 6.1.
1. Para la definición no es necesario que el muestreo sea aleatorio simple, aunque

será más difı́cil determinar Pθ . Tampoco es necesario que X sea unidimensional.
3
2. En el ejemplo se conseguı́a la igualdad
Pθ (T1 < θ < T2 ) = 1 − α,
mientras que la definición es más imprecisa, puesto que sólo exige que dicha pro-
babilidad sea ≥ 1 − α. La razón es la continuidad de la distribución N (0, 1), que
además hace inútil incluir los extremos del intervalo [T1 , T2 ]. Pero en general la
distribución podrı́a ser discreta y no ser posible alcanzar exactamente el valor 1−α
y aconseja incluir los extremos T1 y T2 para aumentar la probabildiad de que [T1 , T2 ]
contenga g(θ) sin incrementar la longitud del intervalo; se trata de garantizar que
el intervalo [T1 , T2 ] incluya al valor g(θ) con probabilidad al menos 1 − α (por ello
la desigualdad). Y dentro de los que cumplan ≥ 1 − α, tomar el más corto posible
y de nivel de confianza menor ya que un intervalo de nivel 0,99 también lo serı́a
de 0,95.
3. Si θ es unidimensional muchas veces g(θ) = θ y habrá de ser (Ti (X1 , X2 , . . . , Xn ) ∈

Θ c.s.i = 1, 2).
4. En el caso de más dimensiones también se puede generalizar el concepto de inter-

valo de confianza a región de confianza:
Definición 6.1. Si S(x1 , x2 , . . . , xn ) es un subconjunto de Θ ⊂ Rk , dependiente

de la muestra (x1 , x2 , . . . , xn ) tal que
Pθ (S(X1 , X2 , . . . , Xn ) ∋ θ) ≥ 1 − α ∀θ ∈ Θ
el conjunto S(x1 , x2 , . . . , xn ) recibe el nombre de región de confianza de nivel 1−α.
6.3. Método de la cantidad pivotal para la construc-

ción de intervalos de confianza
X −θ
El intervalo construido en el ejemplo se basa en que σ tiene distribución
√
n
en el muestreo independiente de θ. La misma técnica puede utilizarse en numerosas
ocasiones y recibe el nombre de método de la cantidad pivotal.
Descripción:
Sea T (X1 , X2 , . . . , Xn ; θ) una función de la muestra y del parámetro cuya distribución
en el muestreo no depende de θ, (es decir ∀A ∈ B , Pθ (T ∈ A) es independiente de θ).
4
En tal caso, fijado un nivel de confianza 1 − α se pueden determinar constantes c1 y c2

(que no serán únicas) tales que
Pθ {c1 ≤ T (X1 , X2 , . . . , Xn ; θ) ≤ c2 } ≥ 1 − α ∀θ
Basta por ejemplo que c1 y c2 sean los cuantiles de orden α1 y 1 − α2 con α1 + α2 = α

de la distribución en el muestreo de T (X1 , X2 , . . . , Xn ; θ).
Si es posible despejar g(θ) en las desigualdades
c1 ≤ T (X1 , X2 , . . . , Xn ; θ) y T (X1 , X2 , . . . , Xn ; θ) ≤ c2
obtendremos sendos valores Ti (X1 , X2 , . . . , Xn ) i = 1, 2 tales que ∀θ ∈ Θ
Pθ {T1 (X1 , X2 , . . . , Xn ) ≤ g(θ) ≤ T2 (X1 , X2 , . . . , Xn )} ≥ 1 − α
de manera que [T1 (x1 , x2 , . . . , xn ), T2 (x1 , x2 , . . . , xn )] será un intervalo de confianza para

g(θ) de nivel 1 − α.
Ejemplo 6.2.
Consideremos una población con distribución U (0, θ)
⎧
⎨ 0 x<0
x
Fθ (x) = 0≤x<θ
⎩ θ
1 x≥θ
Dada una m.a.s. de tamaño n consideramos la cantidad pivotal

1 X(n)
T (X1 , X2 , . . . , Xn ; θ) = máx Xi =
θ 1≤i≤n θ
de distribución en el muestreo
⎧
⎨ 0 y<0
n
Pθ (T ≤ y) = Pθ (X(n) ≤ θy) = y 0≤y<1 independiente de θ
⎩
1 1≤y
Fijado entonces el nivel de confianza 1 − α, sean α1 , α2 /α1 + α2 = α

( )
1/n
Pθ α1 ≤ T (X1 , X2 , . . . , Xn ; θ) ≤ (1 − α2 )1/n = (1 − α2 ) − α1 = 1 − α
De las ecuaciones
X(n) 1/n X(n)
= α1 y = (1 − α2 )1/n
θ θ
5
resulta
−1/n
θ = X(n) α1 y θ = X(n) (1 − α2 )−1/n
la segunda de las cuales es menor que la primera. Luego
* +
−1/n −1/n
(1 − α2 ) x(n) , α1 x(n)
constituye un intervalo de confianza para θ de nivel 1 − α ∀α1 , α2 /α1 + α2 = α. Como

su longitud es
−1/n
[α1 − (1 − α2 )−1/n ]x(n) = [(α − α2 )−1/n − (1 − α2 )−1/n ]x(n)
, -. /
ϕ(α2 )
es una función creciente de α2 , la longitud es mı́nima para α2 = 0 +→ α1 = α y el

intervalo es (x(n) , α−1/n x(n) ).
Nota:
0 1
′ 1 1 1 1 1
ϕ (α2 ) = (α−α2 )−1/n−1 − (1−α2 )−1/n−1 = n+1 − n+1 > 0 α2 < α
n n n (α − α2 ) n (1 − α2 ) n
La longitud esperada:
2 1
n n
E[T ] = yny n−1 dy = E[X(n) ] = θ
0 n+1 n+1
n
luego la longitud esperada = [α−1/n − 1]E[X(n) ] = [α−1/n − 1]θ .
n+1
La determinación de un estadı́stico que permita emplear el método de la cantidad
pivotal puede llevarse a cabo, en ocasiones, gracias al hecho siguiente: Si (X1 , X2 , . . . , Xn )
es una m.a.s. de una población de distribución F = {Fθ ; θ ∈ Θ ⊂ R} cuyos elementos
son funciones continuas de x entonces el estadı́stico
n
3
T (X1 , X2 , . . . , Xn ; θ) = − logFθ (Xi )
i=1
tiene distribución en el muestreo independiente de θ. De hecho −log Fθ (Xi ) tiene dis-

tribución exponencial de parámetro 1 pues si y > 0
Pθ {−log Fθ (Xi ) ≤ y} = Pθ {logFθ (Xi ) ≥ −y} = Pθ (Fθ (Xi ) ≥ e−y } = Pθ {Xi ≥ Fθ−1 (e−y )} =
n
3
=1− Fθ (Fθ−1 (e−y )) =1−e −y
⇒− log Fθ (Xi ) : γ(n, 1)
i=1
6
Observación 6.2.
V du 1
Si U : γ(n, 1) ⇒ 2 U : χ22n pues V = 2U, U= , = ,
2 dv 2
1 1
f (v) = v n−1 2n−1 e−v/2 v > 0
2 (n − 1)!
Aunque este método es general, pero a veces da lugar a cálculos inviables. En
cambio en otras ocasiones el método es operativo.
Ejemplo 6.3.
Sea (X1 , X2 , . . . , Xn ) una m.a.s. de una población con distribución teórica
⎧
⎨ 0 x<0
Fθ (x) = xθ 0 ≤ x < 1
⎩
1 1≤x
Como 0 < X1 , X2 , . . . , Xn < 1, se obtiene

n
3 n
3 n
3
− log Fθ (Xi ) = − log Xiθ = −θ log Xi .
i=1 i=1 i=1
con lo cual si 0 < c1 < c2 son tales que

2 c2 n−1 −t
t e
dt = 1 − α
c1 (n − 1)!
4 n
5
3
será ∀θ > 0, Pθ c1 < −θ log Xi < c2 = 1 − α
i=1
En consecuencia ⎛ ⎞
⎜ ⎟
⎜ c1 c2 ⎟
⎜ , ⎟
⎜ n
3 n
3 ⎟
⎝ ⎠
− log xi − log xi
i=1 i=1
es un intervalo de confianza para θ de nivel 1 − α.

Los cálculos de γ(n, 1) con n entero, pueden obtenerse de la tabla de la χ2 . Por
ejemplo 2 2
c2 2c2
tn−1 e−t un−1 e−u/2
dt = du
c1 Γ(n) 2c1 2n Γ(n)
7
siendo el integrando la función de densidad de una χ22n .

⎛ ⎞
n ⎜ ⎟
3 ′ ′ ⎜ ′
c1
′
c2 ⎟
−2 θ log Xi : χ22n , P (c1 < χ22n < c2 ) = 1 − α, ⎜
⎜ n , n
⎟
⎟
⎝ 3 3 ⎠
i=1
−2 log Xi −2 logXi
i=1 i=1
Ejemplo 6.4.
En la distribución Uniforme U (0, θ), como 0 < x1 , x2 , . . . xn < θ
n
3 n
3 3 n
xi
Y =− log Fθ (xi ) = − log =− log xi + n log θ
i=1 i=1
θ i=1
tiene distribución γ(n, 1).

4 n
5 n
3 3
Pθ c1 < − log Xi + n log θ < c2 = 1 − α; −2 log Xi + 2 n log θ : χ22n
i=1 i=1
P (2c1 < χ22n < 2c2 ) = 1 − α 2c1 = χ22n,1−α/2 ; 2c2 = χ22n,α/2

n
3 n
3 n n
c1 1 3 c2 1 3
c1 + log xi < n log θ < c2 + log xi + log xi < log θ < + log, xi
i=1 i=1
n n i=1 n n i=1
0 n n
1
< 1/n
< 1/n
ec1 /n xi < θ < ec2 /n xi
i=1 =1
es un intervalo de confianza para θ basado en la media geométrica de las observaciones,
en vez de en su máximo.
Si tenemos dos intervalos se elegirá el más corto, esto es, el de menor longitud
si uno es siempre más corto que otro, en otro caso se puede elegir el de longitud esperada
mı́nima.
En el ejemplo anterior la longitud esperada será
n
< n
<
1/n 1/n n n
E( Xi )= E(Xi ) = E(X 1/n )n = ( ) θ
i=1 i=1
n+1
2 θ
1 1 1 n 1/n
E(X 1/n ) = y 1/n dy = [y 1/n+1 ]θ0 = θ
0 θ θ 1/n + 1 n+1
Cantidades pivotales. Caso de parámetros de posición y escala.

En el caso de parámetros de posición - escala, existen las siguientes cantidades pivotales:
8
Función de densidad Tipo de parámetro Cantidad Pivotal

1.- f (x − µ) posición X −µ
1 x X
2.- f( ) escala
σ σ σ
1 x−µ X −µ X −µ
3.- f( ) posición escala ,
σ σ S σ
Prueba:
dx
1. Sea X ′ = X − µ ⇒ X = X ′ + µ ⇒ =1
dx′
g(x′ ) = f (x′ ) independiente de µ, X ′ = X − µ: distribución independiente de µ.
Ejemplo de parámetro de posición: µ en N (µ, σ) con σ conocida.
X dx
2. Sea X ′ = ⇒ X = σX ′ ⇒ ′ = σ
σ dx
1 X
g(x′ ) = f (x′ )σ = f (x′ ) independiente de σ, X ′ = distribución independiente
σ σ
de σ.
1
Ejemplo de parámetro de escala: λ en Exp( )
λ
X −µ dx
3. Sea Y = ⇒ X = σY +µ ⇒ = σ.
σ dy
1
g(y) = f (y)σ = f (y) distribución independiente de µ y σ .
σ
X −µ
Y = distribución independiente de µ y σ.
σ
n
3
(Yi − Y )2 n = >2
i=1 1 3 Xi − µ (X − µ)
SY2 = = − =
n−1 n − 1 i=1 σ σ
n
1 3 (Xi − X)2 1 2
= 2
= 2 SX
n − 1 i=1 σ σ
Y X −µ
= distribución independiente de µ y σ
SY SX
Ejemplo de parámetro de posición - escala: (µ, σ) en N (µ, σ).
9
6.4. Método de Neyman para la construcción de In-

tervalos de Confianza
El método anterior supone la existencia de una función llamada cantidad pivo-

tal cuya distribución no depende de θ y además a x fijo es una función estrictamente
monótona y contı́nua de θ. El método de Neyman va a prescindir de esta condición,
teniendo ası́ un mayor alcance.
De una población con distribución teórica perteneciente a una familia F =
{Fθ /θ ∈ Θ}, siendo Θ un intervalo de R, se considera una m.a.s. (X1 , X2 , . . . , Xn ) con
distribución Pθ . Sea T una estadı́stico unidimensional, cuyo recorrido se representará
con L ⊂ R.
Fijado un nivel de confianza 1 − α, para cada θ ∈ Θ, se pueden determinar dos valores
c1 (θ), c2 (θ) en L tales que
Pθ {T < c1 (θ)} ≤ α1 y Pθ {T > c2 (θ)} ≤ α2 con α1 , α2 > 0 y α1 + α2 = α
con lo cual
Pθ {c1 (θ) ≤ T (X1 , X2 , . . . , Xn ) ≤ c2 (θ)} ≥ 1 − α2 − α1 = 1 − α
es decir que las desigualdades c1 (θ) ≤ T ≤ c2 (θ) determinan en el plano (θ, T ) una región
R cuyas secciones verticales, correspondientes a cada valor fijo de θ, tienen probabilidad
Pθ superior a 1 − α.
10
Para cada valor t ∈ T , la sección horizontal de la región R, por la recta T = t, estará

limitada por dos abcisas θ1 (t), y θ2 (t), θ1 (t) < θ2 (t). En tal caso
{(x1 , x2 , . . . , xn )/c1 (θ) ≤ T (x1 , x2 , . . . , xn ) ≤ c2 (θ)} =
= {(x1 , x2 , . . . , xn )/(θ, T (x1 , x2 , . . . , xn )) ∈ R} =

{(x1 , x2 , . . . , xn )/θ1 (T (x1 , x2 , . . . , xn )) ≤ θ ≤ θ2 (T (x1 , x2 , . . . , xn ))}
de manera que para cada θ ∈ Θ, se tiene
Pθ {θ1 (T (X1 , X2 , . . . , Xn )) ≤ θ ≤ θ2 (T (X1 , X2 , . . . , Xn ))} ≥ 1 − α
y por tanto
[θ1 (T (x1 , x2 , . . . , xn )), θ2 (T (x1 , x2 , . . . , xn ))]
es un intervalo de confianza de nivel 1 − α para θ.
Observación 6.3.
1. Frecuentemente c1 (θ) y c2 (θ) son continuas y monótonas en cuyo caso es θ1 (t) =

c−1 −1 −1 −1
2 (t) y θ2 (t) = c1 (t) ∀t ∈ L si son crecientes y θ1 (t) = c1 (t) y θ2 (t) = c2 (t) ∀t ∈
L si son decrecientes.
El método es aplicable aunque c1 y c2 no sean monótonas pero puede dar lugar a
varios intervalos.
11
2. Si la distribución de T es continua se eligen c1 (θ) y c2 (θ) tales que
Pθ (T < c1 (θ)) = α1 y Pθ (T > c2 (θ)) = α2
Ejemplo 6.5.
Sea (X1 , . . . , Xn ) una m.a.s. de una U (0, θ). Consideremos el estadı́stico T (X1 , . . . , Xn ) =
X(n) = M axi=1,2,...,n {Xi } cuya distribución en el muestreo es
⎧
⎨ 0 si t < 0
t n
Hθ (t) = Pθ (X(n) ≤ t) = ( ) 0≤t<θ
⎩ θ
1 t≥θ
las condiciones Hθ (c1 (θ)) = α1 H2 (c2 (θ)) = 1 − α2 proporcionan los valores
1/n
c1 (θ) = α1 θ y c2 (θ) = (1 − α2 )1/n θ
1/n
α1 θ = t, (1 − α2 )1/n θ = t
−1/n
θ1 (t) = (1 − α2 )−1/n t, θ2 (t) = α1 t
Por tanto
−1/n
Pθ {(1 − α2 )−1/n X(n) < θ < α1 X(n) } = 1 − α
−1/n
resulta el mismo intervalo de confianza ((1 − α2 )−1/n x(n) , α1 x(n) ) que el obtenido por
el método de la cantidad pivotal.
12
Ejemplo 6.6.
Sea (X1 , X2 , . . . , Xn ) una m.a.s. de una población con función de densidad
2x
fθ (x) = 0<x<θ
θ2
Determinar por el método de Neyman un intervalo de confianza para θ con nivel 1 − α.
La función de distribución de la población es
⎧
⎪ 0 x<0
⎨ 2
x
Fθ (x) = 0≤x<θ
⎪
⎩ θ2
1 θ≤x
Como θ es el extremo superior parece razonable considerar el estadı́stico X(n) de función
de distribución ⎧
⎪ 0 y<0
⎨ 2n
n y
Gθ (y) = (Fθ (y)) = 0≤y<θ
⎪
⎩ θ2n
1 y≥θ
Pθ (X(n) < c1 (θ)) = α1 Pθ (X(n) > c2 (θ)) = α2 , α1 + α2 = α

Gθ (c1 (θ)) = α1 1 − Gθ (c2 (θ)) = α2
(c1 (θ))2n (c2 (θ))2n
= α1 1− = α2
θ2n θ2n
1/2n
c1 (θ) = θα1 c2 (θ) = θ(1 − α2 )1/2n
1/2n −1/2n
x(n) = θα1 , θ2 (T ) = x(n) α1 , θ1 (T ) = x(n) (1 − α2 )−1/2n
13
Resulta el intervalo de confianza:

−1/2n
((1 − α2 )−1/2n x(n) , α1 x(n) )
Este intervalo tiene longitud
−1/2n
L = (α1 − (1 − α2 )−1/2n )x(n) = ((α − α2 )−1/2n − (1 − α2 )−1/2n )x(n)
para obtener el intervalo de longitud mı́nima
= >
∂L 1 −1/2n−1 1 −1/2n−1
= (α − α2 ) − (1 − α2 ) x(n) > 0
∂α2 2n 2n
la longitud mı́nima se alcanza para α2 = 0, α1 = α resultando el intervalo
[x(n) , α−1/2n x(n) ]
6.5. Intervalos de Confianza para parámetros de dis-

tribuciones normales
Notación:
Si Z, Y, t y U son v.a. respectivamente N (0, 1), χ2n , tn y Fn,m se designará por Zα , χ2n,α , tn,α , Fn,m,α
los valores tales que
P {Z > Zα } = α P {t > tn,α } = α
2
P {Y > χn,α } = α P {U > Fn,mα } = α
A.- Intervalo de confianza para la media si la varianza poblacional es conocida

X −µ
Cantidad pivotal: T (X1 , ..., Xn , µ) = √ : N (0, 1)
σ/ n
X −µ
Pµ {−Zα/2 < < Zα/2 } = 1 − α
√σ
n
σ σ
{(x − Zα/2 √ , x + Zα/2 √ }
n n
es un intervalo de confianza para µ con σ conocida en una población Normal a
nivel 1 − α.
14
B.- Intervalo de Confianza para la media (µ) con varianza poblacional desconocida
(S 2 cuasivarianza).
X −µ
Cantidad pivotal: T (X1 , ..., Xn , µ) = √ : tn−1
S/ n
X −µ
Pµ,σ {−tn−1;α/2 < √ < tn−1;α/2 } = 1 − α
S/ n
S S
{(x − tn−1,α/2 √ , x + tn−1,α/2 √ )}
n n
es un intervalo de confianza para µ con σ desconocida a nivel 1 − α.
C.- Intervalo de confianza para σ 2 si la media poblacional es conocida.

n
1 3
Cantidad pivotal: T (X1 , ..., Xn , σ 2 ) = (Xi − µ)2 : χ2n
σ 2 i=1
n
3 (Xi − µ)2
Pσ {χ2n,1−α/2 < < χ2n,α/2 } = 1 − α
i=1
σ2
⎧ n n
⎫
⎪ 3 3
⎪
⎪ 2 2⎪
⎪
⎪ (x i − µ) (x i − µ) ⎪
⎪
⎨ ⎬
i=1 i=1
,
⎪
⎪ χ2n,α/2 χ2n,1−α/2 ⎪ ⎪
⎪
⎪ ⎪
⎪
⎩ ⎭
es un intervalo de confianza para la varianza al nivel 1 − α.

Este intervalo elimina colas iguales a α/2 en los extremos de la distribución.
D.- Intervalo de Confianza para la varianza con media desconocida.

(n − 1)S 2
Cantidad pivotal: T (X1 , ..., Xn , σ 2 ) = : χ2n−1 (S 2 cuasivarianza )
σ2
(n − 1)S 2
Pµ,σ {χ2n−1;1−α/2 < < χ2n−1,α/2 } = 1 − α
σ2
⎧ n n
⎫
⎪ 3 3 ⎪
⎪
⎪ (xi − x)2 (xi − x)2 ⎪
⎪
⎪
⎨ ⎪
⎬
i=1 i=1
, 2
⎪
⎪ χ2n−1,α/2 χn−1,1−α/2 ⎪ ⎪
⎪
⎪ ⎪
⎪
⎩ ⎭
es un intervalo de confianza para σ 2 de nivel (1 − α)
15
E.- Región de confianza para la media y la varianza poblacionales.

El teorema de Fisher proporciona la distribución conjunta de
X −µ S2
y (n − 1) con S 2 cuasivarianza .
√σ σ 2
n
En efecto como ambos estadı́sticos son independientes

4 5
X −µ
Pµ,σ −Zα/2 < σ < Zα/2 = 1 − α
√
n
! "
(n − 1)S 2
Pµ,σ χ2n−1,1−β/2 < < χ2n−1,β/2 =1−β
σ2
la región
4 5
X −µ (n − 1)S 2
−Zα/2 < < Zα/2 ; χ2n−1,1−β/2 < < χ2n−1,β/2
√σ σ 2
n
tiene probabilidad (1 − α)(1 − β). Las dos desigualdades definen en el plano (µ, σ 2 )
una región Σ limitada por la parábola
σ2 (n − 1)S 2 (n − 1)S 2
(X − µ)2 = Zα/2 y por las rectas σ 2 = 2 , σ2 = 2
n χn−1,β/2 χn−1,1−β/2
Σ es una región de confianza para (µ, σ 2 ) a nivel (1 − α)(1 − β) eligiendo α y β de

forma que el nivel sea 1 − γ prefijado.
16
Otra posibilidad para encontrar región de confianza para (µ, σ 2 ) es: Teniendo en
cuenta P (A ∩ B) = P (A) − P (A ∩ B c ) ≥ P (A) − P (B c ) = P (A) − (1 − P (B)) =
P (A)+P (B)−1, si P (A) = 1−α y P (B) = 1−β, P (A∩B) ≥ 1−α+1−β −1 =
1−α−β
! "
S S (n − 1)S 2 2 (n − 1)S 2
P X − √ tn−1,α/2 < µ < X + √ tn−1,α/2 ; <σ < ≥
n n χn−1,β/2 χn−1,1−β/2
1−α−β =1−γ
Resulta como región de confianza un rectángulo en el plano (µ, σ 2 ).
F.- Intervalo de Confianza para la diferencia de medias con (σ1 , σ2 conocidas, σ1 ̸= σ2 )
X − Y − (µ1 − µ2 )
C
Cantidad pivotal: T (X1 , ..., Xn , Y1 , ..., Ym , µ1 −µ2 ) = : N (0, 1)
σ12 σ22
+
n m
C C
σ12 σ22 σ12 σ22
{(x − y − Zα/2 + , x − y + Zα/2 + )}
n m n m
es un intervalo de confianza a nivel 1 − α para µ1 − µ2 .
G.- Intervalo de Confianza para la diferencia de medias de poblaciones normales (σ1 , σ2

desconocidas pero σ1 = σ2 = σ)
√ √
⃗ Y⃗ , µ1 −µ2 ) = (X − Y − (µ1 − µ 2 )) mn m + n − 2
Cantidad pivotal: T (X, √ D : tn+m−2
n + m nS1 + mS22
2
(S12 , S22 varianzas muestrales)

√ D
n + m nS12 + mS22
{(x − y ∓ tm+n−2,α/2 D )}
mn(m + n − 2)
es un intervalo de confianza al nivel 1 − α para µ1 − µ2 .
√ √
⃗ Y⃗ , µ1 − µ2 ) = (X − Y − (µ1 − µ 2 )) mn m + n − 2
T (X, √ D : tn+m−2
n + m (n − 1)s1 + (m − 1)s22
2
(s21 , s22 cuasivarianzas muestrales )
17
H.- Intervalo de confianza para el cociente de varianzas de dos poblaciones normales.

Puesto que
S12 /σ12
S22 /σ22
tiene distribución Fn−1,m−1 siendo S12 , S22 cuasivarianzas muestrales
S12 /σ12
P {Fn−1,m−1;1−α/2 < 2 2 < Fn−1,m−1;α/2 } = 1 − α
S2 /σ2
y por tanto
S12 σ22
Fn−1,m−1;1−α/2 < < Fn−1,m−1;α/2
S22 σ12
entonces
S12 /S22 S12 /S22
{ , }
Fn−1,m−1,α/2 Fn−1,m−1,1−α/2
σ12
es un intervalo de confianza al nivel 1 − α para el cociente de varianzas 2 .
σ2
I.- Intervalo de confianza para la diferencia de medias de dos poblaciones normales
no independientes.
Si (X1 , Y1 ), (X2 , Y2 ), . . . , (Xn , Yn ) es una m.a.s. de una población normal bidimen-
sional de medias (µ1 , µ2 ) y covarianza σ11 ̸= 0 tenı́amos que
n
√ X − Y − (µ1 − µ2 ) ∗2 13
n−1 , S = (Xi − Yi )2 − (X − Y )2
S∗ n i=1
sigue una distribución tn−1 con lo cual

S∗ S∗
(x − y − tn−1;α/2 √ , x − y + tn−1;α/2 √ )
n−1 n−1
es un intervalo de confianza para µ1 − µ2 de nivel 1 − α donde S ∗ representa la
varianza muestral de Xi − Yi esto supuesto que algún elemento de la matriz de
covarianzas es desconocido.
En otro caso
C C
σ12 + σ22 − 2σ11 σ12 + σ22 − 2σ11
(x − y − Zα/2 , x − y + Zα/2 )
n n
es un intervalo de confianza más preciso de nivel de confianza 1 − α, basado en la
X − Y − (µ1 − µ2 ) √
cantidad pivotal D 2 n : N (0, 1)
σ1 + σ22 − 2σ11
18
6.6. Intervalos de confianza basados en distribucio-

nes asintóticas.
Siempre que dispongamos de una sucesión Tn de estadı́sticos tales que

Tn − θ
→ N (0, 1) σn (θ) función de n y θ
σn (θ)
Para n suficientemente grande ∀θ ∈ Θ
Tn − θ
Pθ {−Zα/2 < < Zα/2 } ≃ 1 − α
σn (θ)
de modo que si puede invertirse la desigualdad, despejando θ se obtendrá un intervalo
de confianza para θ de nivel 1 − α.
Ejemplo 6.7.
Se considera una población de Poisson P (λ) y se observa una m.a.s. (X1 , X2 , . . . Xn ).
3n
T − nλ X −λ
Sea T = Xi tal que √ =D ≃ N (0, 1).
i=1
nλ λ/n
√ (X − λ)
Pλ {−Zα/2 < n √ < Zα/2 } = 1 − α
λ
Entonces
(x − λ)2 2
n < Zα/2 ⇒ nx2 + nλ2 − 2nxλ < Zα/2
2
λ ⇒ nλ2 − (2nx + Zα/2
2
)λ + nx2 < 0
λ
2
2
Zα/2
λ − (2x + )λ + x2 < 0
n
es < 0 entre las raı́ces
E E
2 2 2 2
Zα/2Zα/2 Zα/2 4x Zα/2
Zα/2 Zα/2 4x
x+ − + <λ<x+ + +
2n 2 n2 n 2n 2 n2 n
es aproximadamente un intervalo de confianza para λ de nivel 1 − α.
Como el resultado es aproximado y por tanto sólo válido para n grande, se
pueden despreciar los términos en n1 frente a √1n y considerar el intervalo simplificado
C C
x x
x − Zα/2 < λ < x + Zα/2
n n
Si por ejemplo n = 400, T = 960, 1 − α = 0,95 resulta Zα/2 = 1,96, x = 2,4 y el
intervalo sin simplificar es [2,253, 2,557] y el simplificado [2,248, 2,552].
19
Ejemplo 6.8.
Dadas dos poblaciones independientes N (µ1 , σ1 ), N (µ2 , σ2 ) con los 4 parámetros desco-
nocidos y σ12 ̸= σ22 vimos que
(X − Y ) − (µ1 − µ2 )
C 2 → N (0, 1)
S1 S22
+
n1 n2
y el Intervalo de confianza aproximado para (µ1 − µ2 ) si n1 y n2 son grandes
E E
S12 S22 S12 S22
((x − y) − Zα/2 + , (x − y) + Zα/2 + )
n1 n2 n1 n2
6.7. Intervalos de confianza bayesianos.
Hasta ahora suponemos para la población una función de densidad f (x, θ) su-
poniendo conocida la función f (·, ·). Además se supone que θ tiene un valor fijo aunque
desconocido. En muchas situaciones reales puede haber cierta información sobre θ (hasta
ahora sólo era θ ∈ Θ).
Ası́ el experimentador puede tener la evidencia de que θ actúa como variable aleatoria
para la cual se puede suponer cierta función de densidad. Por ejemplo, en un proceso de
producción se examina la producción de piezas defectuosas que resultan. En un cierto
dı́a se examinan 10 piezas con observaciones x1 , x2 , . . . , x10 donde x1 = 1 si es defectuosa,
xi = 0 si no es defectuosa. Aquı́ f (x; θ) = θx (1 − θ)1−x I0,1 (x) 0 ≤ θ ≤ 1. La distribución
conjunta de los 10 valores es
n
<
!n !n
xi 10− xi
θ i=1 (1 − θ) i=1 I0,1 (xi ) 0 ≤ θ ≤ 1
i=1
Supongamos que de observaciones en varios dı́as se ha observado que el valor de θ cambia

y que el cambio se puede representar como una variable aleatoria de densidad
gθ (θ) = 6θ(1 − θ)I[0,1] (θ)
¿Cómo incorporar esa información adicional al problema estadı́stico?

La situación es: X : f (·; θ), θ v.a. con densidad g(·) = gθ (·) ¿Cómo incorporar
esa información al problema?
20
6.7.1. Distribución a posteriori
En este caso f (·; θ) se debe interpretar como f (x/θ) una densidad condicionada
(densidad si θ = θ), indicable también por fX/θ=θ (x/θ). Si gΘ es conocida, gΘ se llama
distribución a priori, contiene la información que tenemos sobre θ a priori es decir antes
de tomar la muestra x1 , x2 , . . . , xn .
Introducimos ahora la distribución que contiene la información sobre Θ después
de observada la muestra.
Definición 6.2. La distribución condicionada de θ dada la muestra X1 = x1 , X2 =
x2 , . . . , Xn = xn indicada por π(θ/x1 , x2 , . . . , xn ) = πθ/X1 =x1 ,X2 =x2 ,...Xn =xn (θ/x1 , x2 , . . . xn )
se llama distribución a posteriori de θ
Observación 6.4.
Fn
f (x1 , x2 , . . . , xn /θ)g(θ) f (xi /θ)g(θ)
π(θ/x1 , x2 , . . . , xn ) = = Fni=1
G
f (x1 , x2 , . . . , xn ) ( i=1 f (xi /θ))g(θ)dθ
Utilizamos la distribución a priori de θ para construir un intervalo estimador de θ.

Dado 1 − α cualquier intervalo (t1 , t2 ) que cumpla
2 t2
π(θ/x1 , x2 , . . . , xn )dθ = 1 − α
t1
será un intervalo de confianza Bayesiano para θ. Observemos que ti = ti (x1 , x2 , . . . , xn )

función de las observaciones.
Hay una diferencia conceptual importante con los intervalos No Bayesianos:
Para no bayesianos antes de observar la muestra
Pθ ((t1 (X1 , X2 , . . . , Xn ), t2 (X1 , X2 , . . . , Xn )) ∋ θ) = 1 − α
significa probabilidad de que el intervalo aleatorio cubra a θ, observada la muestra ya no

tiene sentido hablar de probabilidad sino de confianza de que (t1 (x1 , x2 , . . . , xn ), t2 (x1 , x2 , . . . , xn ))
cubra a θ.
Para bayesianos
P (θ ∈ (t1 (x1 , x2 , . . . , xn ), t2 (x1 , x2 , . . . , xn ))/X1 = x1 , X2 = x2 , . . . , Xn = xn ) = 1 − α
significa probabilidad a posteriori de que θ pertenezca al intervalo fijo
(t1 (x1 , x2 , . . . , xn ), t2 (x1 , x2 , . . . , xn )).
21
Ejemplo 6.9.
Sea X1 , X2 , . . . , Xn una m.a.s. de N (θ, 1), θ : N (0, 1)
n
1 1 3
√ n+1 exp{− ( (xi − θ)2 + θ2 )}
2π 2 i=1
π(θ/x1 , x2 , . . . , xn ) = 2 n
1 1 3
√ exp{− ( (xi − θ)2 + θ2 )}dθ
( 2π)n+1 2 i=1
n
3 n
3 n
3
2 2
(xi − θ) + θ = x2i − 2θ xi + (n + 1)θ2
i=1 i=1 i=1
⎛ n ⎞
3
⎜ xi ⎟ n
⎜ 2 ⎟ 3
= (n + 1) ⎜
⎜θ − 2 θ i=1 ⎟+
⎟ x2i
⎝ n + 1 ⎠ i=1
⎛ n ⎞2 n
3 3
⎜ xi ⎟ ( xi ) 2 n
⎜ ⎟ 3
⎜
= (n + 1) ⎜θ − i=1 ⎟ i=1
x2i
n + 1 ⎟ − (n + 1) +
⎝ ⎠ i=1
⎧ ⎛ ⎞2 ⎫ n
⎧ ⎛ n ⎞⎫
⎪ ⎪ 3 ⎪ 3 ⎪
⎪
⎪ xi ⎟ ⎪ ⎪ ⎪
⎪ ( x ) 2 ⎪
⎪
⎪
⎨ ⎜ ⎪
⎬ ⎪
⎨ ⎜ n i ⎟⎪
⎬
⎜ ⎟ ⎜ 3 ⎟
exp − 2 (n + 1) ⎜
1
⎜ θ − i=1 ⎟ exp − 1 ⎜ x 2
− i=1 ⎟
⎪
⎪ ⎝ n+1⎟ ⎠⎪ ⎪ ⎪
⎪
2 ⎜
⎝ i=1
i
n+1 ⎟ ⎠⎪
⎪
⎪
⎪ ⎪
⎪ ⎪
⎪ ⎪
⎪
⎩ ⎭ ⎩ ⎭
π(θ/x1 , x2 , . . . , xn ) = ⎧ ⎛ n ⎞⎫
⎪ 3 ⎪ Hn
⎪
⎪ 2 ⎪
⎪ ⎜ ( x i ) ⎟⎪⎪ 2 i=1 xi 2
⎨ ⎜3 n
⎟⎬ − 12 (n+1)(θ− )
1⎜ 2 i=1 ⎟ n + 1 dθ
exp − 2 ⎜ xi − ⎟ e
⎪
⎪ ⎝ i=1 n + 1 ⎠⎪ ⎪
⎪
⎪ ⎪
⎪
⎩ ⎭
= Hn >
xi
i=1 1
θ/x1 , x2 , . . . , xn : N ,σ = √
n+1 n+1
Intervalo de Confianza
= = Hn > >
X i √
P −Zα/2 < θ − i=1 n + 1 < Zα/2 = 1 − α ⇒
n+1
22
=I Hn I >
I I
i=1 Xi I 1
I
P Iθ − < Zα/2 √ =1−α
n+1 I n+1
y por tanto el intervalo es:
= Hn Hn >
i=1 xi 1 i=1 xi 1
− Zα/2 √ , + Zα/2 √
n+1 n+1 n+1 n+1
El intervalo No Bayesiano era:
= Hn Hn >
i=1 xi 1 i=1 xi 1
− Zα/2 √ , + Zα/2 √
n n n n
El Intervalo Bayesiano es de menor longitud.

Si fuese θ : N (θ0 , 1) resulta
= H H >
θ0 + ni=1 xi 1 θ0 + ni=1 xi 1
− λα √ , + λα √
n+1 n+1 n+1 n+1
θ0 actúa como si fuese una observación más.
23

Tema 6. Intervalos de Confianza

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Tema 6. Intervalos de Confianza

Diunggah oleh

Hak Cipta:

Format Tersedia

Índice general

6.1. Planteamiento del problema

El estudio de las distribuciones en el muestreo ha puesto de relieve un gran

a mayor nivel de confianza mayor longitud del intervalo.

de donde saldrı́a otro intervalo de confianza a nivel 0.95

6.2. Concepto general de Intervalo de Confianza

1. Para la definición no es necesario que el muestreo sea aleatorio simple, aunque

2. En el ejemplo se conseguı́a la igualdad

Pθ (T1 < θ < T2 ) = 1 − α,

3. Si θ es unidimensional muchas veces g(θ) = θ y habrá de ser (Ti (X1 , X2 , . . . , Xn ) ∈

4. En el caso de más dimensiones también se puede generalizar el concepto de inter-

Definición 6.1. Si S(x1 , x2 , . . . , xn ) es un subconjunto de Θ ⊂ Rk , dependiente

el conjunto S(x1 , x2 , . . . , xn ) recibe el nombre de región de confianza de nivel 1−α.

6.3. Método de la cantidad pivotal para la construc-

En tal caso, fijado un nivel de confianza 1 − α se pueden determinar constantes c1 y c2

Basta por ejemplo que c1 y c2 sean los cuantiles de orden α1 y 1 − α2 con α1 + α2 = α

obtendremos sendos valores Ti (X1 , X2 , . . . , Xn ) i = 1, 2 tales que ∀θ ∈ Θ

Pθ {T1 (X1 , X2 , . . . , Xn ) ≤ g(θ) ≤ T2 (X1 , X2 , . . . , Xn )} ≥ 1 − α

de manera que [T1 (x1 , x2 , . . . , xn ), T2 (x1 , x2 , . . . , xn )] será un intervalo de confianza para

Dada una m.a.s. de tamaño n consideramos la cantidad pivotal

Fijado entonces el nivel de confianza 1 − α, sean α1 , α2 /α1 + α2 = α

constituye un intervalo de confianza para θ de nivel 1 − α ∀α1 , α2 /α1 + α2 = α. Como

es una función creciente de α2 , la longitud es mı́nima para α2 = 0 +→ α1 = α y el

tiene distribución en el muestreo independiente de θ. De hecho −log Fθ (Xi ) tiene dis-

Como 0 < X1 , X2 , . . . , Xn < 1, se obtiene

con lo cual si 0 < c1 < c2 son tales que

es un intervalo de confianza para θ de nivel 1 − α.

siendo el integrando la función de densidad de una χ22n .

tiene distribución γ(n, 1).

P (2c1 < χ22n < 2c2 ) = 1 − α 2c1 = χ22n,1−α/2 ; 2c2 = χ22n,α/2

Cantidades pivotales. Caso de parámetros de posición y escala.

Función de densidad Tipo de parámetro Cantidad Pivotal

6.4. Método de Neyman para la construcción de In-

El método anterior supone la existencia de una función llamada cantidad pivo-

Pθ {T < c1 (θ)} ≤ α1 y Pθ {T > c2 (θ)} ≤ α2 con α1 , α2 > 0 y α1 + α2 = α

Pθ {c1 (θ) ≤ T (X1 , X2 , . . . , Xn ) ≤ c2 (θ)} ≥ 1 − α2 − α1 = 1 − α

Para cada valor t ∈ T , la sección horizontal de la región R, por la recta T = t, estará

{(x1 , x2 , . . . , xn )/c1 (θ) ≤ T (x1 , x2 , . . . , xn ) ≤ c2 (θ)} =

= {(x1 , x2 , . . . , xn )/(θ, T (x1 , x2 , . . . , xn )) ∈ R} =

Pθ {θ1 (T (X1 , X2 , . . . , Xn )) ≤ θ ≤ θ2 (T (X1 , X2 , . . . , Xn ))} ≥ 1 − α

1. Frecuentemente c1 (θ) y c2 (θ) son continuas y monótonas en cuyo caso es θ1 (t) =

2. Si la distribución de T es continua se eligen c1 (θ) y c2 (θ) tales que

Pθ (T < c1 (θ)) = α1 y Pθ (T > c2 (θ)) = α2

las condiciones Hθ (c1 (θ)) = α1 H2 (c2 (θ)) = 1 − α2 proporcionan los valores

Pθ (X(n) < c1 (θ)) = α1 Pθ (X(n) > c2 (θ)) = α2 , α1 + α2 = α

Resulta el intervalo de confianza:

6.5. Intervalos de Confianza para parámetros de dis-

A.- Intervalo de confianza para la media si la varianza poblacional es conocida

C.- Intervalo de confianza para σ 2 si la media poblacional es conocida.

es un intervalo de confianza para la varianza al nivel 1 − α.

D.- Intervalo de Confianza para la varianza con media desconocida.

es un intervalo de confianza para σ 2 de nivel (1 − α)

E.- Región de confianza para la media y la varianza poblacionales.

En efecto como ambos estadı́sticos son independientes

Σ es una región de confianza para (µ, σ 2 ) a nivel (1 − α)(1 − β) eligiendo α y β de

F.- Intervalo de Confianza para la diferencia de medias con (σ1 , σ2 conocidas, σ1 ̸= σ2 )

G.- Intervalo de Confianza para la diferencia de medias de poblaciones normales (σ1 , σ2

(S12 , S22 varianzas muestrales)

(s21 , s22 cuasivarianzas muestrales )

H.- Intervalo de confianza para el cociente de varianzas de dos poblaciones normales.

sigue una distribución tn−1 con lo cual

6.6. Intervalos de confianza basados en distribucio-

Siempre que dispongamos de una sucesión Tn de estadı́sticos tales que