Anda di halaman 1dari 24

Índice general

6. Intervalos de Confianza 1
6.1. Planteamiento del problema . . . . . . . . . . . . . . . . . . . . . . . . . 1
6.2. Concepto general de Intervalo de Confianza . . . . . . . . . . . . . . . . 3
6.3. Método de la cantidad pivotal para la construcción de intervalos de con-
fianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
6.4. Método de Neyman para la construcción de Intervalos de Confianza . . . 10
6.5. Intervalos de Confianza para parámetros de distribuciones normales . . . 14
6.6. Intervalos de confianza basados en distribuciones asintóticas. . . . . . . . 19
6.7. Intervalos de confianza bayesianos. . . . . . . . . . . . . . . . . . . . . . 20
6.7.1. Distribución a posteriori . . . . . . . . . . . . . . . . . . . . . . . 21

1
Capı́tulo 6

Intervalos de Confianza

6.1. Planteamiento del problema

El estudio de las distribuciones en el muestreo ha puesto de relieve un gran


número de casos en que un determinado estadı́stico T se distribuye con escasa varia-
bilidad alrededor de algún parámetro poblacional θ. Cabe esperar que el valor de T ,
observado en una muestra concreta, sea relativamente próximo a θ ó equivalentemente
que θ esté relativamente próximo del valor observado de T .
La distribución en el muestreo de T va a permitir diseñar un método para dar
unos márgenes de variación en que es previsible que se encuentre θ. Tal método se conoce
como estimación confidencial ó estimación por intervalos de confianza.

Ejemplo 6.1.
Sea (X1 , X2 , . . . , Xn ) una m.a.s. de una población N (θ, σ) con σ conocida y θ descono-
cida. Sabemos que el estadı́stico
X −θ
T = σ

n
sigue una distribución N (0, 1). Por consiguiente, consultando las tablas de la N (0, 1),
podemos afirmar que
Pθ (−1,96 < T < 1,96) = 0,95.
La desigualdad −1,96 < T < +1,96 equivale a
σ σ
X − 1,96 √ < θ < X + 1,96 √
n n

1
Capı́tulo 6. Intervalos de Confianza 2

de manera que es
! "
σ σ
Pθ X − 1,96 √ < θ < X + 1,96 √ = 0,95
n n
cualquiera que sea θ.
La interpretación es clara: Hay una probabilidad de 0.95 de obtener una muestra
tal que el intervalo de extremos aleatorios
σ σ
X − 1,96 √ , X + 1,96 √
n n
incluya al valor de θ con el que se han producido las observaciones muestrales; y ello
independientemente de cual sea ese valor θ.
Una vez utilizada la distribución en el muestreo de X para establecer la con-
clusión anterior, se puede hacer efectivo el muestreo; obtener unos resultados concretos:
σ σ
x1 , x2 , . . . , xn y con ellos x y determinar el intervalo numérico (x−1,96 √ , x+1,96 √ ).
n n
Desde luego, ahora no tiene sentido afirmar que hay probabilidad 0.95 de que
el intervalo numérico contenga a θ con el que se han producido las observaciones, no
obstante 0.95 expresa el margen de confianza (nivel de confianza) que tenemos en que el
valor θ esté entre los márgenes del intervalo; en el sentido de que repitiendo el muestreo
un gran número de veces, se obtendrı́an resultados distintos, entre los cuales, muy apro-
ximadamente, el 95 % contendrı́an al valor concreto de θ.
El intervalo numérico
σ σ
(x − 1,96 √ , x + 1,96 √ )
n n
se denomina intervalo de confianza para θ con nivel de confianza 0,95 (ó del 95 %).
Por supuesto el procedimiento puede repetirse con cualquier nivel de confianza.
Por ejemplo,
σ σ
con 0,9 → (x − 1,645 √ , x + 1,645 √ )
n n
σ σ
con 0,99 → (x − 2,576 √ , x + 2,576 √ )
n n

a mayor nivel de confianza mayor longitud del intervalo.


Observemos que también si T : N (0, 1)
Pθ (−1,74 < T < 2,37) = 0,95

2
Capı́tulo 6. Intervalos de Confianza 3

de donde saldrı́a otro intervalo de confianza a nivel 0.95


σ σ
(x − 2,37 √ , x + 1,74 √ )
n n
σ σ σ
pero la longitud 4,11 √ es mayor que 2 · 1,96 √ = 3,92 √ .
n n n
σ
Si P (a < T < b) = 0,95 la longitud (b − a) √ es mı́nima para a = −b
n
En efecto hay que minimizar (b − a) sujeto a F (b) − F (a) = 0,95.
L = (b − a) − λ(F (b) − F (a) − 0,95)
∂L
= 1 − λf (b) = 0
∂b
∂L
= −1 + λf (a) = 0
∂a

=⇒ f (b) = f (a) =⇒ a = −b
por ser f simétrica respecto al origen.

6.2. Concepto general de Intervalo de Confianza

De una población descrita por una variable aleatoria X cuya distribución teórica
pertenece a una familia paramétrica
# $
F = Fθ /θ ∈ Θ ⊂ Rk
se considera una muestra aleatoria (X1 , X2 , . . . , Xn ) con distribución Pθ . Sea g(θ) una
función del parámetro con valores reales y T1 ≤ T2 dos estadı́sticos unidimensionales
tales que
Pθ {T1 (X1 , X2 , . . . , Xn ) ≤ g(θ) ≤ T2 (X1 , X2 , . . . , Xn )} ≥ 1 − α ∀θ ∈ Θ
Entonces para cualquier muestra concreta (x1 , x2 , . . . , xn ), el intervalo
[T1 (x1 , x2 , . . . , xn ), T2 (x1 , x2 , . . . , xn )] se denomina intervalo de confianza para g(θ), de
nivel de confianza 1 − α.
Observación 6.1.

1. Para la definición no es necesario que el muestreo sea aleatorio simple, aunque


será más difı́cil determinar Pθ . Tampoco es necesario que X sea unidimensional.

3
Capı́tulo 6. Intervalos de Confianza 4

2. En el ejemplo se conseguı́a la igualdad

Pθ (T1 < θ < T2 ) = 1 − α,

mientras que la definición es más imprecisa, puesto que sólo exige que dicha pro-
babilidad sea ≥ 1 − α. La razón es la continuidad de la distribución N (0, 1), que
además hace inútil incluir los extremos del intervalo [T1 , T2 ]. Pero en general la
distribución podrı́a ser discreta y no ser posible alcanzar exactamente el valor 1−α
y aconseja incluir los extremos T1 y T2 para aumentar la probabildiad de que [T1 , T2 ]
contenga g(θ) sin incrementar la longitud del intervalo; se trata de garantizar que
el intervalo [T1 , T2 ] incluya al valor g(θ) con probabilidad al menos 1 − α (por ello
la desigualdad). Y dentro de los que cumplan ≥ 1 − α, tomar el más corto posible
y de nivel de confianza menor ya que un intervalo de nivel 0,99 también lo serı́a
de 0,95.

3. Si θ es unidimensional muchas veces g(θ) = θ y habrá de ser (Ti (X1 , X2 , . . . , Xn ) ∈


Θ c.s.i = 1, 2).

4. En el caso de más dimensiones también se puede generalizar el concepto de inter-


valo de confianza a región de confianza:

Definición 6.1. Si S(x1 , x2 , . . . , xn ) es un subconjunto de Θ ⊂ Rk , dependiente


de la muestra (x1 , x2 , . . . , xn ) tal que

Pθ (S(X1 , X2 , . . . , Xn ) ∋ θ) ≥ 1 − α ∀θ ∈ Θ

el conjunto S(x1 , x2 , . . . , xn ) recibe el nombre de región de confianza de nivel 1−α.

6.3. Método de la cantidad pivotal para la construc-


ción de intervalos de confianza
X −θ
El intervalo construido en el ejemplo se basa en que σ tiene distribución

n
en el muestreo independiente de θ. La misma técnica puede utilizarse en numerosas
ocasiones y recibe el nombre de método de la cantidad pivotal.
Descripción:
Sea T (X1 , X2 , . . . , Xn ; θ) una función de la muestra y del parámetro cuya distribución
en el muestreo no depende de θ, (es decir ∀A ∈ B , Pθ (T ∈ A) es independiente de θ).

4
Capı́tulo 6. Intervalos de Confianza 5

En tal caso, fijado un nivel de confianza 1 − α se pueden determinar constantes c1 y c2


(que no serán únicas) tales que

Pθ {c1 ≤ T (X1 , X2 , . . . , Xn ; θ) ≤ c2 } ≥ 1 − α ∀θ

Basta por ejemplo que c1 y c2 sean los cuantiles de orden α1 y 1 − α2 con α1 + α2 = α


de la distribución en el muestreo de T (X1 , X2 , . . . , Xn ; θ).
Si es posible despejar g(θ) en las desigualdades

c1 ≤ T (X1 , X2 , . . . , Xn ; θ) y T (X1 , X2 , . . . , Xn ; θ) ≤ c2

obtendremos sendos valores Ti (X1 , X2 , . . . , Xn ) i = 1, 2 tales que ∀θ ∈ Θ

Pθ {T1 (X1 , X2 , . . . , Xn ) ≤ g(θ) ≤ T2 (X1 , X2 , . . . , Xn )} ≥ 1 − α

de manera que [T1 (x1 , x2 , . . . , xn ), T2 (x1 , x2 , . . . , xn )] será un intervalo de confianza para


g(θ) de nivel 1 − α.

Ejemplo 6.2.
Consideremos una población con distribución U (0, θ)

⎨ 0 x<0
x
Fθ (x) = 0≤x<θ
⎩ θ
1 x≥θ

Dada una m.a.s. de tamaño n consideramos la cantidad pivotal


1 X(n)
T (X1 , X2 , . . . , Xn ; θ) = máx Xi =
θ 1≤i≤n θ
de distribución en el muestreo

⎨ 0 y<0
n
Pθ (T ≤ y) = Pθ (X(n) ≤ θy) = y 0≤y<1 independiente de θ

1 1≤y

Fijado entonces el nivel de confianza 1 − α, sean α1 , α2 /α1 + α2 = α


( )
1/n
Pθ α1 ≤ T (X1 , X2 , . . . , Xn ; θ) ≤ (1 − α2 )1/n = (1 − α2 ) − α1 = 1 − α

De las ecuaciones
X(n) 1/n X(n)
= α1 y = (1 − α2 )1/n
θ θ

5
Capı́tulo 6. Intervalos de Confianza 6

resulta
−1/n
θ = X(n) α1 y θ = X(n) (1 − α2 )−1/n
la segunda de las cuales es menor que la primera. Luego
* +
−1/n −1/n
(1 − α2 ) x(n) , α1 x(n)

constituye un intervalo de confianza para θ de nivel 1 − α ∀α1 , α2 /α1 + α2 = α. Como


su longitud es
−1/n
[α1 − (1 − α2 )−1/n ]x(n) = [(α − α2 )−1/n − (1 − α2 )−1/n ]x(n)
, -. /
ϕ(α2 )

es una función creciente de α2 , la longitud es mı́nima para α2 = 0 +→ α1 = α y el


intervalo es (x(n) , α−1/n x(n) ).
Nota:
0 1
′ 1 1 1 1 1
ϕ (α2 ) = (α−α2 )−1/n−1 − (1−α2 )−1/n−1 = n+1 − n+1 > 0 α2 < α
n n n (α − α2 ) n (1 − α2 ) n

La longitud esperada:
2 1
n n
E[T ] = yny n−1 dy = E[X(n) ] = θ
0 n+1 n+1
n
luego la longitud esperada = [α−1/n − 1]E[X(n) ] = [α−1/n − 1]θ .
n+1
La determinación de un estadı́stico que permita emplear el método de la cantidad
pivotal puede llevarse a cabo, en ocasiones, gracias al hecho siguiente: Si (X1 , X2 , . . . , Xn )
es una m.a.s. de una población de distribución F = {Fθ ; θ ∈ Θ ⊂ R} cuyos elementos
son funciones continuas de x entonces el estadı́stico
n
3
T (X1 , X2 , . . . , Xn ; θ) = − logFθ (Xi )
i=1

tiene distribución en el muestreo independiente de θ. De hecho −log Fθ (Xi ) tiene dis-


tribución exponencial de parámetro 1 pues si y > 0

Pθ {−log Fθ (Xi ) ≤ y} = Pθ {logFθ (Xi ) ≥ −y} = Pθ (Fθ (Xi ) ≥ e−y } = Pθ {Xi ≥ Fθ−1 (e−y )} =
n
3
=1− Fθ (Fθ−1 (e−y )) =1−e −y
⇒− log Fθ (Xi ) : γ(n, 1)
i=1

6
Capı́tulo 6. Intervalos de Confianza 7

Observación 6.2.
V du 1
Si U : γ(n, 1) ⇒ 2 U : χ22n pues V = 2U, U= , = ,
2 dv 2
1 1
f (v) = v n−1 2n−1 e−v/2 v > 0
2 (n − 1)!
Aunque este método es general, pero a veces da lugar a cálculos inviables. En
cambio en otras ocasiones el método es operativo.

Ejemplo 6.3.
Sea (X1 , X2 , . . . , Xn ) una m.a.s. de una población con distribución teórica

⎨ 0 x<0
Fθ (x) = xθ 0 ≤ x < 1

1 1≤x

Como 0 < X1 , X2 , . . . , Xn < 1, se obtiene


n
3 n
3 n
3
− log Fθ (Xi ) = − log Xiθ = −θ log Xi .
i=1 i=1 i=1

con lo cual si 0 < c1 < c2 son tales que


2 c2 n−1 −t
t e
dt = 1 − α
c1 (n − 1)!
4 n
5
3
será ∀θ > 0, Pθ c1 < −θ log Xi < c2 = 1 − α
i=1

En consecuencia ⎛ ⎞
⎜ ⎟
⎜ c1 c2 ⎟
⎜ , ⎟
⎜ n
3 n
3 ⎟
⎝ ⎠
− log xi − log xi
i=1 i=1

es un intervalo de confianza para θ de nivel 1 − α.


Los cálculos de γ(n, 1) con n entero, pueden obtenerse de la tabla de la χ2 . Por
ejemplo 2 2
c2 2c2
tn−1 e−t un−1 e−u/2
dt = du
c1 Γ(n) 2c1 2n Γ(n)

7
Capı́tulo 6. Intervalos de Confianza 8

siendo el integrando la función de densidad de una χ22n .


⎛ ⎞
n ⎜ ⎟
3 ′ ′ ⎜ ′
c1

c2 ⎟
−2 θ log Xi : χ22n , P (c1 < χ22n < c2 ) = 1 − α, ⎜
⎜ n , n


⎝ 3 3 ⎠
i=1
−2 log Xi −2 logXi
i=1 i=1

Ejemplo 6.4.
En la distribución Uniforme U (0, θ), como 0 < x1 , x2 , . . . xn < θ
n
3 n
3 3 n
xi
Y =− log Fθ (xi ) = − log =− log xi + n log θ
i=1 i=1
θ i=1

tiene distribución γ(n, 1).


4 n
5 n
3 3
Pθ c1 < − log Xi + n log θ < c2 = 1 − α; −2 log Xi + 2 n log θ : χ22n
i=1 i=1

P (2c1 < χ22n < 2c2 ) = 1 − α 2c1 = χ22n,1−α/2 ; 2c2 = χ22n,α/2


n
3 n
3 n n
c1 1 3 c2 1 3
c1 + log xi < n log θ < c2 + log xi + log xi < log θ < + log, xi
i=1 i=1
n n i=1 n n i=1
0 n n
1
< 1/n
< 1/n
ec1 /n xi < θ < ec2 /n xi
i=1 =1
es un intervalo de confianza para θ basado en la media geométrica de las observaciones,
en vez de en su máximo.
Si tenemos dos intervalos se elegirá el más corto, esto es, el de menor longitud
si uno es siempre más corto que otro, en otro caso se puede elegir el de longitud esperada
mı́nima.
En el ejemplo anterior la longitud esperada será
n
< n
<
1/n 1/n n n
E( Xi )= E(Xi ) = E(X 1/n )n = ( ) θ
i=1 i=1
n+1
2 θ
1 1 1 n 1/n
E(X 1/n ) = y 1/n dy = [y 1/n+1 ]θ0 = θ
0 θ θ 1/n + 1 n+1

Cantidades pivotales. Caso de parámetros de posición y escala.


En el caso de parámetros de posición - escala, existen las siguientes cantidades pivotales:

8
Capı́tulo 6. Intervalos de Confianza 9

Función de densidad Tipo de parámetro Cantidad Pivotal


1.- f (x − µ) posición X −µ

1 x X
2.- f( ) escala
σ σ σ

1 x−µ X −µ X −µ
3.- f( ) posición escala ,
σ σ S σ

Prueba:

dx
1. Sea X ′ = X − µ ⇒ X = X ′ + µ ⇒ =1
dx′
g(x′ ) = f (x′ ) independiente de µ, X ′ = X − µ: distribución independiente de µ.
Ejemplo de parámetro de posición: µ en N (µ, σ) con σ conocida.
X dx
2. Sea X ′ = ⇒ X = σX ′ ⇒ ′ = σ
σ dx
1 X
g(x′ ) = f (x′ )σ = f (x′ ) independiente de σ, X ′ = distribución independiente
σ σ
de σ.
1
Ejemplo de parámetro de escala: λ en Exp( )
λ
X −µ dx
3. Sea Y = ⇒ X = σY +µ ⇒ = σ.
σ dy
1
g(y) = f (y)σ = f (y) distribución independiente de µ y σ .
σ
X −µ
Y = distribución independiente de µ y σ.
σ
n
3
(Yi − Y )2 n = >2
i=1 1 3 Xi − µ (X − µ)
SY2 = = − =
n−1 n − 1 i=1 σ σ
n
1 3 (Xi − X)2 1 2
= 2
= 2 SX
n − 1 i=1 σ σ

Y X −µ
= distribución independiente de µ y σ
SY SX
Ejemplo de parámetro de posición - escala: (µ, σ) en N (µ, σ).

9
Capı́tulo 6. Intervalos de Confianza 10

6.4. Método de Neyman para la construcción de In-


tervalos de Confianza

El método anterior supone la existencia de una función llamada cantidad pivo-


tal cuya distribución no depende de θ y además a x fijo es una función estrictamente
monótona y contı́nua de θ. El método de Neyman va a prescindir de esta condición,
teniendo ası́ un mayor alcance.
De una población con distribución teórica perteneciente a una familia F =
{Fθ /θ ∈ Θ}, siendo Θ un intervalo de R, se considera una m.a.s. (X1 , X2 , . . . , Xn ) con
distribución Pθ . Sea T una estadı́stico unidimensional, cuyo recorrido se representará
con L ⊂ R.
Fijado un nivel de confianza 1 − α, para cada θ ∈ Θ, se pueden determinar dos valores
c1 (θ), c2 (θ) en L tales que

Pθ {T < c1 (θ)} ≤ α1 y Pθ {T > c2 (θ)} ≤ α2 con α1 , α2 > 0 y α1 + α2 = α

con lo cual

Pθ {c1 (θ) ≤ T (X1 , X2 , . . . , Xn ) ≤ c2 (θ)} ≥ 1 − α2 − α1 = 1 − α

es decir que las desigualdades c1 (θ) ≤ T ≤ c2 (θ) determinan en el plano (θ, T ) una región
R cuyas secciones verticales, correspondientes a cada valor fijo de θ, tienen probabilidad
Pθ superior a 1 − α.

10
Capı́tulo 6. Intervalos de Confianza 11

Para cada valor t ∈ T , la sección horizontal de la región R, por la recta T = t, estará


limitada por dos abcisas θ1 (t), y θ2 (t), θ1 (t) < θ2 (t). En tal caso

{(x1 , x2 , . . . , xn )/c1 (θ) ≤ T (x1 , x2 , . . . , xn ) ≤ c2 (θ)} =

= {(x1 , x2 , . . . , xn )/(θ, T (x1 , x2 , . . . , xn )) ∈ R} =


{(x1 , x2 , . . . , xn )/θ1 (T (x1 , x2 , . . . , xn )) ≤ θ ≤ θ2 (T (x1 , x2 , . . . , xn ))}
de manera que para cada θ ∈ Θ, se tiene

Pθ {θ1 (T (X1 , X2 , . . . , Xn )) ≤ θ ≤ θ2 (T (X1 , X2 , . . . , Xn ))} ≥ 1 − α

y por tanto
[θ1 (T (x1 , x2 , . . . , xn )), θ2 (T (x1 , x2 , . . . , xn ))]
es un intervalo de confianza de nivel 1 − α para θ.

Observación 6.3.

1. Frecuentemente c1 (θ) y c2 (θ) son continuas y monótonas en cuyo caso es θ1 (t) =


c−1 −1 −1 −1
2 (t) y θ2 (t) = c1 (t) ∀t ∈ L si son crecientes y θ1 (t) = c1 (t) y θ2 (t) = c2 (t) ∀t ∈
L si son decrecientes.
El método es aplicable aunque c1 y c2 no sean monótonas pero puede dar lugar a
varios intervalos.

11
Capı́tulo 6. Intervalos de Confianza 12

2. Si la distribución de T es continua se eligen c1 (θ) y c2 (θ) tales que

Pθ (T < c1 (θ)) = α1 y Pθ (T > c2 (θ)) = α2

Ejemplo 6.5.
Sea (X1 , . . . , Xn ) una m.a.s. de una U (0, θ). Consideremos el estadı́stico T (X1 , . . . , Xn ) =
X(n) = M axi=1,2,...,n {Xi } cuya distribución en el muestreo es

⎨ 0 si t < 0
t n
Hθ (t) = Pθ (X(n) ≤ t) = ( ) 0≤t<θ
⎩ θ
1 t≥θ

las condiciones Hθ (c1 (θ)) = α1 H2 (c2 (θ)) = 1 − α2 proporcionan los valores

1/n
c1 (θ) = α1 θ y c2 (θ) = (1 − α2 )1/n θ

1/n
α1 θ = t, (1 − α2 )1/n θ = t
−1/n
θ1 (t) = (1 − α2 )−1/n t, θ2 (t) = α1 t

Por tanto
−1/n
Pθ {(1 − α2 )−1/n X(n) < θ < α1 X(n) } = 1 − α
−1/n
resulta el mismo intervalo de confianza ((1 − α2 )−1/n x(n) , α1 x(n) ) que el obtenido por
el método de la cantidad pivotal.

12
Capı́tulo 6. Intervalos de Confianza 13

Ejemplo 6.6.
Sea (X1 , X2 , . . . , Xn ) una m.a.s. de una población con función de densidad
2x
fθ (x) = 0<x<θ
θ2
Determinar por el método de Neyman un intervalo de confianza para θ con nivel 1 − α.
La función de distribución de la población es

⎪ 0 x<0
⎨ 2
x
Fθ (x) = 0≤x<θ

⎩ θ2
1 θ≤x
Como θ es el extremo superior parece razonable considerar el estadı́stico X(n) de función
de distribución ⎧
⎪ 0 y<0
⎨ 2n
n y
Gθ (y) = (Fθ (y)) = 0≤y<θ

⎩ θ2n
1 y≥θ

Pθ (X(n) < c1 (θ)) = α1 Pθ (X(n) > c2 (θ)) = α2 , α1 + α2 = α


Gθ (c1 (θ)) = α1 1 − Gθ (c2 (θ)) = α2
(c1 (θ))2n (c2 (θ))2n
= α1 1− = α2
θ2n θ2n
1/2n
c1 (θ) = θα1 c2 (θ) = θ(1 − α2 )1/2n
1/2n −1/2n
x(n) = θα1 , θ2 (T ) = x(n) α1 , θ1 (T ) = x(n) (1 − α2 )−1/2n

13
Capı́tulo 6. Intervalos de Confianza 14

Resulta el intervalo de confianza:


−1/2n
((1 − α2 )−1/2n x(n) , α1 x(n) )
Este intervalo tiene longitud
−1/2n
L = (α1 − (1 − α2 )−1/2n )x(n) = ((α − α2 )−1/2n − (1 − α2 )−1/2n )x(n)
para obtener el intervalo de longitud mı́nima
= >
∂L 1 −1/2n−1 1 −1/2n−1
= (α − α2 ) − (1 − α2 ) x(n) > 0
∂α2 2n 2n
la longitud mı́nima se alcanza para α2 = 0, α1 = α resultando el intervalo
[x(n) , α−1/2n x(n) ]

6.5. Intervalos de Confianza para parámetros de dis-


tribuciones normales

Notación:
Si Z, Y, t y U son v.a. respectivamente N (0, 1), χ2n , tn y Fn,m se designará por Zα , χ2n,α , tn,α , Fn,m,α
los valores tales que
P {Z > Zα } = α P {t > tn,α } = α
2
P {Y > χn,α } = α P {U > Fn,mα } = α

A.- Intervalo de confianza para la media si la varianza poblacional es conocida


X −µ
Cantidad pivotal: T (X1 , ..., Xn , µ) = √ : N (0, 1)
σ/ n
X −µ
Pµ {−Zα/2 < < Zα/2 } = 1 − α
√σ
n
σ σ
{(x − Zα/2 √ , x + Zα/2 √ }
n n
es un intervalo de confianza para µ con σ conocida en una población Normal a
nivel 1 − α.

14
Capı́tulo 6. Intervalos de Confianza 15

B.- Intervalo de Confianza para la media (µ) con varianza poblacional desconocida
(S 2 cuasivarianza).

X −µ
Cantidad pivotal: T (X1 , ..., Xn , µ) = √ : tn−1
S/ n

X −µ
Pµ,σ {−tn−1;α/2 < √ < tn−1;α/2 } = 1 − α
S/ n
S S
{(x − tn−1,α/2 √ , x + tn−1,α/2 √ )}
n n
es un intervalo de confianza para µ con σ desconocida a nivel 1 − α.

C.- Intervalo de confianza para σ 2 si la media poblacional es conocida.


n
1 3
Cantidad pivotal: T (X1 , ..., Xn , σ 2 ) = (Xi − µ)2 : χ2n
σ 2 i=1
n
3 (Xi − µ)2
Pσ {χ2n,1−α/2 < < χ2n,α/2 } = 1 − α
i=1
σ2
⎧ n n

⎪ 3 3

⎪ 2 2⎪

⎪ (x i − µ) (x i − µ) ⎪

⎨ ⎬
i=1 i=1
,

⎪ χ2n,α/2 χ2n,1−α/2 ⎪ ⎪

⎪ ⎪

⎩ ⎭

es un intervalo de confianza para la varianza al nivel 1 − α.


Este intervalo elimina colas iguales a α/2 en los extremos de la distribución.

D.- Intervalo de Confianza para la varianza con media desconocida.


(n − 1)S 2
Cantidad pivotal: T (X1 , ..., Xn , σ 2 ) = : χ2n−1 (S 2 cuasivarianza )
σ2
(n − 1)S 2
Pµ,σ {χ2n−1;1−α/2 < < χ2n−1,α/2 } = 1 − α
σ2
⎧ n n

⎪ 3 3 ⎪

⎪ (xi − x)2 (xi − x)2 ⎪


⎨ ⎪

i=1 i=1
, 2

⎪ χ2n−1,α/2 χn−1,1−α/2 ⎪ ⎪

⎪ ⎪

⎩ ⎭

es un intervalo de confianza para σ 2 de nivel (1 − α)

15
Capı́tulo 6. Intervalos de Confianza 16

E.- Región de confianza para la media y la varianza poblacionales.


El teorema de Fisher proporciona la distribución conjunta de

X −µ S2
y (n − 1) con S 2 cuasivarianza .
√σ σ 2
n

En efecto como ambos estadı́sticos son independientes


4 5
X −µ
Pµ,σ −Zα/2 < σ < Zα/2 = 1 − α

n
! "
(n − 1)S 2
Pµ,σ χ2n−1,1−β/2 < < χ2n−1,β/2 =1−β
σ2
la región
4 5
X −µ (n − 1)S 2
−Zα/2 < < Zα/2 ; χ2n−1,1−β/2 < < χ2n−1,β/2
√σ σ 2
n

tiene probabilidad (1 − α)(1 − β). Las dos desigualdades definen en el plano (µ, σ 2 )
una región Σ limitada por la parábola
σ2 (n − 1)S 2 (n − 1)S 2
(X − µ)2 = Zα/2 y por las rectas σ 2 = 2 , σ2 = 2
n χn−1,β/2 χn−1,1−β/2

Σ es una región de confianza para (µ, σ 2 ) a nivel (1 − α)(1 − β) eligiendo α y β de


forma que el nivel sea 1 − γ prefijado.

16
Capı́tulo 6. Intervalos de Confianza 17

Otra posibilidad para encontrar región de confianza para (µ, σ 2 ) es: Teniendo en
cuenta P (A ∩ B) = P (A) − P (A ∩ B c ) ≥ P (A) − P (B c ) = P (A) − (1 − P (B)) =
P (A)+P (B)−1, si P (A) = 1−α y P (B) = 1−β, P (A∩B) ≥ 1−α+1−β −1 =
1−α−β
! "
S S (n − 1)S 2 2 (n − 1)S 2
P X − √ tn−1,α/2 < µ < X + √ tn−1,α/2 ; <σ < ≥
n n χn−1,β/2 χn−1,1−β/2

1−α−β =1−γ
Resulta como región de confianza un rectángulo en el plano (µ, σ 2 ).

F.- Intervalo de Confianza para la diferencia de medias con (σ1 , σ2 conocidas, σ1 ̸= σ2 )

X − Y − (µ1 − µ2 )
C
Cantidad pivotal: T (X1 , ..., Xn , Y1 , ..., Ym , µ1 −µ2 ) = : N (0, 1)
σ12 σ22
+
n m
C C
σ12 σ22 σ12 σ22
{(x − y − Zα/2 + , x − y + Zα/2 + )}
n m n m
es un intervalo de confianza a nivel 1 − α para µ1 − µ2 .

G.- Intervalo de Confianza para la diferencia de medias de poblaciones normales (σ1 , σ2


desconocidas pero σ1 = σ2 = σ)
√ √
⃗ Y⃗ , µ1 −µ2 ) = (X − Y − (µ1 − µ 2 )) mn m + n − 2
Cantidad pivotal: T (X, √ D : tn+m−2
n + m nS1 + mS22
2

(S12 , S22 varianzas muestrales)


√ D
n + m nS12 + mS22
{(x − y ∓ tm+n−2,α/2 D )}
mn(m + n − 2)
es un intervalo de confianza al nivel 1 − α para µ1 − µ2 .
√ √
⃗ Y⃗ , µ1 − µ2 ) = (X − Y − (µ1 − µ 2 )) mn m + n − 2
T (X, √ D : tn+m−2
n + m (n − 1)s1 + (m − 1)s22
2

(s21 , s22 cuasivarianzas muestrales )

17
Capı́tulo 6. Intervalos de Confianza 18

H.- Intervalo de confianza para el cociente de varianzas de dos poblaciones normales.


Puesto que
S12 /σ12
S22 /σ22
tiene distribución Fn−1,m−1 siendo S12 , S22 cuasivarianzas muestrales

S12 /σ12
P {Fn−1,m−1;1−α/2 < 2 2 < Fn−1,m−1;α/2 } = 1 − α
S2 /σ2
y por tanto
S12 σ22
Fn−1,m−1;1−α/2 < < Fn−1,m−1;α/2
S22 σ12
entonces
S12 /S22 S12 /S22
{ , }
Fn−1,m−1,α/2 Fn−1,m−1,1−α/2
σ12
es un intervalo de confianza al nivel 1 − α para el cociente de varianzas 2 .
σ2
I.- Intervalo de confianza para la diferencia de medias de dos poblaciones normales
no independientes.
Si (X1 , Y1 ), (X2 , Y2 ), . . . , (Xn , Yn ) es una m.a.s. de una población normal bidimen-
sional de medias (µ1 , µ2 ) y covarianza σ11 ̸= 0 tenı́amos que
n
√ X − Y − (µ1 − µ2 ) ∗2 13
n−1 , S = (Xi − Yi )2 − (X − Y )2
S∗ n i=1

sigue una distribución tn−1 con lo cual


S∗ S∗
(x − y − tn−1;α/2 √ , x − y + tn−1;α/2 √ )
n−1 n−1
es un intervalo de confianza para µ1 − µ2 de nivel 1 − α donde S ∗ representa la
varianza muestral de Xi − Yi esto supuesto que algún elemento de la matriz de
covarianzas es desconocido.
En otro caso
C C
σ12 + σ22 − 2σ11 σ12 + σ22 − 2σ11
(x − y − Zα/2 , x − y + Zα/2 )
n n
es un intervalo de confianza más preciso de nivel de confianza 1 − α, basado en la
X − Y − (µ1 − µ2 ) √
cantidad pivotal D 2 n : N (0, 1)
σ1 + σ22 − 2σ11

18
Capı́tulo 6. Intervalos de Confianza 19

6.6. Intervalos de confianza basados en distribucio-


nes asintóticas.

Siempre que dispongamos de una sucesión Tn de estadı́sticos tales que


Tn − θ
→ N (0, 1) σn (θ) función de n y θ
σn (θ)
Para n suficientemente grande ∀θ ∈ Θ
Tn − θ
Pθ {−Zα/2 < < Zα/2 } ≃ 1 − α
σn (θ)
de modo que si puede invertirse la desigualdad, despejando θ se obtendrá un intervalo
de confianza para θ de nivel 1 − α.
Ejemplo 6.7.
Se considera una población de Poisson P (λ) y se observa una m.a.s. (X1 , X2 , . . . Xn ).
3n
T − nλ X −λ
Sea T = Xi tal que √ =D ≃ N (0, 1).
i=1
nλ λ/n
√ (X − λ)
Pλ {−Zα/2 < n √ < Zα/2 } = 1 − α
λ
Entonces
(x − λ)2 2
n < Zα/2 ⇒ nx2 + nλ2 − 2nxλ < Zα/2
2
λ ⇒ nλ2 − (2nx + Zα/2
2
)λ + nx2 < 0
λ
2
2
Zα/2
λ − (2x + )λ + x2 < 0
n
es < 0 entre las raı́ces
E E
2 2 2 2
Zα/2Zα/2 Zα/2 4x Zα/2
Zα/2 Zα/2 4x
x+ − + <λ<x+ + +
2n 2 n2 n 2n 2 n2 n
es aproximadamente un intervalo de confianza para λ de nivel 1 − α.
Como el resultado es aproximado y por tanto sólo válido para n grande, se
pueden despreciar los términos en n1 frente a √1n y considerar el intervalo simplificado
C C
x x
x − Zα/2 < λ < x + Zα/2
n n
Si por ejemplo n = 400, T = 960, 1 − α = 0,95 resulta Zα/2 = 1,96, x = 2,4 y el
intervalo sin simplificar es [2,253, 2,557] y el simplificado [2,248, 2,552].

19
Capı́tulo 6. Intervalos de Confianza 20

Ejemplo 6.8.
Dadas dos poblaciones independientes N (µ1 , σ1 ), N (µ2 , σ2 ) con los 4 parámetros desco-
nocidos y σ12 ̸= σ22 vimos que

(X − Y ) − (µ1 − µ2 )
C 2 → N (0, 1)
S1 S22
+
n1 n2
y el Intervalo de confianza aproximado para (µ1 − µ2 ) si n1 y n2 son grandes

E E
S12 S22 S12 S22
((x − y) − Zα/2 + , (x − y) + Zα/2 + )
n1 n2 n1 n2

6.7. Intervalos de confianza bayesianos.

Hasta ahora suponemos para la población una función de densidad f (x, θ) su-
poniendo conocida la función f (·, ·). Además se supone que θ tiene un valor fijo aunque
desconocido. En muchas situaciones reales puede haber cierta información sobre θ (hasta
ahora sólo era θ ∈ Θ).
Ası́ el experimentador puede tener la evidencia de que θ actúa como variable aleatoria
para la cual se puede suponer cierta función de densidad. Por ejemplo, en un proceso de
producción se examina la producción de piezas defectuosas que resultan. En un cierto
dı́a se examinan 10 piezas con observaciones x1 , x2 , . . . , x10 donde x1 = 1 si es defectuosa,
xi = 0 si no es defectuosa. Aquı́ f (x; θ) = θx (1 − θ)1−x I0,1 (x) 0 ≤ θ ≤ 1. La distribución
conjunta de los 10 valores es
n
<
!n !n
xi 10− xi
θ i=1 (1 − θ) i=1 I0,1 (xi ) 0 ≤ θ ≤ 1
i=1

Supongamos que de observaciones en varios dı́as se ha observado que el valor de θ cambia


y que el cambio se puede representar como una variable aleatoria de densidad

gθ (θ) = 6θ(1 − θ)I[0,1] (θ)

¿Cómo incorporar esa información adicional al problema estadı́stico?


La situación es: X : f (·; θ), θ v.a. con densidad g(·) = gθ (·) ¿Cómo incorporar
esa información al problema?

20
Capı́tulo 6. Intervalos de Confianza 21

6.7.1. Distribución a posteriori

En este caso f (·; θ) se debe interpretar como f (x/θ) una densidad condicionada
(densidad si θ = θ), indicable también por fX/θ=θ (x/θ). Si gΘ es conocida, gΘ se llama
distribución a priori, contiene la información que tenemos sobre θ a priori es decir antes
de tomar la muestra x1 , x2 , . . . , xn .
Introducimos ahora la distribución que contiene la información sobre Θ después
de observada la muestra.
Definición 6.2. La distribución condicionada de θ dada la muestra X1 = x1 , X2 =
x2 , . . . , Xn = xn indicada por π(θ/x1 , x2 , . . . , xn ) = πθ/X1 =x1 ,X2 =x2 ,...Xn =xn (θ/x1 , x2 , . . . xn )
se llama distribución a posteriori de θ
Observación 6.4.
Fn
f (x1 , x2 , . . . , xn /θ)g(θ) f (xi /θ)g(θ)
π(θ/x1 , x2 , . . . , xn ) = = Fni=1
G
f (x1 , x2 , . . . , xn ) ( i=1 f (xi /θ))g(θ)dθ

Utilizamos la distribución a priori de θ para construir un intervalo estimador de θ.


Dado 1 − α cualquier intervalo (t1 , t2 ) que cumpla
2 t2
π(θ/x1 , x2 , . . . , xn )dθ = 1 − α
t1

será un intervalo de confianza Bayesiano para θ. Observemos que ti = ti (x1 , x2 , . . . , xn )


función de las observaciones.
Hay una diferencia conceptual importante con los intervalos No Bayesianos:
Para no bayesianos antes de observar la muestra

Pθ ((t1 (X1 , X2 , . . . , Xn ), t2 (X1 , X2 , . . . , Xn )) ∋ θ) = 1 − α

significa probabilidad de que el intervalo aleatorio cubra a θ, observada la muestra ya no


tiene sentido hablar de probabilidad sino de confianza de que (t1 (x1 , x2 , . . . , xn ), t2 (x1 , x2 , . . . , xn ))
cubra a θ.
Para bayesianos

P (θ ∈ (t1 (x1 , x2 , . . . , xn ), t2 (x1 , x2 , . . . , xn ))/X1 = x1 , X2 = x2 , . . . , Xn = xn ) = 1 − α

significa probabilidad a posteriori de que θ pertenezca al intervalo fijo

(t1 (x1 , x2 , . . . , xn ), t2 (x1 , x2 , . . . , xn )).

21
Capı́tulo 6. Intervalos de Confianza 22

Ejemplo 6.9.
Sea X1 , X2 , . . . , Xn una m.a.s. de N (θ, 1), θ : N (0, 1)
n
1 1 3
√ n+1 exp{− ( (xi − θ)2 + θ2 )}
2π 2 i=1
π(θ/x1 , x2 , . . . , xn ) = 2 n
1 1 3
√ exp{− ( (xi − θ)2 + θ2 )}dθ
( 2π)n+1 2 i=1

n
3 n
3 n
3
2 2
(xi − θ) + θ = x2i − 2θ xi + (n + 1)θ2
i=1 i=1 i=1
⎛ n ⎞
3
⎜ xi ⎟ n
⎜ 2 ⎟ 3
= (n + 1) ⎜
⎜θ − 2 θ i=1 ⎟+
⎟ x2i
⎝ n + 1 ⎠ i=1

⎛ n ⎞2 n
3 3
⎜ xi ⎟ ( xi ) 2 n
⎜ ⎟ 3

= (n + 1) ⎜θ − i=1 ⎟ i=1
x2i
n + 1 ⎟ − (n + 1) +
⎝ ⎠ i=1

⎧ ⎛ ⎞2 ⎫ n
⎧ ⎛ n ⎞⎫
⎪ ⎪ 3 ⎪ 3 ⎪

⎪ xi ⎟ ⎪ ⎪ ⎪
⎪ ( x ) 2 ⎪


⎨ ⎜ ⎪
⎬ ⎪
⎨ ⎜ n i ⎟⎪

⎜ ⎟ ⎜ 3 ⎟
exp − 2 (n + 1) ⎜
1
⎜ θ − i=1 ⎟ exp − 1 ⎜ x 2
− i=1 ⎟

⎪ ⎝ n+1⎟ ⎠⎪ ⎪ ⎪

2 ⎜
⎝ i=1
i
n+1 ⎟ ⎠⎪


⎪ ⎪
⎪ ⎪
⎪ ⎪

⎩ ⎭ ⎩ ⎭
π(θ/x1 , x2 , . . . , xn ) = ⎧ ⎛ n ⎞⎫
⎪ 3 ⎪ Hn

⎪ 2 ⎪
⎪ ⎜ ( x i ) ⎟⎪⎪ 2 i=1 xi 2
⎨ ⎜3 n
⎟⎬ − 12 (n+1)(θ− )
1⎜ 2 i=1 ⎟ n + 1 dθ
exp − 2 ⎜ xi − ⎟ e

⎪ ⎝ i=1 n + 1 ⎠⎪ ⎪

⎪ ⎪

⎩ ⎭
= Hn >
xi
i=1 1
θ/x1 , x2 , . . . , xn : N ,σ = √
n+1 n+1
Intervalo de Confianza
= = Hn > >
X i √
P −Zα/2 < θ − i=1 n + 1 < Zα/2 = 1 − α ⇒
n+1

22
Capı́tulo 6. Intervalos de Confianza 23

=I Hn I >
I I
i=1 Xi I 1
I
P Iθ − < Zα/2 √ =1−α
n+1 I n+1
y por tanto el intervalo es:
= Hn Hn >
i=1 xi 1 i=1 xi 1
− Zα/2 √ , + Zα/2 √
n+1 n+1 n+1 n+1
El intervalo No Bayesiano era:
= Hn Hn >
i=1 xi 1 i=1 xi 1
− Zα/2 √ , + Zα/2 √
n n n n

El Intervalo Bayesiano es de menor longitud.


Si fuese θ : N (θ0 , 1) resulta
= H H >
θ0 + ni=1 xi 1 θ0 + ni=1 xi 1
− λα √ , + λα √
n+1 n+1 n+1 n+1
θ0 actúa como si fuese una observación más.

23

Anda mungkin juga menyukai