Anda di halaman 1dari 11

PRUEBA DE HIPÓTESIS

Existen dos áreas de interés en el proceso de inferencia estadı́stica: la


estimación puntual y las pruebas de hipótesis. En este capı́tulo se presentan
algunos métodos para desarrollar estas pruebas de forma que puedan ser
aplicadas a ciertos problemas de interés.

8.1. Introducción
Definición 8.1.1 Una hipótesis es una afirmación acerca de un parámetro.

Definición 8.1.2 Las dos hipótesis complementarias en un problema de


prueba de hipótesis son llamadas hipótesis nula e hipótesis alternativa y
se denotan por H0 y H1 respectivamente.
El objetivo de una prueba de hipótesis es decidir, en base a una muestra
extraı́da a partir de la población, cuál de las dos hipótesis complementarias
es verdadera.

Definición 8.1.3 Una prueba de hipótesis es una regla que especifı́ca:

a. Para que valores muestrales la decisión es no rechazar H0 y suponer


que es verdadera.

b. Para que valores muestrales la decisión es rechazar H0 y aceptar H1


como verdadera.

99
CAPÍTULO 8. PRUEBA DE HIPÓTESIS 100

El subconjunto del espacio muestral para el que se rechaza H0 se denomina


región de rechazo o región critica. El complemento de la región de rechazo es
llamado la región de no rechazo.
En general, una prueba de hipótesis se desarrolla en términos de un esta-
dı́stico de prueba W (X) = W (X1 , · · · , Xn ) que es una función de la muestra.

8.2. Métodos para encontrar pruebas


Se presentan a continuación tres métodos para establecer pruebas de hi-
pótesis que pueden ser aplicados a diferentes situaciones.

8.2.1. Prueba de razón de verosimilitud


Recordar que si X1 , · · · , Xn es una muestra aleatoria de una población
con función de probabilidad o función de densidad f (x|θ) entonces la función
de verosimilitud es:
n
Y
L(θ|x1 , · · · , xn ) = L(θ|x) = f (xi |θ)
i=1

Definición 8.2.1 La prueba estadı́stica de razón de verosimilitud para pro-


bar H0 : θ ∈ Θ0 versus H1 : θ ∈ Θc0 es:

supΘ0 L(θ|x)
λ(x) =
supΘ L(θ|x)
donde Θ denota el espacio paramétrico completo. Una prueba de razón
de verosimilitud es aquella con región de rechazo de la forma {x : λ(x) ≤ c},
donde 0 ≤ c ≤ 1.
Suponga que θ̂ es el estimador de máxima verosimilitud de θ sin res-
tricción. Considerar además que θ̂0 es el estimador de máxima verosimilitud
de θ asumiendo que el espacio paramétrico restringido es Θ0 , es decir θ̂0 es
el valor de θ ∈ Θ0 que maximiza L(θ|x). Entonces, la prueba de razón de
verosimilitud es:

L(θ̂0 |x)
λ(x) =
L(θ̂|x)
CAPÍTULO 8. PRUEBA DE HIPÓTESIS 101

Ejemplo 8.2.1 Sea X1 , · · · , Xn una muestra aleatoria de una población


N (θ, 1). Considerar la hipótesis H0 : θ = θ0 versus H1 : θ 6= θ0 donde θ0
es una constante definida a priori por el experimentador. Hallar la prueba de
razón de verosimilitud para probar las hipótesis anteriores.

Ejemplo 8.2.2 Sea X1 , · · · , Xn una muestra aleatoria de una población ex-


ponencial con función de densidad:

e−(x−θ) x≥θ
f (x|θ) = 
0 x<θ

donde −∞ < θ < ∞. Hallar la prueba de razón de verosimilitud para las


hipótesis H0 : θ ≤ θ0 versus H1 : θ > θ0 donde θ0 es una constante definida
por el experimentador.
Si T (X) es una estadı́stica suficiente para θ con función de probabilidad o
densidad g(t|θ) entonces se podrı́a considerar construir una prueba de razón
de verosimilitud basado en T y su función de verosimilitud L∗ (θ|t) = g(t|θ)
en lugar de X y su función de verosimilitud L(θ|x).

Teorema 8.2.1 Si T (X) es una estadı́stica suficiente para θ y λ∗ (t) y λ(x)


son las pruebas de razón de verosimilitud basados en T y X respectivamente,
entonces:
λ∗ (T (x)) = λ(x)

Ejemplo 8.2.3 En el ejemplo 8.2.1 se tiene que X es una estadı́stica sufi-


ciente para θ y en el ejemplo 8.2.2 X(1) = mı́n Xi es también una estadı́stica
suficiente para θ.
Las pruebas de razón de verosimilitud son también útiles en situaciones en
las que existen parámetros de ruido, es decir parámetros que estan presentes
en un modelo pero sobre los que no existe interés inferencial directo.

Ejemplo 8.2.4 Suponga X1 , · · · , Xn una muestra aleatoria de una pobla-


ción N (µ, σ 2 ) y que un experimentador desea realizar inferencias solamente
sobre µ a través de las hipótesis H0 : µ ≤ µ0 versus H1 : µ > µ0 . Hallar la
prueba de razón de verosimilitud considerando que σ 2 es un parámetro de
ruido.
CAPÍTULO 8. PRUEBA DE HIPÓTESIS 102

8.2.2. Prueba de Unión-Intersección


El método de unión-intersección para construir pruebas de hipótesis se
usa cuando la hipótesis nula puede ser expresada como una intersección:
\
H0 : θ ∈ Θγ (8.2.1)
γ∈Γ

donde Γ es un conjunto de ı́ndices que puede ser finito o infinito dependiendo


del problema. Suponga que las pruebas disponibles para H0γ : θ ∈ Θγ versus
H1γ : θ ∈ Θcγ tienen región de rechazo {x : Tγ (x) ∈ Rγ } entonces la región
de rechazo para la prueba de unión-intersección es:
[
{x : Tγ (x) ∈ Rγ } (8.2.2)
γ∈Γ

En particular, suponga que cada una de las pruebas individuales tiene


región de rechazo de la forma {x : Tγ (x) > c}, donde c no depende de γ,
entonces la región de rechazo para la prueba de unión-intersección puede
expresarse como:
[
{x : Tγ (x) > c} = {x : supTγ (x) > c} (8.2.3)
γ∈Γ γ∈Γ

En consecuencia el estadı́stico de prueba es T (X) = supTγ (x).


γ∈Γ

Ejemplo 8.2.5 Sea X1 , · · · , Xn una muestra aleatoria de una población


N (µ, σ 2 ). Usar la prueba de unión-intersección para las hipótesis H0 : µ = µ0
versus H1 : µ 6= µ0 donde µ0 es una constante.

8.2.3. Prueba de Intersección-Unión


Suponga que se desea probar la hipótesis nula:
[
H0 : θ ∈ Θγ (8.2.4)
γ∈Γ

y que para cada γ ∈ Γ, {x : Tγ (x) ∈ Rγ } es la región de rechazo para las


hipótesis H0γ : θ ∈ Θγ versus H1γ : θ ∈ Θcγ . Entonces la región de rechazo
para la prueba de intersección-unión para H0 versus H1 es:
CAPÍTULO 8. PRUEBA DE HIPÓTESIS 103

\
{x : Tγ (x) ∈ Rγ } (8.2.5)
γ∈Γ
Si las regiones de rechazo para las hipótesis individuales son de la forma
{x : Tγ (x) ≥ c}, donde c no depende de γ, entonces la región de rechazo para
H0 es: \
{x : Tγ (x) ≥ c} = {x : ı́nf Tγ (x) ≥ c} (8.2.6)
γ∈Γ
γ∈Γ

Ejemplo 8.2.6 Suponga que dos parámetros son importantes al evaluar la


calidad en una fábrica: θ1 , la resistencia media a la ruptura y θ2 , la probabi-
lidad de pasar un test de inflamación. Suponga que las hipótesis son:
H0 : {θ1 ≤ 50 o θ2 ≤ 0,95} versus H1 : {θ1 > 50 y θ2 > 0,95}
donde un lote de material es aceptado solo si se acepta H1 .
Sean X1 , · · · , Xn las mediciones de la resistencia a la ruptura obtenidas
en una muestra desde N (θ1 , σ√2 ). La prueba de razón de verosimilitud para
H01 : θ1 ≤ 50 se rechaza si n(X − 50)/S > t. Suponga que también se
tienen los resultados en m pruebas de inflamación denotados por Y1 , · · · , Ym
donde Yi = 1 si la i−ésima prueba paso el test y Yi = 0 en caso contrario. La
prueba de razón de verosimilitud correspondiente rechaza H02 : θ2 ≤ 0,95 si
Pm
i=1 Yi > b. La región de rechazo para la prueba de intersección-unión es:
m
( )
x − 50 X
(x, y) : √ >ty yi > b
s/ n i=1

8.3. Métodos para evaluar pruebas


Las pruebas de hipótesis se evaluan y comparan a través de sus probabi-
lidades de cometer error al decidir entre rechazar o no rechazar H0 .

8.3.1. Probabilidades de error y potencia de la prueba


Una prueba de hipótesis para H0 : θ ∈ Θ0 vs H1 : θ ∈ Θc0 puede conducir
a dos tipos de error.
Decisión
Hipótesis verdadera No se rechaza H0 Se rechaza H0
H0 Decisión correcta Error tipo I
H1 Error tipo II Decisión correcta
CAPÍTULO 8. PRUEBA DE HIPÓTESIS 104

Suponga que R denota la región de rechazo de una prueba, entonces:



Pr (Cometer error tipo I) si θ ∈ Θ0
Pr(X ∈ R) =
θ 1 − Pr (Cometer error tipo II) si θ ∈ Θc
0

Definición 8.3.1 La función potencia de una prueba de hipótesis con región


de rechazo R es la función de θ definida por:

β(θ) = Pr(X ∈ R)
θ

Ejemplo 8.3.1 Sea X1 , · · · , Xn una muestra aleatoria de una población


N (θ, σ 2 ) con σ 2 conocido. Una prueba de razón de verosimilitud
√ para H0 :
θ ≤ θ0 versus H1 : θ > θ0 rechaza H0 si (x̄ − θ0 )/(σ/ n) > c . La constante
c puede ser cualquier número positivo. La función potencia para esta prueba
es:
!
X − θ0
β (θ) = Pr √ >c
θ σ/ n
!
X −θ θ0 − θ
= Pr √ >c+ √
θ σ/ n σ/ n
!
θ0 − θ
= Pr Z > c + √
θ σ/ n

El gráfico se muestra a continuación.

> set.seed(500)
> sigma <- 1
> x <- rnorm(n=15, mean=5, sd=sigma)
> media <- mean(x)
> n <- length(x)
> theta0 <- 6
> theta <- seq(from=4, to=8, by=0.1)
> c <- 1.28
> z0 <- c + (theta0 - theta)/(sigma/sqrt(n))
> potencia <- 1 - pnorm(q=z0, mean=0, sd=1)
> plot(theta, potencia, type="l")
CAPÍTULO 8. PRUEBA DE HIPÓTESIS 105

Figura 8.1: Función potencia usando R

1.0
0.8
0.6
potencia

0.4
0.2
0.0

4 5 6 7 8

theta

Es común considerar aquellas pruebas que controlan la probabilidad de


cometer error tipo I en un determinado nivel y dentro de ellas buscar la que
tenga la menor probabilidad de cometer error tipo II.

Definición 8.3.2 Para 0 < α < 1, una prueba con función potencia β(θ)
es una prueba de tamaño α si:
sup β(θ) = α
θ∈Θ0

Definición 8.3.3 Para 0 < α < 1, una prueba con función potencia β(θ)
es una prueba de nivel α si:
sup β(θ) ≤ α
θ∈Θ0
CAPÍTULO 8. PRUEBA DE HIPÓTESIS 106

Algunos autores no realizan distinción entre los términos tamaño y ni-


vel, que resulta de importancia para aquellas situaciones en las que resulta
imposible obtener una prueba de tamaño α.

8.3.2. Pruebas más poderosas


En las secciones previas se presentaron algunas pruebas que controlan la
probabilidad de cometer error tipo I. Sin embargo una buena prueba deberı́a
tener también una pequeña probabilidad de cometer error tipo II, es decir
un valor grande para la potencia.

Definición 8.3.4 Sea F una familia de pruebas para H0 : θ ∈ Θ0 versus


H1 : θ ∈ Θc0 . Una prueba en esta familia con función potencia β(θ) es la
prueba uniformemente más poderosa de F si para cualquier otra prueba con
función potencia β ∗ (θ) se tiene que β(θ) ≥ β ∗ (θ).

Teorema 8.3.1 (Lema de Neyman-Pearson) Considere las hipótesis H0 :


θ = θ0 versus H1 : θ = θ1 donde la función de probabilidad o densidad con-
junta es f (x|θi ) para i = 0, 1. Una prueba con región de rechazo R que
satisface:

x ∈ R si f (x|θ1 ) > kf (x|θ0 )

para k ≥ 0 y α = Prθ0 (X ∈ R) se dice que es una prueba uniformemente más


poderosa de nivel α.

Ejemplo 8.3.2 Sea X1 , · · · , Xn una muestra aleatoria de una población


N (θ, σ 2 ) donde σ 2 es conocido. Hallar la prueba uniformente más podero-
sa de nivel α para probar H0 : θ = θ0 versus H1 : θ = θ1 donde θ0 > θ1 .
Las hipótesis H0 y H1 en el Lema de Neyman-Pearson que consideran
solo una distribución para la muestra X son llamadas hipótesis simples. En
muchos problemas las hipótesis de interés consideran más de una distribución
para la muestra y son llamadas hipótesis compuestas. En este último caso
también se requiere encontrar una prueba uniformemente más poderosa.

Teorema 8.3.2 (Familias exponenciales I) Sea X1 , · · · , Xn una muestra


aleatoria de una función de probabilidad o densidad de la forma f (x|θ) =
h(x)c(θ) exp {t(x)w(θ)} y que T (x) = ni=1 t(xi ). Se desea probar H0 : θ ≤ θ0
P

versus H1 : θ > θ0 .
CAPÍTULO 8. PRUEBA DE HIPÓTESIS 107

a. Si w (θ) es monótona creciente y existe c tal que α = Prθ0 (T (X) > c)


entonces la prueba con región de rechazo {x : T (x) > c} es la prueba
uniformemente más poderosa de nivel α .

b. Si w (θ) es monótona decreciente y existe c tal que α = Prθ0 (T (X) < c)


entonces la prueba con región de rechazo {x : T (x) < c} es la prueba
uniformemente más poderosa de nivel α .

Teorema 8.3.3 (Familias exponenciales II) Sea X1 , · · · , Xn una mues-


tra aleatoria de una función de probabilidad o densidad de la forma f (x|θ) =
h(x)c(θ) exp {t(x)w(θ)} y que T (x) = ni=1 t(xi ). Se desea probar H0 : θ ≥ θ0
P

versus H1 : θ < θ0 .

a. Si w (θ) es monótona creciente y existe c tal que α = Prθ0 (T (X) < c)


entonces la prueba con región de rechazo {x : T (x) < c} es la prueba
uniformemente más poderosa de nivel α .

b. Si w (θ) es monótona decreciente y existe c tal que α = Prθ0 (T (X) > c)


entonces la prueba con región de rechazo {x : T (x) > c} es la prueba
uniformemente más poderosa de nivel α .

Ejemplo 8.3.3 Sea X1 , · · · , X5 una muestra aleatoria a partir de la dis-


tribución N (2, σ 2 ). Hallar la prueba uniformemente más poderosa de nivel
α = 0,05 para probar las hipótesis H0 : σ 2 ≤ 0,8 versus H1 : σ 2 > 0,8.

Definición 8.3.5 Una familia de funciones de probabilidad o densidad tiene


la propiedad de razón de verosimilitud monótona (RVM) si para todo θ1 < θ2 :
Qn
f (xi |θ1 )
ψ = Qi=1
n
i=1 f (xi |θ2 )

es una función creciente o decreciente en T (x).

Teorema 8.3.4 (RVM I) Sea X1 , · · · , Xn una muestra aleatoria de una


función de probabilidad o densidad que pertenece a una familia con la pro-
piedad de RVM en T (x) y se desea probar H0 : θ ≤ θ0 versus H1 : θ > θ0 .

a. Si ψ es creciente y existe c tal que α = Prθ0 (T (X) < c) entonces la


prueba con región de rechazo {x : T (x) < c} es la prueba uniforme-
mente más poderosa de nivel α .
CAPÍTULO 8. PRUEBA DE HIPÓTESIS 108

b. Si ψ es decreciente y existe c tal que α = Prθ0 (T (X) > c) entonces la


prueba con región de rechazo {x : T (x) > c} es la prueba uniforme-
mente más poderosa de nivel α .

Teorema 8.3.5 (RVM II) Sea X1 , · · · , Xn una muestra aleatoria de una


función de probabilidad o densidad que pertenece a una familia con la pro-
piedad de RVM en T (x) y se desea probar H0 : θ ≥ θ0 versus H1 : θ < θ0 .

a. Si ψ es creciente y existe c tal que α = Prθ0 (T (X) > c) entonces la


prueba con región de rechazo {x : T (x) > c} es la prueba uniforme-
mente más poderosa de nivel α .

b. Si ψ es decreciente y existe c tal que α = Prθ0 (T (X) < c) entonces la


prueba con región de rechazo {x : T (x) < c} es la prueba uniforme-
mente más poderosa de nivel α .

Ejemplo 8.3.4 Sea X1 , · · · , Xn una muestra aleatoria a partir de:


2x
f (x|θ) = 0<x<θ
θ2
Hallar la prueba uniformemente más poderosa de nivel α para probar las
hipótesis H0 : θ ≥ θ0 versus H1 : θ < θ0 .

8.4. Distribución asintótica de la prueba de


razón de verosimilitud
En muchas situaciones no es posible determinar la distribución exacta de
la prueba de razón de verosimilitud. Se hace necesario obtener una prueba
aproximada y su distribución asintótica para poder establecer algunas con-
clusiones.

Teorema 8.4.1 Sea X1 , · · · , Xn una muestra aleatoria de una función de


probabilidad o densidad f (x|θ). Bajo ciertas condiciones de regularidad la
distribución del estadı́stico:

L(θ̂ 0 |X)
−2 log λ(X) = −2 log
L(θ̂|X)
CAPÍTULO 8. PRUEBA DE HIPÓTESIS 109

converge a la distribución χ2 conforme n → ∞. Los grados de libertad de


la distribución lı́mite se obtienen como la diferencia entre el número de pa-
rámetros libres especificados por θ ∈ Θ y el número de parámetros libres
especificados por θ ∈ Θ0 .

Ejemplo 8.4.1 Suponga que se tiene dos muestras aleatorias independien-


tes X1 , · · · , Xn a partir de la distribución exponencial con parámetro θ1 y
Y1 , · · · , Yn a partir de la distribución exponencial con parámetro θ2 . Hallar la
prueba de razón de verosimilitud de nivel α = 0,05 para probar H0 : θ1 = θ2
versus H1 : θ1 6= θ2 considerando que n = 200, x = 8 y y = 9,5.

Anda mungkin juga menyukai