Anda di halaman 1dari 5

Estadstica - 2

o
de Qumicas - UNIVERSIDAD DE OVIEDO 115
CONTRASTE DE HIP

OTESIS
El otro problema fundamental en Inferencia Estadstica es el del contraste de hipotesis.
Si se considera el experimento aleatorio consistente en observar una variable aleatoria
sobre una poblacion, y la distribucion de la misma no esta especicada totalmente, se
entiende por hipotesis estadstica cualquier suposicion relativa a dicha distribucion.
Cuando esta hipotesis especica completamente la distribucion se habla de hipotesis
simple, y en caso contrario de hipotesis compuesta.
Conceptos basicos
Un contraste o test de hipotesis consiste en un procedimiento que para cada
realizacion muestral indica si la hipotesis puede aceptarse como posible o debe recha-
zarse. De este modo, puede formalizarse un test de hipotesis basado en una muestra
aleatoria simple (X
1
, . . . , X
n
) como una regla que establece para que muestras de obser-
vaciones debe rechazarse la hipotesis y para cuales puede aceptarse. En otras palabras,
un test puede caracterizarse mediante dos conjuntos o regiones disjuntos cuya union es
la clase de todas las muestras de observaciones: la region crtica (integrada por las
observaciones para las que se considera que la hipotesis debe rechazarse)
C = S
1
= {(x
1
, . . . , x
n
) | debe rechazarse la hipotesis}
y la region de aceptacion (integrada por las observaciones para las que se considera
que la hipotesis puede aceptarse)
C = S
0
= {(x
1
, . . . , x
n
) | puede aceptarse la hipotesis} .
Recibe el nombre de hipotesis nula, y se denota por H
0
, a la suposicion que se
contrasta e hipotesis alternativa, y se denota por H
1
, a la suposicion (o al conjunto de
las suposiciones) restante(s). Generalmente, H
0
suele estar mas especicada que H
1
.
Para poder valorar la idoneidad de un procedimiento de contraste de hipotesis van
a considerarse las probabilidades de los errores en que puede incurrirse al utilizar un
test: rechazar H
0
siendo cierta (error de tipo I ) o aceptarla siendo falsa (error
de tipo II ). El procedimiento de contraste idealmente mas adecuado sera aquel
que, jado el tama no de muestra y la muestra aleatoria simple de base, proporcionara
probabilidades de errores de tipo I y II mnimas simult aneamente. Sin embargo, como
estas probabilidades afectan a dos regiones complementarias entre s, solo en casos muy
especiales (y sin interes practico) puede determinarse ese procedimiento ideal.
Estadstica - 2
o
de Qumicas - UNIVERSIDAD DE OVIEDO 116
Como consecuencia, se establece una especie de relacion de prioridad entre las pro-
babilidades de los dos tipos de error, controlando en primer termino la(s) del error de
tipo I y, dentro de los tests que superan este primer control, se controlan (si es posible)
la(s) probabilidad(es) del error de tipo II. Mas concretamente, se establece una cota
[0, 1] para la probabilidad maxima admisible de error de tipo I (es decir, cualquiera
que sea una distribucion correspondiente a H
0
la probabilidad mediante tal distribucion
de que (X
1
, . . . , X
n
) C debe ser ). El valor de esa cota se denomina nivel de
signicacion.
Una vez jado el nivel de signicacion , una forma de proceder es buscar el test que
teniendo probabilidad(es) de error de tipo I inferior(es) o igual(es) a tenga probabili-
dad(es) de error de tipo II mnima(s) (lo que tambien se indica diciendo que es el test al
nivel alpha con mayor funcion de potencia, que corresponde a la(s) probabilidad(es)
de rechazar H
0
siendo falsa).
Sin embargo, no siempre es posible (ni necesariamente interesa) encontrar un test
que satisfaga las condiciones precedentes. Otra forma de proceder, a un mas usual, es
la que consideran los llamados tests de signicacion, en los que jado el nivel de
signicacion la region crtica puede expresarse en la forma
C = {(x
1
, . . . , x
n
) | U(x
1
, . . . , x
n
) > k

}
en funcion de un estadstico U(X
1
, . . . , X
n
), que mide cierta desviacion entre lo que
supone la hipotesis nula y lo que indica la informacion contenida en la muestra, y tiene
distribucion conocida bajo la(s) distribucion(es) supuesta(s) en la hipotesis nula. El
valor k

, a menudo llamado valor crtico del contraste, cuantica la desviacion maxima


admisible que cabra atribuir al azar (es decir, si se supera k

se interpreta que la
desviacion entre lo que establece la hipotesis nula y lo que indica la muestra de obser-
vaciones es demasiado grande como para admitir que se deba al azar, y por lo tanto se
concluye que la hipotesis nula no es aceptable). k

se determina de forma que


P
0
(U(X
1
, . . . , X
n
) > k

)
cualquiera que sea la distribucion P
0
entre las supuestas en H
0
. En el caso en que H
0
sea una hipotesis simple,siempre que sea posible se determina k

de forma que (ver


Figura 32)
P
0
(U(X
1
, . . . , X
n
) > k

) = .
Alternativamente, puede describirse un contraste de hipotesis como un pro-
cedimiento que establece hasta que punto la hipotesis puede considerarse sostenible
o aceptable sobre la base de la informacion dada por la muestra de observaciones
disponible. Cuando se adopta esta interpretaci on alternativa, en lugar de prejar un
nivel de signicacion, una vez considerada la muestra de observaciones se determina el
p-valor (que dependera de la muestra de observaciones) y que consiste en el menor nivel
de signicacion a partir del que la hipotesis H
0
se rechaza a la vista de la informacion
muestral disponible.
Estadstica - 2
o
de Qumicas - UNIVERSIDAD DE OVIEDO 117
|
funcion de densidad de U(X
1
, . . . , X
n
)

Figura 32. Determinacion del valor crtico en un contraste de signicacion


Cuanto menor es el p-valor de un contraste para la muestra de observaciones con-
siderada, menos sostenible resulta la hipotesis nula. Por ejemplo, un p-valor es inferior
o igual a 0.001 indica que si H
0
fuera cierta a lo sumo un 1 por 1000 de las mues-
tras de individuos elegidas al azar e independientemente de la poblacion conduciran
a un rechazo de H
0
; por ello, si se rechaza la hipotesis nula cabe pensar que obedece
mas a la falsedad de esa hipotesis que a que se haya incurrido en un error que resulta
tan altamente improbable. En el caso del contraste de signicacion de una hipotesis
nula simple basado en el estadstico U(X
1
, . . . , X
n
), el p-valor asociado a la muestra de
observaciones (x
1
, . . . , x
n
) vendr a dado por
p = P
0
(U(X
1
, . . . , X
n
) > U(x
1
, . . . , x
n
)) .
|
funcion de densidad de U(X
1
, . . . , X
n
)
p
U(x
1
, . . . , x
n
)
Figura 33. Determinacion del p-valor en un contraste de signicacion
Estadstica - 2
o
de Qumicas - UNIVERSIDAD DE OVIEDO 118
Contrastes basados en intervalos de conanza
Si X es una variable aleatoria cuya distribucion depende de cierto parametro , para
contrastar la hipotesis
H
0
: =
0
frente a la hipotesis alternativa H
1
: =
0
sobre la base de una realizacion (X
1
, . . . , X
n
)
de la muestra aleatoria simple (x
1
, . . . , x
n
), puede utilizarse el siguiente procedimiento
supuesto jado un nivel de signicacion :
1) se construye un intervalo de conanza [T
1
(x
1
, . . . , x
n
), T
2
(x
1
, . . . , x
n
)] con coe-
ciente de conanza 1 ;
2)
si
0
/ [T
1
(x
1
, . . . , x
n
), T
2
(x
1
, . . . , x
n
)] , entonces debemos rechazar H
0
,
si
0
[T
1
(x
1
, . . . , x
n
), T
2
(x
1
, . . . , x
n
)] , entonces podramos aceptar H
0
,
Como ejemplos de contrastes de hipotesis de este tipo podemos considerar el caso
en que X N(, ) y (X
1
, . . . , X
n
) es una muestra aleatoria simple de tama no n a
partir de X. Entonces:
si consideramos = , H
0
: =
0
y conocemos el valor de , sabemos que bajo
H
0
X
n

0
/

n
N(0, 1)
de manera que si jado el nivel de signicacion buscamos a partir de las tablas
de la distribucion Normal tpica el valor

tal que
P


X
n

0
/

= 2 (

) 1 = 1 ,
se concluye que:
puede aceptarse H
0


X
n

0
/

.
si consideramos = , H
0
: =
0
y desconocemos el valor de , sabemos que
bajo H
0
X
n

0
s
n
/

n
t
n1
de manera que si jado el nivel de signicacion buscamos a partir de las tablas
de la distribucion t de Student el valor

tal que
P


X
n

0
s
n
/

n
t

= 1 ,
se concluye que:
puede aceptarse H
0
t


X
n

0
s
n
/

n
t

.
Estadstica - 2
o
de Qumicas - UNIVERSIDAD DE OVIEDO 119
si consideramos = , H
0
: =
0
, sabemos que bajo H
0
ns
2
n

2
0

2
n1
de manera que si jado el nivel de signicacion buscamos a partir de las tablas
de la distribucion chi-cuadrado el valor
2

tal que
P

ns
2
n

2
0

2

= 1 ,
se concluye que:
debe rechazarse H
0

ns
2
n

2
0
>
2

.
Otro ejemplo interesante de contraste de hipotesis que sigue un razonamiento similar
es el relativo al parametro p de una distribucion Bernoulli X B(1, p) y (X
1
, . . . , X
n
)
es una muestra aleatoria simple de tama no n a partir de X. Entonces:
si consideramos = p, H
0
: p = p
0
, sabemos que bajo H
0
p p
0

p
0
(1 p
0
)
n
(aprox. -si n 30-)N(0, 1)
siendo p = X
n
= la proporcion muestral del valor 1 (es decir, el contraste sobre
el verdadero valor de la probabilidad de ocurrencia del suceso o propiedad A
asociado a la distribucion de Bernoulli se basa en el valor de la proporcion de
individuos de la muestra para los que se cumple esa propiedad).
Si jado el nivel de signicacion buscamos a partir de las tablas de la distribucion
Normal tpica el valor

, se concluye (aproximadamente) que:


puede aceptarse H
0


p p
0

p
0
(1 p
0
)
n