Anda di halaman 1dari 55

Pruebas de hiptesis par

una muestra

Ref:
Apuntes de Estadstica, Mtra Leticia de la Torre
Instituto Tecnolgico de Chiuhuahua
Las secciones anteriores han mostrado cmo puede estimarse un parmetro de
una poblacin a partir de los datos contenidos en una muestra. Puede
encontrarse ya sea un slo nmero (estimador puntual) o un intervalo de valores
posibles (intervalo de confianza).
Sin embargo, muchos problemas de ingeniera, ciencia, y administracin,
requieren que se tome una decisin entre aceptar o rechazar una proposicin
sobre algn parmetro de la poblacin.
Esta proposicin recibe el nombre de hiptesis. Este es uno de los aspectos
ms tiles de la inferencia estadstica, puesto que muchos tipos de problemas de
toma de decisiones, pruebas o experimentos en el mundo de la ingeniera,
pueden formularse como problemas de prueba de hiptesis.
Una hiptesis estadstica sobre los parmetros de puesto
una o ms poblaciones.

Empec
emos
con un
ejempl
o,
supon
ga que
se
tiene
inters
en la
rapide
z de
combu
stin
de un
agente
propul
sor slido utilizado en los sistemas de salida de
emergencia para la tripulacin de aeronaves. El
inters se centra sobre la rapidez de combustin
promedio. De manera especfica, el inters recae
en decir si la rapidez de combustin promedio es o
no 50 cm/s. Esto puede expresarse de manera
formal como dos alternativas o hiptesis:

Ho; ji = 50 cm/s La rapidez


promedio s es de 50 cm/s i * 50
cm/s La rapidez promedio no es
de 50 cm/s

La proposicin Ho; ji = 50 cm/s se conoce como


hiptesis nula (PENSAR: NO HAY DIFERENCIA) ,
mientras que la proposicin ji 50 cm/s, recibe el
nombre de hiptesis alternativa (PENSAR: S HAY
DIFERENCIA).
Ahora bien, se podra considerar slo una direccin en el caso en la hiptesis
alternativa o sea que la hiptesis alternativa especifique valores de i que pueden
ser mayores o menores que 50 cm/s, esto tambin se conoce como hiptesis
alternativa de una cola o unilateral. En algunas situaciones, lo que se desea es
formular una hiptesis alternativa unilateral, como en los casos:
Ho ; j = 50 cm/s H1; j >50 cm/s
o

Ho ; j = 50 cm/s H1; j <50 cm/s


Es importante recordar que las hiptesis siempre son proposiciones sobre
la poblacin o distribucin bajo estudio, no proposiciones sobre la
muestra.
Por lo general, el valor del parmetro de la poblacin especificado en la hiptesis
nula se determina en una de tres maneras diferentes:

1. Puede ser resultado de la experiencia pasada o del conocimiento del


proceso, entonces el objetivo de la prueba de hiptesis usualmente es
determinar si ha cambiado el valor del parmetro.
2. Puede obtenerse a partir de alguna teora o modelo que se relaciona con el
proceso bajo estudio. En este caso, el objetivo de la prueba de hiptesis es
verificar la teora o modelo.
3. Cuando el valor del parmetro proviene de consideraciones externas
tales como las especificaciones de diseo o ingeniera, o de obligaciones
contractuales. En esta situacin, el objetivo usual de la prueba de hiptesis
es probar el cumplimiento de las especificaciones.
Un procedimiento que conduce a una decisin sobre una hiptesis en particular
recibe el nombre de prueba de hiptesis. Los procedimientos de prueba de
hiptesis dependen del empleo de la informacin contenida en la muestra
aleatoria de la poblacin de inters.
Si esta informacin es consistente con la hiptesis, se concluye que sta es
verdadera; sin embargo si esta informacin es inconsistente con la hiptesis, se
concluye que esta es falsa.

Debe hacerse hincapi en que la verdad o falsedad de una hiptesis en


particular nunca puede conocerse con certidumbre, a menos que pueda
examinarse a toda la poblacin.

Usualmente esto es imposible en muchas situaciones prcticas. Por tanto, es


necesario desarrollar un procedimiento de prueba de hiptesis teniendo en
cuenta la probabilidad de llegar a una conclusin equivocada.
La hiptesis nula, representada por Ho, es la afirmacin sobre una o ms
caractersticas de poblaciones que al inicio se supone cierta (es decir, la
"creencia a priori").
La hiptesis alternativa, representada por H1, es la afirmacin contradictoria
a Ho, y sta generalmente es la hiptesis a investigar.
La hiptesis nula se rechaza en favor de la hiptesis alternativa, slo si la
evidencia muestral sugiere que Ho es falsa. Si la muestra no contradice
decididamente a Ho, se contina creyendo en la validez de la hiptesis nula.
Entonces, las dos conclusiones posibles de un anlisis por prueba de hiptesis
son:

Rechazar Ho

No rechazar Ho.
Prueba de una Hiptesis

Para ilustrar los conceptos generales, considere el problema anterior de la


rapidez de combustin. La hiptesis nula podra ser que la rapidez promedio de
combustin es 50 cm/s, mientras que la hiptesis alternativa es que sta no es
igual a 50 cm/s. Esto es, como se mencion al principio, lo que se desea probar
es:

Supngase que se realiza una prueba sobre una muestra de 10 especmenes, y


que se observa cual es la rapidez de combustin promedio muestral. La media
muestral es un estimador_de la media verdadera de la poblacin. Un valor de la
media muestral x que est prximo al valor hipottico ji = 50 cm/s es una
evidencia de que el verdadero valor de la media ji es realmente 50 cm/s; esto
es, que apoya la hiptesis nula Ho. Por otra parte, una media muestral muy
diferente de 50 cm/s constituye una evidencia que apoya la hiptesis alternativa
H1. Por tanto, en este caso, la media muestral es el estadstico de prueba.
La media muestral puede tomar muchos valores diferentes. Supngase que si
48.5 < x < 51.5, entonces no se rechaza la hiptesis nula Ho; i = 50 cm/s, y
que si x < 48.5 x >51.5, entonces se acepta la hiptesis alternativa H1; ji * 50
cm/s.
Los valores de x que son menores que 48.5 o mayores que 51.5 constituyen la
regin crtica de la prueba, mientras que todos los valores que estn en el
intervalo 48.5 < x < 51.5 forman la regin de aceptacin de la hiptesis
nula. Las fronteras entre las regiones crtica y de aceptacin reciben el nombre
de valores crticos.
La costumbre es establecer conclusiones con respecto a la hiptesis nula Ho. Por
tanto, se rechaza Ho en favor de H1 si el estadstico de prueba cae en la regin
crtica, de lo contrario, no se rechaza Ho.
Este tipo de conclusin equivocada se conoce como error tipo I.
El error tipo I se define
como el rechazo de la hiptesis nula Ho cuando sta es verdadera.

Este procedimiento de decisin puede conducir a una de dos conclusiones


errneas. Por ejemplo, es posible que el valor verdadero de la rapidez promedio
de combustin del agente propulsor sea igual a 50 cm/s. Sin embargo, para
todos los especmenes bajo prueba, bien puede observarse un valor del
estadstico de prueba x que cae en la regin crtica. En este caso, la hiptesis
nula Ho ser rechazada en favor de la alternativa H1 cuando, de hecho, Ho en
realidad es verdadera.
Para probar si cometemos un error del tipo I consideramos un "nivel de
significancia" que nos ayuda a determinar la probabilidad de cometer este
tipo de error.

A este nivel se denomina con la letra a.


Si tuviramos un nivel de confianza del 95% (0.95) entonces el nivel de
significancia sera del 5% (0.05).

Nivel de confianza = (1- a)

Anlogamente si se tiene un nivel de confianza del 90% entonces el nivel de


significancia sera del 10%.
Ahora supngase que la verdadera rapidez promedio de combustin es
diferente de 50 cm/s, aunque la media muestral x cae por error de
muestreo dentro de la regin de aceptacin.
En este caso se acepta Ho cuando sta es falsa.
Este tipo de conclusin recibe el nombre de error tipo II.
A la probabilidad de tener un error de tipo II se denomina con la

El error tipo II se define como la aceptacin de la hiptesis nula cuando sta es falsa.

letra p.
Tipos de pruebas de

Como mencionamos antes, se pueden presentar dos tipos de pruebas de


hiptesis que son:
3. De dos colas, o bilateral.
Ho; ju = 50 H 1 ; i * 50
4. De una cola, o uniilateral.
Este ltimo puede ser de cola derecha o izquierda.
El tipo de prueba depende de lo que se necesite probar. 1.

De una cola derecha.

El investigador desea comprobar la hiptesis de un valor mayor en el parmetro


que el de la hiptesis nula, en este caso el nivel de significancia se carga todo
hacia el lado derecho, para definir las regiones de aceptacin y de rechazo.

Prueba de ^^^^^^^^^1^9^^^^^^^^^^!
Ho; Dato < x
H1; Dato > x

Regin de aceptacin

Regin de rechazo
de Ho = a
2. De una cola izquierda:

El investigador desea comprobar la hiptesis de que el parmetro sea menor


que el de la hiptesis nula, en este caso el nivel de significancia se carga
todo hacia el lado izquierdo, para definir las regiones de aceptacin y de
rechazo.

Prueba de

^^^^^^^^^I^^SB^^^^^^^^I
Ho; Parmetro > x
H1; Parmetro < x
Regin de aceptacin
Hiptesis

de H
o

Regin de rechazo
de Ho= a
De dos colas:

Prueba de hiptesis:
Ho; Parmetro = x H1; Parmetro * x

Regin de rechazo de Ho= a/2


Regin de rechazo
de Ho= a/2

El investigador desea comprobar la hiptesis de un cambio en el parmetro, es


decir, no importa si es mayor o menor y lo que se busca es si hay
diferencia con el valor planteado. El nivel de significancia se divide en dos y
existen dos regiones de rechazo.
Una Regla para Rechazar H

Seleciona la probabilidad de error tipo I: a (nivel de


significancia).
Encuentra el valor estadstico crtico correspondiente (z a en la tabla de la
distribucin normal estndar o ta en la distribucin t de student).
Calcula el valor del estadstico para la muestra
Si Z o t cae en el rango crtico za ta entonces, rechaza H0
EJEMPLOS.
1. Una muestra aleatoria de 100 muertes registradas en Estados Unidos el ao
pasado muestra una vida promedio de 71.8 aos. Suponga una desviacin
estndar poblacional de 8.9 aos. Queremos probar si la vida media hoy en
da es mayor a 70 aos con base en esa muestra. La muestra parecera
indicar que es as pero Cul es la probabilidad de que la media de la
muestra no refleje la verdadera media de la poblacin?
Utilizar un nivel de significancia de 0.05.

Solucin:
Se trata de una distribucin muestral de medias con desviacin estndar
conocida.
1.Datos:
i =70 aos s = 8.9
aos x = 71.8 aos n
= 100 a = 0.05
2. Establecemos la hiptesis
Ho; i = 70 aos.
H1; i > 70 aos.

6. Nivel de significancia a =
0.05, za = 1.645
7. Regla de decisin: Si z <
1.645 no se rechaza Ho. Si z >
1.645 se rechaza Ho.
8. Clculos:

6. Decisin y justificacin.

Como 2.02 >1.645 se rechaza


Ho y se concluye con un nivel
de significancia del 0.05 que la
vida media hoy en da es mayor
que 70 aos.
2. Una empresa elctrica fabrica bateras de celular que tienen una duracin
que se distribuye de forma aproximadamente normal con una media de 800
horas y una desviacin estndar de 40 horas. Si una muestra aleatoria de
30 bateras tiene una duracin promedio de 788 horas, muestran los datos
suficiente evidencia para decir que la duracin media no es 800? Utilice un
nivel de significancia del 0.04.
Solucin:
9. Se trata de una distribucin muestral de medias con desviacin estndar
poblacional conocida. Por lo tanto usamos la distribucin normal.
10. Datos:
i =800 horas s = 40
horas x = 788 horas
n = 30 a = 0.04
3. Prueba de hiptesis.

4. Nivel de significancia a = 0.04, za = -1.75

3. Prueba de hiptesis.
Como a la empresa no le preocupa si la duracin es igual o mayor a su
propuesta, entonces las hiptesis a plantear son:
Ho; i > 800 horas H1;
i < 800 horas
5. Regla de decisin:
Si z > -1.75 no se rechaza Ho.
Si z < -1.75 se rechaza Ho.

7. Decisin y justificacin
Como -1.643 > -1.75 por lo tanto, no se rechaza Ho y se concluye con un
nivel de significancia del 0.04 que la duracin media de las bateras no ha
cambiado.
Ejemplos:
1. El Instituto Elctrico Edison publica cifras del nmero anual de Kilowatt-
hora que gastan varios aparatos elctrodomsticos. Se afirma que una
aspiradora gasta un promedio de 46 kilowatt-hora al ao. Si una muestra
aleatoria de 12 hogares que se incluye en un estudio indica que las
aspiradoras gastan un promedio de 42 kilowatt-hora al ao con una
desviacin estndar de 11.9 kilowatt-hora, esto sugiere con un nivel de
significancia de 0.05 que las aspiradoras gastan, en promedio, menos de 46
kilowatt-hora anualmente? Suponga que la poblacin de kilowatt-hora es
normal.
Solucin:
1. Datos:

|u= 46 kilowatt-hora s=
11.9 kilowatt-hora x = 42
kilowatt-hora
n= 12
a = 0.05
Ho; |i = 46 kilowatt-hora HI; ji < 46 kilowatt-hora
3. Valores crticos tc para

0.95 (a = 0.05) con 11

grados de libertad

4. Regla de decisin:
Si t > -1.796 No se rechaza ]
Si t < -1.796 Se rechaza Ho
6. Decisin y justificacin :
Como del
nivel de significancia -1.16 > el
0.05 que -1.796, por lodetanto
nmero promedio no se
kilowatt-hora querechaza
gastan al aoHo y se concluye
las aspiradoras con un menor que 46.
no es significativamente
Nivel de significancia a

Cul es el mximo de probabilidad de error tipo I


(a) que estaramos dispuestos a aceptar?

i I I I ^

Regin de rechazo de -1J8 12


Ho = a
Pruebas de Hiptesis en general

Si G es conocida y los datos son normales, aplicamos el Teorema del Lmite


Central y dependiendo de lo que se desea probar:
1 H0: \x = (i o
Ha: JLX < |u0 una cola izquierda Ha: |u > LU0 una
H :
2 o ^=^o
cola derecha Ha: |u ^ LU0 dos colas
H :
3 o ^=^o
Si a es desconocida (la desviacin estndar de la poblacin), pero tenemos
datos distribuidos de forma normal y n < 30.

Usamos la prueba t con la desviacin estndar de la muestra:

x-a
t
s
y se compara con ta/2 ta
4n

Recordando que:

4 La estadstica de la prueba t tiene una distribucin t d e s t u d e n t con n- 1


grados de libertad.

5 Cuando n > 30, se puede usar la tabla de la distribucin normal en vez de la


t.
Valor p de la prue

es cierta, y la alternativa es H : u< lu Cul es la probabilidad de


Es la probabilidad de observar un valor extremo de la estadstica a prueba si se supone que la hiptesis nula es cierta.

0.00798 por lo que ese es el valor de p.


Ejemplo de empleo del valor

El rea color amarillo sera el


valor p para una t = - 2.41,
puede verse que es menor al
rea azul que es la regin
crtica. Eso implica que un
-t 05 = -1.7293
valor de t = - 2.41 rechaza la Si t < -1.7293 se rechaza
hiptesis nula. H0 al nivel a del 5% de
significancia.
Pero tambin se puede
0.2 comparar el valor de p
directamente con el de
P(t<-1.7293) = .05
Si pes menor que a se
rechaza H0 al nivel del 5% de
0 significancia.
-2 0

-2.41 I -1.7293
Ms ejercicios de Pruebas de Hiptesis.
1. Una muestra aleatoria de 64 bolsas de hojuelas de maz pesan, en promedio
5.23 onzas con una desviacin estndar de 0.24 onzas. El fabricante quiere
poner en la etiqueta que el peso promedio es de 5.5 onzas. Probar la hiptesis
de que u ^ 5.5 onzas contra la hiptesis alternativa, ju < 5.5 onzas con un nivel
de significancia de 0.05.
Solucit.
Se trata de una distribucin muestral de medias con desviacin estndar
desconocida, pero como el tamao de muestra es mayor a 30 se puede tomar la
desviacin muestral como un estimador puntual para la poblacional.

u= 5.5 onzas s=
0.24 onzas x = 5.23
onzas n = 64 a =
0.05
Prueba de hiptesi
s

Ho; ju > 5.5 onzas


H1; u < 5.5 onzas

na
/?egla de decisin:
Si Z > -1.645 No se rechaza Ho
Si Z < -1.645 Se rechaza Ho

Clculos
x-u
5.23- 5.5 0.24
s
V4
Justificacin y decisin:
Como -9 < -1.645 por lo tanto se rechaza Ho y se concluye con un nivel de
significancia del 0.05 que las bolsas de hojuelas de maz pesan en promedio
menos de 5.5 onzas.

2. Un constructor afirma que se instalan calefactores en 70% de todas las casas


que se construyen hoy en da en la ciudad de Richmond. Estara de acuerdo
con esta afirmacin si una investigacin de casas nuevas en esta ciudad
muestra que 8 de 15 tienen instaladas calefactores ? Utilizar un nivel de
significancia de 0.10.

lucir.
e trata de una
colas.
Datos: P= 0.70
p = 8/15 =
0.5333 n = 15 a
= 0.10
Hi

Hi

Regin de Rechazo

a/2 = 0.05 a/2 = 0.05

t= -1.7613 t=1.7613

Prueba de hiptesii
Ho; P = 0.70 H1; P *
0.70
Regla de Decisin Si -1.7613 < t < 1.7613 No
se rechaza Ho Si Z < -1.7613 si Z > 1.7613
Se rechaza Ho
0.533 - 0.70
= -1.41
/( 0.70)(0.30)
15

P - PP
(1 - P )
n
Como -1.7613< -1.41 < 1.7613 No se rechaza Ho y se concluye con un nivel de significancia de 0.10 que la afirmacin del constructor es cierta.

Decisin y justificacin:
3. Una lata de 12 onzas de refresco se disea para que contenga una cantidad
ligeramente mayor que 12 onzas, de tal manera que si excede este volmen no
hay problemas. Sin embargo, un volmen menor a 12 onzas ocasiona que los
consumidores demanden al fabricante. En el proceso normal de produccin, el
fabricante supone que es igual o mayor a 12 onzas. Suponiendo que se prueba
una muestra de 45 latas y se encuentra un volmen promedio de 10.5 onzas con
una desviacin estndar de 2 onzas, establecer si se puede afirmar con un nivel
de significancia de 0.01 que el fabricante est en lo correcto.

Soluci

Se trata de una distribucin de medias con n > 30.

Datos: =
12 x =10.5
s=2
n = 45 a =
0.01
Regin de ]erbnzo

a =0.01

Za=-2.326

H-
Prueba de hiptesis
Ho; u> 12 onzas
H1; i < 12 onzas
S
i

>

-
2
.
3 S
2 i
6
Z
N
o <

s -
e 2
.
r 3
e 2
c 6
h
a S
z e
a
r
H e
o c
h
a
z
a

H
o
Justificacin y decisin: Como -5.03 < - 2.326 por lo tanto se rechaza Ho y se
concluye con un nivel de significancia del 0.01 que no se pude afirma que las
latas tengan un volumen de 12 onzas en promedio.

4. Resolver el problema anterior considerando un nivel de significancia de


0.05.

Soluci

Mismos datos excepto a = 0.05


Mismas hiptesis Mismos clculos

Encontramos que el valor crtico de Z es ahora za = -1.649, por lo que el


resultado anterior no se altera ya que -5.03 < - 1.649, por lo tanto la Ho
tambin se rechaza a un nivel de significancia de 0.05

Anda mungkin juga menyukai