Tipos de errores
Error tipo I
Es el error que se comete al rechazar la hiptesis nula cuando sta es realmente verdadera.
1 Conceptos bsicos
Prueba de Hiptesis
( ) se define como:
Una Prueba de Hiptesis es hacer una afirmacin acerca del valor que el parmetro de la
poblacin bajo estudio puede tomar. Esta afirmacin puede estar basada en alguna creencia
o experiencia pasada que ser contrastada con la evidencia que nosotros obtengamos a
travs de la informacin contenida en la muestra.
El valor es fijado por la persona que realiza la investigacin, por lo general, en 1%, 5%
10%. Tambin se le llama riesgo
Error tipo II
Es el error que se comete al no rechazar la hiptesis nula H0 cuando sta en realidad es
falsa.
La probabilidad de cometer el error tipo II
() se define como:
Ejemplo 1
H0: El tiempo medio de atencin a un cliente en el mdulo de informacin es de 2,8
minutos o menos.
H1: El tiempo medio de atencin a un cliente en el mdulo de informacin es de ms de 2,8
minutos.
H0: 2,8 minutos
H1: > 2,8 minutos
Ejemplo 2
H0: El porcentaje de personas que votar por un candidato es del 50%.
H1: El porcentaje de personas que votar por un candidato es menor al 50%.
H0: p = 0,50
H1: p 0,50
Contraste de hiptesis
El hecho de no rechazar la hiptesis nula no implica que sta sea cierta, significa que los
datos de la muestra no proporcionan evidencia suficiente que contradiga lo supuesto en la
hiptesis nula.
La hiptesis que se contrasta es rechazada o no en funcin de la informacin muestral. La
hiptesis alternativa se especifica como opcin posible si se rechaza la hiptesis nula.
Decisin
Rechazar H0
Error tipo I
Decisin correcta
No rechazar H0
Decisin correcta
Error tipo II
Paso 1: Plantear hiptesis acerca del parmetro . En este curso puede ser , (media
poblacional), 2 (varianza poblacional) o p (proporcin poblacional) 1 - 2 (diferencia
de medias poblacionales) o p1
En la estadstica aplicada los usuarios han adoptado de forma extensa la aproximacin del
valor P. La aproximacin se disea para dar al usuario una alternativa a la simple
conclusin de rechazo o no rechazo
12
22
1.
2.
Regla de decisin
Unilateral
Unilateral
p 1 P( z z c )
p P( z z c )
p 1 P(t n1 t c )
p P(t n1 t c )
Bilateral
p 21 P( z z c )
p 21 P(t n1 t c )
Unilateral
H 0 : 0
H 0 : 0
H1 : 0
H1 : 0
H1 : 0
H1 : 0
H 0 : 1550 ? El tiempo medio de lmparas fluorescentes producidas por una
cierta empresa que se mantienen encendidas antes de echarse a
perder es a lo ms 1550 horas
El tiempo medio de lmparas fluorescentes producidas por una
cierta empresa que se mantienen encendidas antes de echarse a
perder es ms de 1550 horas
H1 : 1550
Bilateral
H 0 : 0
H 0 : 0
2.
0.02
0.01 1
0.99
Z1 Z 0.992.33
RRRR
RRRA
zc
z c z1
x 0
/ n
z c z1
z c z1 / 2
4. Estadstico de la prueba
z c z1 / 2
n =102
5. Conclusiones.
zc
Ejemplo 1
a. Se trata de probar si el tiempo medio de lmparas fluorescentes
producidas por una cierta empresa que se mantienen encendidas antes de echarse a perder
es a lo ms 1550horas con una desviacin estndar de 120 horas. Para ello se toma una
muestra de 102 lmparas y se dejan encendidas hasta que se apagan. El resultado de la
muestra dio una duracin por da de 1500 horas Utilice un riesgo del 2%
b. Halle el p de la prueba
c. Qu tipo de error se comete?
x 0
/ n
1500 1550
4.208
120
102
Solucin
PRUEBA DE HIPTESIS UNILATERAL
b. Usando el p de la prueba
Ejemplo 2
Un fabricante de detergente afirma que el contenido de los paquetes que
vende pesa, por trmino medio, al menos 200 gramos. Se sabe que la distribucin de los
pesos es normal, con desviacin tpica de cuatro gramos. Una muestra aleatoria de 16
paquetes da un peso medio muestral de 198,4 gramos. Contrastar, al nivel de significacin
del 10% la afirmacin del fabricante.
Solucin
Unilateral
Bilateral
H 0 : 0
H 0 : 0
H 0 : 0
H1 : 0
H1 : 0
H1 : 0
tc
t c t1 ,n1
x 0
s/ n
t c t1 ,n1
t c t1 / 2,n 1
t c t1 / 2,n 1
5 Conclusiones.
Ejemplo3
Una compaa que se dedica a la venta de franquicias afirma que, por
trmino medio, los delegados obtienen durante el primer ao un rendimiento del 10% (para
clculo tomar 10) en sus inversiones iniciales. Una muestra aleatoria de 10 de estas
franquicias present los siguientes rendimientos el primer ao de operacin
6,1
9,2
11,5
8,6
12,1
3,9
8,4
10,1
9,4
8,9
a. Asumiendo que los rendimientos poblacionales tienen distribucin normal, contrastar la
afirmacin de la compaa.
b. Halle el p de la prueba
c. Qu tipo de error se comete?
Solucin
Ejemplo 4
Cuando funciona correctamente un proceso produce frascos de champ
cuyo contenido pesa, en promedio 200 gramos. Una muestra aleatoria de nueve frascos de
una remesa present los siguientes pesos (en gramos) para el contenido
2.
H1 : 10
0.05
Como alfa =0.05
0.025 1
0.975
214
197
197
206
208
201
197
203
209
Asumiendo que la distribucin de la poblacin es normal, contrastar al nivel del 5%, la
hiptesis nula de que el proceso est funcionando correctamente.
Solucin
2.262
RRRR
RRRR
RRRA
4. Estadstico de la prueba
n = 10 S
x
tc
x 0
s/ n
0 10
p 21 P(t t c ) 21 P(t 9
) 21
2*
Ejemplo 5
Suponga que el peso (en kilogramos) de ciertos paneles publicitarios
sigue una distribucin normal. Para realizar un control de calidad de los mismos, se
tomaron al azar una muestra de 7 de ellos, encontrndose los siguientes resultados:
p
rechazar Ho
c. Qu tipo de error se comete?.............................................................................................. ...
Paneles
Peso(en kilos)
1
55,50
2
56,20
3
61,00
4
64,50
5
67,80
6
62,10
7
56,70
a. Se desea probar si las evidencia muestral permiten suponer que el verdadero peso
promedio de estos paneles es menos de 59 kilos. Sabiendo que los pesos siguen una
distribucin normal y = 0,05
b. Halle el p de la prueba
Unilateral
Solucin
Unilateral
Bilateral
H 0 : 0
H 0 : 0
H 0 : 0
H1 : 0
H1 : 0
H1 : 0
4. Clculos.
zc
z c z1
x 0
s/ n
z c z1
z c z1 / 2
z c z1 / 2
Ejemplo 6
Los inspectores de INDECOPI al investigar el cargo levantado contra una
embotelladora de que no llena adecuadamente las botellas, tomaron una muestra de 100
botellas y encontraron que el contenido tena una media de 31,65 onzas con una desviacin
estndar de dos onzas. Las botellas indican en su etiqueta que contienen 32 onzas. Al nivel
de significacin del 2%.
a. Deberan los inspectores aceptar que las botellas estn siendo llenadas con menos contenido
medio que el indicado?
b. Halle el p de la prueba
c. Qu tipo de error se comete?
Solucin PRUEBA DE HIPTESIS UNILATERAL
1. H 0 : 32 El contenido neto de las botellas es por lo menos a 32 onzas
2.
0.02
1 0.98
RRRR
RRRA
4. Estadstico de la prueba
n = 100
S 2
zc
x 0
S/ n
x 31.65
0 32
31.65 32
1.75
2
100
No se rechaza H0
c. Qu tipo de error se comete?............................................................................................
Ejemplo 7
Una cadena de restaurantes de comida rpida afirma en su anuncio
publicitario: Te atendemos en menos de 3 minutos. Para corroborar esta afirmacin se le
encarga a usted verificarla y para ello decide seleccionar al azar una muestra de 50 clientes
de uno de estos restaurantes encontrando que el tiempo promedio de espera era de 2,75
minutos con una desviacin estndar de 1 minuto.
a. Ser cierta la afirmacin dada por esta cadena de restaurantes? Use un nivel de
significancia del 5%.
b. Halle el p de la prueba
c. Qu tipo de error se comete?
Unilateral
H 0 : p p0
H 0 : p p0
H 0 : p p0
H 1 : p p0
H 1 : p p0
H 1 : p p0
Solucin
4. Clculo del estadstico de la prueba
Bilateral
zc
z c z1
z c z1
p p0
Solucin
p0 q0
n
z c z1 / 2
z c z1 / 2
5. Conclusiones
Ejemplo 8
El jefe de personal opina que el 18% de los empleados de la compaa
trabajan horas extras cada semana. El porcentaje observado esta semana en una muestra de
100 empleados es de 9%. Con un nivel de significacin del 5%. La opinin del jefe de
personal ha cambiado?
Solucin
Ejemplo 10
En abril del 2010 un diario de la capital public en base a una encuesta
realizada por una prestigiosa encuestadora a una muestra de 2735 limeos el siguiente
grfico:
Ejemplo 9
En una encuesta a 400 electores de un distrito, el 52 % estaban de
acuerdo con la gestin del alcalde. Con un nivel de significacin del 5%. Se puede afirmar
que ms de la mitad de los electores del distrito estn de acuerdo con la gestin del alcalde?
Ejemplo 11
Una organizacin de defensa del consumidor afirma que ms del 15% de
los clientes de una compaa que presta servicios de desratizacin necesita que se repita el
proceso despus del perodo de garanta de 90 das. Para determinar la validez de esta
afirmacin, selecciona una muestra aleatoria de 100 clientes y descubre que 22 necesitaron
repetir el proceso despus del perodo de garanta de 90 das. Usando un nivel de
significacin del 5%, hay evidencia estadstica de que la afirmacin sea vlida?
varianzas poblacionales 1
y 2
Las muestras son independientes y las poblaciones tienen distribucin normal
2
Solucin
H 0 : 12 22
H 1 : 12 22
2. Fijar el nivel de significacin: alfa
3. Regiones crticas. F1, F2 valores crticos
F2
1
F
2
F1 F
, n2 1; n1 1
, n1 1;n2 1
4. Estadstico de la prueba
Fc
s12
s 22
70
90
84
65
75
85
71
La Victoria(2)
43
43
51
56
44
64
58
Accidentes
Distrito
media
Cercado
La Victoria
7
7
77.14
51.29
Ejemplo 13.
La empresa de investigacin de mercados ABC realiza un estudio para
evaluar el tiempo que pasan conectados a Internet, por mes, adultos y jvenes de los
niveles socioeconmicos A y B. En un estudio preliminar, se concluy que, en promedio,
los adultos pasan ms tiempo conectados a Internet que los jvenes. Suponga que para
confirmarlo esta empresa toma una muestra de 25 adultos y otra de 21 jvenes. Las
desviaciones estndar de las cantidades de tiempo que pasan conectados a Internet son 94 y
58 minutos, respectivamente. Estos resultados favorecen la conclusin que las varianzas
de los tiempos que pasan conectados a Internet los adultos es diferente al de los
jvenes? Use alfa= 0,05. Asuma distribucin normal.
Desviacin
estndar
9.263
3.160
Solucin
Solucin
10
10
13
12
16
9
8
14
12
12
14
10
13
11
14
Unilateral
Bilateral
H 0 : 1 2
H 0 : 1 2
H 0 : 1 2
H 1 : 1 2
H 1 : 1 2
H 1 : 1 2
Usando un nivel de significacin del 5% se puede confirmar que existe una diferencia
significativa en la variabilidad del precio de la calculadora en las dos ciudades?
Solucin:
zc
z c z1
x1 x2 u1 u 2
12 22
n2
n1
z c z1
z c z1 / 2
z c z1 / 2
5. Conclusiones
11
Ejemplo 15
Se llev a cabo un estudio para comparar el tiempo que toma a los
hombres y mujeres efectuar determinada maniobra en una lnea de ensamble. Se utilizaron
muestras independientes de 50 hombres y 50 mujeres en un experimento en el cual se
tomaba a cada persona el tiempo para hacer tareas idnticas. Los resultados fueron los
siguientes:
Datos
N 2
Aqu las varianzas poblacionales, pueden ser similares o diferentes, para ello ser
necesario realizar previamente la prueba de la razn de las varianzas poblacionales. Esto
afectar al clculo del error tpico de la diferencia de medias muestrales y el grado de
libertad del estadstico de prueba.
Caso 2 y 3 Varianzas desconocidas pero iguales o diferentes, las muestras son
independientes y las poblaciones tienen distribucin normal.
Hombres1
Mujeres2
50
50
18
14
42s
38s
Presentaron estos datos la evidencia suficiente como para decir que hay una diferencia
entre los verdaderos tiempos de terminacin para hombres y mujeres? A un nivel se
significancia del 5%
Solucin
Unilateral
Bilateral
H 0 : 1 2
H 0 : 1 2
H 0 : 1 2
H 1 : 1 2
H 1 : 1 2
H 1 : 1 2
tc
x 2 u1 u 2
1
1
S
n1 n2
2
p
t n1 n 22
S p2
n1 1s12 n2 1s22
n1 n2 2
tc
x1 x2 u1 u 2 t
s12 s 22
n1 n2
Rechazar Ho si
Para realizar las pruebas de hiptesis acerca de la diferencia entre las medias de dos
poblaciones con varianzas poblacionales desconocidas y poblaciones independientes que
siguen una distribucin normal, usaremos la distribucin t.
12
s12 s 22
n1 n2
2
s12
s 22
n1 n2
n1 1 n1 1
t c t1 ,n1
t c t1 / 2,n 1
t c t1 ,n1
t c t1 / 2,n 1
5. Conclusiones.
Ejemplo 16
Ciertos observadores de medios afirman que la cantidad promedio de
minutos dedicados a las noticias de negocios y finanzas durante los noticieros de dos
canales de televisin no son similares. Para cada canal, seleccionaron de manera aleatoria
e independiente diez emisiones semanales y observaron durante la transmisin la cantidad
de minutos dedicados a la noticia de negocios y finanzas. Los tiempos medidos en estas
muestras independientes se presentan a continuacin. Asumiendo normalidad en las
poblaciones y varianzas similares en el tiempo que dedican a las noticias de negocios y
finanzas, es correcta la afirmacin de los observadores utilizando un nivel de significacin
del 5%?
Canal
8 (1)
Canal
10 (2)
3,8
2,7
4,9
3,4
3,7
4,5
4,2
2,8
3,5
4,6
3,6
4,0
4,5
5,2
4,8
4,3
5,7
3,5
3,7
5,8
H 0 : 12 22
H 1 : 12 22
2. Fijar el nivel de significacin: alfa=0.01= Error tipo I
3. Regiones crticas. F1, F2 valores crticos
Solucin
F2
1
F
2
, n2 1;n1 1
F1 F
2
, n1 1;n2 1
F0.005, 24,30
2.73
F0.005,30, 24
1
0.3484
2.87
13
4. Estadstico de la prueba
Fc
s12 212
1.2216
s 22 19 2
No Rechazo H
Solucin
1.
H 0 : 1 2
H 1 : 1 2
2. Fijar el nivel de significacin: =0.5% = 0.005 para hallar los valores crticos
3. Regiones crticas
En este caso, el valor que separa las reas de rechazo y no rechazo, una vez estudentizado
RRRR
RRRA
3.
4.
tc
tc
2
p
x 2 u1 u 2
1
1
S p2
n1 n 2
n1 1s12 n2 1s 22
n1 n2 2
149 135 0
1
1
19.9137
25 31
19.9137
2.6154
x 2 u1 u 2
1
1
S p2
n1 n 2
2.6699 S p2 19.9137 2
1
1
0.0733
n1 n 2
P( x1 x2 14.2924)
14.2924 0
P t 54
Pt 54 0.802 78.69%
19.9137 0.0723
No rechazo H0
5.
14
Sera
2
x
y2 z1 z1
1 0 2
2
10 02
152tiempos
Este resultado implica 152 mediciones para el procedimiento antiguo, y 152 para el
nuevo.
En este caso el experimento deber repetirse.
Ejercicio 18
Un vendedor de jugo de naranja natural compra paquetes de 100 naranjas
de dos tipos y tiene la sospecha que la cantidad promedio de jugo extrado de la naranja
tipo 1 es mayor al del tipo 2. Al seleccionar al azar 10 paquetes de cada tipo de naranja y
anotar la cantidad de jugo extrado (en litros) obtuvo los siguientes resultados:
Tipo 1
Tipo 2
20,3
23,5
22,5
26,5
23,3
28,6
29,1
21,5
26,5
26,4
22,1
27,9
20,8
26,5
28,6
25,5
23,3
26,7
Ejemplo 19
El Gerente de Ventas de la compaa M&E desea analizar 2 tcnicas de
ventas A y B, para ello seleccion al azar 2 muestras aleatorias independientes de 31 y 41
vendedores que aplicaron las 2 tcnicas, obteniendo como resultado ventas promedio de 37
y 35 mil soles y varianzas de 21 y 9 (mil soles)2 respectivamente. Al nivel de significacin
del 5%.
a. Se puede inferir que la variabilidad de las ventas para las 2 tcnicas son diferentes?
b. Se puede inferir que el valor de las ventas promedio aplicando las tcnicas A y B no
son similares?
21,5
28,9
Adems se sabe que el vendedor compra mensualmente paquetes del tipo 1 y 2. Utilice un
nivel de significacin del 5% para corroborar su afirmacin.
Solucin
Solucin
15
Ejemplo 20
El centro de exmenes del Touring Automvil Club del Per sostiene que
el puntaje promedio obtenido por los hombres al rendir el examen escrito para obtener la
licencia de conducir es mayor al puntaje promedio de las damas al rendir el mismo examen.
Para probar esta hiptesis la institucin tom dos muestras de postulantes que rindieron el
examen la ltima semana, obtenindose los siguientes resultados:
Hombres
Tamao de muestra
Promedio
Desviacin estndar
41
25,45
1,3
Mujeres
46
17,68
1,2
Unilateral
Bilateral
H 0 : 1 2
H 0 : 1 2
H 0 : 1 2
H 1 : 1 2
H 1 : 1 2
H 1 : 1 2
zc
z c z1
x1 x2 u1 u 2
z c z1
s12 s 22
n1 n2
z c z1 / 2
z c z1 / 2
5. Conclusiones
16
Ejemplo 21
La publicidad del gimnasio Gym Center asegura que al trmino del curso
de 6 meses que ofrece se obtendr una efectiva prdida de peso corporal. Una muestra
aleatoria de 8 registros seleccionados al azar de este gimnasio permiti observar el peso
corporal (en Kilos) entre los meses de febrero a julio de 8 participantes que asistieron al
curso. Los resultados se muestran a continuacin:
Participante
Febrero
2011
Julio 2011
Solucin
Bilateral
H 0 : 1 2
H 0 : 1 2
H 0 : 1 2
H 1 : 1 2
H 1 : 1 2
H 1 : 1 2
tc
d ud
sd
n
t c t1 ,n1
t c t1 ,n1
2
103
3
63
4
73
5
95
6
74
7
83
8
77
69
93
66
71
88
68
77
74
Unilateral
1
70
t c t1 / 2,n 1
t c t1 / 2,n 1
5. Conclusiones
17
Ejemplo 22
Doce individuos participaron en un experimento para estudiar la
efectividad de cierta campaa publicitaria, registrndose la informacin de sus consumos
realizados (en soles) antes y despus de observar por televisin la publicidad de dicho
producto. Los datos que se presentan a continuacin:
Sujetos
10
11
12
Antes (1)
201
231
221
260
228
237
326
235
240
267
284
201
Despus (2)
200
236
216
233
224
216
296
195
207
247
210
209
Unilateral
Bilateral
H 0 : p1 p 2
H 0 : p1 p 2
H 0 : p1 p 2
H 1 : p1 p 2
H 1 : p1 p 2
H 1 : p1 p 2
Solucin
2. Fijar el nivel de significacin y hallar los valores crticos
3. Regiones crticas
p1 p 2 p1 p 2
zc
1
1
p(1 p)
n1 n2
p1
# de xitos en la muestra 1
n1
z c z1
z c z1
n p n 2 p 2 x1 x 2
p 1 1
n1 n2
n1 n2
p2
# de xitos en la muestra 2
n2
z c z1 / 2
z c z1 / 2
5. Conclusiones
Ejemplo 23
En una encuesta realizada el ao pasado se determin que 20% de 505
hombres y 25% de 426 mujeres encuestados, estaban a favor de prohibir la venta libre de
cerveza, vinos y licores en el pas. Con un nivel de significacin del 5%, considera usted
que las mujeres favorecen ms a la prohibicin?
Solucin
18
Ejemplo 25
Se tiene la siguiente informacin muestral resultante de una encuesta
realizada a alumnos de dos universidades:
Universidad A
Universidad B
Yahoo
95
65
19