Anda di halaman 1dari 38

UNIVERSIDAD NACIONAL DE INGENIERIA

CLASE 09:INTERVALOS DE CONFIANZA – PRUEBA DE


HIPOTESISIS PARA DOS POBLACIONES

Material de Clases © G:P.P 27/12/2017


Diferencia entre muestras independientes y dependientes

 Dos muestras son independientes o dependientes entre sí, en


función de si las observaciones de las muestras se han obtenido
de los mismos individuos u objetos o no.

 Si ambas muestras se obtienen de distintos individuos,


máquinas, empresas, objetos, etc…no hay nada en común en
dichas muestras lo que hace que ambas sean “independientes”.

 Sin embargo, si las observaciones o valores de ambas muestras


se obtienen de los mismos individuos, empresas, agentes, etc.,
diremos que hay algo en común en dichas muestras por lo que
serán muestras “dependientes” o (relacionadas)

Material de Clases © G:P.P 27/12/2017


Material de Clases © G:P.P 27/12/2017
Material de Clases © G:P.P 27/12/2017
Material de Clases © G:P.P 27/12/2017
Prueba de Hipótesis e I.C. para la diferencia de medias 𝜇1 − 𝜇2

a) Caso de varianzas σ12 y σ22 , conocidas (poco frecuente)


Si 𝑥ҧ1 y 𝑥ҧ2 son las medias de las muestras aleatorias independientes de tamaño
𝑛1 𝑦 𝑛2 con varianzas conocidas 𝜎12 𝑦 𝜎22 , respectivamente y la distribución
muestral de las diferencias de las medias 𝑥ҧ1 − 𝑥ҧ2 está dado por el estadístico
de prueba Z .

𝑥1ҧ − 𝑥ҧ2 − (𝜇1 − 𝜇2 )


𝑍=
𝜎12 𝜎12
+
𝑛1 𝑛2

Entonces el intervalo de confianza para 1 − 𝛼 % para 𝜇1 − 𝜇2 es:

𝜎12 𝜎12
𝑥1ҧ −𝑥ҧ2 ± 𝑍𝛼/2 +
𝑛1 𝑛2
Material de Clases © G:P.P 27/12/2017
Prueba de Hipótesis e I.C. para la diferencia de medias 𝜇1 − 𝜇2
b) Desconociendo σ21 y σ22 pero asumiendo σ21 = σ22

Material de Clases © G:P.P 27/12/2017


Prueba de Hipótesis e I.C. para la diferencia de medias 𝜇1 − 𝜇2
c) Desconociendo σ21 y σ22 pero asumiendo σ21 ≠ σ22

Material de Clases © G:P.P 27/12/2017


Prueba de Hipótesis e I.C. para la diferencia de medias 𝜇1 − 𝜇2

Sin embargo en la práctica no tiene mucho sentido pensar que se


conocen las varianzas.

Primero para probar la igualdad de varianzas, realizamos la prueba


de Levene (F) sobre la homogeneidad e igualdad de varianzas.

Ho: σ21 = σ22


H1: σ21 ≠ σ22

Si p= Sig < α entonces rechazamos H0


Si p= Sig ≥ α, entonces, no rechazamos H0, luego podemos
suponer que las varianzas son iguales

Material de Clases © G:P.P 27/12/2017


Ejemplo 1: El jefe de compras de una fábrica está considerando la posibilidad de
comprar un nuevo tipo de fresadora. Ha determinado comprar la nueva máquina
si confirma que las piezas producidas con ella tienen una mayor resistencia a la
rotura que las de la máquina antigua. La desviación estándar de la resistencia a la
rotura para la máquina antigua es 25 Kg y para la nueva 20 Kg. Una muestra de
100 piezas tomada de la máquina antigua arrojó una resistencia media de 65 Kg.
en tanto que una muestra similar de la nueva maquina señaló una resistencia
media de 75 Kg. ¿Con  = 0,01, el jefe de compras debe adquirir la nueva
máquina?.

Solución .- De los datos del problema tenemos:

1=Nueva n1=100 𝑥ҧ1 = 75 𝜎1 = 20


2=Antigua n2=100 𝑥ҧ2 =65 𝜎2 = 25

Las hipótesis a plantear son:


H0: No comprar la nueva máquina H0 : 1 = 2
H1: Comprar la nueva máquina H1 : 1 > 2

10
Nivel de significación:  = 0,01
Estadística de Prueba
𝑥ҧ1 − 𝑥ҧ2 − (𝜇1 − 𝜇2 )
𝑍=
𝜎12 𝜎12
+
𝑛1 𝑛2

75  65
zc   3,12
2 2
20 25

100 100
Hallar el intervalo de confianza al 99%
Valor crítico: 𝜎12 𝜎12
z1- = 2,33 𝑥ҧ1 −𝑥ҧ2 ± 𝑍𝛼/2 +
𝑛1 𝑛2

Regla de Decisión:
Si zc > z1- se rechaza H0
Decisión de la Prueba: Rechazar H0
11
Ejemplo2: Los siguientes datos representan, los tiempos de duración en años, de un tipo de
pintura, con y sin aditivo de secado.
1=Con aditivo 2.1 5.3 1.4 4.6 0.9
2=Sin aditivo 1.9 0.5 2.8 3.1
a) Calcule un intervalo de confianza del 95% para la diferencias entre los tiempos de
duración promedio de la pintura con y sin aditivo

1º Realizar un Test para ver la normalidad.


2º Aplicar el Test de Levene para la igualdad de
varianza utilizando la distribución F de Fisher
Prueba de Hipótesis
Ho: σ21 = σ22
Entonces los grados de libertad será: 𝑛1 − 1 = 5 − 1 = 4,
H1: σ21 ≠ σ22
𝑛2 =4-1=3

1
Estadistico de prueba F / 2(v1,v 2) 
F1 / 2(v 2,v1)
s12 1.97 2
F 2   2.85
s2 1.167 2
Como 2,85 cae dentro del intervalo
1 1
entonces no se rechaza Ho y se asume F0.025( 4,3)    0.1002
que tienen igual varianza F0.975(3, 4) 9.98
Material de Clases © G:P.P 27/12/2017
Test para probar la normalidad

Ho: Los datos tienen distribución Normal (𝑝 ≥ 𝛼)


H1: Los datos NO tienen distribución Normal 𝑝<𝛼

Gráfica de probabilidad de años


Normal - 95% de IC
99
trata
con
95 sin

90 Media Desv .Est. N AD P


2.86 1.971 5 0.354 0.294
80 2.075 1.167 4 0.271 0.448
70
Porcentaje

60
50
40
30
20

10

1
-5.0 -2.5 0.0 2.5 5.0 7.5 10.0 12.5
años

Como p≥α entonces los datos tienen distribución NORMAL


Material de Clases © G:P.P 27/12/2017
a) Hallar un intervalo de confianza del 95% para las diferencias de medias

Interpretación: Como el intervalo contiene al cero, podemos concluir que existe


no existen diferencias entre las medias poblacionales de tiempo de duración de
las pinturas con y sin aditivo.
Material de Clases © G:P.P 27/12/2017
b) ¿Se puede decir la pintura con aditivo tiene mayor duración. Con un nivel de
significación de 𝛼 = 0.05?
Prueba de Hipótesis
Ho: μc= μs
H1: μc> μs

Como p=0.254>0.05 Luego no rechazamos H0


Se concluye con un nivel de significancia del 0.05 que no existe suficiente
evidencia para decir que el la duración de pintura con aditivo es mayor .

Material de Clases © G:P.P 27/12/2017


Ejemplo 03: Un fabricante de monitores prueba dos diseños de microcircuitos para
determinar si producen un flujo de corriente equivalente. El departamento de ingeniería ha
obtenido los datos siguientes
Diseño 1 𝑛1 = 16 𝑥ҧ1 = 242 𝑆12 = 10
Asumir que las dos poblaciones son
Diseño 2 n2 = 10 𝑥ҧ2 = 239 𝑆22 = 40
normales y 𝛼 = 0.05
¿Se desea determinar si existe alguna diferencia significativa en el flujo de corriente
promedio entre los dos diseños?

Prueba de Levene Entonces los grados de libertad será: 𝑣1 = 𝑛2 −1 = 10 − 1 = 9,


Ho: σ22 = σ21 𝑣2 = 𝑛1 − 1 = 16 − 1 = 15
H1: σ22 ≠ σ21
Estadistico de prueba 1
F / 2(v1,v 2) 
s22 40 F1 / 2(v 2,v1)
F 2 4
s1 10

1 1
F0.025(9,15)    0.265
F0.975(15,9) 3.77

Como 4 > 3.12 se rechaza Ho, luego se asumen


que tienen diferentes varianzas

Material de Clases © G:P.P 27/12/2017


Prueba de Hipótesis 𝑥ҧ1 −𝑥ҧ 2 − 𝜇1 −𝜇2 Diseño 1 𝑛1 = 16 𝑥ҧ1 = 242 𝑆12 = 10
Ho: μ1= μ2
𝑡=
𝑆2 2
1 + 𝑆1
Diseño 2 n2 = 10 𝑥ҧ2 = 239 𝑆22 = 40
H1:. μ1≠ μ2
𝑛1 𝑛2

242−239
𝑡= = 1.39
10 40
+
16 10

Con 𝑣 grados de libertad


2
𝑆12ൗ 𝑆22ൗ
𝑛1 + 𝑛2
𝑣= 2 2
𝑆12ൗ 𝑆22ൗ
𝑛1 𝑛2 Luego no se rechaza Ho
+ Luego la prueba no es significativa
𝑛1 − 1 𝑛2 − 1

10ൗ + 40ൗ 2
𝑣= 16 10
2 2 = 11.858
10ൗ 40ൗ
16 + 10
16 − 1 10 − 1
Este valor se redondea al próximo menor
que sería 11
Material de Clases © G:P.P 27/12/2017
Material de Clases © G:P.P 27/12/2017
Ejemplo4: En el campo de la informática, se hace un experimento en el que se miden las
velocidades de los procesadores de Intel frente a los correspondientes AMD. Los resultados
obtenidos son los tiempos en segundos en bajar de Internet un determinados programa

Intel 100 125 135 128 140 142 128 137 156 142
AMD 105 128 128 135 115 150 125 122
a) ¿Hallar el intervalo de confianza del 95% para la diferencia entre los tiempos medios de
estos dos procesadores?
b) ¿Podría decirse que el procesador Intel es mas veloz que el AMD si alfa es 5%?

Ejemplo5: Queremos estudiar la influencia que puede tener el tabaco con el peso de los niños
al nacer. Para ello se consideran dos grupos de mujeres embarazadas (unas que fuman un
paquete al día y otras que no) y se obtienen los siguientes datos sobre el peso X, de sus hijos:

Población Muestra Medias DS


Madres fumadoras n1 =35 = 3.6 S1= 0.5 kg
Madre no fumadoras n2 =27 = 3.2 S2= 0.8 kg
a) Calcular en cuanto influye el que la madre sea fumadora en el peso de su hijo, si alfa es
0.05Rpta: 0,068 Kg y los 0,731 Kg.
b) ¿Podría decirse que los hijos de las madres fumadoras tienen menos pesos que las no
fumadoras si el nivel de significación es de 10% ?
Material de Clases © G:P.P 27/12/2017
Ejemplo6: Una inspección de calidad efectuada sobre dos marcas de baterías para
linterna, reveló que una muestra aleatoria de 61 unidades de la marca A generó un
promedio de vida útil de 36,5 horas con una desviación estándar de 1,8 horas, mientras
que otra muestra aleatoria de 31 unidades de la marca B generó un promedio de 36,8
horas con una desviación estándar de 1,5 horas.
a) Con un nivel de significación del 5% se desea saber si hay diferencia significativa entre
la vida útil de ambas marcas
b) Podría decirse quela batería de la marca A dura mas que la marca B

Ejemplo7: El test de evaluación de CAPECO, informa los resultados de pruebas de


laboratorios realizados para investigar la estabilidad y permeabilidad del concreto de
asfalto. En el experimento se prepararon 4 mezclas de concreto con un contenido de 3%
de asfalto del peso total de la mezcla y 4 mezclas con un 7% de asfalto respectivamente
Las mediciones de permeabilidad registradas en pulgadas por hora fueron:
CONTENIDO DE Permeabilidad en pulgadas por hora
ASFALTO
3% x1 1189 840 1020 980
7% x 2 853 900 733 785

a) ¿Hallar el intervalo de confianza del 95% para la diferencia entre la permeabilidad


media del concreto elaborado con un contenido de 3% y 7% de asfalto?
b) Podría decirse que el 3% de asfalto es mas permeable que un 75 de asfalto?
Material de Clases © G:P.P 27/12/2017
Ejemplo08: Se realizó un experimento para comparar el tiempo promedio requerido por el
cuerpo humano para absorber dos medicamentos, A y B. Suponga que el tiempo necesario
para que cada medicamento alcance un nivel específico en el torrente sanguíneo se
distribuye normalmente. Se eligieron al azar a doce personas para ensayar cada fármaco
registrándose el tiempo en minutos que tardó en alcanzar un nivel específico en la sangre.
Calcule con 𝛼 = 0.05

Material de Clases © G:P.P 27/12/2017


Prueba de Hipótesis e I.C. para observaciones pareadas µD=µ1 - µ2

En este caso se trata de comparar dos métodos o tratamientos, pero se quiere


que las unidades experimentales donde se aplican los tratamientos sean las
mismas.
Un intervalo de confianza del 100(1-𝛼)% para la diferencia poblacional dada una
muestra de tamaño n es de la forma
Supuesto:
Sd S
d  t / 2   D  d  t / 2 d XA: antes y XB: después
n n Las diferencias deben tener una
distribución normal.
n
𝑑 = 𝑋𝐴 - 𝑋𝐵 ∼ 𝑁(µA-µB ,σ2d) .
Donde:
 d i
que no es relevante si el tamaño
Promedio de diferencias d  i 1

n de la muestra n es grande.
Prueba de Hipótesis
Sd = desviación estándar de las diferencias
𝑯𝟎 : 𝝁𝑫 = 𝝁𝑨 − 𝝁𝑩
La prueba estadística t se
d  D 𝑯𝟏 : 𝝁𝑫 ≠ 𝝁𝑨 − 𝝁𝑩
distribuye con (n-1) gl t 𝑯𝟏 : 𝝁𝑫 > 𝝁𝑨 − 𝝁𝑩
sd / n 𝑯𝟏 : 𝝁𝑫 < 𝝁𝑨 − 𝝁𝑩
Material de Clases © G:P.P 27/12/2017
Ejemplo 1: Para verificar la influencia de un cartel publicitario en las
ventas de una marca de cerveza se ha seleccionado al azar una
muestra de 7 bodegas en las que se registró el número de botellas
vendidas en la última semana antes de colocar el cartel y dos
semanas después de colocar el cartel publico
Los resultados se muestran a continuación:

a) Calcular un intervalo de confianza al 95% de confianza para la diferencia de las ventas


promedio semanales antes y después de colocar el cartel publicitario.

Material de Clases © G:P.P 27/12/2017


b) ¿Se puede decir en el nivel de significancia del 0.05 que el cartel influye en las
ventas
Ho: μsc - μcc =μD = 0 ( No tiene efecto el cartel)
H1: μsc - μcc =μD < 0 (El cartel tienen efecto en las ventas de la cerveza).

Interpretación : El valor de P es 0,006, se rechaza la hipótesis nula y se acepta la


alternativa la cual indica que el cartel tiene efecto sobre la venta de la cerveza.

Material de Clases © G:P.P 27/12/2017


Como el valor de H0 no se encuentra en el
intervalo de confianza de la diferencia de las
dos medias, se rechaza Ho y se acepta H1
indicando

Material de Clases © G:P.P 27/12/2017


Ejemplo2: Un médico desea investigar si una droga tiene el efecto de bajar la presión
sanguínea en los usuarios. El médico eligió al azar 15 pacientes mujeres y les tomó la
presión, luego les recetó la medicina por un periodo de 6 meses, y al final del mismo
nuevamente les tomó la presión. Los resultados son como siguen:

a) ¿Encuentre un intervalo de confianza del 95% para las diferencias de la reducción de


la presión sanguínea antes y después de usar la droga?
b) ¿ Se puede decir que la antes de usar la droga la presión era mayor que después de
usarla , si alfa es 0.05?

Material de Clases © G:P.P 27/12/2017


Ho: μD = 0 (La droga no tiene ningún efecto)
H1: μD >0 (La droga tiene efecto, la presión antes de usar la droga
era mayor que después de usarla).

Material de Clases © G:P.P 27/12/2017


Prueba de Hipótesis e I.C. para la diferencia de dos proporciones
poblacionales
Muchas aplicaciones involucran poblaciones de datos cualitativos que deben
compararse utilizando proporciones.
𝑝1 =Proporción poblacional
 Condiciones: n1 ≥ 30 y n2 ≥30 𝑛1 = Tamaño de la muestra
Donde para la población 1 𝑥ҧ
𝑝1ҧ = 𝑛ത1 (proporción muestral)
1
𝑞ത1 = 1 − 𝑝1ҧ

Intervalo de confianza de dos poblaciones

Prueba Estadística para dos poblaciones


( p1  p2 )  ( p1  p2 )
x1  x2 Z
donde, p es estimado por p  pq pq

n1  n2
n1 n2
Material de Clases © G:P.P 27/12/2017
Ejemplo1: Un médico de una zona minera, ha sugerido que un ataque cardíaco es menos
probable que ocurra en hombres que practican alguna clase de deporte. Se elige una
muestra al azar de 300 hombres, de los cuales 100 practican alguna clase de deporte y de
ellos sólo 10 han sufrido un ataque cardíaco. De los 200 que no practican deportes, 25 han
sufrido ataques cardíacos.
a) Hallar un intervalo de confianza del 95% para la diferencia de las dos proporciones
Practican deporte No practican deporte Interpretación: Como el
𝑛1 = 100 𝑛1 = 200 intervalo contiene al cero,
podemos concluir que no
𝑥1 = 10 𝑥1 = 25
existen diferencias entre las
𝑥 10 𝑥2 25
𝑝1ҧ = 𝑛1 = 100 = 0.10 𝑝ҧ2 = = 200 = 0.125 proporciones poblacionales
1 2
de los hombres que han
𝑝1ҧ 𝑞ത1 𝑝ҧ2 𝑞ത2 tendido ataque cardiaco con
𝑝1ҧ − 𝑝ҧ2 ± 𝑍𝛼/2 + los que practican deporte o
𝑛1 𝑛2
no.
(0.1)(0.9) (0.125)(0.875)
0.1−0.125 ± 1.96 +
100 200

−0.09955 ≤ 𝑝1 − 𝑝2 ≤ 0.049553

Material de Clases © G:P.P 27/12/2017


Material de Clases © G:P.P 27/12/2017
b) Probar si los resultados de las muestras apoyan lo sugerido por el médico. Si alfa es 0,05
1) Ho: p1 = p2 (las probabilidades de sufrir ataque cardíaco son iguales para ambos grupos)
Ha: p1 < p2 (la probabilidad de sufrir ataque cardíaco es menor en hombres deportistas).

2) Establecer el nivel de significación 0,05


3) Elección de la prueba estadística
( p1  p2 )  ( p1  p2 ) x1  x2 10  25
Z  p   0.1167
pq

pq n1  n2 100  200
n1 n2

(0.10  0.125)  (0  0)
Z  0.6357
(0.1167)(0.8833) (0.1167)(0.8833)

100 200

4) Calcular puntos críticos


5) Como -0,6281<-1,645
6) No rechazamos Ho

Material de Clases © G:P.P 27/12/2017


Interpretación: Como p=0.262>0.05 se concluye que no hay evidencia
suficiente para afirmar que la probabilidad de sufrir un ataque cardiaco entre
los hombres deportistas es menor que de la de los hombres que no practican
deporte.
El intervalo de confianza contiene el cero, lo cual es otra razón para no
rechazar la hipótesis nula.
Material de Clases © G:P.P 27/12/2017
Ejemplo3: Un profesor de Estadística desea comparar el porcentaje de aprobados de la
sección “A” contra el porcentaje de aprobados de la sección “B”. En la sección “A” se tomó
una muestra de 26 estudiantes, de los cuales 16 habían aprobado, de la sección “B” una
muestra de 28 estudiantes reveló 25 aprobados. Utilice un 99% de confiabilidad para
comprobar si el porcentaje de aprobados de la sección “B” es superior al de la sección “A”.

Ejemplo.4: Una semana antes de las elecciones municipales para Lima Metropolitana, dos
compañías encuestadoras publican los resultados las encuestas por encargo, realizadas de
forma independiente.
• Encuestadora Apoyo: para un n = 1800, los votos al partido ZYX =42 %.
• Encuestadora Datum: para un n = 6800, votos al partido ZYX = 36 %.
¿Estos resultados dispares, se puede atribuir al tamaño de la muestra respectiva?.
Razone su respuesta.

Material de Clases © G:P.P 27/12/2017


Prueba de Hipótesis e I.C. para el Cociente de varianzas

Suponga que tenemos dos poblaciones independientes, la población 1 sigue una


distribución𝑁 𝜇1 , 𝜎12 y sobre la población 2 sigue una distribución 𝑁 𝜇2 , 𝜎22 . Se
toma una m.a. de cada población de tamaños n1 y n2 respectivamente.
El intervalo de confianza, con nivel de confianza (1 − α)%, para el cociente de
varianzas que sigue una distribución F de Fisher con n1 − 1 y n2 − 1 grados de
libertad, es
: 𝑠12 𝜎12 𝑠12
< <
𝑆22 𝐹1−𝛼/2 𝜎22 𝑆22 𝐹𝛼/2

Nota: Si el I.C. contiene el valor uno se concluye que las varianzas son iguales, en caso
contrario se dice que son diferentes.

𝑆12
൘ 2
El estadístico de prueba es 𝜎1 𝑆12
𝐹= 2 = 2
𝑆2 𝑆2
൘ 2
𝜎2

Material de Clases © G:P.P 27/12/2017


𝑠12 𝜎12 𝑠12
< <
𝑆22 𝐹1−𝛼/2 𝜎22 𝑆22 𝐹𝛼/2

50 𝜎12 50
< 2<
24(1,94) 𝜎2 24(0,530)
𝜎12
1,074 < < 3,932
𝜎22

Material de Clases © G:P.P 27/12/2017


Con un nivel de confianza del 90% se
𝜎12
sabe que la relación de varianzas ൗ𝜎2
2
Esta entre 1.07 y 3.93, es decir que la
varianza de la población 1 es mayor que
a la población 2 entre 1.07 y 3.93

Material de Clases © G:P.P 27/12/2017


b) Podría afirmar que la variabilidad de método 1 es mayor que el método 2, con 𝛼 = 0.10
1) Ho: 𝜎12 = 𝜎22 (la variabilidad del tiempo de ensamblaje en ambos métodos es lo mismo.
Ha: 𝜎12 > 𝜎22 (la variabilidad del tiempo de ensamblaje en método 1 es mayor que el
método 2)
2) Establecer el nivel de significación 0,10
3) Elección de la prueba estadística
Gráfica de distribución
F, df1=30, df2=24
𝑆12 50 1.2
𝐹= = = 2.083
𝑆12 24
1.0

0.8

4) Calcular puntos críticos

Densidad
2.083>1.672 0.6

5) Luego rechazamos Ho
0.4
6) Interpretación: la variabilidad
de los tiempos en método 1 es 0.2

mayor que el método 2 0.1


0.0
0 1.672
X

Material de Clases © G:P.P 27/12/2017


Como 𝑝 = 0.034 < 𝛼 = 0.10
Entonces se rechaza Ho y se acepta
H1

Material de Clases © G:P.P 27/12/2017

Anda mungkin juga menyukai