Anda di halaman 1dari 7

PRUEBA DE HIPOTESIS DE LA DIFERENCIA DE MEDIAS USANDO

MUESTRAS INDEPENDIENTES DE LA DISTRIBUCIÓN NORMAL.

Autor: Ing. Felipe Salinas Velázquez

Materia: Estadística Inferencial

Suposiciones para comparar dos poblaciones (Muestras independientes).

a).- X1, X2,…, Xn es una m.a. de una población cuyo modelo probabilístico es N
(𝜇𝑋 ,𝜎 2 ).

b).- Y1, Y2,…, Ym es una m.a de una población cuyo modelo probabilístico es M
(𝜇𝑌,𝜎2 )

c).- La m.a. X1, X2,…Xn y Y1, Y2,…, Ym son independientes. Es decir las
respuestas en la primera muestra no están relacionadas con las de la segunda.

Paso 1.- Planteamiento del juego de hipótesis.

a).- 𝐻0 : 𝛿=𝛿0 b).- 𝐻0 : 𝛿 ≤ 𝛿0 c ).- 𝐻0 : 𝛿 ≥ 𝛿0

𝐻𝑎: 𝛿 ≠ 𝛿0 𝐻𝑎: 𝛿 > 𝛿0 𝐻𝑎: 𝛿 < 𝛿0 dónde:

𝛿 =𝜇𝑥−𝜇𝑌

𝛿0 Es un número cualquiera propuesta a ser verificada o que se pone a prueba.

Paso 2: Identifique el nivel de significancia (𝛼) y defínalo.

𝛼 = Es la probabilidad de rechazar la 𝐻0 , siendo verdadera.

Paso 3: Elegir el estadístico de prueba adecuado y obtenga su valor tabular.

𝑍𝛼 Si es bilateral. 𝑍𝛼 Si es unilateral izquierdo o derecho si se busca su


2
valor en la tabla dela distribución normal estándar.

𝑇∝ (n+m-2) Si es bilateral T ∝ (n+m-2) Si es unilateral izquierdo o derecho


2

Paso 4: Grafique señalando la región de rechazo para la 𝐻0 .

Paso 5 Determine los cálculos estadísticos necesarios utilizando los datos


muestrales.
( 𝑥̅ − 𝑦̅ )−𝛿0
𝑍𝐶 = en muchos casos 𝑍𝐶 no se utiliza ya que no es razonable
2 2
√𝜎𝑥 + 𝜎𝑦
𝑛 𝑚

suponer que la 𝜎 2 combinada es conocida por lo que es necesario estimarla, de


hecho si 𝑆𝑥2 y 𝑆𝑦2 son las varianzas muestrales de cada una de las muestras
entonces:

E(𝑠𝑋2 )= 𝜎̂ 2 y E(𝑠𝑌2 )= 𝜎̂ 2

pero el estimador de 𝜎 2 combinada es:

(𝑛−1)𝑆𝑥2 +( 𝑚−1 )𝑆𝑦2 𝑆𝐶2 𝑆𝑦2


𝑆𝑐2 = 𝑠𝑥̅ − 𝑦̅ = √ +
𝑛+𝑚−2 𝑛 𝑚

este error estándar de la diferencia de medias está basado en la suposición de


que las varianzas son iguales, y las desviaciones estándares individuales son: por
lo tanto:
𝑺𝒙 𝑺𝒚
𝑺𝒙̅ = 𝑺𝒚̅ = y el estadístico de prueba sería:
√𝒏 √𝒎

(𝑥̅ − 𝑦̅ )−𝛿0
Tc = 2 2
√𝑆𝑐 + 𝑆𝑐
𝑛 𝑚

siempre que 𝛿=𝛿0 𝛿 = 𝜇𝑥− 𝜇𝑦 y 𝛿0 es un número arbitrario escogido por


investigador o por el conocedor del problema.

Las estadísticas necesarias a calcular:

(𝒏−𝟏)𝑺𝟐
1 1 𝒙+(𝒎−𝟏)𝑺𝟐
𝑋̅ =𝑛 ∑𝑛𝑖 𝑋𝑖 ∑𝑛𝑖−1(𝑋𝑖− 𝑋̅ )2 𝒚
𝑆𝑥2 = 𝑛−1 𝑺𝟐𝒄 = 𝒏+𝒎−𝟐

1 1
𝑌̅= 𝑚 ∑𝑚
𝑖=1 𝑌𝑖 𝑆𝑦2 = 𝑚−1 ∑𝑚
𝑖=1(𝑌𝑖− 𝑌̅ )
2

Paso 6. Establecer las reglas de decisión para rechazar la 𝐻𝑜


∝ ∝
a).- Rechazo 𝐻0 si 𝑡𝐶 ≥ t (n+m-2) ó −𝑡𝑐 ≤ -t (n+m-2)
2 2

Rechazo 𝐻0 si 𝑍𝑐 ≥ 𝑍∝ ó −𝑍𝑐 ≤ - 𝑍∝
2 2

b).- Rechazo 𝐻0 𝑡𝐶 ≥ t ∝ (n+m-2)


Rechazo 𝐻0 si 𝑍𝑐 ≥ 𝑍∝

c).- Rechazo 𝐻0 𝑡𝑐 ≤ - t ∝(n+m-2)

Rechazo 𝐻0 𝑍𝑐 ≤ - 𝑍∝

Paso 7 La conclusión.

PROBLEMA 1 RESUELTO

En un experimento con plantas de soya se compararon dos tratamientos


consistentes en proporcionar el riego de auxilio cuando se tenían diferentes
niveles de humedad aprovechable en el suelo. Cada unidad experimental es una
superficie rectangular de 7x4 metros, en los que se sembró la misma variedad de
soya, el rendimiento es la respuesta que se comparó de dos muestras aleatorias
independientes. Las respuestas observadas son:

Tratamiento 1 Respuestas en kilogramos por


hectárea.

1735 2002 1820 2082 1894


(10% de humedad aprovechable) 𝑋𝑖 ) 1816 2008 1758 1898 2223
2873 2313
Tratamiento 2

(40% de humedad aprovechable) 𝑌𝑖 3403 3294 2899 3350 3212


2964 3098 2984 2492

Pruebe la hipótesis utilizando un ∝=5%

a).- Defina la variable aleatoria de interés según el contexto.

X= Rendimiento en kilogramos de soya por hectárea en el tratamiento 1

Y=Rendimiento en kilogramos de soya por hectárea en el tratamiento 2

b).- Identifique el parámetro de estudio en el problema y defínalo.

𝜇𝑥 El rendimiento promedio en kilogramos de soya por hectárea en el tratamiento


1

𝜇𝑦 El rendimiento promedio en kilogramos de soya por hectárea en el tratamiento


2
𝝁𝒙 - 𝝁𝒚 La diferencia entre el rendimiento promedio en kilogramos de soya en
los dos tratamientos de humedad 1 y 2

c).- Desarrolle la prueba de hipótesis bajo el procedimiento propuesto en clases.

PRIMER PASO: Planteamiento del juego de hipótesis.

𝐻0 : 𝛿=0 No existe diferencia entre el rendimiento promedio de soya en


kilogramos tanto en el tratamiento 1 y 2.

𝐻𝑎 : 𝛿 ≠ 0 existe diferencia entre el rendimiento promedio de soya en


kilogramos tanto en el tratamiento 1 y 2.

Es equivalente :

𝐻0 : 𝜇𝑥 = 𝜇𝑦

𝐻𝑎 : 𝜇𝑥 ≠ 𝜇𝑦

SEGUNDO PASO: Elegir el nivel de significancia y definirlo de acuerdo al juego de


hipótesis.

∝ = 0.05 Es la probabilidad de rechazar que no existe diferencia entre el


rendimiento promedio de soya en kilogramos tanto en el tratamiento 1 y 2, cuando
que sí la hay.

TERCER PASO: Identificar el estadístico de prueba adecuado de acuerdo al


contexto, y obtener su valor tabular.
∝ 0.05
T 2 (n+m-2) T (19) = 2.0930
2

CUARTO PASO: Graficar señalando la región o regiones de rechazo para la


𝐻0 según corresponda el caso.

QUINTO PASO. Determinar los estadísticos de prueba necesarios con los datos
muestrales.

(𝑥̅ − 𝑦̅ )−𝛿0
Tc = 𝛿0 =0
2 2
√𝑆𝑐 + 𝑆𝑐
𝑛 𝑚
𝑋̅=2035.2 𝑌̅= 3077.3 𝑆𝑥2 = 101678.5 𝑆𝑦2 =80235.8 n=12 m=9

(𝒏−𝟏)𝑺𝟐
𝟐 𝒙+(𝒎−𝟏)𝑺𝟐
𝒚 (𝟏𝟏∗𝟏𝟎𝟏𝟔𝟕𝟖.𝟓)+(𝟖∗𝟖𝟎𝟐𝟑𝟓.𝟖)
𝑺𝒄 = = = 92650
𝒏+𝒎−𝟐 𝟏𝟗

2 𝑆𝑐2
√𝑆𝑐 + = √
2 92650
+
92650 2 2
= √7721 + 10294.4 = √18015.4 = 134.22
𝑛 𝑚 12 9

(2035.2−3077.3)−0
𝑇𝑐 = = - 7.76
134.22

Paso 6. Establecer las reglas de decisión para rechazar la 𝐻𝑜


∝ ∝
Rechazo 𝐻0 si 𝑡𝐶 ≥ t (n+m-2) cola derecha ó −𝑡𝑐 ≤ -t (n+m-2) cola
2 2
izquierda.

Paso 7 La conclusión.

Considerando la información muestral de la situación en cuestión se puede afirmar


con un error tipo 1 del 5% de que si existe diferencia entre el rendimiento
promedio de soya en kilogramos tanto en el tratamiento 1 y 2 es decir que 𝜇𝑥 - 𝜇𝑦
es diferente de cero, por el valor de 𝑋̅ < 𝑌̅ entonces podemos asegurar que es a
favor del tratamiento 2 por lo tanto (𝜇𝑦 > 𝜇𝑥 )

EJERCICIO 1.1 PARA RESOLVER:

En un programa de alfabetización para adultos se están considerando dos


métodos de enseñanza. Para considerar sus méritos relativos se toma un grupo
de 28 analfabetas, los cuales se separan en aleatoriamente en dos grupos de 14.
Cada grupo es alfabetizado con uno de los métodos y una vez completada la
instrucción se registra, para cada uno de los 28 individuos, el tiempo en segundos
que tardan en leer un párrafo con una extensión de 125 palabras. Los resultados
son:

Método A: 58, 67, 63, 61, 56, 59, 60, 64, 69, 52, 55, 64, 65, 59

Método B : 65, 52, 54, 58, 63, 59, 60, 48, 57, 63, 62, 59, 50, 47

Pruebe la hipótesis con un ∝ = 0.05

PROBLEMA 2 RESUELTO

Al comparar el gasto promedio diario de los estudiantes de dos carreras del


Instituto Tecnológico de Comitancillo es como se describe: de una muestra de 30
alumnos de I.G.E es de $ 280.00 con una desviación estándar de $14.00. Se toma
otra muestra de 40 alumnos de la carrera de ing. En agronomía y resulta que su
gasto promedio diario es de $270.00 con una desviación estándar de $10.00. No
se supone que las desviaciones estándar de los gastos medios de los estudiantes
de las dos carreras sean iguales. (Leonard J. Kazmier, 2006)

Para este caso se utilizará la distribución normal donde n=30 y m=40 El


estadístico que se empleará será Z

a).- Defina la variable aleatoria según el contexto.

X= El gasto diario de los alumnos de la carrera de I.G.E. del I.T.C.

Y= = El gasto diario de los alumnos de la carrera de Ing. En Agronomía del I.T.C.

b).- Identifique el parámetro de estudio y defínalo.

𝜇𝑥 = El gasto promedio diario de los alumnos de la carrera de I.G.E. del I.T.C.

𝜇𝑦 = El gasto promedio diario de los alumnos de la carrera de Ing. En Agronomía


del I.T.C.

𝜇𝑥 - 𝜇𝑦 = La diferencia entre el gasto promedio diario de los alumnos de la carrera


de I.G.E. y de Ing. En Agronomía del I.T.C.

c).- Realice la prueba de hipótesis, con el error tipo 1 de 5%.

PROCEDIMIENTO.

Primer paso: planteamiento del juego de hipótesis.

𝐻𝑜 : 𝜇𝑥 - 𝜇𝑦 = 0 No existe diferencia entre el gasto promedio diario de los alumnos


de la carrera de I.G.E. y de Ing. En Agronomía del I.T.C.

𝜇𝑎 : 𝜇𝑥 - 𝜇𝑦 ≠ 0 Existe diferencia entre el gasto promedio diario de los alumnos de


la carrera de I.G.E. y de Ing. En Agronomía del I.T.C.

SEGUNDO PASO: Elegir el nivel de significancia y definirlo de acuerdo al juego de


hipótesis.

TERCER PASO: Identificar el estadístico de prueba adecuado de acuerdo al


contexto, y obtener su valor tabular.

𝑍∝ = ± 1.96
2

CUARTO PASO: Graficar señalando la región o regiones de rechazo para la


𝐻0 según corresponda el caso.
QUINTO PASO. Determinar los estadísticos de prueba necesarios con los datos
de la muestra.

𝑥̅ − 𝑦̅ 𝑥̅ − 𝑦̅ 10 10
𝑍𝑐 = = = = = + 3.32
𝑆𝑥̅ − 𝑆𝑦
̅ 2 √2.362 + 1.582 3.01
√𝑆𝑥2̅ + 𝑆𝑌
̅

𝑋̅ = $280.00 𝑌̅ = $270.00 𝑆𝑥 = $14.00 𝑆𝑦 = $10.00 n=30 m=40

𝑆𝑥 𝑆𝑦
𝑆𝑥̅ = = 2.56 𝑆𝑦̅ = = 1.58 𝑆𝑋2̅ = (2.56)2 𝑠𝑦2̅ = (1.58)2
√𝑛 𝑚

PASO 6. Establecer las reglas de decisión para rechazar la 𝐻𝑜

Rechazo 𝐻0 si 𝑍𝑐 ≥ 𝑍∝ para cola derecha ó −𝑍𝑐 ≤ - 𝑍∝ para cola


2 2
izquierda

Paso 7 La conclusión.

Los datos del experimento muestran evidencia significativa con un 5% de que


existe diferencia entre el gasto promedio diario de los alumnos de la carrera de
I.G.E. y de Ing. En Agronomía del I.T.C.

EJERCICIO 2 PARA RESOLVER

Suponga que se comparan los ingresos familiares de dos agencias municipales:


San Dionisio del Mar y huamúchil pertenecientes a la ciudad de Juchitán, Oaxaca
esto es con el propósito de construir un centro Comercial en cualquiera de las dos
agencias, pero es determinante decidir en donde el ingreso familiar es más
impactante, para lograr lo anterior un grupo de inversionistas deciden llevar a cabo
el estudio, y deciden tomar una muestra de n=30 familias en San Dionisio del Mar,
el ingreso anual promedio es de 𝑋̅ = $45,500.00 con una desviación estándar
muestral de $1,800.00. En la segunda comunidad se tomó una muestra de m= 40
familias y el ingreso anual promedio es de 𝑌̅ = $44,600.00 con una desviación
estándar de $ 2400.00. Pruebe la hipótesis con un nivel de significancia del 5%.

Anda mungkin juga menyukai