Anda di halaman 1dari 30

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

FACULTAD DE CIENCIAS ECONOMICAS

ESTIMACIONES Y PRUEBAS DE HIPOTESIS

Dra. SARA ADELINA ARANA LOPEZ

LIMA, 2018

1
INTRODUCCION

Inferencia estadística es un conjunto de métodos de la ciencia estadística, que


permite inducir, a partir de la información empírica proporcionada por una
muestra, sobre el comportamiento de una determinada población con un error
medible en términos de probabilidad, es decir, Inferencia Estadística es el
procedimiento que permite realizar afirmaciones de naturaleza probabilística
respecto a una población, en base a resultados obtenidos de una muestra
seleccionada de forma aleatoria de una población.

Las poblaciones son descritas por medidas numéricas descriptivas, llamados


parámetros, se puede hacer inferencias acerca de la población haciendo
inferencia respecto a sus parámetros.
La inferencia estadística se pueden dividir, básicamente, en: métodos de
estimación de parámetros y métodos de contraste de hipótesis. Ambos
métodos se basan en el conocimiento teórico de la distribución de probabilidad
del estadístico muestral que se utiliza como estimador de un parámetro.

La estimación de parámetros consiste en asignar un valor concreto al


parámetro o parámetros que caracterizan la distribución de probabilidad de la
población. Cuando se estima un parámetro poblacional, aunque el estimador
que se utiliza posea todas las propiedades deseables, se comete un error de
estimación que es la diferencia entre la estimación y el verdadero valor del
parámetro. El error de estimación es desconocido por lo cual es imposible
saber en cada caso cual ha sido la magnitud o el signo del error; para valorar el
grado de precisión asociado con una estimación puntual se parte de dicha
estimación para construir un intervalo de confianza. En síntesis, un intervalo de
confianza está formado por un conjunto de valores numéricos tal que la
probabilidad de que éste contenga al verdadero valor del parámetro puede
fijarse tan grande como se quiera. Esta probabilidad se denomina grado de
confianza del intervalo, y la amplitud de éste constituye una medida del grado
de precisión con el que se estima el parámetro.

2
Los métodos de contraste de hipótesis tienen como objetivo comprobar si
determinado supuesto referido a un parámetro poblacional, o a parámetros
análogos de dos o más poblaciones, es compatible con la evidencia empírica
contenida en la muestra. Los supuestos que se establecen respecto a los
parámetros se llaman hipótesis paramétricas. Para cualquier hipótesis
paramétrica, el contraste se basa en establecer un criterio de decisión, que
depende en cada caso de la naturaleza de la población, de la distribución de
probabilidad del estimador de dicho parámetro y del control que se desea fijar a
priori sobre la probabilidad de rechazar la hipótesis contrastada en el caso de
ser ésta cierta.
En todo contraste intervienen dos hipótesis. La hipótesis nula (Ho) es aquella
que recoge el supuesto de que el parámetro toma un valor determinado y es la
que soporta la carga de la prueba. La decisión de rechazar la hipótesis nula,
que en principio se considera cierta, está en función de que sea o no
compatible con la evidencia empírica contenida en la muestra. El contraste
clásico permite controlar a priori la probabilidad de cometer el error de rechazar
la hipótesis nula siendo ésta cierta; dicha probabilidad se llama nivel de
significación del contraste ( ) y suele fijarse en el 1%, 5% o 10%.
La proposición contraria a la hipótesis nula recibe el nombre de hipótesis
alternativa (H1) y suele presentar un cierto grado de indefinición: si la hipótesis
alternativa se formula simplemente como 'la hipótesis nula no es cierta', el
contraste es bilateral o a dos colas; por el contrario cuando se indica el sentido
de la diferencia, el contraste es unilateral o a una sola cola.
Cuando se realiza un contraste con el SPSS no se fija el nivel de significación
deseado, el programa calcula el valor-p o significación asintótica, que es la
probabilidad de que el estadístico de prueba tome un valor igual o superior al
muestral bajo el supuesto de que la hipótesis nula es cierta. Por tanto, si el
valor-p es menor o igual que el nivel de significación deseado se rechazará Ho.
Un valor-p próximo a cero indica que se rechazará la Ho para cualquier nivel de
significación.

3
Cada acción de un proceso estadístico está asociado a un Nivel de confianza
(probabilidad de haber acertado al decir que el parámetro está contenido en el
intervalo), y a un Nivel de significancia (probabilidad de equivocarnos: es un
error).

La estadística inferencial permite analizar información en base a datos


históricos y actuales, para realizar estimaciones, proyecciones a futuro para
tomar decisiones con mayor precisión, en todo proceso de investigación, y/o
administración.

INFERENCIA

ESTIMACIONES ERRORES

HIPOTESIS
PUNTUALES POR INTERVALOS
DE CONFIANZA

PARA LA PARA LA
MEDIA PROPORCION

4
INDICE

1. Introducción

2. Definiciones

3. Estimaciones

3.1. Estimaciones Puntuales

3.2. Estimaciones por Intervalos

3.2.1. Estimaciones para la Media (para una y dos poblaciones)

3.2.1.1. Para la Media con Varianza Conocida

3.2.1.2. Para la Media con Varianza Desconocida

3.2.2. Estimaciones para la Proporción

3.2.3. Estimaciones para la Varianza

4. Pruebas De Hipótesis

4.1. Hipótesis

4.2. Clases de Hipótesis

4.3. Pruebas de Hipótesis

4.4. Clases de pruebas de hipótesis

4.5. Tipos de pruebas de hipótesis

5. Errores

5
3. ESTIMACION

ESTIMACION:

Estimación es usar medidas calculadas en una muestra (estimador) para


predecir uno o más parámetros de la población

ESTIMADOR:

Un estimador es expresado en términos de una fórmula matemática obtenida


de la estimación como una función de las medidas muestrales (estadísticos o
estadígrafos)

Propiedades

a. Insesgado:

Sea ˆ un estimador puntual de un parámetro  . Entonces ˆ es un


estimador Insesgado de  :

si : E ˆ  
de lo contrario se dice que es sesgado, un estimador Insesgado es aquel cuya
media o valor esperado de la distribución de las de las estimaciones es igual al
parámetro estimado.
Es decir:
Al aumentar el tamaño de la muestra, su media tiende a coincidir con el
parámetro θ, y por lo tanto, su sesgo tiende a cero.
lim E ˆ  
Esto es:
n 

Dados dos ó más estimadores insesgados de un parámetro , seleccionamos


el estimador con la menor varianza, permaneciendo constante todo lo demás.

6
Ahora, en lugar de utilizar el sesgo y la varianza para describir la bondad de un

estimador puntual, se puede emplear el valor esperado de


Es decir:
Si el estimador no es Insesgado, entonces la diferencia:

E ˆ   

Es conocida como sesgo del estimador ˆ .

b. Consistente
Se utiliza cuando no es posible utilizar estimador de mínima varianza, ya que a
medida que crece el tamaño de la muestra las estimaciones que nos
proporciona el estimador se aproximan cada vez más al valor del parámetro θ .
Si el estimador es Insesgado o asintóticamente Insesgado (carece de sesgo),
para que sea consistente es suficiente que, cuando el tamaño de la muestra
tiende a infinito (es decir, se hace muy grande), la varianza del estimador se
aproxime a cero. Esto es,

lim Var    0
n

c. Eficiente
La eficiencia de un estimador está vinculada a su varianza muestral. Así, para

un mismo parámetro Ө, se dice que el estimador ˆ1 es más eficiente que el

estimador ˆ2 si se cumple:

Var ˆ1   Var ˆ2 

Si un estadístico es más eficiente que otro, significa que varía menos de unas
muestras a otras. La media es un estimador del parámetro µ es más eficiente
que la mediana. Del mismo modo, la varianza Sn-12 es un estimador de σ2 más
eficiente que Sn2. (demostración para el alumno)

7
Conclusión:

Considerando todos los estimadores insegados de un parámetro  , el que


tiene varianza mínima se llama estimador eficiente de  , llamado también
estimador de varianza mínima

d. Suficiencia:

Un estimador es suficiente cuando en su cálculo se emplea toda la información


de la muestra.
Por ejemplo, al calcular el estimador X del correspondiente parámetro
poblacional, utilizamos la fórmula:

x
i 1
i

X 
n

Para el cálculo se tienen en cuenta todas las puntuaciones Xi. también ocurre
con los estimadores Sn-12 y Sn2 de la varianza. Todos ellos pueden ser
considerados estimadores suficientes de los respectivos parámetros.

La estimación de un parámetro se puede realizar de dos maneras:

ESTIMACION

PUNTUAL POR INTERVALOS


DE CONFIANZA

8
4.2. Estimación Puntual

La estimación puntual se refiere a la elección de un estadístico, es decir un


número calculado a partir de los datos muestrales, respecto al cual tenemos
alguna esperanza o seguridad de que esté “razonablemente cerca” del
parámetro (población) que se ha de estimar.

También se dice que es la obtención de un punto, para ello se usan las


medidas de la muestra para calcular un único valor numérico, que es la
estimación del parámetro poblacional.
La estimación puntual de un parámetro desconocido  de la población consiste
en elegir una función de la muestra Y  G  X 1 , X 2 , X 3 , ... , X N  cuyo valor de

Y  G x1 , x2 , x3 , ... , x N  , puede tomarse como el valor de  con cierta


probabilidad

PARAMETRO ESTIMADOR INSESGADO ESTIMACION

Media
X SI x

Varianza
 
S 2 s2 SI s 
2

2

Desviación típica
S s   NO s

Proporción p̂ SI p̂
P

9
4.3. ESTIMACIÓN: POR INTERVALOS DE CONFIANZA

La estimación confidencial nos permite determinar un posible rango de valores


o intervalos. Es decir asociar a cada muestra un intervalo. No siempre los
resultados pueden ser los esperados

Es decir, estimar por intervalos es obtener dos valores estadísticos que definen
el intervalo (un límite inferior y un límite superior) con un grado específico de
confianza incluye al parámetro a estimar. La probabilidad de que una
estimación por intervalo incluya al parámetro se denomina nivel de confianza.

4.4. ESTIMACIÓN POR INTERVALOS DE CONFIANZA:

Para una población y dos poblaciones

a. para la media (con varianza conocida y con varianza desconocida)


b. para la proporción
c. para la varianza

Procedimiento para obtener un intervalo de confianza

a. Establecer una muestra aleatoria

b. Establecer un nivel de confianza o un determinado nivel de significancia

Nivel de Nivel de Total

confianza: Y significancia: 
0.99. 0.01 1.00
0.975 0.025 1.00
0.95 0.05 1.00
0.90 0.10 1.00
0.80 0.20 1.00

10
c.Determinar el estadístico de la distribución muestral

Estadístico de la Definición Intervalo


muestra
 Z0  Z 0
Con varianza IC (  ) : X  Z  X    X
1 n n n
conocida 2
Media s
Con varianza IC (  ) : X  Z  * X 
Z0 S
   X 
Z 0S
1 n
desconocida 2 n n
n > 30
s
Con varianza IC (  ) : X  t 2 * X 
t0 S
   X 
t 0S
n  1 , 1 n
desconocida n n
n < 30
P * (1  P P * (1  P) P * (1  P)
Proporción IC ( ) : p  Z 
PZ
1

n
   PZ
1

n
1 n 2 2
2

c. Calcular los valores del intervalo


Z0  Z 0
1     2
X    X
n n

d. Construir el intervalo

e. Interpretación

11
4.4.1. Intervalos de confianza para la media con varianza
conocida

Ejemplo:

La Facultad de Educación de cierta universidad desea estimar la calificación


media de los expedientes de los alumnos, se conoce por otros cursos que la
desviación estándar de las puntuaciones en la facultad es 2.01 puntos y la
media de la muestra es 4.9. Si se eligen una muestra 25 alumnos en la
Facultad
Hallar el intervalo de confianza para el 90%.

Solución
f. Muestra: n = 25 alumnos
g. Nivel de confianza : 90%
h. Estadístico de la muestra: es Z, se conoce la varianza.
i. Calculo de los valores del intervalo (puntos críticos)

IC (  ) : X  Z 
1 n
2

 4.9  0.66  4.24 , 5.56


2.01
IC (  ) : 4.9  1.64
25

j. Construcción del intervalo

k. Interpretación: el intervalo de confianza para la estimación media


de las calificaciones es 4.24 , 5.56 puntos

12
4.4.2.Intervalos de confianza para la media con varianza

desconocida

a. Para n > 30

El `presidente de una institución deportiva está interesado en conocer el


promedio de Km recorridos por los participantes de una maratón
realizada el año anterior, para establecer nuevas marcas y mejores
tiempos en la maratón a realizarse por el aniversario de dicha institución,
y así establecer nuevos record. Para ello, selecciona una muestra de
100 maratonistas y obtiene una desviación estándar S= 3.5 Km. y una
media muestral de 20 Km.. Determinar el intervalo de confianza al 95%.

l. Muestra: n = 100 maratonistas


m. Nivel de confianza : 95%
n. Estadístico de la muestra: es Z, no se conoce la varianza. (pero n
> 30).
o. Calculo de los valores del intervalo (puntos críticos)
s
IC (  ) : X  Z  *
1 n
2
3.5
IC (  ) : 20  1.96 *  20  0.56  (19.44, 20.56)
100

p. Construcción del intervalo

q. Interpretación: el intervalo de confianza para promedio de Km


recorridos por los participantes de una maratón es (19.44. 20.56)
km

Ejemplo(n=120,150) y 90% , 99%

13
b. Para n < 30

Se ha obtenido una muestra de 15 vendedores de una Empresa Editora para


estimar el valor medio de las ventas por trabajador en la Empresa. La media y
varianza de la muestra (en miles de soles) son 5 y 2, respectivamente.
Determinar el Intervalo de confianza para la venta media por trabajador en la
Editorial al 90 %.

1. Muestra: n = 15 alumnos
2. Nivel de confianza : 90%
3. Estadístico de la muestra: es t, no se conoce la varianza
4. La media y la varianza se han obtenido de la muestra (media = 5 y la
varianza = 2, desviación estándar =1.464.)
5. Calculo de los valores del intervalo (puntos críticos

s
IC (  ) : X  t 2 *
n 1,1 n
1.464
IC (  ) : 5  1.761*  5  0.666  (4.334, 5.666)
15

r. Construcción del intervalo de confianza

s. Interpretación: el Intervalo de confianza para la venta media por


trabajador es (4.334, 5.666) ventas, al 90% de confiabilidad

14
ERRORES DE ESTIMACION DE LA MEDIA

Poblaciones Grandes (N) Poblaciones Pequeñas (n)

 S
EZ  * Et  *
1 n 1 n
2 2

4.4.3.Intervalos de confianza para la proporción

p * (1  p)
IC ( ) : p  Z 
PZ
1

p * (1  p)
n
   PZ
1

p * (1  p)
n
1 n 2 2
2

Ejemplo

Se ha obtenido una muestra al azar de 150 vendedores de una empresa de


cemento para estimar la proporción de vendedores que no alcanza un límite de
ventas mínimo establecido por la gerencia de logística. De entre los
seleccionados, 50 no han conseguido llegar al límite de ventas mínimo
establecido. Hallar el Intervalo de confianza para la proporción de trabajadores
en la empresa que no alcanza el límite al 80 %.

1. Muestra: n = 150 vendedores


2. Nivel de confianza : 80%
3. Estadístico de la muestra: es Z.
4. Calculo de los valores del intervalo (puntos críticos)

P * (1  P
IC ( ) : p  Z 
1 n
2

0.333* (1  0.333
IC ( ) : 0.333  1.28  (0.28, 0.38)
150

5. Construcción del intervalo

15
6. Interpretación : el intervalo de confianza para los trabajadores que
no alcanzan el límite de las ventas es (0.28, 0.38)

4.5. PRUEBA DE HIPÓTESIS:

Otra manera de hacer inferencia es haciendo una afirmación acerca del valor
que el parámetro de la población bajo estudio puede tomar. Esta afirmación
puede estar basada en alguna creencia o experiencia pasada que será
contrastada con la evidencia que nosotros obtengamos a través de la
información contenida en la muestra. Esto es a lo que llamamos Prueba de
Hipótesis

HIPOTESIS:

Es una proposición, afirmación, verdad anticipada, una aseveración a cerca de


una población o más poblaciones.
A los investigadores les interesa dos tipos de hipótesis:

Hipótesis de Investigación

Es la conjetura o suposición que motiva la investigación, puede ser el resultado


de años de observación por parte del investigador. Conducen directamente a
las hipótesis estadísticas.

Hipótesis Estadística
Se establecen para ser evaluadas por medio de técnicas estadísticas
adecuadas. Estas son las hipótesis objeto de estudio.

TIPOS DE HIPOTESIS

A. Hipótesis Nula: Ho

Es la hipótesis que se quiere probar (se formula con la finalidad de ser


rechazada). Se rechaza cuando los resultados de los datos muestrales
así lo demuestran. ( puede tener los signos =, mayor =, menor =).

16
H 0 :    0 , H 0 :    0 , H 0 :   0

B. Hipótesis Alternativa: H1

Hipótesis que se acepta si la Ho se rechaza.

H1 :  0 , H 0 :   0 , H 0 :   0
PRUEBA DE HIPÓTESIS

Es una regla que cuando los valores experimentales son observados nos
conduce a una decisión, No rechazar “Aceptar”, Rechaza, bajo consideración

CLASES DE PRUEBAS DE HIPOTESIS

1. PRUEBA UNILATERAL O DE UNA COLA

1.1. Prueba de la cola inferior o del lado izquierdo


1.2. Prueba de la cola superior o del lado derecho

2. HIPOTESIS BILATERAL O DE DOS COLAS

HIPÓTESIS UNILATERAL O DE UNA COLA

a. Prueba de la cola inferior o del b. Prueba de la cola superior o


lado izquierdo del lado derecho

región de región de
región región aceptación rechazo
de de
1 
1  


Hipótesis Nula: H o :   0 Hipótesis Nula: H o :   0


Hipótesis Alternativa: H1 :   0
Hipótesis Alternativa: H1 :  0

17
HIPOTESIS BILATERAL O DE DOS COLAS

región de aceptación

región de
región de rechazo
rechazo
1 
 /2  /2

1 2

Hipótesis Nula: H 0 :   0
Hipótesis Alternativa: H1 :    0

PROCEDIMIENTO PARA LA PRUEBA DE HIPOTESIS

1. Formular las hipótesis

H 0 :   0 , H 0 :   0 , H 0 :   0
H1 :   0 , H 0 :   0 , H 0 :   0
2. Definir un nivel de confianza

Nivel de significancia:  0.01 0. 025 0.05 0.10 0.20

Nota:

Si la hipótesis es bilateral, el nivel de significancia debe ser dividido en dos, ya


que la región de aceptación se ubicara entre dos puntos críticos, es decir en un
intervalo (un límite inferior y un límite superior), en cuyos extremos hacia atrás

18
de cada punto podemos ubicar a la región de rechazo, solo para este caso se
contara con dos regiones de rechazo.

3. Determinar la estadística de prueba


La estadística de prueba, se elige dependiendo de lo que se solicita, es
decir se debe leer correctamente el texto que describe las características
del problema objeto de investigación, para luego elegir la estadística
correcta. Normal. T, …

4. Establecerla región critica


Para la construcción o delimitación de la región critica o región de rechazo
se debe tener en cuenta:
a. El tipo de hipótesis que se ha formulado, ya sea esta, unilateral o bilateral,
la hipótesis que indica que zona es de rechazo es la hipótesis alternativa.
b. El nivel de significancia

5. Calculo de estadística de prueba


Se reemplaza los valores del problema y se obtiene un valor,
denominado estadística calculada

6. Decisión

Para tomar la decisión correcta se debe:

a. Si la prueba de hipótesis se ha efectuado sin usar un paquete estadístico,


el valora del estadístico de prueba se debe comparar con un valor
obtenido de una tabla estadística, considerando para la obtención de esta
valor el nivel de significancia y el tamaño de la muestra.
Se aceptara la hipótesis si está el valor del estadístico de prueba se
encuentra en la zona de aceptación, con un determinado nivel de
significancia
b. Si la prueba se ha efectuado haciendo uso de un paquete estadístico, el
valor del p – valor (nivel de significancia en el sistema) se compara con el
nivel de significancia establecido en el ítems 2, si el valor de mayor que el
nivel de significancia la hipótesis nula se rechaza.

7. Conclusión

Responder al problema formulado, con un determinado nivel de


significancia o de confiabilidad.

4.6. PRUEBA DE HIPÓTESIS: PARA LA MEDIA, PARA


PROPORCIÓN

A.PARA UNA POBLACIÓN

4.6.1. PRUEBA DE HIPÓTESIS PARA LA MEDIA CUANDO LA


VARIANZA ES CONOCIDA

19
Una caja de 300cm3de leche evaporada se diseña para que contenga una
cantidad ligeramente mayor que 300cm3, de tal manera que si excede este
volumen hay problemas. Sin embargo, un volumen menor a 300cm3ocasiona
que los consumidores demanden al fabricante. En el proceso normal de
producción, el fabricante supone que la media es igual o mayor
a300cm3Suponiendoquese prueba una muestra de 45 cajas y se encuentra un
volumen promedio de 290cm3.Sepuedeafirmarqueel fabricante está en lo
correcto, si se sabe que la desviación estándar de las cajas de leche de 6 cm3,
con un nivel de significancia de 0.01

Solución

El problema corresponde a la distribución de la media con n > 30.


  300 cm3 X  290cm3  6  0.01 n  49

1. Formular la hipótesis
Ho :   300 cm 3
H 1 :   300 cm 3

2. Nivel de Significancia
  0.01
3. Estadística de Prueba
Como n > 30 y la varianza es conocida, la estadística de prueba de la
variable aleatoria es la distribución normal estándar N (0,1)

X  290  300 10


Z  Z     5.833
/ n 12 / 49 12 / 7

4. Región Critica

5. Decisión
Si Z calc  Z tabl  Ho se acepta 
 5.833   2.326  Ho no se acepta

Por lo tanto, Ho se rechaza

6. Conclusión

20
.Se puede afirmar que el fabricante no está en lo correcto, el contenido de
las cajas no es 300cm3 , con un nivel de significancia de 0.01

4.6.2. PRUEBA DE HIPÓTESIS PARA LA MEDIA CUANDO LA


VARIANZA NO ES CONOCIDA

Una empresa que regula el consumo eléctrico de cierta localidad, publica los
resultados del consumo anual en número de Kilowatt-hora que gastan varios
aparatos electrodomésticos. Se afirma que una aspiradora gasta un promedio
de 46 kilowatt-hora al año. Si una muestra aleatoria de 12 hogares que se
incluye en un estudio indica que las aspiradoras gastan un promedio de 42
kilowatt-hora al año con una desviación estándar de 11.9 kilowatt-hora.
¿Se puede concluir que las aspiradoras gastan anualmente, en promedio,
menos de 46 kilowatt-hora con un nivel de significancia de 0.05? Suponga que
la población de kilowatt-hora es normal.

Solución:

  46 Kilowatt  hora X  42 Kilowatt  hora  11.9 Kilowatt  hora


 0.05 n  12
1. Formular la hipótesis
Ho :    46 kilowatt  hora
H 1 :   46 kilowatt  hora

2. Nivel de Significancia
  0.05

3. Estadística de Prueba

Como n < 30 y la varianza es conocida, la estadística de prueba de la


variable aleatoria es la distribución normal estándar N (0,1)

X  42  46 4
t Z     1.164
S/ n 11.9 / 12 11.9 / 3.464

4. Región Critica

21
5. Decisión
Si t calc  ttabl  Ho se acepta 
 1.164   1.796  Ho se acepta

Por lo tanto la Ho no se rechaza

6. Conclusión
Se concluye que las aspiradoras gastan anualmente, en promedio, menos
de 46 kilowatt-hora con un nivel de significancia de 0.05

4.6.3. PRUEBA DE HIPÓTESIS PARA PROPORCION

Un ingeniero civil afirma que se instalan termas eléctricas en 70% de todas las
casas que se construyen hoy actualmente en la ciudad. ¿Estaría de acuerdo
con esta afirmación si una investigación de casas nuevas en esta ciudad
muestra que 8 de 15 tienen instaladas termas eléctricas? Con un nivel de
significancia de 0.10.

Solución.

P  0.70 p  8 / 15  0.5333 (1  P)  0.4667  0.10 n  15

1. Formular la hipótesis
Ho : P  0.70
H 1 : P  0.70

2. Nivel de Significancia
  0.10

3. Estadística de Prueba

Como n < 30 y la varianza es conocida, la estadística de prueba de la


variable aleatoria es la distribución normal estándar N (0,1)

22
pP 0.533  0.70  0.167
t Z     1.415
P (1  P) 0.70 (0.30) 0.118
n 15

4. Región Critica

5. Decisión
Si t calc  ttabl  Ho se acepta 
 1.164   1.796  Ho se acepta

Por lo tanto lo Ho no se rechaza

6. Conclusión
Se concluye que las aspiradoras gastananualmente, en promedio, menos
de 46 kilowatt-hora con un nivel de significancia de 0.05

4.6. Prueba de hipótesis: para la media, para proporción, para la


varianza (relativas para una población, y dos poblaciones)

B.PARA DOS POBLACIONES (diferencia entre las media y


proporciones)

HIPÓTESIS UNILATERAL O DE UNA COLA

c. Prueba de la cola inferior o d. Prueba de la cola superior o del


del lado izquierdo lado derecho

región de región de
aceptación rechazo
región región
de de
1 
1  


 23
Hipótesis Nula: Hipótesis Nula:
H o : 1   2   0 H o : 1   2   0

Hipótesis Alternativa:
Hipótesis Alternativa: H1 : 1   2   0
H 1 : 1   2   0

HIPOTESIS BILATERAL O DE DOS COLAS

Región de aceptación

Región de
Región de Rechazo
rechazo
1 
 /2  /2

1 2

Hipótesis Nula:

Hipótesis Alternativa:

Procedimiento:
Es el mismo procedimiento que en primer caso: solo se tiene en cuenta al
formular las hipótesis, que en este caso es para la diferencia de dos promedios,
como se muestra en la tabla anterior.

4.6.4. PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS



CUANDO LAS VARIANZAS  12 , ,  22 SON CONOCIDAS 
Un grupo de investigadores desea saber si los datos que han recolectado
muestran evidencia suficiente para indicar una diferencia entre las
concentraciones medias de ácidoúrico en el suero de individuos normales e
individuos con síndrome de Down. Los daros recogidos corresponden a las
lecturas de ácidoúrico en el suero de 12 individuos con síndrome de Down y 15
individuos sanos. Las medias de las muestras son 4.5mg/100ml y 3.4
mg/100ml, si las varianzas ara la población con síndrome de Down es 1 y para
la población sana es 1.5. Con 5% de confiabilidad.

SOLUCION:

24
1. Formular la hipótesis
Ho : 1   2  0
H 1 : 1   2  0

2. Nivel de Significancia
  
  0.05   , 
2 2

3. Estadística de Prueba

( X 1  X 2 )  ( 1  1 ) (4.5  3.4 )  0
Z calc   Z calc   2.57
 12  22 1 1.5


n1 n2 121 15 2

4. Región Critica

5. Decisión
Si Z tabl  Z calc  Z tabl  Ho se acepta 
(1.96)  2.57 no es  (1.96)  Ho no se acepta

Por lo tanto la Ho se rechaza

6. Conclusión
Se concluye que los datos recogidos, no muestran evidencia suficiente para
explicar diferencia entre las concentraciones medias de ácido úrico en el suero
de individuos normales e individuos con síndrome de Down, con un nivel de
significancia de 0.05

4.6.5. PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS



CUANDO LAS VARIANZAS  12 , ,  22 NO SON CONOCIDAS 

A. CUANDO LAS VARIANZAS  12   22 SON IGUALES 

25
Un grupo de especialistas de la salud, tiene como objetivo examinar las
características de la destrucción pulmonar, en personas que fuman cigarrillos
antes de desarrollar un marcado Enfisema pulmonar. En personas longevas se
practicaron mediciones de tres índices de destrucción pulmonar, en personas
que no fumaban, y en personas con tabaquismo que mueren repentinamente
fuera de un nosocomio y por causas no respiratorias. Según el estudio una
calificación alta indica un mayor daño pulmonar. Se obtuvieron muestras con
las calificaciones producidas, para uno de los índices de destrucción pulmonar
de una muestra de 9 personas que no fuman y 16 fumadores. Los especialistas
pretenden saber si es posible concluir, en base a los datos, que las personas
que si fuman, en general, tienen los pulmones más dañados que las personas
no fumadoras, como se indica en la siguiente tabla. No se conoce las varianza
de las muestras, pero se supone son iguales)

No fumadores 18.1 6 10.8 11.0 7.7 17.9 8.5 13.0 18.9

Fumadores 16.6 13.9 11.3 26.5 17.4 15.3 15.8 12.3 18.6

12.0 24.1 16.5 21.8 16.3 23.4 18.8

SOLUCION:

1. Formular la hipótesis
Ho :  NF   F  0
H 1 :  NF   F  0

2. Nivel de Significancia
  0.05 

3. Estadística de Prueba

X S  17.5 S  4.4711, X S  12.4 S  4.8492

combinar las var ianzas de las muestras para obtener

15(4.4711) 2  8(4.8492) 2
S p2  21.2165
15  8
(17.51  12.4 )  0
t calc   t calc  2.6573
21.2165 21.2165

16 9

4. Región Critica

26
5. Decisión
tcalc  ttabl  Ho se acepta 
2.6573 no es  (1.71)  Ho no se acepta

Por lo tanto Ho se rechaza

6. Conclusión

De los resultados se concluye que las dos medias poblacionales son


diferentes, las personas que fuman tienen los pulmones más dañados que las
personas que no fuman. Con un nove de significancia de 0.05

 
B. CUANDO LAS VARIANZAS  12   22 NO SON IGUALES

En una empresa que fabrica sustancias químicas, evalúanla calidad del


producto por la cantidad de impurezas presentes en un lote. Para la fabricación
utilizan dos líneas de producción 1,2 como cantidad promedio de impurezas en
la sustancia química. Se tomaron muestras aleatorias de cada línea y se
obtuvo las siguientes mediciones.

Línea n Promedio Varianza


1 16 3.2 1.04
2 16 3.0 0.51

¿Los datos aportan evidencia suficiente para concluir que la cantidad promedio
de impurezas del proceso es menor para la línea 2?. Con un nivel de
significancia igual a 0.05

Solución:

7. Formular la hipótesis
Ho : 1   2
H1 : 1   2

8. Nivel de Significancia
  0.05

27
9. Estadística de Prueba

( X 1  X 2 )  ( 1  1 ) (3.21  3.0 )  0
t calc   t calc   0.6426
S12 S 22 1.04 0.51


n1 n2 16 16

10. Región Critica

11. Decisión
Si tcalc  ttabl  Ho se acepta 
 1.164   1.7  Ho se acepta

Por lo tanto la Ho no se rechaza

12. Conclusión
Se concluye que las aspiradoras gastananualmente, en promedio, menos
de 46 kilowatt-hora con un nivel de significancia de 0.05

4.6.6. PRUEBA DE HIPÓTESIS PARA POBLACIONES QUE NO


PRESENTAN UNA DISTRIBUCION NORMAL

En este caso se aplica el teorema del Limite Central, si el tamaño de la muestra


(n>30). “La distribución de la diferencia entre medias de las muestras será
aproximadamente normal”. Las muestras son independientes.

4.6.7. PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS


PORPORCIONES
Un estudio de estudios nutricionales en acilos de ancianos, encontraron que
entre 55 pacientes con hipertensión, 24 tenían una dieta con restricción de

28
sodio. De 149 pacientes sin hipertensión, 36 tenían una dieta sin sodio. ¿Es
posible concluir que las poblaciones muestreadas, la proporción de pacientes
con dieta restringida en sodio es mayor entre pacientes con hipertensión que
entre pacientes sin hipertensión?

Solución.

1. Formular la hipótesis
Ho : P    0
H1 : P    0

2. Nivel de Significancia
  0 .0 .5

3. Estadística de Prueba

Como n > 30, la estadística de prueba de la variable aleatoria es la


distribución normal estándar N (0,1)

( p 1  p2 )  ( P1  P2 ) X1  X 2
Z  P 
1 1 n1  n2
Pˆ (1  Pˆ ) 
n1 n2

(0.43641  0.2416)
Z  2.71
0.2941(0.7059) 0.2941(0.7059)

55 149

4. Región Critica

Región rechazo Región de


rechazo aceptación de
aceptación

1 

5. Decisión

29
Si Z calc  Z tabl  Ho se acepta 
2.71   1.64  Ho se acepta

Por lo tanto lo Ho no se rechaza

6. Conclusión

La proporción de pacientes con dieta restringida en sodio es mayor entre


pacientes hipertensos que entre los pacientes sin hipertensión

4.7. ERRORES

Ho verdadera Ho falsa

Rechazar Ho Error tipo I Decisión correcta


P(error tipo I )  

No rechazar Ho Decisión correcta Error tipo II


P(error tipo II )  

La Probabilidad de cometer un error Tipo I:se conoce como Nivel de


Significancia, se denota como α y es el tamaño de la región de rechazo

El complemento de la región de rechazo es 1−α y es conocido como el


Coeficiente de Confianza

En una prueba de Hipótesis de dos colas la región que no se rechaza


corresponde a un intervalo de confianza para el parámetro enestudio

30

Anda mungkin juga menyukai