Estimaciones y Pruebas de Hipotesis

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS
FACULTAD DE CIENCIAS ECONOMICAS
ESTIMACIONES Y PRUEBAS DE HIPOTESIS
Dra. SARA ADELINA ARANA LOPEZ
LIMA, 2018
1
INTRODUCCION
Inferencia estadística es un conjunto de métodos de la ciencia estadística, que

permite inducir, a partir de la información empírica proporcionada por una
muestra, sobre el comportamiento de una determinada población con un error
medible en términos de probabilidad, es decir, Inferencia Estadística es el
procedimiento que permite realizar afirmaciones de naturaleza probabilística
respecto a una población, en base a resultados obtenidos de una muestra
seleccionada de forma aleatoria de una población.
Las poblaciones son descritas por medidas numéricas descriptivas, llamados

parámetros, se puede hacer inferencias acerca de la población haciendo
inferencia respecto a sus parámetros.
La inferencia estadística se pueden dividir, básicamente, en: métodos de
estimación de parámetros y métodos de contraste de hipótesis. Ambos
métodos se basan en el conocimiento teórico de la distribución de probabilidad
del estadístico muestral que se utiliza como estimador de un parámetro.
La estimación de parámetros consiste en asignar un valor concreto al

parámetro o parámetros que caracterizan la distribución de probabilidad de la
población. Cuando se estima un parámetro poblacional, aunque el estimador
que se utiliza posea todas las propiedades deseables, se comete un error de
estimación que es la diferencia entre la estimación y el verdadero valor del
parámetro. El error de estimación es desconocido por lo cual es imposible
saber en cada caso cual ha sido la magnitud o el signo del error; para valorar el
grado de precisión asociado con una estimación puntual se parte de dicha
estimación para construir un intervalo de confianza. En síntesis, un intervalo de
confianza está formado por un conjunto de valores numéricos tal que la
probabilidad de que éste contenga al verdadero valor del parámetro puede
fijarse tan grande como se quiera. Esta probabilidad se denomina grado de
confianza del intervalo, y la amplitud de éste constituye una medida del grado
de precisión con el que se estima el parámetro.
2
Los métodos de contraste de hipótesis tienen como objetivo comprobar si
determinado supuesto referido a un parámetro poblacional, o a parámetros
análogos de dos o más poblaciones, es compatible con la evidencia empírica
contenida en la muestra. Los supuestos que se establecen respecto a los
parámetros se llaman hipótesis paramétricas. Para cualquier hipótesis
paramétrica, el contraste se basa en establecer un criterio de decisión, que
depende en cada caso de la naturaleza de la población, de la distribución de
probabilidad del estimador de dicho parámetro y del control que se desea fijar a
priori sobre la probabilidad de rechazar la hipótesis contrastada en el caso de
ser ésta cierta.
En todo contraste intervienen dos hipótesis. La hipótesis nula (Ho) es aquella
que recoge el supuesto de que el parámetro toma un valor determinado y es la
que soporta la carga de la prueba. La decisión de rechazar la hipótesis nula,
que en principio se considera cierta, está en función de que sea o no
compatible con la evidencia empírica contenida en la muestra. El contraste
clásico permite controlar a priori la probabilidad de cometer el error de rechazar
la hipótesis nula siendo ésta cierta; dicha probabilidad se llama nivel de
significación del contraste ( ) y suele fijarse en el 1%, 5% o 10%.
La proposición contraria a la hipótesis nula recibe el nombre de hipótesis
alternativa (H1) y suele presentar un cierto grado de indefinición: si la hipótesis
alternativa se formula simplemente como 'la hipótesis nula no es cierta', el
contraste es bilateral o a dos colas; por el contrario cuando se indica el sentido
de la diferencia, el contraste es unilateral o a una sola cola.
Cuando se realiza un contraste con el SPSS no se fija el nivel de significación
deseado, el programa calcula el valor-p o significación asintótica, que es la
probabilidad de que el estadístico de prueba tome un valor igual o superior al
muestral bajo el supuesto de que la hipótesis nula es cierta. Por tanto, si el
valor-p es menor o igual que el nivel de significación deseado se rechazará Ho.
Un valor-p próximo a cero indica que se rechazará la Ho para cualquier nivel de
significación.
3
Cada acción de un proceso estadístico está asociado a un Nivel de confianza
(probabilidad de haber acertado al decir que el parámetro está contenido en el
intervalo), y a un Nivel de significancia (probabilidad de equivocarnos: es un
error).
La estadística inferencial permite analizar información en base a datos

históricos y actuales, para realizar estimaciones, proyecciones a futuro para
tomar decisiones con mayor precisión, en todo proceso de investigación, y/o
administración.
INFERENCIA
ESTIMACIONES ERRORES
HIPOTESIS
PUNTUALES POR INTERVALOS
DE CONFIANZA
PARA LA PARA LA
MEDIA PROPORCION
4
INDICE
1. Introducción
2. Definiciones
3. Estimaciones
3.1. Estimaciones Puntuales
3.2. Estimaciones por Intervalos
3.2.1. Estimaciones para la Media (para una y dos poblaciones)
3.2.1.1. Para la Media con Varianza Conocida
3.2.1.2. Para la Media con Varianza Desconocida
3.2.2. Estimaciones para la Proporción
3.2.3. Estimaciones para la Varianza
4. Pruebas De Hipótesis
4.1. Hipótesis
4.2. Clases de Hipótesis
4.3. Pruebas de Hipótesis
4.4. Clases de pruebas de hipótesis
4.5. Tipos de pruebas de hipótesis
5. Errores
5
3. ESTIMACION
ESTIMACION:
Estimación es usar medidas calculadas en una muestra (estimador) para

predecir uno o más parámetros de la población
ESTIMADOR:
Un estimador es expresado en términos de una fórmula matemática obtenida

de la estimación como una función de las medidas muestrales (estadísticos o
estadígrafos)
Propiedades
a. Insesgado:
Sea ˆ un estimador puntual de un parámetro  . Entonces ˆ es un

estimador Insesgado de  :
si : E ˆ  
de lo contrario se dice que es sesgado, un estimador Insesgado es aquel cuya
media o valor esperado de la distribución de las de las estimaciones es igual al
parámetro estimado.
Es decir:
Al aumentar el tamaño de la muestra, su media tiende a coincidir con el
parámetro θ, y por lo tanto, su sesgo tiende a cero.
lim E ˆ  
Esto es:
n 
Dados dos ó más estimadores insesgados de un parámetro , seleccionamos

el estimador con la menor varianza, permaneciendo constante todo lo demás.
6
Ahora, en lugar de utilizar el sesgo y la varianza para describir la bondad de un
estimador puntual, se puede emplear el valor esperado de

Es decir:
Si el estimador no es Insesgado, entonces la diferencia:
E ˆ   
Es conocida como sesgo del estimador ˆ .
b. Consistente
Se utiliza cuando no es posible utilizar estimador de mínima varianza, ya que a
medida que crece el tamaño de la muestra las estimaciones que nos
proporciona el estimador se aproximan cada vez más al valor del parámetro θ .
Si el estimador es Insesgado o asintóticamente Insesgado (carece de sesgo),
para que sea consistente es suficiente que, cuando el tamaño de la muestra
tiende a infinito (es decir, se hace muy grande), la varianza del estimador se
aproxime a cero. Esto es,
lim Var    0
n
c. Eficiente
La eficiencia de un estimador está vinculada a su varianza muestral. Así, para
un mismo parámetro Ө, se dice que el estimador ˆ1 es más eficiente que el
estimador ˆ2 si se cumple:
Var ˆ1   Var ˆ2 
Si un estadístico es más eficiente que otro, significa que varía menos de unas
muestras a otras. La media es un estimador del parámetro µ es más eficiente
que la mediana. Del mismo modo, la varianza Sn-12 es un estimador de σ2 más
eficiente que Sn2. (demostración para el alumno)
7
Conclusión:
Considerando todos los estimadores insegados de un parámetro  , el que

tiene varianza mínima se llama estimador eficiente de  , llamado también
estimador de varianza mínima
d. Suficiencia:
Un estimador es suficiente cuando en su cálculo se emplea toda la información

de la muestra.
Por ejemplo, al calcular el estimador X del correspondiente parámetro
poblacional, utilizamos la fórmula:
x
i 1
i
X 
n
Para el cálculo se tienen en cuenta todas las puntuaciones Xi. también ocurre
con los estimadores Sn-12 y Sn2 de la varianza. Todos ellos pueden ser
considerados estimadores suficientes de los respectivos parámetros.
La estimación de un parámetro se puede realizar de dos maneras:
ESTIMACION
PUNTUAL POR INTERVALOS

DE CONFIANZA
8
4.2. Estimación Puntual
La estimación puntual se refiere a la elección de un estadístico, es decir un

número calculado a partir de los datos muestrales, respecto al cual tenemos
alguna esperanza o seguridad de que esté “razonablemente cerca” del
parámetro (población) que se ha de estimar.
También se dice que es la obtención de un punto, para ello se usan las

medidas de la muestra para calcular un único valor numérico, que es la
estimación del parámetro poblacional.
La estimación puntual de un parámetro desconocido  de la población consiste
en elegir una función de la muestra Y  G  X 1 , X 2 , X 3 , ... , X N  cuyo valor de
Y  G x1 , x2 , x3 , ... , x N  , puede tomarse como el valor de  con cierta

probabilidad
PARAMETRO ESTIMADOR INSESGADO ESTIMACION
Media
X SI x

Varianza
 
S 2 s2 SI s 
2
2
Desviación típica
S s   NO s

Proporción p̂ SI p̂
P
9
4.3. ESTIMACIÓN: POR INTERVALOS DE CONFIANZA
La estimación confidencial nos permite determinar un posible rango de valores

o intervalos. Es decir asociar a cada muestra un intervalo. No siempre los
resultados pueden ser los esperados
Es decir, estimar por intervalos es obtener dos valores estadísticos que definen
el intervalo (un límite inferior y un límite superior) con un grado específico de
confianza incluye al parámetro a estimar. La probabilidad de que una
estimación por intervalo incluya al parámetro se denomina nivel de confianza.
4.4. ESTIMACIÓN POR INTERVALOS DE CONFIANZA:
Para una población y dos poblaciones
a. para la media (con varianza conocida y con varianza desconocida)

b. para la proporción
c. para la varianza
Procedimiento para obtener un intervalo de confianza
a. Establecer una muestra aleatoria
b. Establecer un nivel de confianza o un determinado nivel de significancia
Nivel de Nivel de Total
confianza: Y significancia: 
0.99. 0.01 1.00
0.975 0.025 1.00
0.95 0.05 1.00
0.90 0.10 1.00
0.80 0.20 1.00
10
c.Determinar el estadístico de la distribución muestral
Estadístico de la Definición Intervalo

muestra
 Z0  Z 0
Con varianza IC (  ) : X  Z  X    X
1 n n n
conocida 2
Media s
Con varianza IC (  ) : X  Z  * X 
Z0 S
   X 
Z 0S
1 n
desconocida 2 n n
n > 30
s
Con varianza IC (  ) : X  t 2 * X 
t0 S
   X 
t 0S
n  1 , 1 n
desconocida n n
n < 30
P * (1  P P * (1  P) P * (1  P)
Proporción IC ( ) : p  Z 
PZ
1

n
   PZ
1

n
1 n 2 2
2
c. Calcular los valores del intervalo

Z0  Z 0
1     2
X    X
n n
d. Construir el intervalo
e. Interpretación
11
4.4.1. Intervalos de confianza para la media con varianza
conocida
Ejemplo:
La Facultad de Educación de cierta universidad desea estimar la calificación

media de los expedientes de los alumnos, se conoce por otros cursos que la
desviación estándar de las puntuaciones en la facultad es 2.01 puntos y la
media de la muestra es 4.9. Si se eligen una muestra 25 alumnos en la
Facultad
Hallar el intervalo de confianza para el 90%.
Solución
f. Muestra: n = 25 alumnos
g. Nivel de confianza : 90%
h. Estadístico de la muestra: es Z, se conoce la varianza.
i. Calculo de los valores del intervalo (puntos críticos)

IC (  ) : X  Z 
1 n
2
 4.9  0.66  4.24 , 5.56

2.01
IC (  ) : 4.9  1.64
25
j. Construcción del intervalo
k. Interpretación: el intervalo de confianza para la estimación media

de las calificaciones es 4.24 , 5.56 puntos
12
4.4.2.Intervalos de confianza para la media con varianza
desconocida
a. Para n > 30
El `presidente de una institución deportiva está interesado en conocer el

promedio de Km recorridos por los participantes de una maratón
realizada el año anterior, para establecer nuevas marcas y mejores
tiempos en la maratón a realizarse por el aniversario de dicha institución,
y así establecer nuevos record. Para ello, selecciona una muestra de
100 maratonistas y obtiene una desviación estándar S= 3.5 Km. y una
media muestral de 20 Km.. Determinar el intervalo de confianza al 95%.
l. Muestra: n = 100 maratonistas

m. Nivel de confianza : 95%
n. Estadístico de la muestra: es Z, no se conoce la varianza. (pero n
> 30).
o. Calculo de los valores del intervalo (puntos críticos)
s
IC (  ) : X  Z  *
1 n
2
3.5
IC (  ) : 20  1.96 *  20  0.56  (19.44, 20.56)
100
p. Construcción del intervalo
q. Interpretación: el intervalo de confianza para promedio de Km

recorridos por los participantes de una maratón es (19.44. 20.56)
km
Ejemplo(n=120,150) y 90% , 99%
13
b. Para n < 30
Se ha obtenido una muestra de 15 vendedores de una Empresa Editora para

estimar el valor medio de las ventas por trabajador en la Empresa. La media y
varianza de la muestra (en miles de soles) son 5 y 2, respectivamente.
Determinar el Intervalo de confianza para la venta media por trabajador en la
Editorial al 90 %.
1. Muestra: n = 15 alumnos
2. Nivel de confianza : 90%
3. Estadístico de la muestra: es t, no se conoce la varianza
4. La media y la varianza se han obtenido de la muestra (media = 5 y la
varianza = 2, desviación estándar =1.464.)
5. Calculo de los valores del intervalo (puntos críticos
s
IC (  ) : X  t 2 *
n 1,1 n
1.464
IC (  ) : 5  1.761*  5  0.666  (4.334, 5.666)
15
r. Construcción del intervalo de confianza
s. Interpretación: el Intervalo de confianza para la venta media por

trabajador es (4.334, 5.666) ventas, al 90% de confiabilidad
14
ERRORES DE ESTIMACION DE LA MEDIA
Poblaciones Grandes (N) Poblaciones Pequeñas (n)
 S
EZ  * Et  *
1 n 1 n
2 2
4.4.3.Intervalos de confianza para la proporción
p * (1  p)
IC ( ) : p  Z 
PZ
1

p * (1  p)
n
   PZ
1

p * (1  p)
n
1 n 2 2
2
Ejemplo
Se ha obtenido una muestra al azar de 150 vendedores de una empresa de

cemento para estimar la proporción de vendedores que no alcanza un límite de
ventas mínimo establecido por la gerencia de logística. De entre los
seleccionados, 50 no han conseguido llegar al límite de ventas mínimo
establecido. Hallar el Intervalo de confianza para la proporción de trabajadores
en la empresa que no alcanza el límite al 80 %.
1. Muestra: n = 150 vendedores

2. Nivel de confianza : 80%
3. Estadístico de la muestra: es Z.
4. Calculo de los valores del intervalo (puntos críticos)
P * (1  P
IC ( ) : p  Z 
1 n
2
0.333* (1  0.333
IC ( ) : 0.333  1.28  (0.28, 0.38)
150
5. Construcción del intervalo
15
6. Interpretación : el intervalo de confianza para los trabajadores que
no alcanzan el límite de las ventas es (0.28, 0.38)
4.5. PRUEBA DE HIPÓTESIS:
Otra manera de hacer inferencia es haciendo una afirmación acerca del valor
que el parámetro de la población bajo estudio puede tomar. Esta afirmación
puede estar basada en alguna creencia o experiencia pasada que será
contrastada con la evidencia que nosotros obtengamos a través de la
información contenida en la muestra. Esto es a lo que llamamos Prueba de
Hipótesis
HIPOTESIS:
Es una proposición, afirmación, verdad anticipada, una aseveración a cerca de

una población o más poblaciones.
A los investigadores les interesa dos tipos de hipótesis:
Hipótesis de Investigación
Es la conjetura o suposición que motiva la investigación, puede ser el resultado

de años de observación por parte del investigador. Conducen directamente a
las hipótesis estadísticas.
Hipótesis Estadística
Se establecen para ser evaluadas por medio de técnicas estadísticas
adecuadas. Estas son las hipótesis objeto de estudio.
TIPOS DE HIPOTESIS
A. Hipótesis Nula: Ho
Es la hipótesis que se quiere probar (se formula con la finalidad de ser

rechazada). Se rechaza cuando los resultados de los datos muestrales
así lo demuestran. ( puede tener los signos =, mayor =, menor =).
16
H 0 :    0 , H 0 :    0 , H 0 :   0
B. Hipótesis Alternativa: H1
Hipótesis que se acepta si la Ho se rechaza.
H1 :  0 , H 0 :   0 , H 0 :   0
PRUEBA DE HIPÓTESIS
Es una regla que cuando los valores experimentales son observados nos
conduce a una decisión, No rechazar “Aceptar”, Rechaza, bajo consideración
CLASES DE PRUEBAS DE HIPOTESIS
1. PRUEBA UNILATERAL O DE UNA COLA
1.1. Prueba de la cola inferior o del lado izquierdo

1.2. Prueba de la cola superior o del lado derecho
2. HIPOTESIS BILATERAL O DE DOS COLAS
HIPÓTESIS UNILATERAL O DE UNA COLA
a. Prueba de la cola inferior o del b. Prueba de la cola superior o

lado izquierdo del lado derecho
región de región de
región región aceptación rechazo
de de
1 
1  



Hipótesis Nula: H o :   0 Hipótesis Nula: H o :   0

Hipótesis Alternativa: H1 :   0
Hipótesis Alternativa: H1 :  0
17
HIPOTESIS BILATERAL O DE DOS COLAS
región de aceptación
región de
región de rechazo
rechazo
1 
 /2  /2
1 2
Hipótesis Nula: H 0 :   0
Hipótesis Alternativa: H1 :    0
PROCEDIMIENTO PARA LA PRUEBA DE HIPOTESIS
1. Formular las hipótesis
H 0 :   0 , H 0 :   0 , H 0 :   0
H1 :   0 , H 0 :   0 , H 0 :   0
2. Definir un nivel de confianza
Nivel de significancia:  0.01 0. 025 0.05 0.10 0.20
Nota:
Si la hipótesis es bilateral, el nivel de significancia debe ser dividido en dos, ya

que la región de aceptación se ubicara entre dos puntos críticos, es decir en un
intervalo (un límite inferior y un límite superior), en cuyos extremos hacia atrás
18
de cada punto podemos ubicar a la región de rechazo, solo para este caso se
contara con dos regiones de rechazo.
3. Determinar la estadística de prueba

La estadística de prueba, se elige dependiendo de lo que se solicita, es
decir se debe leer correctamente el texto que describe las características
del problema objeto de investigación, para luego elegir la estadística
correcta. Normal. T, …
4. Establecerla región critica

Para la construcción o delimitación de la región critica o región de rechazo
se debe tener en cuenta:
a. El tipo de hipótesis que se ha formulado, ya sea esta, unilateral o bilateral,
la hipótesis que indica que zona es de rechazo es la hipótesis alternativa.
b. El nivel de significancia
5. Calculo de estadística de prueba

Se reemplaza los valores del problema y se obtiene un valor,
denominado estadística calculada
6. Decisión
Para tomar la decisión correcta se debe:
a. Si la prueba de hipótesis se ha efectuado sin usar un paquete estadístico,

el valora del estadístico de prueba se debe comparar con un valor
obtenido de una tabla estadística, considerando para la obtención de esta
valor el nivel de significancia y el tamaño de la muestra.
Se aceptara la hipótesis si está el valor del estadístico de prueba se
encuentra en la zona de aceptación, con un determinado nivel de
significancia
b. Si la prueba se ha efectuado haciendo uso de un paquete estadístico, el
valor del p – valor (nivel de significancia en el sistema) se compara con el
nivel de significancia establecido en el ítems 2, si el valor de mayor que el
nivel de significancia la hipótesis nula se rechaza.
7. Conclusión
Responder al problema formulado, con un determinado nivel de

significancia o de confiabilidad.
4.6. PRUEBA DE HIPÓTESIS: PARA LA MEDIA, PARA

PROPORCIÓN
A.PARA UNA POBLACIÓN
4.6.1. PRUEBA DE HIPÓTESIS PARA LA MEDIA CUANDO LA

VARIANZA ES CONOCIDA
19
Una caja de 300cm3de leche evaporada se diseña para que contenga una
cantidad ligeramente mayor que 300cm3, de tal manera que si excede este
volumen hay problemas. Sin embargo, un volumen menor a 300cm3ocasiona
que los consumidores demanden al fabricante. En el proceso normal de
producción, el fabricante supone que la media es igual o mayor
a300cm3Suponiendoquese prueba una muestra de 45 cajas y se encuentra un
volumen promedio de 290cm3.Sepuedeafirmarqueel fabricante está en lo
correcto, si se sabe que la desviación estándar de las cajas de leche de 6 cm3,
con un nivel de significancia de 0.01
Solución
El problema corresponde a la distribución de la media con n > 30.

  300 cm3 X  290cm3  6  0.01 n  49
1. Formular la hipótesis
Ho :   300 cm 3
H 1 :   300 cm 3
2. Nivel de Significancia
  0.01
3. Estadística de Prueba
Como n > 30 y la varianza es conocida, la estadística de prueba de la
variable aleatoria es la distribución normal estándar N (0,1)
X  290  300 10

Z  Z     5.833
/ n 12 / 49 12 / 7
4. Región Critica
5. Decisión
Si Z calc  Z tabl  Ho se acepta 
 5.833   2.326  Ho no se acepta
Por lo tanto, Ho se rechaza
6. Conclusión
20
.Se puede afirmar que el fabricante no está en lo correcto, el contenido de
las cajas no es 300cm3 , con un nivel de significancia de 0.01
4.6.2. PRUEBA DE HIPÓTESIS PARA LA MEDIA CUANDO LA

VARIANZA NO ES CONOCIDA
Una empresa que regula el consumo eléctrico de cierta localidad, publica los
resultados del consumo anual en número de Kilowatt-hora que gastan varios
aparatos electrodomésticos. Se afirma que una aspiradora gasta un promedio
de 46 kilowatt-hora al año. Si una muestra aleatoria de 12 hogares que se
incluye en un estudio indica que las aspiradoras gastan un promedio de 42
kilowatt-hora al año con una desviación estándar de 11.9 kilowatt-hora.
¿Se puede concluir que las aspiradoras gastan anualmente, en promedio,
menos de 46 kilowatt-hora con un nivel de significancia de 0.05? Suponga que
la población de kilowatt-hora es normal.
Solución:
  46 Kilowatt  hora X  42 Kilowatt  hora  11.9 Kilowatt  hora

 0.05 n  12
Ho :    46 kilowatt  hora
H 1 :   46 kilowatt  hora
  0.05
Como n < 30 y la varianza es conocida, la estadística de prueba de la

X  42  46 4
t Z     1.164
S/ n 11.9 / 12 11.9 / 3.464
4. Región Critica
21
5. Decisión
Si t calc  ttabl  Ho se acepta 
 1.164   1.796  Ho se acepta
Por lo tanto la Ho no se rechaza
6. Conclusión
Se concluye que las aspiradoras gastan anualmente, en promedio, menos
de 46 kilowatt-hora con un nivel de significancia de 0.05
4.6.3. PRUEBA DE HIPÓTESIS PARA PROPORCION
Un ingeniero civil afirma que se instalan termas eléctricas en 70% de todas las
casas que se construyen hoy actualmente en la ciudad. ¿Estaría de acuerdo
con esta afirmación si una investigación de casas nuevas en esta ciudad
muestra que 8 de 15 tienen instaladas termas eléctricas? Con un nivel de
significancia de 0.10.
Solución.
P  0.70 p  8 / 15  0.5333 (1  P)  0.4667  0.10 n  15
Ho : P  0.70
H 1 : P  0.70
  0.10
Como n < 30 y la varianza es conocida, la estadística de prueba de la

22
pP 0.533  0.70  0.167
t Z     1.415
P (1  P) 0.70 (0.30) 0.118
n 15
4. Región Critica
5. Decisión
Si t calc  ttabl  Ho se acepta 
 1.164   1.796  Ho se acepta
Por lo tanto lo Ho no se rechaza
6. Conclusión
Se concluye que las aspiradoras gastananualmente, en promedio, menos
4.6. Prueba de hipótesis: para la media, para proporción, para la

varianza (relativas para una población, y dos poblaciones)
B.PARA DOS POBLACIONES (diferencia entre las media y

proporciones)
HIPÓTESIS UNILATERAL O DE UNA COLA
c. Prueba de la cola inferior o d. Prueba de la cola superior o del

del lado izquierdo lado derecho
región de región de
aceptación rechazo
región región
de de
1 
1  


 23
Hipótesis Nula: Hipótesis Nula:
H o : 1   2   0 H o : 1   2   0
Hipótesis Alternativa:
Hipótesis Alternativa: H1 : 1   2   0
H 1 : 1   2   0
HIPOTESIS BILATERAL O DE DOS COLAS
Región de aceptación
Región de
Región de Rechazo
rechazo
1 
 /2  /2
1 2
Hipótesis Nula:
Hipótesis Alternativa:
Procedimiento:
Es el mismo procedimiento que en primer caso: solo se tiene en cuenta al
formular las hipótesis, que en este caso es para la diferencia de dos promedios,
como se muestra en la tabla anterior.
4.6.4. PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS


CUANDO LAS VARIANZAS  12 , ,  22 SON CONOCIDAS 
Un grupo de investigadores desea saber si los datos que han recolectado
muestran evidencia suficiente para indicar una diferencia entre las
concentraciones medias de ácidoúrico en el suero de individuos normales e
individuos con síndrome de Down. Los daros recogidos corresponden a las
lecturas de ácidoúrico en el suero de 12 individuos con síndrome de Down y 15
individuos sanos. Las medias de las muestras son 4.5mg/100ml y 3.4
mg/100ml, si las varianzas ara la población con síndrome de Down es 1 y para
la población sana es 1.5. Con 5% de confiabilidad.
SOLUCION:
24
Ho : 1   2  0
H 1 : 1   2  0
  
  0.05   , 
2 2
( X 1  X 2 )  ( 1  1 ) (4.5  3.4 )  0
Z calc   Z calc   2.57
 12  22 1 1.5


n1 n2 121 15 2
4. Región Critica
5. Decisión
Si Z tabl  Z calc  Z tabl  Ho se acepta 
(1.96)  2.57 no es  (1.96)  Ho no se acepta
Por lo tanto la Ho se rechaza
6. Conclusión
Se concluye que los datos recogidos, no muestran evidencia suficiente para
explicar diferencia entre las concentraciones medias de ácido úrico en el suero
de individuos normales e individuos con síndrome de Down, con un nivel de
significancia de 0.05
4.6.5. PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS


CUANDO LAS VARIANZAS  12 , ,  22 NO SON CONOCIDAS 

A. CUANDO LAS VARIANZAS  12   22 SON IGUALES 
25
Un grupo de especialistas de la salud, tiene como objetivo examinar las
características de la destrucción pulmonar, en personas que fuman cigarrillos
antes de desarrollar un marcado Enfisema pulmonar. En personas longevas se
practicaron mediciones de tres índices de destrucción pulmonar, en personas
que no fumaban, y en personas con tabaquismo que mueren repentinamente
fuera de un nosocomio y por causas no respiratorias. Según el estudio una
calificación alta indica un mayor daño pulmonar. Se obtuvieron muestras con
las calificaciones producidas, para uno de los índices de destrucción pulmonar
de una muestra de 9 personas que no fuman y 16 fumadores. Los especialistas
pretenden saber si es posible concluir, en base a los datos, que las personas
que si fuman, en general, tienen los pulmones más dañados que las personas
no fumadoras, como se indica en la siguiente tabla. No se conoce las varianza
de las muestras, pero se supone son iguales)
No fumadores 18.1 6 10.8 11.0 7.7 17.9 8.5 13.0 18.9
Fumadores 16.6 13.9 11.3 26.5 17.4 15.3 15.8 12.3 18.6
12.0 24.1 16.5 21.8 16.3 23.4 18.8
SOLUCION:
Ho :  NF   F  0
H 1 :  NF   F  0
  0.05 
X S  17.5 S  4.4711, X S  12.4 S  4.8492
combinar las var ianzas de las muestras para obtener
15(4.4711) 2  8(4.8492) 2
S p2  21.2165
15  8
(17.51  12.4 )  0
t calc   t calc  2.6573
21.2165 21.2165

16 9
4. Región Critica
26
5. Decisión
tcalc  ttabl  Ho se acepta 
2.6573 no es  (1.71)  Ho no se acepta
Por lo tanto Ho se rechaza
6. Conclusión
De los resultados se concluye que las dos medias poblacionales son

diferentes, las personas que fuman tienen los pulmones más dañados que las
personas que no fuman. Con un nove de significancia de 0.05
 
B. CUANDO LAS VARIANZAS  12   22 NO SON IGUALES
En una empresa que fabrica sustancias químicas, evalúanla calidad del

producto por la cantidad de impurezas presentes en un lote. Para la fabricación
utilizan dos líneas de producción 1,2 como cantidad promedio de impurezas en
la sustancia química. Se tomaron muestras aleatorias de cada línea y se
obtuvo las siguientes mediciones.
Línea n Promedio Varianza

1 16 3.2 1.04
2 16 3.0 0.51
¿Los datos aportan evidencia suficiente para concluir que la cantidad promedio
de impurezas del proceso es menor para la línea 2?. Con un nivel de
significancia igual a 0.05
Solución:
Ho : 1   2
H1 : 1   2
  0.05
27
( X 1  X 2 )  ( 1  1 ) (3.21  3.0 )  0
t calc   t calc   0.6426
S12 S 22 1.04 0.51


n1 n2 16 16
10. Región Critica
11. Decisión
Si tcalc  ttabl  Ho se acepta 
 1.164   1.7  Ho se acepta
Por lo tanto la Ho no se rechaza
12. Conclusión
Se concluye que las aspiradoras gastananualmente, en promedio, menos
4.6.6. PRUEBA DE HIPÓTESIS PARA POBLACIONES QUE NO

PRESENTAN UNA DISTRIBUCION NORMAL
En este caso se aplica el teorema del Limite Central, si el tamaño de la muestra

(n>30). “La distribución de la diferencia entre medias de las muestras será
aproximadamente normal”. Las muestras son independientes.
4.6.7. PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS

PORPORCIONES
Un estudio de estudios nutricionales en acilos de ancianos, encontraron que
entre 55 pacientes con hipertensión, 24 tenían una dieta con restricción de
28
sodio. De 149 pacientes sin hipertensión, 36 tenían una dieta sin sodio. ¿Es
posible concluir que las poblaciones muestreadas, la proporción de pacientes
con dieta restringida en sodio es mayor entre pacientes con hipertensión que
entre pacientes sin hipertensión?
Solución.
Ho : P    0
H1 : P    0
  0 .0 .5
Como n > 30, la estadística de prueba de la variable aleatoria es la

distribución normal estándar N (0,1)
( p 1  p2 )  ( P1  P2 ) X1  X 2
Z  P 
1 1 n1  n2
Pˆ (1  Pˆ ) 
n1 n2
(0.43641  0.2416)
Z  2.71
0.2941(0.7059) 0.2941(0.7059)

55 149
4. Región Critica
Región rechazo Región de

rechazo aceptación de
aceptación
1 

5. Decisión
29
Si Z calc  Z tabl  Ho se acepta 
2.71   1.64  Ho se acepta
Por lo tanto lo Ho no se rechaza
6. Conclusión
La proporción de pacientes con dieta restringida en sodio es mayor entre

pacientes hipertensos que entre los pacientes sin hipertensión
4.7. ERRORES
Ho verdadera Ho falsa
Rechazar Ho Error tipo I Decisión correcta

P(error tipo I )  
No rechazar Ho Decisión correcta Error tipo II

P(error tipo II )  
La Probabilidad de cometer un error Tipo I:se conoce como Nivel de

Significancia, se denota como α y es el tamaño de la región de rechazo
El complemento de la región de rechazo es 1−α y es conocido como el

Coeficiente de Confianza
En una prueba de Hipótesis de dos colas la región que no se rechaza

corresponde a un intervalo de confianza para el parámetro enestudio
30

Estimaciones y Pruebas de Hipotesis

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Estimaciones y Pruebas de Hipotesis

Diunggah oleh

Hak Cipta:

Format Tersedia

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

FACULTAD DE CIENCIAS ECONOMICAS

ESTIMACIONES Y PRUEBAS DE HIPOTESIS

Dra. SARA ADELINA ARANA LOPEZ

Inferencia estadística es un conjunto de métodos de la ciencia estadística, que

Las poblaciones son descritas por medidas numéricas descriptivas, llamados

La estimación de parámetros consiste en asignar un valor concreto al

La estadística inferencial permite analizar información en base a datos

3.1. Estimaciones Puntuales

3.2. Estimaciones por Intervalos

3.2.1. Estimaciones para la Media (para una y dos poblaciones)

3.2.1.1. Para la Media con Varianza Conocida

3.2.1.2. Para la Media con Varianza Desconocida

3.2.2. Estimaciones para la Proporción

3.2.3. Estimaciones para la Varianza

4.2. Clases de Hipótesis

4.3. Pruebas de Hipótesis

4.4. Clases de pruebas de hipótesis

4.5. Tipos de pruebas de hipótesis

Estimación es usar medidas calculadas en una muestra (estimador) para

Un estimador es expresado en términos de una fórmula matemática obtenida

Sea ˆ un estimador puntual de un parámetro  . Entonces ˆ es un

Dados dos ó más estimadores insesgados de un parámetro , seleccionamos

estimador puntual, se puede emplear el valor esperado de

Es conocida como sesgo del estimador ˆ .

un mismo parámetro Ө, se dice que el estimador ˆ1 es más eficiente que el

estimador ˆ2 si se cumple:

Var ˆ1   Var ˆ2 

Considerando todos los estimadores insegados de un parámetro  , el que

Un estimador es suficiente cuando en su cálculo se emplea toda la información

La estimación de un parámetro se puede realizar de dos maneras:

PUNTUAL POR INTERVALOS

La estimación puntual se refiere a la elección de un estadístico, es decir un

También se dice que es la obtención de un punto, para ello se usan las

Y  G x1 , x2 , x3 , ... , x N  , puede tomarse como el valor de  con cierta

PARAMETRO ESTIMADOR INSESGADO ESTIMACION

La estimación confidencial nos permite determinar un posible rango de valores

4.4. ESTIMACIÓN POR INTERVALOS DE CONFIANZA:

Para una población y dos poblaciones

a. para la media (con varianza conocida y con varianza desconocida)

Procedimiento para obtener un intervalo de confianza

a. Establecer una muestra aleatoria

b. Establecer un nivel de confianza o un determinado nivel de significancia

Nivel de Nivel de Total

Estadístico de la Definición Intervalo

c. Calcular los valores del intervalo

La Facultad de Educación de cierta universidad desea estimar la calificación

 4.9  0.66  4.24 , 5.56

j. Construcción del intervalo

k. Interpretación: el intervalo de confianza para la estimación media

El `presidente de una institución deportiva está interesado en conocer el

l. Muestra: n = 100 maratonistas

p. Construcción del intervalo

q. Interpretación: el intervalo de confianza para promedio de Km

Ejemplo(n=120,150) y 90% , 99%

Se ha obtenido una muestra de 15 vendedores de una Empresa Editora para

r. Construcción del intervalo de confianza

s. Interpretación: el Intervalo de confianza para la venta media por

Poblaciones Grandes (N) Poblaciones Pequeñas (n)

4.4.3.Intervalos de confianza para la proporción

Se ha obtenido una muestra al azar de 150 vendedores de una empresa de

1. Muestra: n = 150 vendedores

5. Construcción del intervalo

4.5. PRUEBA DE HIPÓTESIS: