Muestreo y estimaciones.
4.2.2 Distribución muestral de la diferencia entre dos medias con σ2. conocida y desconocida.
4.6 Intervalos de confianza para la media, con el uso de la distribución Normal y “t” student.
4.7 Intervalo de confianza para la diferencia entre dos medias μ1−μ2 con σ12 y σ22 σ1 2= σ22 pero conocidas,
con el uso de la distribución normal y la “t” student.
En donde z es una variable estandarizada con media igual a cero y varianza igual
a uno. Con esta fórmula se pueden a hacer los cálculos de probabilidad para
cualquier ejercicio, utilizando la tabla de la distribución z.
Ejemplo:
Una empresa eléctrica fabrica focos que tienen una duración que se distribuye
aproximadamente en forma normal, con media de 800 horas y desviación estándar
de 40 horas. Encuentre la probabilidad de que una muestra aleatoria de 16 focos
tenga una vida promedio de menos de 775 horas.
Solución:
Este valor se busca en la tabla de z
Ejemplo:
Solución:
Como se puede observar en este ejercicio se cuenta con una población finita y un
muestreo sin reemplazo, por lo que se tendrá que agregar el factor de corrección.
Se procederá a calcular el denominador de Z para sólo sustituirlo en cada inciso.
a.
(0.7607)(200)=152 medias muestrales
b.
Ejemplo:
En un estudio para comparar los pesos promedio de niños y niñas de sexto grado
en una escuela primaria se usará una muestra aleatoria de 20 niños y otra de 25
niñas. Se sabe que tanto para niños como para niñas los pesos siguen una
distribución normal. El promedio de los pesos de todos los niños de sexto grado de
esa escuela es de 100 libras y su desviación estándar es de 14.142, mientras que
el promedio de los pesos de todas las niñas del sexto grado de esa escuela es de
85 libras y su desviación estándar es de 12.247 libras. Si representa el promedio
de los pesos de 20 niños y es el promedio de los pesos de una muestra de 25
niñas, encuentre la probabilidad de que el promedio de los pesos de los 20 niños
sea al menos 20 libras más grande que el de las 25 niñas.
Solución:
Datos:
1 = 100 libras
2 = 85 libras
1 = 14.142 libras
2 = 12.247 libras
n1 = 20 niños
n2 = 25 niñas
=?
Ejemplo:
Solución:
Datos:
A = 7.2 años
B = 6.7 años
A = 0.8 años
B = 0.7 años
nA = 34 tubos
nB = 40 tubos
=?
Ejemplo:
Solución:
En este ejercicio no se cuenta con los parámetros de las medias en ninguna de las
dos poblaciones, por lo que se supondrán que son iguales.
Datos:
1 = 1.23 Km/Lto
2 = 1.37 Km/Lto
n1 = 35 autos
n2 = 42 autos
a. =?
b.
?
La probabilidad de que la diferencia en rendimientos promedio en las muestras se
encuentre entre 0.65 y 0.83 Km/Lto a favor de la gasolina 1 es de 0.0117.
Número de
Proporción de
Artículos maneras en las que
Artículos Malos artículos
Buenos se puede obtener la
defectuoso
muestra
1 4 4/5=0.8 C1*4C4=8
8
2 3 3/5=0.6 C2*4C3=112
8
3 2 2/5=0.4 8C3*4C2=336
4 1 1/5=0.2 8C4*4C1=280
5 0 0/5=0 8C5*4C0=56
Total 792
p =P
2
La varianza de la distribución binomial es = npq, por lo que la varianza de la
2
distribución muestral de proporciones es p =(Pq)/n. Si se sustituten los valores
en esta fórmula tenemos que:
Ejemplo:
Solución:
Este ejercicio se puede solucionar por dos métodos. El primero puede ser con la
aproximación de la distribución normal a la binomial y el segundo utilizando la
fórmula de la distribución muestral de proporciones.
Datos:
n=800 estudiantes
p=0.60
x= (.55)(800) = 440 estudiantes
p(x 440) = ?
p(x 440) = 0.0017. Este valor significa que existe una probabilidad del 0.17% de
que al extraer una muestra de 800 estudiantes, menos de 440 fuman cigarrillos.
Datos:
n=800 estudiantes
P=0.60
p= 0.55
p(p 0.55) = ?
Observe que este valor es igual al obtenido en
el método de la aproximación de la distribución normal a la binomial, por lo que si
lo buscamos en la tabla de "z" nos da la misma probabilidad de 0.0017. También
se debe de tomar en cuenta que el factor de corrección de 0.5 se esta dividiendo
entre el tamaño de la muestra, ya que estamos hablando de una proporción.
Ejemplo:
Datos:
n=150 personas
p=0.03
x= (0.04)(150) = 6 personas
p(x>6) = ?
Datos:
n=150 personas
P=0.03
p= 0.04
p(p>0.04) = ?
Observe que este valor es igual al obtenido y la interpretación es: existe una
probabilidad del 17% de que al tomar una muestra de 150 personas se tenga una
proporción mayor de 0.04 presentando una reacción adversa.
Ejemplo:
Se sabe que la verdadera proporción de los componentes defectuosos fabricadas
por una firma es de 4%, y encuentre la probabilidad de que una muestra aleatoria
de tamaño 60 tenga:
Solución:
a. Datos:
n= 60 artículos
P=0.04
p= 0.03
p(p<0.03) = ?
b. Datos:
n= 60 artículos
P=0.04
p= 0.01 y 0.05
p(0.01<p<0.05) = ?
y que .
Ejemplo:
Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren
en sus opiniones sobre la promulgación de la pena de muerte para personas
culpables de asesinato. Se cree que el 12% de los hombres adultos están a favor
de la pena de muerte, mientras que sólo 10% de las mujeres adultas lo están. Si
se pregunta a dos muestras aleatorias de 100 hombres y 100 mujeres su opinión
sobre la promulgación de la pena de muerte, determine la probabilidad de que el
porcentaje de hombres a favor sea al menos 3% mayor que el de las mujeres.
Solución:
Datos:
PH = 0.12
PM = 0.10
nH = 100
nM = 100
p(pH-pM 0.03) = ?
Se recuerda que se está incluyendo el factor de corrección de 0.5 por ser una
distribución binomial y se está utilizando la distribución normal.
Ejemplo:
Una encuesta del Boston College constó de 320 trabajadores de Michigan que
fueron despedidos entre 1979 y 1984, encontró que 20% habían estado sin trabajo
durante por lo menos dos años. Supóngase que tuviera que seleccionar otra
muestra aleatoria de 320 trabajadores de entre todos los empleados despedidos
entre 1979 y 1984. ¿Cuál sería la probabilidad de que su porcentaje muestral de
trabajadores sin empleo durante por lo menos dos años, difiera del porcentaje
obtenido en la encuesta de Boston College, en 5% o más?
Solución:
También debe de comprenderse la pregunta que nos hace este problema, ¿cuál
sería la probabilidad de que su porcentaje muestral de trabajadores sin empleo
durante por lo menos dos años, difiera del porcentaje obtenido en la encuesta de
Boston College, en 5% o más?, la palabra difiera quiere decir que puede existir
una diferencia a favor de la muestra uno, o a favor de la muestra dos, por lo que
se tendrán que calcular dos áreas en la distribución y al final sumarlas.
Datos:
p1 = 0.20
n1 = 320 trabajadores
n2 = 320 trabajadores
P1 = P 2
La probabilidad de que su proporcion muestral de trabajadores sin empleo durante
por lo menos dos años, difiera del porcentaje obtenido en la encuesta de Boston
College, en 0.05 o más es de 0.1260.
Ejemplo:
Solución:
Datos:
P1 = 3/6 = 0.5
P2 = 2/5 = 0.4
n1 = 120 objetos
n2 = 120 objetos
a. p(p2-p1 0.10) = ?
b. p(p1-p2
0.15)=?
La probabilidad de que exista una diferencia de proporciones de artículos
defectuosos de por lo menos 15% a favor de la máquina 1 es de 0.2357.
TAMAÑO DE LA MUESTRA
A la hora de determinar el tamaño que debe alcanzar una muestra hay que tomar en cuenta
varios factores: el tipo de muestreo, el parámetro a estimar, el error muestral admisible, la
varianza poblacional y el nivel de confianza. Por ello antes de presentar algunos casos
sencillos de cálculo del tamaño muestral delimitemos estos factores.
Para calcular el tamaño de una muestra hay que tomar en cuenta tres factores:
1. El porcentaje de confianza con el cual se quiere generalizar los datos desde la
muestra hacia la población total.
2. El porcentaje de error que se pretende aceptar al momento de hacer la
generalización.
3. El nivel de variabilidad que se calcula para comprobar la hipótesis.
El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipótesis
que sea falsa como si fuera verdadera, o la inversa: rechazar a hipótesis verdadera por
considerarla falsa. Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del
error y considerarlo como 0%, entonces la muestra es del mismo tamaño que la población,
por lo que conviene correr un cierto riesgo de equivocarse.
Una de las preguntas planteadas con mayor frecuencia al iniciar una investigación y difícil
de contestar, sobre todo por falta de información del problema, es: ¿cuántas observaciones
se deben obtener para que el tamaño de la muestra sea realmente representativo del
universo estadístico? En este sentido -la decisión del tamaño de la muestra de una
población -, es necesario considerar que las muestras varían en su composición de una a
otra. La magnitud de la variación depende del tamaño de la muestra y de la variabilidad
original de la población. Así, el tamaño de la muestra queda determinada por el grado de
precisión que se desea obtener y por variabilidad inicial de la población.
Nivel de Confianza 99.73% 99% 98% 96% 95.45% 95% 90% 80% 68.27% 50%
Valores de Z 3.00 2.58 2.33 2.05 2.00 1.96 1.645 1.28 1.00 0.6745
El tamaño de la muestra:
En el tamaño de una muestra de una población tenemos que tener presente además si es
conocida o no la varianza poblacional.
Para determinar el tamaño de muestra necesario para estimar con un error máximo permisible
d prefijado y conocida la varianza poblacional ( 2 ) podemos utilizar la formula:
2
Z1
n 2
d
(1)
que se obtiene de reconocer que d es el error estándar o error máximo prefijado y está dado por
la expresión d Z1 para el nivel de confianza 1 y constituye una medida de la
n 2
Ejemplo 1.2
Se desea estimar el peso promedio de los sacos que son llenados por un nuevo instrumento en
una industria. Se conoce que el peso de un saco que se llena con este instrumento es una variable
aleatoria con distribución normal. Si se supone que la desviación típica del peso es de 0,5 kg.
Determine el tamaño de muestra aleatoria necesaria para determinar una probabilidad igual a 0,95
de que el estimado y el parámetro se diferencien modularmente en menos de 0,1 kg.
Solución:
d 0,1
0,5 2
Z1 0,51,96
2
1 0,95 n 96,4
2
d 0,1
1 2 0,975
Z1 2 1,96
Evidentemente un tamaño de muestra no puede ser fraccionario por lo que se debe aproximar por
exceso. El tamaño de muestra sería de 97.
Primeramente, se toma una pequeña muestra, que se le llama muestra piloto, con ella se estima la
varianza poblacional ( 2 ) y con este valor se evalúa en la formula (1), sustituyendo ( 2 ) por su
estimación ( s 2 ). El valor de n obtenido será aproximadamente el valor necesario, nuevamente
con ese valor de n se extrae una muestra de este tamaño de la población se le determina la
varianza a esa muestra, como una segunda estimación de ( 2 ) y se aplica de nuevo la formula
(1), tomando la muestra con el n obtenido como muestra piloto para la siguiente iteración, se
llegará a cumplir con las restricciones prefijadas. Se puede plantear esta afirmación ya que la s 2
de 2 tiende a estabilizarse a medida que aumenta n alrededor de la 2 por lo que llegará el
momento en que se encuentre el tamaño de muestra conveniente, sin embargo, en la práctica es
mucho más sencillo pues, a lo sumo con tres iteraciones se obtiene el tamaño de muestra
deseado, este procedimiento para obtener el tamaño de muestra deseado se puede realizar
utilizando en Microsoft Excel en la opción análisis de datos las opciones estadística descriptiva
para ir hallando la varianza de cada una de las muestras y la opción muestra para ir determinado
las muestras pilotos. Para obtener el tamaño de la muestra utilizando este método recomendamos
la utilización de un paquete de computo como por ejemplo el Microsoft Excel, aplicando las
opciones muestra y estadística descriptiva.
Para determinar el tamaño de la muestra cuando los datos son cualitativos es decir para el
análisis de fenómenos sociales o cuando se utilizan escalas nominales para verificar la
ausencia o presencia del fenómeno a estudiar, se recomienda la utilización de la siguiente
formula:
n'
n (2)
1 n' N
s2
siendo n' sabiendo que:
2
2 es la varianza de la población respecto a determinadas variables.
s 2 es la varianza de la muestra, la cual podrá determinarse en términos de probabilidad
como s 2 p (1 p )
se es error estandar que está dado por la diferencia entre ( x ) la media poblacional y
la media muestral.
se 2 es el error estandar al cuadrado, que nos servirá para determinar 2 , por lo que
2 = se 2 es la varianza poblacional.
Ejemplo 1.3
De una población de 1 176 adolescentes de una ciudad X se desea conocer la aceptación por los
programas humorísticos televisivos y para ello se desea tomar una muestra por lo que se necesita
saber la cantidad de adolescentes que deben entrevistar para tener una información adecuada con
error estandar menor de 0.015 al 90 % de confiabilidad.
Solución:
N = 1 176
se = 0,015
2 2 2
( se) (0,015) 0.000225
s 2 p (1 p ) 0,9(1 0,9) 0,09
s2 0,09
por lo que n' 400
2 0,000225
n' 400
n 298
n ' 400
1 N 1 1176
Es decir para realizar la investigación se necesita una muestra de al menos 298 adolescentes.
A la hora de determinar el tamaño que debe alcanzar una muestra hay que tomar
en cuenta varios factores: el tipo de muestreo, el parámetro a estimar, el error
muestral admisible, la varianza poblacional y el nivel de confianza. Por ello antes
de presentar algunos casos sencillos de cálculo del tamaño muestral delimitemos
estos factores.
Estadístico. Los datos o medidas que se obtienen sobre una muestra y por lo tanto
una estimación de los parámetros.
Veamos los pasos necesarios para determinar el tamaño de una muestra empleando el muestreo
aleatorio simple. Para ello es necesario partir de dos supuestos: en primer lugar el nivel de
confianza al que queremos trabajar; en segundo lugar, cual es el error máximo que estamos
dispuestos a admitir en nuestra estimación. Así pues los pasos a seguir son:
Veamos los pasos necesarios para determinar el tamaño de una muestra
empleando el muestreo aleatorio simple. Para ello es necesario partir de dos
supuestos: en primer lugar el nivel de confianza al que queremos trabajar; en
segundo lugar, cual es el error máximo que estamos dispuestos a admitir en
nuestra estimación. Así pues los pasos a seguir son:
Donde:
: varianza poblacional
e: error máximo
donde
4.6 Intervalos de confianza para la media, con el uso de la distribución Normal y “t” student.
Solución:
La estimación puntual de es = 2.6. El valor de z para un nivel de
confianza del 95% es 1.96, por lo tanto:
.
Como se puede observar en los resultados del ejercicio se tiene un error de
estimación mayor cuando el nivel de confianza es del 99% y más pequeño
cuando se reduce a un nivel de confianza del 95%.
2. Una empresa eléctrica fabrica focos que tienen una duración
aproximadamente distribuida de forma normal con una desviación estándar
de 40 horas. Si una muestra de 30 focos tiene una duración promedio de
780 horas, encuentre un intervalos de confianza de 96% para la media de la
población de todos los focos que produce esta empresa.
Solución:
Con un nivel de confianza del 96% se sabe que la duración media de los
focos que produce la empresa está entre 765 y 795 horas.
3. La prueba de corte sesgado es el procedimiento más aceptado para evaluar
la calidad de una unión entre un material de reparación y su sustrato de
concreto. El artículo "Testing the Bond Between Repair Materials and
Concrete Substrate" informa que, en cierta investigación, se obtuvo una
resistencia promedio muestral de 17.17 N/mm2, con una muestra de 48
observaciones de resistencia al corte, y la desviación estándar muestral fue
3.28 N/mm2. Utilice un nivel de confianza inferior del 95% para estimar la
media real de la resistencia al corte.
Solución:
En este ejercicio se nos presentan dos situaciones diferentes a los ejercicios
anteriores. La primera que desconoce la desviación estándar de la población y la
segunda que nos piden un intervalo de confianza unilateral.
El primer caso ya se había comentado y se solucionará utilizando la desviación
estándar de la muestra como estimación puntual de sigma.
Para el intervalo de confianza unilateral, se cargará el área bajo la curva hacia un
solo lado como sigue:
Esto quiere decir que con un nivel de confianza de 95%, el valor de la media está
en el intervalo (16.39, ).
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la
siguiente relación:
N .S 2 Z 2 2
n 2 2
N .d S Z 2 2
de donde:
n = tamaño de la muestra.
N = tamaño de la población.
S² = varianza de la muestra.
Ejemplo: En un lote de frascos para medicina, con una población de 8000 unidades, se desea
estimar la media de la capacidad en centímetros cúbicos de los mismos.
DATOS:
Z 2= 1.96
Solo faltaría muestrear 204 frascos, pues los datos de los 35 frascos del premuestreo siguen
siendo válidos.
En bastantes ocasiones, la variable bajo estudio es de tipo binomial, en ese caso para calcular
el tamaño de muestra bajo el muestreo simple aleatorio, se haría de la siguiente manera:
N . p .q .Z 2 2
n 2
N .d p .q .Z 2 2
De donde:
p = probabilidad de éxito.
q = probabilidad de fracaso.
d = precisión expresada en porcentaje.
a) hacer un premuestreo.
b) asumir varianza máxima.
Ejemplo: En una investigación, se desea determinar en que proporción los niños de una
región toman leche en el desayuno. Si se sabe que existen 1.500 niños y deseamos tener una
precisión del 10 %, con un nivel de significancia del 5 % . ¿De que tamaño debe de ser la
muestra?
DATOS:
N = 1500; d = 10 % = 0.1; α = 5 %
p = 0.5 y q = 0.5 (asumiendo varianza máxima).
Zα/2 = 1.96