INTEGRANTES:
3184
ingresantes a
la UNFV en
el 2018.
MUESTRA
305
Ingresantes
a la UNFV-
FCE en el
2018
CENSO
Ejemplo:
CENSOS
AÑO HABITANTES
La tasa de crecimiento
1993 22,639,000
anual de la población
es de 1,6%
2007 28,221,000
UNIDAD DE ANÁLISIS
MARCO MUESTRAL
MARCO MUESTRAL
• Marco muestral de
lista
• Ejemplo: listado de
agentes, listado de
estudiantes, listado de
empresas, etc.
MARCO MUESTRAL
• Marco muestral de área
Ejemplo: El marco de parcelas catastradas, el marco digital de manzanas de viviendas de
Lima metropolitana, etc.
UNIDAD DE MUESTREO
Ejemplo: Si se desea conocer en qué medida las madres de
una determinada comunidad cumplen o no con el
calendario de vacunaciones de sus niños menores de 5
años.
• Variable:
Cuantitativas (discretas y continuas)
Cualitativas (nominal u ordinal).
DATO
PARÁMETROS Y ESTADÍSTICOS
(ESTADÍGRAFO)
Estatura media de todos
PARÁMETRO los alumnos de la FCE-
UNFV 165 cm.
• Recursos limitados
• Escasez
PRUEBAS DESTRUCTIVAS
El muestreo puede ser más exacto
CRITERIOS PARA LA ACEPTABILIDAD
DEL MUESTREO
• Probabilidad de Selección
Ejemplo: Se lanza una vez un dado común, ¿cuál es la probabilidad de
obtener un número par, menor que 5?
Solución:
Sea A ≡Obtener un número par menor que 5 = {2, 4} ⇒#A = 2.
La probabilidad pedida es
P(A)=casos favorables/ casos totales
P(A) = 2/6 (0.33)
CRITERIOS PARA LA ACEPTABILIDAD
DEL MUESTREO
• Confiabilidad Medible
CRITERIOS PARA LA ACEPTABILIDAD
DEL MUESTREO
• Viabilidad o Factibilidad
CRITERIOS PARA LA ACEPTABILIDAD
DEL MUESTREO
• Economía y Eficiencia
IMPORTANCIA DE LA FACTORES QUE AFECTAN AL
DETERMINACIÓN DEL CÁLCULO DEL TAMAÑO
TAMAÑO MUESTRAL MUESTRAL
SELECCIÓN DE LA UNIDAD DE MUESTREO
MUESTREO CON Y SIN REEMPLAZO
ETAPAS
PROBABILIDAD
ESTRATOS
TIPOS DE MUESTREO
MUESTREO PROBABILÍSTICO
Ejemplo:
MUESTREO ALEATORIO SISTEMÁTICO
Ejemplo:
MUESTREO ALEATORIO ESTRATIFICADO
Ejemplo:
PORCENTAJE INDIVIDUOS
PORCENTAJE SOBRE EL EN LA
N° DE
SOBRE EL TOTAL MUESTRA
ESTUDIANTES
TOTAL
MICRO 100 10.00% MICRO 10.00% 10
MACRO 15.00% 15
MACRO 150 15.00% ECONOMETRÍ
20.00% 20
A
ECONOMETRÍA 200 20.00%
FINANZAS 25.00% 25
FINANZAS 250 25.00%
I. OPERATIVA 300 30.00% I. OPERATIVA 30.00% 30
1000 100%
100
MUESTREO POR CONGLOMERADOS
¿CÓMO SELECCIONAR UNA MUESTRA
POR CONGLOMERADOS?
MUESTREO POR CONGLOMERADOS
MUESTREO NO PROBABILÍSTICO
METODOS DE MUESTREO NO PROBABILÍSTICO:
• MUESTREO POR CUOTAS
• MUESTREO OPINATICO O INTENCIONAL
• MUESTREO POR CONVENIENCIA
• MUESTREO POR BOLA DE NIEVE
MUESTREO POR CUAOTAS
Ventajas e inconvenientes:
• Ofrece resultados útiles a un coste efectivo y, si se
han elegido correctamente las variables sobre las que
segmentar, dichos resultados suelen ser fiables.
• La imposibilidad de acotar el error que estamos
cometiendo al usar este tipo de muestreo
MUESTREO OPINATICO
Ventajas e inconvenientes:
P = 4/12=1/3=0.333
Por lo que podemos decir que el 33% de las personas de este grupo
tienen fobias.
Proporción de
Personas sin Personas con Combinaciones
Personas con posibles
fobias fobias
fobias
5 0 0/5= 0 8C5*4C0 = 56
TOTAL 792
Para calcular la media de la distribución muestral de proporciones
se tendría que hacer la sumatoria de la frecuencia por el valor de la
proporción muestral y dividirla entre el número total de muestras.
Esto es:
pP
La desviación estándar de la distribución muestral de proporciones
del ejemplo se puede calcular directamente con los datos:
(0.8 0.33)2 8 (0.6 0.33)2 112 (0.4 0.33)2 336 (0.2 0.33)2 280 (0 0.33)2 56
p 0.168
792
P(1 P)
p
n
Notar que P es la
proporción de la población
pero n es el tamaño de la
muestra
Como vimos antes, si contamos con una población finita y un
muestreo sin reemplazo, para calcular la desviación estándar
usamos la corrección (Como regla aproximada, si el muestreo se
hace sin reemplazo y el tamaño de la población es 20 veces el
tamaño de la muestra o menor, entonces se puede usar la fórmula):
P(1 P) Nn
p
n N 1
Para el ejemplo anterior tendríamos la siguiente distribución
de probabilidades:
Usando la fórmula tendríamos entonces:
P(1 P) N n 0.333(0.666) 12 5
p 0.168
n N 1 5 12 1
Si X1, X2, ..., Xn son muestras aleatorias independientes ,con idéntico modelo
de probabilidad, de valor medio μ y varianza σ2, entonces la distribución de
la variable
se aproxima a la de una variable normal tipificada N(0,1),
mejorándose la calidad de la aproximación a medida que n aumenta.
Este resultado prueba que el estadístico o estimador media muestral.
µ=500
Ejemplo: Simulación de Montecarlo
N=100
16
Series: BETA1
14 Sample 1 100
Observations 100
12
Mean 1499.976
10 Median 1499.985
Maximum 1500.593
8 Minimum 1499.470
Std. Dev. 0.228972
6 Skewness 0.049870
Kurtosis 2.847555
4
Jarque-Bera 0.138281
2 Probability 0.933196
0
1499.6 1499.8 1500.0 1500.2 1500.4 1500.6
N=1000
160
Series: BETA1
140 Sample 1 1000
Observations 1000
120
Mean 1500.003
100 Median 1500.004
Maximum 1500.199
80 Minimum 1499.795
Std. Dev. 0.063942
60 Skewness -0.014386
Kurtosis 2.908564
40
Jarque-Bera 0.382850
20
Probability 0.825782
0
1499.8 1499.9 1500.0 1500.1 1500.2
N=5000
500
Series: BETA1
Sample 1 5000
400 Observations 5000
Mean 1500.000
300 Median 1500.000
Maximum 1500.098
Minimum 1499.902
200
Std. Dev. 0.028322
Skewness -0.010050
Kurtosis 2.856222
100
Jarque-Bera 4.390870
Probability 0.111310
0
1499.90 1499.95 1500.00 1500.05 1500.10
N=10000
1,200
Series: BETA1
Sample 1 10000
1,000
Observations 10000
La distribución de
frecuencias de la
población es una
distribución uniforme.
Notar que:
2.236
1.58
x
n 2
El teorema del límite central y el error estándar de la media y de la proporción
están basados en que las muestras son seleccionadas con reemplazo. Sin embargo,
en virtualmente todos los casos reales, el muestreo se hace sin reemplazo de
poblaciones con tamaño finito N. En estos casos, y particularmente cuando el
tamaño de la muestra NO ES PEQUEÑO en comparación con el de la población
(por ejemplo, más del 5% de la población) de manera que:
n
0.05
N
Nn
N 1
La corrección modifica la ecuación del estadístico de la siguiente forma.
x
z
Nn
n N 1
0.4
0.3
Densit
0.2
Área = 0.0062
y
0.1
0.00621
0.0
-2.5 0
z =-2.5 X
a)El número de las medias muestrales que caen entre 172.5 y 175.8 centímetros.
b)El número de medias muestrales que caen por debajo de 172 centímetros.
Solución:
Como n/N=200/1000 = 0.2, se puede observar en este ejercicio se
cuenta con una población finita y un muestreo sin reemplazo, por lo que se
tendrá que agregar el factor de corrección. Se procederá a calcular el
denominador de Z para sólo sustituirlo en cada inciso.
a)
Distribution Plot
Normal, Mean=0, StDev=1
0.4 0.761
0.3
Área = 0.761
Density
0.2
0.1
0.4 0.30
0.25
0.3
0.20
Density
Density
0.2 0.15
0.10
0.1
0.05
0.0330 0.0330
0.0 0.00
-1.8382 0 172 175
X X
p P
z
P(1 P)
n
A la fórmula anterior se le puede agregar el factor de corrección (en el
denominador):
p P
z
P(1 P) N n
n N 1
Solución:
La media o valor esperado de la distribución muestral es de P=0.851 (la
proporción de la población), por lo que:
p P 0.800 0.851
z 2.0255
P(1 P) 0.851(1 0.851)
n 200
Usando las tablas de valor z, para z = -2.02 encontramos que la
probabilidad de que no más de (es decir, menos de) 80% de los
alumnos de la muestra fumen es de 0.0214 o sea 2.14%
0.0214
Suponga que de la gente que solicita ingresar a una compañía, el
40% pueden aprobar un examen de artimética para obtener el
trabajo. Si se tomara una muestra de 20 solicitantes, ¿Cuál sería la
probabilidad de que 50% o más de ellos aprobaran?
Datos:
P = 0.40, n = 20, p = 0.50
p P 0.50 0.40
z 0.9129
P(1 P) 0.40(1 0.40)
n 20
Usan tablas de valor o clasificación z, o un programa para
distribución normal estándar (como Minitab, etc.), encontramos
que el área bajo la curva hasta un valor de z = 0.9129 es de
0.81935, o sea que (1- 0.81935) = 0.1806,
por lo que la probabilidad de que 50% o más aprobaran es de
18.06%.
n: tamaño de la muestra
S²: varianza muestral
σ²: varianza de la población de donde se extrrajo la muestra
Encuentre la probabilidad de que una muestra aleatoria de
25 observaciones, de una poblacion normal con varianzas
igual a 6, tenga una varianza muestra:
a. Mayor que 9.1
b. Entre 3.462 y 10.745