Anda di halaman 1dari 94

LA MUESTRA

INTEGRANTES:

 CÓRDOVA TIPIANI HUMBERTO

 DE LA CRUZ HUAYLINOS MARISOL

 DELGADO MONSALVE DAVID

 DÍAZ SALAZAR MAYUMI

 ENRÍQUEZ DÍAZ NICOLE


DEFINICIÓN Y CONCEPTOS PREVIOS
POBLACIÓN

3184
ingresantes a
la UNFV en
el 2018.
MUESTRA

305
Ingresantes
a la UNFV-
FCE en el
2018
CENSO
Ejemplo:

CENSOS

AÑO HABITANTES
La tasa de crecimiento
1993 22,639,000
anual de la población
es de 1,6%
2007 28,221,000
UNIDAD DE ANÁLISIS
MARCO MUESTRAL
MARCO MUESTRAL
• Marco muestral de
lista
• Ejemplo: listado de
agentes, listado de
estudiantes, listado de
empresas, etc.
MARCO MUESTRAL
• Marco muestral de área
Ejemplo: El marco de parcelas catastradas, el marco digital de manzanas de viviendas de
Lima metropolitana, etc.
UNIDAD DE MUESTREO
Ejemplo: Si se desea conocer en qué medida las madres de
una determinada comunidad cumplen o no con el
calendario de vacunaciones de sus niños menores de 5
años.

¿La unidad de muestreo?


¿La unidad de análisis?
UNIDAD INFORMANTE Y VARIABLE
• Unidad informante: Corresponde a la entidad que reporta la información sobre
la unidad de análisis observada.

Ejemplo: El jefe de familia, el trabajador, el estudiante, el consumidor, etc.

• Variable:
Cuantitativas (discretas y continuas)
Cualitativas (nominal u ordinal).
DATO
PARÁMETROS Y ESTADÍSTICOS
(ESTADÍGRAFO)
Estatura media de todos
PARÁMETRO los alumnos de la FCE-
UNFV 165 cm.

Estatura media de la clase


ESTADÍSTICO de tercer año de la FCE-
UNFV del Prof. Bonilla
165 cm.
RAZONES PARA EL USO DE MUESTRA
RAZONES PARA EL USO DE MUESTRA

• Recursos limitados

• Escasez
PRUEBAS DESTRUCTIVAS
El muestreo puede ser más exacto
CRITERIOS PARA LA ACEPTABILIDAD
DEL MUESTREO
• Probabilidad de Selección
Ejemplo: Se lanza una vez un dado común, ¿cuál es la probabilidad de
obtener un número par, menor que 5?
Solución:
Sea A ≡Obtener un número par menor que 5 = {2, 4} ⇒#A = 2.
La probabilidad pedida es
P(A)=casos favorables/ casos totales
P(A) = 2/6 (0.33)
CRITERIOS PARA LA ACEPTABILIDAD
DEL MUESTREO
• Confiabilidad Medible
CRITERIOS PARA LA ACEPTABILIDAD
DEL MUESTREO
• Viabilidad o Factibilidad
CRITERIOS PARA LA ACEPTABILIDAD
DEL MUESTREO
• Economía y Eficiencia
IMPORTANCIA DE LA FACTORES QUE AFECTAN AL
DETERMINACIÓN DEL CÁLCULO DEL TAMAÑO
TAMAÑO MUESTRAL MUESTRAL
SELECCIÓN DE LA UNIDAD DE MUESTREO
MUESTREO CON Y SIN REEMPLAZO
ETAPAS
PROBABILIDAD
ESTRATOS
TIPOS DE MUESTREO
MUESTREO PROBABILÍSTICO

- Muestreo aleatorio simple.


- Muestreo sistemático.
- Muestreo aleatorio estratificado.
- Muestreo por conglomerado
- Muestreo multietápico
MUESTRA ALEATORIA SIMPLE

Ejemplo:
MUESTREO ALEATORIO SISTEMÁTICO

Ejemplo:
MUESTREO ALEATORIO ESTRATIFICADO

Ejemplo:
PORCENTAJE INDIVIDUOS
PORCENTAJE SOBRE EL EN LA
N° DE
SOBRE EL TOTAL MUESTRA
ESTUDIANTES
TOTAL
MICRO 100 10.00% MICRO 10.00% 10
MACRO 15.00% 15
MACRO 150 15.00% ECONOMETRÍ
20.00% 20
A
ECONOMETRÍA 200 20.00%
FINANZAS 25.00% 25
FINANZAS 250 25.00%
I. OPERATIVA 300 30.00% I. OPERATIVA 30.00% 30
1000 100%
100
MUESTREO POR CONGLOMERADOS
¿CÓMO SELECCIONAR UNA MUESTRA
POR CONGLOMERADOS?
MUESTREO POR CONGLOMERADOS
MUESTREO NO PROBABILÍSTICO
METODOS DE MUESTREO NO PROBABILÍSTICO:
• MUESTREO POR CUOTAS
• MUESTREO OPINATICO O INTENCIONAL
• MUESTREO POR CONVENIENCIA
• MUESTREO POR BOLA DE NIEVE
MUESTREO POR CUAOTAS

Ventajas e inconvenientes:
• Ofrece resultados útiles a un coste efectivo y, si se
han elegido correctamente las variables sobre las que
segmentar, dichos resultados suelen ser fiables.
• La imposibilidad de acotar el error que estamos
cometiendo al usar este tipo de muestreo
MUESTREO OPINATICO

Ventajas e inconvenientes:

• La capacidad de reunir grandes cantidades de información usando una


gama de diferentes técnicas. Esta variedad, a su vez, le dará una mejor
sección de información.

• Alta probabilidad de sesgo del investigador.


MUESTREO POR CONVENIENCIA
Ventajas e inconvenientes:
• La principal virtud, los individuos empleados en la
investigación se seleccionan porque están fácilmente
disponibles, no porque hayan sido seleccionados mediante
un criterio estadístico.
• El principal defecto, la falta de representatividad, la
imposibilidad de hacer aseveraciones estadísticas sobre los
resultados y el riesgo de incurrir en sesgos debido al
criterio de muestreo empleado
MUESTREO POR BOLA DE NIEVE
Ventajas e inconvenientes:
• Permite muestrear a poblaciones de difícil acceso
• Requiere poca planificación y pocos recursos
humanos: los propios sujetos entrevistados hacen de
mano de obra.
• No garantiza representatividad, ni permite conocer
el grado de precisión que ofrecerá.
DISTRIBUCION MUESTRAL

Resulta de considerar todas las muestras posibles que pueden ser


tomadas de una población.

- Distribución muestral de las proporciones


- Distribución muestral de las medias
DISTRIBUCIÓN MUESTRAL DE LAS
PROPORCIONES
El siguiente diagrama sirve para explicar el concepto de
distribución muestral de proporciones.
Ejercicio:

Suponga que se cuenta con un grupo de 12 personas, el cual tiene 4


personas con fobias. Se van a seleccionar 5 personas al azar de ese
grupo sin reemplazo. Vamos a generar la distribución muestral de
proporciones para el número de personas con fobias.

P = 4/12=1/3=0.333
Por lo que podemos decir que el 33% de las personas de este grupo
tienen fobias.
Proporción de
Personas sin Personas con Combinaciones
Personas con posibles
fobias fobias
fobias

1 4 4/5= 0.8 8C1*4C4 = 8


2 3 3/5= 0.6 8C2*4C3 = 112

3 2 2/5= 0.4 8C3*4C2 = 336

4 1 1/5= 0.2 8C4*4C1 = 280

5 0 0/5= 0 8C5*4C0 = 56

TOTAL 792
Para calcular la media de la distribución muestral de proporciones
se tendría que hacer la sumatoria de la frecuencia por el valor de la
proporción muestral y dividirla entre el número total de muestras.
Esto es:

(0.88)  (0.6 112)  (0.4 336)  (0.2 280)  (0 56) 1


p    0.333
792 3

Como podemos observar la media de la distribución muestral de


proporciones es igual a la proporción de la población.

 pP
La desviación estándar de la distribución muestral de proporciones
del ejemplo se puede calcular directamente con los datos:

(0.8  0.33)2 8  (0.6  0.33)2 112  (0.4  0.33)2 336  (0.2  0.33)2  280  (0  0.33)2 56
p   0.168
792

Sin embargo, podemos usar la distribución binomial lo cual nos da


la siguiente fórmula para la desviación estándar de la distribución
muestral de proporciones:

P(1 P)
p 
n
Notar que P es la
proporción de la población
pero n es el tamaño de la
muestra
Como vimos antes, si contamos con una población finita y un
muestreo sin reemplazo, para calcular la desviación estándar
usamos la corrección (Como regla aproximada, si el muestreo se
hace sin reemplazo y el tamaño de la población es 20 veces el
tamaño de la muestra o menor, entonces se puede usar la fórmula):

P(1 P) Nn
p 
n N 1
Para el ejemplo anterior tendríamos la siguiente distribución
de probabilidades:
Usando la fórmula tendríamos entonces:

P(1  P) N n 0.333(0.666) 12  5
p    0.168
n N 1 5 12  1

Lo cual es igual al valor de la desviación estándar obtenido antes


TEOREMA DEL LÍMITE CENTRAL

Si X1, X2, ..., Xn son muestras aleatorias independientes ,con idéntico modelo
de probabilidad, de valor medio μ y varianza σ2, entonces la distribución de
la variable
se aproxima a la de una variable normal tipificada N(0,1),
mejorándose la calidad de la aproximación a medida que n aumenta.
Este resultado prueba que el estadístico o estimador media muestral.
µ=500
Ejemplo: Simulación de Montecarlo
N=100
16
Series: BETA1
14 Sample 1 100
Observations 100
12
Mean 1499.976
10 Median 1499.985
Maximum 1500.593
8 Minimum 1499.470
Std. Dev. 0.228972
6 Skewness 0.049870
Kurtosis 2.847555
4
Jarque-Bera 0.138281
2 Probability 0.933196
0
1499.6 1499.8 1500.0 1500.2 1500.4 1500.6
N=1000
160
Series: BETA1
140 Sample 1 1000
Observations 1000
120
Mean 1500.003
100 Median 1500.004
Maximum 1500.199
80 Minimum 1499.795
Std. Dev. 0.063942
60 Skewness -0.014386
Kurtosis 2.908564
40
Jarque-Bera 0.382850
20
Probability 0.825782
0
1499.8 1499.9 1500.0 1500.1 1500.2
N=5000
500
Series: BETA1
Sample 1 5000
400 Observations 5000

Mean 1500.000
300 Median 1500.000
Maximum 1500.098
Minimum 1499.902
200
Std. Dev. 0.028322
Skewness -0.010050
Kurtosis 2.856222
100
Jarque-Bera 4.390870
Probability 0.111310
0
1499.90 1499.95 1500.00 1500.05 1500.10
N=10000
1,200
Series: BETA1
Sample 1 10000
1,000
Observations 10000

800 Mean 1500.000


Median 1500.000
Maximum 1500.086
600 Minimum 1499.930
Std. Dev. 0.020158
400 Skewness 0.016714
Kurtosis 3.022863

200 Jarque-Bera 0.683378


Probability 0.710569
0
1499.925 1499.950 1499.975 1500.000 1500.025 1500.050 1500.075
Ejemplo: (Para diferentes tipos de poblaciones)
DISTRIBUCIÓN MUESTRAL DE MEDIAS
El proceso estadístico para emplear una media de muestra para hacer
inferencias acerca de una media poblacional:
La distribución muestral de medias tiene un

comportamiento aproximadamente normal, por lo  x y s
que se puede utilizar la formula de la distribución n
normal con
s, es equivalente al error estándar de la media, x 
entonces la fórmula para calcular la probabilidad z
del comportamiento del estadístico, en este caso 
la media de la muestra , quedaría de la siguiente
n
manera:
EJERCICIO:
Se eligen muestras de pares de números, con reemplazo, de la población de
los valores 0, 2, 4 y 6. Encontrar:
μ , la media poblacional.
s , la desviación estándar poblacional.
μ x, la media de la distribución muestral de medias.
s x, la desviación estándar de la distribución muestral de medias.
Además, graficar las frecuencias para la población y para la distribución
muestral de medias.
Nota: Usar muestras ordenadas implica todas las combinaciones de valores,
por ejemplo, (4,2) y (2,4) son dos parejas diferentes.
Solución: 0246
La media poblacional es:  3
4

La distribución de
frecuencias de la
población es una
distribución uniforme.

La desviación estándar de la poblacional es:

(0  3)2  (2  3)2  (4  3)2  (6  3)2


  2.236
4
La distribución muestral de las medias es:
La media de la distribución muestral de medias es:

x   ( fx)  (0)(1)  (1)(2)  (2)(3)  (3)(4)  (4)(3)  (5)(2)  (6)(1)  48  3


f 16 16

La desviación estándar de la distribución muestral de medias es:


 f (x   ) x
2 2 2
1(0  3)  2(1 3)  3(2  3)  4(3  3)  3(4  3)  2(5  3) 1(6  3)
2 2 2 2 2
x   1.58
f 16

Notar que:

 
2.236
 1.58
x 
n 2
El teorema del límite central y el error estándar de la media y de la proporción
están basados en que las muestras son seleccionadas con reemplazo. Sin embargo,
en virtualmente todos los casos reales, el muestreo se hace sin reemplazo de
poblaciones con tamaño finito N. En estos casos, y particularmente cuando el
tamaño de la muestra NO ES PEQUEÑO en comparación con el de la población
(por ejemplo, más del 5% de la población) de manera que:

n
 0.05
N

Siendo n el tamaño de la muestra y N el de la población. Entonces es necesario


emplear un Factor de Corrección para Población Finita para la desviación estándar:

Nn
N 1
La corrección modifica la ecuación del estadístico de la siguiente forma.

x 
z
 Nn
n N 1

Siendo n el tamaño de la muestra y N el de la población.


EJERCICIO:
Una empresa eléctrica fabrica baterías que tienen una duración que
se distribuye aproximadamente en forma normal, con media de 800
horas y desviación estándar de 40 horas. Encuentre la probabilidad
de que una muestra aleatoria de 16 baterías tenga una vida
promedio de menos de 775 horas.
Solución:
Distribution Plot
Normal, Mean=0, StDev=1

0.4

0.3

Densit
0.2
Área = 0.0062

y
0.1

0.00621
0.0
-2.5 0
z =-2.5 X

La respuesta sería que la probabilidad de que la media de la muestra de 16


baterías sea menor a 775 horas es de 0.0062 o 0.62 %.
EJERCICIO:
Las estaturas de aproximadamente 1000 Estudiantes están distribuidas en forma normal con
una media de 174.5
centímetros y una desviación estándar de 6.9 centímetros. Si se extraen 200 muestras
aleatorias de tamaño 25 sin reemplazo de esta población, determine:

a)El número de las medias muestrales que caen entre 172.5 y 175.8 centímetros.
b)El número de medias muestrales que caen por debajo de 172 centímetros.

Solución:
Como n/N=200/1000 = 0.2, se puede observar en este ejercicio se
cuenta con una población finita y un muestreo sin reemplazo, por lo que se
tendrá que agregar el factor de corrección. Se procederá a calcular el
denominador de Z para sólo sustituirlo en cada inciso.
a)

Distribution Plot
Normal, Mean=0, StDev=1

0.4 0.761

0.3
Área = 0.761

Density
0.2

0.1

Por lo tanto la respuesta es: 0.0


-1.47 0 0.96
(0.761)(200)=152 medias muestrales X
b) Área =
0.0330
Distribution Plot Distribution Plot
Normal, Mean=0, StDev=1 Normal, Mean=174.5, StDev=1.36

0.4 0.30

0.25

0.3
0.20
Density

Density
0.2 0.15

0.10
0.1
0.05
0.0330 0.0330
0.0 0.00
-1.8382 0 172 175
X X

Nota: Es lo mismo si se toman los valores


originales con la distribución para la media y Por lo tanto la respuesta es:
desviación estándar correspondientes, pero (0.0330)(200)= 7 medias muestrales
esto sólo se puede efectuar con software y no
con tablas.
La fórmula que se utilizará para el cálculo de probabilidad en una
distribución muestral de proporciones está basada en la
aproximación de la distribución binomial a la normal . Esta fórmula
nos servirá para calcular la probabilidad del comportamiento de la
proporción en la muestra

p P
z
P(1 P)
n
A la fórmula anterior se le puede agregar el factor de corrección (en el
denominador):

p P
z
P(1 P) N  n
n N 1

si se cumplen con las condiciones mencionadas anteriormente de


que sea una población finita (N/n < 20) y sin reemplazo.
Ejemplo:
Se ha determinado que 85.1% de los estudiantes de una universidad
fuman cigarrillos. Se toma una muestra aleatoria de 200 estudiantes.
Calcular la probabilidad de que no más de 80% de alumnos de la
muestra fume.

Solución:
La media o valor esperado de la distribución muestral es de P=0.851 (la
proporción de la población), por lo que:

p P 0.800  0.851
z   2.0255
P(1 P) 0.851(1 0.851)
n 200
Usando las tablas de valor z, para z = -2.02 encontramos que la
probabilidad de que no más de (es decir, menos de) 80% de los
alumnos de la muestra fumen es de 0.0214 o sea 2.14%

0.0214
Suponga que de la gente que solicita ingresar a una compañía, el
40% pueden aprobar un examen de artimética para obtener el
trabajo. Si se tomara una muestra de 20 solicitantes, ¿Cuál sería la
probabilidad de que 50% o más de ellos aprobaran?

Datos:
P = 0.40, n = 20, p = 0.50

p P 0.50  0.40
z   0.9129
P(1 P) 0.40(1 0.40)
n 20
Usan tablas de valor o clasificación z, o un programa para
distribución normal estándar (como Minitab, etc.), encontramos
que el área bajo la curva hasta un valor de z = 0.9129 es de
0.81935, o sea que (1- 0.81935) = 0.1806,
por lo que la probabilidad de que 50% o más aprobaran es de
18.06%.

El área desde - ∞ hasta z= 0.9129


es de 0.81935
Supongamos el siguiente experimento: lanzar un dado común.
Ahora consideremos el evento de que nos salga el número 1.
Como sabemos, la probabilidad de que salga el número 1 es de 1/6 (el dado tiene 6 caras,
una de ellas es el uno).
• ESTIMAR RIESGOS EN INVERSIONES(EL
RIESGO DEPENDE LA VARIANZA)
• PARA APLICAR EL TEOREMA CENTRAL DEL
LIMITE
• PARA ESTIMAR DESIGUALDADES EN
INGRESOS, RENTAS, ENTRE OTROS.
2
൫𝑛 − 1)𝑆 2
2
~ 𝑥𝑛−1
𝜎

n: tamaño de la muestra
S²: varianza muestral
σ²: varianza de la población de donde se extrrajo la muestra
Encuentre la probabilidad de que una muestra aleatoria de
25 observaciones, de una poblacion normal con varianzas
igual a 6, tenga una varianza muestra:
a. Mayor que 9.1
b. Entre 3.462 y 10.745

Anda mungkin juga menyukai