Anda di halaman 1dari 48

Enfoque Cuantitativo

Fundamentos 2: Muestreo estadstico

Ismael G. Muoz
Guillermo Jopen

Direccin de Investigacin y Documentacin Educativa


Programa de Fortalecimiento de Capacidades en Investigacin
PFCI-DIDE
Junio del 2013
Contenido
1. Estadstica e incertidumbre

2. Muestreo estadstico
a. Poblacin y muestra
b. Muestreo Aleatorio Simple
c. Error Muestral, Intervalo de Confianza y Prevalencia

3. Ejercicio prctico
a. Efecto del tamao de la poblacin
b. Efecto del tamao de la muestra
c. Efecto de la prevalencia
Fundamentos 2: Muestreo estadstico

ESTADSTICA E INCERTIDUMBRE
Estadstica e Incertidumbre
Si no existiera incertidumbre, no existiran dudas, y tomar
decisiones sera muy fcil
El prximo mes llover mucho?
Por qu las familias tienen pocos ingresos en mi localidad?
A qu se debe que los estudiantes de mi localidad no vayan a clases?
La informacin siempre es completa?
El programa social X reducir la inasistencia escolar
El incremento del rendimiento escolar se asocia a la aplicacin de la
poltica Y
La informacin siempre es incompleta!!!
El programa social X podra reducir la inasistencia escolar
El incremento del rendimiento escolar podra asociarse a la aplicacin de
la poltica Y
La Estadstica permite reducir el nivel de incertidumbre
Fundamentos 2: Muestreo estadstico

MUESTREO ESTADSTICO
Poblacin y Muestra
Observacin
Una observacin es la unidad de anlisis ms bsica
Algunos ejemplos de unidades de anlisis utilizadas en investigacin
educativa son:
Locales educativos
Instituciones Educativas (IIEE)
Estudiantes
Poblacin
Es el conjunto de observaciones disponibles
Requiere de determinada dimensin o dimensiones de anlisis:
Temporal: en el ao 2012, a enero de 2013, en el mes anterior, en
los ltimos 3 aos, etc.
Transversal: de gestin pblica, de primaria, de 4 grado de primaria,
de 5to ao de secundaria. mujeres, hombres de 3 grado de
secundaria con 15 aos, etc.
Poblacin y Muestra
Anlisis Poblacional

VENTAJAS: DESVENTAJAS:
Permite realizar un anlisis Resulta muy costoso en
detallado observacin por trminos de:
observacin, revelando las Dedicacin de tiempo
caractersticas del conjunto Recursos financieros
Peor an si es que el
conjunto es muy amplio o
grande (p. e. todos los
estudiantes del Per)
Poblacin y Muestra
Muestra
Es un subconjunto de observaciones tomadas a partir de la poblacin
de inters
Comnmente se busca que esta muestra sea representativa de la
poblacin, es decir, que comparta las mismas caractersticas y
composicin
Permite:
Reducir costos de tiempo y recursos financieros (No requiere
anlisis observacin x observacin.)
Validez interna: Realizar anlisis representativos para el conjunto
muestral
Validez externa: Si es una muestra representativa de la poblacin,
ser posible realizar anlisis representativos del conjunto
poblacional tambin
Cmo conseguir una muestra representativa?
Muestreo aleatorio simple
La forma ms sencilla es realizar un Muestreo Aleatorio Simple (MAS)
Pronto discutiremos tcnicas ms complejas (muestreo estratificado,
muestreo por etapas, etc.), pero todas sern tcnicas aleatorias.
El MAS es un sorteo sencillo entre las observaciones de la poblacin a
analizar (eleccin como en una lotera)

Poblacin

Muestra

Observacin
Muestreo aleatorio simple

El resultado del sorteo es la muestra


La muestra est compuesta por observaciones con iguales
posibilidades de ser elegidas; es decir es aleatoria
Este sorteo asegura que las observaciones que pasen a la muestra
cumplan con las mismas caractersticas de la poblacin
Adems, las muestras aleatorias permiten calcular mrgenes de error
e intervalos de confianza. Otras formas de muestreo no aleatorias
(por cuotas, por conveniencia, etc.) no lo permiten
Error muestral
Diferencia entre el valor poblacional y el obtenido mediante una
muestra
Describe el nivel de precisin de una medida (media, proporcin,
etc.) debido a la incertidumbre presente en los datos al ser
tomados de una muestra
Esta dificultad de acertar en el valor puntual, conlleva a una
estimacin por intervalos, donde es el error muestral el que se
emplea para ubicar entre qu valores se encuentra el verdadero (o
poblacional)
Cmo calcular el error muestral asociado a un intervalo de
confianza? de qu factores depende?
Estimacin del error estndar

En primer lugar, es necesario conocer el error estndar de una


determinada estimacin, el cual depender de:

n P(1 P)
e 1
N n

Error Tamao de Tamao de


Prevalencia
estndar la poblacin la muestra
Ejemplo

Queremos evaluar el impacto de una campaa para reducir el


consumo de tabaco entre adolescentes entre 12 y 16 aos de edad
en Lima Metropolitana.
Para tener datos de lnea de base, se eligi una muestra aleatoria
simple de 900 de los 17125 adolescentes de la provincia de Lima
registrados en el ltimo Censo Nacional de Poblacin y Vivienda.
279 de los adolescentes de la muestra declararon haber fumado en
el ltimo mes.
Qu podemos decir sobre la prevalencia actual del consumo de
tabaco entre los adolescentes entre 12 y 16 aos de edad en Lima
Metropolitana?
Ejemplo
Podemos calcular fcilmente la prevalencia del consumo de tabaco:
279
P 0,31 (31 por ciento)
900
Tambin podemos estimar el error estndar como:

n P(1 P)
e 1
N n

900 0,31(1 0,31)


e 1
17125 900
e 0,015 (1,5 por ciento)
Error Muestral e Intervalo de Confianza
Con base en el error estndar podemos calcular el error muestral y
los intervalos de confianza
La prevalencia estimada es 31 por ciento
con un error estndar de 1,5 por ciento
Error estndar Error estndar
(e) (e)

27 28 29 30 31 32 33 34 35

Ahora queremos calcular el error muestral asociado, por


ejemplo, a un 95 % de confianza ( =0,05)

Frmula del error muestral: E e t 2


Error Muestral e Intervalo de Confianza
Obtenemos los valores crticos de la distribucin normal

0,95
0,025 0,025

-t/2 0 t/2
Error Muestral e Intervalo de Confianza
Valores crticos en la tabla de distribucin

Probabilidad de ocurrencia

El valor crtico asociado a un 95% de confianza es 1,96


Error Muestral e Intervalo de Confianza
Obtenemos los valores crticos de la distribucin normal

0,95
0,025 0,025

-1,96 = -t/2 0 t/2 = 1,96


Error Muestral e Intervalo de Confianza
Con base en el error estndar podemos calcular el error muestral y
los intervalos de confianza
La prevalencia estimada es 31 por ciento
con un error estndar de 1,5 por ciento
Error estndar Error estndar
(e) (e)

27 28 29 30 31 32 33 34 35

Ahora queremos calcular el error muestral asociado, por


ejemplo, a un 95 % de confianza ( =0,05)

Frmula del error muestral: E e t 2

E 1,5 1,96 2,94


Intervalo de Confianza
Con base en el error estndar podemos calcular intervalos de
confianza
La prevalencia estimada es 31 por ciento
con un error estndar de 1,5 por ciento
Error estndar Error estndar
(e) (e)

27 28 29 30 31 32 33 34 35

Intervalo del 95 % de confianza ( =0,05)


31 (1,5 1,96) 31 2,94

Intervalo del 99 % de confianza ( =0,01)


31 (1,5 2,58) 31 3,87
Efecto del tamao de la poblacin

n P(1 P)
e 1
N n
Correccin de En la prctica, casi
poblacin siempre es tan cercana
finita a 1 que podemos
ignorarla
Efecto del tamao de la poblacin
Tamao de la
muestra
necesaria
para obtener
una precisin
determinada

En la prctica, el tamao de la
poblacin incide muy poco
sobre el tamao de la muestra

Tamao de la poblacin
Efecto del tamao de la muestra

Error
estndar Para reducir el error a la mitad
hay que cuadruplicar la muestra
Pero en la prctica podra ser muy costoso

Tamao de la muestra
Despejando para calcular el tamao de muestra ptimo

n P(1 P)
e 1
N n
E e t 2
E n P (1 P )
1
t 2 N n

t 2 P(1 P) N
2

n
E ( N 1) t 2 P(1 P)
2 2
Fundamentos 2: Muestreo estadstico

EJERCICIO PRCTICO
Ejercicio

En esta sesin vamos a plantear algunos problemas de muestreo


aleatorio simple

Puede seguir el ejercicio haciendo uso del archivo excel Ejercicio


prctico Muestro

Recordemos el ejemplo sobre el consumo de tabaco entre


adolescentes entre 12 y 16 aos de edad en Lima Metropolitana
Clculo del error estndar

Tengamos en cuenta los siguientes datos:

Tamao de la poblacin: 17125 adolescentes (N = 17125)


Tamao de la muestra: 900 adolescentes (n = 900)
Prevalencia del consumo de tabaco: 31% (P = 0,31)

Pregunta: Cul es el error estndar o error muestral?


Clculo del error estndar
Tamao de Tamao de Error
Prevalencia
la poblacin la muestra estndar
(N) (n) (P) (e)

17125 900 0.31 1.50 %


Efecto del tamao de la poblacin

Recordemos los datos originales:


N = 17125, n = 900, P = 0,31 => e = 1.50 %

Y si el tamao de la poblacin aumentara a 30000


adolescentes, pero nuestro presupuesto no permite aumentar
la muestra:
N = 30000, n = 900, P = 0,31

Pregunta: Cul sera el nuevo error estndar?


Efecto del tamao de la poblacin
Tamao de Tamao de Error
Prevalencia
la poblacin la muestra estndar
(N) (n) (P) (e)

17125 900 0.31 1.50 %

30000 900 0.31 1.52 %


Efecto del tamao de la poblacin

Y si el tamao de la poblacin aumentara an ms a 50000


observaciones
N = 50000, n = 900, P = 0,31

Pregunta: Cul sera el nuevo error estndar?


Efecto del tamao de la poblacin
Error
Tamao de Tamao de
Prevalencia estnda
la poblacin la muestra
r
(N) (n) (P) (e)

17125 900 0.31 1.50 %

30000 900 0.31 1.52 %


50000 900 0.31 1.53 %
Efecto del tamao de la poblacin

Y si ahora el tamao de la poblacin disminuyera a 1000 a


observaciones
N = 1000, n = 900, P = 0,31

Pregunta: Cul sera el nuevo error estndar?


Efecto del tamao de la poblacin
Tamao de Tamao de Error
Prevalencia
la poblacin la muestra estndar
(N) (n) (P) (e)

17125 900 0.31 1.50 %

30000 900 0.31 1.52 %


50000 900 0.31 1.53 %
1000 900 0.31 0.49 %
Efecto del tamao de la poblacin

Conclusin:

El tamao de la poblacin influye muy poco sobre la


precisin de una muestra de un tamao dado.

Excepto en los casos de poblaciones muy pequeas


Efecto del tamao de la muestra

Recordemos los datos originales:


N = 17125, n = 900, P = 0,31 => e = 1.50 %

Ahora supongamos que podemos duplicar el tamao de la


muestra, es decir ahora contamos con 1800 observaciones:
N = 17125, n = 1800, P = 0,31

Pregunta: Cul sera el nuevo error estndar?


Efecto del tamao de la muestra
Tamao de Tamao de Error
Prevalencia
la poblacin la muestra estndar
(N) (n) (P) (e)

17125 900 0.31 1.50 %

30000 900 0.31 1.52 %


50000 900 0.31 1.53 %
1000 900 0.31 0.49 %
17125 1800 0.31 1.03 %
Efecto del tamao de la muestra

Ahora supongamos que tenemos que reducir el tamao de la


muestra a la mitad, es decir a solo 450 observaciones:
N = 17125, n = 450, P = 0,31

Pregunta: Cul sera el nuevo error estndar?


Efecto del tamao de la muestra
Tamao de Tamao de Error
Prevalencia
la poblacin la muestra estndar
(N) (n) (P) (e)

17125 900 0.31 1.50 %

30000 900 0.31 1.52 %


50000 900 0.31 1.53 %
1000 900 0.31 0.49 %
17125 1800 0.31 1.03 %
17125 450 0.31 2.15 %
Efecto del tamao de la muestra

Conclusin:

El error se reduce al aumentar el tamao de la muestra,

Este cambio es significativo


Efecto de la prevalencia
Recordemos los datos originales:
N = 17125, n = 900, P = 0,31 => e = 1.50 %

Ahora supongamos que las prevalencias pueden variar de la


siguiente manera:
N = 17125, n = 900, P = 0,25
N = 17125, n = 900, P = 0,75
N = 17125, n = 900, P = 0,90
N = 17125, n = 900, P = 0,10

Pregunta: Cules seran los nuevos errores estndar?


Efecto de la prevalencia
Tamao de Tamao de Error
Prevalencia
la poblacin la muestra estndar
(N) (n) (P) (e)

17125 900 0.31 1.50 %

30000 900 0.31 1.52 %


50000 900 0.31 1.53 %
1000 900 0.31 0.49 %
17125 1800 0.31 1.03 %
17125 450 0.31 2.15 %
17125 900 0.25 1.40 %
17125 900 0.75 1.40 %
17125 900 0.90 0.97 %
17125 900 0.10 0.97 %
Efecto de la prevalencia

Finalmente supongamos que la prevalencia toma el valor


medio, es decir 0,50:
N = 17125, n = 2000, P = 0,50

Pregunta: Cul sera el nuevo error estndar?


Efecto de la prevalencia
Tamao de Tamao de Error
Prevalencia
la poblacin la muestra estndar
(N) (n) (P) (e)

17125 900 0.31 1.50 %

30000 900 0.31 1.52 %


50000 900 0.31 1.53 %
1000 900 0.31 0.49 %
17125 1800 0.31 1.03 %
17125 450 0.31 2.15 %
17125 900 0.25 1.40 %
En P = 0,50
17125 900 0.75 1.40 %
el Error es
17125 900 0.90 0.97 %
mximo
17125 900 0.10 0.97 %
17125 900 0.50 1.62 %
Efecto de la prevalencia

El error es mximo
cuando P = 0,5
El mximo es plano:
El error no vara mucho
entre P = 0,2 y P = 0,8

Cuando P disminuye, el
error absoluto tambin
disminuye
Efecto de la prevalencia

Conclusin:

El error es mximo cuando la prevalencia es 50 %

El mximo es plano: Si la prevalencia no es muy pequea


ni muy grande, el error es muy parecido al mximo

Si la prevalencia es muy pequea, el error estndar


disminuye
Resumen y conclusiones
Tamao de Tamao de Error
Prevalencia
la poblacin la muestra estndar
(N) (n) (P) (e)

17125 900 0.31 1.50 % El tamao de la


poblacin importa poco

30000 900 0.31 1.52 %


El tamao de la muestra
50000 900 0.31 1.53 %
importa, pero puede
1000 900 0.31 0.49 % salir caro
17125 1800 0.31 1.03 %
17125 450 0.31 2.15 % La prevalencia slo
17125 900 0.25 1.40 % importa cuando es muy
17125 900 0.75 1.40 % baja o muy alta
17125 900 0.90 0.97 %
17125 900 0.10 0.97 % El error es mximo para
17125 900 0.50 1.62 % P = 50%
Enfoque Cuantitativo
Fundamentos 2: Muestreo estadstico

Ismael G. Muoz
Guillermo Jopen

Direccin de Investigacin y Documentacin Educativa


Programa de Fortalecimiento de Capacidades en Investigacin
PFCI-DIDE
Junio del 2013