UNIDAD 5
MUESTREO SISTEMTICO
El muestreo irrestricto aleatorio (m.i.a) y el muestreo aleatorio estratificado (m.a.e) requieren
de un trabajo detallado en el proceso de seleccin de la muestra. Porque las unidades de
muestreo en el marco adecuado deben de ser numeradas de modo que un mecanismo de
aleatorizacin, como una tabla de nmeros aleatorios, pueda utilizarse para seleccionar
unidades especficas de la muestra. Un diseo de muestreo que se utiliza frecuentemente
porque simplifica el proceso de seleccin de la muestra es el muestreo sistemtico (m.s).
5.1.-PRESENTACIN DEL MUESTREO SISTEMATICO
El muestreo sistemtico es un proceso de seleccin regular cuyo punto de inicio es aleatorio,
tomando un elemento de los k primeros elementos y posteriormente la seleccin de cada ksimo elemento, este tipo de muestreo es mas fcil de realizar y esta menos expuesto a
errores del encuestador.
La muestra sistemtica se define como una muestra obtenida al seleccionar aleatoriamente
un elemento de los primeros k elementos en el marco y despus cada k-simo elemento se
denomina muestra sistemtica de 1 en k.
Por ejemplo, suponga que va a seleccionarse una muestra de n nombres de una larga lista;
una forma sencilla de seleccionarlos es, eligiendo un intervalo apropiado (dependiendo de n)
y seleccionar los nombres a lo largo de la lista. De ese modo si k=10, se escoge un numero
aleatorio entre los 10 primeros elementos, suponga que fue el 4 (seleccin aleatoria), el
siguiente elemento sera el 14 luego el 24 y as sucesivamente se toma una observacin
cada 10 elementos.
Las ventajas del muestreo sistemtico son las siguientes:
1 El muestreo sistemtico es fcil de realizarse en el campo y por su forma de llevarse a
cabo est menos expuesto a los errores de seleccin que cometen los investigadores.
2 El muestreo sistemtico puede proporcionar mayor informacin por unidad de costo
que la que proporciona el muestreo irrestricto aleatorio ya que se extiende ms
uniformemente sobre toda la poblacin y por lo tanto puede proporcionar mayor
informacin que una muestra equivalente en tamao, tomada con muestreo irrestricto
aleatorio.
I
Tcnicas de Muestreo
Una consideracin importante en el muestreo sistemtico es que su precisin depende del
orden de las unidades de muestreo en el marco, ya que si estas estn dispuestas de manera
aleatoria entre todos los dems entonces la ventaja se pierde y resulta equivalente al
irrestricto aleatorio.
Otros ejemplos del uso del muestreo sistemtico se dan cuando se realiza la seleccin de
cada k- esimo cuestionario de un censo, para su validacin; cada k-esimo rengln de un libro
para su revisin; o cada k-esima manzana de mapas numerados. Las ventajas mencionadas
se acentan cuando se le encarga a un enumerador la seleccin de las unidades de
muestreo. Su instruccin puede consistir en que liste las viviendas de una manzana y que
seleccione posteriormente las unidades numeradas r, r+k, r+2k etc. (r es el punto de partida).
Tambin puede servir para supervisar el trabajo de un enumerador, durante el levantamiento
de cuestionarios en un censo, de modo que cada dcimo cuestionario sea verificado.
La ventaja de que el muestreo sistemtico produce muestras proporcionales se puede
apreciar al seleccionarla de una lista de nombres en orden alfabtico producir
aproximadamente la misma proporcin de nombres de cada letra, o tambin en el caso de
los auditores que requieren muestrear de una larga lista ordenadas en el tiempo, de cuentas
para comprobar el cumplimiento de los procedimientos de contabilidad.
Los investigadores de mercado y los encuestadores, que regularmente muestrean personas
en movimiento, frecuentemente utilizan un diseo sistemtico, por ejemplo a cada vigsimo
cliente en un mostrador de pago se le puede preguntar su opinin acerca del sabor, color o
textura de un producto alimenticio o a cada dcima persona que aborde un autobs se le
puede pedir que responda un cuestionario acerca del servicio del autobs.
Los ingenieros agrnomos pueden muestrear sistemticamente parcelas de terreno para
estimar proporcin de rboles enfermos o para estudiar patrones de crecimiento. Todas
estas muestras son sistemticas.
5.2.-OBTENCIN DE UNA MUESTRA SISTEMATICA
Los mtodos para seleccionar los datos en un muestreo irrestricto aleatorio y en un muestreo
sistemtico son muy diferentes, en el primer caso se seleccionan con una tabla de nmeros
aleatorios y en el sistemtico solamente el primer elemento se selecciona al azar entre los
primeros k elementos y luego se seleccionan los dems de 1 en k hasta que se complete la
I
Tcnicas de Muestreo
muestra.
Las muestras sistemticas se seleccionan de 1 en 3 o de 1 en 5 en general de 1 en k, ahora
cmo se selecciona el nmero k? Sabiendo que N es conocido y se puede determinar el
tamao de n, entonces k debe de ser un nmero aleatorio menor o igual que N/n o sea:
N
n
Posteriormente se selecciona cada k-esimo elemento a partir del punto de inicio hasta
completar el tamao de muestra n
Cuando N es desconocido la seleccin de k generalmente se supone para poder obtener una
muestra de tamao n pero si k se selecciona muy grande, el tamao de n que se
requiere no se podr obtener utilizando una muestra sistemtica de 1 en k de la poblacin.
Ejemplo.
En una preparatoria de 2998 estudiantes repartidos en tres grados se desea conocer la
opinin de los estudiantes sobre la utilidad del evento feria del libro que se realiza cada fin
de curso. Se puede tener la lista de los estudiantes ordenados por grado, si optamos por un
muestreo irrestricto aleatorio, posiblemente obtengamos mayor cantidad de estudiantes de
primer grado cuya opinin ser muy diferente a la de los estudiantes del segundo y del tercer
grado, ya que por las fechas en las que se realiza el evento, los estudiantes del primer grado
no tienen ninguna experiencia previa y esto dara una estimacin deficiente y alejada de la
realidad, en cambio con un muestreo sistemtico se tendran elementos proporcionales de
los tres grados.
Si seleccionamos una muestra del 10% de los estudiantes, tendremos un intervalo muestral
de k=10. Si el nmero al azar entre 1 y 10 es 4 los estudiantes con los nmeros:
4, 14, 24, 34, 44, 54,2994
conformarn la muestra. Si el nmero seleccionado al azar es el 9, entonces la muestra se
integrara con los estudiantes listados con los nmeros
9, 19, 29, 39, 49, 59,2989
En la primera muestra se tienen 300 estudiantes y en la segunda solamente 299. El tamao
de la muestra puede diferir en una unidad cuando N no es exactamente divisible entre k.
Observe que no se podr seleccionar exactamente a k cuando el tamao de la poblacin es
desconocido. Podemos determinar un tamao de muestra n aproximada, pero debemos
I
Tcnicas de Muestreo
suponer el valor de k necesario para obtener un tamao de muestra n. Si se selecciona un
valor de k muy grande, el tamao de muestra n requerida no se obtendr usando una
muestra sistemtica de 1 en k de la poblacin. Este resultado no presenta problema si el
experimentador puede volver a la poblacin y realizar otra muestra sistemtica de 1 en k
hasta obtener el tamao requerido. Sin embargo en algunas situaciones, obtener una
segunda muestra sistemtica es imposible. Por ejemplo, tomar una muestra sistemtica de 1
en 40 compradores de peridicos, es prcticamente imposible, si el tamao de la muestra es
de n=90 compradores y no se obtiene en el tiempo que los compradores pasan por la
esquina.
5.3.-ESTIMACIN DE UNA MEDIA, DE UN TOTAL Y DE UN PROPORCIN
POBLACIONAL
Sabemos que el objetivo de las encuestas por muestreo es estimar uno o ms parmetros de
la poblacin. Para estimar una media poblacional se puede utilizar la media muestral
y de
= y
yi
i=1
ys
Varianza estimada de
yi
2
y i i =1
s2 N n
V ( ys ) =
n N
en donde
s2 =
i =1
o tambin
s =
n 1
n
y i2 n y 2
i =1
n 1
N n
Con una probabilidad del 95%
s2
n
2 v( y s ) = 2
Cuando N se desconoce se elimina el factor de correccin por poblacin finita (c.p.f) de las
ecuaciones anteriores.
I
Tcnicas de Muestreo
Estimacin de un total poblacional
La estimacin de un total poblacional requiere del conocimiento del total de elementos N de
la poblacin, de manera semejante a lo que se hizo en el muestreo irrestricto aleatorio y en el
relacin:
Estimador del total poblacional
:
s = N y s
Varianza estimada de
s :
2
2
2 s N n
V ( s ) = V (Ny s ) = N V ( y s ) = N
n N
B = 2 V ( Nys ) = 2 N
n N
Es importante notar que se necesita conocer el valor de N para poder estimar cuando se
usa un muestreo sistemtico.
Estimador de una proporcin poblacional
Es comn que se desee estimar una proporcin poblacional con base en los datos de una
muestra sistemtica, en este caso al igual que en el muestreo irrestricto aleatorio las
ys , considerando
p s = y s =
i =1
n
P
Tcnicas de Muestreo
Varianza estimada de p s es:
p q N n
V ( p s ) = s s
n 1 N
en donde:
q s = 1 p s
p q N n
B = 2 V ( p s ) = 2 s s
n 1 N
aleatorio,
y esta
esto no implica que las varianzas poblacionales sean iguales, ya que la varianza de
dada por la relacin:
V ( y) =
2 N n
n N 1
V ( ys ) =
en donde
2
n
[1 + (n 1) ]
Cuando
est cercano a uno, significa que los elementos muestrales son muy
Si
Tcnicas de Muestreo
Por ltimo si
V ( ys ) puede incrementarse aun al tomar una muestra grande, por lo tanto, es muy difcil dar
un consejo general respecto a las distintas situaciones en donde se pueda utilizar un
muestreo sistemtico, para ello es necesario conocer la estructura de la poblacin para
usarlo de manera efectiva.
Ahora, es importante aclarar que la correlacin que se da entre los pares de elementos
dentro de una muestra sistemtica depende del tipo de poblacin de donde se seleccione la
muestra.
Para ello se consideran tres tipos de poblaciones:
1 Poblacin aleatoria
2 Poblacin ordenada
3 Poblacin peridica
La poblacin aleatoria es aquella en que sus elementos estn ordenados al azar.
Cuando una muestra sistemtica se selecciona de una poblacin aleatoria, se espera que
sus elementos sean heterogneos y que no tengan correlacin entre valores vecinos con
Tcnicas de Muestreo
heterognea con 0 y si N es grande puede demostrarse que V ( ys ) V ( y ) por lo que una
muestra sistemtica de una poblacin ordenada proporciona mas informacin que una
muestra irrestricta aleatoria por unidad de costo. Por ejemplo una lista de las cuentas por
cobrar pueden estar ordenadas de mayor a menor cantidad, as la estimacin de la muestra
sistemtica podra tener una varianza menor (generalmente inestimable) que la de de una
m.i.a; ya que barre con todos los valores de las cuentas.
Como no podemos obtener una estimacin de V ( ys ) con base en los datos de una muestra,
una estimacin conservadora de dicha varianza es:
s2 N n
V ( ys ) =
n N
La poblacin peridica es aquella cuyos elementos tienen variacin cclica.
Cuando una muestra sistemtica es seleccionada de una poblacin peridica, la efectividad
del muestreo sistemtico depende del valor de k.
Los elementos de este tipo de muestra pueden ser homogneos ( > 0 ) y cuando esto se da
s2 N n
V ( ys ) =
n N
Si hay una variacin peridica en la poblacin debemos de tener cuidado en el uso del
muestreo sistemtico. Por ejemplo si los hombres y las mujeres se alternan en una lista y k
es par, la muestra sistemtica solo tendr hombres o solo mujeres, por lo que la estimacin
no sera representativa del parmetro.
I
Tcnicas de Muestreo
Ejercicio 1
La seccin de control de calidad de una empresa usa el muestreo sistemtico para estimar la
cantidad promedio de llenado de latas de 12 onzas que sale de una lnea de produccin. Los
datos de la tabla adjunta representan una muestra sistemtica de 1-en-50 de la produccin
de un da. Estime y establezca un lmite para el error de estimacin. Suponga que N =
1800
Cantidad de llenado (en onzas)
12.00
11.97
12.01
12.03
12.01
11.80
11.91
11.98
12.03
11.98
12.00
11.83
11.87
12.01
11.98
11.87
11.90
11.88
12.05
11.87
11.91
11.93
11.94
11.89
11.72
11.93
11.95
11.97
11.93
12.05
11.85
11.98
11.87
12.05
12.02
12.04
Solucin:
La estimacin de esta dada por
n
i =1
ys =
430.01
= 11.94onzas
36
s =
2
i =1
n 1
5136.57 184908.6
35
36 = 0.2199 = .0063
35
Suponemos que la poblacin de latas en una lnea de produccin, es una poblacin aleatoria,
entonces la varianza la estimaremos con:
s 2 N n .0063 1800 36
V ( y s ) =
=
= 0.00017
n N
36 1800
Y el lmite para el error de estimacin al 95% de confianza, sera:
2 V ( y s ) = 2 .00017 = .0262
Tcnicas de Muestreo
En resumen estimamos que el promedio de llenado de latas de 12 onzas es de 11.94 onzas,
y el lmite para el error de estimacin con un 95% de confianza es de 0.0262 por lo que la
verdadera media del parmetro se debe de encontrar en el siguiente rango de valores
(11.91,11.97) onzas.
Ejercicio 2
La empresa del caso anterior desea estimar el total de lquido utilizado en la lnea de
produccin que se muestreo. Estime el total poblacional de la produccin de un da con un
lmite para el error de estimacin.
Respuesta
13
23
1997
1
200
= 132
i =1
Tcnicas de Muestreo
Respuesta: p = 0.66 , B=0.0637.
B = 2 V (s )
Para cualquiera de los estimadores s (media, total o proporcin poblacional) basados en un
muestreo sistemtico. Pero esta ecuacin involucra a s2 y que deben de ser conocidas o
al menos poderlas estimar de estudios previos, en estas notas utilizaremos la frmula para
calcular n que se uso en el muestreo irrestricto aleatorio, pero considerando que esta frmula
podra dar una muestra muy grande cuando la poblacin es ordenada y una muestra muy
pequea para poblaciones peridicas. Recurdese que las varianzas de y s y de y son
equivalentes cuando la poblacin es aleatoria.
Tamao de muestra requerido para estimar una media poblacional con un lmite para el
error de estimacin de B:
n=
N 2
( N 1) D + 2
en donde: D =
B2
4
Nota: 2 puede aproximarse con s2, a partir de una muestra piloto o por estudios previos
Rango
. En cualquier caso n ser un valor aproximado. Si N es grande,
4
similares o bien 2
con un
N 2
( N 1) D + 2
n=
en donde:
B2
D=
4N 2
El tamao de muestra requerido para estimar una proporcin poblacional p con un lmite
para el error de estimacin de B, ser:
Tcnicas de Muestreo
Npq
( N 1) D + pq
n=
en donde:
q = 1- p
D=
B2
4
D=
entonces:
B 2 (0 .015 ) 2
=
= 0 .00005625
4
4
N 2
1800(0.0063)
=
= 105.49 106 latas
2
( N 1) D +
(1799)(0.00005625) + 0.0063
n=
Asi:
Ejercicio 5.
en una sola muestra sistemtica, a menos que el muestreo sistemtico genere una muestra
aleatoria. Sin embargo en la mayora de los casos el muestreo aleatorio sistemtico no es
I
Tcnicas de Muestreo
equivalente al irrestricto aleatorio, entonces es aconsejable utilizar un mtodo alternativo
para estimar la varianza V ( y S ) , este mtodo alternativo es el muestreo sistemtico
replicado.
Este mtodo consiste en seleccionar varias muestras sistemticas o replicas y as poder
estimar la media poblacional , como el promedio de todas las medias muestrales
, la
960
= 16 o sea una muestra de 1 en 16
60
sistemticas
que
queremos
seleccionar.
As
para
nuestro
ejemplo
k=10k=10(16)=160.
Inmediatamente despus seleccionamos 10 nmeros aleatorios entre 1 y 160 y la constante
k=160, es la que se le adiciona a cada uno de estos 10 nmeros que sern los puntos de
inicio aleatorio de las muestras, hasta que se obtienen 10 muestras de tamao 6, por ello
siempre obtendremos 60 elementos.
Una seleccin de 10 nmeros aleatorios entre 1 y 160 es:
Tcnicas de Muestreo
2 elemento
3 elemento
6 elemento
aleatorio
muestral
muestral
muestral
166
326
806
17
177
337
817
21
181
341
821
42
202
362
842
73
233
393
873
81
241
401
881
86
246
406
886
102
262
422
902
112
272
432
912
145
305
465
945
Es comn que nS=10 ya que permite obtener suficientes medias muestrales para obtener una
estimacin satisfactoria de V ( )
Las formulas para estimar S con nS muestras sistemticas se dan a continuacin:
usando nS muestras sistemticas de 1 en k
yi
ns
i=1
en donde
Varianza estimada de
ns
(y
N n
V ( ) =
N
) 2
i =1
ns (ns 1)
B = 2 V ( )
I
Tcnicas de Muestreo
Tambin se puede utilizar el muestreo sistemtico replicado para estimar un total poblacional
= N =
i=1
yi
ns
Varianza estimada de :
ns
(y
N n
) 2
V () = N 2V ( ) = N 2
i=1
N ns (ns 1)
El lmite para el error de estimacin al 95% de confianza es:
B = 2 V ()
Ejercicio 7
Un parque estatal cobra la admisin por automvil en lugar de por persona y un funcionario
del parque quiere estimar el nmero promedio de personas por automvil para un da
efectivo en particular durante el verano. El funcionario sabe por experiencia que entrarn al
parque alrededor de 400 automviles y quiere muestrear 80 de ellos. Para obtener una
estimacin de la varianza, utiliza el muestreo sistemtico replicado con 10 muestras de 8
automviles cada una. Usando los datos que se presentan en la tabla, estime el nmero
promedio de personas por automvil y establezca un lmite para el error de estimacin
Punto de
inicio
aleatorio
Segundo
Tercer
Cuarto
Quinto
Sexto
Sptimo
Octavo
elemento
elemento
elemento
elemento
elemento
elemento
elemento
2(3)
52(4)
102(5)
152(3)
202(6)
252(1)
302(4)
352(4)
3.75
14.06
5(5)
55(3)
105(4)
155(2)
205(4)
255(2)
305(3)
355(4)
3.38
11.42
7(2)
57(4)
107(6)
157(2)
207(3)
257(2)
307(1)
357(3)
2.88
8.29
13(6)
63(4)
113(6)
163(7)
213(2)
263(3)
313(2)
363(7)
4.62
21.34
26(4)
76(5)
126(7)
176(4)
226(2)
276(6)
326(2)
376(6)
4.50
20.25
31(7)
81(6)
131(4)
181(4)
231(3)
281(6)
331(7)
381(5)
5.25
27.56
35(3)
85(3)
135(2)
185(3)
235(6)
285(5)
335(6)
385(8)
4.50
20.25
40(2)
90(6)
140(2)
190(5)
240(5)
290(4)
340(4)
390(5)
4.12
16.97
45(2)
95(6)
145(3)
195(6)
245(4)
295(4)
345(5)
395(4)
4.25
18.06
Tcnicas de Muestreo
46(6)
96(5)
146(4)
196(6)
246(3)
296(3)
346(5)
396(3)
Totales
4.38
19.18
41.63
177.41
N
n
k =
400
80
= 5
estimacin de ser:
yi
( 3 . 75 + 3 . 38 + ..... + 4 . 38
=
= 4 . 16
ns
10
ns
i =1
(y
) =
2
i =1
ns
i =1
1
y
ns
2
i
ns
y i
i =1
Sustituyendo:
ns
(y
) 2 = 177 .41
i =1
1
( 41 .63) 2 = 4.104
10
ser:
ns
(y
N n
) 2
400 80 4.104
V ( ) =
=
i =1
= 0.0365
400 10(9)
N ns (ns 1)
i
B = 2 0.0365 = 0.38
I
Tcnicas de Muestreo
Por lo que decimos que nuestra mejor estimacin del promedio de personas por automvil es
de 4.16 personas, por lo que con un 95% de confianza podemos decir que el verdadero valor
del parmetro se encuentra en el intervalo (4.160.38)