Anda di halaman 1dari 13

Sampling Sistematik

Pengertian sampling sistematik : adalah salah satu metode penarikan sampel


dengan menggunakan interval sampel dalam melakukan pemilihan sampel
Sampling sistematik muncul dikarenakan beberapa hal:
1. Pada penarikan sampel acak sederhana setiap unit dipilih dengan menggunakan
tabel angka random. Salah satu kelemahan dari cara ini adalah :
a. Secara teoritis apabila populasi bersifat heterogen, maka
dimungkinkan mengelompok pada salah satu karakteristik tertentu

sampel

b. Secara operasional lapangan sampel dapat mengelompok pada lokasi


tertentu atau terdapat lokasi sulit dengan sampel sedikit, yang mengakibatkan
biaya lapangan menjadi tinggi. Hal ini bersifat inefisien.
2. Karakteristik sampel diharapkan bersifat representatif atau mewakili karakteristik
populasi, sehingga diharapkan sampel terpilih bersifat proporsional. Dengan
sampling acak hal ini sulit dijamin tercapai, karena bisa jadi sampel sudah
mewakili karakteristik populasi tetapi belum proporsional. Proporsional artinya
jumlah sampel pada karakteristik tertentu sudah sebanding dengan jumlah
populasinya.
Karena alasan diatas maka diterapkan penarikan sampel secara sistematik, dengan
hanya mengambil satu angka random saja dan lainnya akan mengikuti dengan
menghitung intervalnya. Sistematik disini adalah sistematik linier.
Salah satu yang sederhana adalah penggunaan sistematik linear dengan cara
sebagai berikut:
a. Hitung interval, yaitu

N
n

b. Tentukan satu angka random yang lebih kecil atau sama dengan intervalnya.
Angka random ini selanjutnya disebut angka random pertama R1.
Angka random selanjutnya
R2 = R1 + I
R3 = R2 + I = R1 + 2I
.
.
Rn = Rn-1 + I = R1 + (n-1)I
Rn digunakan sebagai kontrol apakah penarikan sampel sudah benar.
Misal banyaknya unit dalam populasi N = 30 dan banyaknya unit dalam sampel n
= 5, maka I = 6 sehingga R1 < 6 katakan 2, maka yang harus dipilih adalah nomor
2, 8, 14, 20, dan 26 yang harus dicek dengan Rn = R1 + (n-1)I = 2 + 4(6) = 26.
Selain untuk mempermudah penarikan sampel, penarikan sampel sistematik juga
dapat meningkatkan efisiensi, misal dengan mengadakan pengaturan unit-unit
(systematic arrangement). Seperti pada contoh soal acak sederhana, elemen terletak
dengan urutan sebagai berikut:
Elemen

Nilai karakteristik

12

10

urutan letak elemen diubah menjadi:


Elemen

Nilai karakteristik

10

12

Lebih lanjut pengaturan unit-unit tersebut dapat berupa membentuk implicit


stratification. Pembentukan strata pada populasi tidak ditujukan untuk melakukan
pendugaan atau estimasi setiap strata, akan tetapi ditujukan agar sampel lebih
proporsional.
Pertanyaan : Kalau memakai implicit stratification, kenapa pakai sistematik? Kenapa
tidak menggunakan stratifikasi saja?
Master blok sensus, master wilayah (desa/kota, kecamatan, kab) sudah diberi nomor
urut tertentu. Pemberian nomor urut wilayah desa/kota dan blok sensus misalnya
dari ujung barat daya secara zig-zag, dimaksudkan apabila dilakukan penarikan
sampel secara sistematik, sampel akan menyebar secara proporsional di seluruh
wilayah.
Metode estimasi yang digunakan, karena biasanya sampling sistematik semata-mata
hanya untuk mempermudah penarikan sampel, adalah sama dengan acak
sederhana.
Notasi Matematis
Jika populasi N diambil n sampel, maka I = N/n
Jika k= banyaknya kemungkinan sampel dengan interval = I
Contoh N = 4 n = 2 maka, I = 2, k = 2 . Populasi A B C D
i = 1, 2 (k)
j = 1, 2 (n)

j \ i

yi

y1

y2

Si

S1

S2

Variance between : S b V ( y i )
k

Sw

Si
i 1

(y
i 1

Y ) 2 /( k 1)

( yij yi ) 2
i 1 j 1

(n 1) k

S2

( y
i 1 j 1

ij

Y )2

nk 1
2

Sampling sistematik akan lebih efisien dibandingkan SRS jika S w S 2


Estimation of Mean and True Sampling Variance:

y sys

y
j 1

is unbiased estimator of Y

n
k

True Sampling Variance of Mean :


k

V ( y sys )
n

k 1 2
Sb
k

(y
i 1

i 1 j 1

(nk 1) S 2 k (n 1) S w nkV ( y sys ) 2 w


2

Y )2

(nk 1) S 2 ( y ij Y ) 2 ( y ij y i ) ( y i Y )
i 1 j 1

We also can defined :


k

V ( y sys )

(y
i 1

Y )

i 1

j 1

( yij Y ) 2
k

(nk 1) S 2
1 (n 1)
n2k

Comparison of Efficiency with SRS:

V ( y sys )
V ( y srs )

( N 1)
1 (n 1)
( N n)

Estimation of Sampling Variance:


Unbiased estimator:
m

V ( y sys ) v( y sys )

( yi y sys ) 2
i 1

m( m 1)

y sys

y
i 1

ij

Biased Estimator:
a. Simple Random Sampling:
n

v( y sys )

(y
N n

N n 2
s
Nn
Nn

j 1

ij

yi ) 2

( n 1)

b. Pair Selection:
n 1

v( y sys )

(y
N n
j 1

Nn

ij

y ij 1 ) 2

2(n 1)

c. Succesive Difference

n 1

v( y sys )

(y
k 1
j 1

ij 1

y ij ) 2

2( n 1)

Estimation Total and Sampling Variance:


Y Ny sys

Unbiased estimator:
m

V (Y ) V ( Ny sys ) N v( y sys ) N
2

( yi y sys ) 2

2 i 1

y sys

m(m 1)

y
i 1

ij

Biased Estimator:
a. Simple Random Sampling:
n

N n 2
v (Y ) v( Ny sys ) N 2
s
Nn

(y
N ( N n)
j 1

ij

yi ) 2

(n 1)

b. Pair Selection:
n 1

v (Y ) v ( Ny sys )

(y
N ( N n)
j 1

ij

y ij 1 ) 2

2( n 1)

c. Succesive Difference
n 1

v (Y ) v ( Ny sys ) N (k 1)

(y
j 1

ij 1

y ij ) 2

2(n 1)

Probability Proportional To Size Sampling:


a. PPS sampling digunakan umumnya apabila unit berupa kelompok atau
cluster atau elemen populasi yang mempertimbangkan size (ukuran) tertentu
b. Unit berupa cluster, contoh blok sensus .dibahas di Cluster Sampling
(MPCII)
c. Unit berupa elemen populasi yang mempertimbangkan size, contoh
rumahtangga dengan size jml anggota rt, perusahaan dengan size jml tenaga
kerja, omset, nilai produksi, dll
d. Informasi size berasal dari kerangka sampel, jika tidak ada size pakai SRS
atau sistematik sampling. Penggunaan size yang tepat meningkatkan akurasi
dan efisiensi estimator, karena probability terpilihnya ultimate sampling unit
atau unit observasi yang dijadikan target survei akan semakin besar.
e. Metode pemilihan sampel menggunakan metode Kumulatif atau metode
Lahiri.
f.

Metode Kumulatif lebih sering digunakan dibandingkan metode Lahiri.

g. Nilai Peluang terpilih setiap unit adalah =


sistematik = 1 / N . Dimana

X i / X X i / X i . SRS or
i 1

h. Sampling fraction = jumlah sampel x nilai peluang. PPS = nX i / X . SRS or


sistematik = n / N . Sampling fraction adalah 1/weighting. Weighting atau
Penimbang merupakan suatu ukuran yang menyatakan nilai kelipatan untuk
perkiraan populasi.
i.

PPS terbagi 2 : PPS WR (with Replacement) dan PPS WOR (without


Replacement). PPS WOR lebih kompleks dalam hal nilai peluang.

Metode Kumulatif
Unit Size ( X i )

Kumulatif Range

30

30

1-30

24

54

31-54

15

69

55-69

22

91

70-91

40

131

92-131

Probability Proportional To Size Random & Sistematik Sampling:


PPS Random menggunakan angka random untuk memilih setiap sampel. Misal n=3,
Contoh diatas total size = 131 (3 digit), maka dengan TAR 3 kolom dipilih angka
random sebanyak 3 kali yang lebih kecil atau sama dengan 131, contoh 021, 082,
104. Maka 021 jatuh pada range 1-30 (unit 1 terpilih 1), 082 jatuh pada range 70-91
(unit 4 terpilih 2), dan 104 jatuh pada range 92-131 (unit 5 terpilih 3)
PPS Sistematik menggunakan TAR hanya untuk Random Pertama, selanjutnya
menggunakan interval. Interval dalam PPS : I X / n X i / n dan untuk unit
terpilih selanjutnya menggunakan rumus sistematik biasa: Rn R1 ( n 1) I
Stratified PPS Random/Sistematik Sampling:
Populasi dibagi dalam strata-strata, selanjutnya setiap strata dipilih sampel dengan
PPS random or sistematik.

Strata 1
Unit

Size ( X 1i )

Strata h
Kumulatif

Unit

Size ( X hi )

Kumulatif

X 11

X 11

X h1

X h1

X 12

X 12 X 11

X h2

X h 2 X h1

.....

.....

.....

.....

X hNh

X h X hi

...

N1

X 1N 1

N1

X 1 X 1i

...
Nh

i 1

Nh

i 1

Lahiris Method:
Jika N=jumlah populasi & M=size terbesar, maka ambil angka random sebanyak n
(jumlah sampel), dimana jumlah digitnya/kolom TAR sebanyak digit N + digit M.
Selanjutnya angka random terpilih adalah angka random dimana digit pertama
sebanyak digit N nilainya N dan digit kedua sebanyak digit M nilainya size unit
senilai pertama
Unit Size ( X i )
1

30

24

15

22

40

Contoh diatas, N=5, M=40 jika diambil n=2


Maka ambilnya angka random sebanyak 2 kali. Angka random terdiri dari 3 kolom (N
= 1 digit + M = 2 digit).
Jika terpilih 112 maka diterima karena 15 dan 1230 (30 size unit 1), unit 1 terpilih
Jika terpilih 325 maka ditolak meskipun 35 tetapi 25>15 (15 size unit 3), unit 3 tidak
terpilih
Jika terpilih 518 maka diterima karena 55 dan 1840 (40 size unit 5), unit 5 terpilih
Estimation of Total, Mean using PPS WR in Random/Sistematik:
Total:

1 n y
X n y
Y i i
n i 1 pi
n i 1 X i
Y adalah estimator yang unbiased terhadap Y . Buktikan!.

misal : y i = karakteristik/ nilai pengeluaran sebulan pada rumahtangga sampel ke-i

Xi

pi X i / X

20

145

20/145

14

145

14/145

32

145

32/145

15

145

15/145

40

145

40/145

24

145

24/145

Unit
pop

yi

2500000

1250000

Mean:

1 n yi
X n yi
y Y

Nn i 1 pi Nn i 1 X i
Estimation of Total, Mean using PPS WR in Stratified Random/Sistematik:
Total:
L
L
L
X h nh y hi
1 nh y hi

Y Yh

h 1
h 1 n h i 1 p hi
h 1 n h i 1 X hi

Mean:
L

y Y

N Y
h 1
L

h h

N
h 1

Y
Yh h
Nh

y hi = karakteristik/ nilai pengeluaran rumahtangga sampel ke-i strata-h


X hi = size rumahtangga sampel ke-i strata-h, misal size adalah jumlah art

X h = total size strata-h


n h = sampel strata-h

N h = populasi strata-h

Variance of Total, Mean using PPS WR in Random/Sistematik:


Variance of Total

1 N
V (Y ) pi i Y
n i 1 pi

Variance of Mean

yi

1 N
V (Y ) pi
Y
n i 1 Np i

Estimation of Variance Total, Mean using PPS WR in Random/Sistematik:


Est .Variance of Total

v(Y )

n
yi

n(n 1) i 1 p i

Est. Variance of Mean

v(Y )

n
yi

1
pi
Y

n(n 1) i 1 Np i

n(n 1) N 2

yi

i 1 p i

nY 2

Estimation of Variance Total, Mean using PPS WR in Stratified Random/Sistematik:


Est .Variance of Total
L

h 1

h 1

v(Y ) v(Yh )

nh
y hi

Yh

n h ( n h 1) i 1 p hi

Est. Variance of Mean


L

h 1

h 1

v(Y ) v(Yh )

nh
yhi

1
phi
Yh

nh (nh 1) i 1
N h phi

yhi

i 1 phi

2
h 1 nh ( nh 1) N h

nh

PPS WOR (Horvitz-Thompson Estimator/Unordered Estimator)


a. Jika sampling fraction kecil pada survei berskala besar, maka tingkat efisiensi
antara WR dan WOR tidak terlalu berbeda secara significant.
b. Aplikasi WOR untuk survei berskala besar tidaklah gampang dan sangat
rumit
Prosedur secara umum:
Probabilita terpilihnya unit ke i setelah unit ke j terpilih

2
nhYh

pi / j

Xi
pi
Xi

X
Xj X Xj
(1 p j )
1
X

Horvitz-Thompson Estimator
Jika p i

Xi
adalah probabilita terpilihnya unit ke-i dengan WR, maka probabilita unit
X

ke-i terpilih secara WOR:

i pi
j i

pj

pi 1

(1 p j )
(
1

p
)
j

i
j

p j pi

pengembangan rumus, untuk dua unit katakan Ui dan Uj terpilih sampel secara
WOR, maka nilai probabilitanya

ij pi p j 1

(
1

p
)
j
i
j

Estimator Total (HT Estimator):


n

YHT y i / i
i 1

Sampling Variance :

(1 i ) y i
V (YHT )

i
i 1
i 1 j i
N

( ij j i )

j i

yi y j

Ratio Estimator dalam SRS


a. Dalam banyak survei variabel pembantu
meningkatkan akurasi dan efisiensi suatu survei

dapat

digunakan

untuk

b. Variabel pembantu adalah yang berkorelasi erat dengan karakteristik survei


c. Dalam Stratified atau PPS, variabel pembantu tersedia sampai level terendah
seperti rumahtangga atau elemen terkecil
d. Dalam kasus variabel pembantu tersedia dalam level tertinggi (aggregat saja)
atau tidak dapat digunakan karena akurasi lemah, masalah muncul apakah
variabel pembantu (auxiliary var) dapat dipakai?
e. Dapat dipakai dan estimator jenis ini disebut ratio atau regresi estimator
f.

Ratio bersifat bias karena tersedia pada level aggregat, akan konsisten jika
sampel cukup besar

g. Contoh dalam PPS atau direct estimate menggunakan hasil listing, size tidak
mencerminkan kondisi sebenarnya, untuk pemilihan sampel boleh, tapi untuk
estimasi akan bermasalah???

h. Contoh dalam Susenas.....


i.

Yang dibahas penggunaan ratio estimator pada SRS.

Notasi:
y i = karakteristik under study
x i = variabel pembantu

Y = total unit y
X = total unit x
maka nilai rasio :

Y
R

Y
Y

X
X

Y
y y

x x
X

Bias dalam SRS:


Y
E( y)
E ( R x )
B ( R ) R E ( R )
E ( R )
E ( R )
E ( R )
X
E(x)
E(x)
) E (R
x) E(x )E(R
) Cov ( R
, x)
E ( x ) B( R

Cov ( R , x )
Cov ( R , x )
B ( R )

E(x)
X

Cov ( R , x )

rR , x

masih ingat bahwa korelasi

, maka B ( R )

rR , x R x
X

jika rR , x 0 , maka Bias = 0


Bias for Estimator Total dan Rata2:
X ) XB ( R
)
B (Y ) B ( R
X ) XB ( R
)
B (Y ) B ( R

Variance of Bias:
In SRS WOR for large n (large sample), an aproximation of Variance of Bias :
y

V ( R ) E ( R E ( R )) 2 E ( R R ) 2 E
R
x

1
1
V ( R ) 2 E ( y Rx ) 2 2 E

X
X

1
V ( R )
X 2

V ( R )

x
R
n

y Rx
E

E ( y ) R E ( x )
i

(1 f ) N ( y i Rxi ) 2
N 1 atau
nX 2 i 1

10

(1 f ) 2
2
V ( R )
S y R 2 S x 2 RS x S y dimana
2
nX
N

(y
i 1

Y )( xi X )

( N 1) S x S y

Koefisien korelasi x dan y

Variance of estimator Total and Rata2:


N
( y i Rxi ) 2
(1 f ) N ( y i Rxi ) 2
2 (1 f )
V (Y ) V ( R X ) X 2

N
N 1
N 1
n i 1
nX 2 i 1

(1 f ) N ( y i Rxi ) 2 (1 f ) N ( y i Rxi ) 2
V (Y ) V ( R X ) X 2
N 1 n
N 1
nX 2 i 1
i 1
Estimator Variance of Bias:
In SRS WOR for large n (large sample), an aproximation of Estimator Variance of
Bias :

(1 f ) n ( y i R xi ) 2 (1 f ) n ( y i rxi ) 2
v( R )
atau
n 1 nX 2
n 1
nX 2 i 1
i 1

(1 f ) 2
2
v( R )
s y r 2 s x 2 rs x s y dimana
2
nX
n

(y
i 1

y )( xi x )

(n 1) s x s y

Koefisien korelasi x dan y dari sampel

Estimator Variance of Total and Rata2:

(1 f ) n ( yi rxi ) 2
(1 f ) 2
2
v(Y ) v(rX ) N 2
N 2
s y r 2 s x 2 rs x s y

n i 1
n 1
n

(1 f ) n ( y i rxi ) 2 (1 f ) 2
2

v(Y ) v(rX )

s y r 2 s x 2 rs x s y

n i 1
n 1
n

Dari rumus variance:


1. Semakin kuat korelasi antara y (variabel yang diestimasi) dan x (variabel
pembantu) maka variance semakin kecil. Contoh: jika Susenas menggunakan
jumlah penduduk atau rumahtangga sebagai variabel pembantu (X), maka rasio
yang terbentuk misalnya rasio jumlah penduduk dengan tingkat pendidikan
tertentu terhadap total penduduk (rasio=proporsi) dari data sampel akan
menghasilkan estimator jml penddk dengan tingkat pendidikan yang memiliki
akurasi baik (variance minimum)

11

2. Semakin besar n, maka variance minimum. Disamping itu jika X dan Y


berkorelasi kuat maka korelasi r dan x akan semakin kecil (mendekati nol).
Berdasarkan rumus di depan jika rR , x 0 , maka bias=0. Ini yang menyebabkan
bahwa rasio estimator disebut sebagai estimator bias tapi konsisten.
Cov ( x, y )
( y i rx i ) 2
2
2
s y r 2 s x 2 rs x s y , ingat
Coba buktikan bahwa
sx s y
n 1
i 1
n

Perbandingan efisiensi estimator rata2 antara bias estimator dan SRS:

v(Y )rasio

v(Y ) srs

(1 f ) 2
2
2
2
s y r 2 s x 2 rs x s y
s y r 2 s x 2 rs x s y
n

2
(1 f ) 2
sy
sy
n

Bias estimator akan lebih efisien (variance lebih kecil) dibandingkan SRS, jika

s y r 2 s x 2 rs x s y < s y
2

2
r 2 s x 2 rs x s y 0 , maka

rs x
2s y

Separate & Combine Ratio Estimator in Stratified Random Sampling


dan Product Estimator
Separate estimator :
Pada dasarnya pada separate estimator prinsip estimasi dilakukan tiap strata,
sehingga estimator variance total dan rata2 :

L
L
y
2 (1 f h )
2
2
2
v(Yrs ) v(rh X h ) N h
s yh rh s xh 2 h rh s xh s yh dimana rh h
xh
nh
h 1
h 1

L
L
(1 f h )
2
2
2
v(Yrs ) v(rh X h )
s yh rh s xh 2 h rh s xh s yh
nh
h 1
h 1

ingat h

s xhyh
Cov ( x h , y h )

maka h s xh s yh s xhyh , rumus menjadi:


s xh s yh
s xh s yh

L
2 (1 f h )
2
2
2
v(Yrs ) N h
s yh rh s xh 2rh s xhyh
nh
h 1

L
(1 f h )
2
2
2
v(Yrs )
s yh rh s xh 2rh s xhyh
nh
h 1

Combine estimator :
Perbedaan dengan separate, penghitungan r (rasio) dihitung gabungan seluruh
strata, bukan setiap strata.

12

Y
y
rh rc str str
X str x str

w y
h 1
L

w x
h 1

h 1

h 1

v(Yrs ) v( rh X h ) N h

, maka

h h

(1 f h )
2
2
2
s yh rh s xh 2 h rc s xh s yh
nh

L
L
(1 f h )
2
2
2
v (Yrs ) v(rh X h )
s yh rh s xh 2 h rc s xh s yh
nh
h 1
h 1

Jika rasio setiap strata sama, maka separate dan combine menghasilkan rasio yang
sama, bukti:

rh

yh
y

xh
x
L

rc

N h yh
h 1
L

N x
h 1

h h

y N h xh
h 1
L

x N h xh

y
rh
x

terbukti

h 1

13

Anda mungkin juga menyukai