Anda di halaman 1dari 10

Varying Probability Sampling

6.1 Ukuran Unit


Kadangkala memilih sampel yang memiliki peluang tidak sama memberikan penduga yang
lebih efisien daripada pengambilan sampel yang memiliki peluang sama. Metode ini dikenal
dengan unequal atau varying probability sampling. Pada varying probability sampling yang
umum digunakan, pemilihan unit dilakukan secara proporsional atau berimbang dengan
ukuran penimbang yang diberikan dimana ukuran penimbang tersebut adalah variabel
tambahan (auxiliary variable) yang berhubungan dengan karakteristik y yang sedang diteliti
sehingga metode ini disebut dengan Probability Proportional to size (PPS).
Contoh penggunaan metode PPS misalnya jumlah penduduk pada wilayah yang sama
pada tahun sebelumnya yang merupakan variabel tambahan bagi penelitian karakter sosial
ekonomi penduduk yang sama pada masa sekarang. Contoh lainnya misal pada survei
industri, banyaknya pekerja dapat diambil sebagai ukuran besar kecilnya industri.
6.2. Pemilihan Sampel pada PPS Sampling
Misal total populasi Y dari variabel y sebanyak N unit dapat diduga dengan
mengambil satu sampel dengan metode PPS dimana unit tersebut memiliki karakteristik lain,
x yang berhubungan dengan y. Jika

( Xi , Y i)

adalah nilai dari

x i dan

U i , i=1,2,3 , N , maka peluang terpilihnya U i adalah

X = X i
i=1

. Bila unit yang terpilih memiliki nilai

bias bagi Y adalah

y
Y^ = 1
p1
(6.1)

p1=

x1
X

x 1 dan

y i dari unit ke

Pi=X i / X ,

y 1 , maka penduga tak

Untuk

E ( Y^ )= ( Y i / P i ) Pi=Y , varians sampel dari Y^


i=1

adalah

2
N
N
Yi
Y 2i
^
V ( Y )=
Y P i= Y 2
i=1 P i
i=1 Pi

(6.2)

Dari formula ini, terlihat bahwa varians akan mengecil jika


sebanding dengan

Pi kurang lebih

Y i . Pada kenyataannya, Varians akan bernilai 0 ketika

Pi dan

Y i benar benar sebanding. Dengan demikian, dapat disimpulkan bahwa ketika


hubungan antara x dan y mengikuti garis regresi linear melewati titik pusat, metode PPS
Sampling akan sangat efisien.
Hal yang menarik adalah bahwa SRS merupakan kasus yang sama dengan PPS
Sampling, dimana

Pi=1/ N , i=1,2,3 , N , dan bahwa pada SRS formula (6.1) dan

(6.2) untuk penduga dan variansnya menjadi

Y^ =N y i dan V ( Y^ )=N 2 2 .

6.3. PPS Sampling with Replacement


Seperti pada SRS-WR, sampel sebanyak n dengan PPS Sampling juga dapat
dilakukan dengan pengembalian. Penduga dari Y pada PPS-WR adalah

y
1
Y^ = S ni=1 i
n
pi
(6.3)
Dengan varians sampel

1
V ( Y^ )= 2 Sni=1 V
n

yi
1
= Sn
p i n2 i=1

( )

{ ( ) }
2

i=1

Yi
Y Pi
Pi

2
N
N
Yi
Y 2i
1
1
Y
P
=

Y 2
i
n i=1 Pi
n i=1 Pi

Nilai kovarians

{ ( )}
y i y 'i
Cov
,
p i p'i

(6.4)

i ' i, bernilai nol. Hal ini menunjukkan bahwa

varians dari penduga berimbang dengan ukuran sampel n seperti pada metode sampling SRSWR.
Nilai harapan dan varians dari
N
yi
1
^
Y = r i
n i=1
pi ,

Dimana

Y^

pada (6.3) dapat ditulis dalam bentuk

r i =n

(6.5)

i=1

r i adalah jumlah kejadian dari U i pada sampel dan bernilai 0 ketika U i

tidak terpilih. Ingat bahwa

E ( r i )=n P i , V ( r i )=n Pi ( 1Pi ) ,


N

Dan

dan

Cov ( r i , r ,i ) =n Pi P'i

y
pi

1
i
E ( Y^ )= E(r i ) =Y
n

i=1

1
V ( Y^ )= 2
n

Y i Y 'i
V ( r i ) P2 + Cov ( r r ) P P'
i=1
i=1 i i
i
i
i
N

Y 2i

'

'
i, i

1Pi
()

2
i

N
N
Y
Y i Y 'i
Pi i=1 i i
'

i=1

1

n

v ( Y^ ) =

Y 2i
P Y 2
i=1
i
N

y
y
1
1
Sni=1 i Y^ =
Sni=1 i2 n Y^ 2
pi
n (n1)
n (n1)
pi

(6.6)

6.4. Efisiensi PPS Sampling


PPS Sampling diharapkan lebih efisien daripada SRS, dimana variabel yang diteliti y
sebanding dengan variabel tambahan x. X dan y berhubungan secara linear dan mengikuti
garis regresi yang melewati titik pusat.
Misal unit

U i memiliki ukuran

masing memiliki peluang yang sama


memiliki peluang

X i dimana

X i merupakan sub unit, masing

(Y i / X i ) . Maka anggota ke-j dari sub unit

Xi

Z ij =(Y i / X i) dimana j= 1,2,..., X i . Terlihat bahwa dengan PPS

Sampling, peluang terpilihnya suatu unit sebanding dengan jumlah sub unitnya.
Jika

U ij adalah unit yang terpilih, maka penduga tak bias dari total populasi adalah

Xi

Xi

Z ij= Xi =Y
j=1

i=1 j =1
N

Z=
i=1

Berdasarkan pemilihan sampel dengan SRS, maka

Yi
Yi
X=
Xi
Pi

( )

Y^ =Z ij X =

dimana

Pi =

Xi
X

Penduga tersebut sama dengan penduga yang didapat dengan PPS sampling.
Sedangkan penduga varians dari
N

Xi

Y^

adalah

= Z =Y
Z
dimana
X X

V ( Y^ )= X ( Z ij Z )
i=1 j=1

X 2 2Z

Nilai penduga tersebut sama dengan

dimana

2Z adalah varians dari

Z ij . Substitusikan (Y i / X i ) pada Z ij , maka didapat


X
2
N
Yi Y 2 N Yi
^
V ( Y )= X

=
Y Pi
X
i=1 j=1 X i
i=1 Pi
i

) (

Rumus tersebut sama dengan rumus (6.2). maka dapat dilihat bahwa PPS Sampling
akan lebih efisien jika

kedua ruas dibagi dengan

2Y / Y 2 > 2Z / Z 2

N Y > X Z ,dimana Y

adalah varians dari populasi y. Jika

Y 2 ,didapat
(6.7)

Untuk

Y =N Y

dan

Z =Y / X .Maka PPS Sampling akan lebih efisien dari SRS

jika koefien varians (CV) z (y/x) lebih kecil daripada koefien variasi y.
Konsep sub unit sangat membantu dalam PPS Sampling sehingga sama mudahnya
seperti SRS. Pemilihan sampel sebanyak n unit dengan metode sampling PPS-WR sama
dengan pemilihan n sub unit dari X dengan SRS-WR.
Hubungan Linear
Kondisi saat PPS Sampling lebih efisien daripada SRS adalah saat variabel y
berhubungan secara linear denganvariabel tambahan x. Pada prakteknya, tidak sulit untuk
menemukan variabel tambahan yang berkorelasi linear dengan variabel yang diteliti. Misal
hubungan antara x dan y memiliki bentuk

Y i= + X i+ i ,

i=1,2, , N

dan

adalah konstanta dan

harapan dan varians bersyarat untuk

E ( i|X i ) =0

Dengan

(6.8)

dan

adalah random variabel dengan nilai

X i tertentu yaitu

V ( i| X i )= X ig

(6.9)

i adalah konstanta. Ingat bahwa varians dari penduga Y untuk PPS

Sampling SRS-WR masing masing

Y
1
V PPS = X i Y 2
n
i=1 X i

dan

Jika kedua varians tersebut dikurangkan, didapat

D=V SRS V PPS =

N
N
X
2
1 Y i 1
n
Xi

V SRS =

1
n

(
1

Y 2i Y 2

Y i dengan (6.8) dan dicari nilai harapannya, maka

Ganti nilai

E ( D )=

[(

N
N2 2
X
1
1
+ 2 2X + Cov ( X gi 1 X i )
n
N i=1 X i

Dimana

adalah varians dari x. Sehingga PPS Sampling akan lebih efisien

daripada SRS jika

Cov ( X

g1
i

N 1
X
X i ) >
1 2 2X

N i=1 X i
2

(6.10)

Dari kondisi (6.10), jelas bahwa walaupun x dan y berhubungan linear, sehingga

V ( i| X i )= X ig=0 , PPS Sampling tidak lebih efisien dari SRS untuk kondisi

N
X
1 1 2 2X < 0
N i=1 X i

(6.11)

Maka hubungan linear bukanlah syaat yang cukup agar PPS Sampling lebih baik
daripada SRS.jika garis regresi melewati titik pusat sehingga

=0 , kondisi (6.10)

menjadi

Cov ( X ig1X i )> 2 2X

Yang akan memenuhi syarat efisiensi jika g > 1, karena

(6.12)

>0 dan

Cov ( X g1
X i ) >0 . Studi empiris yang dirancang oleh pengaang lain telah menunjukkan
i
bahwa nilai g mungkin terletak antara 1 dan 2. Hasil tersebut ditemukan oleh Des Raj (1958)
pada sifat efisiensi PPS Sampling

6.5. Aspek Harga


Perbandingan efisiensi antara PPS Sampling dan SRS untuk ukuran sampel tertentu
seperti pada (6.4) akan terwujud hanya jika biaya survei kurang lebih sebanding dengan
jumlah sampel n.Pada kenyataannya, biaya survei tergantung pada n dan ukuran total dari
unit sampel. Misalnya untuk mengestimasi jumlah penduduk dan karakteristik demografi
lainnya di suatu wilayah dengan mengambil sampel beberapa desa atau blok sensus, maka
biaya survei yang terdiri atas biaya perjalanan menuju tempat sampel, serta biaya
pengumpulan dan tabulasi data akan tergantung pada jumlah sampel desa dan jumlah
penduduk di dalamnya.
Efisiensi dari PPS Sampling dibandingkan dengan SRS untuk n tertentu adalah

Es =

N
N
V SRS
Y2
= N Y 2i Y 2 / X i Y 2
V PPS
1
i=1 X i

)(

(6.13)

Fungsi dari biaya dapat ditulis

C=C0 + nC 1+ E ( Sni=1 x i ) C 2

(6.14)

Dimana C adalah biaya total,

C0 adalah biaya tetap, n C1 adalah biaya

perjalanan dan lainnya yang tergantung pada jumlah unit sampel, serta biaya pengumpulan
data dan liannya yang tergantung pada ukuran sampel.

E ( Si=1 x i ) untuk SRS dan PPS

Sampling adalah

n X

dan

i=1

i=1

n X i Pi=n

Xi
X

(6.15)

Dengan demikian, untuk biaya tertentu C, ukuran sampel yang dapat digunakan untuk
metode SRS dan PPS Sampling adalah

n2
=
n1

CC 0

n2=

CC 0
n1=
C2
C 1+ X

dan

C 1+

X 2i
C2
X

( )
i=1

sehingga

C 1 + X C2
N

C 1+

X 2i
C2
X

( )
i=1

Yang menunjukkan bahwa

(6.16)

n2 <n1 . Jika C1 >0 dan C2 =0 , maka n1=n2


N

C1 =0 , C2 >0 maka
dan ketika

2
2
2
( n2 /n1 ) =N X / X i =1 /( 1+ C x ) dimana
i=1

C x adalah koefisien variasi dari x. Sehingga perbandingan efisiensi harga dari PPS
Sampling dibanding SRS adalah

EC =

V SRS /n1 n2
= E
V PPS /n2 n1 S

Bila

maka

C1 >0 dan C2 =0 , maka

(6.17)

EC =E S . Jika C1 =0 , dan C2 >0 ,

EC =E S / ( 1+C 2x ) .
Efisiensi biaya juga dapat dihitung dengan menghitung biaya untuk varians tertentu.

Jika

V 0 adalah varians tertentu yang ingin dicapai, maka ukuran sampel yang diperlukan

pada SRS dan PPS Sampling untuk mencapai varians tersebut adalah

n1=V SRS /V 0 dan

n2=V PPS /V 0 . Substitusikan nilai ini pada fungsi biaya (6.14), maka setelah beberapa
penyederhanaan akan didapat dugaan biayanya, yaitu

CSRS =C 0+

PPS

V SRS
( C1 + X C 2)
V0

(6.18)

{ ( ) }

V
=C 0+ PPS C 1 +
V0

Xi
C2
X

i=1

Dapat dilihat bahwa

(6.19)

CPPS <CSRS jika

ES > 1 atau C1 >0 dan C2 =0

ES > ( 1+C 2x ) atau C1 =0 , dan C2 >0

6.6. Studi Empiris


Tabel Pengaruh Keliling Lahan Terhadap jumlah Cabang Pohon
untuk Menduga Jumlah Buah
cabang

Estimasi buah per cabang


Jumlah buah

SRS

PPG2

PPG3

PPG4

476

2380

1696

1625

1587

162

810

903

1117

1373

85

425

874

1164

1635

441

2205

1701

1427

1235

215

1075
0.317

1171
0.068

1194
0.020

1243
0.014

utama

sekunder

3
Varians Relatif

Tabel di atas menunjukkan bahwa PPS Sampling lebih efisien daripada SRS, terutama jika
menggunakan variabel tambahan yang sesuai.

Anda mungkin juga menyukai