Anda di halaman 1dari 19

SAMPLING WITH PROBABILITY PROPORTIONAL TO SIZE

(PPS SAMPLING)

Contact: ird_dna@yahoo.com

A. Definisi

PPS Sampling adalah suatu metode pengambilan sampel dari sebuah


populasi dimana peluang terpilihnya setiap unit sampel sebanding dengan ukuran.
Ukuran tersebut adalah informasi tambahan yang dimiliki oleh setiap unit sampel
yang dijadikan sebagai dasar pertimbangan dalam penarikan sampel sehingga
dapat diperoleh estimator-estimator yang lebih efisien.

Informasi tambahan (ukuran) yang berguna untuk dijadikan dasar


pertimbangan penarikan sampel adalah inform,asi yang mempunyai korelasi yang
kuat dengan variabel-variabel yang akan diteliti.

B. Keuntungan

Keuntungan yang dapat diperoleh dari PPS Sampling, yaitu:

1. Akan diperoleh estimator yang unbiased terhadap populasi.


2. Dapat memberikan estimator-astimator yang lebih sederhana.
3. Mempunyai akurasi yang lebih tinggi dibandingkan metode-metode lain.
A. Kerugian
1. Pemilihan sampel dengan menggunakan prosedur With Out
Replacement (WOR) lebih sulit dilakukan.
A. Kondisi Penggunaan

PPS Sampling digunakan pada saat setiap unit sampel dalam populasi
memiliki ukuran yang bervariasi sehingga peluang terpilihnya sampel tidak sama.
Semakin besar ukuran suatu unit sampel, maka semakin besar pula peluang
terpilihnya unit sampel tersebut. Selain itu, penggunaan PPS Sampling harus
memperhatikan ada tidakanya hubungan yang kuat antara informasi tambahan
(ukuran) yang dimiliki oleh setiap unit sampel dengan variabel-variabel yang ingin
diteliti.

B. Kasus Penggunaan

Variabel yang Diteliti Informasi Tambahan (Ukuran)

Rata-rata pengeluaran pulsa per Jumlah handphone yang


bulan dimiliki

Jumlah produksi sebuah pabrik Jumlah pekerja yang dimiliki

Rata-rata indeks prestasi Lamanya jam belajar


mahasiswa

C. Pemilihan Sampel Dari Suatu Daftar (LIST)


1. Metode Kumulatif
• membuat frekuensi kumulatif dari ukuran yang dijadikan dasar
penarikan sampel untuk seluruh unit dalam populasi (jumlah
kumulatif dari ukuran auxiliary information) untuk seluruh unit
dalam populasi.
• Mengambil suatu angka random dari 1 sampai Z
• Bila i-1zi<AR< izi , maka unit ke-i terpilih, bila kondisi tidak
terpenuhi, maka kembali ke langkah ke 2
• Mengulangi langkah ke-2 hingga n unit sampel terpilih

Kelemahan dari prosedur ini adalah dalam melakukan perhitungan


akumulasi secara total (frekuensi kumulatif total) akan menghabiskan banyak
waktu dan biaya yang lebih bila populasi berukuran besar.

Contoh :

– Suatu desa memiliki 10 buah tanah/ lahan yang terdiri dari 50, 30, 45,
25, 40, 26, 44, 35,28, dan 27 sawah, berturut-turut. Ambil sampel sebanyak 4 buah
tanah dengan pengembalian dan dengan metode proporsi peluang sesuai
ukuran(PPS), jumlah sawah pada lahan sebagai informasi tambahan.
Jawab :
Langkah pertama, dalam menyeleksi lahan adalah membentuk frekuensi
kumulatif, seperti tabel di bawah ini :

No. Ukuran Frekuensi Selang


Sample (xi) Kumulatif Ukuran
1. 50 50 1-50
2. 30 80 51-80
3. 45 125 81-125
4. 25 150 126-150
5. 40 190 151-190
6. 26 216 191-216
7. 44 260 217-260
8. 35 295 261-295
9. 28 323 296-323
10. 27 350 324-350

Untuk memilih sebuah lahan, sebuah angka acak yang kurang dari 350
dipilih dengan bantuan tabel angka random. Misalkan, angka random yang terpilih
adalah 272. Kita lihat dimana letak angka tersebut dalam interval selang ukuran.
Ternyata, terletak dalam selang 261-295 sehingga lahan ke-8 yang terpilih sebagai
sampel karena 272 terletak dalam selang tersebut. Dengan cara yang sama seperti
di atas kita akan memilih 3 sampel yang lain. Misalkan, 3 angka lain yang terpilih
adalah 346, 165, dan 094 maka lahan yang terpilih sesuai dengan angka random
tersebut masing-masing adalah 10, 5, dan 3. Jadi, keempat lahan yang terpilih
sebagai sampel yang diambil dengan metode PPS terdiri dari lahan ke 8, 10, 5, dan
3.
1. Metode Lahiri

Merupakan metode pps yang paling baik digunakan jika ukuran unit cukup
besar.

Tidak seperti kumulatif, metode ini tidak membutuhkan jumlah kumulatif


dari ukuran unit sampling dalam populasi. Misalkan saja sampel yang terpilih
berukuran n, dari populasi yang berukuran N secara pps dengan pemulihan, dan xi
adalah ukuran sampel ke-i, maka tahap penarikan sampelnya adalah sebagai
berikut:

a. Membangkitkan 2 angka random secara bersama- sama, anggap saja AR


dan AR’, dengan
• AR yang memiliki besar ≤N, sehingga berkenaan dengan nomor
urut unit sampling dalam populasi.
• AR’ memiliki besar ≤xi maks, yaitu berkenaan dengan ukuran unit
yang digunakan untuk penarikan sampel.
a. Bila AR’ ≤xi , maka unit yang dipilih adalah yang ke xi, bila kondisi tidak
terpenuhi, maka 2 AR lain perlu dibangkitkan
b. Mengulangi langkah ke-2 hingga tercapai jumlah yang terpilih sebanyak n

Contoh soal:

Suatu desa memiliki 10 buah tanah/ lahan yang terdiri dari 50, 30, 45, 25,
40, 26, 44, 35,28, dan 27 sawah, berturut-turut. Ambil sampel sebanyak 4 buah
tanah dengan pengembalian dan dengan metode proporsi peluang sesuai
ukuran(PPS), jumlah sawah pada lahan sebagai informasi tambahan. Halaman 2,
baris 1, kolom 1

Jawab:

N 1 2 3 3 5 6 7 8 9 1
No 2 3 4 5 6 7 8 9 10
N 50 3 4 2 4 2 4 3 2 2
X 30 45 25 40 26 44 35 28 27

dibangkitkan 4 angka random secara serentak, 2 untuk no sampel dan 2


untuk nilai, sampel yang diambil sebagai berikut

N AR No Nilai Ket
No sampel

1 0331 3 45 Selur
1 uh angka
random
2 0703 7 44
yang ditolak
2
tidak
3 0404 4 25 ditampilkan
3

4 1018 10 27
4

1. Metode Sistematik

Bila ukuran sampel sebesar n dan X adalah total ukuran, maka interval
penarikan sampelnya adalah:

• I bilangan bulat (integer), maka gunakan sistematik linear


Misalkan R1 adalah merupakan angka random pertama (random start) yang
lebih kecil atau sama dengan I ,
unit-unit yang berpadanan X 1 N
I = = ∑ xi
dengan (R1 + j .I), j = 0, 2, 3,…, n n i =1
(n-1), akan terpilih sebagai
sampel . Secara umum, unit ke-i terpilih sebagai sampel bila terpenuhi
kondisi :
i −1 i

∑x i < R1 + j .I ≤ ∑ x i

• I bukan bilangan bulat, maka gunakan sistematik sirkuler.


Dalam sistematik sirkuler, angka random pertama R1 besarnya antara 1
sampai dengan N (tidak harus lebih kecil sama dengan interval).

A. Pemilihan Dari Suatu Peta (MAP)

Prosedur ini dipakai untuk pemilihan unit-unit wilayah geografis dari


sebuah peta dengan peluang proporsi terhadap luas (area)Probability
Proportional to Area.

Banyak situasi dimana unit populasi berada dalam satu area. Prosedur
sistematik sampling untuk situasi ini disebut plane systematic atau two-
dimensional systematic sampling. Pengembangan paling sederhana dari sampel
sistematik linier menuju systematik sampling dua dimensi dikenal dengan
pemetaan persegi (grid square). Ada dua prosedur untuk memilih sampel pada
sistematik sampling dua dimensi
Asumsikan populasi terdiri dari N persegi area dengan ukuran sama dan
sampel area n akan diambil. Asumsikan wilayah petakan disusun dalam
lxm=Nk=K, terbentuk petak petak yang tebentuk dari r baris dan s kolom, cara
termudah untuk memilh sampel yaitu:

a. Ambil dua angka random sekaligus (dimana: AR 1= 1≤ r baris/panjang


dan AR 2=1≤ s kolom/lebar)
b. Sepasang angka random terpilih, akan menempatkan titik pada suatu peta.
Maka di titik itulah sampel terpilih.
c. Ulangi langkah ke 1 hingga n unit sampel terpilih.

Cara lain:

Wilayah petakan disusun dalam rxl baris dan mxs kolom, membutuhkan
sampel berukuran n sebanyak rxs wilayah petakan.

Pilih r angka random independent i1,…, ir≤l dan s angka random


independent dengan j1,…, js≤m, wilayah petakan yang masuk dalam sampel
adalah (ix+1+xl,jx+1+ym) dengan x=0,1,...,(r-1) dan y=o,1,...,(s-1). Disebut
unaligned sampel.

A. PPS WOR

PPS WOR dapat memberikan efisiensi yang lebih baik disbanding PPS WR,
tetapi metode perhitungan lebih kompleks dan tidak mudah diaplikasikan, efisiensi
lebih substansial jika fraksi besar.

B. Estimasi dan Pembuktian

Misalnya populasi dengan ukuran N akan diambil sampel sebanyak n secara


PPS-WR. Jika setiap unit sampel memiliki ukuran sebesar xi, maka probabilita
terpilihnya sampel ke-i adalah:

pi=xii=1Nxi=xiX dimana i=1Npi=1

Dalam PPS Sampling setiap ukuran dalam unit sampel ke-i memiliki
hubungan atau korelasi dengan variabel yi. Penduga yang tidak bias dari total
adalah

Yi=Xyixi=yixiX=yipi

Bukti:
EYi=Ei=1Nxiyixi

=i=1Nyi=Y

Penduga yang tidak bias bagi total Y adalah

YPPS=i=1nYin=1ni=1nyipi=Xni=1nyixi

dengan varians

VYPPS=1ni=1Npiyipi-Y

Bukti:

Pembuktiannya menggunakan rumus multinomial

n!t1!t2!…tN!p1t1p2t2…pNtN dimana t1, t2,…,tN independen

dengan

Eti=npi Vti=pi1- pi Kovtitj=0

Kita dapat menulis

YPPS=1nt1y1x1+t2y2x2+…+tNyNxN=1ni=1Ntiyipi

EYPPS=E1ni=1Ntiyipi

=1ni=1Nyipi∙Eti

=i=1Nyinpi ∙npi

=i=1Nyi=Y

sehingga YPPS tidak bias. Begitu juga dengan varians

VYPPS=V1ni=1Ntiyipi

=1n2i=1Nyipi2Vti+2i=1Nj>iNyipiyjpjKovtitj
=1n2ni=1Nyipi2pi1- pi+2i=1Nj>iNyipiyjpj∙0

=1n2 ni=1Nyipi2pi1- pi

VYPPS=1ni=1Nyipi2pi-yipi2p12

=1ni=1Nyi2pi-yi2

VYPPS=1ni=1Nyi2pi-Y2

=1ni=1Npiyi2pi-Y2

dengan i=1Npi=1.

Jadi, VYPPS tidak bias.

Penduga yang tidak bias bagi VYPPS adalah

vYPPS=1n(n-1)i=1nyixi-YPPS2

Bukti:

i=1nyixi-YPPS2=i=1nyixi-Y2-nYPPS-Y2

selanjutnya

nn-1vYPPS=i=1nyixi-YPPS2

Enn-1vYPPS=Ei=1nyixi-Y2-nYPPS-Y2

nn-1EvYPPS=Ei=1Ntiyizi-Y2-n VYPPS

nn-1EvYPPS =ni=1npiyipi-Y2-n VYPPS

=n∙n VYPPS-n VYPPS

=n2VYPPS-n VYPPS

=nn-1VYPPS
EvYPPS=VYPPS

dila

YPPS=1n i=1nyipi

pi=xiX

X=i=1Nxi

Merupakan perkiraan yang tidak bias terhadap Y dengan


varians

V (YPPS)=1n i=1npi yipi- Y2

Bukti :

Misalkan ti= jumlah waktu ; i= 0, 1, 2, ..., n

Sehingga distribusi frekuensi gabungan dari ti untuk N unit


dan populasinya adalah pada saat n dimasukkan ke dalam kotak
ke-i adalah pi pada setiap pemasukan, sehingga distribusi
gabungan ti adalah rumus multinomial

n!t1!t2!… tN! p1t1p2t2… pNtN

Sehingga diketahui

E(ti) = n pi

V(ti) = n pi (1-pi)

Cov(t1,t2) = -n pi pj

Sehingga : jika sebuah sampel berukuran n unit diambil


dengan probabilita pi, dengan pengembalian maka

YPPS=1n i=1nyipi

YPPS=1n t1y1p1+t2y2p2+…+tNyNpN=1n i=1Nti yipi

t adalah variabel acak, yi dan pi adalah sekumpulan bilangan


tetap
E(ti) = n pi

E(YPPS)= 1n i=1nnpi yipi=i=1nyi=Y

Sehingga YPPS tidak bias

V YPPS= 1n2 i=1nVyipi=1n2i=1nj=1NYjPj-Y2Pj=1n i=1N YiPi-


Y2Pi= 1n i=1N Yi2Pi2- Y2

Nilai Covarians Covyipi , yjpj , jika j ≠ i, akan menjadi 0. Ini


menunjukkan bahwa varians estimator adalah proporti yang
berkebalikan dengan ukuran sampel (n) pada SRS WR

Jika sebuah sampel berukuran n unit diambil dengan


probabilita proporsional terhadap ukuran, degan pengembalian
(WR) :

pi=xiX dan dengan pengembalian

YPPS=1n i=1nyipi

YPPS=Xn i=1nyixi= Xn i=1nyi=Xy

y adalah rata-rata tak tertimbang dari rata-rata unitnya


adalah perkiraan yang tak bias dari Y dengan varians

V(YPPS)=Xn i=1nxi( yi-Y)2

yi= yixi

Y=YX

Y=YPPSX=NnXi=1nyi

YR= YRX=i=1nyii=1nxi = rata-rata sampel per elemen

Sehingga, unbiased estimator dari rata-rata populasinya :

YPPS=yN=1n Ni=1nyipi= Xn Ni=1nyixi

Unbiased estimator V(YPPS) pada PPS Sampling WR nya


adalah :
v YPPS= i=1nYi-Y2nn-1=1nn-1i=1nyipi-Y2= 1nn-
1i=1nyipi2+i=1nYPPS2-2 YPPS n YPPS u=1nn-1i=1nyipi2+ n YPPS2-2 n
YPPS2= 1nn-1i=1nyipi2+ n YPPS2

Dan Unbiased estimator V(YPPS) pada PPS Sampling WR nya


adalah :

v YPPS= 1nn-1i=1nyiN pi-YPPS2 = 1nn-1i=1nyiNpi2+ i=1nYPPS2-


2 YPPS i=1nyiNpi =1nn-11N2i=1nyipi2+ n YPPS2-2 n YPPS2= 1nn-
11N2i=1nyipi2+ n YPPS2 = 1nn-11N2i=1nyipi2+ n YPPS2N2 =1nn-
1N2i=1nyipi2+ n YPPS2

a. Koefisien relative / relative efficiency

Perbandingan sampling PPS WR dan SRS WR dengan sampel yang sama


dapat diketahui. Seperti yang diketahui sebelumnya, varians dari SRS WR adalah

V(Ŷsrs)= N2 s2n , dimana s2(Ŷ)=NiNyi2-NY2

Sehingga VYsrs=NniNyi2-NY2

Sebuah penduga tidak bias dari iNyi adalah , sedangkan salah satu penduga
tidak bias dari NY2 adalah Ypps2-v(Ypps2), maka

Varians SRS WR berdasarkan sampel PPS WR adalah

vppsYsrs=Nn1ninyi2pi-NnnY2

= Nn2inyi2pi-Ypps2-v(Ypps2)

=Nn2inyi2pi-Ypps2+vYpps2

=1n2Ninyi2pi- nYpps2+1nvYpps

Sehingga relative efficiency atau design effect adalah

RE=v(Ypps)vppsYpps×100%

b. Estimasi terurut Des Raj


Z1 = dan z2 = y1 + y2
yi (1 − p 2 )
pi p3

ŶORD =

( z1 + z 2 ) = 1  y1 (1 + p1 ) + y 2 (1 − p1 ) 
1  
2 2 p1 p2 

Teorema 1.1

Dalam pps sampling WOR, estimator ŶORD adalah estimator tak bias dan
varian sampling diberikan oleh

V(ŶORD) =
 1 N 2  1 N  y i  1 N Y
2

1 − ∑ P1  ∑  − Y  pi  − ∑ ( i − Y ) 2 pi2
 2 1  2 1  pi   4 1 pi

Bukti :

E(z1) =
 yi 
∑  p  pi = ∑ y i = Y
 i

E2 =
 (1 − p1 )  (1 − p i ) pj
 y2
p2
y1  ∑y j
pj (1 − p i )
 

E2 = Y – y1
 (1 − p1 ) 
 y2 y1 
 p2 

E(z2) = E1E2 (z2|y1) = y1+ Y – y1 = Y


E(ŶORD) = Y

V(z1) =
2
y yj 
∑∑ pi p j  i − 
 pi p j 
i> j  

V(z2) = E1V2 (z2) + V1E2(z2)

E2(z2) = Y , V1E2 (z2) = 0

V(z2) =
2
y yj 
∑∑ pi p j  i −  ( 1− pi − p j )
 pi p j 
i> j  

Sehingga varian dari ŶORD adalah:

V(ŶORD) =
2
1  yi y j   
∑∑
4 i> j
p i p  −
j


 2 − pi − p∑



 pi p j   

Dan estimator tidak bias dari V(ŶORD) adalah :

V(ŶORD) =
2
1 1 2  y y 
( z1 − z2 ) = ( 1− p1 )  1 − 2 
2

4 4  p1 p2 

Teorema 1.2

Dalam pps sampling WOR, estimator ŶORD adalah estimator tak bias dari
total populasi Y dan variasi samplingnya yang diberikan oleh
1 yj
V (YˆD ) = 2 ∑∑ p p ( y i − ) 2 { 1 + rij (1) + ... + rij (k ) + ... + rij ( n − 1)}
n i >i
i j pi pj

Dimana rijk adalah peluang bahwa yi dan yj tidak termasuk dalam deret.

Bukti Telah diketahui bahwa Ezi=Y

Dan
Ezi|y1, y2, …, yi-1=Y,i=2, …, n

Karenanya Ezi=Y untuk i=2, …, n

Mengikuti bahwa YD=z=inzin adalah sebuah estimator tak bias.


Selanjutnya, untuk memperoleh varian sampling kita dapat melihat bahwa
Ezizj=Y2, yang mana menunjukkan bahwa zi dan zj tidak berkorelasi. Karenanya,
dengan perlakuan yang serupa, dapat diperoleh hasilnya. Untuk lebih
mendetailnya, pembahasan ini ditujukan pada Des Raj (1966). Meskipun
perhitungan untuk VYORD agak kompleks, namun dapat dimodifikasi menjadi
bentuk yang lebih sederhana seperti berikut

VYORD=Vinzin=1n2inVzi

Dan estimasi tidak bias dari V(ŶORD) bisa ditulis :

n
(z − z ) 2
v(YˆD ) = ∑ i ( n −1)
i n

c. Penduga Tidak Terurut Horvitz-Thompson

Sebuah sampel penduga berukuran n unit dipilih tanpa pengembalian


dengan beberapa metode. Misalkan
π i=probabilita bahwa unit ke-i ada dalam sampel

πij=probabilita bahwa unit ke-i dank e-j keduanya berada dalam sampel

hubungan berikut terpenuhi :

(1.1)
N N N
1
∑π i =n ∑π ij = (n − 1)π i ∑∑ π ij =
2
n(n − 1)
i j ≠i i j >i

Untuk membentuk hubungan kedua, misalkan P(s) menyatakan probabilita

dari sebuah sampel yang terdiri atas n unit tertentu. Maka πij = seluruh
∑ P(s)

sampel yang terdiri atas unit ke-i dan unit ke-j, serta πi = seluruh sampel
∑ P(s)

yang terdiri atas unit ke-i. Bila kita mengambil untuk j≠i, setiap P(s) untuk
∑π ij

sebuah sampel yang terdiri atas unit ke-i dihitung (n-1) kali pada jumlahnya,
karena ada (n-1) nilai lainnya dari j dalam sampel. Ini membuktikan hubungan
yang kedua. Hubungan ketiga mengikuti hubungan kedua.

Penduga Horvitz dan Thompson (1952) tentang jumlah populasi adalah:

ŶHT = (1.2)
n
yi
∑πi i

Dimana yi adalah pengukuran untuk unit ke-i.

Teorema :

Jika πi>0,(i=1,2,….,N)
ŶHT =
n
yi
∑π
i i

Adalah sebuah penduga tidak bias dari Y, dengan varians

V(ŶHT) = (1.3)
N N (π − π π )
N
(1 − π i ) 2
∑ ∑∑
ij i j
y + 2 yi y j
πi π iπ j
i
i =1 i =1 j >i

Dimana πij adalah probabilita bahwa unit ke-i dan ke-j berada dalam sampel.

Bukti :

Misalkan ti (i = 1,2,….,N) merupakan sebuah variable acak yang


mempunyai nilai 1 jika unit ke-i diambil dan bernilai nol untuk lainnya. Maka ti
mengikuti distribusi binomial untuk sebuah sampel berukuran 1, dengan
probabilita πi . maka ,

E(ti) = πi

V(ti) = πi (1- πi)

Nilai kovarians (titj) juga di gunakan. Karena titj adalah 1 hanya jika kedua
unit mencul dalam sampel,

Kov (titj) = E(titj) – E(ti)E(tj) = πij - πi πj (1.4)

Karena yi tetap dan ti sebagai variable acak,

E(ŶHT) = E
 N t i yi  N
 ∑  = ∑ y i = Y
 i =1 π i  i −1
V(ŶHT) =
2
N
y  N N
y y
∑i  π i  V (t i ) + 2∑∑ i j Kov(t i t j )
i j >i π i π j
 i 

= (1.5)
N N (π − π π )
N
(1 − π i ) 2
∑ y i + 2∑∑
ij i j
yi y j
i =1 πi i =1 j >i π iπ j

Ini membuktikan teorema.

Varians di atas dapat dinyatakan dalam bentuk lain dengan menggunaka dua
hubungan pertama. Ini memberikan

∑ (π
j ≠i
ij − π i π j ) = (n − 1)π i − π j (n − π i ) = −π i (1 − π i )

Dengan menggantikan (1- πi) pada suku pertama dalam (1.5)

V(ŶHT) =
 y 2
  yj 
2
y 
 − 2 yi j 
N N

∑∑ (π π
i j − π ij )  i
 π i
 + 
 
i j >i
  π j  πi π j 

= (1.6)
2
N N y yj 
∑∑ (π π i j − π ij ) i −
π π


i j >i  i j 

Kesimpulan: Dari (1.5), dengan menggunakan metode ti , sebuah penduga


sampel yang tidak bias dari V(ŶHT) terlihat menjadi.
V1(ŶHT)= =
n
(1 − π i ) n n (π ij − π i π j )
∑ y i + 2∑∑
2
yi y j
i =1 πi
2
i =1 j >i π i π j π ij

Membuktikan bahwa tidak satu pun dari πij dalam populasinya yang hilang.

Sebuah penduga sampel yang berbeda telah di berikan oleh Yates dan
Grundy (1953) dan oleh Sen (1953). Dari (1.6), penduga ini adalah

V2(ŶHT) =
2
n (π i π j − π ij )  y i y j 
n

∑∑ π
 −
 π π


i j >i ij  i j 

Dengan batasan yang sama pada πij ,

Karena suku (πi πj - πij) sering bervariasi secara besar dan kadang-kadang
negatif, v1dan v2 cenderung menjadi tidak stabil. Kedua penduga dapat mempunyai
nilai negatif untuk bberapa metode pemilihan sampel. Rao dan Singh (1973)
membandingkan koefisien variasi v1dan v2 dengan sampel n=2 sampel 34 dari
populasi alamiah kecil yang didapat dalam buku-buku dan majalah sampel survey,
dengan menggunakan metode pemilihan sampel Brewer, untuk πi = 2zi seperti yang
diiinginkan. Penduga v2 dianggap lebih stabil dan selalu ≥ 0 untuk metode ini,
sedangkan vi seringkali mempunyai nilai negative.

d. PPS Stratified

Phi=XhiXhi

phi=xhixhi

Asumsikan sampel nh diambil dari Nh unit terhadap strata ke h dengan pps


wr, ukurannya adalah x. Dimana Yhi dan Phi=XhiXh suatu nilai, dan probability
pemilihan i unit pada strata ke h dan yhidan phi adalah sampel maka estimator
unbiased bagi Y adalah:
YPPS= hLYh=h=1L1nhi=1nhyhiphi=h=1LXhnhi=1nhyhixhi

Dengan

v YPPS= h=1LYhi-Yh2nn-1=1nn-1h=1Lyhiphi-Yh2= 1nn-


1h=1Lyhiphi2+i=1nYh2-2 Yh n Yh=1nn-1h=1Lyhiphi2+n Yh2-2 Yh n
Yh=1nn-1h=1Lyhiphi2+n Yh2-2 n Yh2=1nn-1h=1Lyhiphi2- n Yh2

Dan

YPPS=YPPShL Nh=hL Xhnh inh yhixhihLNh =hL Xhnhinh yhixhi .


1hLNh =hL XhnhNh inh yhixhi

Stratifikasi menjadi strata efektif apabila diambil dari strata yang unit dari
masing-masing strata yang homogen, yang bersesuaian dengan variabel yhixhi
atau YhiXhi dan tidak bersesuaian dengan variabel y dan x yang diambil terpisah.
Karena nilai Yhitidak mungkin tersedia dalam praktek maka sangat penting untuk
menggunakan pada nlai rasio pada periode sebelumnya atau nilai dari karakteristik
yang berhubungan dengan tujuan stratifikasi.

Sumber:

Murthy

Daroga singh:

Cochran

www.iccid.org/.../survey-sites.pdf

www.amstat.org/.../JSM2002-000704.pdf