Pengantar 6.1
Pada beberapa survey, informasi pada variasi pendukung yang memiliki korelasi tinggi
terhadap variasi yang diamati dapat atau bias atau dapat digunakan dalam design sampling.
Stratifikas sampling dan pola PPS adalah 2 contoh dalam memperbaiki design sampling yang
menggunakan data variasi pendukung yang sudah dibahas pada bab 3 dan 5. Bagaimanapun
juga pola ini menunjukkany bahwa informasi pada variasi bantuan pada setiap sampling ada
pada persiapan design sampling. Dalam kasus data pada variasi pendukung, untuk unit
sampling yang tidak ada, tapi jika hanya nilai agregat untuk semua unit dari variasi
pendukung untuk unit ada, 2 pola tersebut tidak dapat digunakan. SEperti pada situasi,
agregat data pada variasi pendukung dapat digunakan saat memperkirakan parameter yang
diobservasi, menyediakan data pada variasi pendukung untuk unit sampel yang mudah
didapat saat mencatat nilai pada variasi yang di observasi. Dua metode dalam memperkirakan
dikenal dengan metode estimasi rasio dan metode estimasi regresi. Pada bab ini, akan
membahas metode estimasi rasio.
6.2 DEFINISI DAN NOTASI
Didenotasikan :
Yi = nilai karakteristik yang diobservasi dalam populasi
Xi = nilai karakteristik pendukung dalam populasi
Y = Jumlah karakteristik y dalam populasi
X = Jumlah karakteristik x dalam populasi
adalah nilai rata-rata karakteristik y dan x pada sampel dan populasi total X atau rata-rata
Y
X diketahui. Estimasi rasio dari rasio populasi
X = R, dengantotal Y dan rata-rata
^ y y
R = =
x x
y y ^
y R R X
= x X= x X=
y
Y^ R = X =
^
R X
x
^ Cov ( ^
R , ^x )
B( R ) = - X
^
= E ( y ) E ( R ) E ( x )
X ^
= Y - E( R )
Cov ( ^
R , x ) Y ^
Atau
X = X -E( R )
^
=RE( R )
^
=-B( R )
Buktikan bahwa :
^ )
B(R
^R
CV ( x )
^
R unbias jika ( ^R , x )
Buktikan bahwa : = 0 , saat sebagai koefisien variasi
Teorema 6.3.2 Tunjukkan bahwaestimasi rasio dalam SRS WOR merupakan perkiraan awal
pada relative bias yang diberikan sebagai berikut.
^
B( R) 1f 2
Sx Sy
R n x y (R S x )
1f
( C2x C x C y )
n
Sx Sy
Cx Cy
Saat =
X dan = Y adalah koefisien variasi dari x dan y.
y R x x X
y y x R
^
R R= 1
Bukti : Diketahui x -R=
X( x X ) = )(1+ )-1
X
X
^ 1 y R x 1 y R x
E( RR = [ )- E )( x - X )]
X E X
Saat E ( y - R x ) = Y -R X = 0 dan
E( y - R x ) ( x - X )=E{ y . ( x - X )} R E { x . ( x - X
)}
X X )2
= E ( y Y ( x - ) R E ( x -
(1f ) 2
Sx Sy
= n [ - R Sx ]
(1f ) 2
^ Sx Sy
Sehingga B ( R ) = { n x2 } ( R S x - )
^
B( R) (1f ) 2
Sx Sy
Atau R = n X Y ( R Sx - )
Sx Sy
Cx Cy
Dengan mensubstitusi , =
X dan = Y hasil didapatkan.
Untuk nilai yang cukup besar dari bias akan tidak berarti. Ini dinotasikan bahwa estimasi
Sy
bias menjadi nol saat R = , akan memuaskan jika garis regresi y dan x melewati
Sx
kejadian yang sebenarnya. Dapat terlihat bahwa kontribusi tahap pada urutan pertama
dipengaruhi oleh kejadian dari 2 variasi yang dibuktikan oleh Sukhatme (1944). Pada
perkiraan pada tahap urutan kedua, relative bias pada estimasi rasio pada populasi besar dapat
dinyatakan sebagai berikut :
3 C 2x
B = B ( 1 + n )
Kesimpulan 1 bahwa batas atas rasio dari bias terhadap standar error akan memenuhi
persamaan berikut
|B( ^R)| x
=C x (6.3.4)
R^ X
^
Kesimpulan 2 penduga dari bias B ( R) adalah sebagai berikut
^
^ )= [ R v ( x )Cov
^ (R ( x , y ) ]
B 2 (6.3.5)
x
ui= y i Rx i ,
Sekarang pertimbangkan variasi kita mempunyai
Y R X=0
u = y R x , dan U=
2
( 1f ) N ( ui U )
.
n X 2 i ( N 1 )
2
( 1f ) N ( y i R x i)
.
n X 2 i ( N 1 )
Kesimpulan 1 bahwa
Kesimpulan 2 bahwa
Kesimpulan 6.4.2 dengan pendekatan pertama, varians dari dapat dituliskan sebagai
berikut
Kemudian,
Koefisien korelasi antara y dan x pada populasi terbatas disefinisikan sebagai
Sehingga diperoleh,
(6.4.3)
Kesimpulan 2 bahwa, dengan pendekatan pertama
(6.4.4)
Kesimpulan 3 bahwa dengan pendekatan pertama
(6.4.5)
Jumlah oleh Hansen, Hurwitz, dan Madow (1953) disebut sebagai varians
relative. Karena koefisien korelasi diperoleh dari standar error dibagi dengan parameternya
untuk meduga jumlah yang sama bagi semua dari tiga penduga , dan
sebagai berikut
(6.4.6)
Kesimpulan 5 Penduga varians dari rasio estimator pada sampel diberikan sebagai berikut
(6.4.7)
Dimana r adalah penduga dari koefisien korelasi dari data sampel.
Persamaan (6.4.7) bentuk yang cocok untuk perhitungan yang dapat ditangani dari data
survey.
Bentuk lain dari penduga varians dari data sampel adalah
Pertanyaan yang muncul yaitu kapan kita harus menggunakan atau jika
diketahui. Rao dan Rao(1971) meneliti bahwa menghasilkan bias yang lebih
Juga, kita telah mempelajari pendekatan pertama, varians dari rata-rata berdasarkan metode
rasio yaitu sebagai berikut
Sedangkan penduga rasio akan memiliki varians yang lebih kecil jika
Atau jika
(6.5.1)
Jadi, itu tergantung pada nilai korelasi antara y dan x. jika , nilai koefisien
variasi antara x dan y sama,, penduga rasio akan lebih besar jika melebihi 0.5. Keragaman
dari variable tambahan x merupakan factor yang penting. Jika CV dari x lebih besar dari pada
dua kali y, penduga rasio selalu menghasilkan ketepatan yang lebih rendah.
Contoh 6.1 dalam mempelajari produksi susu, pemberian makan,dan praktik manajemen
dalam peternakan pada tahun 1977-1978, seluruh Negara bagian Haryana dibagi menjadi 4
zona menurut kondisi iklim pertaniannya. Total jumlah ternak penghasil susu pada 17 desa
terpilih pada tahun 1977-78 pada zona A, tergantung data sensus peternakan pada tahun 1976
adalah sebagai berikut:
No. Desa 1 2 3 4 5 6 7 8 9 10
Jumlah ternak 1129 1144 1125 1138 1137 1127 1163 1153 1164
1130
pada survey(y)
Jumlah ternak 1141 1144 1127 1153 1117 1140 1153 1146 1189
1137
Pada sensus(x)
No. Desa 11 12 13 14 15 16 17
Penduga dari total jumlah ternak pada 117 desa pada zona A
(i) Dengan mmetode rasio
(ii) Dengan metode sederhana rata-rata per unit
Juga bandingkan ketepatannya, jika diberikan total hewan ternak penghasil susu pada sensus
= 143968
(i) Penduga rasio jumlah total hewan ternak penghasil susu dengan metode rasio
adalah sebagai berikut
Jadi, ketepatan relative (relative presisi) dari penduga rasio adalah sebagai berikut
(6.6.1)
Dimana z adalah nilai variable normal pada tingkat kepercayaan yang ditentukan.
Seperti halnya dengan , batas untuk R dapat dituliskan sebagai berikut
(6.6.2)
Untuk jumlah sampel kecil, kita dapat mengasumsikan bahwa (x,y) mengikuti distribusi
bivariate normal dan kita dapatkan
Dan
kita mendefinisikan,
(6.6.3)
Dimana adalah penduga tak bias dari yang diberikan sebagai berikut
Kita mendapatkan
Batas kepercayaan dari R dengan koefisien kepercayaan (1- ) ditentukan oleh akar kuadrat
dari R, yang diberikan setelah mensubstitusikan nilai-nilai ini pada persamaan (6.6.3). akar
akar tersebut menentukan beberapa hal. Setelah beberapa penyederhanaan, batas kepercayaan
dari R dapat dituliskan dengan lebih mudah dalam bentuk berikut
(6.6.4)
Ketika populasi pada penarikan sampel secara stratifikasi dan unit-unit dipilih dengan simple
random sampling (SRS) dari masing-masing strata, ada dua cara bagaimana menentukan
penduga rasio dengan total populasi Y (1) penduga rasio separate , dan (2) penduga rasio
combine. Kita akan mendiskusikannya bada bagian ini.
(6.7.1)
Teorema 6.7.1 jika ukuran sampel besar pada setiap strata den simple random
sampling, WOR, dilakukan secara independen di dalam masing-masing strata, maka dapat
dibuktikan bahwa adalah penduga yang bias dengan bias yang dapat diabaikan dan
(6.7.2)
Dimana dan adalah rasio yang sebenarnya dan
Lalu
Di sini dapat dilihat bahwa penduga dibuat dari penduga rasio level strata.
bukan penduga yang tak bias tetapi penduga yang konsisten dari total populasi dan akan
memiliki nilai seperti halnya penduga rasio. Dengan menggunakan persamaan (6.3.2), bias
relative dapat ditentukan sebagai
memuaskan.
Dengan asumsi yang sama, dapat dibuktikan bahwa varians dari , pada pendekatan
Karena adalah penduga rasio di dalam strata ke-m karena ukuran sampel besar pada
setiap strata.
Kesimpulan pada penarikan sampel sistematik, WOR, penduga yang hampir tak bias dari
sebagai berikut
(6.7.3)
Diasumsikan pada kasus penduga separate, bahwa s cukup besar pada masing-masing
strata. Akan tetapi, pada praktiknya itu tidak selalu menghasilkan yang baik. Untuk mengatasi
kesulitan ini, Hansen, Hurwitz, dan Gruney (1946) menyarankan menggunakan penduga
rasio combine ( c untuk combine) untuk sampel dari populasi yang telah terstratifikasi
sebagai
(6.7.4)
Dimana dan
Adalah rata-rata populasi yang diduga dari sampel terstratifikasi, dan X adalah total x dari
semua strata.
Teorema 6.7.2 jika total ukuran sampel n besar dan simple random sampling,WOR,
dilakukan pada masing-masing strata secara acak, maka adalah penduga yang
Bukti karena adalah penduga yang konsisten, adalah penduga rasio dan juga
penduga yang konsisten dari total populasi. Jadi, untuk menurunkan biasnya, kita dapat
menuliskan
Proses pada baris yang sama dengan persamaan (6.3.2), bias relative dapat ditentukan dengan
sampel bahkan ketika ukuran sampel kecil pada masing-masing strata. Sama halnya, varians
penarikan sampel pada pendekatan pertama
Kesimpulan pada penarikan sampel berstratifikasi, WOR, penduga yang hamper tak bias
dari adalah sebagai berikut
(1 f m ) 2
N 2
m
nm
[( R Rm2 ) S xm
2
2( R Rm ) m S ym S xm )]
Y Y m
V( ) V(
Rc ) =
Rs
(1 f m )
N
m
2
m
nm
[( R Rm ) 2 S xm
2
2( R Rm )( m S ym S xm Rm S xm ) 2 ]
(6.6.7)
Karena persamaan terakhir pada persamaan (6.7.7) kecil, maka ruas kanan mungkin akan
bernilai positif. Jadi separate ratio estimator diharapkan untuk lebih tepat, dengan penyediaan
sample pada tiap strata yang cukup besr agar rumus pendekatan varians dapat diterapkan.
Combined ratio estimator akan mempunyai varians yang lebih besar dibandingkan dengan
dengan separate estimator,tetapi rasio populasi y terhadap x pada strata yang berbeda sangat
bervariasi, combined ratio estimator akan selalu mempunyai bias yang tidak berarti dan
presisinya akan sebesar presisi separate ratio estimator. Pada kenyataannya ketika garis
regresi dari y terhadap x melewati titik origin pada tiap strata, separate ratio estimator akan
lebih tepat daripada combined ratio estimator. Oleh karena itu, aturan dalam pemilihan antara
kedua metode tersebut adalah:
(1) Jika sample yang diambil pada tiap strata kecil, gunakan combined ratio estimator
kecuali ada perbedaan yang besar antara rasio strata R m. ketika terdapat perbedaan dan
pengelompokkan strata kembali dapat dilakukan supaya masing masing kelompok tidak
berbeda jauh dan mempunyai ukuran sample yang besar, maka separate ratio estimator
sebaiknya digunakan.
(2) Jika ukuran sample tiap strata besar, sehingga rumus pendekatan varians dapat
digunakan, maka akan lebih baik jika menggunakan separate ratio estimator walaupun hal ini
akan membutuhkan perhitungan tambahan. Jika hal ini terjadi, maka sebaiknya mengecek
kkeuntungan sebelum menggunakannya.
(3) Jika Xm diketahui independent dari strata ke strata, separate ratio estimator dapat
digunakan sebagai metode estimasi. Ketika X m = Nm, estimator menjadi sama dengan
estimator strata dan tidak ada masalah bias dari estimasi ini.
(4) Jika unit sampling adalah elementary unit dan satuan dari rasio benar benar nomor
dari unit dasar dari sample, kedua estimasi adalah unbiased. Pada kasus ini, estimator
sebaiknya diilih dengan mempertimbangkan varians dan keuntungan yang dihasilkan dengan
menggunakan ratio estimator ini.
Contoh 6.2 Data beriut ini dik umpulkan pada survey pendahuluan yang dilakukan
untuk memperkirakan banyaknya pengolahan dan produksi buah segar pada tiga distrik di
Uttar Pradesh pada tahun 1076 77.
Total
No. of
Total area (in
Stratu village Area under Total no.
no. of hect.)
m s in orchads in of trees
village under
number sample ha. (Xm) (ym)
s (Nm) orchad
(nm)
(Xm)
10.63,
1 985 11253 6 747, 719,
9.90,
1.45, 3.38, 78, 201,
5.17,
311, 448
10.35
2 2196 25115 8 14.66, 580, 103,
2.61,
4.35, 9.87, 316, 739,
2.42, 5.60, 196, 235,
212,
4.70,36.75
1646
11.60,
3 1020 18870 11 488, 227,
5.29,
7.94, 7.29, 374, 491,
8.00, 1.20, 499, 50,
11.50,
455, 47,
1.70,
2.01, 7.96, 879, 115,
23, 15 115
Hitung jumlah pohon pada ketiga distrik dengan berbagai metode dan bandingkan
presisinya.
(
1 1
Stra
Wm xm ym R m Wm x m Wm x m S x2m S y2m S xm y m
-ta nm N m
R Wm y m / Wm x m
Dimana = 443.53/8.80 = 50.40
1 1
YRc ) N m2 ( )( s 2ym R s x2m 2 R s xy2 m )
nm N m
v(
- 2 x 50.40 x 1403.81]
(ii) Separate Ratio Estimate Perkiraan lain dari jumlah pohon yaitu
YRs R m X m
= 2750076.89 = 2750077
YRs
Varians estimasi dari adalah
1 1 2
v (YRs ) N m2 ( s ym R m2 s x2m 2 R m2 s xym )
n
m N m
(985) 2 (0.16598)[74778.80 (61.28) 2 16.03
2 61.28 1008.75]
(2196) 2 (0.12454)[ 259107.90 (49.99) 2 16.03
2 49.99 5643.81] (1020) 2 (0.08902) [65885.60
(42.66) 2 38.39 2 42.66 1403.69
YRs YRc
Efisiensi dari separate ratio estimate( ) terhadap combined ratio estimate( ) adalah
6019519627.34
100%
2441137855.48
R.P.= = 246.58%
x
i
i
dimasukkan dengan probability proportional terhadap dan sisanya (n-1) unit dengan
peluang sama. Midzuno(1951) menyarankan metodelain dimana sampel pertama dipilih
dengan probability proportional terhadap xi dan sisanya (n-1) unit dipilih dari sisa (N-1) unit
dengan probabilita sama dengan tanpa pengembalian. Pada bagian ini, kita akan
membicarakan dengan singkat metode sampling dengan peluang berunah ubah tanpa
pengembalian(sampling with varying probability method).
Mari kita anggap bahwa, dari populasi terbatas berjumlah N, unit pertama pada sample
n
p
i
i 1
dipilih dengan peluang pi(i=1,2,,N), , dan dengan sisa (n-1) unit dengan peluang
sama tanpa pengembalian. Peluang bahwa unit U i adalah unit pertama dan unit unit
berikutnya yang terpilih dari SRS tanpa pengembalian dengan ukuran (n-1) adalah
N 1
pi /
n 1
. Ketika pi sebanding dengan xi sehingga pi = xi/X, peluang memilih sebuah
sample tersendiri SS(y1,y2,,yn) adalah sebagai berikut:
n n
p i x i
p( s) i
i
N 1 N 1
X
n 1 n 1
(6.8.1)
y y
YR X X
x x
Sekarang mari kita anggap
y ' y x y
(YR ) XE X
'
Y
x x N 1 N 1
X
n 1 n 1
Sehingga E
Jadi rasio estimator yang biased menjadi unbiased pada rencana sampling ini. Varians dari
estimatornya adalah:
YR ) E (YR2 ) Y 2
V(
X
(y
' 2
/ x) Y 2
N 1
n 1
= (6.8.2)
YR
Unbiased estimator dari varians adalah
NX 1 1 2
v (YR ) YR2 y n N sy
2
x
(6.8.3)
Perkiraan luas tanah dari pertanian utama di India diperoleh dengan metode ini dan
ramalan yang agak bagus dibuat sebelum pertanian panen. Data area pertanian dikumpulkan
bidang demi bidang dan dipelihara oleh Patwari or Lekhpal (akuntan pedesaan) untuk semua
desa dibawah yuridiksinya. Informasi ini digunakan sebagai dasar untuk memilihdesa desa
dengan probability proportional terhadap wilayah pertanian.
Contoh 6.3 Data berikut berhubungan dengan total area yang ditanami antara 1978 79
dan daerah gandum pada dua tahun berurutan 1978 79 dan 1979 80 untuk sebuah sample
dari 16 desa yang terpilih di distrik Baghpat Tehsil of Meerut(UP) untuk survey pemberian
pupuk. Desa desa dipilih dengan pengembalian, dengan peluang sebanding dengan wilayah
tanam yang dicatat pada tahun 1978-79. jumlah wilayah tanam dan walayah gandum untuk
wilayah Tehsil pada tahun 1978 79 untuk 304 desa dari Baghpat Tehsil berturut turut
adalah191648 dan 61100 hektar.
( i ) perkirakan luas wilayah gandum untuk Tehsil untuk tahun 1979 80 dengan metode
rasio untuk memperkirakannya dan hitung standar errornya.
(ii) Bagaimana estimasi dan standar errornya jika informasi tahun sebelumnya tidak
digunakan.
1 376 100 85
2 747 200 239
3 1149 423 406
4 1487 503 503
5 674 258 217
6 4163 1275 1191
7 595 89 69
8 1873 699 584
9 515 243 294
10 2534 672 745
11 2541 597 611
12 1307 455 421
13 1017 282 361
14 1343 421 277
15 291 80 96
16 1163 465 489
Perhitungannya telah dilakukan dalam bentuk table yang disajikan sebagai berikut
( i ) Estimasi rasio dari total wilayah pertanian gandum pada tahun 1979-80 diberikan
oleh
z
YR X
v
1 n A
z zi
n i
li
n i
Diamana X = 61,100 =
1 n A n '
v vi
n i
li
n i
Dan =
YR
l i
X R X
l i
'
Jadi
YR
Estimasi varians dari adalah
A2
v (YR ) [ l i2 R 2 l i2 2 R l i li' ]
n(n 1)
R
l i
1.006778
l i
'
Kita punya ,
R 2
= 1.013605117
l i
2
l i
'2
1.7532604136, 1.6743255075
l l i i
'
1.6056407512
v (YR )
Masukkan nilai ini pada persamaan di atas, kita dapat
(1916448) 2
[0.035153243] 537975.6757
v (YR ) 16 15
=
(ii) Jika informasi tahun sebelumnya tidak digunakan, maka perkiraan totalnya diberikan
oleh
1 n
Y z A l i
n i
n
2 n
( l i ) 2
A
v (Y )
n(n 1)
l
i
i
2
i
916448
5.086928 60931.22
YR 16
=
(1916448) 2
(0.13597601) 20,799,919.6547
v (YR ) 16 15
Dan =
Y 20,799,919.6547 4560.69
Estimasi standar error dari
Jadi, estimasi dari metode rasio dengan peluang berubah ubah (ratio method varying
probabilities) dibandingkan dengan simple estimate with varying probabilities diperoleh
sebagai
v(Y ) 20,799,919.6547
100% 386.63%
v(YR ) 537,975.6757
Tipe rasio estimator unbias akan dikemukakan oleh Hartley and Ross (1954). Mereka
mengusulkan rata rata dari rasio yi/xi yaitu estimator
1 n yi n
r i ri
n i xi
Telah diproleh dan telah diperbaiki biasnya. Kita akan membicarakan beberapa hasil penting
secara singkat disini.
Teorema 6.9.1 Pada Simple Random Sampling , dengan tanpa pengembalian, unbias
estimator bagi R (=Y/X) adalah
n( N 1)
R1 r ( y rx) X
N (n 1)
(6.9.1)
( S y2 R 2 S x2 2 R S y S x )
V ( R1 )
nX 2
(6.9.2)
y
R E i
xi
Dmana
Bukti Pada simple random sample,
1 n E (ri ) E ( xi )
E (r )
n i
E (ri ) E (ri )
X
Cov(ri , xi ) N 1
B(r ) E (r ) R S rx
X NX
Maka, (6.9.3)
S rx
Jadi estimator unbias dari adalah
n
ri ( xi x ) n
S rx {y rx)
i (n 1) n 1
(6.9.4)
Ini menunjukkan bahwa tipe rasio estimator unbias dari R diberikan oleh persamaan
(6.9.1). pernyataan yang tepat untuk varians dari estimator ini telah dikemukakan oleh
Robson (1957) dan Goodman and Hartley (1958). Dari hasil ini, itu dapat menunjukkan
bahwa kira kira varians untuk sampel besar diberikan oleh persamaan (6.9.2).
n( N 1)
YR1 r X ( y rx )
(n 1)
(6.9.5)
Mickey (1959) dan Williams (1961) telah memberikan gambaran umum tipe rasio estimator.
Estimator yang diberikan oleh Hartley and Ross adalah untuk keadaan khusus.
R
Pada metode ini, ada pencarian untuk mencocokkan bias dari . Quenouille (1956)
memberikan estimator untuk kelas yang besar, yang diberi nama jackknife method. Banyak
pekerjaan telah dilakukan pada bidang ini yang terbesar adalah teori alam dan sulit untuk
digunakan dalam prakteknya. Oleh karena itu pembicaraan mereka ditunda.
y
YR X
x
Pada bagian 6.5, telah dilihat bahwa rasio estimator dari populasi total , Y lebih
y
tepat daripada estimator rata rata per unit N , asalkan koefisien korelasi lebih besar dari
Cx/2Cy dan R positif. Jika koefisien korelasi antara peubah utama dan peubah tambahan x
adalah negative, kita tidak dapat menggunakan rasio estimator. Pada situasi serupa, Goodman
Yp
(1960) mengusulkan tipe estimator lain untuk rata rata dan total Y, ditetapkan seperti
yx
YP
X
YX Nyx
YP
X X
Dan (6.10.1)
Estimator ini dianjurkan jika itu adalah pelengkap rasio estimator dan oleh sebab itu
diharapkan akan berguna pada situasi dimana rasio estimator tidak efisien. Estimator produk
analog dengan rasio estimator, teori dan perlakuannya sama.
YR
Dengan asumsi yang sama dengan itu untuk rasio estimator , kita peroleh nilai harapan,
YP YX / X
bias, dan varians dari estimator . Hasil yang sama dapat diperoleh untuk
yx
YP
X
juga.
YP YX / X
Teorema 6.13.1 Ditunjukkan bahwa estimator produk untuk adalah
estimator bias, dan biasnya diberikan oleh
B (YP ) ( N n)
C x C y
Y Nn
(6.10.2)
Dimana Cx dan Cy secara berturut turut adalah koefisien varians dari x dan y.
Akibat Pada sampel besar biasnya relative lebih kecil dari koefisien variasi produk dari
x dan y, yaitu
B(YP )
CxC y
Y
(6.10.3)
Oleh sebab itu, harus dituliskan bahwa jika hubungan keduanya dan derajat yang lebih tinggi
dapat diabaikan, bias dari estimator produk menjadi nol.
Teorema 6.10.2 Jika ukuran sampel cukup besar, varians sampling dari estimator
Y P
produk , pendekatan pertama kira kira sebagai berikut
V (YP ) V (Y ) 2 RCov ( X , Y ) R 2V (Y )
(6.10.4)
V (Y ) ( X , Y ) V ( X )
V (YP ) Y 2 2
2Cov
Y XY X2
V (Y ) 2 RCov ( X , Y ) R 2V ( X )
YP YP
Akibatnya, jika cv adalah koefisien variasi dari atau dan jumlah sampelnya besar,
maka
cv 2 1 f C y2 C x2 2 C y Cx
n
Penduga dari bias dan varians dari hasil pendugaan bisa didapat dengan mensubtitusi
C y Cx
pendugaan sampel R, , dan dalam rumus yang sesuai.
YP
Untuk perbandingan penelitian dari hasil penduga , dengan rataan tiap unit
Y YP
penduga , mari kita anggap kalau sampelnya besar dan bias diabaikan. Penduga akan
Y
V Yp V Y
lebih efisien daripada rataan tiap unit penduga , jika , yang mengarah
kepada kondisi
Cx
2C y
dalam kasus dimana kedua Y dan X
dan (6.10.6)
Cx
2C y
adalah negatif
Demikian, hasilnya adalah kepentingan yang besar karena itu menujukkannya, untuk
setiap peubah tambahan yang diberikan, salah satunya bisa menentukan apakah yang dipakai
rataan tiap unit atau rasio atau hasil penduga sebagai dasar dari koefisien korelasi antara y
dan x . Untuk keseluruhan nilai dari koefisien korelasi antara y dan x, kondisi dan penduga
apa yang akan digunakan adalah sebagai berikut :
Cx Cy YP
* Memakai penduga (i) jika -1 < < - /2 dan kedua Y hasil (
) dan X adalah positif atau negatif or
Cx Cy
(ii) jika /2 < +1 dan salah satu
Cx Cy
*Memakai penduga rasio (i) Jika /2 < +1 dan kedua Y
YR
( ) dan X adalah positif/negatif
Cx Cy
(ii) -1 < - /2 dan salah satu
dari Y atau X adalah negatif.
YP
Goodman (1960) telah memperoleh peubah yang sebenarnya dari berbarengan
dengan penduga varians. Murthy (1964) telah membahas fungsi dari hasil pendugaan dan
telah mengemukakan sebuah teknik untuk mendapatkan hasil pendugaan takbias berdasarkan
interpenetrasi sub sampel
yi k
YMR Wi X i Wi YRi
xi i
(6.11.1)
y
YRi i X i , Wi
xi
Dimana adalah penimbang yang diambil dari fungsi penmbang seperti
W i 1
, dan populasi total Xi diketahui.
x1, x 2 ,....., x k
Tipe penduga ini hanya tepat digunakan ketika regresi dari y pada
adalah linear, garis yang melewati daerah asal dan fungsi penimbang harus optimal, i.e
W1
seperti yang mengmaksimalkan ketelitian.
Kita disini mungkin mempertimbangkan kasus dimana dua variabel x dipakai untuk
YMR
memaksimalkan ketelitian dari . Umumnya beberapa variabel tambahan terlihat jelas dan
bisa diselesaikan tanpa kesulitan.
x1 x2
Anggap y menunjukkan variabel yang diteliti dan dan variabel tambahan.
YMR
Lalu penduga adalah
Cy , Cx , C x2 x1 x2
Dimana dan secara berurutan adalah koefisien variasi dari y , dan ,
y x1 y x1 x1
dan secara berurutan adalah koefisien variasi antara y dan dan antara y
x2 YMR
dan . Ini menunjukkan bahwa penduga berbias dan bahwa bias itu, ke penaksiran
terbaik, akan diabaikan jika ukuan sampelnya besar.
V YMR W V Y W V Y 2W W
1
2
R1 2
2
R2 1 2
Cov YR1 , YR 2
Dimana
A11
1 f Y 2 C 2 C 2 2 yx1 C y C x1
y x1
n
A22
1 f Y 2 C 2 C 2 2 yx 2 C y C x 2
y x2
n
A12
1 f Y 2 C 2 C y C x1 yx 2 C y C x 2 x1 x 2 C x1 C x 2
y yx1
n
W2 1 W1 W1
Ganti dalam hubungan (6.12.4), diferensialkan (diturunkan) w.r.t . dan
W1 W2
samakan dengan nol, kita temukan penimbang minimum dan yang diberikan oleh
A22 A12
W1
A11 A22 2A12
(6.11.5)
A11 A12
W2
A11 A22 2A12
Vmin
YMR
A11 A22 A122
A11 A22 2 A12
(6.11.6)
C x1 C x 2 C x
dan
Lalu varians minimum dalam (6.11.6) direduksi menjadi
V YMR
1 f Y 2 C y2 2 C y C x C x2
n 21 p '
(6.11.7)
Y SR
Jika tidak ada peubah tambahan yang dipakai varian total dari penduga adalah
V YSR
1 f Y 2 C 2
y
n
YMR
Membandingkan varians-varians tersebut, kita bisa mengatakan bahwa penduga ,
Y SR
berdasarkan 2 peubah tambahan akan lebih teliti dibandingkan penduga , jika
Cy 1
1 ' C x 4
(6.11.8)
x1 x2
Jika berbarengan dengan , i.e. maka disana ada korelasi yang sempurna antara
1
C y / Cx
x1 x2 2
dan , rumus diatas disederhanakan menjadi . Disini dapat juga dilihat
bagwa cara tersebut mampu memberikan hasil yang lebih teliti dibanding cara yang
berdasarkan atas satu peubah pembantu. Hanya keterbatasan komputasi terlibat dalam
membatasi cari ini untuk diaplokasikan dalam survei. Dalam praktiknya beratnya diduga dari
A , A ,
11 22 A 12
dan , disini kita mempunyai
A11
1 f Y 2 c 2 c 2 2 r01 c y c x1
y x1
n
A22
1 f Y 2 c 2 c 2 2 r01 c y c x 2
y x2
n
A12
1 f Y 2 c 2 r c c r01c y c x1 r02 c x1 c x 2
y 12 x1 x 2
n
dan
s 2y
c
2
y
y2 r01 ryx1
dimana dll. Dan dll.
Untuk penelitian lebih lanjut, pembaca dreferensikan kepada Singh (1965 1967)
yang telah mengusulkan penduga hasil jumlah rasio untuk 2 peubah tambahan, dan Rao dan
Mudhokar (1967) yang telah memperluas penduga rasio multivariabel menjadi kombinasi
x1
penimbang dari penduga rasio ketika dan y berkolerasi positif dan hasil pendugaan
x1
ketika dan y berkolerasi negatif.
KUMPULAN SOAL
6.1 Jika x dan y penduga takbias dari keseluruhan populasi dari peubah utama dan
peubah tambahan, berturut-turut berdasarkan dari sampel design apapun, tunjukkan rasio dari
y
X
x
bias sebenarnya dari penduga rasio terhadap standar erornya tidak lebih besar dibanding
dengan relatif standar eror dari penduga x. Dapatkan penaksiran dari bias dan kuadrat rata-
rata erornya dinyatakan jelas asumsi digunakan
y1 x1
6.2 Jika dan adalah penduga tak bias dari keseluruhan populasi Y dan X yang
merupakan peubah utama dan peubah tambahan, secara berurutan, berdasarkan kepada i
yi
X
pi xi
sampel dipilih dengan peluang , tunjukan bahwa penduga rasio akan tak bias
xi pi
terhadap keseluruhan populasi Y jika sampel dipilih dengan peluang sebanding .
Dapatkan persamaan untuk varians sampelnya.
6.3 Jika x dan y adalah penduga tak bias dari keseluruhan populasi Y dan X secara
berurutan, berdasarkan pada kumpulan sampel unit yang ditarik sesuai sampel design apapun,
dapatkan persamaan yang benar terhadap derajat kedua dari penaksiran terhada bias dan
y
X
x
kuadat rata-rata eror dari penduga rasio untuk memperkirakan populasi total y.
Dinyatakan jelas asumsi mendasari dan derajat dari penaksiran diperlukan. Juga dikatakan
Y
dibawah kondisi seperti apakah penduga rasio akan lebih efisien dibanding penduga untuk
sample yang besar?
6.4 (a) Definisikan penduga rasio untung memperkirakan populasi total dari y dan
dapatkan persamaan standar eror dari penduga. Dikatakan penduga rasio berada dibawah
kondisi blue (best linear unbiased estimator/penduga terbaik linear takbias).
(b) Jika koefisien variasi dari variabel tambahan x lebih dari dua kali koefisien
variasi y tunjukan bahwa dalam sampel besar dengan Pengambilan Sampel Acak
Sederhana, penduga rasionya kurang teliti dibanding rata-rata tiap unit penduga. Apakah hal
itu benar?
R Y
X
6.5 Dalam Penarikan Sampel Acak Sederhana, wor, penduga rasio dari
y y
x x
ditunjukan dengan . Dapatkan persamaan yang tepat untuk varians .
y i , xi
6.6 Jika (i = 1, . . . . , m) adalah penduga takbias dari Y dan X secara berurutan,
berdasarkan interpenetrasi sub sampel dalam ukuran yang sama, buktikan bahwa
r X m( y r x )
(m 1)
adalah penduga tak bias dari Y
dimana
1 m yi
r
m i xi
6.7 Nilai dari x dan y diukur di tiap unitnya dalam penarikan sampel acak sederhana
R Y
X
untuk menduga rasio populasi, . Penduga yang mana yang akan kamu
rekomendasikan untuk menduga R ?
y
X
(i) Selalu memakai
y
x
(ii) Selalu memakai
y y
X x
(iii) Memakai salah satu atau tergantung kepada kondisi ( diberitahu
X
bahwa diketahui)
NP1
6.8 Andaikan populasi terbatas dari N individu mempunyai individu sebagai
NP2
petani, dimana yang individu melek huruf. Dengan tujuan untuk menduga rasio
P2
P1 p1 p2
populasi , sampel acak, wor, diambil dimana dan sampel sebanding yang
P1 P2
disamakan terhadap dan , secara berurutan.
p2 p2
p1 P1 P1
(i) Tunjukan bahwa penduga lebih efisien dibanding , ketika
diketahui.
p2 P2
p1 p1
(ii) Dapatkan kondisi untuk agar menjadi lebih efisien dibanding ,
P2
ketika diketahui.
6.9 Jika sebuah populasi dibagi menjadi L lapisan, satu unit dipilih secara acak dari
y x
masing-masing lapisan dengan peluang pasti dan memberikan , sebagai pendugaan dari
Y X yi xi
dan . Dengan mengambil k sebagai sampel interpenetrasi, , (i = 1, . . . . , k)
penduga tersebut didefinisikan sebagai berikut
k
yt k
x
y stR , x st i ,
i k i k
yi
k xi k
rt
rst
i k i k
Y
Buktikan bahwa penduga tak bias dari diberikan sebagai berikut
r r xi x st 1
rst X rst X y r x
k 1 k 1 st st st
Desa Jumlah Pohon Jambu Biji Luas Lahan yang Ditanami Pohon jambu Biji (ha)
1 492 4.8
2 1008 5.99
3 714 4.27
4 1265 8.43
5 1889 14.39
6 784 6.53
7 294 1.88
8 793 6.35
9 780 6.58
10 619 9.18
11 403 2.00
12 467 2.20
13 197 1.00
Diberitahu bahwa total lahan yang ditanami pohon jambu biji di 13 desa tersebut adalah
354.78 ha, taksirlah jumlah seluruh pohon jambu biji di Tehsil dengan standar erornya,
gunakan luas lahan yang ditanami pohon jambu biji sebagai variabel tambahan. Diskusikan
efisiensi dari dengan temanmu yang juga menaksir jumlah seluruh pohon jambu biji tapi
tanpa memakai informasi pada variabel tambahan
6.11 Jumlah sapi perah ( y ) dihitung satu per satu diambil dari sampel acak, terambil 20
desa dari 84 desa di Tehsil, bersamaan dengan itu juga ada hasil sensus ( x ) tahun lalu ,
diberikan dibawah ini :
Desa y x
1 237 155
2 1060 583
3 405 205
4 1085 738
5 666 526
6 542 284
7 1337 758
8 1166 681
9 399 143
10 228 111
11 813 616
12 666 576
13 681 540
14 2743 2242
15 1228 940
16 472 387
17 643 675
18 180 220
19 583 654
20 1195 1787
Diberitahukan bahwa sensus menduga jumlah sapi perah si Tehsil adalah 74488, perkirakan
jumlah sapi perah di tahun sekarang, dengan dan tidak menggunakan informasi sensus dan
bandingkan efisiensi dari hasil pendugaannya.
6.12 Sebuah sampel yakni 34 desa telah terpilih dari 170 desa, dengan pps wr untuk
menduga daerah yang ditanami gandum di suatu daerah selama 1974. Daerah yang ditanami
pada tahun 1971 adalah 78000 ha. Lalu diketahui bahwa lahan yang ditanami gandum di
tahun 1973 adalah 21288 ha. Juga tersedia data seluruh desa di daerah tersebut. Data
lengkapnya adalah sebagai berikut :
Luas Lahan yang Ditanami ( ha )
( x1 ) ( x2 ) (y)
1 401 70 50
11 4170 109 99
14 96 5 6
16 377 78 80
17 259 75 105
18 186 45 27
21 700 92 85
29 184 73 62
30 282 62 79
31 194 71 60
(i) Perkirakan luas lahan yang ditanami gandum pada tahun 1974 dengan metode
pendugaan rasio, dengan memakai informasi luasa lahan gandum pada tahun 1973 dan
dugalah standar erornya juga.
(ii) Tentukan efisiensi dari penduga rasio sebagai perbandingan terhadap pendugaan
takbias biasa.
REFERANSI
Elkin, J. M., Estimating the ratio between the proportion of two classes when one is a
subclass other, J. Amer . Statist. Assoc., 48, 128 130, (1953).
Goodman, L.A., On the exact variance of products, J. Amer . Statist. Assoc., 55, 708-713,
( 1960 ).
______and H.O. Hartley, The precision of unbiased ratio-type estimators, J. Amer . Statist.
Assoc.,53, 491-508, (1958).
Hansen, M.H,. W.N. Hurwitz, and M. Gurney, Problem and methods of the sample survey
of bussiness, J. Amer . Statist. Assoc.,47, 173-189, (1946).
______ W.N. Hurwitz, and W.G. Madow, Sample survey methods and theory, John Wiley
& Sons, New York, (1953).
Hartley, H.O. and A. Ross, Unbiased ratio estimators, Nature, 174, 270-271, (1954).
Lahiri, D.B., A methode of sample selection providing unbiased ratio estimates, Bull. Int.
Statist. Inst., 32, 133-140, (1951).
Mickey, M.R., Some finite population unbiased ratio and regresion estimators, J. Amer .
Statist. Assoc., 54, 594-612, (1959).
Midzono, M., One the sampling system with probability proportionate to sum of sizes,
Ann. Inst. Statist. Math, 2, 99-106, (1951).
Olkin, I., Multi-variate ratio estimation for finite population, Biometrika, 45, 154 164,
(1958).
Rao, P.S.R.S. and G.S Mudhokar, Generalized multivariate estimations for the mean of finite
populations, J. Amer . Statist. Assoc., 62, 1008-1012, (1967).
_______and J.N.K. Rao, Small sample results for ratio estimator, Biometrika, 58, 625-630,
(1971).
Singh, M.P., On the estimation of ratio and product of the population parameters, Sankhya,
27, 321-328, (1965).
Sukhatme, P.V., (1944). Moments and product moments of moments statistics for sample of
finite and infinite populations, Sankhya, 6, 363-382, (1944).
Williams, W.H., Generalizing unbiased ratio and regresion estimators, Biometries, 17, 267-
274, (1961).