BAB I
PENDAHULUAN
I. 1 Beberapa Definisi
Dalam berbagai media sering dijumpai hasil jejak pendapat dari masyarakat
tentang isu tertentu, jejak pendapat itu dilakukan untuk mengetahui gambaran
pendapat dari masyarakat di daerah dimana jejak pendapat ini dilakukan. Hal serupa
juga dijumpai dalam publikasi-publikasi penelitian ilmiah baik yang ditulis dalam
rangka penyelesaian studi mahasiswa maupun yang tertera dalam jurnal-jurnal
penelititan. Pada dasarnya semuanya menghendaki gambaran menyeluruh yang
didasarkan pada sebagian objek yang diteliti yang disebut sampel. Gambaran ini
dihasilkan oleh proses generalisasi atau disebut juga dengan proses induksi .Oleh
karena itu, agar diperoleh gambaran yang bisa mengungkapkan keadaan menyeluruh
yang sebenarnya, diperlukan dua hal, yaitu proses induksi yang dilakukan dengan cara
yang tepat, dan sampel yang tergolong “baik”. Dengan proses induksi yang tepat
diartikan sebagai proses yang menggunakan teknik-teknik analisis yang cocok untuk
permasalahan yang dikaji serta mengikuti kaidah-kaidah yang mendasarinya. Sampel
dikatakan baik apabila dapat menggambarkan semua sifat atau karakteristik dari
keseluruhan objek yang diteliti. Untuk dapat memperoleh sampel seperti ini,
diperlukan teknik yang disebut teknik sampling.
Terdapat beberapa definisi yang diperlukan untuk membahas teknik ini.
POPULASI ( N )
SAMPEL ( n )
Alasan -alasan
Parameter Statistik
x
μ
s
σ
p
π
Sampling
Sensus Proses Induksi
I. 1. 2 Unit Observasi
Suatu objek dimana perlakuan dilakukan disebut unit observasi. Ini merupakan
unit dasar dari observasi yang terkadang disebut elemen. Dalam penelitian tentang
perilaku masyarakat, maka individu masyarakat adalah unit observasi.
I. 1. 3 Populasi Target
Populasi yang disampel adalah populasi dimana sampel akan diambil. Pada
suatu saat tertentu setelah peneliti menentukan secara tegas populasi targetnya,
peneliti tidak bisa memperoleh keterangan mengenai populasi targetnya, sehingga
populasi yang ditelitinya berbeda (lebih kecil) dari populasi sasarannya.
Jadi dalam suatu penelitian survey, idealnya populasi yang disampel adalah
juga populasi target, namun keadaan ideal ini jarang terjadi. Contoh, dalam survey
masyarakat, populasi yang disampel biasanya lebih kecil dari populasi target, seperti
tampak dalam gambar berikut :
Kerangka
Populasi sampling
Tidak dapat
dijangkau
Tidak termasuk
dalam kerangka
sampling
Menolak Tidak layak
merespon untuk di
Populasi yang survai
disampel
Tidak dapat
dijangkau
I. 1. 5 Unit sampling
Unit sampling merupakan segala sesuatu yang oleh peneliti dijadikan kesatuan
(unit) yang nantinya akan menjadi objek pemilihan. Jadi unit sampling itu adalah unit
yang diambil sebagai sampel. Unit sampling ini bentuknya bisa individu yang berdiri
sendiri yang disebut satuan elementer (Elementary Unit), dan bisa juga kumpulan
individu yang disebut Cluster. Misalnya, apabila universitas dibagi ke dalam beberapa
fakultas dan dalam penelitian fakultas ini yang akan dipilih, maka fakultas tersebut
mejadi unit sampling. Tetapi apabila universitas dibagi menjadi beberapa jurusan dan
jurusan ini yang akan dijadikan objek penelitian, maka sekarang yang menjadi unit
samplingnya adalah jurusan.
I. 1. 6 Kerangka sampling
Kerangka sampling (sampling frame) adalah daftar unit sampling yang ada
dalam sebuah populasi. Dalam survey tentang pendapat masyarakat akan suatu
kebijakan, maka bila unit samplingnya adalah rumah tangga, daftar yang berisikan
rumah tangga, nomor rumah serta alamatnya dan karakteristik lain yang berkaitan,
disebut kerangka sampling.
Dalam teori sampling, apabila kita harus menyusun sampel, kemudian
terhadap data yang dikumpulkan dari sampel ini kita ingin melakukan analisis secara
statistis, maka sampel yang kita susun tadi harus merupakan sampel random. Sampel
random hanya bisa disusun apabila ada kerangka sampling. Oleh karena itu untuk bisa
memperoleh sampel random, kerangka sampling mutlak harus ada.
untuk semua θˆ nilainya sama dengan θ, maka dikatakan θˆ adalah penaksir tak bias
untuk θ.
Definisi:
Apabila parameter yang akan ditaksir adalah θ dan penaksirnya adalah θˆ maka bias
didefinisikan sebagai
B =| θ − E (θˆ) |
Bias adalah selisih mutlak antara parameter yang ditaksir dengan ekspektasi
penaksirnya.
Sampel yang baik adalah sampel yang bebas dari bias (bias dalam pemilihan
unit sampel) terjadi bila beberapa bagian dari populasi target tidak ada dalam populasi
yang disampel. Bila suatu survey dirancangkan untuk mempelajari pendapatan rumah
Sampel yang baik adalah juga sampel yang mempunyai sifat bahwa responden
merespon pertanyaan dengan akurat. Bias dalam pengkuran terjadi bila instrument
yang digunakan untuk mengukur cenderung akan memberikan hasil yang berbeda dari
yang sesungguhnya. Jadi instrument tersebut gagal untuk dapat mengukur apa yang
sebenarnya harus diukur.Mengukur apa yang seharusnya merupakan hal yang
memang sulit dalam penelitian sosial karena penelitian biasanya berkaitan dengan
pengukuran karakteristik manusia, yang kadang-kadang tidak bersedia untuk
mengatakan hal yang sebenarnya. Dla survey penelitian yang dilakukan terhadap
petani dalam rangka pemberian bantuan makanan maka mereka akan cenderung
merendahkan hasil pertaniannya dengan harapan memperoleh bantuan pangan.
Definisi:
Apabila θ merupakan sebuah parameter dan θˆ merupakan penaksir bagi θ maka error
sampling didefinisikan sebagai:
X X X X
X X X XXX XX
X XXX
X X XX
Ketika kita melakkukan proses sampling, maka secara tegas kita membedakan
apa yang dimaksud dengan Rencana Sampling dan Rancangan Sampling.
Rencana Sampling merupakan sebuah gambaran garis besar yg menyangkut :
1. Penentuan populasi sasaran
2. Penentuan bentuk dan ukuran satuan sampling
3. Penentuan ukuran sampel ( n )
4. Penentuan cara memilih satuan sampling
Apabila pada rencana sampling di atas kita menambahkan metode penaksiran/metode
analisis, maka rencana sampling meningkat menjadi Rancangan Sampling.
Rancangan Sampling
Rencana Sampling
§ n·
Dengan menggunakan rumus FPC = ¨1 − ¸ , maka diperoleh dua buah keterangan
© N¹
yaiotu :
n
a. , disebut sampling fraction, menyatakan berapa persen sampel yang kita buat
N
n
(dari populasi). Misalnya jika ada keterangan = 0.15, maka berarti bahwa
N
ukuran sampel adalah 15 % dari populasinya.
n
b. menyatakan besarnya peluang setiap satuan sampling untuk termasuk ke dalam
N
sampel berukuran n.
I. 3 Distribusi Sampling
¦X i
μ = i =1
N
350
=
5
= 70
¦ (X −μ)
2
i
σ = i =1
=
(50 − 70)2 + (60 − 70)2 + (70 − 70)2 + (80 − 70)2 + (90 − 70 )2
5
1000
=
5
= 14,14214
Tabel di atas merupakan distribusi sampel untuk nilai intelegensi. Terlihat dari
tabel di atas bahwa terdapat data baru sebanyak 25 rata-rata. Distribusi dari rata-
rata tersebut juga bisa disajikan ke dalam bentuk berikut :
Rata-rata
Frekuensi P(X)
Nilai Intelegensi
50 1 0,04
55 2 0,08
60 3 0,12
65 4 0,16
70 5 0,2
75 4 0,16
80 3 0,12
85 2 0,08
90 1 0,04
Intelegensi
6
2
Frequency
0 N = 25.00
50.0 55.0 60.0 65.0 70.0 75.0 80.0 85.0 90.0
Intelegensi
¦X i
μX = i =1
25
1750
=
25
= 70
Sedangkan simpangan baku ke – 25 rata-rata tersebut juga dapat dihitung sebagai
berikut :
25
¦ (X i − μX )2
σX = i = 25
25
=
(50 − 70) 2 + (55 − 70) 2 + (60 − 70) 2 + ...(90 − 70 ) 2
25
2500
=
25
= 10
Ternyata terlihat bahwa rata-rata populasi = 70 dengan rata-rata dari ke-25 rata
tersebut sama, tetapi memiliki simpangan baku yang berbeda. Dari populasi
diperoleh simpangan bakunya = 14,14214 sedangkan dari ke-25 rata-rata
diperoleh simpangan baku = 10. Selanjutnya dapat dihitung :
σ
σX =
n
14,14214
=
2
= 10
Ternyata berlaku :
μX = μ
σ
σX =
n
Tabel di atas merupakan distribusi sampel untuk nilai intelegensi jika data yang
diambil tanpa pengembalian. Terlihat dari tabel di atas bahwa terdapat data baru
sebanyak 10 rata-rata. Distribusi dari rata-rata tersebut juga bisa disajikan ke
dalam bentuk berikut :
Rata-rata
Frekuensi P(X)
Nilai Intelegensi
55 1 0,1
60 1 0,1
65 2 0,2
70 2 0,2
75 2 0,2
Intelegensi
2.5
2.0
1.5
1.0
Frequency
.5
Std. Dev = 9.13
Mean = 70.0
0.0 N = 10.00
55.0 60.0 65.0 70.0 75.0 80.0 85.0
Intelegensi
Dari kumpulan rata-rata di atas, diperoleh jumlah rata-rata = 490. Maka rata-rata
untuk ke – 25 rata-rata ini adalah :
10
¦X i
μX = i =1
10
700
=
10
= 70
Sedangkan simpangan baku ke – 25 rata-rata tersebut juga dapat dihitung sebagai
berikut :
10
¦ (X i − μX )2
σX = i = 25
10
=
(55 − 70) 2 + (60 − 70) 2 + (65 − 70) 2 + ... + (85 − 70) 2
10
750
=
10
= 8,66
Ternyata rata-rata populasi = 70 sama dengan rata-rata dari ke-10 rata-rata
tersebut, tetapi memiliki simpangan baku yang berbeda. Dari populasi diperoleh
σ N −n
σX =
n N −1
14,14214 5 − 2
=
2 5 −1
= 8,66
Ternyata berlaku :
μX = μ
σ N −n
σX =
n N −1
Selanjutnya simpangan baku dari rata-rata tersebut, baik itu yang diambil dengan
pengembalian ataupun tanpa pengtembalian, dinamakan simpangan baku rata-
rata atau galat baku rata-rata. Ukuran ini menunjukkan variasi rata-rata sampel
sekitar rata-rata populasi ȝ.
α/2 α/2
θ - Z σθ θ θ + Z σθ
BAB II
SAMPLING ACAK SEDERHANA
II. 1 Pendahuluan
Sampling acak sederhana merupakan bentuk yang paling dasar dari jenis
sampling peluang yang memberikan dasar teori untuk proses sampling peluang
lainnya yang lebih komplek. Sampling Acak Sederhana ini merupakan suatu proses
memilih satuan sampling dari populasi sedemikian rupa sehingga setiap satuan
sampling dalam populasi mempunyai peluang yang sama besar untuk terpilih ke
dalam sampel dan peluang itu diketahui sebelum pemilihan dilakukan.Terdapat dua
cara dalam pengambilan sampling acak sederhana ini, yaitu dengan pengembalian
(with replacement), yang mana dalam proses ini adanya kemungkinan bahwa suatu
unit akan terpilih lebih dari satu kali dan tanpa pengembalian (without replacement)
yang mana semua unit yang terpilih tidak akan ada yang sama.
Sampling Acak Sederhana dengan pengembalian yang berukuran n dari
populasi yang berukuran N unit dapat digambarkan sebagai n buah sampel
independen yang berukuran 1. Satu unit dipilih secara acak dari populasi menjadi unit
sampel yang pertama, dengan peluang 1/N. Prosedur ini diulang sampai diperoleh
sampel yang berukuran n unit, yang mana bisa terjadi duplikasi unit sampling.
Pada populasi yang terbatas (finite population), suatu sampling yang memiliki
penggandaan unit tersebut tidak akan memberikan tambahan informasi. Oleh karena
itu, biasanya sampling tanpa pengembalian lebih disukai karena unit yang terpilih
tidak akan terjadi duplikasi. Sebuah sampel acak sederhana tanpa pengembalian yang
berukuran n dipilih sedemikian rupa sehingga setiap kemungkinan bagian dari n unit
dalam populasi memiliki peluang yang sama untuk terpilih menjadi anggota sampel.
§N·
Terdapat ¨¨ ¸¸ kemungkinan sampel yang akan terbentuk. Oleh karena itu, peluang
©n ¹
terpilihnya beberapa individu dalam suatu sampel S dari n unit adalah :
1 n ! (N − n )!
P (S ) = =
§N · N!
¨¨ ¸¸
©n ¹
.
.
.
262 Ending Jl. Cikaso 23
Catatan:
1. Simple Randomization adalah randomisasi yang palling sederhana, tetapi
banyak menghamburkan bilangan random.
2. Dala praktik, survai yang populasi sasarannya besar, Simpel Randomization
tidak dilakukan secara manual tetapi menggunakan komputer.
3. Semua angka random yang lebih besar dari N dilewat, angka randoom yang
sudah dipilih tidak dipilih lagi
4. Bilangan-bilangan random yang sudah dipakai , baik terpilih maupun tidak,
tidak boleh dipilih lagi dalam suatu proses pemilihan. Oleh karena itu sangat
disarankan agar pada saat menggunakan tabel angka random peneliti benar-
benar memperhatikan angka random mana yang sudah dipakai, dan sampai
mana peneliti terakhir menggunakan angka random.
5. Proses pemilihan seperti ini disebut Simple Random Sampling dan secara
matematis proses ini menjamin bahwa setiap satuan pengamatan dalam
populasi mempunyai kesempatan yang sama (peluang yang sama) untuk
terpilih yaitu peluang terpilih: n/N. Untuk tidak menghamburkan bilangan
random kita bisa menggunakan Simple Random Sampling melalui pendekatan
lain.
Untuk menghemat bilangan random kita melakukan randomisasi atas dasar sisa hasil
pmbagian
Langkah kerja :
1. Tentukan populasi sassaran dan satuan samplingnya
Dalil :
Apabila sebuah populasi berukuran N kita embentuk sebuah sampel berukuran n
melalui Sampling Acak Sederhana dan dari sampel tersebut diukur variat X yang
mempunyai tingkat pengukuran interval/rasio dengan hasil pengukuran x1, x2, …, xn,
maka :
1
X=
n
¦ xi
2. Estimator untuk standar error σ (X ) adalah
¦ x − (¦ x )
2 2
§N −n·s
2 n
σˆ (X ) = ¨ 2 i i
¸ ; s =
© N ¹ n n (n − 1)
Apabila dari sebuah sampel berukuran n yang dipilih melalui Sampling Acak
Sederhana, kita bisa menghitung σˆ (X ) , maka Bound of Error untuk rata-rata μ
didefinisikan sebagai :
BE = δ = t§ α ·
σˆ (X )
¨ 1− ; n −1 ¸
© 2 ¹
secara teori, Bound of Error tersebut menyatakan kekeliruan terbesar yang mungkin
terjadi dengan derajat kepercayaan ( 1 - α ) 100%. Secara fisik, Bound of Error adalah
setengah lebar taksiran.
Secara statistis kalo kita berbicara persentase, sebenarnya kita berbicara proporsi
(belum dikalikan 100%). Oleh karena itu dalam statistika, analisis mengenai
persentasse dilakukan atas dasar proporsi.
§ N − n · p (1 − p )
σˆ ( p ) = ¨ ¸
© N ¹ n −1
Setelah peneliti menentukan tujuan dari penelitiannya, maka selanjutnya perlu diambil
keputusan apakah akan dilakukan sensus atau sampling. Apabila proses yang akan
dilaksanakannya adalah sampling, maka diperlukan adanya suatu ketegasan berapa
ukuran sampel minimal yang sebaiknya diambil. Ukuran sampel ini akan memberi
isyarat mengenai managability of the research (kelayakan penenlitian). Ada dua dasar
pemikiran dalam menentukan ukuran sampel, yaitu ditentukan atas dasar oemikiran
statistis, dan atau ditentukan atas dasar pemikikran nonstatistis.
Apabila dipandang dari sudut nonstatisti, ukran sampel ditentukan oleh beberapa
faktor, yaitu :
a. Ditentukan oleh waktu (time constraint / kendala waktu)
b. Ditentukan oleh biaya
c. Ditentukan oleh ketersediaan satuan sampling, akan lebih terasa di bidang
kedokteran
Ditinjau dari aspek statistis, ukuran sampel ditentukan oleh banyak faktor, yaitu :
a. Ukuran sampel ditentukan oleh bentuk parameter yang menjadi tolok ukur
analisis, dalam arti apakah kesimpulan yang akan kita ambil dasarnya rata-rata
( μ ), apakah persentase ( π ), atau yang lainnya. Masalah bentuk parameter
uini erat kaitannya dengan tingkat pengukuran variabel yang kita hadapi,
apakah tingkat penggukurannya nominal, ordinal, interval, atau rasio.
b. Ukuran sampel ditentukan oleh tipe sampling yang digunakan, apakah
sampling peluang (Sampling Acak Sederhana, Sampling Sistematis, Sampling
Acak Stratifikasi, dan Sampling Klaster) atau sampling Nonpeluang.
c. Ukuran sampel ditentukan pula oleh tujuan penelitian, apakah bertujuan
untuk menaksir parameter atau menguji hipotesis.
d. Ukuran sampel ditentukan oleh sifat penelitian, apakah sifatnya
nonkomparatif atau komparatif.
e. Ukuran sampel ditentukan oleh variabilitas variabel (keseragaman variabel)
yang diteliti, makin tidak seragam variabel yang diteliti, makin besar ukuran
sampel minimal yang harus diambil.
f. Apabila tujuan penelitian semata-mata hanya membuat taksiran parameter,
maka ukuran sampel ditentukan oleh bound of error penaksiran dan derajat
kepercayaan yang dikehendaki ( α ). Sedanghkan apabila tujuan penelitian
menenguji hipotesis, maka ukuran sampel ditentukan oleh berapa selisih
terkecil yang harus dinyatakan secara signifikan, tergantung pula pada level of
significant ( α ) dan kuasa uji (1-β)
n0
n=
n
1+ 0
n
Keterangan :
S : Simpangan baku untuk variabel yang diteliti dalam populasi
δ : Bound of error yang bisa ditolelir / dikehendaki
Z (1−α ) : Konstanta bilangan yang diperoleh dari tabel normal baku
2
2
§z S·
n0 = ¨ α / 2 ¸
© δ ¹
2
§ 1.96(3.84) ·
n0 = ¨ ¸ = 226.586 ≈ 227
© 5 ¹
n0 227
n= = = 226.89 ≈ 227
n0 227
1+ 1+
n 500.000
catatan:
Skor minimal :40
Skor maksimal : 200
R =160
Diketahui bahwa distribusi skor simetri. Maka
S=(0.24)160= 38.4
Secara statistis, persentase itu dinyatakan dalam proporsi. Oleh karena itu,
menaksir persentase sama dengan menaksir proporsi. Untuk menentukan ukuran
sampel dengan tujuan penaksiran persentase, dapat dihitung dengan persamaan
berikut :
a. Jika sebelumnya ada keterangan sekunder mengenai dugaan harga
proporsi , maka rumusnya :
2
§ zα / 2 π 0 (1 −π 0 ) ·
n0 = ¨ ¸
¨ δ ¸
© ¹
n0
n=
n −1
1+ 0
N
b. Jika belum ada keterangan sekunder mengenai dugaan π0, maka
disarankan dipakai π0 = 0,5 sehingga rumusnya menjadi :
2
§z ·
n0 = ¨ α / 2 ¸
© 2δ ¹
n0
n=
n −1
1+ 0
N
Rumus ini adalah rumus ukuran sampel minimal yang terbesar , sebab
perkalian π0 (1 - π0) akan merupakan perkalian terbesar nilainya jika dan
hanya jika π0 = 0,5
Contoh:
Seseorang ingin mendapat keterangan berapa persen di suatu daerah yang
tergolong pengangguran, bila derajat keyakinan dipilih 99% dengan bound of
error 5%. Diketahui bahwa banyaknya masyarakat di daerah tersebut adalah
12.000
2 2
§ z · § 2.575 ·
n0 = ¨ α / 2 ¸ = ¨ ¸ ≈ 664
© 2δ ¹ © 2 × 0.05 ¹
n=
(Z 1−α + Z1− β ) 2 S 2
2
∂2
untuk α dan β yang ditentukan
S adalah simpangan baku dari variabel yang diteliti, dimana diasumsikan
bahwa simpangan baku ini sama untuk kedua populasi.
δ menyatakan perbedaan rata rata yang menurut teori /tujuan penelitian
dianggap bermakna
Contoh:
Andaikan dalam suatu penelitian ingin diuji suatu hipotesis yang mengatakan bahwa
kinerja perusahaan BUMN lebih tinggi dibandingkan dengan non BUMN. Untuk itu
penelitian dilakukan. Yang menjadi unit sampling dalam penelitian ini adalah
perusahaan bak BUMN maupun non BUMN. Masalahnya berapa perusahaan yang
harus dijadikan sampel bila pengujian ingin mengambil resiko α dan β sebesar
masing masing 0.05. Bila menurut teori perbedaan skor rata rata kinerja antara
perusahan BUMN dan Non BUMN sebesar 10
dianggap bermakna dan menurut pengalaman skor terendah dari kinerja adalah 30
serta tertingi 150, maka kran sampel yang diperlukan adalah:
n=
(Z 1−α + Z1− β ) 2 S 2
2
=
(1.645 + 1.645)2 2S 2
∂2 10 2
Jadi dperlukan paling sedikit masing 180 perusahaan BUMN dan non BUMN.
n=
(Z 1−α + Z1− β ) S d
2 2
∂2
Ukuran sampel ditentukan secara iterasi dengan cara berikut. Tentukan ukuran
sampel melalui rumusan :
Pada iterasi pertama, u p ditentukan melalui persamaan berikut
§1+ ρ ·
u p = 1 log¨¨ ¸¸
2
©1− ρ ¹
L
n= + k +1
f2
R2
dimana f 2 =
1 − R2
BAB III
SAMPLING SISTEMATIS
III. 1 Pendahuluan
Sebuah sampel yang diperoleh dari penyeleksian satu unsur secara acak dari k
unsur yang pertama dalam sebuah kerangka sampling dan setiap unsur ke-k kemudian
disebut satu dalam k sampel sistematik. Jadi, suatu proses memilih dikatakan
sampling sistematik apabila dalam pemilihan itu dilakukan pemilihan sistematik
setelah terpilih bilangan acak, dengan syarat bahwa peluang terpilihnya 1 N .
Sampling sistematik digunakan apabila :
1. Bisa disusun kerangka sampling yang lengkap
2. Keadaan variabel yang sedang diteliti relatif homogen dan tersebar merata
di seluruh populasi
Sampling Sistematik memberikan sebuat alternatif yang berguna dari Sampling Acak
Sederhana untuk alasan sebagai berikut :
1. Sampling Sistematik lebih mudah untuk dilakukan dan oleh sebab itu lebih
sedikit subjek yang melakukan kesalahan wawancara daripada Sampling Acak
Sederhana.
2. Sampling Sistematik sering memberikan informasi yang lebih banyak
mengenai biaya per unit/satuan daripada yang diberikan Sampling Acak
Sederhana.
Pada umunya Sampling Sistematik merupakan penyeleksian secara acak pada
suatu unsur dari k unsur yang pertama dan kemudian penyeleksian pada setiap unsur k
sesudahnya. Prosedur ini lebih mudah dibentuk dan biasanya akan meminimalisir
kesalahan yang mungkin dilakukan oleh pewawancara daripada dalam proses
Sampling Acak Sederhana. Sebagai contohnya, akan menjadi lebih sulit apabila
menggunakan Sampling Acak Sederhana untuk menyeksi n = 50 orang pembeli pada
sebuah sudut jalan kota. Pewawancara tidak menentukan pembeli-pembeli mana yang
termasuk dalam sampelnya, karena ia tidak memiliki sampling framenya serta tidak
¦x i
μ = x sy = i =1
( 3.1 )
n
2
§N −n·s
δ = Zα Vˆ (x sy ) = Z α ¨ ¸ (3.3)
2 2 © N ¹ n
Jika N tidak diketahui maka fpc, ( N – n ) / N pada persamaan (3.2) dan (3.3)
dibuang. Ternyata bahwa taksiran varians dari x sy yang ada pada persamaan (3.2)
§ N −n ·σ 2
V (x ) = ¨¨
ˆ ¸¸
© N −1 ¹ n
Demikian juga varians dari x sy dapat dituliskan :
σ2
V (x sy ) = {1 + (n − 1) ρ }
n
dimana ρ adalah koefisien korelasi antara observasi dalam sampel sisitematik yang
sama. Ketika N besar, kedua varians tersebut sama jika observasi dalam sebuah
sampel yang ditetapkan tidak berkorelasi (ρ ≈ 0).
Sebuah taksiran yang tak bias dari V (x sy ) tidak dapat diperoleh dengan
menggunakan data hanya dari satu sampel sistematik. Hal ini tidak berarti bahwa
suatu taksiran dari V (x sy ) tidak pernah bisa diperoleh. Untuk populasi tertentu,
ampling sistematik ekivalen dengan sampling acak sederhana, dan kita dapat
Definisi : Suatu populasi dikatakan acak apabila elemen-elemen dari populasi tersebut
berada dalam urutan yang acak.
Elemen-elemen dari sampel sistematik yang diambil dari populasi yang acak
diaharapkan akan heterogen dengan ρ mendekati nol. Dengan demikian, ketika N
besar, varians dari x sy kira-kira sama dengan varians dari x yang berdasarkan pada
sampling acak sederhana, sampling sistematis dalam kasus ini ekivalen dengan
sangling acak sederhana. Sebagai contohnya, seorang peneliti ingin menentukan rata-
rata jumlah dari yang ditulis oleh dokter tertentu selama tahun sebelumnya.. Jika
frame (kerangka) mengandung daftar dokter-dokter, cukup beralasan untuk
mengasumsikan bahwa nama-nama pada daftrar tersebut tidak berhubungan dengan
banyaknya resep yang ditulis untuk obat tertentu. Oleh karena itu, kita pertimbangkan
bahwa populasinya acak. Suatu sampel sistematik akan ekivelan dengan sampel acak
sederhana untuk kasus tersebut.
Jika tidak diperoleh taksiran V (x sy ) dari data sampel, suatu taksiran konservatif
s2 § N − n ·
Vˆ (x sy ) = ¨ ¸
n © N ¹
BAB IV
SAMPLING ACAK BERSTRATA
IV. 1 Pendahuluan
Salah satu metoda pengambilan sampel lain disamping Sampling Acak
Sederhana adalah Sampling Acak Bestrata. Sampling ini dilakukan apabila dalam
keadaan tertentu Sampling Acak Sederhana kurang baik untuk digunakan karena akan
memberikan presisi suatu taksiran yang rendah. Untuk itu kita perhatikan kasus yang
berikut. Misalkan di suatu daerah, pendapatan masyarakat bersifat heterogen, yakni
ada yang tergolong “tinggi, menengah, atau rendah”, dan melalui Sampling Acak
Sederhana akan diambil sampel dalam usaha menaksir rata-rata pendapatan
masyarakat tersebut, maka ada kemungkinan yang terambil ke dalam sampel
walaupun dilakukan secara acak, kebanyakan atau hanyalah mereka yang tergolong
berpenghasilan rendah. Bila rata-rata pendapatan dihitung dari sampel ini, maka rata-
rata tadi akan merupakan taksiran yang rendah (under estimate).
Telah diketahui bahwa metoda pengambilan sampel yang dilakukan dalam
rangka menaksir parameter populasi adalah metode yang dapat memberikan presisi
suatu taksiran yang tinggi. Diketahui pula bahwa presisi suatu taksiran diukur oleh
galat baku dari taksiran tersebut. Dari rumus galat baku-galat baku yang sudah kita
kenal, dalam Sampling Acak Sederhana, Tampak bahwa besar kecilnya galat baku
antara lain bergantung pada ukuran sampel. Makin besar ukuran sampel
menyebabkan makin kecilnya galat baku suatu penaksir, yang juga berarti semakin
tinggi presisi penaksir tersebut. Selain itu, variasi data, yang diukur oleh S2, juga bisa
menentukan besarnya galat baku. Dari rumus galat baku rata-rata misalnya, tampak
bahwa makin besar harga S2 (artinya karakteristik populasi heterogen) akan juga
menyebabkan makin besarnya galat baku. Sebaliknya, semakin kecil (karakteristik
populasi relative homogen) akan menghasilkan galat baku yang kecil. Dengan
demikian Sampling Acak Sederhana akan memberikan presisi yang tinggi apabila
karakteristk populasi bersifat homogen. Dalam kasus ini, tampak bahwa pendapatan
bersifat heterogen yang berarti varians pendapatan, S2, juga akan besar. Oleh karena
itu, apabila sampel diambil melalui Sampling Acak Sederhana, akan memberikan
presisi yang rendah.
IV. 2 Notasi
Telah dikatakan bahwa populasi dibagi ke dalam kelompok-kelompok yang
disebut strata. Andaikan populasi dibagi dalam L strata, maka banyaknya unit serta
beberapa besaran karakteristik yang diperlukan dalam stratum dinyatakan dalam
notasi-notasi berikut, Indeks k dalam notasi menyatakan stratum ke-k, jadi k bisa
berharga 1, 2, …, L.
Nh banyaknya unit dalam stratum ke – h
nh banyaknya unit dalam sampel yang diambil dari stratum ke – h
yhi nilai pengamatan atau nilai karakteristik untuk unit ke-i dalam
stratum ke-h
Nh
Wh = bobot stratum ke-h
N
fh fraksi sampling dalam stratum ke-h
Yh =
¦y hi
nilai rata-rata karakteristik dalam stratum ke-h
Nh
¦ (y − Yh )
2
2 hi
S h = varians karakteristik dalam stratum ke-h
Nh −1
¦ (y − Yh )
2
2 hi
s h = varians karakteristik sampel berukuran nh dari stratum ke-h
nh − 1
…
Stratum I : nL
6. Dari setiap stratum kemudian dipilih satuan sampling melalui teknik Sampel
Acak Sederhana.
Oleh karena dari setiap stratum dilakukan secara Sampling Acak Sederhana, maka
keseluruhan proses disebut Sampling Acak Berstrata. Jika proses memilih dari
setiap stratum dilakukan secara sistematik, maka proses keseluruhan disebut
Sampling Acak Sistematis Berstrata.
Sebagai contoh, dibawah ini diberikan gambaran pembagian populasi menjadi
tiga buah stratum yang kemudian dilakukan prose Sampling Acak Berstrata :
N1 N2 . N3 n1 n1 n1
N = N1 + N2 + N3 n = n1 + n2 + n3
Seperti halnya Sampling Acak Sederhana maka akan diuraikan tiga penaksir
yang barangkali dilibatkan dalam penelitian. Penaksir ini adalah penaksir rata-rata,
proporsi dan total populasi.
Rata-rata nilai karakteristik populasi tiada lain adalah jumlah nilai
karakteristik dibagi banyaknya unit dalam populasi.
L Nh
¦¦ x
h =i i =1
hi
X= (4.2)
N
atau bisa juga ditulis dengan :
L
¦N
h =1
h Xh
X= (4.3)
N
X disebut “rata-rata yang dibobot” dengan bobot yang digunakan adalah
ukuran-ukuran stratum, yaitu Nh. Kalau sampel dari setiap stratum diambil dengan
menggunakan Sampling Acak Sederhana, maka rata-rata nilai karakteristik dari
sampel dalam setiap stratum bisa ditentukan yaitu
nh
¦x
i =1
hi
xh = (4.4)
nh
x h ini tentu saja merupakan penaksir yang takbias untuk X h . Karena x h ini
Oleh karena itu, taksiran rata-rata nilai karakteristik populasi akan sama dengan
¦x
h =1
h
x st = (4.5)
N
Taksiran ini juga merupakan taksiran yang takbias untuk X .
Contoh 4. 1 :
Seorang peneliti mengadakan suatu survai untuk mengetahui berapa rata-rata hasil
penjualan lading per bulan milik para petani di suatu daerah. Dikeahui bahwa di
daerah tersebut terdapat 250 petani yang 60 diantaranya tergolong kelompok yang
mempunyai lading luas, 100 tergolong kelompok yang mempunyai ladang lumayan
luas, dan 40 petani tergolong mempunyai ladang kecil. Sampel yang diambil oleh
peneliti adalah 50 petani yang masing-masing kelompok diwakili oleh 15, 25, dan 10
petani. Dalam tiap kelompok petani-petani ini diambil dengan sampling acak
sederhana. Dari petani yang terpilih, rata-rata pendapatannya dihitung, lihat table (IV.
1) diperoleh :
Tabel IV. 1
PENJUALAN HASIL LADANG PER BULAN
MENURUT STRATA LUAS LADANG
(DALAM RATUSAN RIBU RUPIAH)
x st =
(60)(125.000) + (100)(60.000) + (40)(30.000)
200
= Rp. 73.500,−
Seperti telah kita ketahui dalam uraian sebelumnya, selain taksiran untuk suatu
parameter populasi, diperlukan juga varians atau galat baku dari taksiran tersebut agar
presisi dari penaksir dapat diukur. Apabila sampel diambil melalui prosedur Sampling
Acak Berstrata dan dari nilai karakteristik sampel ini akan ditaksir rata-rata populasi
X , oleh x st , maka varians dari x st , ditulis V ( x st ) dapat ditentukan dengan
menggunakan persamaan berikut :
§ L N x ·
V ( x st ) = V ¨ ¦ h h ¸ (4.6)
© h =1 N ¹
yang apabila diuraikan menjadi
1 L
N h − n h S h2
V ( x st ) =
N2
¦ N h2
h =1 N h nh
(4.7)
Oleh karena itu, V( x st ) bisa ditaksir. Taksiran untuk V( x st ) akan didasarkan pada
besarnya varians nilai karakteristik yang dihitung melalui sampel yang diambil dari
setiap stratum. Penaksir tersebut adalah :
L
§ N − nh · s h2
Vˆ ( x st ) = ¦ Wh2 ¨¨ h ¸¸ (4.9)
h =1 © Nh ¹ nh
s h2 menyatakan varians nilai karakteristik stratum ke – h yang dihitung dengan
menggunakan persamaan (…). Dengan demikian galat baku dari rata-rata untuk
sampling berstrata adalah
s x st = V ( x st ) (4.10)
Dari contoh 4.1, melalui sampel yang diambil dari tiap stratum, besarnya varians atau
simpangan baku pendapatan petani dihitung. Dari 15 petani yag mempunyai ladang
luas, juga dari 25 petani serta 10 petani yang mempunyai ladang cukup dan kecil,
simpangan baku pendapatan dihitung. Hasilnya tampak pada tabel III. 1 berturut-turut
adalah :
s1 = Rp. 16.053,48 , -
s2 = Rp. 6.416,13 , -
s3 = Rp. 7.149,20 , -
Maka dengan menggunakan persamaan (…) varians rata-rata petani di daerah tersebut
besarnya ditaksir oleh :
§ 40 · § 40 − 10 · (7149,20 ) ½°
2 2
¨ ¸ ¨ ¸ ¾
© 200 ¹ © 40 ¹ 10 °¿
=1621797,603
s x st = Vˆ ( x st ) = Rp.1273,498 ,−
Contoh 4.2 :
Dalam contoh yang lalu, apabila diinginkan interval taksiran untuk rata-rata
pendapatan hasil ladang dengan α = 5 %, maka interval taksiran tersebut adalah :
73.500 – (1,96) (1273,498) < X < 73.500 + (1,96) (1273,498)
71003,94 < X < 75996,06
yang berarti bahwa dengan derajat keyakinan 95 % rata-rata penjualan hasil ladang
para petani di daerah tersebut terletak antara Rp. 71.004 , - dan Rp. 75.996,-.
Seperti halnya pada taksiran untuk rata-rata, maka taksiran untuk proporsi juga
melibatkan besaran proporsi untuk setiap strata. Oleh karena itu, melalui Sampling
Acak Berstrata berukuran N, taksiran untuk proporsinya adalah :
L
§N ·
Pst = ¦ ¨ i ¸ pi
i =1 © N ¹
1 ni
dengan pi = ¦ xij
n j =1
xij = 1 jika satuan sampling mempunyai karakteristik yang dicari
xij = 0 jika satuan sampling tidak mempunyai karakteristik yang dicari
Apabila sampel diambil melalui prosedur Sampling Acak Berstrata dan dari
nilai karakteristik sampel ini akan ditaksir proporsi populasi πst, oleh Pst, maka varians
dari Pst, ditulis V(Pst) dapat ditentukan dengan menggunakan persamaan berikut :
·§ N i · pi (1 − p i )
2
L
§ N − ni
V (Pst ) = ¦ ¨¨ i ¸¸¨ ¸ (4.12)
i =1 © Ni ¹© N ¹ ni − 1
Salah satu cara menentukan besarnya nh untuk n yang diketahui adalah alokasi
proporsional. Alokasi ini adalah alokasi yang paling sederhana. Ukuran-ukuran
sampel dari setiap stratum diambil proporsional terhadap ukuran stratumnya, Nh.
Dengan alokasi ini, maka :
Nh
nh = ⋅n ; h = 1, 2, ... , L (4.14)
N
nh n
sehingga berlaku bahwa = yang menyatakan berapa bagian sampel diambil
Nh N
dari populasi.
Contoh 4. 3 :
Dari contoh 4.1 nampak bahwa ukuran populasinya terdiri dari 200 petani, dan
masing-masing stratum berukuran N1 = 60, N2 = 100, dan N3 = 40. Dari ukuran ini
akan diambil sampel berukuran 50 petani. Maka dengan alokasi proporsional,
banyaknya petani yang harus diambil dari setiap stratum adalah:
60
n1 = × 50 = 15 pe tan i
200
100
n2 = × 50 = 25 pe tan i
200
40
n3 = × 50 = 10 pe tan i
200
dengan demikian, sampel-sampel yang diambil dari setiap stratum dari contoh di atas
merupakan sampel yang proporsional terhadap ukuran stratum.
Apabila alokasi sampel dilakukan dengan alokasi proporsional, maka x st
dengan variansnya yang masing-masing ditulis dalam persamaan () dan () dapat
disederhanakan menjadi :
L nh
¦¦ x
h =1 i =1
hi
x st = (4.15)
n
yang merupakan rata-rata nilai karakteristik sampel, dan
dengan s h2 menyatakan varians nilai karakteristik yang dihitung dari sampel yang
diambil dari stratum ke-h, dihitung dengan menggunakan rumus (….)
Apabila rumus ini kita gunakan untuk contoh yang lalu, maka
§ 200 − 50 ·§ 60 (16053,48) ·
2
100 (6406,13) 2 40 (7149,20) 2
V ( x st ) = ¨
ˆ ¸¨¨ + + ¸¸
© 200 ¹© 200 50 200 50 200 50 ¹
= 1621797,603
terlihat bahwa hasilnya sama dengan apabila digunakan persamaan ((())))
jumlah biaya tetap dan tidak tetap, maka seluruh biaya dapat dituliskan sebagai
berikut :
B = B0 + ¦ nh Bh (4.18)
Dengan menggunakan fungsi biaya, maka ukuran sampel dapat ditentukan melalui
dua cara: Pertama, dengan biaya sampling tertentu, yakni sebesar B, tentukan ukuran
sampel n, dan alokasikan n ini ke dalam setiap stratum sehingga dicapai presisi yang
maksimal (galat baku taksiran minimal). Ke dua, dengan presisi taksiran yang
dikehendaki, tentukan ukuran sampel n, lalu alokasikan n ini pada setiap stratum
sehingga biaya yang harus dikeluarkansekecil mungkin. Metode alokasi ukuran
sampel ini disebut Alokasi Optimal.
Dengan terminologi lain, alokasi optimal dapat dinyatakan seperti berikut,
tentukan n dan nh sedemikian rupa sehingga untuk B ′ tertentu s x st minimal, atau
Apabila biaya total per satuan sampling dalam setiap stratum (Bh) sama, maka
penentuan alokasi sampling ke dalam setiap stratum dari persamaan 4.18 menjadi :
Sebagaimana telah diketahui, banyak sekali faktor yang ikut menentukan ukuran
sampel, dua diantaranya adalah tergantung kepada parameter yang akan ditaksir dan
tergantung kepada tipe samplingnya.
¸¸ N + ¦ N i S i
2 2
¨¨ Z
© (1−α 2 ) ¹
i =1
wi = ni / n ; δ = bound of error
Selanjutnya jika parameter yang akan ditaksir adalah rata-rata dan tipe sampling
Sampling Acak Berstrata, maka ukuran sampel bisa diperoleh melalui persamaan
berikut :
L
N i2 π i (1 − π i )
¦ wi
n= i =1 (4.24)
2
§ ·
¨ δ ¸
L
¨¨ Z ¸¸ N 2
+ ¦ N i π i (1 − π i )
© (1−α )
2 ¹
i =1
BAB V
SAMPLING KLASTER
V. 1 Pendahuluan
Salah satu jenis sampling yang juga sering digunakan dalam praktek penelitian
adalah sampling klaster. Sampling ini dilakukan apabila peneliti ingin menekan biaya
sampling atau jika kerangka sampling yang memuat elemen/atau unit observasi tidak
tersedia. Sampling klaster adalah sampling dimana unit samplingnya adalah kumpulan
atau kelompok (cluster) elemen (unit observasi). Sebagai contoh, andaikan seorang
peneliti ingin mengetahui rata-rata pendapatan kepala keluarga disebuah kota besar.
Apabila Sampling acak sederhana atau sampling acak berstrata akan digunakan, maka
peneliti harus mempunyai kerangka sampling yang berisikan daftar kepala keluarga
dikota tersebut. Daftar keseluruhan nama kepala keluarga dikota yang besar seperti ini
pasti akan sulit diperoleh. kalaupun ada, dan SRS dilakukan maka sampel masyarakat
yang terambil bisa tersebar ke semua penjuru kota, dan ini akan melibatkan biaya
pengambilan sampel yang tinggi. Daftar yang mungkin bisa diperoleh adalah daftar
nama nama kelurahan dikota tersebut. Kelurahan adalah kumpulan kepala kepala
keluarga. Oleh karena itu kelurahan dipandang sebagai klaster.
Proses pegambilan sampling klaster dilakukan dengan memperhatikan
kerangka sampling yang berisikan daftar klaster , dalam contoh di atas daftar nama
kelurahan. Pengambilan sampel kemudian dilakukan dengan mengambil secara acak
klaster-klaster. Unit sampling yang berisikan klaster-klaster dinamakan unit sampling
utama (primary sampling unit) disingkat USU. Apabila semua unit observasi dalam
USU menjadi anggota sampel maka dikatakan bahwa proses pengambilan sampel
dilakukan dengan sampling klaster satu tahap. Namun apabila USU dibagi lagi ke
dalam unit yang lebih kecil, misalnya kelurahan dibagi lagi ke dalam Rukun-rukun
Warga maka rukun warga disebut unit sampling ke dua (secondary sampling unit)
disingkat USD. Apabila semua unit obervasi (elemen) dari USD menjadi anggota
sampel, maka dikatakan proses pengambilan sampel dilakukan dengan sampling
klaster dua tahap, demikian seterusnya.
Untuk presisi yang terbaik, elemen- Untuk presisi yang terbaik, elemen-
elemen individu di dalam setiap stratum elemen individu di dalam masing-masing
harus memiliki nilai-nilai yang serupa , klaster harus heterogen, dan rata-rata
tetapi rata-rata sertiap statum satu sama klaster harus serupa satu sama lainnya.
lain sedapat mungkin harus berbeda
V.2 Notasi notasi yang digunakan untuk Sampling Klaster Satu Tahap
Dalam sampling acak sederhana, unit-unit yang diambil sebagai sampel adalah
elemen-elemen yang diobservasi. Dalam sampling klaster, unit samplingnya adalah
klaster-klaster, dan elemen-elemen yang diobservasi adalah USD di dalam klaster-
klaster. Himpunan semestanya, U¸ merupakan populasi dari N USU; S menandakan
sampel dari USU yang dipilih dari populasi USU, dan Si merupakan sampel dari USD
yang dipilih dari USU yang ke-i.
Berikut ini adalah notasi notasi yang akan digunakan dalam sampling klaster
khususnya bila ingin menaksir rata rata populasi:
N = banyaknya klaster dalam populasi
n = banyaknya klaster yang dipilih sebagai sample
mi = banyaknya unit observasi (elemen) dalam klaster ke I, I=1,2, … ,N
1 n
m = ¦ mi rata rata ukuran klaster dalam sampel
n i =1
N
M= ¦m
i =1
i Banyaknya unit observasi (elemen) dalam populasi
M
M = rata rata ukuran klaster dalam Populasi
N
y i = total semua observasi dalam klaster ke i
Dalam sampling klaster satu tahap, terjadi suatu kondisi dimana semua atau
tidak satupun elemen-elemen yang terkandung di dalam klaster (= USU) dijadikan
sebagai sampel. Sampling klaster satu tahap banyak digunakan pada kegiatan survai
yang memiliki biaya sampling untuk USD dapat diabaikan bila dibandingkan dengan
biaya sampling untuk USU. Misalnya untuk survai pendidikan, yang bertindak
sebagai USU adalah ruangan kelas; semua siswa dalam kelas yang terpilih yang
sebenarnya merupakan USD dijadikan sebagai objek analisis jika hanya sedikit biaya
ekstra yang perlukan daripada meneliti beberapa siswa saja dalam kelas terpilih
tersebut.
i) Populasi dibagi-bagi ke dalam N buah klaster atau Unit Sampling Utama
(USU). Keadaan variable Y dalam setiap klaster diusahakan se-heterogen
mungkin (dalam praktik tidak pernah bisa tercapai, terutama apabila yang
menjadi klaster adalah daerah atau kumpulan satuan-satuan sampling yang
ukurannya besar).
ii) Secara Simple Random Sampling dipilih n buah klaster.
iii) Pemilihan hanya dilakukan sekali yaitu memilih klaster ( memilih Unit
Sampling Utama / USU ). Oleh karena itu, semua unit sampling kedua
(USD) yang ada dalam klaster yang terpilih diperiksa.
Sebagai catatatan bahwa apabila kita akan menggunakan sampling klaster satu tahap
maka disarankan ukuran klaster relatif kecil. Ukuran klaster yang terlalu kecil bisa
merugikan, bisa pula menguntungkan.
Merugikan : Apabila yang sedang kita teliti adalah peristiwa-peristiwa yang
jarang terjadi (Rare Cases)
Contoh : Kematian ibu pada saat melahirkan (mortality)
Menguntungkan : Apabila peristiwa itu banyak terjadi (abundant cases).
¦y
i =1
i
y= n
(5.1)
¦m
i =1
i
ˆ ( y) = §¨ i =1 (5.2)
2¸
V
© NnM ¹ n −1
Dalam hal ini M dapat ditaksir dengan m jika M tidak diketahui.
Taksiran varians pada persamaan (5.2) merupakan taksiran yang bias dan taksiran
varians tersebut akan baik jika ukuran sampel yang diambil, n, besar, yaitu n 20.
Bias akan hilang jika masing-masing klaster, m1, m2, …, mN, memiliki ukuran yang
sama.
Contoh:
Suatu survai dirancangkan untuk menaksir rata rata pengeluaran untuk keperluan
rumah tangga masyarakat disuatu kota. Karena daftar rumah tangga di daerah tersebut
tidak ada, maka dilakukanlah pengambilan sampel dengan cara klaster. Yang menjadi
klaster adalah Rukun rukun warga (RW) di daerah tersebut. Dari hasil sampel
diperoleh data berikut.
Tabel 5.1
Total Jumlah Total Jumlah
Banyaknya Pengeluaran dari Banyaknya Pengeluaran dari
RW Rumah Rumah Tangga RW Rumah Rumah Tangga
Tangga (dalam ribuan Tangga (dalam ribuan
rupiah) rupiah
1 55 2210 11 73 2930
2 60 2390 12 64 2470
3 63 2430 13 69 2830
n
Dari tabel ini maka m1 = 55, m2 = 60, m3 = 63, , m20 = 70 , sehingga ¦m
i =1
i = 1303
= 138873600
20
¦ m i2 = m 21 + m 22 + ... + m 252
i =1
= 86171
20
¦ y i m i = y1 m1 + y 2 m 2 + ... y 20 m 20
i =1
= (2210) (55) + (2390) (60 ) + ... + (2880 ) (70)
= 3456230
i =1 i =1 i =1 i =1
= 248085,668
Apabila dimisalkan bahwa total Rukun Warga yang ada di daerah tersebut adalah
sebanyak 100 (N = 100), maka varians dari pengeluarannya adalah:
n
§ N−n ·
¦ (yi − ymi )2
V̂( y) = ¨ 2
¸ i =1
© Nn M ¹ n −1
§ 100 − 20 · 248085,668
=¨ ¸
¨ (100 )(20 )(65,15)2 ¸ 20 − 1
© ¹
= 0,123
Dengan demikian, dengan kepercayaan mendekati 95%, taksiran interval untuk
pengeluaran tersebut adalah :
ˆ (y ) = 40,167 ± 2 0,123 = 40,167 ± 0,702
y±2 V
Jadi taksiran yang paling baik dari rata-rata pengeluaran untuk keperluan rumah
tangga masyarakat di kota tersebut adalah 40,167, dan kekeliruan taksiran harus
kurang dari 0,702 dengan peluang mendekati 0,95.
ˆ ( My ) = M 2 V (y ) = M 2 §¨ N − n ¸ i =1
V
·
© NnM 2 ¹ n −1
n
¦ (y i − ym i )
2
§ N − n i =1 · (5.4)
= M2 N2 ¨ ¸
© NnM 2 ¹ n −1
n
¦ (y i − ym i )
2
§ N − n · i =1
= N¨ ¸
© n ¹ n −1
Contoh :
Dari contoh sebelumnya mengenai tingkat pengeluaran untuk keperluan rumah
tangga masyarakat di suatu kota, akan ditaksir total pengeluarannya. Dimisalkan
bahwa terdapat 5500 penduduk dari kota tersebut, maka nilai taksiran total
pengeluarannya adalah:
M y = 5500 (40,167 )
= 220918,5
Sebelumnya telah diketahui nilai dari V̂(y ) , namun dari sekarang ini nilai M tidak
perlu lagi ditaksir dengan m . Dengan memanfaatkan nilai yang telah diperoleh
tersebut, maka dengan menggunakan kepercayan 95%, taksiran interval untuk τ
adalah sebagai berikut:
ˆ (M y ) = 220918,5 ± 2 M 2 V
M y±2 V ˆ ( y)
Seringkali banyaknya elemen dalam populasi tidak diketahui ketika akan digunakan n
klaster sampling. Maka penaksir M y tidak dapat digunakan, tetapi dapat digunakan
bentuk taksiran yang lain dari total populasi yang tidak bergantung pada M. Nilai y τ ,
diperoleh dengan persamaan:
adalah rata-rata dari total klaster untuk sampel klaster yang berukuran n. Oleh kareba
itu, y τ merupakan penaksir yang tak bias untuk rata dari total N klaster dalam
populasi. Begitu juga N y τ merupakan penaksir yang tak bias untuk jumlah dari total
§N −n·
ˆ ( Ny ) = N 2 V ( y ) = N 2 ¨ (5.7)
V ¸ i =1
© Nn ¹ n −1
Jika ternyata variasi di antara ukuran-ukuran klaster besar dan jika ukuran klaster
sangat berkorelasi dengan total klaster, maka varians untuk N y τ (persamaan 5.7)
pada umumnya lebih besar dari varians untuk My (persamaan 5.4). Penaksir N y τ
tidak menggunakan informasi yang mengenai ukuran-ukuran klaster m1, m2, …, mn
sehingga bisa mangakibatkan rendahnya presisi yang dimiliki.
Contoh :
Dengan menggunakan contoh soal sebelumnya, dimisalkan bahwa untuk menaksir
total pengeluaran ternyata banyaknya penduduk dari kota tersebut tidak diketahui.
Yang diketahui adalah banyak klaster yaitu N=100. Sebagai solusinya, dapat
digunakan persamaan (5.7) sebagai berikut:
N n 100
N yτ = ¦ yi = (52340) = 261700
n i =1 20
Selanjutnya untuk menentukan varians dari penaksirnya, maka terlebih dahulu dicari
persamaan berikut:
maka interval taksiran untuk total pengeluaran untuk pengeluaran rumah tangga
masyarakat adalah :
ˆ (Ny )
Ny τ ± 2 V τ
n
¦ (y i − y)
2
§N−n·
i =1
Ny τ ± 2 N2 ¨ ¸
© Nn ¹ n −1
V.6 Menentukan Ukuran Sampel untuk Menaksir Rata-rata dan Total Populasi
Banyaknya informasi dalam suatu sampel klaster dipengaruhi oleh dua faktor
yaitu banyaknya klaster dan ukuran relatif dari klaster. Sebagaimana telah kita
ketahui, ukuran dari batas-batas kekeliruan (bound of error) dari taksiran tergantung
kepada variasi di antara klaster. Dengan demikian harus disahakan untuk
memperoleh variasi yang kecil diantara totalnya.diasumsikan bahwa u8kuran klaster
(unit sampling) telah dipilih dan dianggap hanya sebagai masalh dari pemililhan
jumlah klaster, n.
§ N−n · 2
V̂( y) = ¨ ¸ sk
© NnM 2 ¹
( )
dimana
n
¦ (y i − ym i )
2
i =1
s 2k = (5.8)
n −1
V ( )
ˆ ( y ) = §¨ N − n ·¸ σ 2
k
(5.9)
© NnM 2 ¹
2 2
dimana σ k merupakan varians populasi yang ditaksir dengan s k .
2
Karena tidak dketahui σ k atau rata-rata dari klaster M , pemilihan ukuran sampel,
yaitu banyaknya klaster yang perlu untuk memperoleh informasi khusus mengenai
parameter populasi menjadi sulit. Kesulitan ini dapat diatasi dengan menggunakan
metode yang sama dengan penggunaan pada taksiran rasio. Yaitu, digunakansebuah
2
taksiran dari σ k dan M , yang diperoleh dari survai pendahuluan, atau dipilih
sampel yang berukuran n’ elemen yang telah diambil dari penelitian
sebelumnya.Dengan demikian, seperti halnya pada semua permasalahan mengenai
penentuan ukuran sampel, pada standard deviasi penaksir dikalikan dengan dua
untuk memperoleh batas-batas kekeliruan dari taksiran (bound of error), δ. Batasan
ini menunjukkan nilai kekeliruan maksimum yang dirasa memiliki toleransi yang
sesuai, yaitu:
δ = 2 V( y ) (5.10)
populasi τ, karena V( My ) = M2 V( y ).
Pendekatan ukuran sampel dengan tujuan untuk menaksir μ dengan batas kekeliruan
taksiran δ , adalah:
N σ 2k (5.11)
n=
N D + σ 2k
2 2
dimana σ k ditaksir dengan s k , dan
δ2 M 2
D= (5.12)
4
yang merupakan pendekatan dari distribusi normal baku dengan melibatkan resiko
kekeliruan sebesar α, maka diperoleh :
δ = zα V (y ) (5.13)
2
Contoh:
Misalkan data pada tabel 5.1 merupakan sampel pendahuluan dari pengeluaran untuk
keperluan rumah tangga msyarakat di suatu kota. Berapa besar sampel yang harus
diambil untuk keperluan survai yang akan datang yang bertujuan untuk menaksir rata-
rata pengeluaran μ dengan batas kekeliruan dari taksirannya adalah 25 ribu rupiah?
Jawab:
n
¦ (y i − ym i )
2
248085,668
s 2k = i =1 = = 13057,14
n −1 20 − 1
δ 2 M 2 (25)2 (65,15)2
D= = = 663206,64
4 4
taksiran δ :
Dengan pola pemikiran yang sama, maka diperoleh persamaan ukuran sampel
yang harus diambil sebagai berikut:
N σ 2k
n= (5.15)
N D + σ 2k
2 2
dimana σ k ditaksir dengan s k , dan
δ2 (5.16)
D= 2
4N
atau apabila menggunakan kita mengambil nilai pengali dari simpangan baku
taksirannya adalah z α , yang merupakan pendekatan dari distribusi normal baku
2
δ2 (5.17)
D=
(z α
2
N )
2
Contoh:
Dengan menggunakan data pada tabel 5.1 kembali, anggap sebagai data yang
diperoleh merupakan data survai pendahuluan. Ingin diketahui berapa banyak sampel
yang harus diambil untuk menaksir total pengeluaran masyarakat untuk keperluan
rumah tangganya, τ, dengan batas kekeliruan 3000 ribu rupiah. Dimisalkan bahwa
terdapat 2000 penduduk di kota tersebut.
dan
D= =
(3000 )2
δ2
= 225
4 N 2 4 (100 )2
maka diperoleh
§ N −n · ¦ (ai − p mi )2
V̂ ( p ) = ¨¨ ¸
2 ¸
i =1
(5.19)
© N nM ¹ n−1
·¦ i
(a − p mi )2
§ N − n i =1
δ = Zα V̂ ( p ) = Z α ¨ ¸
¨ N nM2 ¸ (5.20)
2 2
© ¹ n−1
dimana Z α diperoleh dari tabel distribusi normal baku dengan taraf signifikansi α.
2
Apabila kita mengambil nilai α = 5%, maka diperoleh nilai Z α mendekati 2 , maka
2
·¦ i
(a − p mi )2
§ N −n
δ=2 ¨ ¸ i =1
(5.21)
¨ N nM 2 ¸ n −1
© ¹
persamaan varians di atas merupakan penaksir yang baik hanya jika ukuran sampel,
n,besar, katakanlah n 20. Jika m1 = m2 = … = mN , maka p merupakan penaksir tak
bias untuk π, dan V̂ ( p ) merupakan penaksir yang tak bias dari varians p yang
sebenarnya untuk setiap ukuran sampel.
Contoh :
Sebagai lanjutan dari contoh sebelumnya, kepada masyarakat ditanyakan pula apakah
masyarakat di kota tersebut menempati rumah sewaan atau rumah milik sendiri.
Hasilnya disajikan dalam tabel 5.2 . Gunakan data pada tabel tersebut untuk menaksir
proprsi penduduk yang tinggal di rumah sewaan.
Tabel 5.2
Banyaknya Banyaknya
Banyaknya Banyaknya
Rumah Rumah
Klaster Penyewa Klaster Penyewa
Tangga Tangga
( ai ) ( ai )
( mi ) ( mi )
1 55 25 11 73 32
2 60 36 12 64 22
3 63 26 13 69 19
Penyelesaian:
Taksiran terbaik dari populasi penyewa adalah p, ditunjukkan dalam persmaan 5.18,
yaitu :
n
¦ ai 524
i =1
p= m
= = 0 ,40
1303
¦ mi
i =1
i =1 i =1 i =1
Apabila dimisalkan bahwa total Rukun Warga yang ada di daerah tersebut adalah
sebanyak 100 (N = 100), maka varians dari proporsi penyewa adalah:
§
N −n ·
¦ (ai − p mi )2
V̂ ( y ) = ¨¨ ¸ i =1
2 ¸
© NnM ¹ n−1
§ 100 − 20 · 720 ,982
=¨ ¸
¨ (100 )(20 )(65 ,15 )2 ¸ 20 − 1
© ¹
= 0 ,000358
Taksiran dari proporsi populasi, π, dengan batas δ unit dari kekeliruan taksiran
dinyatakan dengan
2 V ( p) = δ
Persamaan di atas dapat menjadi solusi untuk menentukan besarnya sampel yang
harus diambil, n dan prosedur solusinya serupa dengan persamaan 5.15, yaitu:
N σ 2k (5.15)
n=
N D + σ 2k
2 2
dimana σ k ditaksir dengan s k ;
n
¦ (a i − p mi )2
i =1
s k2 =
n −1
dan
δ2 M 2
D= (5.16)
4
δ2 M 2
D=
(z )
α
2
2 (5.17)
Contoh:
Dimisalkan bahwa data pada tabel 5.2 dianggap sudah kadaluarsa. Selanjutnya
diperlukan suatu penelitian baru yang bertujuan untuk menaksir proporsi penduduk
yang menyewa rumah. Berapa banyak sampel yang harus diambil untuk memberikan
taksiran tersebut dengan batas 0,03 dari kekeliruan penaksiran?
Penyelesaian:
2
Taksiran terbaik dari σ k adalah yang dihitung dengan menggunakan tabel 5.2
sebagai berikut:
n
¦ (ai − p mi )2 720,982
i =1
s k2 = = = 37 ,946
n −1 20 − 1
δ2 m 2 (0,03)2 (65,15)2
D=
(z ) α
2
2
=
(1,96)2
= 0,994
n=
N σ 2k
=
(100)(37,946) = 27 ,62 ≈ 28
N D + σ 2k (100)(0,994) + (37,946)
VI.1 Pendahuluan
Sampling klaster dua tahap merupakan perluasan dari konsep klaster sampling.
Sebagaimana yang telah dibahas pada bab sebelumnya mengenai sampling klaster
secara umum, ternyata klaster pada umumnya merupakan suatu kumpulan dari
elemen-elemen, seperti blok-blok rumah tangga. Sebuah klaster sering mengandung
begitu banyak elemen. Oleh karena itu, diperlukan suatu pengelompokkan kembali
dari elemen-elemen klaster yang telah terbentuk tersebut. Proses pengelompokkan
kedua dari klaster-klater pertama yang terbentuk itu menghasilkan suatu prosedur
sampling klaster dua tahap. Sebagai contohnya adalah apabila akan diteliti pendapat
masyarakat di suatu daerah, dalam hal ini kecamatan merupakan bentuk klaster yang
pertama. Akan tetapi dikarenakan adanya keterbatasan dana penelitian dan didukung
pula poleh suatu kondisi dimana elemen-elemen dalam kecamatan sangat heterogen
yang merupakan imbas dari heterogennya tiap desa, maka desa-desa dari tiap klaster
dijadikan sebagai klaster-kalster dari klaster pertama (kecamatan). Prosedur pemilihan
untuk klaster tahap dua dilakukan sama halnya seperti prosedur pemilihan pada
sampling klaster satu tahap. Oleh karena itu, di sini hanya akan terpilih desa-desa dari
klaster pertama yang terpilih saja. Sehingga hal akan berakibat pada penghematan
biaya apabila dibandingkan dengan memilih desa langsung sebagai klaster tahap
pertama. Hal ini dapat dipahami karena jika desa langsung dijadikan sebagai klaster
pertama, maka muncul suatu kemungkinan bahwa desa-desa yang terpilih sangat
berjauhan yang berakibat pada peningkatan biaya survai atau biaya pengambilan data.
Definisi VI.1
Sampling klaster dua tahap merupakan suatu sampel yang diperoleh dengan diawali
pemilihan sampel peluang dari klaster-klaster pertama yang kemudian memilih
sampel peluang dari elemen-elemen masing-masing klaster yang telah dijadikan
sampel pada tahap sebelumnya.
Pembahasan dalam buku ini hanya akan terbatas pada pemilihan masing-masing tahap
secara sampling acak sederhana. Sebagai contoh, suatu survai nasional terhadap
Masalah pertama dalam pemilihan sampel klaster dua tahap adalah pemilihan
klaster yang tepat. Terdapat dua kondisi yang diperlukan, yaitu:
1. Kedekatan geografis dari elemen-elemen dalam klaster
2. Ukuran klaster yang sesuai bagi administer/peneliti
Pemilihan klaster yang sesuai juga tergantung pada apakah diinginkan untuk
membuat sampel sedikit klaster dengan elemen-elemen dalam kalster yang banyak
atau sampel banyak klaster dengan elemen-elemen dalam klasternya yang sedikit.
Akhirnya, pemilihan tergantung pada biaya yang akan dikeluarkan. Klaster-klaster
yang besar cenderung memiliki elemen-elemen yang heterogen, dan karenanya suatu
sampel yang besar diharuskan untuk tiap-tiap klaster agar diperoleh taksiran yang
akurat dari parameter populasi. Sebaliknya, kalster-klaster yang kecil sering
mengandung elemen-elemen yang relatif homogen, dalam hal keakuratan informasi
mengenai karakteristik dari sebuah klaster, dapat diperoleh dengan memilih suatu
sampel yang kecil dari masing-masing klaster.
M
M = = Rata-rata ukuran klaster populasi
N
merupakan suatu penaksir yang tak bias untuk τ. Dengan demikian jika persamaan di
atas dibagi dengan M, diperoleh:
n
N
Mn
¦ yi
i =1
menjadi suatu peaksir yang tak bias untuk μ. Tetapi penaksir tersebut tidak dapat
dievaluasi karena tidak lagi diketahui total klaster, yi. Bagaimanapun juga, yi dapat
ditaksir dengan M i y i , dan dalam penggantian M i y i untuk yi, dimiliki suatu taksiran
tak bias untuk μ, yang dapat dihitung dari data sampel.
§N·
¦ M i yi
i =1
ˆ =¨ ¸
μ (6.1)
©M ¹ n
§ N −n ·§ 1 · 2 1 n
§ M − mi · § s i2 ·
V̂ (μ
ˆ)= ¨
N
¸¨ 2
¸ sb +
nNM 2
¦ M i2 ¨¨ i ¸¨
¸¨ m
¸
¸
(6.2)
© ¹ © nM ¹ i =1 © Mi ¹© i ¹
dengan
i =1
s b2 = (6.3)
n −1
dan
n
¦ (y ij − yi )2
i =1
s i2 = i = 1, 2, ..., n (6.4)
mi − 1
δ = 2 V̂ (μ
ˆ) (6.5)
sebagaimana yang telah dibahas pada bab sebelumnya bahwa nilai pengali 2 diperoleh
dari pendekatan nilai tabel Z α untuk α = 5 %.
2
§ N − n · §¨ N
2 · 2 N n
§ M − mi · § s i2 ·
=¨ ¸
© N ¹ ¨© n
¸ sb +
¸ n
¦ M i2 ¨¨ i ¸¨
¸¨ m
¸
¸
¹ i =1 © Mi ¹© i ¹
dengan s b2 telah dibahas pada persamaan (6.3) dan s i2 pada persamaan (6.4)
δ = 2 V̂ (ˆτ)
= 2 M 2V̂ (μ
ˆ)
Penaksir μ̂ yang diberikan pada persamaan (6.1) bergantung pada jumlah total dari
elemen-elemen dalam populasi, M. Seringkali M tidak diketahui. Jika kondisinya
seperti itu, maka harus ditaksir dari data sampel. Penaksir untuk M diperoleh dengan
n
mengalikan rata-rata ukuran klaster, ¦Mi n , dengan jumlah klaster dalam populasi,
i =1
§ N −n ·§ 1 · 2 1 n
§ M −m · § s i2 ·
V̂ (μ
ˆr)= ¨
© N
¸¨ 2
¹ © nM ¹
¸ sτ +
nNM 2
¦ M i2 ¨¨ iM i i ¸¨
¸¨ m
¸
¸
i =1 © ¹© i ¹
dengan
n
¦ M i2 ( y i − μˆ r )2
i =1
s τ2 =
n −1
dan
mi
¦ (y ij − yi )2
i =1
s i2 = i = 1, 2 , ..., n
mi − 1
δ = 2 V̂ (μ
ˆr)
Taksiran μ̂ r adalah bias, tapi bias tersebut dapat diabaikan jika n besar.
Taksiran varians π :
§ N − n · §¨ 1 · 2 § M i − mi · § pi qi ·
n
V̂ ( p ) = ¨ ¸ ¸ si + 1 ¦ M i2 ¨¨ ¸¨ ¸
© N ¹ ¨© n M 2 ¸ nNM 2 ¸ ¨ m −1 ¸
¹ i =1 © Mi ¹© i ¹
dengan
n
¦ M i2 ( pi − p )2
i =1
s r2 =
n −1
dan
q i = 1 − pi
M1 = M2 = … = MN = M
Dalam kasus ini, merupakan hal yang wajar apabila sampel yang diambil pun
memiliki ukuran yang sama untuk tiap klaster, yaitu :
m1 = m2 = … = mN = m
Di bawah kondisi seperti ini, persamaan (6.1) menjadi:
n
§N·
¦ M i yi
i =1
ˆ =¨ ¸
μ
©M ¹ n
n
M ¦ yi
§ N · i =1
=¨ ¸
© NM ¹ n
1 n
= ¦ yi
n i =1
dimana yij merupakan ukuran ke – j dalam klaster ke-i. Kondisi seperti ini dapat
terjadi dalam sampling produk-produk yang berbentuk paket (sebagai contohnya
masing-masing klaster terdiri atas 1 lusin / 24 kaleng sayuran) atau dalam sampling
barang-barang manufacture.
Persamaan (6.2) menjadi:
MSB § 1 · MSW
V̂ (μ
ˆ ) = (1 − f 1 ) + (1 − f 2 )¨ ¸
nm ©N¹ m
dimana f 1 = n N , f 2 = m M
m n
MSB =
n − 1 i =1
¦
( y i − μˆ )2
dan
MSB (Between-Claster Mean Square) merupakan rata-rata kuadrat antar klaster dan
MSW (Within-Claster Mean Square) rata-rata kuadrat dalam klaster.
Dari persamaan 6.19 di atas, dapat dibuat suatu rangkaian observasi yang penting
pada karakteristikdari sampling klaster dua tahap sebgai beikut:
MSW
1. Jika N besar, V̂ (μˆ ) = dan hanya bergantung pada rata-rata klaster. Dengan
nm
demikian, dapat dihasilkan suatu taksiran yang baik dari varians μ̂ sekalipun
bentuk s i2 merpakan taksiran yang kurang baik untuk varians dalam klaster.
Hal ini bisa terjadi, sebagai contohnya, jika sampling sistematik digunakan
dalam klaster-klaster.
2. Jika m = M (atau f2 = 1), maka samping klaster dua tahap dikurangi menjadi
samping klaster satu tahap, sebagaimana yang telah dibahas pada bab 5.
3. Jika n = N, maka
MSW
V̂ (μ
ˆ ) = (1 − f 2 )
nm
yang merupakan taksiran varians yang diperoleh dalam suatu sampel acak
stratifikasi dengan n = N strata dan m observasi dari masing-masing strata.
Oleh karena itu, terlihat bahwa m mendekati M , sampling klaster dua tahap
memiliki proses yang sama dengan sampling kalster satu tahap. Ketika n
mendekati N, sampling klaster dua tahap berkelakuan seperti sampling acak
stratifikasi. Jika elemen-elemen di dalam klaster bersifat heterogen, maka harus
dijadikan sebagai sampel dalam penelitian.
dengan
dan
σ 2w = varians di antara elemen-elemen dalam klaster-klaster.
σ 2w c1
m =
σ b2 c 2
Setelah m ditentukan, n diperoleh dari persamaan (6.21) jika V (μ̂ ) tertentu nilainya
atau dari persamaan (6.23) jika c tertentu. Sebagai catatan bahwa m meningkat
nilainya jika σ 2w meningkat dan m akan menurun jika σ b2 meningkat. Dengan
demikian, lebih banyak elemen-elemen dalam klaster yang dijadikan sebagai
sampel (dan karenanya, akan sedikit klaster yang akan dijadikan sebagai sampel)
sebagaimana σ 2w yang lebih besar bila dibandingkan dengan σ b2 .
BAB VIII
Klasifiklasi Sampling
Ditinjau dari sudut kesempatan semua unit sampling untuk terpilih menjadi
anggota sampel, maka sampling terbagi dalam dua bagian yaitu sampling random dan
sampling nonrandom, atau disebut juga sampling peluang dan sampling nonpeluang.
Suatu proses pengambilan sampel dikatakan random bila semua unit sampling
mempunyai peluang untuk bisa terpilih menjadi anggota sampel. Apabila dalam
proses memilih satuan sampling dilibatkan unsur peluang sedemikian rupa sehingga
besarnya peluang setiap satuan sampling untuk terpilih diketahui besarnya, maka
sampling tersebut digolongkan ke dalam sampling peluang.
Pada sampling peluang, peluang tiap elemen untuk terpilih sebegai sampel
harus diketahui. Untuk tujuan ini, maka daftar elemen untuk memilih sampel
(kerangka sampling) harus tersedia. Ke dalam sampling peluang dapat digolongkan
beberapa teknik pengambilan sampel. Selain bagaimana teknik pengambilan sampel
yang harus dikerjakan agar setiap unit mempunyai peluang terambil menjadi anggota
sampel, dalam sampling peluang juga dibahas berapa banyak unit sampling yang
harus diambil.
Sampling Acak Sederhana ini merupakan suatu proses memilih satuan sampling
dari populasi sedemikian rupa sehingga setiap satuan sampling dalam populasi
mempunyai peluang yang sama besar untuk terpilih ke dalam sampel dan peluang itu
diketahui sebelum pemilihan dilakukan.Terdapat dua cara dalam pengambilan
sampling acak sederhana ini, yaitu dengan pengembalian (with replacement), yang
mana dalam proses ini adanya kemungkinan bahwa suatu unit akan terpilih lebih dari
satu kali dan tanpa pengembalian (without replacement) yang mana semua unit yang
terpilih tidak akan ada yang sama.
BAB VII
RASIO, REGRESI, DAN SELISIH PENAKSIRAN
VII. 1 PENDAHULUAN
Kita dapat menaksir μ y dan μ x dengan menggunakan y dan x , rata-rata dari isi gula
dan berat jeruk dari sampel n jeruk. Kita juga dapat mengukur IJx, yang merupakan
total berat dari jeruk dalam muatan truk. Kemudian penaksiran rasio dari total isi gula
IJy yaitu:
∧ y
τy = (τ x )
x
atau, sama dengan ( mengalikan pembilang dan penyebut dengan n ).
n
∧y
¦y i
τ y = (τ x ) = i =1
n
(τ x )
x
¦x
i =1
i
Dalam kasus ini jumlah elemen populasi, N, tidak diketahui, dan karena itu
kita tidak dapat menggunakan penaksir sederhana N y untuk menaksir total populasi
IJy . Jadi, penaksir rasio diperlukan untuk menyelesaikan objek penaksiran. Bagaimana
¦yi =1
i
r= n
(7.1)
¦x
i =1
i
∧ ¦ i ·¦
¨ y ¸ ( y i − rx i ) 2
∧
¨
V (r ) = V ni =1 ¸ = § N − n ·§¨ 1 ¸ i =1
¸ ¨© nN ¸¹¨ μ 2
(7.2)
¨ ¸ n −1
¨ ¦ xi ¸ © i ¹
© i =1 ¹
Rentang kekeliruan penaksiran :
n
·¦
( y i − rxi ) 2
∧
§ N − n ·§¨ 1 ¸ i =1
2 V (r ) = 2 ¨ ¸ 2 (7.3)
© nN ¹¨© μ i ¸
¹ n −1
−
[Jika rata-rata dari populasi x, ȝx tidak diketahui, kita gunakan x untuk
memperkirakan persamaan (6.2) dan (6.3).]
Contoh 7.1 Dalam sebuah survei yang menyelidiki tentang trend pada real estate,
seorang peneliti tertarik pada perubahan relatif selama lebih dari 2 tahun
dalam nilai perkiraan rumah pada sebuah komunitas yang khusus. Sampel
acak sederhana dengan n = 20 rumah dipilih dari N = 1000 rumah dalam
komunitas tersebut. Dari pencatatan pajak, peneliti mendapatkan nilai
perkiraan untuk tahun ini ( y ) dan nilai sebenarnya dari 2 tahun yang lalu
( x ) untuk tiap sampel dengan n = 20 rumah. Dia berharap untuk
memperkirakan R, perubahan relatif pada nilai perkiraan untuk N = 1000
rumah, dengan menggunakan informasi pada sampel.
Data dari survei real estate ditunjukkan pada tabel 7.1. Kita telah
menambahkan kolom xi2, yi2 dan xiyi , yang sangat penting untuk
∧
menghitung V (r ) .
Tabel 7.1 Data dan perhitungan survei nilai real estate ( dalam $ 10,000 )
2 2
Rumah Nilai perkiraan 2 tahun Nilai sebenarnya xi yi xiyi
yang lalu ( xi ) ( yi )
1 6.7 7.1 44.88 50.41 47.57
2 8.2 8.4 67.24 70.56 83.88
3 7.9 8.2 62.41 67.24 74.78
4 6.4 6.9 40.96 47.01 44.16
5 8.3 8.4 68.89 70.56 69.72
6 7.2 7.9 51.84 62.41 56.88
7 6.0 6.5 36.00 42.25 39.00
8 7.4 7.6 54.76 57.76 56.24
9 8.1 8.9 65.61 79.21 72.09
10 9.3 9.9 86.49 98.01 92.07
11 8.2 9.1 67.24 82.81 74.62
12 6.8 7.3 46.24 53.29 49.64
13 7.4 7.8 54.76 60.84 57.72
14 7.5 8.3 56.25 68.89 62.25
15 8.3 8.9 68.89 79.21 73.87
16 9.1 9.6 82.21 92.16 87.36
17 8.6 8.7 73.96 75.69 74.82
18 7.9 8.8 62.41 77.44 69.52
19 6.3 7.0 39.69 49.00 44.10
20 8.9 9.4 79.21 88.36 83.66
Jumlah 154.5 164.7 1210.55 1373.71 1288.95
20 20 20 20
¦(y − rxi ) 2 = ¦ y i + r 2 ¦ xi − 2r ¦ xi y i
2 2
i (7.4)
i =1 i =1 i =1 i =1
¦(y
i =1
i − rxi ) 2 = 1373.71 + (1.07) 2 (1210.55) − 2(1.07)(1288.95)
= 1.3157
Dengan menggunakan persamaan (7.3)
n
· ¦ ( y i − rxi )
2
§
∧
§ N − n ·¨ 1 ¸ i =1
2 V (r ) = 2 ¨ ¸ 2
© nN ¹¨¨ − ¸¸ n −1
©x ¹
n
· ¦ (1.3157)
2
§
§ 1000 − 20 ·¨ 1 ¸ i =1
= 2 ¨¨ ¸¸¨ ¸¸ = 0.015
© 20(1000) ¹¨ (7.725) 2 19
© ¹
Jadi, kita menaksir rasio dari nilai real estate sekarang dengan yang dua tahun
yang lalu menjadi r = 1.07 dan kita sungguh yakin bahwa kesalahan penaksiran
kurang dari 0.02. Karena itulah, rasio sebenarnya R untuk polpulasi seharusnya
berada diantara 1.05 dan 1.09. Dengan catatan bahwa rentang kesalahan dari
penaksiran cukup kecil. Karena itu r seharusnya menjadi penaksir yang cocok untuk
R.
Interval konfidensi untuk sampel besar yang didasai oleh teori distribusi
normal, seperti yang ditunjukkan dalam bagian 2, mengaplikasikan contoh rasi
estimasi dengan baik. Dengan demikian sebagai contoh, penaksiran inteval konfidensi
90 % untuk rasio R dalam bentuk
∧
r ± 1.645 V (r )
Taksiran varians r dapat dituliskan dalam berbagai bentuk. Salah satu yang
lebih khusus yang berguna untuk menunjukkan koefisien korelasi ȡ antara x dan y.
Korelasi ini dapat ditaksir oleh
S xy
ρ=
SxSy
2
1 n −
Sx2 = ¦ i )
n − 1 i =1
( x − x
dan
2
1 n −
Sy2 = ¦ i )
n − 1 i =1
( y − y
7KHUHJUHVVLRQHTXDWLRQLV
\ [
3UHGLFWRU&RHI6WGHYWUDWLRS
1R&RQVWDQ
[
Jika taksiran koefisien 1.066 § 1.07 = r, dan
∧
2 V (r ) = 2 0.98 (0.00745) = 0.15
adalah seperti hasil perhitungan kita yang diawal. Pendekatan ini tentunya membawa
kebosanan pada perhitungannya, tapi pengguna teknik ini seharusnya memiliki
pengetahuan tentang regresi klasik disamping yang ada di buku ini. ( t-rasio dan p-
value yang ditunjukkan diatas, jika dalam populasi normal yang tidak terbatas,
koefisien regresi akan berbeda secara signifikan terhadap nol).
Tehnik rasio untuk menaksir total populasi IJy diaplikasikan dalam penaksiran
−
toal isi gula dalam muatan truk jeruk. Penaksir sederhana dari N y tidak dapat
digunakan karena kita tidak mengetahui N, total banyaknya jeruk dalam truk.
Prosedur penaksiran rasio berikut dapat diaplikasikan dalam menaksir IJy apakah N
diketahui atau tidak.
∧
Penaksir rasio dari total populasi τ y :
n
∧ ¦y i
τ y= i =1
n
(τ x ) = rτ x (7.5)
¦x
i =1
i
∧
Varian dari taksiran τ y :
n
·¦
2
( y − rx )
§ N − n ·§¨ 1 ¸
∧ ∧ ∧ i i
V (τ y ) = (τ x ) 2 V (r ) = τ x2 ¨ ¸ 2 i =1
(7.6)
© nN ¹¨© μi ¸¹ n −1
·¦
( y i − rxi ) 2
^ ∧
§ N − n ·§¨ 1 ¸¸ i =1
2 V (τ y ) = 2 τ x2 ¨ ¸ 2 (7.7)
© nN ¹¨© μ x ¹ n −1
Dengan catatan meskipun kita tidak perlu mengetahui N atau ȝx , kita harus
mengetahui IJx untuk menaksir IJy dengan menggunakan prosedur penaksiran rasio.
Contoh 7.2 Dalam sebuah penelitan untuk menaksir total banyaknya gula dalam
muatan truk jeruk, sebuah sampel acak dengan n = 10 jeruk dibuat
menjadi jus dan diukur beratnya. Total berat dari semua jeruk, didapatkan
dengan penimbangan pertama pada truk yang berisi muatan dengan
kemudian truk yang dikosongkan, didapatkan 1800 pon. Taksirlah IJy ,
total jumlah gula pada jeruk, dan rentang kekeliruan penaksirannya
6ROXVL
Gula yang terkandung dalam jeruk biasanya dicatat dalam derajat brix, yang
merupakan pengukur berapa pon gula padat per 100 pon jeruk. Untuk menghitungnya
kita akan menggunakan berapa pon kandungan yang sebenarnya untuk setiap jeruk.
Taksiran τˆ y dapat diperoleh dengan menggunakan persamaan (7.5):
¦y i
0.246
τˆ y = r τˆ x = i =1
10
(τ x ) = (1800) = 101.79 pon
4.35
¦x
i =1
i
§ 1 ·§ 1 ·
¦(y i − rxi ) 2
2 Vˆ (τˆ y ) = 2 τ x2 ¨ ¸¨ 2 ¸ i =1
© n ¹© x ¹ n −1
Gunakan persamaan (7.4), untuk menghitung :
10 10 10 10
¦(y
i =1
i − rxi ) 2 = ¦ y i2 + r 2 ¦ xi2 − 2r ¦ xi y i
i =1 i =1 i =1
dimana
10
¦y
i =1
i
0.246
r= 10
= = 0.0566
4.35
¦x
i =1
i
Dari data,
10
¦y 2
i = (0.021) 2 + (0.030) 2 + ... + (0.025) 2 = 0.006224
i =1
10
¦x
i =1
2
i = (0.40) 2 + (0.48) 2 + ... + (0.44) 2 = 1.9035
10
¦y x
i =1
i i = (0.021)(0.40) + (0.030)(0.48) + ... + (0.025)(0.44) = 0.10839
4.35
x= = 0.435
10
Substitusikan ke dalam persamaan (7.4) didapat
§ 1 ·§ 1 ·
¦(y i − rxi ) 2
2 Vˆ (τˆ y ) = 2 τ x2 ¨ ¸¨ 2 ¸ i =1
© n ¹© x ¹ n −1
§ 1 ·ª 1 º§ 0.000052285 ·
= 2 (1800) 2 ¨ ¸ « 2 »¨ ¸ = 6.3
© 10 ¹ ¬ (0.435) ¼© 9 ¹
Kesimpulannya, rasio penaksiran total gula dalam truk jeruk adalah τˆ y = 101.79 pon,
dengan kekeliruan penaksiran 7.3. Kita yakin bahwa total kandungan gula τy berada
pada interval
101.79 ± 6.3
sehingga, intervalnya berada pada 95.49 sampai 108.09 pon.
Selain itu, deskriptif statistik, yang diperlihatkan di bawah ini dari output
Minitab, dapat digunakan untuk menghitung Vˆ (r ) , bagian utama dari Vˆ (τ y ) .
N Rata-rata Stdev
x 10 0.4350 0.0354
y 10 0.02460 0.00438
Korelasi x dan y = 0.991
Analisis regresi yang diboboti dengan garis lurus melalui titik pangkalnya
menghasilkan :
Maka didapat,
2 Vˆ (τ y ) = 2τ x Vˆ (r )
¦y i
μˆ y = i =1
n
( μ x ) = rμ x (7.8)
¦x
i =1
i
§ N − n §
·¨ 1 · ¦ ( y i − rxi ) 2
Vˆ ( μˆ y ) = μ x2Vˆ (r ) = μ x2 ¨ ¸¨ 2 ¸¸
i =1
(7.9)
© nN ¹© μ x ¹ n −1
§ N −n·
¦(y i − rxi ) 2
2 Vˆ ( μˆ y ) = 2 ¨ ¸ i =1
(7.10)
© nN ¹ n −1
Catatan bahwa kita tidak perlu mengetahui τ x atau N untuk menaksir μ y ketika
ͽǤ
Sebuah perusahaan ingin menaksir rata-rata jumlah uang μ y yang dibayarkan kepada
karyawan untuk biaya pengobatan selama tiga bulan pertama pada kalender tahunan.
Laporan rata-rata setiap tiga bulan ini didapat dari laporan keuangan tahun
sebelumnya. Sampel acak sebanyak 100 karyawan diambil dari populasi sebanyak
1000 karyawan. Hasilnya dinyatakan sebagai berikut. Gunakan data tersebut untuk
memprediksi μ y dan untuk menempatkan kekeliruan penaksiran.
n = 100, N = 1000
Total tiga bulan terakhir :
100
¦y
i =1
i = 1750
¦x
i =1
i = 1200
τ x = 12500
¦
i =1
2
y = 31,650,
i ¦x
i =1
2
i = 15,620, ¦y x
i =1
i i = 22,059.35
Solusi
Taksiran untuk μ y adalah
μˆ y = rμ x
¦y i
1750
μˆ y = i =1
100
(μ x ) = (12.5) = 18.23
1200
¦x
i =1
i
Taksiran kekeliruan didapat dengan menggunakan persamaan (7.10); tetapi kita harus
menghitung terlebih dahulu
100 100 100 100
§ N −n·
¦(y i − rxi ) 2
2 Vˆ ( μˆ y ) = 2 ¨ ¸ i =1
© nN ¹ n −1
dari $0.42.
Untuk mengingat rumus taksiran rasio dari rata-rata populasi, total, atau rasio, kita
membuat asosiasi berikut. Rasio sampel r dinyatakan dalam rumus berikut
n
¦y
i =1
i
r= n
¦x
i =1
i
(7.11)
Penaksir R , τ y , dan μ y adalah
τˆ y = rτ x
(7.13)
μˆ y = rμ x
(7.14)
Jadi kita hanya perlu mengetahui rumus r dan hubungannya dengan μ̂ y dan τˆ y .
§ N − n · § 1 · ¦ ( y i − rxi ) 2
Vˆ (r ) = ¨ ¸¨¨ 2 ¸¸
i =1
(7.15)
© nN μ
¹© x ¹ n −1
Maka
Vˆ (τˆ y ) = τ x2Vˆ (r ) (7.16)
Vˆ ( μˆ y ) = μ x2Vˆ (r ) (7.17)
·¦
( yi − rxi ) 2
^
§ N − n ·§¨ 1 ¸ i =1
V (r ) = ¨ ¸ 2 (7.19)
© nN ¹¨© μ x ¸
¹ n −1
^
§ N − n ·§¨ 1 ·¸ 2
atau : V (r ) = ¨ ¸ 2 s (7.20)
© nN ¹¨© μ x ¸¹
dengan
n
¦(y i − rxi ) 2
s2 = i −1
n −1
^
Varians populasi V(r) yang mendekati dapat diperoleh dari V (r ) dengan mengganti
§ N − n ·§¨ 1 ·¸ 2
2 V (r ) = 2 ¨ ¸ 2 σ =B (7.21)
© nN ¹¨© μ x ¸¹
^ 2 ¦(y i − rxi ) 2
σ = i −1
n' −1
kemudian kita substitusikan hasil dari persamaan ini untuk σ 2 pada persamaan
(7.22), maka kita akan mendapatkan ukuran sampel yang mendekati. Jika μ x juga
−
tidak diketahui, maka μ x dapat digantikan oleh rata-rata sampel x , yang dihitung
178 187
3HPHFDKDQ
Pertama kita menghitung penaksir dari σ 2 dengan menggunakan data yang diperoleh
dari penelitian pendahuluan
^ 2 ¦(y i − rxi ) 2
σ = i =1
9
Dengan :
10 10 10 10
Kemudian, dari data yang disajikan pada tabel kita akan menentukan :
10
¦y
i =1
2
i = (13) 2 + (25) 2 + ... + (12) 2 = 4463
10
¦x
i =1
2
i = (12) 2 + (24) 2 + ... + (14) 2 = 4066
10
¦y i =1
i
187
r= 10
= = 1.05
178
¦x
i =1
i
10 10 10 10
^ 2 ¦(y i − rxi ) 2
31.625
σ = i =1
= = 16.3
9 9
B 2 μ x2 (0.01) 2 (16.3) 2
D= = = 0.006642
4 4
6HNDUDQJ NLWD GDSDW PHQHQWXNDQ XNXUDQ VDPSHO \DQJ GLSHUOXNDQ GHQJDQ PHQJJXQDNDQ
SHUVDPDDQ6HEDJDLFDWDWDQEDKZD
τx 16.300
μx = = = 16.3
N 1000
dan
B 2 μ x2 (0.01) 2 (16.3) 2
D= = = 0.006642
4 4
dengan demikian
penaksiran B adalah :
Nσ 2
n=
ND + σ 2
dengan
B2
D=
4
Sebagai catatan bahwa untuk menentukan n pada persamaan (7.24) kita tidak perlu
mengetahui nilai μ x ; namun demikian kita tetap memerlukan taksiran dari σ 2 , yang
bisa kita peroleh atau kita tentukan dari penelitian yang telah dilakukan sebelumnya.
208 221
^ 2 ¦(y i − rxi ) 2
σ = i =1
9
Kemudian gunakanlah persamaan (7.4)
10 10 10 10
¦(y
i =1
i − rxi ) 2 = ¦ y i2 + r 2 ¦ xi2 − 2r ¦ xi y i
i =1 i =1 i =1
¦y
i =1
2
i = (25) 2 + (15) 2 + ... + (29) 2 = 5469
10
¦x
i =1
2
i = (23) 2 + (14) 2 + ... + (31) 2 = 4872
10
¦y
i =1
i
221
r= 10
= = 1.06
208
¦x
i =1
i
10 10 10 10
bound of error sebesar B = 1.0. kita memerlukan sebanyak 17 bidang tanah untuk
diteliti. Karena pada penelitian pendahuluan kita telah meneliti sebanyak 10 bidang
tanah, maka kita tinggal meneliti sisanya yaitu sebanyak 7 bidang tanah.
Ukuran sampel yang diperlukan untuk menaksir τ y dengan bound of error
sebesar B bisa didapatkan dengan mencari solusi untuk n dari persamaan berikut :
^
2 V (τ y ) = B (7.25)
adalah :
Nσ 2
n= (7.27)
ND + σ 2
dengan
B2
D=
4N 2
Telah ditunjukan sebelumnya bahwa penaksir rasio lebih layak digunakan jika
hubungan antara y dan x adalah linier. Jika kenyataan dari hubungan linier antara
pengamatan y’s dan x’s, tetapi tidak harus salah satunya , lalu informasi tambahan
disediakan dengan bantuan variabel x yang didapat dari perhitungan taksiran regresi
dari rata-rata μ y . Harus diketahui μ y sebelum penaksir dapat dipakai, seperti yang
Yang digarisbawahi memperlihatkan hubungan dasar antara y’s dan x’s yang
kadang menunjuk pada garis regresi dari y atas x.
Penaksir memberikan asumsi bahwa x’s adalah variabel tetap dan y’s adalah
variabel acaknya. Dapat kita pikirkan nilai x sebagai suatu yang telah diteliti, seperti
pendapatan seperempat bulan pertama tahun yang lalu, dan respon y sebagai variabel
acak yang belum di teliti, seperti pendapatan empat bulan berikutnya dari suatu
perusahaan untuk x yang telah diketahui. Peluang dari penaksir selanjutnya
tergantung hanya dari y untuk pasangan x’s.
μˆ yL = y + b( μ x − x ) (7.28)
dimana
n
¦ (y
i =1
i − y )( x i − x )
b= n
¦ (x
i =1
i − x) 2
§ N − n ·§ 1 · ª º
n n
Vˆ ( μˆ yL ) = ¨ ¸¨
2
¸« ( yi − y) − b
© Nn ¹© n − 2 ¹ «¬ i =1
2
¦ ¦ (x
i =1
i − x) 2 »
»¼
(7.29)
§ N − n ·§ 1 · ª º
n n
2 vˆ( μ yL ) = 2 ¨
© Nn
¸¨
¹© n − 2 ¹ «¬ i =1
2
¸« ( yi − y) − b
2
¦ ¦ (x
i =1
i − x) 2 »
»¼
(7.30)
¦(y
i =1
i − y )( x i − x ) ¦y x
i =1
i i − nx y
n
= n
¦ (x
i =1
i − x) 2
¦x
i =1
2
i − nx 2
Contoh 7.9
Perolehan nilai test matematika telah diberikan kepada 486 siswa yang terlebih dahulu
masuk perguruan tinggi tertentu. Dari semua siswa tersebut SRS dari n=10 siswa telah
diseleksi dan kemajuan mereka dalam kalkulus diteliti. Hasil akhir nilai kalkulus telah
dilaporkan, seperti telah diberikan pada tabel. Diketahui bahwa μ y =52 untuk 486
siswa yang mengambil test perolehan tsb. Taksir μ y untuk populasi ini, dan
¦y x
i =1
i i − nx y
36,854 − 10(46)(76)
b= n
= = 0.766
23,634 − 10(46) 2
¦i =1
x i2 − nx 2
n n
¦ (y
i =1
i − y) 2 = ¦y i =1
2
i − ny 2 = 2056
n n
¦i =1
( xi − x ) 2 = ¦x i =1
2
i − nx 2 =2474
juga
§ N − n ·§ 1 · ª º
n n
Vˆ ( μˆ yL ) = ¨ ¸¨
2
¸« ( y i − y ) − b
© Nn ¹© n − 2 ¹ «¬ i =1
2
¦ ¦ (x
i =1
i − x) 2 »
»¼
§ 486 − 10 ·§ 1 ·
= ¨¨
486 (10)
[
¸¸¨ ¸ 2056 − (0,766) 2 (2474) = 7,397 ]
© ¹© 8 ¹
Perhitungan untuk penaksir regresi dari rata-rata sejajar dengan analisis regresi
klasik dalam kasus populasi yang tak berhingga.dengan model
E ( y i ) = β 0 + β 1 xi
untuk (xi,yi) data. Lalu penaksir kuadrat terkecil dari β i adalah b, telah didapat dari
persamaan (7.28). juga hasil dari (7.29) menjadi
§ N −n·
v ( μˆ yL ) = ¨ ¸ MSE
© Nn ¹
dimana MSE adalah kesalahan rata-rata kuadrat yang biasa dari analisis regresi.
476
= (75.8) = 7.42
486(10)
dan
2 vˆ( μ yL ) = 5.45
dimana sangat dekat dengan nilai yang terkandung dalam perhitungan yang lalu.
Pemeriksaaan yang lebih dekat dari data dalam kandungan gula dan berat
jeruk diberikan dalam contoh 7.2 disarankan bahwa penaksir rata-ratanya lebih layak
dari pada penaksir rasio.(Plot ari nilainya akan memperlihatkan bahwa garis regresi
tidak tampak) walau demikian, penaksir regresi dari total adalah bentuk Nμ yL ,
khususnya n harus diketahui. Sejak penaksir rasio juga bekerja dengan baik dalam
kasus ini, menetapkan nomor dari jeruk dalam truk tidak akan mendapatkan biaya dan
waktu tambahan. Dalam kasus N yang lain akan diketahui atau mudah ditemukan.
Dengan demikian, kita harus hati-hati dalam memilih antara penaksir rasio dan
μˆ yD = y + ( μ x − x ) = μ x + d (7.31)
dimana
d = y−x
§ N −n·
¦ (d i − d )2
Vˆ ( μ yD ) = ¨ ¸
i =1
(7.32)
© Nn ¹ n −1
dimana
d i = y i − xi
§ N −n·
¦ (d i − d )2
2 Vˆ ( μˆ yD ) = 2 ¨ ¸
i =1
(7.33)
© Nn ¹ n −1
200.00
150.00
y
100.00
50.00
58 − 10(0.4) 2
= = 6.27
9
jadi
n
§ N −n·
¦ (d i − d )2
ª180 − 10 º
Vˆ ( μˆ yD ) = ¨ ¸ i =1
=« » (6.27) = 0.59
© Nn ¹ n −1 ¬ (180)10 ¼
Kita telah melihat bahwa rata-rata sample, penaksir rasio, penaksir regresi, dan
penaksir selisih semuanya bisa digunakan sebagai penaksir rata-rata populasi μ y .
Bagaimana kita mengetahui penaksir yang mana yang terbaik untuk situasi penarikan
sample tertentu? sebenarnya, kita selalu tidak bisa menjawabnya secara pasti, tetapi
ada beberapa pedoman yang membandingkan sifat-sifat dari penaksir-penaksir
tersebut. Salah satu pedomannya bisa diungkapkan dalam hal efisiensi relatif dari
penaksir.
Andaikan kita mempunyai dua penaksir E1 dan E 2 untuk rata-rata μ . Jika
kedua E1 dan E 2 adalah penaksir takbias, atau hampir takbias, dari μ , maka secara
umum kita sebaiknya memilih penaksir dengan varians terkecil sebagai penaksir
terbaik. Hal ini menghasilkan taksiran selang kepercayaan terpendek bagi μ . Varians
biasanya mengecil ketika ukuran sample membesar, jadi kita harus membandingkan
varians E1 dan E 2 dengan asumsi ukuran sample sama untuk kedua penaksir. Sesuatu
hal yang mudah untuk menjelaskan ukuran relatif dari dua varians dengan melihat
pada rasionya. Rasio ini disebut dengan efisiensi relatif (relative efficiency),
dinotasikan RE, untuk dua penaksir. Kita membentuk rasio efisiensi relatif sehingga
nilainya yang besar mengutungkan bagi penaksir yang disebutkan pertama kali. Jadi,
efisiensi relatif dari E1 ke E 2 (atau E1 terhadap E 2 ) diberikan melalui
© E 2 ¹ Vˆ ( E1 )
∧
Sekarang kita harus hati-hati dalam menginterpetasi; bahwa RE (E1 E 2 ) > 1
tidak cukup mengartikan bahwa V ( E 2 ) > V ( E1 ) , karena kita hanya berurusan dengan
penaksir varians, yang akan mengalami perubahan dari sampel ke sampel. Akan
tetapi, jika kita mempunyai sampel besar (dan karenanya menjadi penaksir varians
∧
yang baik), nilai dari RE (E1 E 2 ) akan sangat lebih besar dari 1 yang tentunya akan
betul-betul menunjukan bahwa E1 mungkin menjadi penaksir terbaik.
Sekarang kita menghitung taksiran efisiensi relatif untuk pelbagai kombinasi
dari empat penaksir μ y yang telah disebutkan diatas. Pertama, bagaimanapun, kita
acak sederhana selalu penaksir takbias dari μ y , jadi tidak ada masalah bias (setidak-
umum penaksir bias dari R = μ y μ x . Bias menjadi tidak berarti jika hubungan antara
y dan x jatuh sepanjang garis lurus yang bergerak melalui titik asal. Hampiran untuk
bias relatif dari r diberikan oleh:
E (r ) − R § N − n ·§ s x2 sy s ·
≈¨ ¸¨¨ 2 − ρ̂ ⋅ x ¸¸
R © Nn ¹© x y x ¹
s y2
=
s y2 + r 2 s x2 − 2rρ̂s x s y
∧
sekarang, RE (μˆ y y ) > 1 jika
s y2 + r 2 s x2 − 2rρˆs x s y < s 2y
atau
r 2 s x2 > 2rρ̂s x s y
atau
rs x2 > 2 ρ̂s x s y (dengan asumsi r > 0 )
atau
1 rs x 1 s x x
ρˆ > =
2 sy 2 sy y
Besaran s x x disebut koefisien variasi. Pada situasi dimana penaksir rasio biasa
digunakan, y adalah nilai yang diperbaharui dari x (pendapatan kuartal pertama dalam
satu tahun dibandingkan dengan pendapatan kuartal pertama tahun sebelumnya, nilai
audit melawan nilai buku, dan lain-lain). Dalam kasus seperti ini, koefisien variasi
bahwa
μˆ yL = y + b( μ x − x )
dengan b adalah penaksir kemiringan (slope) dari garis regresi. Varians taksiran dari
μ̂ yL telah diberikan (lihat persamaan (7.29) yaitu
§ N − n ·§ 1 · ª n n
º
Vˆ ( μˆ yL ) = ¨ ¸ «¦ ( y i − y ) − b ¦ ( xi − x )2»
2 2
¸¨
© Nn ¹© n − 2 ¹ ¬ i =1 i =1 ¼
Jika kita membuat sedikit perubahan dengan mengganti (n-2) oleh (n-1) pada
penyebutnya, kita akan mempunyai
§ N −n· 2
Vˆ ( μˆ yL ) ≈ ¨ [ 2 2
¸ sy − b sx ]
© Nn ¹
dan, karena
sy
b = ρ̂
sx
Vˆ ( μˆ yL ) menjadi
§ N −n· 2
Vˆ ( μˆ yL ) ≈ ¨ (
¸ s y 1 − ρˆ
2
)
© Nn ¹
Hampiran Vˆ ( μˆ yL ) ini baik sepanjang n agak besar; (n-2) digunakan pada penyebut
untuk mencegah menaksir varians terlalu rendah (underestimation) yang serius dalam
situasi sampel kecil.
Dengan menggunakan hampiran varinas yang telah disederhanakan diatas,
^ § μˆ yL · s2 1
RE ¨¨ ¸¸ = 2 y 2 =
© y (
¹ s y 1 − ρˆ )
1 − ρˆ 2
efisien dari y sebagai penaksir dari μ y . (akan tetapi, ingat bahwa μ̂ yL akan
mempunyai masalah bias yang serius kecuali regresi y pada x benar-benar linear.)
Ketika membandingkan taksiran regresi dengan taksiran rasio,
^ § μˆ yL · s y2 + r 2 s x2 − 2rρˆs x s y
RE ¨ ¸=
¨ μˆ y
©
¸
¹ (
s 2y 1 − ρˆ 2 )
^
Pada kasus ini. RE >1 akan menunjukan
r 2 s x2 − 2rρˆs x s y > − ρˆ 2 s 2y
atau
(ρˆs y − rs x ) > 0
2
yang menunjukan
(b − r )2 >0
Jadi, penaksir regresi lebih efisien dari penaksir rasio kecuali b=r, dimana kasus
mereka ekuivalen.Kasus b=r akan terjadi ketika regresi y pada x linear melalui titik
asal dan varians y sebanding dengan x.
GAMBAR 7.2 Plot dari penerimaan kas (y) dengan banyaknya pembeli (x)
¦ (d −d)
2
i
§ N −n·
Vˆ ( μˆ yD ) = ¨ ¸
i =1
© Nn ¹ n −1
bisa ditulis
§ N − n ·§ 1 · n
Vˆ ( μˆ yD ) = ¨ ¸¦ [( y i − y ) − ( xi − x )]
2
¸¨
© Nn ¹© n − 1 ¹ i =1
§ N −n· 2
=¨
Nn
[
¸ s y + s x − 2 ρ̂s x s y
2
]
© ¹
Dalam membandingkan penaksir selisih dengan rata-rata sample per elemen,
kita mempunyai
^ § μˆ yD · s y2
RE ¨ ¸=
¨ μˆ y ¸ s 2 + s 2 − 2 ρˆs s
© ¹ y x x y
atau
^
sx
ρ>
2s y
Jika variasi dalam x’s dan y’s sama, Penaksir difference akan menjadi lebih efisien
1
dibanding y ketika korelasi antara x dan y lebih besar dari 2
.
¨ μ yD ¸ 2§
^ 2
·
© ¹ sy ¨ 1 − ρ ¸
© ¹
b=1. Di lain pihak, penaksir regresi akan menjadi lebih efisien daripada penaksir
difference.
Sekarng kita akan melihat beberapa nilai numeric dari efisiensi relative untuk
data yang telah kita analisis terlebih dahulu pada bab ini. Data dari table 7.1 dalam
real estate valuation diplotkan dalam gambar 7.3. Melihat point data tersebut yang
jatuh sepanjang garis lurus dengan kemiringan dekat dengan persamaan (dalam
kenyataan, b=0.977 untuk penaksir regresi) dan y mendekati 0. Untuk kasus ini
E( r ) − R
≈ 0.0053
R
Jadi nilai relative bias untuk penaksir ratio tidak terlalu berpengaruh.
§ μ^ ·
^
¨ yL ¸
RE ¨ ^ ¸ = 1.13
© μy ¹
dan
§ μ^ ·
^
¨ yD ¸
RE ¨ ^ ¸ = 1.01
© μy ¹
jadi ketiga penaksir, regresi, ratio, dan difference adalah tentang persamaan yang ada
dalam penaksir varians. Salah satu dari ketiga penaksir tersebut bekerja dengan baik
untuk masalah menaksir μ y atau τy dengan data tersebut. Tapi
§ μ^ ·
RE¨
yL ¸
^
= 14.96
¨ y ¸
© ¹
dari 3 penaksir membuat taksiran dari x’s. Di lain pihak, itu membuat 15 kali atau
lebih pengamatan untuk mencapai sukses dalam varians yang sama dengan y adalah
^
yang terbagus dengan μ yL .
Data dari table 7.2 tentang kadar gula dengan berat jeruk, hal 159, yang telah
diplot dalam table 7.4. Disini, point data terdapat sepanjang garis lurus tapi
kemiringannya tidak cukup dekat dengan komunitas (kenyataannya, b=0.123) y
intercept signifikan berbeda dari 0. Nilai relative bias dari r = -0.00077 tidak terlalu
berpengaruh, tapi
§ μ^ ·
RE¨ ^ ¸ = 16.79
^
yL
¨ ¸
© μy ¹
Hal ini mengimplikasikan akurasi yang lebih baik dalam mencapai sukses dalam
penaksiran μ y atau τy yang dikerjakan oleh penaksir regresi lebih baik dari penaksir
Dari contoh 7.9, kita mempunyai data nilai akhir kalkulus dengan nilai tes psikotes.
Kemiringan dalam garis ini tidak cukup dekat dengan komunitas (b=0.766) dan y
intercept jauh dari 0. Perhitungannya ditunjukan
§ μ^ ·
RE¨ ^ ¸ = 4.84
^
yL
¨ ¸
© μy ¹
dan
§ μ^ ·
RE¨ ^ ¸ = 1.22
^
yL
¨ ¸
© μ yD ¹
Disini penaksir regresi biasanya lebih baik dari penaksir ratio, tapi penaksir difference
bias dipakai tetapi kurang efisien.
Untuk data dalam contoh 7.10, ketiga metode, ratio, regresi dan difference
sebenarnya sama; penaksir difference adalah yang paling mudah dihitung jadi itu
adalah pilihan yang masuk akal.
hubungan dengan varians. Jika titiknya tidak jatuh sepanjang garis lurus, mungkin y
VII.8 KESIMPULAN
dengan bound of error yang sama dengan B. pada masing masing kasus seseorang
harus mendapatkan penaksirdari σ 2 dari informasi sebelumnya atau study persiapan
untuk memperkirakan ukuran sample yang dibutuhkan.
Penaksiran regresi adalah salah satu teknik untuk menggabungkan informasi
pada variable tambahan. Metode ini biasanya lebih baik daripada metode penaksiran
ratio jika hubungan antara Y dan X adalah berupa garis lurus yang tidak melalui asal.
Walaupun metode ini bisa diterapkan dengan desain sampling apapun, kita
menitikberatkan pada sampling acak sederhana., ketika menyebutkan stratified
random sampling untuk kasus ratio.
Metode penaksiran pembeda dalam prinsipnya sama dengan dengan
penaksiran regresi .ini bekerja dengan baik ketika plot Y dengan X menampakkan
titik yang uniform pada garis lurus dengan slope unit.