Anda di halaman 1dari 130

TINJAUAN MATA KULIAH

BAB I
PENDAHULUAN

I. 1 Beberapa Definisi

Dalam berbagai media sering dijumpai hasil jejak pendapat dari masyarakat
tentang isu tertentu, jejak pendapat itu dilakukan untuk mengetahui gambaran
pendapat dari masyarakat di daerah dimana jejak pendapat ini dilakukan. Hal serupa
juga dijumpai dalam publikasi-publikasi penelitian ilmiah baik yang ditulis dalam
rangka penyelesaian studi mahasiswa maupun yang tertera dalam jurnal-jurnal
penelititan. Pada dasarnya semuanya menghendaki gambaran menyeluruh yang
didasarkan pada sebagian objek yang diteliti yang disebut sampel. Gambaran ini
dihasilkan oleh proses generalisasi atau disebut juga dengan proses induksi .Oleh
karena itu, agar diperoleh gambaran yang bisa mengungkapkan keadaan menyeluruh
yang sebenarnya, diperlukan dua hal, yaitu proses induksi yang dilakukan dengan cara
yang tepat, dan sampel yang tergolong “baik”. Dengan proses induksi yang tepat
diartikan sebagai proses yang menggunakan teknik-teknik analisis yang cocok untuk
permasalahan yang dikaji serta mengikuti kaidah-kaidah yang mendasarinya. Sampel
dikatakan baik apabila dapat menggambarkan semua sifat atau karakteristik dari
keseluruhan objek yang diteliti. Untuk dapat memperoleh sampel seperti ini,
diperlukan teknik yang disebut teknik sampling.
Terdapat beberapa definisi yang diperlukan untuk membahas teknik ini.

I.1. 1 Populasi dan Sampel

Populasi merupakan keseluruhan (totality) objek, baik itu dari hasil


menghitung maupun mengukur, yang dibatasi oleh kriteria tertentu. Objek populasi
tersebut terbagi menjadi dua bagian, yaitu objek yang bisa diraba/kongkret (tangiable)
dan objek yang tidak bisa diraba/abstrak (untangiable). Banyaknya objek yang ada
dalam populasi disebut ukuran populasi (population size) yang biasanya
dilambangkan dengan N. Ukuran populasi ini besarnya ada yang bisa dihitung
(countable) dan juga tidak terhitung (uncountable). Apabila ukuran populasi

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran Ͷ
berapapun besarnya, tapi masih bisa dihitung, maka populasi tersebut dinamakan
populasi terhingga (finite population). Jika ukuran populasi sudah sedemikian
besarnya sehingga sudah tidak bisa lagi dihitung, maka populasi itu dinamakan
populasi takhingga (infinite population). Apabila suatu penelitian dilakukan terhadap
semua anggota populasi, maka prosesnya dinamakan Sensus
Dalam suatu penelitian, seringkali peneliti tidak bisa memeriksa seluruh
anggota populasi (sensus). Oleh karena itu, hanya diambil sebagian saja dari anggota
populasi sehingga diperolehlah sampel yang besarnya dilambangkan dengan n.
Adapun proses pengambilan sebagian anggota populasi tersebut dinamakan sampling.
Gambaran mengenai proses sampling bisa dilihat dari ilustrasi berikut ini :

POPULASI ( N )
SAMPEL ( n )
Alasan -alasan
Parameter Statistik
x
μ
s
σ
p
π

Sampling
Sensus Proses Induksi

Gambar I. 1 Proses Sampling

Terdapat beberapa alasan sehingga peneliti cenderung lebih memilih proses


sampling daripada sensus, yaitu :
a. Mengurangi biaya, apabila kita melakukan penelitian terhadap sebagian dari
anggota populasi, maka akan berakibat pada penghematan biaya.
b. Masalah tenaga, jelas bahwa semakin banyak objek yang kita teliti, maka
akan berakibat pada semakin banyaknya tenaga yang kita butuhkan baik itu
tenaga pengumpul data / pencacah, pencatat / entri data maupun pengolah
data. Apabila ada keterbatasan untuk ketiga hal tersebut, maka sampling
merupakan alternative terbaik untuk dilakukan.
c. Efisiensi waktu, apabila diinginkan kesimpulan yang segera, maka sampling
akan lebih tepat untuk digunakan. Hal ini dikarenakan dengan memperkecil

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͷ
banyaknya objek yang akan diteliti maka data akan lebih cepat diperoleh dan
dianalisis.
d. Tingkat ketelitian lebih besar, dalam suatu proses penelitian dari mulai
pengumpulan data, pancatatan, dan penganalisisan data harus dilakukan
dengan benar dan tepat. Apabila kita telah memakai tenaga-tenaga yang
berkualitas baik dan diberi latihan intensif, serta pengawasan terhadap
pekerjaan lapangan diperketat tetapi memberikan volume pekerjaan yang
besar dan cenderung monoton, maka akan menimbulkan kebosanan baik itu
dari pencacah maupun peneliti. Oleh karena itu, akan diperoleh data yang
kurang dapat dipercaya kebenarannya.
e. Penelitian bersifat destruktif (penelitian yang sifatnya merusak), sensus tidak
mungkin dilakukan untuk objek yang sifatnya merusak. Misalnya dalam
menguji golongan darah seseorang, maka tidak mungkin semua darah
dikeluarkan untuk diperiksa. Jadi dalam hal ini, sensus tidak mungkin lagi
untuk dilakukan.
f. Faktor ekonomis, yang dimaksud dengan ‘faktor ekonomis’ adalah
kesepadanan antara biaya, tenaga dan waktu yang dikeluarkan dengan
informasi yang akan diperoleh. Apabila nilai dari infomasi tersebut tidak
sepadan dengan biaya, tenaga dan waktu, maka sensus menjadi tidak baik lagi
untuk dilakukan.

I. 1. 2 Unit Observasi

Suatu objek dimana perlakuan dilakukan disebut unit observasi. Ini merupakan
unit dasar dari observasi yang terkadang disebut elemen. Dalam penelitian tentang
perilaku masyarakat, maka individu masyarakat adalah unit observasi.

I. 1. 3 Populasi Target

Populasi Target merupakan keseluruhan kumpulan pengamatan/observasi


secara lengkap yang akan dipelajari. Menentukan populasi target merupakan langkah
awal yang penting pada saat seseorang akan melakukan penelitian. Dalam beberapa
keadaan sulit untuk menentukan populasi target. Sebagai contohnya, dalam
pemungutan suara dalam bidang politik, apakah target populasinya harus semua orang

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͸
dewasa yang layak memilih? Semua pemilih yang terdaftar? Semua orang yang
dipilih pada pemilihan terakhir? Pillihan dari target populasi akan memberikan efek
statistik yang sangat besar terhadap hasilnya. Jadi, dalam setiap penelitian seorang
peneliti pada langkah pertama strateginya harus menentukan secara jelas populasi
targetnya yaitu yang nantinya akan menjadi cakupan kesimpulan penelitian. Oleh
karena itu, apabila dalam sebuah hasil penelitian dikeluarkan kesimpulan, maka
menurut etika penelitian, kesimpulan itu hanya berlaku untuk populasi target yang
telah ditentukan.

I. 1. 4 Populasi yang disampel

Populasi yang disampel adalah populasi dimana sampel akan diambil. Pada
suatu saat tertentu setelah peneliti menentukan secara tegas populasi targetnya,
peneliti tidak bisa memperoleh keterangan mengenai populasi targetnya, sehingga
populasi yang ditelitinya berbeda (lebih kecil) dari populasi sasarannya.
Jadi dalam suatu penelitian survey, idealnya populasi yang disampel adalah
juga populasi target, namun keadaan ideal ini jarang terjadi. Contoh, dalam survey
masyarakat, populasi yang disampel biasanya lebih kecil dari populasi target, seperti
tampak dalam gambar berikut :

Kerangka
Populasi sampling

Tidak dapat
dijangkau
Tidak termasuk
dalam kerangka
sampling
Menolak Tidak layak
merespon untuk di
Populasi yang survai
disampel
Tidak dapat
dijangkau

Gambar I. 2 Populasi target dan populasi yang disampel

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͹
Populasi target dan populasi yang disampel dalam survey atau jajak pendapat
terhadap suatu kebijakan dari para pemilih melalui suatu telephone, maka yang
menjadi populasi target adalah semua pemilih yang terdaftar. Namun tidak semua
pemilih mempunyai telephone, dengan demikian pemilih yang mempunyai telephone
dan yang mau menelephone serta berhak merupakan populasi yang disampel.

I. 1. 5 Unit sampling

Unit sampling merupakan segala sesuatu yang oleh peneliti dijadikan kesatuan
(unit) yang nantinya akan menjadi objek pemilihan. Jadi unit sampling itu adalah unit
yang diambil sebagai sampel. Unit sampling ini bentuknya bisa individu yang berdiri
sendiri yang disebut satuan elementer (Elementary Unit), dan bisa juga kumpulan
individu yang disebut Cluster. Misalnya, apabila universitas dibagi ke dalam beberapa
fakultas dan dalam penelitian fakultas ini yang akan dipilih, maka fakultas tersebut
mejadi unit sampling. Tetapi apabila universitas dibagi menjadi beberapa jurusan dan
jurusan ini yang akan dijadikan objek penelitian, maka sekarang yang menjadi unit
samplingnya adalah jurusan.

I. 1. 6 Kerangka sampling

Kerangka sampling (sampling frame) adalah daftar unit sampling yang ada
dalam sebuah populasi. Dalam survey tentang pendapat masyarakat akan suatu
kebijakan, maka bila unit samplingnya adalah rumah tangga, daftar yang berisikan
rumah tangga, nomor rumah serta alamatnya dan karakteristik lain yang berkaitan,
disebut kerangka sampling.
Dalam teori sampling, apabila kita harus menyusun sampel, kemudian
terhadap data yang dikumpulkan dari sampel ini kita ingin melakukan analisis secara
statistis, maka sampel yang kita susun tadi harus merupakan sampel random. Sampel
random hanya bisa disusun apabila ada kerangka sampling. Oleh karena itu untuk bisa
memperoleh sampel random, kerangka sampling mutlak harus ada.

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͺ
I. 1. 7 Bias

Parameter-parameter populasi hanya bisa diketahui nilainya jika penelitiannya sensus.


Dalam penelititan yang bukan sensus, untuk mengetahui nilai parameter tertentu,
dilakukan penaksiran melalui sampel.
Definisi :
Apabila dari sebuah populasi kita akan menaksir sebuah parameter θ dengan penaksir

θˆ , maka θˆ disebut estimator untuk θ.


Contoh :
- Kita ingin menaksir parameter μ dengan X , maka X adalah estimator untuk
μ
- Kita ingin menaksir parameter σ2 dengan s2, maka s2 adalah estimator untuk
σ2
- Kita ingin menaksir parameter π dengan p, maka π adalah estimator untuk p.
Apabila harga ekspektasi untuk sesuatu penaksir tidak sama dengan parameter yang
ditaksir maka penaksir itu dikatakan bias.
Definisi :
Apabila θˆ merupakan penaksir untuk θ yang memenuhi persyaratan bahwa rata-rata

untuk semua θˆ nilainya sama dengan θ, maka dikatakan θˆ adalah penaksir tak bias
untuk θ.
Definisi:
Apabila parameter yang akan ditaksir adalah θ dan penaksirnya adalah θˆ maka bias
didefinisikan sebagai
B =| θ − E (θˆ) |

Bias adalah selisih mutlak antara parameter yang ditaksir dengan ekspektasi
penaksirnya.

a. Bias dalam pemilihan unit sampel

Sampel yang baik adalah sampel yang bebas dari bias (bias dalam pemilihan
unit sampel) terjadi bila beberapa bagian dari populasi target tidak ada dalam populasi
yang disampel. Bila suatu survey dirancangkan untuk mempelajari pendapatan rumah

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͻ
tangga yang tinggal menetap (tidak termasuk komuter), maka taksiran rata-rata
pendapatan rumah tangga akan mungkin terlalu besar, sehingga memberikan taksiran
yang bias.

b. Bias dalam pengukuran

Sampel yang baik adalah juga sampel yang mempunyai sifat bahwa responden
merespon pertanyaan dengan akurat. Bias dalam pengkuran terjadi bila instrument
yang digunakan untuk mengukur cenderung akan memberikan hasil yang berbeda dari
yang sesungguhnya. Jadi instrument tersebut gagal untuk dapat mengukur apa yang
sebenarnya harus diukur.Mengukur apa yang seharusnya merupakan hal yang
memang sulit dalam penelitian sosial karena penelitian biasanya berkaitan dengan
pengukuran karakteristik manusia, yang kadang-kadang tidak bersedia untuk
mengatakan hal yang sebenarnya. Dla survey penelitian yang dilakukan terhadap
petani dalam rangka pemberian bantuan makanan maka mereka akan cenderung
merendahkan hasil pertaniannya dengan harapan memperoleh bantuan pangan.

I. 1. 8 Error sampling dan nonsampling

Dalam poling pendapat sering dijumpai pernyataan bahwa sampel yang


diambil menggunakan margin error sebesar 5%. Margin error menggambarkan
besarnya sampling error yang ingin diambil oleh peneliti, yaitu error yang dihasilkan
akibat penelitian menggunakan sampel (bukan populasi), Idealnya error harus sekecil
mungkin, namun bila memperkecil error berakibat bertambah besar sampel. Jika
peneliti mengambil sampel lain yang berbeda, maka jelas akan didapat nilai taksiran
yang juga berlainan. Error sampling biasanya dinyatakan dengan terminology
probabilitas.
Jadi error sampling merupakan selisih antara nilai parameter dengan nilai
statistik penaksirnya.

Definisi:
Apabila θ merupakan sebuah parameter dan θˆ merupakan penaksir bagi θ maka error
sampling didefinisikan sebagai:

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͲ
δ =| θ − θˆ |
Error sampling bisa pula berarti semua bentuk error yang ditimbulkan karena proses
sampling. Apabila kekeliruan yang terjadi bukan karena proses sampling maka
kekeliruan itu disebut non-sampling error. Sebagai contoh adalah kekeliruan
pengumpulan data sebagai akibat kekeliruan questioner, pemilihan unit sampel dan
ketidakakuratan merespon. Jadi non-sampling error adalah error yang tidak dapat
ditandai dari variabilitas satu sampel dengan sampel lainnya.

I. 1. 9 Presisi dan Akurasi

Presisi menunjukkan kekonsistenan atau keseragaman dari nilai penaksir.


Makin seragam nilai dari suatu penaksir, maka makin baik presisinya. Dengan kata
lain bahwa datanya semakin homogen. Dalam ukuran statistik, presisi dinyatakan
dengan standard error Jadi penaksir yang baik adalah penaksir yang memiliki
standard error paling kecil .
Sedangkan Akurasi menunjukkan jarak terhadap target. Dalam statistik, yang
menggambarkan akurasi adalah bias yaitu selisih antara penaksir dengan yang
ditaksir.
Gambaran mengenai presisi dan akurasi bisa dilihat dengan menggunakan
pemisalan berikut :

X X X X
X X X XXX XX
X XXX
X X XX

Pemanah A Pemanah B Pemanah C

Gambar I. 3 Ilustrasi presisi dan akurasi dari suatu taksiran

Gambar di atas dimisalkan sebagai target panahan. Tiga orang pemanah


menembakkan anak panahnya masing-masing pada tiap target tersebut. Dari hasilnya
terlihat bahwa ternyata pemanah A memiliki tingkat presisi dan akurasi yang rendah,

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͳ
dalam arti bahwa hasil dari tembakannya tidak tepat sasaran dengan variasi yang tidak
konsisten. Sedangkan untuk pemanah B menghasilkan suatu tembakan yang konsisten
sehingga bisa dikatakan bahwa dia memiliki presisi yang tinggi, tetapi masih tidak
tepat sasaran atau akurasinya rendah. Untuk pemanah C memberikan kondisi yang
terbaik, yaitu memiliki presisi dan akurasi yang tinggi, artinya selain tepat sasaran,
juga hasil tembakannya konsisten. Dalam masalah sampling, kondisi seperti pemanah
C-lah yang diinginkan.

I. 1. 10 Rencana Sampling (Sampling Plan) dan Rancangan Sampling (Sampling


Design)

Ketika kita melakkukan proses sampling, maka secara tegas kita membedakan
apa yang dimaksud dengan Rencana Sampling dan Rancangan Sampling.
Rencana Sampling merupakan sebuah gambaran garis besar yg menyangkut :
1. Penentuan populasi sasaran
2. Penentuan bentuk dan ukuran satuan sampling
3. Penentuan ukuran sampel ( n )
4. Penentuan cara memilih satuan sampling
Apabila pada rencana sampling di atas kita menambahkan metode penaksiran/metode
analisis, maka rencana sampling meningkat menjadi Rancangan Sampling.

Rancangan Sampling

Rencana Sampling

Gambar I. 4 Rencana Sampling dan Rancangan Sampling

I. 1. 11 Finite Population Correction (FPC)

Apabila kita berhadapan dengan penelitian yang memiliki ukuran populasi


terhingga, maka FPC harus dicantumkan pada rumus Standard Error. Jika

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳʹ
populasinya tak hingga, maka FPC dianggap sama dengan 1 dan tidak usah
dicantumkan dalam rumus Standard Error.
N −n
Bentuk dari FPC itu adalah , tetapi bentuk ini tidak bisa memberikan
N −1
keterangan mengenai beberapa hal yang penting. Oleh karena itu dalam pembicaraan
ita mengenai sampling, bentuk FPC yang akan kita gunakan adalah :
N −n § n·
= ¨1 − ¸
N © N¹

§ n·
Dengan menggunakan rumus FPC = ¨1 − ¸ , maka diperoleh dua buah keterangan
© N¹
yaiotu :
n
a. , disebut sampling fraction, menyatakan berapa persen sampel yang kita buat
N
n
(dari populasi). Misalnya jika ada keterangan = 0.15, maka berarti bahwa
N
ukuran sampel adalah 15 % dari populasinya.
n
b. menyatakan besarnya peluang setiap satuan sampling untuk termasuk ke dalam
N
sampel berukuran n.

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳ͵
TINJAUAN MATA KULIAH

I. 3 Distribusi Sampling

Sebagaimana yang telah diuraikan sebelumnya bahwa dengan berbagai


alasan, peneliti cenderung melakukan sampling daripada sensus. Dalam
kenyataannya, akan terdapat lebih dari sebuah sampel berukuran n yang mungkin
yang bisa diambil dari populasi berukuran N. Adanya beberapa kemungkinan
sampel yang bisa diambil menunjukkan adanya bermacam-macam kombinasi data
populasi yang bisa terambil Akan tetapi dalam prakteknya hanya akan diambil
sebuah sampel untuk digunakan dalam penelitiannya, dengan kata lain bahwa
hanya akan diambil satu buah kombinasi data. Sampel yang diambil biasanya
dipilih secara acak, disebut dengan sampel acak. Selanjutnya dari sampel tersebut
dilakukan proses analisis sesuai dengan tujuan penelitiannya. Sebagai contohnya
adalah pada sampel yang bersangkutan akan diperoleh taksiran parameter populasi
θˆ dari θ ( θ merupakan lambang parameter populasi [ μ ,π ,σ 2 ] , sedangkan θˆ
[ ]
merupakan lambang penaksir parameter populasi x , p, s 2 ). Kumpulan nilai-nilai

θˆ pada sampel-sampel yang mungkin disebut sebagai distribusi sampling dari


θˆ .
Banyaknya kemungkinan sampel yang bisa diambil tergantung pada
proses pengambilan unit-unit populasinya. Berdasarkan proses memilihnya,
sampling terbagi ke dalam dua tipe, yaitu sampling dengan pengembalian dan
sampling tanpa pengembalian. Sampling dengan pengembalian merupakan suatu
proses pengambilan sampling dimana sampel yang telah terpilih dikembalikan
lagi ke dalam populasi sebelum pemilihan selanjutnya dilakukan, sehingga ada
kemungkinan suatu satuan sampling tertentu akan terpilih lebih dari sekali. Oleh
karena itu, jika sampling dilakukan dengan pengembalian, maka akan terdapat Nn
buah sampel yang berlainan. Adapun sampling tanpa pengembalian merupakan
suatu proses pengambilan sampel dimana satuan sampling yang telah terpillih
tidak dikembalikan lagi ke dalam populasi, sehingga setiap satuan sampling hanya
memiliki kesempatan terpilih satu kali. Oleh karena itu, jika sampling dilakukan

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳ͸
§N· N!
tanpa pengembalian, maka akan terdapat ¨¨ ¸¸ = buah sampel yang
© n ¹ n !( N − n ) !
berlainan.

I. 3. 1 Distribusi sampling Rata-rata

Dikatakan distribusi sampling rata-rata karena tujuan dari penelitian ini


adalah untuk menaksir rata-rata dari populasi. Oleh karena ada beberapa
kemungkinan sampel yang akan terbentuk, maka untuk tiap-tiap sampel yang
bersangkutan juga akan terdapat beberapa rata-rata sampelnya. Anggap rata-rata
ini sebagai data baru, maka akan terbentuk suatu kumpulan data yang terdiri dari
rata-rata dari sampel-sampel. Dari kumpulan rata-rata tersebut dicari rata-rata dan
simpangan bakunya, maka akan diperoleh rata-rata dari rata-rata, disimbolkan
dengan μ x dan simpangan baku dari rata-rata, disimbolkan dengan σ x .
Sebagai contoh, pada tabel berikut terdapat data mengenai nilai intelegensi calon
legislatif yang menggunakan ijasah palsu. Terdapat 5 calon legislatif yang
mengunakan ijasah palsu dengan nilai intelegensi masing-masing 50, 60, 70, 80,
dan 90. Dari populasi 5 calon legislatif tersebut, diambil 2 sampel secara
berulang-ulang sampai semua kemungkinan sampel terambil.

No. Caleg Nilai Intelegensi


1 50
2 60
3 70
4 80
5 90

Dari data di atas diperoleh rata-rata populasi berikut :


N

¦X i
μ = i =1

N
350
=
5
= 70

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳ͹
dan simpangan bakunya adalah :
N

¦ (X −μ)
2
i
σ = i =1

=
(50 − 70)2 + (60 − 70)2 + (70 − 70)2 + (80 − 70)2 + (90 − 70 )2
5
1000
=
5
= 14,14214

a. Apabila sampling dilakukan dengan pengembalian, maka diperoleh 52 = 25


buah kemungkinan sampel, yaitu :
Rata-rata
Sampel Caleg yang terpilih Nilai Intelegensi
Nilai Intelegensi
1 1;1 50 ; 50 50
2 1;2 50 ; 60 55
3 1;3 50 ; 70 60
4 1;4 50 ; 80 65
5 1;5 50 ; 90 70
6 2;1 60 ; 50 55
7 2;2 60 ; 60 60
8 2;3 60 ; 70 65
9 2;4 60 ; 80 70
10 2;5 60 ; 90 75
11 3;1 70 ; 50 60
12 3;2 70 ; 60 65
13 3;3 70 ; 70 70
14 3;4 70 ; 80 75
15 3;5 70 ; 90 80
16 4;1 80 ; 50 65
17 4;2 80 ; 60 70
18 4;3 80 ; 70 75
19 4;4 80 ; 80 80
20 4;5 80 ; 90 85

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͺ
21 5;1 90 ; 50 70
22 5;2 90 ; 60 75
23 5;3 90 ; 70 80
24 5;4 90 ; 80 85
25 5;5 90 ; 90 90

Tabel di atas merupakan distribusi sampel untuk nilai intelegensi. Terlihat dari
tabel di atas bahwa terdapat data baru sebanyak 25 rata-rata. Distribusi dari rata-
rata tersebut juga bisa disajikan ke dalam bentuk berikut :
Rata-rata
Frekuensi P(X)
Nilai Intelegensi
50 1 0,04
55 2 0,08
60 3 0,12
65 4 0,16
70 5 0,2
75 4 0,16
80 3 0,12
85 2 0,08
90 1 0,04

Selanjutnya dapat ditampilkan dalam bentuk grafik berikut :

Intelegensi
6

2
Frequency

1 Std. Dev = 10.21


Mean = 70.0

0 N = 25.00
50.0 55.0 60.0 65.0 70.0 75.0 80.0 85.0 90.0

Intelegensi

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͻ
Dalam kenyataannya, suatu penelitian tidak pernah mengambil sampel secara
berulang-ulang seperti contoh di atas, namun contoh di atas memberi landasan
dalam melakukan estimasi nilai yang diperoleh dari sampel. Dari kumpulan rata-
rata di atas, diperoleh jumlah rata-rata = 1750. Maka rata-rata untuk ke – 25 rata-
rata ini adalah :
25

¦X i
μX = i =1

25
1750
=
25
= 70
Sedangkan simpangan baku ke – 25 rata-rata tersebut juga dapat dihitung sebagai
berikut :
25

¦ (X i − μX )2
σX = i = 25

25

=
(50 − 70) 2 + (55 − 70) 2 + (60 − 70) 2 + ...(90 − 70 ) 2
25
2500
=
25
= 10
Ternyata terlihat bahwa rata-rata populasi = 70 dengan rata-rata dari ke-25 rata
tersebut sama, tetapi memiliki simpangan baku yang berbeda. Dari populasi
diperoleh simpangan bakunya = 14,14214 sedangkan dari ke-25 rata-rata
diperoleh simpangan baku = 10. Selanjutnya dapat dihitung :
σ
σX =
n
14,14214
=
2
= 10
Ternyata berlaku :
μX = μ
σ
σX =
n

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ʹͲ
Persamaan di atas juga dapat berlaku untuk kasus pengambilan sampel tanpa
pengembalian jika N cukup besar dibandingkan dengan n, dalam hal ini jika
n
≤ 5% .
N
b. Apabila sampling dilakukan tanpa pengembalian, maka diperoleh
§5· 5!
¨¨ ¸¸ = = 10 buah kemungkinan sampel, yaitu :
2
© ¹ (5 − 2 ) ! 2 !

Caleg yang Nilai Rata-rata Nilai


Sampel
terpilih Intelegensi Intelegensi
1 1;2 50 ; 60 55
2 1;3 50 ; 70 60
3 1;4 50 ; 80 65
4 1;5 50 ; 90 70
5 2;3 60 ; 70 65
6 2;4 60 ; 80 70
7 2;5 60 ; 90 75
8 3;4 70 ; 80 75
9 3;5 70 ; 90 80
10 4;5 80 ; 90 85

Tabel di atas merupakan distribusi sampel untuk nilai intelegensi jika data yang
diambil tanpa pengembalian. Terlihat dari tabel di atas bahwa terdapat data baru
sebanyak 10 rata-rata. Distribusi dari rata-rata tersebut juga bisa disajikan ke
dalam bentuk berikut :

Rata-rata
Frekuensi P(X)
Nilai Intelegensi
55 1 0,1
60 1 0,1
65 2 0,2
70 2 0,2
75 2 0,2

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ʹͳ
80 1 0,1
85 1 0,1

Selanjutnya akan ditampilkan ke dalam bentuk grafik sebagai berikut :

Intelegensi
2.5

2.0

1.5

1.0
Frequency

.5
Std. Dev = 9.13
Mean = 70.0

0.0 N = 10.00
55.0 60.0 65.0 70.0 75.0 80.0 85.0

Intelegensi

Dari kumpulan rata-rata di atas, diperoleh jumlah rata-rata = 490. Maka rata-rata
untuk ke – 25 rata-rata ini adalah :
10

¦X i
μX = i =1

10
700
=
10
= 70
Sedangkan simpangan baku ke – 25 rata-rata tersebut juga dapat dihitung sebagai
berikut :
10

¦ (X i − μX )2
σX = i = 25

10

=
(55 − 70) 2 + (60 − 70) 2 + (65 − 70) 2 + ... + (85 − 70) 2
10
750
=
10
= 8,66
Ternyata rata-rata populasi = 70 sama dengan rata-rata dari ke-10 rata-rata
tersebut, tetapi memiliki simpangan baku yang berbeda. Dari populasi diperoleh

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ʹʹ
simpangan bakunya = 14,14214 sedangkan dari ke-7 rata-rata diperoleh
simpangan baku = 8,66. Selanjutnya dapat dihitung :

σ N −n
σX =
n N −1
14,14214 5 − 2
=
2 5 −1
= 8,66
Ternyata berlaku :
μX = μ
σ N −n
σX =
n N −1

Selanjutnya simpangan baku dari rata-rata tersebut, baik itu yang diambil dengan
pengembalian ataupun tanpa pengtembalian, dinamakan simpangan baku rata-
rata atau galat baku rata-rata. Ukuran ini menunjukkan variasi rata-rata sampel
sekitar rata-rata populasi ȝ.

I. 3. 2 Distribusi samplng Proporsi

Sebagaimana pada distribusi sampling rata-rata, pemberian nama disrtribusi


sampling proporsi atau disingkat distribusi proporsi ini dikarenakan tujuan dari
penelitiannya adalah untuk menaksir proporsi suatu peristiwa dari populasi.
Perhatikan Gambar I. 1, dimisalkan bahwa ukuran dari populasi adalah N dan
ukuran sampel yang diambil adalah n. Apabila dari populasi tersebut terdapat Y
buah peristiwa khusus yang akan diteliti, maka proporsi terjadinya peristiwa
tersebut adalah :
Y
π=
N
Selanjutnya berdasarkan sampel yang diambil, ternyata peristiwa khusus yang
diperoleh ada sebanyak x buah, maka diperoleh statistik proporsi peristiwa tesebut
adalah :
x
p=
n

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ʹ͵
Oleh karena ada beberapa kemungkinan sampel yang akan terbentuk, maka untuk
tiap-tiap sampel yang bersangkutan juga akan terdapat beberapa proporsi
sampelnya. Apabila proporsi ini diperlakukan sebagai data baru, maka akan
terbentuk suatu kumpulan data yang terdiri dari proporsi dari sampel-sampel.
Sebagaimana pada distribusi rata-rata, dari kumpulan proporsi tersebut dicari rata-
rata dan simpangan bakunya, maka akan diperoleh rata-rata dari proporsi,
disimbolkan dengan μ p dan simpangan baku dari proporsi, disimbolkan dengan

σ p . Ternyata, jika proses pengambilan sampel dilakukan tanpa pengembalian atau


jika kondisi populasi memiliki ukuran yang tidak terlalu besar dibandingkan
dengan data sampelnya, yaitu (n/N) > 5 %, maka :
μp = π
π (1 − π ) N −n
σp =
n N −1
selanjutnya jika proses pengambilan sampel dilakukan dengan pengembalian atau
kuran populasinya besar dibandingkan dengan ukuran sampel, yaitu (n/N) ≥ 5 %,
maka :
μp = π
π (1 − π )
σp =
n

I. 3. 3 Distribusi samplng Simpangan Baku

Seperti halnya pada pembahahasan sebelumnya, maka dari populasi yang


berukuran N yang kemudian diambil sampel beruikuran n, akan menghasilkan
beberapa kemungkinan sampel. Selanjutnya dari semua sampel yang mungkin
tersebut dicari simpangan bakunya, yaitu s, maka akan terdapat kumpulan dari
simpangan baku. Dari kumpulan tersebut, dihitung rata-ratanya, ȝs dan simpangan
bakunya, σs.
Jika populasi berdistriobusi normal, atau mendekati normal, maka distribusi
simpangan baku untuk n besar, biasanya n ≥ 100, sangat mendekati distribusio
normal dengan :

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ʹͶ
μs = σ
σ
σs =
2n

dengan σ merupakan simpangan baku populasi.


Setelah mengetahui sifat dari distribusi sampel, bukan berarti harus
melakukan pengambilan sampel secara berulang-ulang sebagaimana yang telah
dijelaskan sebelumnya. Distribusi sampel yang telah dibicarakan tersebut
merupakan dasar penting bagi sebuah dalil yang disebut dalil limit pusat. Dalil
limit pusat tersebut menyatakan bahwa jika ada satu populasi dengan rata-rata ȝ,
atau proporsi p, dengan simpangan baku (standar deviasi) σ yang besarnya
terhingga, maka distribusi sampel berdasarkan pengambilan sampel n secara acak
dan berulang-ulang memiliki beberapa sifat :
1. Rata-rata distribusi sampel untuk statistik θˆ akan sama dengan parameter
populasi, θ .
2. Simpangan baku untuk parameter θ sampel akan sama dengan σ/√n . Ukuran
ini juga dikenal sebagai standard error (SE). SE memegang peranan penting
pada estimasi parameter dan uji statistik.
3. Jika distribusi nilai pada populasi normal, maka disribusi sampel juga normal.
Tetapi yang lebih penting adalah jika distribusi nilai pada populasi tidak
normal, dengan jumlah sampel yang “cukup” besar, maka distribusi sampel
akan mendekati normal, tanpa tergantung dari distribusi nilai parameter
populasi.
Maka dengan asumsi besar sampel yang ”cukup”, distribusi sampel x dapat
digambarkan sebagai berikut :

α/2 α/2

θ - Z σθ θ θ + Z σθ

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ʹͷ
Pada gambar di atas menunjukkan menunjukkan sekian standar error dari rata-rata
distribusi sampel. Nilai α merupakan taraf signifikansi yang menunjukkan derajat
kekeliruan yang diberikan.

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ʹ͸
TINJAUAN MATA KULIAH

BAB II
SAMPLING ACAK SEDERHANA

II. 1 Pendahuluan

Sampling acak sederhana merupakan bentuk yang paling dasar dari jenis
sampling peluang yang memberikan dasar teori untuk proses sampling peluang
lainnya yang lebih komplek. Sampling Acak Sederhana ini merupakan suatu proses
memilih satuan sampling dari populasi sedemikian rupa sehingga setiap satuan
sampling dalam populasi mempunyai peluang yang sama besar untuk terpilih ke
dalam sampel dan peluang itu diketahui sebelum pemilihan dilakukan.Terdapat dua
cara dalam pengambilan sampling acak sederhana ini, yaitu dengan pengembalian
(with replacement), yang mana dalam proses ini adanya kemungkinan bahwa suatu
unit akan terpilih lebih dari satu kali dan tanpa pengembalian (without replacement)
yang mana semua unit yang terpilih tidak akan ada yang sama.
Sampling Acak Sederhana dengan pengembalian yang berukuran n dari
populasi yang berukuran N unit dapat digambarkan sebagai n buah sampel
independen yang berukuran 1. Satu unit dipilih secara acak dari populasi menjadi unit
sampel yang pertama, dengan peluang 1/N. Prosedur ini diulang sampai diperoleh
sampel yang berukuran n unit, yang mana bisa terjadi duplikasi unit sampling.
Pada populasi yang terbatas (finite population), suatu sampling yang memiliki
penggandaan unit tersebut tidak akan memberikan tambahan informasi. Oleh karena
itu, biasanya sampling tanpa pengembalian lebih disukai karena unit yang terpilih
tidak akan terjadi duplikasi. Sebuah sampel acak sederhana tanpa pengembalian yang
berukuran n dipilih sedemikian rupa sehingga setiap kemungkinan bagian dari n unit
dalam populasi memiliki peluang yang sama untuk terpilih menjadi anggota sampel.
§N·
Terdapat ¨¨ ¸¸ kemungkinan sampel yang akan terbentuk. Oleh karena itu, peluang
©n ¹
terpilihnya beberapa individu dalam suatu sampel S dari n unit adalah :
1 n ! (N − n )!
P (S ) = =
§N · N!
¨¨ ¸¸
©n ¹

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͵Ͳ
Sebagai konsekuensi dari definisi ini, apabila dilakukan pemilihan dengan Sampling
Acak Sederhana ke dalam sampel yang berukuran n, maka peluang sesuatu unit akan
n
terpilih ke dalam sampel itu adalah .
N
Proses sampling dengan Sampling Acak Sederhana digunakan apabila
memenuhi beberapa kondisi sebagai berikut :
1. Variabel yang akan diteliti keadaannya relatif homogen dan tersebar
merata di seluruh populasi.
2. Apabila bisa disusun secara lengkap kerangka sampling yang
menyangkut setiap satuan pengamatan yang ada dalam populasi.

II. 2 Keuntungan dan Kerugian Sampling Acak Sederhana

Keuntungan dari digunakannya Simple Random Sampling adalah memiliki


bentuk-bentuk rumus yang sederhana, tidak memerlukan pembobotan, dan semua
rmus statistika bisa digunakan.
Kerugiannya :
1. Ada kemungkinan bahwa sekalipun menggunakan randomisasi, satuan
sampling yang terpilih tidak tersebar merata atau randomisasi tidak
menjamin 100% bahwa pemilihan keadaannya menyebar merata.
2. Apabila ukuran populasi besar dan ukuran sampel besar maka pemilihan
secara simple random sampling secara manual menyulitkan.

II. 3 Proses Memilih Melalui Sampling Acak Sederhana

Dalam pemilihan unit sampling melalui sampling Acak Sederhana, diperlukan


adanya kerangka sampling yang tersusun secara lengkap. Setiap satuan sampling
dalam kerangka sampling tersebut diberi nomor urut dan banyaknya angka dalam
nomor-nomor tersebut sama untuk setiap satuan sampling.
Langkah:
1. Tentukan secara tegas Populasi sasaran
misal : Masyarakat di daerah A
2. Buat Kerangka sampling

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͵ͳ
No Nama Alamat

001 Awal Jl. Merkuri Raya 23


002 Arya Jl. Jakarta 24

.
.
.
262 Ending Jl. Cikaso 23

3. Tentukan ukuran sampel n


misal n=20

4. Lakukan proses pengambilan sampel


Apabila suatu target populasi telah ditentukan secara tegas dan dari populasi ini
akan disusun sebuah sampel melalui (SRS), maka selanjutnya harus dilakukan proses
pemilihan dari anggota sampelnya. Adapun proses memilih dalam Samping Acak
Sederhana banyak sekali caranya. Dalam buku ini hanya akan dibahas tiga cara yang
sering dilakukan, yaitu :
1. Simple Randomization (SR) / Pengacakan Secara Sederhana
2. Randomization Based on Remainder
3. Randomization Based on Permutation

II. 3. 1 Simple Randomization (SR) / Pengacakan Secara Sederhana

Langkah-langkah yang harus dilakukan dalam pengambilan sampel melalui Simple


Randomization :
1. Tentukan populasi penelitian secara tegas study population (populassi sasaran
dan populasi penelitian), yang sebaiknya sama dengna populasi sasaran
2. Tentukan secara tegas ukuran populasi
3. Tentukan bentuk satuan sampling dan susun kerangka sampling yang lengkap
4. Tentukan ukuran sampel berdasarkan perhitungan tertentu. Ukuran sampel
tersebut bisa ditentukan atas dasar statistis (statistical aspects) maupun
nonstatistis (nonstatistical aspects)

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͵ʹ
5. Sediakan tabel angka random
6. Proses memilih :
a. Secara sembarang jatuhkan suatu benda ke atas tabel bilangan random
dan perhatikan angka berapa yang tertuju oleh benda tersebut
b. Satuan sampling selanjutnya diperoleh dengan cara membaca tabel
angka random ke bawah menurut kolom yang sesuai. Kalau masih
belum cukup, baca ke atas.

Catatan:
1. Simple Randomization adalah randomisasi yang palling sederhana, tetapi
banyak menghamburkan bilangan random.
2. Dala praktik, survai yang populasi sasarannya besar, Simpel Randomization
tidak dilakukan secara manual tetapi menggunakan komputer.
3. Semua angka random yang lebih besar dari N dilewat, angka randoom yang
sudah dipilih tidak dipilih lagi
4. Bilangan-bilangan random yang sudah dipakai , baik terpilih maupun tidak,
tidak boleh dipilih lagi dalam suatu proses pemilihan. Oleh karena itu sangat
disarankan agar pada saat menggunakan tabel angka random peneliti benar-
benar memperhatikan angka random mana yang sudah dipakai, dan sampai
mana peneliti terakhir menggunakan angka random.
5. Proses pemilihan seperti ini disebut Simple Random Sampling dan secara
matematis proses ini menjamin bahwa setiap satuan pengamatan dalam
populasi mempunyai kesempatan yang sama (peluang yang sama) untuk
terpilih yaitu peluang terpilih: n/N. Untuk tidak menghamburkan bilangan
random kita bisa menggunakan Simple Random Sampling melalui pendekatan
lain.

II. 3. 2 Randomization Based on Remainder (Pengacakan berdasarkan pada sisa


hasil pembagian)

Untuk menghemat bilangan random kita melakukan randomisasi atas dasar sisa hasil
pmbagian
Langkah kerja :
1. Tentukan populasi sassaran dan satuan samplingnya

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͵͵
2. Susun kerangka sampling
3. Tentukan ukuran sampel
4. Sediakan tabel angka random, dari tabel ini kita mulai pada baris ke-1 kolom
ke-1. Sebagai catatan bahwa langkah tersebut dilakukan apabila yakin betul
bahwa tidak ada orang lain yang akan menggunakan kerangkan sampling yang
sama dengan tabel angka random yang sama pula.
5. Sebelum proses pemilihan dimulai, harus ditentukan secara tegas bilangan
random mana saja yang tidak boleh dipakai. Untuk keperluan ini kita susun
interval-interval
Catatan :
1. apabila diperoleh sisi pembagian bernilai nol, maka artinya adalah satuan
sampling yang terpilih adalah nomor yang terbesar.
2. Perhatikan bahwa yang dimaksud dengan sisa pembagian adalah sisa
pembagian dari bilangan random yang terpilih dengan penyebut N
3. Satuan sampling yang sudah terpilih (sisa pembagian yang sudah terpilih)
tidak boleh dipakai lagi

II. 3. 3 Randomization Based on Permutations

Dalam penelitian eksperimental seringkali peneliti harus membagi sekelompok


satuan sampling ke dalam beberapa kelompok secara acak sesuai dengan perlakuan
(treatment) yang akan dipakai. Pengacakan yang paling baik dalam hal ini adalah
pengacakan dengan menggunakan bilangan yang dipermutasikan (diubah-ubah)
secara acak, misalnya; 234, 243, 342, 324, 432, dan 423. Susun bilangan yang telah
dipermutasikan tersebut ke dalam sebuah tabel. Pilih secara acak baris ke berapa yang
akan dipakai dari tabel tersebut yang kemudian tabel ini harus dibacakan dari kiri ke
kanan untuk menentukan bilangan acak yang terpilih sebagai nomor untuk satuan
sampling.

II. 4 Bentuk-bentuk Estimasi

Sebagaimana yang telah diuraikan sebelumnya bahwa dalam proses


inferensial, terdapat dua kegiatan statistik, yaitu penaksiran parameter dan pengujian

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͵Ͷ
hipotesis. Adapun pembahasan yang akan diuraikan selanjutnya adalah mengenai
penaksiran parameter.

II. 4. 1 Estomator untuk rata-rata populasi ( μ x ) dan standar errornya ( σ (X ) )

Dalil :
Apabila sebuah populasi berukuran N kita embentuk sebuah sampel berukuran n
melalui Sampling Acak Sederhana dan dari sampel tersebut diukur variat X yang
mempunyai tingkat pengukuran interval/rasio dengan hasil pengukuran x1, x2, …, xn,
maka :

1. Estomatior tak bias untuk rata-rata populasi μx adalah :

1
X=
n
¦ xi
2. Estimator untuk standar error σ (X ) adalah

¦ x − (¦ x )
2 2
§N −n·s
2 n
σˆ (X ) = ¨ 2 i i
¸ ; s =
© N ¹ n n (n − 1)

Apabila dari sebuah sampel berukuran n yang dipilih melalui Sampling Acak
Sederhana, kita bisa menghitung σˆ (X ) , maka Bound of Error untuk rata-rata μ
didefinisikan sebagai :
BE = δ = t§ α ·
σˆ (X )
¨ 1− ; n −1 ¸
© 2 ¹

secara teori, Bound of Error tersebut menyatakan kekeliruan terbesar yang mungkin
terjadi dengan derajat kepercayaan ( 1 - α ) 100%. Secara fisik, Bound of Error adalah
setengah lebar taksiran.

II. 4. 3 Estomator untuk proporsi (persentase) dan standar errornya

Secara statistis kalo kita berbicara persentase, sebenarnya kita berbicara proporsi
(belum dikalikan 100%). Oleh karena itu dalam statistika, analisis mengenai
persentasse dilakukan atas dasar proporsi.

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͵ͷ
Dalil :
Apabila dari sebuah populasi berukuran nN, kita membentuk sampel berukuran n
melalui sampling Acak sederhana, kemudian dari sampel tersebut kita men variabel X
yang sifatnya (tingkat pengukurannya) nominal dichotomus dengan harga pengukuran
:
xi = 1 jika satuan sampling bersifat A
xi = 0 jika satuan sampling bukan bersifat A
maka eestimator takbias untuk proporsi A dalam populasi didefinisikan sebagai :
1) estomator takbias untuk proporsi
1
p=
n
¦ xi ; x i = 1 jika A
x i = 0 jika B
2) estimator bias untuk standar error dari p adalah :

§ N − n · p (1 − p )
σˆ ( p ) = ¨ ¸
© N ¹ n −1

Sebagai catatan bahwa dalam praktik survay yang menyangkut penaksiran


parameter,ada sebuah perjanjian tak tertulis yang sifatnya optional, yaitu apabila
sampling fraction < 0,05 maka finite population fraction (fpc) dianggap 1. Ini artinya
dalam rumus standar Error tidak dimasukkan Fpc. Dalam hal inni diambil suatu
ketentuan berapa pun sampling fraction, Fpc akan tetap digunakan, sebab sekalipuun
n/N < o,o5apabila hasil pengukuran variabel X adalah bilangan-bilangan kecil, Fpc
besar pengaruhnya.

II. 5 Menentukan Ukuran Sampel

Setelah peneliti menentukan tujuan dari penelitiannya, maka selanjutnya perlu diambil
keputusan apakah akan dilakukan sensus atau sampling. Apabila proses yang akan
dilaksanakannya adalah sampling, maka diperlukan adanya suatu ketegasan berapa
ukuran sampel minimal yang sebaiknya diambil. Ukuran sampel ini akan memberi
isyarat mengenai managability of the research (kelayakan penenlitian). Ada dua dasar
pemikiran dalam menentukan ukuran sampel, yaitu ditentukan atas dasar oemikiran
statistis, dan atau ditentukan atas dasar pemikikran nonstatistis.

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͵͸
II. 5. 1 Menentukan Ukuran Sampel Atas Dasar Pemikiran Non Statistis

Apabila dipandang dari sudut nonstatisti, ukran sampel ditentukan oleh beberapa
faktor, yaitu :
a. Ditentukan oleh waktu (time constraint / kendala waktu)
b. Ditentukan oleh biaya
c. Ditentukan oleh ketersediaan satuan sampling, akan lebih terasa di bidang
kedokteran

II. 5. 2 Menentukan Ukuran Sampel Atas Dasar Pemikiran Statistis

Ditinjau dari aspek statistis, ukuran sampel ditentukan oleh banyak faktor, yaitu :
a. Ukuran sampel ditentukan oleh bentuk parameter yang menjadi tolok ukur
analisis, dalam arti apakah kesimpulan yang akan kita ambil dasarnya rata-rata
( μ ), apakah persentase ( π ), atau yang lainnya. Masalah bentuk parameter
uini erat kaitannya dengan tingkat pengukuran variabel yang kita hadapi,
apakah tingkat penggukurannya nominal, ordinal, interval, atau rasio.
b. Ukuran sampel ditentukan oleh tipe sampling yang digunakan, apakah
sampling peluang (Sampling Acak Sederhana, Sampling Sistematis, Sampling
Acak Stratifikasi, dan Sampling Klaster) atau sampling Nonpeluang.
c. Ukuran sampel ditentukan pula oleh tujuan penelitian, apakah bertujuan
untuk menaksir parameter atau menguji hipotesis.
d. Ukuran sampel ditentukan oleh sifat penelitian, apakah sifatnya
nonkomparatif atau komparatif.
e. Ukuran sampel ditentukan oleh variabilitas variabel (keseragaman variabel)
yang diteliti, makin tidak seragam variabel yang diteliti, makin besar ukuran
sampel minimal yang harus diambil.
f. Apabila tujuan penelitian semata-mata hanya membuat taksiran parameter,
maka ukuran sampel ditentukan oleh bound of error penaksiran dan derajat
kepercayaan yang dikehendaki ( α ). Sedanghkan apabila tujuan penelitian
menenguji hipotesis, maka ukuran sampel ditentukan oleh berapa selisih
terkecil yang harus dinyatakan secara signifikan, tergantung pula pada level of
significant ( α ) dan kuasa uji (1-β)

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͵͹
II. 5. 2. 1 Menentukan Ukuran Sample Apabila Tujuan Penelitiannya
Menaksir Rata - rata

Langkah kerja yang harus dilakukannya adalah sebagai berikut :


a. Tentukan dengan tegas bahwa tujuan penelitiannya adalah menaksir rata-rata
populasi ( μ )
b. Tentukan dengan tegas berapa derajat kepercayaan yang akan dipakai (pada
umumnya statistik klasik menggunakan derajat kepercayaan 95 % atau 90 %)
c. Tentukan bound of error penaksiran
d. Gunakan persamaan :
2
§z S·
n0 = ¨ α / 2 ¸
© δ ¹

n0
n=
n
1+ 0
n
Keterangan :
S : Simpangan baku untuk variabel yang diteliti dalam populasi
δ : Bound of error yang bisa ditolelir / dikehendaki
Z (1−α ) : Konstanta bilangan yang diperoleh dari tabel normal baku
2

Rumus di atas mengandung parameter S yang dalam praktik jarang sekali


diketahui, sebab S hanya diketahui apabila dilakukan sensus. Dalam
kenyataannya, S bisa diperoleh melalui cara-cara sebagai berikut :
a. Diperoleh dari hasil penelitian orang lain mengenai variabel yang sama
atau serupa yang sudah diterima secara akademik
b. Pendapat para pakar mengenai variabel yang sedang diteliti
c. Lakukan penelitian penjajagan (pilot survey)
d. Dengan menggunakan Deming’s Empirical Rule. Menurut Deming, ada
hubungan antara besarnya simpangan baku dengan besarnya rentang
(selisih data terbesar dengan data terkecilnya).
Aturan Deming :
- Jika variabel X adalah variabel dengan tingkat pengukuran interval
atau rasio mnegikuti distribusi yang bentuk kurvanya miring, baik

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͵ͺ
miring ke kiri maupun miring ke kanan, maka hubungan antara
simpangan baku dengan rentang adalah :
S ≈ 0,25 R

Kurva di atas menunjukkan kurva Kurva menunjukkan kurva negatif, yang


positif yang menggambarkan bahwa menggambarkan bahwa nilai-nilai yang
nilai-nilai yang kecil cenderung kecil cenderunng lebih sedikit daripada
banyak, kemudian nilai yang besar nilai-nilai yang besar.
cenderung sedikit. Sebagai contohnya adalah pengunjung
Sebagai contohnya adalah aktifitas di pada café-café tenda. Pada pagi hari
pasar. Pada pukul 05.00 – 10.00 yang nyaris tidak ada pengunjung. Tetapi di
belanja cenderung banyak, sedangkan sore hari, pengunjung mulai
semakin siang semakin sedikit, bahkan berdatangan. Bahkan pada malam hari
yang belanja mulai sepi. terjadi penumpukkan pengunjung
hingga terjadi antrian. Kemudian
menjelang pukul 24.00 ke atas
pengunjung menjadi sepi lagi

- Apabila X mengikuti distribusi yang bentuk kurvanya normal,


maka hubungan antara simpangan baku dengan rentang adalah:
S ≈ 0,24 R

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͵ͻ
- Jika X mengikuti distribusi yang kurvanya uniform, maka
hubungan antara simpangan baku dengan rentangnya adalah:
S ≈ 0,29 R

Nilai S yang diperoleh dari hasil penelitian orang lain bukanlah


merupakan simpangan baku populasi, melainkan simpangna baku
yang diperoleh dari sampel yaitu s. Tetapi karena penelitian
tersebut sudah diterima orang, maka s dianggap menjadi S. Ada
kemungkinan bahwa hasil penelitian mengenai vaiabel serupa
memberikan s yang berbeda. Dalam keadaan yang seperti ini
diambil n yang terbesar.
Dalam praktik, ukuran sampel bisa pula dilakukan berdasarkan
nilai-nilai yang diambil dari ukuran sampel sebesar n. Selanjutnya
digunakan Freund’s Iterative Method, sebagai berikut :
1. Tentukan n0 dengan persamaan berikut :
2
§Z S·
no = ¨ α / 2 ¸
© δ ¹
2. Substitusikan no ke dalam persamaan :
2
§ tα / 2 (no −1) S ·
n1 = ¨¨ ¸¸
© δ ¹
3. Substitusikan n1 ke dalam persamaan :
2
§ tα / 2 (n1 −1) S ·
n2 = ¨¨ ¸¸
© δ ¹
4. Substitusikan hasil dari langkah ketiga pada persamaan
langkah ketiga itu sendiri. Langkah dihentikan apabila hasil
yang diperoleh sama atau hampir sama dengan langkah yang
telah dilakukan sebelumnya. Diperolehlah nilai minimum dari
ukuran sampel berdasarkan nilai akhir dari iterasi.

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͶͲ
Contoh Soal :
Seorang peneliti ingin mengetahui sejauh mana tingkat sadar hukum
masyarakat di daerah A. Untuk itu ia perlu mengambil sampel masyarakat.
Apabila ia menginginkan derajat keyakinan 95% bahwa kalaupun ada
perbedaan rata rata tingkat kesadaran hukum antara hasil sampel dengan rata
rata keseluruhan, perbedaan tersebut jangan lebih dari 5. Maka, bila Jumlah
penduduk dewasa masyarakat daerah A =500.000, ukuran sampel yang
diperlukan adalah:

2
§z S·
n0 = ¨ α / 2 ¸
© δ ¹

2
§ 1.96(3.84) ·
n0 = ¨ ¸ = 226.586 ≈ 227
© 5 ¹

n0 227
n= = = 226.89 ≈ 227
n0 227
1+ 1+
n 500.000

catatan:
Skor minimal :40
Skor maksimal : 200
R =160
Diketahui bahwa distribusi skor simetri. Maka
S=(0.24)160= 38.4

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran Ͷͳ
II.5.2.2 Menentukan Ukuran Sample Apabila Tujuan Penelitiannya
Menaksir Persentase (Proporsi)

Secara statistis, persentase itu dinyatakan dalam proporsi. Oleh karena itu,
menaksir persentase sama dengan menaksir proporsi. Untuk menentukan ukuran
sampel dengan tujuan penaksiran persentase, dapat dihitung dengan persamaan
berikut :
a. Jika sebelumnya ada keterangan sekunder mengenai dugaan harga
proporsi , maka rumusnya :
2
§ zα / 2 π 0 (1 −π 0 ) ·
n0 = ¨ ¸
¨ δ ¸
© ¹

n0
n=
n −1
1+ 0
N
b. Jika belum ada keterangan sekunder mengenai dugaan π0, maka
disarankan dipakai π0 = 0,5 sehingga rumusnya menjadi :
2
§z ·
n0 = ¨ α / 2 ¸
© 2δ ¹
n0
n=
n −1
1+ 0
N
Rumus ini adalah rumus ukuran sampel minimal yang terbesar , sebab
perkalian π0 (1 - π0) akan merupakan perkalian terbesar nilainya jika dan
hanya jika π0 = 0,5

Contoh:
Seseorang ingin mendapat keterangan berapa persen di suatu daerah yang
tergolong pengangguran, bila derajat keyakinan dipilih 99% dengan bound of
error 5%. Diketahui bahwa banyaknya masyarakat di daerah tersebut adalah
12.000
2 2
§ z · § 2.575 ·
n0 = ¨ α / 2 ¸ = ¨ ¸ ≈ 664
© 2δ ¹ © 2 × 0.05 ¹

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran Ͷʹ
n0 664
n= = = 629.13 ≈ 630
n0 − 1 664 − 1
1+ 1+
n 12.000

II.5.2.2 Menentukan Ukuran Sample Apabila Tujuan Penelitiannya Adalah


Melakukan Pengujian Hipotesis

A. Menentukan ukuran sampel bila penelitian bertujuan untuk menguji hipotesis


mengenai perbedaan rata rata dengan sampel independen

Gunakan rumus berikut

n=
(Z 1−α + Z1− β ) 2 S 2
2

∂2
untuk α dan β yang ditentukan
S adalah simpangan baku dari variabel yang diteliti, dimana diasumsikan
bahwa simpangan baku ini sama untuk kedua populasi.
δ menyatakan perbedaan rata rata yang menurut teori /tujuan penelitian
dianggap bermakna

Contoh:
Andaikan dalam suatu penelitian ingin diuji suatu hipotesis yang mengatakan bahwa
kinerja perusahaan BUMN lebih tinggi dibandingkan dengan non BUMN. Untuk itu
penelitian dilakukan. Yang menjadi unit sampling dalam penelitian ini adalah
perusahaan bak BUMN maupun non BUMN. Masalahnya berapa perusahaan yang
harus dijadikan sampel bila pengujian ingin mengambil resiko α dan β sebesar
masing masing 0.05. Bila menurut teori perbedaan skor rata rata kinerja antara
perusahan BUMN dan Non BUMN sebesar 10
dianggap bermakna dan menurut pengalaman skor terendah dari kinerja adalah 30
serta tertingi 150, maka kran sampel yang diperlukan adalah:

n=
(Z 1−α + Z1− β ) 2 S 2
2

=
(1.645 + 1.645)2 2S 2
∂2 10 2

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran Ͷ͵
dengan aturan Deming, maka S = 0.24 × R = 0.24 × (150 − 30) = 28.8 S
Sehingga

(1.645 + 1.645)2 2(28.8)2 = 179.55 ≈ 180


10 2

Jadi dperlukan paling sedikit masing 180 perusahaan BUMN dan non BUMN.

B. Menentukan ukuran sampel ila penelitian bertujuan untuk menguji hipotesis


mengenai perbedaan rata rata dengan sampel berpasangan

Gunakan rumus berikut

n=
(Z 1−α + Z1− β ) S d
2 2

∂2

Sd adalah simpangan baku dari perbedaaan skor populasi pertama dengan


populasi ke dua.
δ menyatakan perbedaan rata rata yang menurut teori /tujuan penelitian
dianggap bermakna

C. Menentukan ukuran sampel bila penelitian bertujuan untuk menguji hipotesis


tentang kebermaknaan korelasi

Untuk menentukan ukuran sampel yang dperlukan digunakan pendekatan berikut:

Ukuran sampel ditentukan secara iterasi dengan cara berikut. Tentukan ukuran
sampel melalui rumusan :
Pada iterasi pertama, u p ditentukan melalui persamaan berikut

§1+ ρ ·
u p = 1 log¨¨ ¸¸
2
©1− ρ ¹

di mana ρ menyatakan perkiraan korelasi yang terjadi antara variabel X dan Y.


Untuk iterasi selanjutnya gunakan

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͶͶ
§1+ ρ · ρ
u p = 1 log¨¨ ¸¸ +
2
© 1 − ρ ¹ 2(n − 1)

demikian seterusnya sampai diperoleh nilai n yang stabil (konvergen).


Untuk berbagai nilai α dan β serta nilai ρ, Machin and Campbel telah membuat tabel
ukuran sampel sehingga memudahkan untuk digunakan. (lihat lampiran 1.)

D. Menentukan ukuran sampel bila penelitian bertujuan untuk menguji hipotesis


tentang kebermaknaan R 2 dalam analisis regresi

Bila tujuannya untuk menguji kebermaknaan R 2 dalam analisis regresi,maka


ukuran sampel ditentukan melalui rumus:

L
n= + k +1
f2

R2
dimana f 2 =
1 − R2

k = banyaknya variabel bebas


L diperoleh dari tabel (lampiran 2) untuk α dan β yang ditentukan
R 2 adalah koefisien determinasi terkecil yang besarnya diperkirakan baik
berdasarkan teori maupun pra survai.

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran Ͷͷ
TINJAUAN MATA KULIAH

BAB III
SAMPLING SISTEMATIS

III. 1 Pendahuluan

Sebuah sampel yang diperoleh dari penyeleksian satu unsur secara acak dari k
unsur yang pertama dalam sebuah kerangka sampling dan setiap unsur ke-k kemudian
disebut satu dalam k sampel sistematik. Jadi, suatu proses memilih dikatakan
sampling sistematik apabila dalam pemilihan itu dilakukan pemilihan sistematik
setelah terpilih bilangan acak, dengan syarat bahwa peluang terpilihnya 1 N .
Sampling sistematik digunakan apabila :
1. Bisa disusun kerangka sampling yang lengkap
2. Keadaan variabel yang sedang diteliti relatif homogen dan tersebar merata
di seluruh populasi
Sampling Sistematik memberikan sebuat alternatif yang berguna dari Sampling Acak
Sederhana untuk alasan sebagai berikut :
1. Sampling Sistematik lebih mudah untuk dilakukan dan oleh sebab itu lebih
sedikit subjek yang melakukan kesalahan wawancara daripada Sampling Acak
Sederhana.
2. Sampling Sistematik sering memberikan informasi yang lebih banyak
mengenai biaya per unit/satuan daripada yang diberikan Sampling Acak
Sederhana.
Pada umunya Sampling Sistematik merupakan penyeleksian secara acak pada
suatu unsur dari k unsur yang pertama dan kemudian penyeleksian pada setiap unsur k
sesudahnya. Prosedur ini lebih mudah dibentuk dan biasanya akan meminimalisir
kesalahan yang mungkin dilakukan oleh pewawancara daripada dalam proses
Sampling Acak Sederhana. Sebagai contohnya, akan menjadi lebih sulit apabila
menggunakan Sampling Acak Sederhana untuk menyeksi n = 50 orang pembeli pada
sebuah sudut jalan kota. Pewawancara tidak menentukan pembeli-pembeli mana yang
termasuk dalam sampelnya, karena ia tidak memiliki sampling framenya serta tidak

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran Ͷͻ
mengetahui ukuran populasi ,N . Sebagai solusinya, ia dapat mengambil sampel
secara sistematik (katakanlah 1 dari 20 pembeli) hingga persyaratan sampelnya bisa
didapatkan. Ini akan menjadi sebuah prosedur yang mudah bahkan untuk
pewawancara yang tidak berpengalaman sekalipun dapat melakukannya.
Selain itu, lebih mudah untuk dilakukan dan lebih sedikit terjadinya kesalahan
dalam wawancara terhadap subjeknya. Sampling Sistematik sering memberikan
informasi yang lebih banyak per unit biaya daripada Sampling Acak Sederhana.
Sampling sistematik seringkali menyebar lebih seragam pada seluruh sendi populasi
sehingga dapat menghasilkan informasi yang lebih banyak mengenai populasinya
daripada data-data yang diperoleh dengan Sampling Acak Sederhana.
Pertimbangkan contoh berikut : Kita akan memilih salah satu dari 5 sampel secara
sistematik dari vouicher perjalanan sekumpulan data sebanyak N = 1000. (yaitu, n =
200 voucher) untuk menghitung proporsi dari voucher yang dicatat secara tidak
benar. Satu voucher menggambarkan proses acak dari 5 voucher yang pertama
(sebagai contohnya 3 ) dan setiap voucher sesudahnya menjadsi anggota sampel.
voucher Voucher yang menjadi sampel
1
2
3 3
4
5
6
7
8 8
9
10
……
996
997
998 998
999
1000

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͷͲ
Dimisalkan bahwa kebanyakan dari 500 voucher pertama telah diisi dengan benar,
tapi berkaitan dengan perubahan yang dialami oleh juru tulis, 500 voucher kedua akan
memiliki kesalahan yang banyak. Apabila proses sampling yang digunakan adalah
dengan Sampling Acak Sederhana, maka secara kebetulan bisa terpilih kebanyakan
(mungkin semua) dari 200 voucher adalah berasal dari salah satunya, baik itu pada
bagian kelompok pertama maupun yang kedua dan sebab itu taksiran untuk p menjadi
kurang sesuai Sebaliknya, Sampling Sistematik akan memilih jumlah yang sama dari
voucher pada kedua kelompok tersebut dan akan memberikan taksiran yang akurat .

III. 2 Bagaimana Menggambarkan Sampling Sistematik

Walaupun Sampel Acak Sederhana maupun Sampel Sistematik keduanya


memberikan alternativ yang berguna satu sama lainnya, metode dari pemilihan data
sampelnya berbeda. Suatu Sampel Acak Sederhana dari populasi dipilih dengan
menggunakan tabel bilangan acak. Akan tetapi metode-metode yang bervariasi dapat
digunakan dalam Sampling Sistematik. Peneliti dapat memilih 1 dari 3, 1 dari 5, atau
secara umum, 1 dari k sampel sisitematis.
Untuk mendapatkan suatu sampel sistematis berukuran n dari sebuah populasi
yang berukuran N, harus ditentukan k sistematis yang kurang atau sama dengan n/N.
k tidak bisa dipilih secara tepat apabila ukuran populasi tidak diketahui. Meskikpun
dapat ditentukan ukuran sampel secara pendekatan, namun harus memperkirakan nilai
k yang dibutuhkan untuk mencapai ukuran sampel (n). Jika nilai k yang dipilih terlalu
besar, ukuran sampel (n) yang diharuskan tidak akan diperoleh dengan menggunakan
1-dalam-k sampel sistematis dari populasinya. Hal ini tidak akan menjadi masalah
jika peneliti dapat menguanginya dan membuat 1-dalam-k sistematik sampling
lainnya hingga ukuran sampel yang telah ditentukan terpenuhi. Namun demikian,
dalam beberapa situasi tidak mungkin untuk memulai sampling sistematis yang
kedua.

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͷͳ
III. 3 Keuntungan Sampling Sistematik

Dibandingkan dengan sampling acak sederhana, sampling sisitematik


mempunyai kelebihan, yaitu :
1. standard Error yang didasarkan pada sampling sisitematik paling sedikit sama
presisinya dengan sampling acak sederhana
2. Mudah dilakukan
3. Pada keadaan tertentu, sampling sistematik bisa dilakukan sekalipun tidak ada
kerangka sampling.

III. 4 Kerugian Sampling Sistematik

Sampling sistematik bisa sangat merugikan apabila dalam kerangka sampling


terdapat periodisitas, teruitama periodisitas yang berhimpit / overlap dengan interval
pemilihan.
Sebagai contohnya adalah suatu penelitian yang akan dilakukan mengenai
tingkat kepuasan tamu hotel terhadap prosedur pelayanan di hotel tersebut.
Sampling frame yang digunakanya adalah daftar tamu yang hadir pada saat itu.
Berdasarkan tujuan kedatangannya, tamu hotel dibagi menjadi convention, bisnis,
weekend, liburan, government dan pelatihan. Celakanya , ternyata berdasarkan
sampling sistematik ternyata dalam kerangka sampling ada periodisitas yang overlap
dengan interval pemilihan, misalnya terus menrus terpilih tamu bisnis. Sehingga pada
akhirnya kurang bisa mencerminkan bagaiman tibgkat kepuasan keseluruhan tamu
yang ada.

III. 5 Menaksir Rata-rata Populasi dan Total

Sebagaimana yang telah berulangkali ditekankan bahwa maksud dari


kebanyakan suatu survey adalah menaksir satu atau lebih parameter dari populasi..
Taksiran untuk rata-rata populasi , μ, dari sampel sistematik menggunakan rata-rata
sampel, x sebagai berikut :

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͷʹ
Penaksir Rata-rata Populasi, μ :
n

¦x i
μ = x sy = i =1
( 3.1 )
n

Varians taksiran untuk x sy :


2
§ N −n · s
Vˆ (x sy ) = ¨ ¸ (3.2)
© N ¹ n

Bound of Error taksiran tersebut :

2
§N −n·s
δ = Zα Vˆ (x sy ) = Z α ¨ ¸ (3.3)
2 2 © N ¹ n

Jika N tidak diketahui maka fpc, ( N – n ) / N pada persamaan (3.2) dan (3.3)
dibuang. Ternyata bahwa taksiran varians dari x sy yang ada pada persamaan (3.2)

identik dengan taksiran varians untuk x yang dperoleh dengan menggunakan


Sampling acak Sederhana. Hal ini tidak menyiratkan bahwa varians populasi yang
bersangkutan sama. Varians dari x diperoleh dari persamaan :

§ N −n ·σ 2
V (x ) = ¨¨
ˆ ¸¸
© N −1 ¹ n
Demikian juga varians dari x sy dapat dituliskan :

σ2
V (x sy ) = {1 + (n − 1) ρ }
n
dimana ρ adalah koefisien korelasi antara observasi dalam sampel sisitematik yang
sama. Ketika N besar, kedua varians tersebut sama jika observasi dalam sebuah
sampel yang ditetapkan tidak berkorelasi (ρ ≈ 0).
Sebuah taksiran yang tak bias dari V (x sy ) tidak dapat diperoleh dengan

menggunakan data hanya dari satu sampel sistematik. Hal ini tidak berarti bahwa
suatu taksiran dari V (x sy ) tidak pernah bisa diperoleh. Untuk populasi tertentu,

ampling sistematik ekivalen dengan sampling acak sederhana, dan kita dapat

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͷ͵
mengambil V (x sy ) yang hampir sama dengan taksiran varians dari x berdasarkan

pada samping acak sederhana.


Untuk populasi yang mana hubungan ini terjadi? Untuk menjawab pertanyaan
tersebut kita harus mempertimbangkan tiga tipe populasi sebagai berikut :
1. Populasi Acak (Random Population)
2. Populasi Terurut (Ordered Populastion)
3. Populasi Berkala (Periodic Population)

III. 5. 1 Populasi acak

Definisi : Suatu populasi dikatakan acak apabila elemen-elemen dari populasi tersebut
berada dalam urutan yang acak.
Elemen-elemen dari sampel sistematik yang diambil dari populasi yang acak
diaharapkan akan heterogen dengan ρ mendekati nol. Dengan demikian, ketika N
besar, varians dari x sy kira-kira sama dengan varians dari x yang berdasarkan pada

sampling acak sederhana, sampling sistematis dalam kasus ini ekivalen dengan
sangling acak sederhana. Sebagai contohnya, seorang peneliti ingin menentukan rata-
rata jumlah dari yang ditulis oleh dokter tertentu selama tahun sebelumnya.. Jika
frame (kerangka) mengandung daftar dokter-dokter, cukup beralasan untuk
mengasumsikan bahwa nama-nama pada daftrar tersebut tidak berhubungan dengan
banyaknya resep yang ditulis untuk obat tertentu. Oleh karena itu, kita pertimbangkan
bahwa populasinya acak. Suatu sampel sistematik akan ekivelan dengan sampel acak
sederhana untuk kasus tersebut.

III. 5. 2 Populasi Terurut

Suatu populasi dikatakan terurut apabila elemen-elemen dalam populasi


terurut dalam dalam jarak sesuai dengan pola tertentu
Dalam sebuah survey untuk menaksir efektivitas dari instruksi dalam suatu
kursus yang besar, pelajar diminta untuk mengevaluasi instrukutur mereka
berdasarkan skala numerik.. sebuah sampel kemudian diambil dari daftar evaluasi
yang disusun dalam urutan numerik yang menaik. Populasi dari pengukuran dimana
data sampel diambil dianggap sebuah populasi yag terurut.

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͷͶ
Suatu sampel sistematik yag diambil dari populasi yang terurut pada umumny
abersifat heterogen dengan ρ ≤ 0,
V (x sy ) ≤ V (x )

Dengan demikian, sebuah sampel sisitematik dari populasi terurut memberikan


indformasi yang lebih banyak per unit biayanya daripada sampel acak sederhana,
karena varians dari x sy yang diperoleh lebih kecil daripada varians dari x .

Jika tidak diperoleh taksiran V (x sy ) dari data sampel, suatu taksiran konservatif

untuk V (x sy ) dapat digunakan :

s2 § N − n ·
Vˆ (x sy ) = ¨ ¸
n © N ¹

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͷͷ
TINJAUAN MATA KULIAH

BAB IV
SAMPLING ACAK BERSTRATA

IV. 1 Pendahuluan
Salah satu metoda pengambilan sampel lain disamping Sampling Acak
Sederhana adalah Sampling Acak Bestrata. Sampling ini dilakukan apabila dalam
keadaan tertentu Sampling Acak Sederhana kurang baik untuk digunakan karena akan
memberikan presisi suatu taksiran yang rendah. Untuk itu kita perhatikan kasus yang
berikut. Misalkan di suatu daerah, pendapatan masyarakat bersifat heterogen, yakni
ada yang tergolong “tinggi, menengah, atau rendah”, dan melalui Sampling Acak
Sederhana akan diambil sampel dalam usaha menaksir rata-rata pendapatan
masyarakat tersebut, maka ada kemungkinan yang terambil ke dalam sampel
walaupun dilakukan secara acak, kebanyakan atau hanyalah mereka yang tergolong
berpenghasilan rendah. Bila rata-rata pendapatan dihitung dari sampel ini, maka rata-
rata tadi akan merupakan taksiran yang rendah (under estimate).
Telah diketahui bahwa metoda pengambilan sampel yang dilakukan dalam
rangka menaksir parameter populasi adalah metode yang dapat memberikan presisi
suatu taksiran yang tinggi. Diketahui pula bahwa presisi suatu taksiran diukur oleh
galat baku dari taksiran tersebut. Dari rumus galat baku-galat baku yang sudah kita
kenal, dalam Sampling Acak Sederhana, Tampak bahwa besar kecilnya galat baku
antara lain bergantung pada ukuran sampel. Makin besar ukuran sampel
menyebabkan makin kecilnya galat baku suatu penaksir, yang juga berarti semakin
tinggi presisi penaksir tersebut. Selain itu, variasi data, yang diukur oleh S2, juga bisa
menentukan besarnya galat baku. Dari rumus galat baku rata-rata misalnya, tampak
bahwa makin besar harga S2 (artinya karakteristik populasi heterogen) akan juga
menyebabkan makin besarnya galat baku. Sebaliknya, semakin kecil (karakteristik
populasi relative homogen) akan menghasilkan galat baku yang kecil. Dengan
demikian Sampling Acak Sederhana akan memberikan presisi yang tinggi apabila
karakteristk populasi bersifat homogen. Dalam kasus ini, tampak bahwa pendapatan
bersifat heterogen yang berarti varians pendapatan, S2, juga akan besar. Oleh karena
itu, apabila sampel diambil melalui Sampling Acak Sederhana, akan memberikan
presisi yang rendah.

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͷͻ
Masuk akal kiranya, agar diperoleh presisi yang tinggi, sampel yang terambil
haruslah sampel yang didalamnya berisi misalnya, masyarakat yang dari semua
golongan pendapatan. Sampel seperti ini dapat diperoleh melalui Sampling Acak
Bestrata. Dalam Sampling Acak Bestrata populasi N dibagi ke dalam beberapa
kelompok sedemikian sehingga setiap kelompok mempunyai karakteristik yang
homogen. Kelompok-kelompok semacam ini disebut strata (tunggalnya disebut
stratum) dan dalam masing-masing stratum sampel diambil secara acak, yakni dengan
Sampling Acak Sederhana. Proses pembagian populasi ke dalam beberapa strata
disebut stratifikasi. Dalam kasus sebelumnya, populasi dibagi dalam tiga strata,
stratum pertama adalah masyarakat yang tergolong berpenghasilan tinggi, stratum
kedua yang berpenghasilan menengah, dan stratum ketiga masyarakat yang
berpenghasilan rendah.
Dalam bab ini, akan diuraikan Sampling Acak Berstrata untuk menaksir rata-
rata, proporsi serta total populasi. Namun sebelum lebih jauh membahasnya, perlu
diperhatikan terlebh dahulu beberapa notasi yang digunakan.

IV. 2 Notasi
Telah dikatakan bahwa populasi dibagi ke dalam kelompok-kelompok yang
disebut strata. Andaikan populasi dibagi dalam L strata, maka banyaknya unit serta
beberapa besaran karakteristik yang diperlukan dalam stratum dinyatakan dalam
notasi-notasi berikut, Indeks k dalam notasi menyatakan stratum ke-k, jadi k bisa
berharga 1, 2, …, L.
Nh banyaknya unit dalam stratum ke – h
nh banyaknya unit dalam sampel yang diambil dari stratum ke – h
yhi nilai pengamatan atau nilai karakteristik untuk unit ke-i dalam
stratum ke-h
Nh
Wh = bobot stratum ke-h
N
fh fraksi sampling dalam stratum ke-h

Yh =
¦y hi
nilai rata-rata karakteristik dalam stratum ke-h
Nh

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͸Ͳ
yh =
¦y hi
nilai rata-rata karakteristik sampel berukuran nh yang diambil dari
nh
stratum ke-h

¦ (y − Yh )
2
2 hi
S h = varians karakteristik dalam stratum ke-h
Nh −1

¦ (y − Yh )
2
2 hi
s h = varians karakteristik sampel berukuran nh dari stratum ke-h
nh − 1

IV. 3 Prosedur Pengambilan Sampel

Seperti sudah dijelaskan, bahwa pembentukan strata atau stratifikasi


dimaksudkan untuk meningkatkan presisi suatu taksiran. Menigkatnya suatu presisi
akan bergantung kepada derajat homogenitas yang dicapai dalam strata, atau dapat
pula dikatakan bergantung pada seberapa besar variabilitas karakteristik yang akan
diukur direfleksikan diantara strata. Hal ini tentu saja pada gilirannya bergantung
kepada efektifitas pembentukan strata.
Dalam membentuk batas-batas stratum, perlu mengumpulkan semua informasi
yang dapat menolong mengklasifikasikan unit-unit menjadi kelompok-kelompok
populasi yang satu sama lain berbeda. Data masa lalu, intuisi, pertimbangan para ahli
di lapangan, atau kejelian seseorang dalam menerka dengan baik, semuanya bisa
digunakan secara efektif dalam membentuk atau membedakan strata satu dengan yang
lainnya.
Apabila secara cermat strata sudah terbentuk, maka sampel untuk masing-
masing stratum dipilih melalui metode Sampling Acak Sederhana. Karena dilakukan
dengan metode Sampling Acak Sederhana, maka tentunya harus tersedia kerangka
sampling dalam setiap stratum. Apabila sudah tersedia, maka dari N1, N2, …, NL unit
diambil sampel secara acak, katakan berukuran n1, n2, …, nL sehingga ukuran sampel
yang dibutuhkan, yakni,
n = n1 + n2 + … + nL (4.1)
merupakan golongan ukuran-ukuran sampel setiap stratum.
Untuk lebih jelasnya, selanjutnya akan diuraikan langkah kerja dalam
membentuk strata untuk sebuah populasi sebaagai berikut :

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͸ͳ
1. Tentukan populasi sasaran dan tentukan populasi secara keseluruhan (N)
2. Berdasarkan variabel tertentu (kriteria tertentu) , populasi dibagi-bagi ke
dalam L buah strata
3. Untuk setiap strata lakukan pendaftaran satuan sampling sehingga untuk setiap
strata diperoleh kerangka sampling masing-masing dengan ukuran strata
masing-masing
4. Dari populasi tersebut kemudian ditentukan ukuran sampel n yang disebut
overall sample size. Menentukan ukuran sampel n tentu saja harus berdasarkan
kriteria tertentu.
5. Ukuran sampel sebesar n selanjutnya dialokasikan (disebarkan) ke seluruh
strata, yang kemudian disebut alokasi sampel (sample allocation)
Stratum I : n1
Stratum I : n2
L
Stratum I : n3 sedemikian rupa sehingga : n = ¦ ni
i =1


Stratum I : nL
6. Dari setiap stratum kemudian dipilih satuan sampling melalui teknik Sampel
Acak Sederhana.
Oleh karena dari setiap stratum dilakukan secara Sampling Acak Sederhana, maka
keseluruhan proses disebut Sampling Acak Berstrata. Jika proses memilih dari
setiap stratum dilakukan secara sistematik, maka proses keseluruhan disebut
Sampling Acak Sistematis Berstrata.
Sebagai contoh, dibawah ini diberikan gambaran pembagian populasi menjadi
tiga buah stratum yang kemudian dilakukan prose Sampling Acak Berstrata :

N1 N2 . N3 n1 n1 n1

N = N1 + N2 + N3 n = n1 + n2 + n3

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͸ʹ
IV. 4 Taksiran Rata-rata Populasi

IV. 4. 1 Bentuk Taksiran

Seperti halnya Sampling Acak Sederhana maka akan diuraikan tiga penaksir
yang barangkali dilibatkan dalam penelitian. Penaksir ini adalah penaksir rata-rata,
proporsi dan total populasi.
Rata-rata nilai karakteristik populasi tiada lain adalah jumlah nilai
karakteristik dibagi banyaknya unit dalam populasi.
L Nh

¦¦ x
h =i i =1
hi
X= (4.2)
N
atau bisa juga ditulis dengan :
L

¦N
h =1
h Xh
X= (4.3)
N
X disebut “rata-rata yang dibobot” dengan bobot yang digunakan adalah
ukuran-ukuran stratum, yaitu Nh. Kalau sampel dari setiap stratum diambil dengan
menggunakan Sampling Acak Sederhana, maka rata-rata nilai karakteristik dari
sampel dalam setiap stratum bisa ditentukan yaitu
nh

¦x
i =1
hi
xh = (4.4)
nh

x h ini tentu saja merupakan penaksir yang takbias untuk X h . Karena x h ini

merupakan penaksir yang takbias untuk X h , maka N h x h akan merupakan penaksir


total nilai karakteristik dalam stratum ke-h, sehingga apabila taksiran-taksiran total ini
kita jumlahkan, yakni ¦N h x h , maka akan merupakan taksiran total nilai populasi.

Oleh karena itu, taksiran rata-rata nilai karakteristik populasi akan sama dengan

¦N h x h dibagi oeh N. Taksiran rata-rata nilai karakteristik populasi dalam Sampling

Acak Berstrata diberi symbol x st . Oleh karenanya

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͸͵
L

¦x
h =1
h
x st = (4.5)
N
Taksiran ini juga merupakan taksiran yang takbias untuk X .

Contoh 4. 1 :
Seorang peneliti mengadakan suatu survai untuk mengetahui berapa rata-rata hasil
penjualan lading per bulan milik para petani di suatu daerah. Dikeahui bahwa di
daerah tersebut terdapat 250 petani yang 60 diantaranya tergolong kelompok yang
mempunyai lading luas, 100 tergolong kelompok yang mempunyai ladang lumayan
luas, dan 40 petani tergolong mempunyai ladang kecil. Sampel yang diambil oleh
peneliti adalah 50 petani yang masing-masing kelompok diwakili oleh 15, 25, dan 10
petani. Dalam tiap kelompok petani-petani ini diambil dengan sampling acak
sederhana. Dari petani yang terpilih, rata-rata pendapatannya dihitung, lihat table (IV.
1) diperoleh :
Tabel IV. 1
PENJUALAN HASIL LADANG PER BULAN
MENURUT STRATA LUAS LADANG
(DALAM RATUSAN RIBU RUPIAH)

STRATA LUAS LADANG


NO
1 2 3
1 123 65 34
2 120 60 30
3 125 63 25
4 160 60 28
5 130 70 27
6 110 64 25
7 140 63 30
8 110 60 35
9 130 59 20
10 100 63 46
11 110 62
12 120 58
13 125 64
14 120 65
15 152 65

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͸Ͷ
16 60
17 50
18 55
19 62
20 60
21 60
22 64
23 62
24 40
25 46
Jumlah 1.875.000 1.500.000 300.000

xh 125.000 60.000 30.000

sh 16.053,48 6.416,13 7.149,20

x1 = Rp.125.000,− x 2 = Rp. 60.000,− x3 = Rp. 30.000,−


maka pukul rata hasil penjualan ladang per bulan di daerah tersebut adalah

x st =
(60)(125.000) + (100)(60.000) + (40)(30.000)
200
= Rp. 73.500,−

IV. 4. 2 Galat Baku Rata-rata

Seperti telah kita ketahui dalam uraian sebelumnya, selain taksiran untuk suatu
parameter populasi, diperlukan juga varians atau galat baku dari taksiran tersebut agar
presisi dari penaksir dapat diukur. Apabila sampel diambil melalui prosedur Sampling
Acak Berstrata dan dari nilai karakteristik sampel ini akan ditaksir rata-rata populasi
X , oleh x st , maka varians dari x st , ditulis V ( x st ) dapat ditentukan dengan
menggunakan persamaan berikut :

§ L N x ·
V ( x st ) = V ¨ ¦ h h ¸ (4.6)
© h =1 N ¹
yang apabila diuraikan menjadi
1 L
N h − n h S h2
V ( x st ) =
N2
¦ N h2
h =1 N h nh
(4.7)

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͸ͷ
atau
L
§ N − nh · S h2
V ( x st ) = ¦ Wh2 ¨¨ h ¸¸ (4.8)
h =1 © Nh ¹ nh
dengan wh menyatakan bobot stratum ke-h.
V( x st ) di atas besarnya besarnya bergantung antara lain pada S h2 yaitu varians nilai
karakteristik dalam stratum ke-h. Kenyataan, sering varians ini jarang diketahui
besarnya sehingga sulit bagi kita untuk menghitung V( x st ) melalui persamaan (4.8).

Oleh karena itu, V( x st ) bisa ditaksir. Taksiran untuk V( x st ) akan didasarkan pada
besarnya varians nilai karakteristik yang dihitung melalui sampel yang diambil dari
setiap stratum. Penaksir tersebut adalah :
L
§ N − nh · s h2
Vˆ ( x st ) = ¦ Wh2 ¨¨ h ¸¸ (4.9)
h =1 © Nh ¹ nh
s h2 menyatakan varians nilai karakteristik stratum ke – h yang dihitung dengan
menggunakan persamaan (…). Dengan demikian galat baku dari rata-rata untuk
sampling berstrata adalah
s x st = V ( x st ) (4.10)

Dari contoh 4.1, melalui sampel yang diambil dari tiap stratum, besarnya varians atau
simpangan baku pendapatan petani dihitung. Dari 15 petani yag mempunyai ladang
luas, juga dari 25 petani serta 10 petani yang mempunyai ladang cukup dan kecil,
simpangan baku pendapatan dihitung. Hasilnya tampak pada tabel III. 1 berturut-turut
adalah :
s1 = Rp. 16.053,48 , -
s2 = Rp. 6.416,13 , -
s3 = Rp. 7.149,20 , -
Maka dengan menggunakan persamaan (…) varians rata-rata petani di daerah tersebut
besarnya ditaksir oleh :

°­§ 60 · § 60 − 15 · (16053,48) § 100 · § 100 − 25 · (6416,13)


2 2 2 2
V ( x st ) = ®¨
ˆ ¸ ¨ ¸ +¨ ¸ ¨ ¸ +
°̄© 200 ¹ © 60 ¹ 15 © 200 ¹ © 100 ¹ 25

§ 40 · § 40 − 10 · (7149,20 ) ½°
2 2

¨ ¸ ¨ ¸ ¾
© 200 ¹ © 40 ¹ 10 °¿
=1621797,603

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͸͸
sehingga galat bakunya adalah

s x st = Vˆ ( x st ) = Rp.1273,498 ,−

nilai tersebut untuk mengukur presisi dari x st .


Apabila varians suatu taksiran bisa ditentukan, maka interval taksirannya juga
bisa dicari. Sejalan dengan pembahasan Sampling Acak Sederhana, maka apabila
sampel diambil melalui Sampling Acak Berstrata, interval taksiran rata-rata dengan
derajat konfiden α, dapat diperoleh dari :
x st − Z 1 s x st < X < x st + Z 1 s x st (4.11)
α α
2 2

dimana Z 1 besarnya didapat dari tabel normal baku.


α
2

Contoh 4.2 :
Dalam contoh yang lalu, apabila diinginkan interval taksiran untuk rata-rata
pendapatan hasil ladang dengan α = 5 %, maka interval taksiran tersebut adalah :
73.500 – (1,96) (1273,498) < X < 73.500 + (1,96) (1273,498)
71003,94 < X < 75996,06
yang berarti bahwa dengan derajat keyakinan 95 % rata-rata penjualan hasil ladang
para petani di daerah tersebut terletak antara Rp. 71.004 , - dan Rp. 75.996,-.

IV. 5 Taksiran Persentase (Proporsi)

IV. 5. 1 Bentuk Taksiran

Seperti halnya pada taksiran untuk rata-rata, maka taksiran untuk proporsi juga
melibatkan besaran proporsi untuk setiap strata. Oleh karena itu, melalui Sampling
Acak Berstrata berukuran N, taksiran untuk proporsinya adalah :
L
§N ·
Pst = ¦ ¨ i ¸ pi
i =1 © N ¹

1 ni
dengan pi = ¦ xij
n j =1
xij = 1 jika satuan sampling mempunyai karakteristik yang dicari
xij = 0 jika satuan sampling tidak mempunyai karakteristik yang dicari

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͸͹
IV. 5. 2 Galat Baku Proporsi

Apabila sampel diambil melalui prosedur Sampling Acak Berstrata dan dari
nilai karakteristik sampel ini akan ditaksir proporsi populasi πst, oleh Pst, maka varians
dari Pst, ditulis V(Pst) dapat ditentukan dengan menggunakan persamaan berikut :

·§ N i · pi (1 − p i )
2
L
§ N − ni
V (Pst ) = ¦ ¨¨ i ¸¸¨ ¸ (4.12)
i =1 © Ni ¹© N ¹ ni − 1

yang apabila diuraikan menjadi


1 L
pi (1 − pi )
V (Pst ) =
N2
¦ (N
h =1
i − ni )N i
ni − 1
(4.13)

IV. 6 Alokasi Sampel

Uraian yang lalu memperlihatkan pada kita bagaimana menentukan taksiran


rata-rata dan mengukur presisi taksiran rata-rata melalui galat baku taksiran tersebut
jika sampel diambil dengan Sampling Acak Berstrata. Ini bisa dilakukan apabila kita
sudah mengetahui besarnya ukuran sampel, n , dan besarnya ukuran-ukuran sampel
yang diambil dari setiap stratum,nh. Dari contoh 4.1 dan 4.2 misalnya, taksiran rata-
rata hasil penjualan, x st , serta variansnya, V( x st ), dapat dihitung karena besarnya
sampel yaitu 50 petani sudah ditentukan, demikian pula besarnya ukuran sampel
untuk setiap stratum, yaitu; 15, 25, dan 10 petani.
Masalah yang timbul tentunya adalah bagaimana menentukan bahwa sampel
berukuran 50 petani , dan dalam berapa bagian dari 50 petani ini diberikan untuk
setiap stratum. Dengan kata lain, bagaimana menentukan n dan bagaimana pula
mengalokasikan n ini ke dalam masing-masing stratum.
Dalam bagian ini akan diuraikan terlebih dahulu bagaimana mangalokasikan n
ke dalam setiap stratum, sehingga untuk n yang diketahui besarnya, nh bisa
ditentukan. Dalam Sampling Acak Berstrata, mengalokasikan n ke dalam setiap
stratum bisa ditempuh dalam beberapa cara. Cara yang paling seerhana adalah yang
disebut alokasi proporsional, yang akan diuraikan berikut ini.

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͸ͺ
IV. 6. 1 Alokasi Proporsional

Salah satu cara menentukan besarnya nh untuk n yang diketahui adalah alokasi
proporsional. Alokasi ini adalah alokasi yang paling sederhana. Ukuran-ukuran
sampel dari setiap stratum diambil proporsional terhadap ukuran stratumnya, Nh.
Dengan alokasi ini, maka :
Nh
nh = ⋅n ; h = 1, 2, ... , L (4.14)
N
nh n
sehingga berlaku bahwa = yang menyatakan berapa bagian sampel diambil
Nh N
dari populasi.

Contoh 4. 3 :
Dari contoh 4.1 nampak bahwa ukuran populasinya terdiri dari 200 petani, dan
masing-masing stratum berukuran N1 = 60, N2 = 100, dan N3 = 40. Dari ukuran ini
akan diambil sampel berukuran 50 petani. Maka dengan alokasi proporsional,
banyaknya petani yang harus diambil dari setiap stratum adalah:
60
n1 = × 50 = 15 pe tan i
200
100
n2 = × 50 = 25 pe tan i
200
40
n3 = × 50 = 10 pe tan i
200
dengan demikian, sampel-sampel yang diambil dari setiap stratum dari contoh di atas
merupakan sampel yang proporsional terhadap ukuran stratum.
Apabila alokasi sampel dilakukan dengan alokasi proporsional, maka x st
dengan variansnya yang masing-masing ditulis dalam persamaan () dan () dapat
disederhanakan menjadi :
L nh

¦¦ x
h =1 i =1
hi
x st = (4.15)
n
yang merupakan rata-rata nilai karakteristik sampel, dan

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͸ͻ
N − n L N h S h2
V ( x st ) = ¦
N h =1 N n
(4.16)

yang taksirannya adalah


N − n L N h s h2
Vˆ ( x st ) = ¦
N h =1 N n
(4.17)

dengan s h2 menyatakan varians nilai karakteristik yang dihitung dari sampel yang
diambil dari stratum ke-h, dihitung dengan menggunakan rumus (….)
Apabila rumus ini kita gunakan untuk contoh yang lalu, maka

§ 200 − 50 ·§ 60 (16053,48) ·
2
100 (6406,13) 2 40 (7149,20) 2
V ( x st ) = ¨
ˆ ¸¨¨ + + ¸¸
© 200 ¹© 200 50 200 50 200 50 ¹
= 1621797,603
terlihat bahwa hasilnya sama dengan apabila digunakan persamaan ((())))

IV. 6. 2 Alokasi Optimal

Dalam alokasi proporsional, ukuran-ukuran sampel dari setiap stratum


ditentukan secara proporsional terhadap ukuran-ukuran stratum Nh. Dalam keadaan
tertentu terdapat suatu kendala dalam menentukan ukuran sampel. Kendala tersebut
biasanya adalah biaya. Dalam sampling, dikenala apa yang disebut biaya samplilng.
Dengan biaya sampling diartikan sebagai biaya yang perlu disediakan apabila kita
akan melakukan pengambilan sampel. Oleh karena itu, tercakup di dalamnya biaya-
biaya merencanakan sampling, membentuk kerangka sampling, melatih pewawancara,
mengumpulkan data, menyusun dan mengolah data, keperluan secretariat, dan lain
sebagainya. Biaya sampling ini terbagi dalam dua bagian, yaitu biaya tetap, B0, dan
biaya-biaya tidak tetap, Bh. Yang termasuk biaya tetap adalah biaya yang tidak
tergantung pada berapa besarnya ukuran sampel yang diambil dari setiap stratum,
termasuk di dalamnya adalah biaya-biaya keperluan secretariat, biaya sewa ruangan,
honor pegawai, dan sebagainya. Biaya tidak tetap adalah biaya untuk mendapatkan
data (melalui wawancara, angket, dan sebagainya) dari satu unut yang ada dalam
setiap stratum. Oleh karena itu, apabila biaya memperoleh data dari satu unit dalam
stratum pertama adalah B1 rupiah, dan dari stratum ini akan diambil sampel berukuran
n1 unit. Maka jumlah biaya yang diperlukan untuk mendapatkan data dari stratum
pertama adalah n1B1. Demikian pula untuk stratum ke dua, dengan biaya untuk

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͹Ͳ
mendapatkan data dari satu unit sebesar B2 rupiah, maka diperlukan sebanyak n2B2
rupiah.
Secara umum, untuk stratum ke-h, diperlukan biaya nhBh rupiah. Oleh karena
itu, biaya yang diperlukan untuk mendapatkan data dari n = ¦ nh unit adalah

¦n B h h rupiah. Karena keseluruhan biaya sampling yang diperlukan merupakan

jumlah biaya tetap dan tidak tetap, maka seluruh biaya dapat dituliskan sebagai
berikut :
B = B0 + ¦ nh Bh (4.18)

Untuk mempermudah perhitungan-perhitungan selanjutnya, hanya akan diperhatikan


biaya tidak tetap saja, yaitu:
B ′ = B − B0 = ¦ nh Bh (4.19)

Dengan menggunakan fungsi biaya, maka ukuran sampel dapat ditentukan melalui
dua cara: Pertama, dengan biaya sampling tertentu, yakni sebesar B, tentukan ukuran
sampel n, dan alokasikan n ini ke dalam setiap stratum sehingga dicapai presisi yang
maksimal (galat baku taksiran minimal). Ke dua, dengan presisi taksiran yang
dikehendaki, tentukan ukuran sampel n, lalu alokasikan n ini pada setiap stratum
sehingga biaya yang harus dikeluarkansekecil mungkin. Metode alokasi ukuran
sampel ini disebut Alokasi Optimal.
Dengan terminologi lain, alokasi optimal dapat dinyatakan seperti berikut,
tentukan n dan nh sedemikian rupa sehingga untuk B ′ tertentu s x st minimal, atau

tentukan n sehingga untuk s x st tertentu B ′ seminimal mungkin.


Kita perhatikan terlebih dahulu bagaimana menentukan nh untuk ukuran n
tertentu. Apabila alokasi optimal digunakan, maka ukuran sampel setiap stratum
dihitung melalui persamaan:
Nh Sh Bh
nh = ⋅n (4.20)
¦ Nh Sh Bh

IV. 6. 3 Alokasi Neyman

Apabila biaya total per satuan sampling dalam setiap stratum (Bh) sama, maka
penentuan alokasi sampling ke dalam setiap stratum dari persamaan 4.18 menjadi :

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͹ͳ
Nh Sh
nh = ⋅n (4.21)
¦ Nh Sh
Alokasi di atas merupakan bentuk daro alokasi Neyman

IV. 6. 4 Alokasi Sembarang

Alokasi ini dilakukan dengan cara mengalokasikan sampling ke dalam strata


seimbang dengan syarat minimal dari sebuah stratum harus ada dua buah satuan
sampling yang diambil. Dalam praktik, alokasi seperti ini sama sekali tidak
disarankan, sebab alokasi tersebut bisa mengakibatkan standard error menjadi
membengkak yang harganya lebih besar daripada standard error Sampling Acak
Sederhana.

IV. 6. 5 Alokasi Sama Besar

Menurut kriterium ini, alokasi dilakukan atas dasar rumus


n
ni = (4.22)
L
Pada keadaan tertentu aloksai sma besar bisa menguntungkan, yaitu pada keadaan
yang disebut paired allocation.

IV. 7 Menentukan Ukuran Sampel

Sebagaimana telah diketahui, banyak sekali faktor yang ikut menentukan ukuran
sampel, dua diantaranya adalah tergantung kepada parameter yang akan ditaksir dan
tergantung kepada tipe samplingnya.

IV. 7. 1 Menentukan Ukuran Sampel Jika Akan Menaksir Rata-rata


Apabila parameter yang akan ditaksir adalah rata-rata dan tipe sampling
Sampling Acak Berstrata, maka ukuran sampel bisa diperoleh melalui persamaan
berikut :

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͹ʹ
L
N i2 S i2
¦
i =1 wi
n= 2
(4.23)
§ ·
¨ δ ¸
L

¸¸ N + ¦ N i S i
2 2
¨¨ Z
© (1−α 2 ) ¹
i =1

wi = ni / n ; δ = bound of error

IV. 7. 2 Menentukan Ukuran Sampel Jika Akan Menaksir Proporsi

Selanjutnya jika parameter yang akan ditaksir adalah rata-rata dan tipe sampling
Sampling Acak Berstrata, maka ukuran sampel bisa diperoleh melalui persamaan
berikut :
L
N i2 π i (1 − π i )
¦ wi
n= i =1 (4.24)
2
§ ·
¨ δ ¸
L

¨¨ Z ¸¸ N 2
+ ¦ N i π i (1 − π i )
© (1−α )
2 ¹
i =1

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͹͵
TINJAUAN MATA KULIAH

BAB V
SAMPLING KLASTER

V. 1 Pendahuluan

Salah satu jenis sampling yang juga sering digunakan dalam praktek penelitian
adalah sampling klaster. Sampling ini dilakukan apabila peneliti ingin menekan biaya
sampling atau jika kerangka sampling yang memuat elemen/atau unit observasi tidak
tersedia. Sampling klaster adalah sampling dimana unit samplingnya adalah kumpulan
atau kelompok (cluster) elemen (unit observasi). Sebagai contoh, andaikan seorang
peneliti ingin mengetahui rata-rata pendapatan kepala keluarga disebuah kota besar.
Apabila Sampling acak sederhana atau sampling acak berstrata akan digunakan, maka
peneliti harus mempunyai kerangka sampling yang berisikan daftar kepala keluarga
dikota tersebut. Daftar keseluruhan nama kepala keluarga dikota yang besar seperti ini
pasti akan sulit diperoleh. kalaupun ada, dan SRS dilakukan maka sampel masyarakat
yang terambil bisa tersebar ke semua penjuru kota, dan ini akan melibatkan biaya
pengambilan sampel yang tinggi. Daftar yang mungkin bisa diperoleh adalah daftar
nama nama kelurahan dikota tersebut. Kelurahan adalah kumpulan kepala kepala
keluarga. Oleh karena itu kelurahan dipandang sebagai klaster.
Proses pegambilan sampling klaster dilakukan dengan memperhatikan
kerangka sampling yang berisikan daftar klaster , dalam contoh di atas daftar nama
kelurahan. Pengambilan sampel kemudian dilakukan dengan mengambil secara acak
klaster-klaster. Unit sampling yang berisikan klaster-klaster dinamakan unit sampling
utama (primary sampling unit) disingkat USU. Apabila semua unit observasi dalam
USU menjadi anggota sampel maka dikatakan bahwa proses pengambilan sampel
dilakukan dengan sampling klaster satu tahap. Namun apabila USU dibagi lagi ke
dalam unit yang lebih kecil, misalnya kelurahan dibagi lagi ke dalam Rukun-rukun
Warga maka rukun warga disebut unit sampling ke dua (secondary sampling unit)
disingkat USD. Apabila semua unit obervasi (elemen) dari USD menjadi anggota
sampel, maka dikatakan proses pengambilan sampel dilakukan dengan sampling
klaster dua tahap, demikian seterusnya.

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͹ͺ
Perhatikan persamaaan dan perbedaan sampling berstrata dan sampling klaster dalam
gambar berikut.

Sampling Acak Stratifikasi Sampling Klaster

Masing-masing elemen di dalam populasi Masing-masing elemen di dalam populasi


tepat berada dalam satu stratum tepat berada dalam satu klaster
Populasi dari H strata; stratum h memiliki Sampling klaster satu tahap; Populasi dari
nh elemen N klaster

Mengambil secara SRS elemen-elemen Mengambil klaster secara SRS kemudian


untuk setiap stratum mengamati semua elemen di dalam
klaster yang terambil

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͹ͻ
Varians penaksirnya tergantung pada Klaster merupakan unit sampling, lebih
keragaman nilai-nilai di dalam strata banyak klaster yang dijadikan sampel
maka lebih kecil variansnya. Varians dari
penaksirnya tergantung pada keragaman
antara rata-rata klaster

Untuk presisi yang terbaik, elemen- Untuk presisi yang terbaik, elemen-
elemen individu di dalam setiap stratum elemen individu di dalam masing-masing
harus memiliki nilai-nilai yang serupa , klaster harus heterogen, dan rata-rata
tetapi rata-rata sertiap statum satu sama klaster harus serupa satu sama lainnya.
lain sedapat mungkin harus berbeda

V.2 Notasi notasi yang digunakan untuk Sampling Klaster Satu Tahap

Dalam sampling acak sederhana, unit-unit yang diambil sebagai sampel adalah
elemen-elemen yang diobservasi. Dalam sampling klaster, unit samplingnya adalah
klaster-klaster, dan elemen-elemen yang diobservasi adalah USD di dalam klaster-
klaster. Himpunan semestanya, U¸ merupakan populasi dari N USU; S menandakan
sampel dari USU yang dipilih dari populasi USU, dan Si merupakan sampel dari USD
yang dipilih dari USU yang ke-i.
Berikut ini adalah notasi notasi yang akan digunakan dalam sampling klaster
khususnya bila ingin menaksir rata rata populasi:
N = banyaknya klaster dalam populasi
n = banyaknya klaster yang dipilih sebagai sample
mi = banyaknya unit observasi (elemen) dalam klaster ke I, I=1,2, … ,N

1 n
m = ¦ mi rata rata ukuran klaster dalam sampel
n i =1
N
M= ¦m
i =1
i Banyaknya unit observasi (elemen) dalam populasi

M
M = rata rata ukuran klaster dalam Populasi
N
y i = total semua observasi dalam klaster ke i

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͺͲ
V.3 Proses Memilih dalam Sampling Klaster Satu Tahap

Dalam sampling klaster satu tahap, terjadi suatu kondisi dimana semua atau
tidak satupun elemen-elemen yang terkandung di dalam klaster (= USU) dijadikan
sebagai sampel. Sampling klaster satu tahap banyak digunakan pada kegiatan survai
yang memiliki biaya sampling untuk USD dapat diabaikan bila dibandingkan dengan
biaya sampling untuk USU. Misalnya untuk survai pendidikan, yang bertindak
sebagai USU adalah ruangan kelas; semua siswa dalam kelas yang terpilih yang
sebenarnya merupakan USD dijadikan sebagai objek analisis jika hanya sedikit biaya
ekstra yang perlukan daripada meneliti beberapa siswa saja dalam kelas terpilih
tersebut.
i) Populasi dibagi-bagi ke dalam N buah klaster atau Unit Sampling Utama
(USU). Keadaan variable Y dalam setiap klaster diusahakan se-heterogen
mungkin (dalam praktik tidak pernah bisa tercapai, terutama apabila yang
menjadi klaster adalah daerah atau kumpulan satuan-satuan sampling yang
ukurannya besar).
ii) Secara Simple Random Sampling dipilih n buah klaster.
iii) Pemilihan hanya dilakukan sekali yaitu memilih klaster ( memilih Unit
Sampling Utama / USU ). Oleh karena itu, semua unit sampling kedua
(USD) yang ada dalam klaster yang terpilih diperiksa.

Sebagai catatatan bahwa apabila kita akan menggunakan sampling klaster satu tahap
maka disarankan ukuran klaster relatif kecil. Ukuran klaster yang terlalu kecil bisa
merugikan, bisa pula menguntungkan.
Merugikan : Apabila yang sedang kita teliti adalah peristiwa-peristiwa yang
jarang terjadi (Rare Cases)
Contoh : Kematian ibu pada saat melahirkan (mortality)
Menguntungkan : Apabila peristiwa itu banyak terjadi (abundant cases).

V.4 Taksiran Rata-rata Populasi

Sampling klaster merupakan sampling acak sederhana dengan setiap unit


samplingnya mengandung sejumlah elemen-elemen. Oleh karena itu, taksiran rata-

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͺͳ
rata populasi, ȝ, dan total, τ, serupa dengan taksiran-taksiran pada sampling acak
sederhana. Secara khusus, rata-rata sampel, y , merupakan taksiran yang baik dari
rata-rata populasi, ȝ.
Taksiran rata rata populasi μ adalah rata-rata sampel yang bentuknya adalah:
n

¦y
i =1
i
y= n
(5.1)
¦m
i =1
i

dan varians dari y adalah


n
(y − ymi )
N−n ·¦ i
2

ˆ ( y) = §¨ i =1 (5.2)

V
© NnM ¹ n −1
Dalam hal ini M dapat ditaksir dengan m jika M tidak diketahui.
Taksiran varians pada persamaan (5.2) merupakan taksiran yang bias dan taksiran
varians tersebut akan baik jika ukuran sampel yang diambil, n, besar, yaitu n • 20.
Bias akan hilang jika masing-masing klaster, m1, m2, …, mN, memiliki ukuran yang
sama.

Contoh:
Suatu survai dirancangkan untuk menaksir rata rata pengeluaran untuk keperluan
rumah tangga masyarakat disuatu kota. Karena daftar rumah tangga di daerah tersebut
tidak ada, maka dilakukanlah pengambilan sampel dengan cara klaster. Yang menjadi
klaster adalah Rukun rukun warga (RW) di daerah tersebut. Dari hasil sampel
diperoleh data berikut.
Tabel 5.1
Total Jumlah Total Jumlah
Banyaknya Pengeluaran dari Banyaknya Pengeluaran dari
RW Rumah Rumah Tangga RW Rumah Rumah Tangga
Tangga (dalam ribuan Tangga (dalam ribuan
rupiah) rupiah
1 55 2210 11 73 2930
2 60 2390 12 64 2470
3 63 2430 13 69 2830

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͺʹ
4 58 2380 14 58 2370
5 71 2760 15 63 2390
6 78 3110 16 75 2870
7 69 2780 17 78 3210
8 58 2370 18 51 2430
9 52 1990 19 67 2730
10 71 2810 20 70 2880

n
Dari tabel ini maka m1 = 55, m2 = 60, m3 = 63,  , m20 = 70 , sehingga ¦m
i =1
i = 1303

Jadi rata rata pengeluaran dari sampel adalah


20
¦ yi 52340
i =1
20 = = 40.169
¦ mi 1303
i =1

Untuk menghitung V̂(y ) diperlukan beberapa perhitungan sebagai berikut:


20
¦ y i2 = y 21 + y 22 + ... + y 252
i =1

= (2210 ) + (2390 ) + ... + (2880)


2 2 2

= 138873600

20
¦ m i2 = m 21 + m 22 + ... + m 252
i =1

= (55 ) + (60 ) + ... + (70 )


2 2 2

= 86171

20
¦ y i m i = y1 m1 + y 2 m 2 + ... y 20 m 20
i =1
= (2210) (55) + (2390) (60 ) + ... + (2880 ) (70)
= 3456230

Kemudian kita uraikan persamaan berikut:

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͺ͵
20 20 20 20
¦ (y i − ym i ) =¦ − 2 y ¦ yi mi + y ¦ m i2
2
y i2 2

i =1 i =1 i =1 i =1

= 138873600 − 2 (40,17 ) (3456230 ) + (40,17 ) (86171)


2

= 248085,668

Karena M tidak diketahui, maka sebagaimana yang telah dijelaskan sebelumnya, M


dapat ditaksir dengan m sebagai berikut :
20
¦ mi 1303
m = i =1 = = 65,15
n 20

Apabila dimisalkan bahwa total Rukun Warga yang ada di daerah tersebut adalah
sebanyak 100 (N = 100), maka varians dari pengeluarannya adalah:
n

§ N−n ·
¦ (yi − ymi )2
V̂( y) = ¨ 2
¸ i =1
© Nn M ¹ n −1
§ 100 − 20 · 248085,668
=¨ ¸
¨ (100 )(20 )(65,15)2 ¸ 20 − 1
© ¹
= 0,123
Dengan demikian, dengan kepercayaan mendekati 95%, taksiran interval untuk
pengeluaran tersebut adalah :
ˆ (y ) = 40,167 ± 2 0,123 = 40,167 ± 0,702
y±2 V
Jadi taksiran yang paling baik dari rata-rata pengeluaran untuk keperluan rumah
tangga masyarakat di kota tersebut adalah 40,167, dan kekeliruan taksiran harus
kurang dari 0,702 dengan peluang mendekati 0,95.

V.5 Taksiran Total Populasi

Penaksir dari total populasi, τ, adalah sebagai berikut:


n
¦ yi
i =1 (5.3)
My=M n
¦ mi
i =1

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͺͶ
penaksir varians dari M y adalah:
n
¦ (y i − ym i )
2

ˆ ( My ) = M 2 V (y ) = M 2 §¨ N − n ¸ i =1
V
·
© NnM 2 ¹ n −1
n
¦ (y i − ym i )
2

§ N − n i =1 · (5.4)
= M2 N2 ¨ ¸
© NnM 2 ¹ n −1
n
¦ (y i − ym i )
2

§ N − n · i =1
= N¨ ¸
© n ¹ n −1

Contoh :
Dari contoh sebelumnya mengenai tingkat pengeluaran untuk keperluan rumah
tangga masyarakat di suatu kota, akan ditaksir total pengeluarannya. Dimisalkan
bahwa terdapat 5500 penduduk dari kota tersebut, maka nilai taksiran total
pengeluarannya adalah:

M y = 5500 (40,167 )
= 220918,5

Sebelumnya telah diketahui nilai dari V̂(y ) , namun dari sekarang ini nilai M tidak

perlu lagi ditaksir dengan m . Dengan memanfaatkan nilai yang telah diperoleh
tersebut, maka dengan menggunakan kepercayan 95%, taksiran interval untuk τ
adalah sebagai berikut:

ˆ (M y ) = 220918,5 ± 2 M 2 V
M y±2 V ˆ ( y)

220918,5 ± 2 (5500)2 (0,123)


220918,5 ± 3858,622

Seringkali banyaknya elemen dalam populasi tidak diketahui ketika akan digunakan n
klaster sampling. Maka penaksir M y tidak dapat digunakan, tetapi dapat digunakan

bentuk taksiran yang lain dari total populasi yang tidak bergantung pada M. Nilai y τ ,
diperoleh dengan persamaan:

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͺͷ
1 n
yτ = ¦ yi
n i =1
(5.5)

adalah rata-rata dari total klaster untuk sampel klaster yang berukuran n. Oleh kareba
itu, y τ merupakan penaksir yang tak bias untuk rata dari total N klaster dalam

populasi. Begitu juga N y τ merupakan penaksir yang tak bias untuk jumlah dari total

klaster atau total populasi, τ.


Adapun penaksir dari total populasi τ, yang tidak bergantung pada M adalah:
N n
N yτ = ¦ yi
n i =1
(5.6)

Taksiran varians untuk Ny :


n
¦ (y i − y)
2

§N −n·
ˆ ( Ny ) = N 2 V ( y ) = N 2 ¨ (5.7)
V ¸ i =1
© Nn ¹ n −1

Jika ternyata variasi di antara ukuran-ukuran klaster besar dan jika ukuran klaster
sangat berkorelasi dengan total klaster, maka varians untuk N y τ (persamaan 5.7)

pada umumnya lebih besar dari varians untuk My (persamaan 5.4). Penaksir N y τ
tidak menggunakan informasi yang mengenai ukuran-ukuran klaster m1, m2, …, mn
sehingga bisa mangakibatkan rendahnya presisi yang dimiliki.

Contoh :
Dengan menggunakan contoh soal sebelumnya, dimisalkan bahwa untuk menaksir
total pengeluaran ternyata banyaknya penduduk dari kota tersebut tidak diketahui.
Yang diketahui adalah banyak klaster yaitu N=100. Sebagai solusinya, dapat
digunakan persamaan (5.7) sebagai berikut:

N n 100
N yτ = ¦ yi = (52340) = 261700
n i =1 20

Selanjutnya untuk menentukan varians dari penaksirnya, maka terlebih dahulu dicari
persamaan berikut:

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͺ͸
2
n n 1§ n ·
¦ (y i − y) = ¦ − ¨ ¦ yi ¸
2
y i2
i =1 i =1 n © i =1 ¹
1
= 138873600 − (52340)2
20
= 1899820

maka interval taksiran untuk total pengeluaran untuk pengeluaran rumah tangga
masyarakat adalah :
ˆ (Ny )
Ny τ ± 2 V τ
n
¦ (y i − y)
2

§N−n·
i =1
Ny τ ± 2 N2 ¨ ¸
© Nn ¹ n −1

261700 ± 2 (100)2 §¨¨ 100 − 20 ·¸¸ 1899820


© 100(20) ¹ 20 − 1
261700 ± 12648,511

V.6 Menentukan Ukuran Sampel untuk Menaksir Rata-rata dan Total Populasi

Banyaknya informasi dalam suatu sampel klaster dipengaruhi oleh dua faktor
yaitu banyaknya klaster dan ukuran relatif dari klaster. Sebagaimana telah kita
ketahui, ukuran dari batas-batas kekeliruan (bound of error) dari taksiran tergantung
kepada variasi di antara klaster. Dengan demikian harus disahakan untuk
memperoleh variasi yang kecil diantara totalnya.diasumsikan bahwa u8kuran klaster
(unit sampling) telah dipilih dan dianggap hanya sebagai masalh dari pemililhan
jumlah klaster, n.

Dari persamaan (5.2), taksiran varians dari y adalah

§ N−n · 2
V̂( y) = ¨ ¸ sk
© NnM 2 ¹
( )
dimana
n
¦ (y i − ym i )
2

i =1
s 2k = (5.8)
n −1

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͺ͹
Varians sebenarnya dari y sekitar:

V ( )
ˆ ( y ) = §¨ N − n ·¸ σ 2
k
(5.9)
© NnM 2 ¹

2 2
dimana σ k merupakan varians populasi yang ditaksir dengan s k .
2
Karena tidak dketahui σ k atau rata-rata dari klaster M , pemilihan ukuran sampel,
yaitu banyaknya klaster yang perlu untuk memperoleh informasi khusus mengenai
parameter populasi menjadi sulit. Kesulitan ini dapat diatasi dengan menggunakan
metode yang sama dengan penggunaan pada taksiran rasio. Yaitu, digunakansebuah
2
taksiran dari σ k dan M , yang diperoleh dari survai pendahuluan, atau dipilih
sampel yang berukuran n’ elemen yang telah diambil dari penelitian
sebelumnya.Dengan demikian, seperti halnya pada semua permasalahan mengenai
penentuan ukuran sampel, pada standard deviasi penaksir dikalikan dengan dua
untuk memperoleh batas-batas kekeliruan dari taksiran (bound of error), δ. Batasan
ini menunjukkan nilai kekeliruan maksimum yang dirasa memiliki toleransi yang
sesuai, yaitu:

δ = 2 V( y ) (5.10)

dengan menggunakan persamaan (5.9), diperoleh pemecahan untuk n.


Kita memperoleh hasil yang sama ketika menggunakan My untuk menaksir total

populasi τ, karena V( My ) = M2 V( y ).

Pendekatan ukuran sampel dengan tujuan untuk menaksir μ dengan batas kekeliruan
taksiran δ , adalah:
N σ 2k (5.11)
n=
N D + σ 2k
2 2
dimana σ k ditaksir dengan s k , dan

δ2 M 2
D= (5.12)
4

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͺͺ
Apabila kita mengambil nilai pengali dari simpangan baku taksirannya adalah z α ,
2

yang merupakan pendekatan dari distribusi normal baku dengan melibatkan resiko
kekeliruan sebesar α, maka diperoleh :

δ = zα V (y ) (5.13)
2

sehingga nilai D berubah menjadi :


δ2 M 2 (5.14)
D=
(z )α
2
2

Contoh:
Misalkan data pada tabel 5.1 merupakan sampel pendahuluan dari pengeluaran untuk
keperluan rumah tangga msyarakat di suatu kota. Berapa besar sampel yang harus
diambil untuk keperluan survai yang akan datang yang bertujuan untuk menaksir rata-
rata pengeluaran μ dengan batas kekeliruan dari taksirannya adalah 25 ribu rupiah?

Jawab:
n
¦ (y i − ym i )
2
248085,668
s 2k = i =1 = = 13057,14
n −1 20 − 1

nilai M dapat ditaksir dengan :


20
¦ mi 1303
m = i =1 = = 65,15
n 20

Selanjutnya nilai D diperoleh adalah:

δ 2 M 2 (25)2 (65,15)2
D= = = 663206,64
4 4

maka ukuran sampel yang sebaiknya diambil adalah

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͺͻ
N σ 2k 100 (13057 ,14 )
n= = = 34,3676 ≈ 35
N D + σ 2k 100 (683722,2656 ) + 13057 ,14

jadi 35 klaster sebaiknya dijadikan sebagai sampel.

V.7 Menentukan ukuran sampel apabila tujuan penelitiannya adalah menaksir


total populasi, τ, menggunakan M y , dengan batas kekeliruan dari

taksiran δ :

Dengan pola pemikiran yang sama, maka diperoleh persamaan ukuran sampel
yang harus diambil sebagai berikut:

N σ 2k
n= (5.15)
N D + σ 2k

2 2
dimana σ k ditaksir dengan s k , dan

δ2 (5.16)
D= 2
4N
atau apabila menggunakan kita mengambil nilai pengali dari simpangan baku
taksirannya adalah z α , yang merupakan pendekatan dari distribusi normal baku
2

dengan melibatkan resiko kekeliruan sebesar α, maka nilai D berubah menjadi :

δ2 (5.17)
D=
(z α
2
N )
2

Contoh:
Dengan menggunakan data pada tabel 5.1 kembali, anggap sebagai data yang
diperoleh merupakan data survai pendahuluan. Ingin diketahui berapa banyak sampel
yang harus diambil untuk menaksir total pengeluaran masyarakat untuk keperluan
rumah tangganya, τ, dengan batas kekeliruan 3000 ribu rupiah. Dimisalkan bahwa
terdapat 2000 penduduk di kota tersebut.

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͻͲ
Jawab
2
Dengan menggunakan persamaan (5.15) dan menaksir σ k dengan
n
¦ (y i − ym i )
2
248085,668
s 2k = i =1 = = 13057,14
n −1 20 − 1

dan

D= =
(3000 )2
δ2
= 225
4 N 2 4 (100 )2
maka diperoleh

N σ 2k 100 (13057 ,14 )


n= = = 36 ,72 ≈ 37
N D + σ 2k 100 (225 ) + 13057 ,14

V.8 Taksiran Proporsi Populasi

Dimisalkan bahwa seorang peneliti akan menaksir proporsi dari populasi,


maka penaksir terbaik dari proporsi populasi, π, adalah proporsi sampel, π̂ atau p.
Misal ai merupakan jumlah total dari elemen-elemen dalam klaster ke-i yang
memilkiki karakteristik yang dimaksud. Maka proporsi karakteristik tersebut dari
elemen-elemen dalam sampel yang berukuran n klaster adalah:
n
¦ ai
i =1
p= m (5.18)
¦ mi
i =1

dimana mi menunjukkan banyaknya elemen di dalam klaster ke-i, i = 1, 2, .., n.


Catatan bahwa p memiliki bentuk yang sama dengan y (lihat persmaan ??), kecuali yi
diganti dengan ai. Taksiran varians dari p serupa dengan y .

Taksiran varians dari p :

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͻͳ
n

§ N −n · ¦ (ai − p mi )2
V̂ ( p ) = ¨¨ ¸
2 ¸
i =1
(5.19)
© N nM ¹ n−1

Batas-batas Kekeliruan (Bound of The error) dari taksiran :


n

·¦ i
(a − p mi )2
§ N − n i =1
δ = Zα V̂ ( p ) = Z α ¨ ¸
¨ N nM2 ¸ (5.20)
2 2
© ¹ n−1

dimana Z α diperoleh dari tabel distribusi normal baku dengan taraf signifikansi α.
2

Apabila kita mengambil nilai α = 5%, maka diperoleh nilai Z α mendekati 2 , maka
2

persamaan di atas menjadi :


n

·¦ i
(a − p mi )2
§ N −n
δ=2 ¨ ¸ i =1
(5.21)
¨ N nM 2 ¸ n −1
© ¹

persamaan varians di atas merupakan penaksir yang baik hanya jika ukuran sampel,
n,besar, katakanlah n • 20. Jika m1 = m2 = … = mN , maka p merupakan penaksir tak
bias untuk π, dan V̂ ( p ) merupakan penaksir yang tak bias dari varians p yang
sebenarnya untuk setiap ukuran sampel.

Contoh :
Sebagai lanjutan dari contoh sebelumnya, kepada masyarakat ditanyakan pula apakah
masyarakat di kota tersebut menempati rumah sewaan atau rumah milik sendiri.
Hasilnya disajikan dalam tabel 5.2 . Gunakan data pada tabel tersebut untuk menaksir
proprsi penduduk yang tinggal di rumah sewaan.

Tabel 5.2
Banyaknya Banyaknya
Banyaknya Banyaknya
Rumah Rumah
Klaster Penyewa Klaster Penyewa
Tangga Tangga
( ai ) ( ai )
( mi ) ( mi )
1 55 25 11 73 32
2 60 36 12 64 22
3 63 26 13 69 19

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͻʹ
4 58 21 14 58 15
5 71 39 15 63 26
6 78 30 16 75 40
7 69 20 17 78 35
8 58 25 18 51 17
9 52 24 19 67 22
10 71 30 20 70 20

Dari data di atas diperoleh beberapa besaran sebagai berikut:


20 20 20 20 20
¦ mi = 1303 ¦ mi2 = 86171 ¦ ai = 524 ¦ ai2 = 14728 ¦ ai mi = 34742
i =1 i =1 i =1 i =1 i =1

Penyelesaian:
Taksiran terbaik dari populasi penyewa adalah p, ditunjukkan dalam persmaan 5.18,
yaitu :
n
¦ ai 524
i =1
p= m
= = 0 ,40
1303
¦ mi
i =1

untuk menaksir varians p. kita harus menghitung:


n n n
¦ (ai − p mi ) 2
= ¦ a i2 −2 p ¦ ai mi + p ¦ mi2 2

i =1 i =1 i =1

= 14728 − 2 (0 ,40 )(34742 ) + (0 ,40 )2 (86171)


= 720 ,982
Karena M tidak diketahui, maka sebagaimana yang telah dijelaskan sebelumnya, M
dapat ditaksir dengan m sebagai berikut :
20
¦ mi 1303
m = i =1 = = 65,15
n 20

Apabila dimisalkan bahwa total Rukun Warga yang ada di daerah tersebut adalah
sebanyak 100 (N = 100), maka varians dari proporsi penyewa adalah:

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͻ͵
n

§
N −n ·
¦ (ai − p mi )2
V̂ ( y ) = ¨¨ ¸ i =1
2 ¸
© NnM ¹ n−1
§ 100 − 20 · 720 ,982
=¨ ¸
¨ (100 )(20 )(65 ,15 )2 ¸ 20 − 1
© ¹
= 0 ,000358

Dengan demikian, dengan kepercayaan mendekati 95%, taksiran interval untuk


proporsi penyewa adalah :

p ± 2 V̂ ( p ) = 0 ,40 ± 2 0 ,000358 = 0 ,40 ± 0 ,0378


Jadi taksiran yang paling baik dari proporsi penyewa masyarakat di kota tersebut
adalah 0,40 dan kekeliruan taksiran harus kurang dari 0,0378 dengan peluang
mendekati 0,95.

V.9 Menentukan ukuran sampel untuk menaksir proporsi

Taksiran dari proporsi populasi, π, dengan batas δ unit dari kekeliruan taksiran
dinyatakan dengan
2 V ( p) = δ

Persamaan di atas dapat menjadi solusi untuk menentukan besarnya sampel yang
harus diambil, n dan prosedur solusinya serupa dengan persamaan 5.15, yaitu:

N σ 2k (5.15)
n=
N D + σ 2k
2 2
dimana σ k ditaksir dengan s k ;
n
¦ (a i − p mi )2
i =1
s k2 =
n −1
dan
δ2 M 2
D= (5.16)
4

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͻͶ
atau apabila menggunakan kita mengambil nilai pengali dari simpangan baku
taksirannya adalah z α , yang merupakan pendekatan dari distribusi normal baku
2

dengan melibatkan resiko kekeliruan sebesar α, maka nilai D berubah menjadi :

δ2 M 2
D=
(z )
α
2
2 (5.17)

Contoh:
Dimisalkan bahwa data pada tabel 5.2 dianggap sudah kadaluarsa. Selanjutnya
diperlukan suatu penelitian baru yang bertujuan untuk menaksir proporsi penduduk
yang menyewa rumah. Berapa banyak sampel yang harus diambil untuk memberikan
taksiran tersebut dengan batas 0,03 dari kekeliruan penaksiran?

Penyelesaian:
2
Taksiran terbaik dari σ k adalah yang dihitung dengan menggunakan tabel 5.2
sebagai berikut:
n
¦ (ai − p mi )2 720,982
i =1
s k2 = = = 37 ,946
n −1 20 − 1

Karena M tidak diketahui, maka sebagaimana yang telah dijelaskan sebelumnya, M


dapat ditaksir dengan m sebagai berikut :
20
¦ mi 1303
m = i =1 = = 65,15
n 20
selanjutnya dengan mengambil nilai α = 5%, diperoleh nilai z α = 1,96 , maka
2

diperoleh nilai D sebagai berikut:

δ2 m 2 (0,03)2 (65,15)2
D=
(z ) α
2
2
=
(1,96)2
= 0,994

sehingga diperoleh ukuran sampel minimal yang harus diambil adalah:

n=
N σ 2k
=
(100)(37,946) = 27 ,62 ≈ 28
N D + σ 2k (100)(0,994) + (37,946)

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͻͷ
Dengan demikian, klaster yang harus diambil adalah sebanyak 28. Perhatikan bahwa
nilai 28 menunjukkan banyaknya sampel minimal yang harus di ambil. Oleh karena
itu, pengambilan sampel (klaster) yang lebih dari nilai tersebut tidak menjadi masalah
selama tidak ada faktor lain yang menjadi pertimbangan ukuran sampel seperti
masalah biaya, tenaga, waktu, dan lain sebagainya.

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͻ͸
BAB VI
SAMPLING KLASTER DUA TAHAP

VI.1 Pendahuluan

Sampling klaster dua tahap merupakan perluasan dari konsep klaster sampling.
Sebagaimana yang telah dibahas pada bab sebelumnya mengenai sampling klaster
secara umum, ternyata klaster pada umumnya merupakan suatu kumpulan dari
elemen-elemen, seperti blok-blok rumah tangga. Sebuah klaster sering mengandung
begitu banyak elemen. Oleh karena itu, diperlukan suatu pengelompokkan kembali
dari elemen-elemen klaster yang telah terbentuk tersebut. Proses pengelompokkan
kedua dari klaster-klater pertama yang terbentuk itu menghasilkan suatu prosedur
sampling klaster dua tahap. Sebagai contohnya adalah apabila akan diteliti pendapat
masyarakat di suatu daerah, dalam hal ini kecamatan merupakan bentuk klaster yang
pertama. Akan tetapi dikarenakan adanya keterbatasan dana penelitian dan didukung
pula poleh suatu kondisi dimana elemen-elemen dalam kecamatan sangat heterogen
yang merupakan imbas dari heterogennya tiap desa, maka desa-desa dari tiap klaster
dijadikan sebagai klaster-kalster dari klaster pertama (kecamatan). Prosedur pemilihan
untuk klaster tahap dua dilakukan sama halnya seperti prosedur pemilihan pada
sampling klaster satu tahap. Oleh karena itu, di sini hanya akan terpilih desa-desa dari
klaster pertama yang terpilih saja. Sehingga hal akan berakibat pada penghematan
biaya apabila dibandingkan dengan memilih desa langsung sebagai klaster tahap
pertama. Hal ini dapat dipahami karena jika desa langsung dijadikan sebagai klaster
pertama, maka muncul suatu kemungkinan bahwa desa-desa yang terpilih sangat
berjauhan yang berakibat pada peningkatan biaya survai atau biaya pengambilan data.

Definisi VI.1
Sampling klaster dua tahap merupakan suatu sampel yang diperoleh dengan diawali
pemilihan sampel peluang dari klaster-klaster pertama yang kemudian memilih
sampel peluang dari elemen-elemen masing-masing klaster yang telah dijadikan
sampel pada tahap sebelumnya.

Pembahasan dalam buku ini hanya akan terbatas pada pemilihan masing-masing tahap
secara sampling acak sederhana. Sebagai contoh, suatu survai nasional terhadap

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͻ͹
mahasiswa-mahasiswa di universitas yang ada di Indonesia mengenai opini mereka
terhadap pemilihan presiden secara langsung. Klaster-klaster dalam hal ini universitas
dapat dipilih secara sampling acak sederhana. Apabila prosedurnya sampling klaster
satu tahap, maka seluruh mahasiswa dari universitas yang tepilih dijadikan sebagai
objek yang diteliti.

VI. 2 Cara Pembuatan Sampel Klaster Dua Tahap

Masalah pertama dalam pemilihan sampel klaster dua tahap adalah pemilihan
klaster yang tepat. Terdapat dua kondisi yang diperlukan, yaitu:
1. Kedekatan geografis dari elemen-elemen dalam klaster
2. Ukuran klaster yang sesuai bagi administer/peneliti
Pemilihan klaster yang sesuai juga tergantung pada apakah diinginkan untuk
membuat sampel sedikit klaster dengan elemen-elemen dalam kalster yang banyak
atau sampel banyak klaster dengan elemen-elemen dalam klasternya yang sedikit.
Akhirnya, pemilihan tergantung pada biaya yang akan dikeluarkan. Klaster-klaster
yang besar cenderung memiliki elemen-elemen yang heterogen, dan karenanya suatu
sampel yang besar diharuskan untuk tiap-tiap klaster agar diperoleh taksiran yang
akurat dari parameter populasi. Sebaliknya, kalster-klaster yang kecil sering
mengandung elemen-elemen yang relatif homogen, dalam hal keakuratan informasi
mengenai karakteristik dari sebuah klaster, dapat diperoleh dengan memilih suatu
sampel yang kecil dari masing-masing klaster.

VI. 3 Taksiran Tak Bias Rata-rata Populasi dan Total Populasi

Sebagaimana yang telah dibahas pada bab sebelumnya, diperlukan suatu


taksiran untuiik rata-rata populasi, μ, atau total populasi, τ dan menempatkan batas-
batas kekeliruan (bound of error) dari taksiran, δ. Berikut adalah notasi-notasi yang
akan digunakan:
N = Banyaknya klaster dalam populasi
n = Banyaknya klaster yang terpilih secara sampel acak sederhana
Mi = Banyaknya elemen dalam klaster ke-i
mi = Banyaknya elemen yang terpilih dalam secara sampel acak sederhana dari

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͻͺ
kklaster ke-i
N
M = ¦Mi = Banyaknya elemen dalam populasi
i =1

M
M = = Rata-rata ukuran klaster populasi
N

y ij = Observasi ke-j dalam sampel dari klaster ke-i


mi
1
yi =
mi
¦ yij = rata-rata sampel untuk klaster ke-i
j =1

Dalam pembentukan suatu taksiran rata-rata populasi, μ, dapat dilakukan


dengan cara yang serupa dengan bahasan dari bab V mengenai sampling klaster satu
tahap. Persamaan (5.6) menunjukkan :
n
N
n
¦ yi
i =1

merupakan suatu penaksir yang tak bias untuk τ. Dengan demikian jika persamaan di
atas dibagi dengan M, diperoleh:
n
N
Mn
¦ yi
i =1

menjadi suatu peaksir yang tak bias untuk μ. Tetapi penaksir tersebut tidak dapat
dievaluasi karena tidak lagi diketahui total klaster, yi. Bagaimanapun juga, yi dapat
ditaksir dengan M i y i , dan dalam penggantian M i y i untuk yi, dimiliki suatu taksiran
tak bias untuk μ, yang dapat dihitung dari data sampel.

Penaksir tak bias untuk rata-rata populasi, μ :


n

§N·
¦ M i yi
i =1
ˆ =¨ ¸
μ (6.1)
©M ¹ n

pengambilannya secara sampling acak sederhana untuk setiap tahap.

Taksiran varians dari μ :

§ N −n ·§ 1 · 2 1 n
§ M − mi · § s i2 ·
V̂ (μ
ˆ)= ¨
N
¸¨ 2
¸ sb +
nNM 2
¦ M i2 ¨¨ i ¸¨
¸¨ m
¸
¸
(6.2)
© ¹ © nM ¹ i =1 © Mi ¹© i ¹

dengan

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͻͻ
n
¦ (M i yi − Mμˆ )
2

i =1
s b2 = (6.3)
n −1

dan
n
¦ (y ij − yi )2
i =1
s i2 = i = 1, 2, ..., n (6.4)
mi − 1

Batas kekeliruan taksiran:

δ = 2 V̂ (μ
ˆ) (6.5)
sebagaimana yang telah dibahas pada bab sebelumnya bahwa nilai pengali 2 diperoleh
dari pendekatan nilai tabel Z α untuk α = 5 %.
2

Taksiran μ̂ yang ditunjukkan pada persamaan (6.1) tergantung pada M yaitu


banyaknya elemen di dalam populasi. Sebuah metoda untuk menaksir μ ketika M
tidak diketahui akan dibahas pada bagian selanjutnya.
Sebagai catatan bahwa s i2 merupakan varians sampel untk sampel yang
terpilih pada klaster ke-i.
Penaksir tak bias dari total populasi dapat diperoleh dengan cara mengalikan
nilai dari taksiran tak bias rata-rata populasi dengan banyaknya elemen dalam
populasi seperti halnya penggunaan pada sampling acak sederhana. Dengan demikian,
Mμ̂ merupakan penaksir yang tak bias dari τ untuk sampling klaster dua tahap.

Taksiran Total Populasi, τ :


n
¦ M i yi
i =1
ˆτ = Mμ
ˆ = N
n

dengan mengasumsikan sampling acak sederhana pada tiap tahap.

Taksiran Varians dari τ̂ :


V̂ (ˆτ) = M 2V̂ (μ
ˆ)

§ N − n · §¨ N
2 · 2 N n
§ M − mi · § s i2 ·
=¨ ¸
© N ¹ ¨© n
¸ sb +
¸ n
¦ M i2 ¨¨ i ¸¨
¸¨ m
¸
¸
¹ i =1 © Mi ¹© i ¹

dengan s b2 telah dibahas pada persamaan (6.3) dan s i2 pada persamaan (6.4)

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͲͲ
Batas Kekeliruan Taksiran

δ = 2 V̂ (ˆτ)

= 2 M 2V̂ (μ
ˆ)

VI. 4 Penaksir Rasio dari Rata-rata Populasi

Penaksir μ̂ yang diberikan pada persamaan (6.1) bergantung pada jumlah total dari
elemen-elemen dalam populasi, M. Seringkali M tidak diketahui. Jika kondisinya
seperti itu, maka harus ditaksir dari data sampel. Penaksir untuk M diperoleh dengan
n
mengalikan rata-rata ukuran klaster, ¦Mi n , dengan jumlah klaster dalam populasi,
i =1

N. Proses seperti merupakan suatu penaksir rasio, dilambangkan dengan μ̂ r , karena


baik itu pembilang maupun penyebut keduanya merupakan variabel acak.

Taksiran Rasio Rata-rata Populasi μ:


m
¦ M i yi
i =1
ˆr =
μ n
¦Mi
i =1

Taksiran Varians dari μ̂ r :

§ N −n ·§ 1 · 2 1 n
§ M −m · § s i2 ·
V̂ (μ
ˆr)= ¨
© N
¸¨ 2
¹ © nM ¹
¸ sτ +
nNM 2
¦ M i2 ¨¨ iM i i ¸¨
¸¨ m
¸
¸
i =1 © ¹© i ¹

dengan
n
¦ M i2 ( y i − μˆ r )2
i =1
s τ2 =
n −1

dan
mi

¦ (y ij − yi )2
i =1
s i2 = i = 1, 2 , ..., n
mi − 1

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͲͳ
Batas Kekeliruan Taksiran:

δ = 2 V̂ (μ
ˆr)

Taksiran μ̂ r adalah bias, tapi bias tersebut dapat diabaikan jika n besar.

Taksiran Proporsi Populasi


Suatu permasalaha dalam menaksir suatu proporsi populasi, π, seperti proporsi
masyarakat yang menyukai produk tertentu. Suatu penaksir π dapat diperoleh dengan
menggunakan μ̂ (pada persamaan 6.1), atau μ̂ r sebagaimana yang diberikan pada
persamaan (6.9), dan dengan mengambil nilai yij = 1 atau 0 yang bergantung pada
kondisi apakah elemen ke-j dalam klaster ke-i termasuk ke dalam kategori yang
dimaksud atau tidak.
Oleh karena M selalu tidak diketahui, maka dibuat formula untk menaksir π dengan
menggunakan suatu taksiran rasio yang sejalan dengan μ̂ r yang diberikan pada
persamaan (6.9). Misalkan p merupakan proporsi dari elemen-elemen yang diambil
sebagai sampel dari klaster i yang termasuk pada kategori yang dimaksud.

Penaksir Proporsi Populasi π :


n
¦ M i p̂ i
i =1
p= n
¦Mi
i =1

Taksiran varians π :

§ N − n · §¨ 1 · 2 § M i − mi · § pi qi ·
n
V̂ ( p ) = ¨ ¸ ¸ si + 1 ¦ M i2 ¨¨ ¸¨ ¸
© N ¹ ¨© n M 2 ¸ nNM 2 ¸ ¨ m −1 ¸
¹ i =1 © Mi ¹© i ¹

dengan
n
¦ M i2 ( pi − p )2
i =1
s r2 =
n −1

dan
q i = 1 − pi

Batas Kekeliruan Taksiran:

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͲʹ
δ = 2 V̂ ( p )

VI. 6 Sampling Klaster Berukuran Sama

Dimisalkan bahwa masing-masing klaster mengandung M elemen, yaitu:

M1 = M2 = … = MN = M
Dalam kasus ini, merupakan hal yang wajar apabila sampel yang diambil pun
memiliki ukuran yang sama untuk tiap klaster, yaitu :
m1 = m2 = … = mN = m
Di bawah kondisi seperti ini, persamaan (6.1) menjadi:
n

§N·
¦ M i yi
i =1
ˆ =¨ ¸
μ
©M ¹ n
n
M ¦ yi
§ N · i =1
=¨ ¸
© NM ¹ n
1 n
= ¦ yi
n i =1

yang ekivalen dengan rata-rata sampel secara keseluruhan


n m
1
ˆ =
μ
nm
¦ ¦ y ij
i =1 j =1

dimana yij merupakan ukuran ke – j dalam klaster ke-i. Kondisi seperti ini dapat
terjadi dalam sampling produk-produk yang berbentuk paket (sebagai contohnya
masing-masing klaster terdiri atas 1 lusin / 24 kaleng sayuran) atau dalam sampling
barang-barang manufacture.
Persamaan (6.2) menjadi:
MSB § 1 · MSW
V̂ (μ
ˆ ) = (1 − f 1 ) + (1 − f 2 )¨ ¸
nm ©N¹ m

dimana f 1 = n N , f 2 = m M

m n
MSB =
n − 1 i =1
¦
( y i − μˆ )2

dan

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͲ͵
n m
¦ ¦ (y ij − y i )2
1
MSW =
n(m − 1) i =1 j =1
n
1
=
n
¦ s i2
i =1

MSB (Between-Claster Mean Square) merupakan rata-rata kuadrat antar klaster dan
MSW (Within-Claster Mean Square) rata-rata kuadrat dalam klaster.
Dari persamaan 6.19 di atas, dapat dibuat suatu rangkaian observasi yang penting
pada karakteristikdari sampling klaster dua tahap sebgai beikut:
MSW
1. Jika N besar, V̂ (μˆ ) = dan hanya bergantung pada rata-rata klaster. Dengan
nm

demikian, dapat dihasilkan suatu taksiran yang baik dari varians μ̂ sekalipun
bentuk s i2 merpakan taksiran yang kurang baik untuk varians dalam klaster.
Hal ini bisa terjadi, sebagai contohnya, jika sampling sistematik digunakan
dalam klaster-klaster.
2. Jika m = M (atau f2 = 1), maka samping klaster dua tahap dikurangi menjadi
samping klaster satu tahap, sebagaimana yang telah dibahas pada bab 5.
3. Jika n = N, maka
MSW
V̂ (μ
ˆ ) = (1 − f 2 )
nm

yang merupakan taksiran varians yang diperoleh dalam suatu sampel acak
stratifikasi dengan n = N strata dan m observasi dari masing-masing strata.

Oleh karena itu, terlihat bahwa m mendekati M , sampling klaster dua tahap
memiliki proses yang sama dengan sampling kalster satu tahap. Ketika n
mendekati N, sampling klaster dua tahap berkelakuan seperti sampling acak
stratifikasi. Jika elemen-elemen di dalam klaster bersifat heterogen, maka harus
dijadikan sebagai sampel dalam penelitian.

Ketika N besar, taksiran varians


1
V̂ (μ
ˆ)= MSB
nm

akan menaksir varian yang sebenarnya;


1 ª 2 σw º
2
V̂ (μ
ˆ)= «σ b + »
n «¬ m »¼

dengan

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͲͶ
σ b2 = varians di antara rata-rata klaster

dan
σ 2w = varians di antara elemen-elemen dalam klaster-klaster.

Karena MSB/m menaksir σ b2 + σ 2w /m , dan MSW menaksir σ 2w , maka jika suatu


pola:
1
[MSB − MSW ]
m

akan menaksir σ b2 . Taksiran secara terpisah dari σ b2 dan σ 2w diperlukan untuk


perhitungan ukuran sampel.
Sebagaimana dalam kasus sampling acak stratifikasi, selanjutnya akan dicari
ukuran sampel m dan n yang akan meminimalkan V (μ̂ ) untuk biaya tertentu atau
meminimalkan total biaya sampling untuk V (μ̂ ) tertentu. Dimisalkan bahwa biaya
dari masing-masing klaster adalah c1 dan biaya dari masing-masing elemen di
dalam klaster adalah c2. Maka biaya total adalah:
c = nc1 + nmc2
Nilai m yang akan meminimumkan V (μ̂ ) untuk biaya tertentu, atau meminimalkan
c untk varians tertentu, diberikan melalui persamaan berikut:

σ 2w c1
m =
σ b2 c 2

Setelah m ditentukan, n diperoleh dari persamaan (6.21) jika V (μ̂ ) tertentu nilainya
atau dari persamaan (6.23) jika c tertentu. Sebagai catatan bahwa m meningkat
nilainya jika σ 2w meningkat dan m akan menurun jika σ b2 meningkat. Dengan
demikian, lebih banyak elemen-elemen dalam klaster yang dijadikan sebagai
sampel (dan karenanya, akan sedikit klaster yang akan dijadikan sebagai sampel)
sebagaimana σ 2w yang lebih besar bila dibandingkan dengan σ b2 .

VI. 7 Sampling Klaster Dua Tahap dengan Peluang Sebanding Ukuran

Oleh karena banyaknya elemen di dalam sebuah klaster berbeda-beda, sebuah


teknik yang seringkali menguntungkan untuk digunakan adalah mengambil
kklaster-klaster dengan peluang yang sebanding dengan ukurannya. Biasanya,
sampling psu digunakan pada tahap pertama dari prosedur sampling klaster dua

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͲͷ
tahap karena elemen-elemen dalam klaster cenderung memiliki ukuran yang sama.
Oleh karena itu, akan diberikan taksiran dari μ dan τ untuk sampling klaser dua
tahap dimana tahap pertama dari samplingnya mempunyai peluang yang
sebanding dengan ukurannya.

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͲ͸
TINJAUAN MATA KULIAH

BAB VIII
Klasifiklasi Sampling

VIII.1 Sampling Peluang

Ditinjau dari sudut kesempatan semua unit sampling untuk terpilih menjadi
anggota sampel, maka sampling terbagi dalam dua bagian yaitu sampling random dan
sampling nonrandom, atau disebut juga sampling peluang dan sampling nonpeluang.
Suatu proses pengambilan sampel dikatakan random bila semua unit sampling
mempunyai peluang untuk bisa terpilih menjadi anggota sampel. Apabila dalam
proses memilih satuan sampling dilibatkan unsur peluang sedemikian rupa sehingga
besarnya peluang setiap satuan sampling untuk terpilih diketahui besarnya, maka
sampling tersebut digolongkan ke dalam sampling peluang.
Pada sampling peluang, peluang tiap elemen untuk terpilih sebegai sampel
harus diketahui. Untuk tujuan ini, maka daftar elemen untuk memilih sampel
(kerangka sampling) harus tersedia. Ke dalam sampling peluang dapat digolongkan
beberapa teknik pengambilan sampel. Selain bagaimana teknik pengambilan sampel
yang harus dikerjakan agar setiap unit mempunyai peluang terambil menjadi anggota
sampel, dalam sampling peluang juga dibahas berapa banyak unit sampling yang
harus diambil.

a. Simpel Random Sampling (SRS)

Sampling Acak Sederhana ini merupakan suatu proses memilih satuan sampling
dari populasi sedemikian rupa sehingga setiap satuan sampling dalam populasi
mempunyai peluang yang sama besar untuk terpilih ke dalam sampel dan peluang itu
diketahui sebelum pemilihan dilakukan.Terdapat dua cara dalam pengambilan
sampling acak sederhana ini, yaitu dengan pengembalian (with replacement), yang
mana dalam proses ini adanya kemungkinan bahwa suatu unit akan terpilih lebih dari
satu kali dan tanpa pengembalian (without replacement) yang mana semua unit yang
terpilih tidak akan ada yang sama.

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͲͻ
Proses sampling dengan Sampling Acak Sederhana digunakan apabila
memenuhi beberapa kondisi sebagai berikut :
- Variabel yang akan diteliti keadaannya relatif homogen dan tersebar merata
di seluruh populasi.
- Apabila bisa disusun secara lengkap kerangka sampling yang menyangkut
setiap satuan pengamatan yang ada dalam populasi.

b. Systematic Sampling (SS)

Suatu proses memilih dikatakan sampling sistematik apabila dalam pemilihan


itu dilakukan pemilihan sistematik setelah terpilih bilangan acak, dengan syarat
bahwa peluang terpilihnya 1 N .
Sampling sistematik digunakan apabila :
1. Bisa disusun kerangka sampling yang lengkap
2. Keadaan variabel yang sedang diteliti relatif homogen dan tersebar merata
di seluruh populasi

c. Stratified Random Sampling (StRS)

Sampling ini dilakukan apabila dalam keadaan tertentu Sampling Acak


Sederhana kurang baik untuk digunakan karena akan memberikan presisi suatu
taksiran yang rendah. Sampling Acak Sederhana akan memberikan presisi yang
tinggi apabila karakteristk populasi bersifat homogen. Akan tetapi jika keadaan
populasi relative heterogen, maka kita akan menggunakan StRS. pembentukan strata
atau stratifikasi dimaksudkan untuk meningkatkan presisi suatu taksiran. Menigkatnya
suatu presisi akan bergantung kepada derajat homogenitas yang dicapai dalam strata,
atau dapat pula dikatakan bergantung pada seberapa besar variabilitas karakteristik
yang akan diukur direfleksikan diantara strata. Hal ini tentu saja pada gilirannya
bergantung kepada efektifitas pembentukan strata.
Dalam membentuk batas-batas stratum, perlu mengumpulkan semua informasi
yang dapat menolong mengklasifikasikan unit-unit menjadi kelompok-kelompok
populasi yang satu sama lain berbeda. Data masa lalu, intuisi, pertimbangan para ahli
di lapangan, atau kejelian seseorang dalam menerka dengan baik, semuanya bisa

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͳͲ
digunakan secara efektif dalam membentuk atau membedakan strata satu dengan yang
lainnya.
Apabila secara cermat strata sudah terbentuk, maka sampel untuk masing-
masing stratum dipilih melalui metode Sampling Acak Sederhana. Karena dilakukan
dengan metode Sampling Acak Sederhana, maka tentunya harus tersedia kerangka
sampling dalam setiap stratum.

d. Cluster Sampling (CS)

Cluster sampling dilakukan apabila peneliti ingin menekan biaya sampling


atau jika kerangka sampling yang memuat elemen/atau unit observasi tidak tersedia.
Sampling klaster adalah sampling dimana unit samplingnya adalah kumpulan atau
kelompok (cluster) elemen (unit observasi).
Proses pegambilan sampling klaster dilakukan dengan memperhatikan
kerangka sampling yang berisikan daftar klaster. Pengambilan sampel kemudian
dilakukan dengan mengambil secara acak klaster-klaster. Unit sampling yang
berisikan klaster-klaster dinamakan unit sampling utama (primary sampling unit)
disingkat USU. Apabila semua unit observasi dalam USU menjadi anggota sampel
maka dikatakan bahwa proses pengambilan sampel dilakukan dengan sampling
klaster satu tahap. Namun apabila USU dibagi lagi ke dalam unit yang lebih kecil,
maka terdapat unit sampling ke dua (secondary sampling unit) disingkat USD.
Apabila semua unit obervasi (elemen) dari USD menjadi anggota sampel, maka
dikatakan proses pengambilan sampel dilakukan dengan sampling klaster dua
tahap, demikian seterusnya.

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͳͳ
TINJAUAN MATA KULIAH

BAB VII
RASIO, REGRESI, DAN SELISIH PENAKSIRAN

VII. 1 PENDAHULUAN

Penaksiran rata-rata dan total populasi dalam bab-bab sebelumnya didasari


dari sebuah sampel respon pengukuran, y1, y2, y3,...yn , seperti dengan simple random
sampling dan stratified random sampling. Kadang-kadang variabel-variabel lain
berkorelasi sangat dekat dengan respon y. Dengan mengukur y dan satu atau lebih
variabel-variabel tambahan, kita bisa mendapatkan informasi tambahan untuk
menaksir rata-rata populasi. Anda mungkin mengenal penggunaan variabel-variabel
tambahan untuk menaksir rata-rata dari sebuah respon y. Ini merupakan dasar dari
konsep korelasi dan rata-rata, untuk pengembangan dari prediksi persamaan relasi y
dan x dengan metode kuadrat terkecil. Topik ini umumnya terdapat di buku
pengenalan statistika ( Mendenhall, 1987, Bab 10 ).
Pada bab-bab sebelumnya diperlihatkan penaksir-penaksir sederhana dari
parameter-parameter dengan memanfaatkan respon pengukuran, y1, y2, y3,...yn ;
bagaimana pun, penekanan utamanya didasarkan kepada desain sampel survey (
simple dan stratified sampling ). Sebaliknya, pada bab ini akan dijelaskan tiga cara
baru dari penaksiran berdasarkan penggunaan variabel tambahan x. Metode-metode
tersebut yaitu, rasio, regresi, dan selisih estimasi. Ketiganya membutuhkan dua
variabel pengukuran, x dan y , dalam setiap elemen sampel. Macam-macam desain
sampling bisa menggunakan ketiga metode di atas, tapi kita akan membicarakan
simple random sampling. Penaksiran rasio akan digunakan dalam stratified random
sampling untuk menunjukkan ide dasar bagaimana ketiga metode ini digunakan.

VII.2 SURVEY-SURVEY YANG MEMBUTUHKAN PENGGUNAAN


PENAKSIR RASIO

Penaksiran yang efisien dari total populasi kadang-kadang membutuhkan


penggunaan variabel tambahan. Kita ilustrasikan penggunaan dari rasio penaksir
dalam suatu situasi berikut ini. Harga yang dibayarkan untuk jeruk dalam pengiriman

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͳͷ
yang besar berdasarkan dari isi gula dari berat pengiriman. Isi gula yang tepat tidak
bisa ditentukan sebelum pembelian dan penyaringan jus buah dari keseluruhan beban;
namun, bagaimana pun hal tersebut bisa kita taksir. Satu metode untuk menaksir hal
diatas yaitu pertama kali kita tentukan rata-rata isi gula dalam tiap jeruk, μ y ,
kemudian mengalikannya dengan jumlah jeruk N dalam muatan. Kemudian kita
ambil sampel n jeruk secara acak dari muatan untuk menentukan isi gula y untuk
masing-masing jeruk. Rata-rata dari pengukuran , y1, y2, y3,...yn , akan menaksir μ y
; N y akan menaksir total isi gula dalam muatan, IJy. Sayangnya, metode ini tidak
mungkin dilakukan karena terlalu membutuhkan banyak waktu dan biaya dalam
menentukan N (yaitu dalam menentukan jumlah jeruk dalam muatan).
Kita dapat menghindari untuk menghitung N dengan mencatat beberapa fakta.
Pertama, isi gula dalam tiap jeruk , y , berkorelasi cukup dekat dengan berat dari
jeruk, x; kedua, rasio dari total gula IJy dengan total berat dari muatan IJx sama dengan
rasio dari rata-rata isi gula dalam tiap jeruk μ y dengan rata – rata berat jeruk μ x. Maka:
μ y Nμ y τ y
= =
μ x Nμ x τ x
untuk mengetahui total isi gula dari muatan, kita mendapatkan
μy
τy = (τ x )
μx

Kita dapat menaksir μ y dan μ x dengan menggunakan y dan x , rata-rata dari isi gula
dan berat jeruk dari sampel n jeruk. Kita juga dapat mengukur IJx, yang merupakan
total berat dari jeruk dalam muatan truk. Kemudian penaksiran rasio dari total isi gula
IJy yaitu:
∧ y
τy = (τ x )
x
atau, sama dengan ( mengalikan pembilang dan penyebut dengan n ).
n

∧y
¦y i
τ y = (τ x ) = i =1
n
(τ x )
x
¦x
i =1
i

Dalam kasus ini jumlah elemen populasi, N, tidak diketahui, dan karena itu
kita tidak dapat menggunakan penaksir sederhana N y untuk menaksir total populasi
IJy . Jadi, penaksir rasio diperlukan untuk menyelesaikan objek penaksiran. Bagaimana

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͳ͸
pun, jika N diketahui, kita punya pilihan apakah akan menggunakan penaksir N y
atau penaksir rasio untuk menaksir IJy. Jika y dan x kerkorelasi cukup tinggi, berarti x
memberikan kontribusi untuk memprediksi y, penaksir rasio harus lebih baik dari
N y , yang semata-mata tergantung pada y .
Dalam penjumlahan untuk mendapatkan total populasi IJy, sering ada paramete-
parameter lain yang terlibat. Kita mungkin akan menaksir rata-rata populasi μ y,
dengan menggunakan prosedur penaksiran rasio. Sebagai contoh, misalkan kita akan
menaksir rata-rata isi gula dalam tiap jeruk dalam pengiriman yang berskala besar.
Kita akan menggunakan rata-rata sampel y untuk menaksir μ y. Bagaimana pun, jika y
dan x berkorelasi, penaksir rasio yang menggunakan informasi dari variabel pembantu
x sering kali memberikan penaksir yang lebih tepat untuk μ y.
Rasio populasi merupakan parameter lain yang mungkin terlibat sebagai faktor
koreksi. Sebagai contoh, asumsikan kita akan menaksir rasio dari penjualan mobil
untuk tiga bulan pertama dalam tahun ini dengan total penjualan di periode yang sama
di tahun yang lalu. Misalkan IJx merupakan total penjualan dalam tiga bulan pertama
di tahun yang lalu, sedangkan IJy total penjualan dalam periode yang sama di tahun ini.
Kita perhatikan dalam penaksiran rasio yaitu:
τy
R=
τx
Kosep dari penaksiran rasio di gunakan dalam analisis data untuk survey-
survey penting dan secara praktis digunakan oleh pemerintah, dunia bisnis, dan
peneliti di akademik. Sebagai contoh, indeks harga konsumen (IHK) sebenarnya
merupakan rasio dari harga-harga pembelian yang tetap dari barang-barang yang
konstan kualitas dan kuantitasnya untuk dua waktu. Sekarang ini, IHK merupakan
perbandingan harga hari ini dengan harga tahun 1967. IHK berdasarkan pada
pengumpulan data tiap bulan atau setiap beberapa bulan dari 24000 penetapan ( toko-
toko, rumah sakit-rumah sakit, dan lain-lain) yang dikumpulkan dari 85 kota di
seluruh negara. IHK digunakan untuk mengukur tingkat inflasi.
The Current Population Survey mendapatkan informasi pengangguran yang
menggambarkan tentang usia, jenis kelamin dan ras pengangguran, menggunakan
teknik penaksiran rasio. Sebagai contoh, jumlah rasio pengangguran ras kulit hitam
dengan yang sudah bekerja untuk area sampel tertentu bisa dikembangkan untuk
menghitung jumlah pengangguran ras kulit hitam di area yang lebih besar dengan cara

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͳ͹
mengalikan rasio sampel dengan jumlah orang ras kulit hitam yang bekerja di area
yang lebih besar yang dimaksudkan sebelumnya.
Index Retail Nielsen bisa menyediakan rasio dari rata-rata harga penjualan
untuk dua merek produk yang bersaing atau satu produk dalam dua waktu yang
berbeda. The SAMI bisa menyediakan rasio jumlah persediaan untuk dua merek yang
bersaing.
Peramalan sering menggunakan teknik penaksiran rasio. Sebagai contoh, rasio
dari total periode pertama penjualan di tahun yang sedang berjalan dengan periode
yang sama di tahun yang lalu, bisa dilakukan dengan cara mengalikan total penjualan
tahun kemarin dengan rasio, untuk menaksir total penjualan tahun ini. Cara yang
serupa juga bisa digunakan untuk pertumbuhan populasi manusia.
Dalam penelitian di akademik, ahli sosiologi menghitung rasio total anggaran
untuk makanan tiap bulannya dengan jumlah penghasilan per bulannya dari suatu
keluarga, atau rasio dari jumlah anak dengan total orang yang bertempat tinggal di
unit-unit rumah. Para peneliti medis dapat menghitung potensi relatif dari suatu obat
baru dengan melihat rasio dari rata-rata jumlah permintaan obat baru dengan yang
diperlukan untuk mendapatkan respon tertentu, dengan rata-rata jumlah dari obat yang
standar yang diperlukan untuk mendapatkan respon yang sama.
Seperti yang bisa anda lihat, kemunkinan untuk mengaplikasikan penaksiran
rasio sangant banyak dan tidak akan berkesudahan. Bagaimana pun, kita akan
menggeser penekanan kita ke cara mendapatkan penaksir μ y, IJy, dan R; dan kita akan
mengaplikasikannya dengan angka untuk masing-masing penaksir. Dalam
melakukannya nanti, sewaktu-waktu kita akan membandingkan penaksir yang
dijelaskan dengan hasil-hasil di bab-bab sebelumnya.

VII.3 PENAKSIRAN RASIO MENGGUNAKAN SIMPLE RANDOM


SAMPLING

Kita asumsikan bahwa sampel acak sederhana dengan ukuran n didapatkan


dari populasi terhingga dengan N anggota populasi. Kemudian, bagaimana kita
menaksir rata-rata populasi μ y, total populasi IJy, dan rasio populasi R, dengan
memanfaatkan informasi di sampel y dan variabel tambahan x?

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͳͺ
Penaksir dari rasio populasi R :

¦yi =1
i
r= n
(7.1)
¦x
i =1
i

Taksiran varian dari r :


§ n · n

∧ ¦ i ·¦
¨ y ¸ ( y i − rx i ) 2

¨
V (r ) = V ni =1 ¸ = § N − n ·§¨ 1 ¸ i =1
¸ ¨© nN ¸¹¨ μ 2
(7.2)
¨ ¸ n −1
¨ ¦ xi ¸ © i ¹
© i =1 ¹
Rentang kekeliruan penaksiran :
n

·¦
( y i − rxi ) 2

§ N − n ·§¨ 1 ¸ i =1
2 V (r ) = 2 ¨ ¸ 2 (7.3)
© nN ¹¨© μ i ¸
¹ n −1

[Jika rata-rata dari populasi x, ȝx tidak diketahui, kita gunakan x untuk
memperkirakan persamaan (6.2) dan (6.3).]

Contoh 7.1 Dalam sebuah survei yang menyelidiki tentang trend pada real estate,
seorang peneliti tertarik pada perubahan relatif selama lebih dari 2 tahun
dalam nilai perkiraan rumah pada sebuah komunitas yang khusus. Sampel
acak sederhana dengan n = 20 rumah dipilih dari N = 1000 rumah dalam
komunitas tersebut. Dari pencatatan pajak, peneliti mendapatkan nilai
perkiraan untuk tahun ini ( y ) dan nilai sebenarnya dari 2 tahun yang lalu
( x ) untuk tiap sampel dengan n = 20 rumah. Dia berharap untuk
memperkirakan R, perubahan relatif pada nilai perkiraan untuk N = 1000
rumah, dengan menggunakan informasi pada sampel.
Data dari survei real estate ditunjukkan pada tabel 7.1. Kita telah
menambahkan kolom xi2, yi2 dan xiyi , yang sangat penting untuk

menghitung V (r ) .

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͳͻ
Dengan menggunakan data pada tabel 7.1, taksirlah R, perubahan relatif
pada penilaian real estate selama periode 2 tahun yang diberikan. Cari
juga rentang kekeliruan penaksiran.
Pembahasan
Taksiran R dengan menggunakan data sampel diperoleh dengan
§ 20 ·
¨ ¦ yi ¸
nilai total sebenarnya dari 20 rumah
r = ¨ i20=1 ¸=
¨ ¸ nilai total dari 20 rumah 2 tahun yang lalu
¨¦x ¸
© i =1 ¹
dengan menggunakan tabel 6.1
164.7
r= = 1.07
154.5
Karena itu, kita menaksir bahwa nilai real estate telah naik kurang lebih 7
% selama 2 tahun periode pada daerah yang diteliti.

Tabel 7.1 Data dan perhitungan survei nilai real estate ( dalam $ 10,000 )
2 2
Rumah Nilai perkiraan 2 tahun Nilai sebenarnya xi yi xiyi
yang lalu ( xi ) ( yi )
1 6.7 7.1 44.88 50.41 47.57
2 8.2 8.4 67.24 70.56 83.88
3 7.9 8.2 62.41 67.24 74.78
4 6.4 6.9 40.96 47.01 44.16
5 8.3 8.4 68.89 70.56 69.72
6 7.2 7.9 51.84 62.41 56.88
7 6.0 6.5 36.00 42.25 39.00
8 7.4 7.6 54.76 57.76 56.24
9 8.1 8.9 65.61 79.21 72.09
10 9.3 9.9 86.49 98.01 92.07
11 8.2 9.1 67.24 82.81 74.62
12 6.8 7.3 46.24 53.29 49.64
13 7.4 7.8 54.76 60.84 57.72
14 7.5 8.3 56.25 68.89 62.25
15 8.3 8.9 68.89 79.21 73.87
16 9.1 9.6 82.21 92.16 87.36
17 8.6 8.7 73.96 75.69 74.82
18 7.9 8.8 62.41 77.44 69.52
19 6.3 7.0 39.69 49.00 44.10
20 8.9 9.4 79.21 88.36 83.66
Jumlah 154.5 164.7 1210.55 1373.71 1288.95

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳʹͲ
Rentang kesalahan penaksiran didapatkan dengan menggunakan persamaan
20
(7.3). Jalan singkat untuk menghitung ¦(y
i =1
i − rxi ) 2 adalah dengan

20 20 20 20

¦(y − rxi ) 2 = ¦ y i + r 2 ¦ xi − 2r ¦ xi y i
2 2
i (7.4)
i =1 i =1 i =1 i =1

Nilai-nilainya didapatkan dari tabel 6.1 :


20

¦(y
i =1
i − rxi ) 2 = 1373.71 + (1.07) 2 (1210.55) − 2(1.07)(1288.95)

= 1.3157
Dengan menggunakan persamaan (7.3)
n

· ¦ ( y i − rxi )
2
§

§ N − n ·¨ 1 ¸ i =1
2 V (r ) = 2 ¨ ¸ 2
© nN ¹¨¨ − ¸¸ n −1
©x ¹
n

· ¦ (1.3157)
2
§
§ 1000 − 20 ·¨ 1 ¸ i =1
= 2 ¨¨ ¸¸¨ ¸¸ = 0.015
© 20(1000) ¹¨ (7.725) 2 19
© ¹
Jadi, kita menaksir rasio dari nilai real estate sekarang dengan yang dua tahun
yang lalu menjadi r = 1.07 dan kita sungguh yakin bahwa kesalahan penaksiran
kurang dari 0.02. Karena itulah, rasio sebenarnya R untuk polpulasi seharusnya
berada diantara 1.05 dan 1.09. Dengan catatan bahwa rentang kesalahan dari
penaksiran cukup kecil. Karena itu r seharusnya menjadi penaksir yang cocok untuk
R.
Interval konfidensi untuk sampel besar yang didasai oleh teori distribusi
normal, seperti yang ditunjukkan dalam bagian 2, mengaplikasikan contoh rasi
estimasi dengan baik. Dengan demikian sebagai contoh, penaksiran inteval konfidensi
90 % untuk rasio R dalam bentuk

r ± 1.645 V (r )
Taksiran varians r dapat dituliskan dalam berbagai bentuk. Salah satu yang
lebih khusus yang berguna untuk menunjukkan koefisien korelasi ȡ antara x dan y.
Korelasi ini dapat ditaksir oleh
S xy
ρ=
SxSy

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳʹͳ
dimana
1 n − −
Sxy = ¦
n − 1 i =1
( xi − x)( y i − y )

2
1 n −
Sx2 = ¦ i )
n − 1 i =1
( x − x

dan
2
1 n −
Sy2 = ¦ i )
n − 1 i =1
( y − y

Koefisien korelasi akan memegang peranan kunci pada diskusi selanjutnya.


Sekarang kita menuliskan
∧ 1− f § 1 · 2 ∧
V (r ) = ¨ ¸( S + r 2 S 2 − 2 r ρ S S )
n ¨μ 2 ¸ y x x y
© x ¹
dimana f = n/N, fraksi sampling. Bentuk ini sering digunakan dengan perhitungan
yang ditampilkan dengan paket-paket perangkat lunak dari statistika stansar. Sebagai
contoh, Minitab membaca data pada sampel 7.1 adalah
N Mean Stdev
x 20 7.725 0.947
y 20 8.235 0.957

Korelasi antara x dan y adalah 0.966


Dari rangkuman ini,
­°§ 2
½°

V (r ) = ®¨1 −
20 ·§ 1 ·§ 1 ·
¸¨ ¸¨
°̄© 1000 ¹© 20 ¹© 7.725 ¹
[
¸ . (0.957 ) + (1.07) (0.947) − 2(1.07)(0.966)(0.947)(0.957) ¾
2 2 2
]
°¿
= 0.0000567

dan 2 V (r ) = 0.015, dianggap sama dengan perhitungan yang di awal.
Ada analogi antara penaksir rasio dan analisis regresi klasik. Kami akan
memperkenalkan salah satu dari analogi dengan tujuan perhitungan, dan menggali
bagian lain dari hubungan tersebut nantinya. Dalam regresi klasik dalam populasi
yang tidak terbatas, seandainya kita membuat model
E (yi) = ȕxi
Selanjutnya, jika varian yi proporsional terhadap xi. Kemudian, analisis regresi yang
diboboti seharusnya digunakan, dengan bobot proporsi pada kedua variannya, atau

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳʹʹ
1/xi dalam kasus ini. Kuadrat terkecil biasa dalam analisi regresi yang terbobot
dengan bobot 1/xi akan menghasilkan r sebagai penaksir ȕ. Standar deviasi dari

koefisien regresi akan hampir sama dengan perhitungan 2 V (r ) kita yang pertama,
kecuali untuk koreksi populasi yang terbatas.
Hasil dari MINITAB untuk analisis regresi yang terbobot untuk data pada
contoh 7.1 adalah

7KHUHJUHVVLRQHTXDWLRQLV
\ [
3UHGLFWRU&RHI6WGHYWUDWLRS
1R&RQVWDQ
[

Jika taksiran koefisien 1.066 § 1.07 = r, dan

2 V (r ) = 2 0.98 (0.00745) = 0.15
adalah seperti hasil perhitungan kita yang diawal. Pendekatan ini tentunya membawa
kebosanan pada perhitungannya, tapi pengguna teknik ini seharusnya memiliki
pengetahuan tentang regresi klasik disamping yang ada di buku ini. ( t-rasio dan p-
value yang ditunjukkan diatas, jika dalam populasi normal yang tidak terbatas,
koefisien regresi akan berbeda secara signifikan terhadap nol).
Tehnik rasio untuk menaksir total populasi IJy diaplikasikan dalam penaksiran

toal isi gula dalam muatan truk jeruk. Penaksir sederhana dari N y tidak dapat
digunakan karena kita tidak mengetahui N, total banyaknya jeruk dalam truk.
Prosedur penaksiran rasio berikut dapat diaplikasikan dalam menaksir IJy apakah N
diketahui atau tidak.

Penaksir rasio dari total populasi τ y :
n

∧ ¦y i
τ y= i =1
n
(τ x ) = rτ x (7.5)
¦x
i =1
i


Varian dari taksiran τ y :
n

·¦
2
( y − rx )
§ N − n ·§¨ 1 ¸
∧ ∧ ∧ i i
V (τ y ) = (τ x ) 2 V (r ) = τ x2 ¨ ¸ 2 i =1
(7.6)
© nN ¹¨© μi ¸¹ n −1

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳʹ͵
dimana ȝx dan IJx adalah rata-rata populasi dan total, yang berturut-turut, dari variabel
acak x.
Rentang kesalahan dari penaksiran :
n

·¦
( y i − rxi ) 2
^ ∧
§ N − n ·§¨ 1 ¸¸ i =1
2 V (τ y ) = 2 τ x2 ¨ ¸ 2 (7.7)
© nN ¹¨© μ x ¹ n −1

Dengan catatan meskipun kita tidak perlu mengetahui N atau ȝx , kita harus
mengetahui IJx untuk menaksir IJy dengan menggunakan prosedur penaksiran rasio.

Contoh 7.2 Dalam sebuah penelitan untuk menaksir total banyaknya gula dalam
muatan truk jeruk, sebuah sampel acak dengan n = 10 jeruk dibuat
menjadi jus dan diukur beratnya. Total berat dari semua jeruk, didapatkan
dengan penimbangan pertama pada truk yang berisi muatan dengan
kemudian truk yang dikosongkan, didapatkan 1800 pon. Taksirlah IJy ,
total jumlah gula pada jeruk, dan rentang kekeliruan penaksirannya

Tabel 7.2 Data untuk contoh 7.2


Jeruk Jumlah gula Berat jeruk
(dalam pon) (dalam pon)
1 0.021 0.40
2 0.030 0.48
3 0.025 0.43
4 0.022 0.42
5 0.033 0.50
6 0.027 0.46
7 0.019 0.39
8 0.021 0.41
9 0.023 0.42
10 0.025 0.44
Total 0.246 4.35

6ROXVL

Gula yang terkandung dalam jeruk biasanya dicatat dalam derajat brix, yang
merupakan pengukur berapa pon gula padat per 100 pon jeruk. Untuk menghitungnya
kita akan menggunakan berapa pon kandungan yang sebenarnya untuk setiap jeruk.
Taksiran τˆ y dapat diperoleh dengan menggunakan persamaan (7.5):

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳʹͶ
10

¦y i
0.246
τˆ y = r τˆ x = i =1
10
(τ x ) = (1800) = 101.79 pon
4.35
¦x
i =1
i

Besarnya kekeliruan taksiran dapat dihitung dengan menggunakan versi modifikasi


dari persamaan (7.7). Karena N tidak diketahui dalam contoh ini, kita asumsikan
faktor koreksi populasi, (N-n)/N, mendekati nilai yang sama. Asumsi ini cukup
beralasan karena kita mengharapkan sedikitnya N = 4000 jeruk di dalam sebuah truk
kecil sekalipun. Rata-rata sampel x digunakan untuk menggantikan μx pada
persamaan (7.7), karena μx tidak diketahui. Dengan demikian persamaan (7.7) menjadi
n

§ 1 ·§ 1 ·
¦(y i − rxi ) 2
2 Vˆ (τˆ y ) = 2 τ x2 ¨ ¸¨ 2 ¸ i =1

© n ¹© x ¹ n −1
Gunakan persamaan (7.4), untuk menghitung :
10 10 10 10

¦(y
i =1
i − rxi ) 2 = ¦ y i2 + r 2 ¦ xi2 − 2r ¦ xi y i
i =1 i =1 i =1

dimana
10

¦y
i =1
i
0.246
r= 10
= = 0.0566
4.35
¦x
i =1
i

Dari data,
10

¦y 2
i = (0.021) 2 + (0.030) 2 + ... + (0.025) 2 = 0.006224
i =1

10

¦x
i =1
2
i = (0.40) 2 + (0.48) 2 + ... + (0.44) 2 = 1.9035
10

¦y x
i =1
i i = (0.021)(0.40) + (0.030)(0.48) + ... + (0.025)(0.44) = 0.10839

4.35
x= = 0.435
10
Substitusikan ke dalam persamaan (7.4) didapat

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳʹͷ
10 10 10 10

¦ ( yi − rxi ) 2 = ¦ yi2 + r 2 ¦ xi2 − 2r ¦ xi yi


i =1 i =1 i =1 i =1

= 0.006224 + (0.0566)2 (1.9035) - 2 (0.0566) (0.10839)


= 0.000052285
Maka kekeliruan penaksirannya adalah
10

§ 1 ·§ 1 ·
¦(y i − rxi ) 2
2 Vˆ (τˆ y ) = 2 τ x2 ¨ ¸¨ 2 ¸ i =1

© n ¹© x ¹ n −1

§ 1 ·ª 1 º§ 0.000052285 ·
= 2 (1800) 2 ¨ ¸ « 2 »¨ ¸ = 6.3
© 10 ¹ ¬ (0.435) ¼© 9 ¹

Kesimpulannya, rasio penaksiran total gula dalam truk jeruk adalah τˆ y = 101.79 pon,

dengan kekeliruan penaksiran 7.3. Kita yakin bahwa total kandungan gula τy berada
pada interval
101.79 ± 6.3
sehingga, intervalnya berada pada 95.49 sampai 108.09 pon.
Selain itu, deskriptif statistik, yang diperlihatkan di bawah ini dari output
Minitab, dapat digunakan untuk menghitung Vˆ (r ) , bagian utama dari Vˆ (τ y ) .

N Rata-rata Stdev

x 10 0.4350 0.0354
y 10 0.02460 0.00438
Korelasi x dan y = 0.991

Analisis regresi yang diboboti dengan garis lurus melalui titik pangkalnya
menghasilkan :

Persamaan regresinya adalah


y = 0.0566 x

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳʹ͸
3UHGLNWRU .RHI  6WGHY UDVLRW  S
Konstanta - - - -
x 0.056552 0.001719 32.90 0.000

Maka didapat,

2 Vˆ (τ y ) = 2τ x Vˆ (r )

= 2 (1800) (0.001719) = 6.19


yang sangat dekat dengan hasil yang diberikan oleh metode perhitungan yang
sebelumnya.
Anda akan mengatakan bahwa populasi berukuran N seringkali diketahui.
Oleh karena itu, peneliti harus memutuskan dalam kondisi bagaimana menggunakan
penaksir rasio τˆ y = rτx lebih baik dibandingkan dengan menggunakan penaksir

koresponding Ny , dimana kedua penaksir didasarkan pada SRS_Sampling Acak


Sederhana (lihat bagian 7.5). Umumnya, rτx mempunyai varians yang lebih kecil
daripada Ny apabila terdapat korelasi positif yang kuat antara x dan y, (dimana ρ ,
koefisien korelasi antara x dan y, lebih besar dari ½ ). Secara intuisi, pernyataan ini
masuk akal karena dalam penaksiran rasio kita menggunakan informasi tambahan dari
penambahan variabel x.
 Jika peneliti lebih tertarik dengan rata-rata populasi daripada total populasi,
prosedur penaksiran rasio koresponding ditunjukkan dalam persamaan (7.8), (7.9),
dan (7.10).
Penaksir rasio rata-rata populasi μ y :
n

¦y i
μˆ y = i =1
n
( μ x ) = rμ x (7.8)
¦x
i =1
i

Varians taksiran dari μ̂ y :


n

§ N − n §
·¨ 1 · ¦ ( y i − rxi ) 2
Vˆ ( μˆ y ) = μ x2Vˆ (r ) = μ x2 ¨ ¸¨ 2 ¸¸
i =1
(7.9)
© nN ¹© μ x ¹ n −1

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳʹ͹
Taksiran kekeliruannya :
n

§ N −n·
¦(y i − rxi ) 2
2 Vˆ ( μˆ y ) = 2 ¨ ¸ i =1
(7.10)
© nN ¹ n −1

Catatan bahwa kita tidak perlu mengetahui τ x atau N untuk menaksir μ y ketika

menggunakan prosedur rasio; tetapi μ x harus kita ketahui.

‘–‘ŠͽǤ͹
Sebuah perusahaan ingin menaksir rata-rata jumlah uang μ y yang dibayarkan kepada

karyawan untuk biaya pengobatan selama tiga bulan pertama pada kalender tahunan.
Laporan rata-rata setiap tiga bulan ini didapat dari laporan keuangan tahun
sebelumnya. Sampel acak sebanyak 100 karyawan diambil dari populasi sebanyak
1000 karyawan. Hasilnya dinyatakan sebagai berikut. Gunakan data tersebut untuk
memprediksi μ y dan untuk menempatkan kekeliruan penaksiran.

n = 100, N = 1000
Total tiga bulan terakhir :
100

¦y
i =1
i = 1750

Total tiga bulan koresponding tahun sebelumnya :


100

¦x
i =1
i = 1200

Total populasi τ x untuk tiga bulan koresponding tahun sebelumnya :

τ x = 12500

100 100 100

¦
i =1
2
y = 31,650,
i ¦x
i =1
2
i = 15,620, ¦y x
i =1
i i = 22,059.35

Solusi
Taksiran untuk μ y adalah

μˆ y = rμ x

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳʹͺ
dimana
τx 12,500
μx = = = 12.5
N 1000
Maka
100

¦y i
1750
μˆ y = i =1
100
(μ x ) = (12.5) = 18.23
1200
¦x
i =1
i

Taksiran kekeliruan didapat dengan menggunakan persamaan (7.10); tetapi kita harus
menghitung terlebih dahulu
100 100 100 100

¦ ( yi − rxi ) 2 = ¦ yi2 + r 2 ¦ xi2 − 2r ¦ xi yi


i =1 i =1 i =1 i =1

= 31.650 + (1.4583)2 (15,620) - (2.9166) (22,059.35)


= 441.68

Substitusikan ke dalam persamaan (7.10) memberikan taksiran kekeliruan :


n

§ N −n·
¦(y i − rxi ) 2
2 Vˆ ( μˆ y ) = 2 ¨ ¸ i =1

© nN ¹ n −1

1000 − 100 § 441.68 ·


= 2 ¨ ¸ = 0.42
100(1000) © 99 ¹
Maka taksiran rata-rata jumlah uang yang dibayar kepada karyawan untuk biaya
pengobatan $18.23. Kita sangat yakin bahwa kekeliruan untuk taksiran μ y kurang

dari $0.42.

Untuk mengingat rumus taksiran rasio dari rata-rata populasi, total, atau rasio, kita
membuat asosiasi berikut. Rasio sampel r dinyatakan dalam rumus berikut
n

¦y
i =1
i
r= n

¦x
i =1
i

(7.11)
Penaksir R , τ y , dan μ y adalah

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳʹͻ
Rˆ = r
(7.12)

τˆ y = rτ x

(7.13)
μˆ y = rμ x
(7.14)
Jadi kita hanya perlu mengetahui rumus r dan hubungannya dengan μ̂ y dan τˆ y .

Taksiran varians bisa diperoleh dengan mengingat rumus dasar,


n

§ N − n · § 1 · ¦ ( y i − rxi ) 2
Vˆ (r ) = ¨ ¸¨¨ 2 ¸¸
i =1
(7.15)
© nN μ
¹© x ¹ n −1

Maka
Vˆ (τˆ y ) = τ x2Vˆ (r ) (7.16)

Vˆ ( μˆ y ) = μ x2Vˆ (r ) (7.17)

VII.4 MENENTUKAN UKURAN SAMPEL

Kita menyatakan sebelumnya bahwa jumlah informasi yang dimuat dalam


sampel bergantung pada variasi dalam data (yang sering dikontrol dengan disain
sampling survey) dan jumlah observasi n yang termasuk dalam sampel. Setelah
disain sampling ditentukan, peneliti harus menentukan jumlah bagian-bagian yang
akan digambar. Kita akan menentukan ukuran sampel yang dibutuhkan untuk
menaksir parameter populasi R, μ y , atau τ y dalam B unit untuk sampling acak

sederhana dengan menggunakan penaksir rasio.


Catatan bahwa prosedur untuk memilih ukuran sampel n identik dengan yang
ditunjukkan pada bagian sebelumnya. Jumlah observasi yang dibutuhkan untuk
menaksir R, sebuah rasio populasi, dengan taksiran kekeliruan sebesar B diperoleh
dengan menetapkan dua standar deviasi dari penaksir rasio r sama dengan B dan
nyatakan untuk n. Sehingga kita harus menyelesaikan
2 V (r ) = B (6.18)

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳ͵Ͳ
^
dengan B adalah bound of error dari penaksiran. Dan V (r ) sebagai penaksir varians
dari r diperoleh melalui persamaan:
n

·¦
( yi − rxi ) 2
^
§ N − n ·§¨ 1 ¸ i =1
V (r ) = ¨ ¸ 2 (7.19)
© nN ¹¨© μ x ¸
¹ n −1

^
§ N − n ·§¨ 1 ·¸ 2
atau : V (r ) = ¨ ¸ 2 s (7.20)
© nN ¹¨© μ x ¸¹
dengan
n

¦(y i − rxi ) 2
s2 = i −1

n −1
^
Varians populasi V(r) yang mendekati dapat diperoleh dari V (r ) dengan mengganti

s 2 oleh σ 2 . Maka jumlah observasi n yang diperlukan untuk menaksir R dengan


bound of error B dapat diperoleh dengan mencari solusi untuk n dari persamaan
berikut ini :

§ N − n ·§¨ 1 ·¸ 2
2 V (r ) = 2 ¨ ¸ 2 σ =B (7.21)
© nN ¹¨© μ x ¸¹

Ukuran sampel yang diperlukan untuk menaksir R dengan bound of error B


adalah :
Nσ 2
n= (7.22)
ND + σ 2
dengan
B 2 μ x2
D=
4
Dalam kenyataan di lapangan kita seringkali dihadapkan pada permasalahan dalam
menentukan ukuran sampel karena σ 2 tidak diketahui. Jika informasi yang
diperlukan untuk menghitung s 2 sebagai penaksir dari σ 2 tidak tersedia, maka kita
mengambil sebuah sampel pendahuluan berukuran n ' .

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳ͵ͳ
n'

^ 2 ¦(y i − rxi ) 2
σ = i −1

n' −1
kemudian kita substitusikan hasil dari persamaan ini untuk σ 2 pada persamaan
(7.22), maka kita akan mendapatkan ukuran sampel yang mendekati. Jika μ x juga

tidak diketahui, maka μ x dapat digantikan oleh rata-rata sampel x , yang dihitung

dari n ' yang diperoleh pada penelitian pendahuluan.

Contoh7.4 : Sebuah perusahaan perakitan berkeinginan untuk menaksir rasio


perubahan hilangnya jam kerja karyawan dikarenakan sakit antara
tahun lalu dengan tahun ini. Sebuah penelitian pendahuluan dengan
n ' = 10 orang pekerja telah dilakukan, dan hasilnya disajikan pada
tabel di bawah. Catatan perusahaan menunjukkan bahwa jumlah
total jam kerja karyawan yang hilang karena sakit adalah sebesar
τ x = 16,300. Dengan data yang telah tersedia kita akan
menentukan ukuran sampel yang diperlukan untuk menaksir R ,
dengan besarnya bound of error B = 0.01. Diasumsikan bahwa
perusahaan memiliki 1000 orang karyawan (N = 1000).

Pekerja Jam kerja karyawan Jam kerja karyawan yang


yang hilang untuk tahun hilang untuk tahun yang
yang lalu, x sedang dijalani, y.
1 12 13
2 24 25
3 15 15
4 30 32
5 32 36
6 26 24
7 10 12
8 15 16
9 0 2
10 14 12

178 187

3HPHFDKDQ

Pertama kita menghitung penaksir dari σ 2 dengan menggunakan data yang diperoleh
dari penelitian pendahuluan

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳ͵ʹ
10

^ 2 ¦(y i − rxi ) 2
σ = i =1

9
Dengan :
10 10 10 10

¦ ( yi − rxi ) 2 = ¦ yi2 + r 2 ¦ xi2 − 2r ¦ xi yi


i =1 i =1 i =1 i =1

Kemudian, dari data yang disajikan pada tabel kita akan menentukan :
10

¦y
i =1
2
i = (13) 2 + (25) 2 + ... + (12) 2 = 4463

10

¦x
i =1
2
i = (12) 2 + (24) 2 + ... + (14) 2 = 4066

¦x y i i = (12)(13) + (25)(42) + ... + (14)(12) = 4066

10

¦y i =1
i
187
r= 10
= = 1.05
178
¦x
i =1
i

10 10 10 10

¦ ( yi − rxi ) 2 = ¦ yi2 + r 2 ¦ xi2 − 2r ¦ xi yi


i =1 i =1 i =1 i =1

= 4463 + (1.05) 2 (4066) − 2(1.05)(4245) = 31.625


dan
10

^ 2 ¦(y i − rxi ) 2
31.625
σ = i =1
= = 16.3
9 9
B 2 μ x2 (0.01) 2 (16.3) 2
D= = = 0.006642
4 4
6HNDUDQJ NLWD GDSDW PHQHQWXNDQ XNXUDQ VDPSHO \DQJ GLSHUOXNDQ GHQJDQ PHQJJXQDNDQ
SHUVDPDDQ  6HEDJDLFDWDWDQEDKZD
τx 16.300
μx = = = 16.3
N 1000
dan
B 2 μ x2 (0.01) 2 (16.3) 2
D= = = 0.006642
4 4
dengan demikian

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳ͵͵
^ 2
Nσ 1000(3.474)
n= = = 343.416
^ 2 1000(0.006642) + 3.474
ND + σ
Maka untuk menaksir R, tingkat perubahan jam kerja karyawan yang hilang karena
sakit, dengan bound of error dari penaksiran sebesar B = 0.01 jam kita memerlukan
sebanyak 344 orang karyawan untuk diteliti.
Dengan cara yang sama, kita dapat menentukan jumlah observasi n yang
diperlukan untuk menaksir rata-rata populasi μ y , dengan bound of error dari

penaksiran sebesar B. Ukuran sampel yang diperlukan untuk menaksir μ y diperoleh

dengan mencari solusi untuk n dari persamaan berikut :


^
2 V (μ y ) = B (7.23)

Persamaan tersebut juga dapat dinyatakan sebagai berikut :


2μ x V (r ) = B

Ukuran sampel yang diperlukan untuk menaksir μ y dengan bound of error

penaksiran B adalah :
Nσ 2
n=
ND + σ 2
dengan
B2
D=
4
Sebagai catatan bahwa untuk menentukan n pada persamaan (7.24) kita tidak perlu
mengetahui nilai μ x ; namun demikian kita tetap memerlukan taksiran dari σ 2 , yang
bisa kita peroleh atau kita tentukan dari penelitian yang telah dilakukan sebelumnya.

Contoh 7.5 : Seorang peneliti berkeinginan untuk menaksir rata-rata


jumlah pohon per hektar pada sebuah kebun yang berukuran N
= 1000 hektar. Dia berencana mengambil sampel berukuran n
dari 1-hektar bidang tanah, kemudian menghitung y, jumlah
pohon untuk setiap bidang tanah. Dia juga memiliki pencitraan
dari kebun tersebut yang bisa digunakan untuk menaksir x,
jumlah pohon pada setiap bidang tanah untuk seluruh kebun,

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳ͵Ͷ
sehingga dia juga mengetahui μ x . Tentukanlah ukuran sampel

yang diperlukan untuk menaksir μ y dengan bound of error dari

penaksiran sebesar B = 1.0.


Pemecahan : Diasumsikan bahwa informasi yang diperlukan untuk
kepentingan penelitian tidak tersedia, maka kita harus
mengadakan sebuah penelitian pendahuluan untuk menaksir
σ 2 . Karena setiap harinya peneliti bisa memeriksa 10 bidang
tanah untuk menentukan y, jumlah seluruh pohon per bidang
tanah, maka tepat sekali jika kita menggunakan n ' = 10 bidang
tanah pada penelitian pendahuluan.

Hasil dari penelitian disajikan pada tabel di bawah ini :


Bidang Nilai Nilai
tanah taksiran, x sebenarnya,
y.
1 23 25
2 14 15
3 20 22
4 25 24
5 12 13
6 18 18
7 30 35
8 27 30
9 8 10
10 31 29

208 221

Taksiran dari σ 2 dapat diperoleh melalui persamaan


10

^ 2 ¦(y i − rxi ) 2
σ = i =1

9
Kemudian gunakanlah persamaan (7.4)
10 10 10 10

¦(y
i =1
i − rxi ) 2 = ¦ y i2 + r 2 ¦ xi2 − 2r ¦ xi y i
i =1 i =1 i =1

Dari penelitian pendahuluan kita peroleh

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳ͵ͷ
10

¦y
i =1
2
i = (25) 2 + (15) 2 + ... + (29) 2 = 5469

10

¦x
i =1
2
i = (23) 2 + (14) 2 + ... + (31) 2 = 4872

¦x y i i = (22)(23) + (14)(15) + ... + (31)(29) = 5144

10

¦y
i =1
i
221
r= 10
= = 1.06
208
¦x
i =1
i

10 10 10 10

¦ ( yi − rxi ) 2 = ¦ yi2 + r 2 ¦ xi2 − 2r ¦ xi yi


i =1 i =1 i =1 i =1

= 5469 + (1.06) 2 (4872) − 2(1.06)(5144) = 37.8992


Dengan menggunakan persamaan (7.24), sekarang kita bisa menentukan n dengan
1
D = B2 / 4 =
4
Nσ 2 100(4.21)
n= = = 16.56
ND + σ 2
1000(0.25) + 4.21
Maka untuk menaksir μ y , rata-rata jumlah pohon per 1-hektar bidang tanah, dengan

bound of error sebesar B = 1.0. kita memerlukan sebanyak 17 bidang tanah untuk
diteliti. Karena pada penelitian pendahuluan kita telah meneliti sebanyak 10 bidang
tanah, maka kita tinggal meneliti sisanya yaitu sebanyak 7 bidang tanah.
Ukuran sampel yang diperlukan untuk menaksir τ y dengan bound of error

sebesar B bisa didapatkan dengan mencari solusi untuk n dari persamaan berikut :
^
2 V (τ y ) = B (7.25)

persamaan di atas juga dapat ditulis sebagai berikut


2τ x V (r ) = B (7.26)

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳ͵͸
Ukuran sampel yang diperlukan untuk menaksir τ y dengan bound of error B

adalah :
Nσ 2
n= (7.27)
ND + σ 2
dengan
B2
D=
4N 2

VII.5 TAKSIRAN REGRESI

Telah ditunjukan sebelumnya bahwa penaksir rasio lebih layak digunakan jika
hubungan antara y dan x adalah linier. Jika kenyataan dari hubungan linier antara
pengamatan y’s dan x’s, tetapi tidak harus salah satunya , lalu informasi tambahan
disediakan dengan bantuan variabel x yang didapat dari perhitungan taksiran regresi
dari rata-rata μ y . Harus diketahui μ y sebelum penaksir dapat dipakai, seperti yang

ada dalam taksiran rasio dari μ y .

Yang digarisbawahi memperlihatkan hubungan dasar antara y’s dan x’s yang
kadang menunjuk pada garis regresi dari y atas x.
Penaksir memberikan asumsi bahwa x’s adalah variabel tetap dan y’s adalah
variabel acaknya. Dapat kita pikirkan nilai x sebagai suatu yang telah diteliti, seperti
pendapatan seperempat bulan pertama tahun yang lalu, dan respon y sebagai variabel
acak yang belum di teliti, seperti pendapatan empat bulan berikutnya dari suatu
perusahaan untuk x yang telah diketahui. Peluang dari penaksir selanjutnya
tergantung hanya dari y untuk pasangan x’s.

Penaksir Regresi dari rata-rata populasi μ y

μˆ yL = y + b( μ x − x ) (7.28)

dimana
n

¦ (y
i =1
i − y )( x i − x )
b= n

¦ (x
i =1
i − x) 2

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳ͵͹
Penaksir varians dari μ̂ yL

§ N − n ·§ 1 · ª º
n n
Vˆ ( μˆ yL ) = ¨ ¸¨
2
¸« ( yi − y) − b
© Nn ¹© n − 2 ¹ «¬ i =1
2
¦ ¦ (x
i =1
i − x) 2 »
»¼
(7.29)

Penaksir batasan kesalahan

§ N − n ·§ 1 · ª º
n n
2 vˆ( μ yL ) = 2 ¨
© Nn
¸¨
¹© n − 2 ¹ «¬ i =1
2
¸« ( yi − y) − b
2
¦ ¦ (x
i =1
i − x) 2 »
»¼
(7.30)

Ketika menghitung b dari pasangan penelitian (y1,x1),…,(yn,xn), kita dapat


menggunakan fakta bahwa
n n

¦(y
i =1
i − y )( x i − x ) ¦y x
i =1
i i − nx y

n
= n

¦ (x
i =1
i − x) 2
¦x
i =1
2
i − nx 2

Contoh 7.9
Perolehan nilai test matematika telah diberikan kepada 486 siswa yang terlebih dahulu
masuk perguruan tinggi tertentu. Dari semua siswa tersebut SRS dari n=10 siswa telah
diseleksi dan kemajuan mereka dalam kalkulus diteliti. Hasil akhir nilai kalkulus telah
dilaporkan, seperti telah diberikan pada tabel. Diketahui bahwa μ y =52 untuk 486

siswa yang mengambil test perolehan tsb. Taksir μ y untuk populasi ini, dan

tempatkan taksiran batasan kesalahannya.


Siswa Perolehan nilai test Kalkulus akhir
(x) (Y)
1 39 65
2 43 78
3 21 52
4 64 82
5 57 92
6 47 89
7 28 73
8 75 98
9 34 56
10 52 75

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳ͵ͺ
Penyelesaian
Hasil penghitungan
y = 76 x = 46
n

¦y x
i =1
i i − nx y
36,854 − 10(46)(76)
b= n
= = 0.766
23,634 − 10(46) 2
¦i =1
x i2 − nx 2

n n

¦ (y
i =1
i − y) 2 = ¦y i =1
2
i − ny 2 = 2056

n n

¦i =1
( xi − x ) 2 = ¦x i =1
2
i − nx 2 =2474

nilai observasi dari μ yL :


y + b( μ x − x ) = 76 + (0,766)(52 − 46) = 80

juga

§ N − n ·§ 1 · ª º
n n
Vˆ ( μˆ yL ) = ¨ ¸¨
2
¸« ( y i − y ) − b
© Nn ¹© n − 2 ¹ «¬ i =1
2
¦ ¦ (x
i =1
i − x) 2 »
»¼

§ 486 − 10 ·§ 1 ·
= ¨¨
486 (10)
[
¸¸¨ ¸ 2056 − (0,766) 2 (2474) = 7,397 ]
© ¹© 8 ¹

dan penaksir batasan kesalahannya adalah


2 vˆ( μ yL ) = 5.4

Agar diketahui bahwa penaksir regresi dari μ y penurunan nilai y dari

x menjadi berkurang daripada μ y dan b nya positif.

Perhitungan untuk penaksir regresi dari rata-rata sejajar dengan analisis regresi
klasik dalam kasus populasi yang tak berhingga.dengan model
E ( y i ) = β 0 + β 1 xi

untuk (xi,yi) data. Lalu penaksir kuadrat terkecil dari β i adalah b, telah didapat dari
persamaan (7.28). juga hasil dari (7.29) menjadi
§ N −n·
v ( μˆ yL ) = ¨ ¸ MSE
© Nn ¹

dimana MSE adalah kesalahan rata-rata kuadrat yang biasa dari analisis regresi.

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳ͵ͻ
Untuk ilustrasi, hasil analisis regresi minitab untuk data dalam contoh 7.9
sebagai berikut:
Persamaan regresi
y = 40.8 + 0.766 x

Predictor Coef Stdev t-ratio p


Constant 40.784 8.507 4.79 0.000
X 0.7656 0.1750 4.38 0.002
s=8.704, R-sq=70.5%, R-sq(adj)=66.8%
Analisis varians
Source DF SS MS F p
Regresi 1 1450.0 1450.0 19.14 0.002
Error 8 606.0 75.8
Total 9 2056.0

Perhitungan b diperlihatkan sebagai koefisien dari x dalam persamaan regresi, atau


dalam kolom “Coef” berlawanan dengan predictor x dalam tabel. MSE dimasukan
dibawah “MS” berlawanan dengan “Error” dalam tabel analisis varians. Dengan
demikian,
§ N −n·
v ( μˆ yL ) = ¨ ¸ MSE
© Nn ¹

476
= (75.8) = 7.42
486(10)

dan
2 vˆ( μ yL ) = 5.45

dimana sangat dekat dengan nilai yang terkandung dalam perhitungan yang lalu.
Pemeriksaaan yang lebih dekat dari data dalam kandungan gula dan berat
jeruk diberikan dalam contoh 7.2 disarankan bahwa penaksir rata-ratanya lebih layak
dari pada penaksir rasio.(Plot ari nilainya akan memperlihatkan bahwa garis regresi
tidak tampak) walau demikian, penaksir regresi dari total adalah bentuk Nμ yL ,

khususnya n harus diketahui. Sejak penaksir rasio juga bekerja dengan baik dalam
kasus ini, menetapkan nomor dari jeruk dalam truk tidak akan mendapatkan biaya dan
waktu tambahan. Dalam kasus N yang lain akan diketahui atau mudah ditemukan.
Dengan demikian, kita harus hati-hati dalam memilih antara penaksir rasio dan

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͶͲ
penaksir regresi ketika menaksir rata-rata populasi atau total. Akan dibahas lebih
lanjut dalam bagian 6.8.

VII.6 TAKSIRAN PERBEDAAN

Metode penaksiran perbedaan rata-rata populasi atau total sama dengan


metode regresi yang sesuai dengan nilai y atas dan bawah dengan jumlah yang
tergantung perbedaan ( μ x − x ) . Akan tetapi, koefisien regresi b tidak dihitung.
Hasilnya, b dibuat sama.
Metode perbedaan lebih mudah untuk dipakai dibandingkan metode regresi
dan kerap kali bekerja lebih baik. Metode ini biasa digunakan dalam prosedur
pemeriksaan, dan akan kita pertimbangkan beberapa contoh dalam bagian ini.
Rumus dibawah ini bahwa sampling acak sederhana telah digunakan.

Perbedaan penaksir dari populasi μ y :

μˆ yD = y + ( μ x − x ) = μ x + d (7.31)

dimana
d = y−x

Penaksir Varians dari μ yD :


n

§ N −n·
¦ (d i − d )2
Vˆ ( μ yD ) = ¨ ¸
i =1
(7.32)
© Nn ¹ n −1

dimana
d i = y i − xi

Penaksir batasan kesalahan:


n

§ N −n·
¦ (d i − d )2
2 Vˆ ( μˆ yD ) = 2 ¨ ¸
i =1
(7.33)
© Nn ¹ n −1

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͶͳ
Contoh 7.10
Pemeriksa tertarik dalam membandingkan pemeriksaan nilai dari beberapa barang
dengan harga buku. Biasanya, harga buku diketahui untuk setiap barang dalam
populasi, dan pemeriksaan harga diperoleh untuk sebuah sampel dari barang tersebut.
Harga buku dapat digunakan untuk memperoleh taksiran yang baik dari total atau
rata-rata pemeriksaan nilai untuk populasi.
Sebuah populasi berisi 180 daftar barang dengan harga buku $13,320. xi adalah harga
buku dan yi pemeriksaan harga untuk barang yang ke-i. Sampel acak sederhana dari
n=10 barang diperlihatkan dalam tabel. Plot dari data tersebut, Gambar 6.1,
menunjukkan sepanjang garis lurus. Taksir nilai pemeriksaan rata-rata dari μ y dengan

metode perbedaan dan taksir varians dari μ yD .

Gambar 7.1 Plot y atas x untuk contoh 6.10.

200.00

150.00
y

100.00

50.00 






50.00 100.00 150.00 200.00

sample nilai audit,y nilai buku,x d


1 9 10 -1
2 14 12 2
3 7 8 -1
4 29 26 3
5 45 47 -2
6 109 112 -3
7 40 36 4
8 238 240 -2
9 60 59 1
10 170 167 3

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͶʹ
6ROXVL
Diketahui y = 72.1 , x = 71.7 , dan μ x = 74
μ yD = μ x + d = 74 + (72.1 − 71.7) = 74.4
dan juga,
§ 1 ·n § 1 ·ª n 2 2º
¸ ¦ ( d i − d ) =¨ ¸ « ¦ d i − nd »
2
¨
© n − 1 ¹ i =1 © n − 1 ¹ ¬ i =1 ¼

58 − 10(0.4) 2
= = 6.27
9
jadi
n

§ N −n·
¦ (d i − d )2
ª180 − 10 º
Vˆ ( μˆ yD ) = ¨ ¸ i =1
=« » (6.27) = 0.59
© Nn ¹ n −1 ¬ (180)10 ¼

VII.7 EFISIENSI RELATIF DARI PENAKSIR

Kita telah melihat bahwa rata-rata sample, penaksir rasio, penaksir regresi, dan
penaksir selisih semuanya bisa digunakan sebagai penaksir rata-rata populasi μ y .

Bagaimana kita mengetahui penaksir yang mana yang terbaik untuk situasi penarikan
sample tertentu? sebenarnya, kita selalu tidak bisa menjawabnya secara pasti, tetapi
ada beberapa pedoman yang membandingkan sifat-sifat dari penaksir-penaksir
tersebut. Salah satu pedomannya bisa diungkapkan dalam hal efisiensi relatif dari
penaksir.
Andaikan kita mempunyai dua penaksir E1 dan E 2 untuk rata-rata μ . Jika
kedua E1 dan E 2 adalah penaksir takbias, atau hampir takbias, dari μ , maka secara
umum kita sebaiknya memilih penaksir dengan varians terkecil sebagai penaksir
terbaik. Hal ini menghasilkan taksiran selang kepercayaan terpendek bagi μ . Varians
biasanya mengecil ketika ukuran sample membesar, jadi kita harus membandingkan
varians E1 dan E 2 dengan asumsi ukuran sample sama untuk kedua penaksir. Sesuatu
hal yang mudah untuk menjelaskan ukuran relatif dari dua varians dengan melihat
pada rasionya. Rasio ini disebut dengan efisiensi relatif (relative efficiency),
dinotasikan RE, untuk dua penaksir. Kita membentuk rasio efisiensi relatif sehingga
nilainya yang besar mengutungkan bagi penaksir yang disebutkan pertama kali. Jadi,
efisiensi relatif dari E1 ke E 2 (atau E1 terhadap E 2 ) diberikan melalui

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͶ͵
§ E · V (E2 )
RE ¨¨ 1 ¸¸ =
© E 2 ¹ V ( E1 )
Jika RE (E1 E 2 ) besar (lebih besar dari 1), maka V ( E 2 ) akan menjadi lebih besar
dari V ( E1 ) yang menguntungkan bagi E1 sebagai penaksir μ . Harus diingat bahwa
ukuran sampel untuk E1 dan E 2 harus sama dalam kalkulasi ini.

Andaikan RE (E1 E 2 ) = 2 . Hal ini menyatakan secara tidak langsung bahwa


V ( E 2 ) = 2V ( E1 ) , yang mana merupakan kasus yang menguntungkan bagi E1 . Cara
yang lain untuk membuat perbandingan ini adalah dengan menetapkan bahwa ukuran
sampel E 2 harus dua kali dari E1 agar membuat E1 dan E 2 ekuivalen dalam hal
varians. Jadi, RE bisa digagas dalam hal ekuivalensi ukuran sampel (atau usaha
penarikan sampel atau biaya penarikan sampel). RE = 1 menyatakan secara tidak
langsung bahwa dua penaksir ekuivalen; tidak menjadi masalah penaksir yang mana
yang kita gunakan.
RE biasanya didefinisikan dalam hal varians teoritis (varians populasi). Akan
tetapi, kita telah memberikan banyak varians taksiran dalam teks ini. Jadi, kita akan
melanjutkannya dalam semangat ini dan mendefinisikan
∧ § E · Vˆ ( E )
RE ¨¨ 1 ¸¸ = 2

© E 2 ¹ Vˆ ( E1 )

Sekarang kita harus hati-hati dalam menginterpetasi; bahwa RE (E1 E 2 ) > 1
tidak cukup mengartikan bahwa V ( E 2 ) > V ( E1 ) , karena kita hanya berurusan dengan
penaksir varians, yang akan mengalami perubahan dari sampel ke sampel. Akan
tetapi, jika kita mempunyai sampel besar (dan karenanya menjadi penaksir varians

yang baik), nilai dari RE (E1 E 2 ) akan sangat lebih besar dari 1 yang tentunya akan
betul-betul menunjukan bahwa E1 mungkin menjadi penaksir terbaik.
Sekarang kita menghitung taksiran efisiensi relatif untuk pelbagai kombinasi
dari empat penaksir μ y yang telah disebutkan diatas. Pertama, bagaimanapun, kita

harus mempertimbangkan pertanyaan kebiasan, karena tidak tepat untuk


membandingkan varians bagi penaksir-penaksir yang bias. Rata-rata y dari sampel

acak sederhana selalu penaksir takbias dari μ y , jadi tidak ada masalah bias (setidak-

tidaknya secara teoritis) dalam berurusan dengan penaksir ini.

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͶͶ
Pada sisi lain, penaksir rasio μ y secara umum bias, karena r = y x secara

umum penaksir bias dari R = μ y μ x . Bias menjadi tidak berarti jika hubungan antara

y dan x jatuh sepanjang garis lurus yang bergerak melalui titik asal. Hampiran untuk
bias relatif dari r diberikan oleh:

E (r ) − R § N − n ·§ s x2 sy s ·
≈¨ ¸¨¨ 2 − ρ̂ ⋅ x ¸¸
R © Nn ¹© x y x ¹

dengan ρ̂ adalah koefisien korelasi sampel antara x dan y.


Mengenai bias dari dua penaksir lainnya, penaksir regresi takbias jika
hubungan antara y dan x (regresi y pada x) jatuh sepanjang garis lurus, tidak perlu
melalui titik asal. Penaksir selisih selalu takbias dalam penarikan sampel acak
sederhana.
Dalam membandingkan penaksir rasio dengan rata-rata sampel per elemen y ,
kita mempunyai
∧ § E · Vˆ ( y )
RE ¨¨ 1 ¸¸ =
© E 2 ¹ Vˆ ( μˆ y )

s y2
=
s y2 + r 2 s x2 − 2rρ̂s x s y


sekarang, RE (μˆ y y ) > 1 jika

s y2 + r 2 s x2 − 2rρˆs x s y < s 2y

atau
r 2 s x2 > 2rρ̂s x s y

atau
rs x2 > 2 ρ̂s x s y (dengan asumsi r > 0 )

atau
1 rs x 1 s x x
ρˆ > =
2 sy 2 sy y

Besaran s x x disebut koefisien variasi. Pada situasi dimana penaksir rasio biasa
digunakan, y adalah nilai yang diperbaharui dari x (pendapatan kuartal pertama dalam
satu tahun dibandingkan dengan pendapatan kuartal pertama tahun sebelumnya, nilai
audit melawan nilai buku, dan lain-lain). Dalam kasus seperti ini, koefisien variasi

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͶͷ
dari y seharusnya sangat dekat dengan koefisien variasi dari x. Jadi, dalam situasi
seperti ini, penaksir rasio lebih efisien daripada rata-rata sampelper elemen penaksir
1
jika ρˆ > .
2
Secara keseluruhan, penaksir rasio akan lebih efisien daripada y jika variasi
diantara x relatif lebih kecil terhadap variasi diantara y dan korelasi antara x dan y
bernilai positif yang besar. Jika peneliti mempunyai pilihan seperti bagaimana
memilih nilai-x, ia sebaiknya memilih mereka hampir terus-menerus.
Perbandingan sederhana dari penaksir regresi dengan rata-rata per elemen
y dan penaksir rasio μ̂ y membutuhkan beberapa modifikasi taksiran varians. Ingat

bahwa
μˆ yL = y + b( μ x − x )
dengan b adalah penaksir kemiringan (slope) dari garis regresi. Varians taksiran dari
μ̂ yL telah diberikan (lihat persamaan (7.29) yaitu

§ N − n ·§ 1 · ª n n
º
Vˆ ( μˆ yL ) = ¨ ¸ «¦ ( y i − y ) − b ¦ ( xi − x )2»
2 2
¸¨
© Nn ¹© n − 2 ¹ ¬ i =1 i =1 ¼
Jika kita membuat sedikit perubahan dengan mengganti (n-2) oleh (n-1) pada
penyebutnya, kita akan mempunyai
§ N −n· 2
Vˆ ( μˆ yL ) ≈ ¨ [ 2 2
¸ sy − b sx ]
© Nn ¹
dan, karena
sy
b = ρ̂
sx

Vˆ ( μˆ yL ) menjadi

§ N −n· 2
Vˆ ( μˆ yL ) ≈ ¨ (
¸ s y 1 − ρˆ
2
)
© Nn ¹

Hampiran Vˆ ( μˆ yL ) ini baik sepanjang n agak besar; (n-2) digunakan pada penyebut

untuk mencegah menaksir varians terlalu rendah (underestimation) yang serius dalam
situasi sampel kecil.
Dengan menggunakan hampiran varinas yang telah disederhanakan diatas,
^ § μˆ yL · s2 1
RE ¨¨ ¸¸ = 2 y 2 =
© y (
¹ s y 1 − ρˆ )
1 − ρˆ 2

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͶ͸
yang akan lebih besar dari satu jika ρ̂ tidak samadengan nol. Pada faktanya, RE
besarnya bisa menjadi takhingga ketika ρ̂ mendekati satu. Jadi, μ̂ yL selalu lebih

efisien dari y sebagai penaksir dari μ y . (akan tetapi, ingat bahwa μ̂ yL akan

mempunyai masalah bias yang serius kecuali regresi y pada x benar-benar linear.)
Ketika membandingkan taksiran regresi dengan taksiran rasio,
^ § μˆ yL · s y2 + r 2 s x2 − 2rρˆs x s y
RE ¨ ¸=
¨ μˆ y
©
¸
¹ (
s 2y 1 − ρˆ 2 )
^
Pada kasus ini. RE >1 akan menunjukan
r 2 s x2 − 2rρˆs x s y > − ρˆ 2 s 2y

atau
(ρˆs y − rs x ) > 0
2

karena ρ̂s y = bs x , maka (bs x − rs x ) > 0


2

yang menunjukan
(b − r )2 >0
Jadi, penaksir regresi lebih efisien dari penaksir rasio kecuali b=r, dimana kasus
mereka ekuivalen.Kasus b=r akan terjadi ketika regresi y pada x linear melalui titik
asal dan varians y sebanding dengan x.

GAMBAR 7.2 Plot dari penerimaan kas (y) dengan banyaknya pembeli (x)

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͶ͹
Situasi yang seperti ditunjukan pada gambar 6.2, dengan kasus penerimaan kas
untuk periode penjualan yang telah ditetapkan yang berhubungan dengan banyaknya
pembeli. Catatan bahwa nilai penerimaan melebar ketika x meningkat.
Penaksir selisih
μˆ yD = y + ( μ x − x )
selalu penaksir takbias dari μ pada penarikan sample acak sederhana, dan varians
taksirannya adalah
n

¦ (d −d)
2
i
§ N −n·
Vˆ ( μˆ yD ) = ¨ ¸
i =1

© Nn ¹ n −1
bisa ditulis
§ N − n ·§ 1 · n
Vˆ ( μˆ yD ) = ¨ ¸¦ [( y i − y ) − ( xi − x )]
2
¸¨
© Nn ¹© n − 1 ¹ i =1
§ N −n· 2

Nn
[
¸ s y + s x − 2 ρ̂s x s y
2
]
© ¹
Dalam membandingkan penaksir selisih dengan rata-rata sample per elemen,
kita mempunyai

^ § μˆ yD · s y2
RE ¨ ¸=
¨ μˆ y ¸ s 2 + s 2 − 2 ρˆs s
© ¹ y x x y

yang lebih besar dari satu ketika


2 ρˆs x s y > s x2

atau
^
sx
ρ>
2s y

Jika variasi dalam x’s dan y’s sama, Penaksir difference akan menjadi lebih efisien
1
dibanding y ketika korelasi antara x dan y lebih besar dari 2
.

Ketika membandingkan penaksir regresi dengan penaksir difference kita


punya model
^
§ μ^ yL · s2y + s2x − 2 ρ sx s y
RE¨ ^ ¸ =
^

¨ μ yD ¸ 2§
^ 2
·
© ¹ sy ¨ 1 − ρ ¸
© ¹

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͶͺ
yang lebih baik lagi jika diuraikan
^ ^ 2
2 2
sx − 2 ρ sx s y > − ρ s y
atau
2
§¨ − ρ^ ·¸ > 0
© sx sy
¹
^
Sejak bsx = ρ s y penaksir regresi akan menjadi sama dengan penaksir difference bila

b=1. Di lain pihak, penaksir regresi akan menjadi lebih efisien daripada penaksir
difference.
Sekarng kita akan melihat beberapa nilai numeric dari efisiensi relative untuk
data yang telah kita analisis terlebih dahulu pada bab ini. Data dari table 7.1 dalam
real estate valuation diplotkan dalam gambar 7.3. Melihat point data tersebut yang
jatuh sepanjang garis lurus dengan kemiringan dekat dengan persamaan (dalam
kenyataan, b=0.977 untuk penaksir regresi) dan y mendekati 0. Untuk kasus ini

E( r ) − R
≈ 0.0053
R
Jadi nilai relative bias untuk penaksir ratio tidak terlalu berpengaruh.

Untuk data ini,

§ μ^ ·
^
¨ yL ¸
RE ¨ ^ ¸ = 1.13
© μy ¹
dan

§ μ^ ·
^
¨ yD ¸
RE ¨ ^ ¸ = 1.01
© μy ¹
jadi ketiga penaksir, regresi, ratio, dan difference adalah tentang persamaan yang ada
dalam penaksir varians. Salah satu dari ketiga penaksir tersebut bekerja dengan baik
untuk masalah menaksir μ y atau τy dengan data tersebut. Tapi

§ μ^ ·
RE¨
yL ¸
^
= 14.96
¨ y ¸
© ¹

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͶͻ
jadi y bias menjadi penaksir yang buruk dari μ y , sebagai perbandingan salah satu

dari 3 penaksir membuat taksiran dari x’s. Di lain pihak, itu membuat 15 kali atau

lebih pengamatan untuk mencapai sukses dalam varians yang sama dengan y adalah
^
yang terbagus dengan μ yL .

Data dari table 7.2 tentang kadar gula dengan berat jeruk, hal 159, yang telah
diplot dalam table 7.4. Disini, point data terdapat sepanjang garis lurus tapi
kemiringannya tidak cukup dekat dengan komunitas (kenyataannya, b=0.123) y
intercept signifikan berbeda dari 0. Nilai relative bias dari r = -0.00077 tidak terlalu
berpengaruh, tapi

§ μ^ ·
RE¨ ^ ¸ = 16.79
^
yL

¨ ¸
© μy ¹
Hal ini mengimplikasikan akurasi yang lebih baik dalam mencapai sukses dalam
penaksiran μ y atau τy yang dikerjakan oleh penaksir regresi lebih baik dari penaksir

ratio. Penaksir difference tidak dapat digunakan dalam masalah ini.

Dari contoh 7.9, kita mempunyai data nilai akhir kalkulus dengan nilai tes psikotes.
Kemiringan dalam garis ini tidak cukup dekat dengan komunitas (b=0.766) dan y
intercept jauh dari 0. Perhitungannya ditunjukan

§ μ^ ·
RE¨ ^ ¸ = 4.84
^
yL

¨ ¸
© μy ¹
dan

§ μ^ ·
RE¨ ^ ¸ = 1.22
^
yL

¨ ¸
© μ yD ¹
Disini penaksir regresi biasanya lebih baik dari penaksir ratio, tapi penaksir difference
bias dipakai tetapi kurang efisien.
Untuk data dalam contoh 7.10, ketiga metode, ratio, regresi dan difference
sebenarnya sama; penaksir difference adalah yang paling mudah dihitung jadi itu
adalah pilihan yang masuk akal.

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͷͲ
Dalam kesimpulan, analisis dari data bivariate harus selalu dimulai dengan
memplot titiknya. Jika titiknya jatuh sepanjang garis lurus permulaannya maka tepat
sekali mengambil penaksir difference, ketiga metode yang melibatkan x’s dan y’s
adalah mungkin. Agar penaksir difference bekerja dengan baik, kemiringan dari garis
harus cukup dekat dengan salah satu titiknya. Jika titiknya jatuh sepanjang garis lurus
tidak melalui garis normal, maka penaksir regresi adalah yang terbaik, dalam

hubungan dengan varians. Jika titiknya tidak jatuh sepanjang garis lurus, mungkin y

sebaiknya digunakan (atau untuk penanganan analisis regresi lebih detail).

VII.8 KESIMPULAN

Dengan mengukur variable Y dan variable tambahan X pada masing2 elemen


dalam sample, kita dapatkan informasi tambahan untuk menaksir parameter populasi
yang bersangkutan. Ketika korelasi positif yang kuat ada antara variable X dan Y ,
prosedur penaksiran ratio biasanya menyediakan taksiran yang lebih tepat dari μ y dan

τy daripada melakukan prosedur normal yang dihadirkan dalam bab sebelumnya.

Ukuran sample yang dibutuhkan dihadirkan untuk menaksir μ y , τy dan R

dengan bound of error yang sama dengan B. pada masing masing kasus seseorang
harus mendapatkan penaksirdari σ 2 dari informasi sebelumnya atau study persiapan
untuk memperkirakan ukuran sample yang dibutuhkan.
Penaksiran regresi adalah salah satu teknik untuk menggabungkan informasi
pada variable tambahan. Metode ini biasanya lebih baik daripada metode penaksiran
ratio jika hubungan antara Y dan X adalah berupa garis lurus yang tidak melalui asal.
Walaupun metode ini bisa diterapkan dengan desain sampling apapun, kita
menitikberatkan pada sampling acak sederhana., ketika menyebutkan stratified
random sampling untuk kasus ratio.
Metode penaksiran pembeda dalam prinsipnya sama dengan dengan
penaksiran regresi .ini bekerja dengan baik ketika plot Y dengan X menampakkan
titik yang uniform pada garis lurus dengan slope unit.

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͷͳ
TINJAUAN MATA KULIAH

VIII. 2 Sampling Peluang

Sebuah proses sampling disebut sebagai sampling nonpeluang bila tidak


semua unit mempunyai peluang untuk terpilih atau dalam proses memilih satuan-
satuan sampling tidak dilibatkan peluangnya. Proses pemilihan tanpa melibatkan
peluang merupakan proses yang sederhana tetapi mempunyai kerugian yang sangat
besar, yaitu dalam analisis datanya tidak boleh digunakan test of significance, artinya
analsis inferensial secara statistis tidak diperkenankan (tidak valid).

Ke dalam sampling nonpeluang termasuk diantaranya adalah


a. Sampling Seadanya (Haphazard/Accidental Sampling)
Yaitu proses pengambilan sampel sedemikian sehingga unit sampling
diperoleh seadanya. Jadi siapa atau apa saja yang secara kebetulan ada bila
dipandang cocok sebagai sumber data, maka dapat digunakan sebagai sampel.
Contohnya, proses penelitian suatu fosil
b. Sampling Sukarela (Voluntary Sampling)
Yaitu sampling dimana unit sampling adalah mereka yang mau secara sukaela
menjadi anggota sampel. Jenis sampling ini banyak digunakan dalam
penelitian medis. Orang sebagai unit observasi diminta secara sukarela untuk
menjadi objek percobaan.
c. Purposive Sampling (Judgement Sampling)
Yaitu proses pengambilan sampling dipilih atas dasar pertimbangan seseorang.
Penelitian tentang pendapat masyarakat akan suatu kebijakan yang dillakukan
terhadap tokoh-tokoh mayarakat yang ditunjuk merupakan penelitian dengan
menggunakan purposive sampling.
d. Snowball Sampling
Dalam jenis sampling ini, unit sampling secara berangkai atas informasi yang
diberikan oleh unit sampling yang terpilih sebelumnya.
Contohnya seorang Dokter yang akan melakukan penelitian mengenai pasien
yang

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͷͶ
e. Quota Sampling
Merupakan suatu tipe sampling dengan menggunakan beberapa kuota sampai
pada kuota yang diinginkan. Tipe sampling ini sangat banyak digunakan
dalam penelitian pemasaran dan dalam penelitian pengumpulan pendapat
(opinion poll)
Contoh : Dalam suatu penelitian mengenai tingkat kepuasan konsumen
terhadap suatu produk rokok akan diambil sampel dengna beberapa ketentuan
berikut :
- Quota 1 : Akan diteliti sebanyak 300 konsumen yang telah menggunakan
produk tersebut (angka 300 merupakan hasil pertimbangan sebagai akibat dari
keterbatasan dana, tenaga, dan waktu)
- Quota 2 : Konsumen yang diambil adalah pria yang berusia 25 - 35 tahun
- Quota 3 : Tingkat pendidikan dari konsumen sekurang-kurangnya SMU.
f. Sampling Jenuh
Apabila sutau populasi memiliki anggota yang sedikit (dalam hal ini kurang
dari 30), maka semua elemennya bisa digunakan sebagai sampel. Proses
penarikan sampel seperti ini dinamakan Sampling Jenuh. Jadi dengan kata lain
bahwa sampling jenuh merupakan sensus.
Keuntungan sampling non pleuang adalah dari aspek kemudahan memperoleh unit
sampling. Namun, data yang dikumpulkan berdasarkan sampling jenis ini tidak dapat
digeneralisir atau tidak dapat dianalisis lebih jauh melalui alat analisis statistika.

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA – Universitas Padjadjaran ͳͷͷ

Anda mungkin juga menyukai