Anda di halaman 1dari 130

Bahan Ajar Sampling - Yudhie Andriyana

Jurusan Statistika, FMIPA Universitas Padjadjaran 4


TINJAUAN MATA KULIAH
BAB I
PENDAHULUAN
I. 1 Beberapa Definisi
Dalam berbagai media sering dijumpai hasil jejak pendapat dari masyarakat
tentang isu tertentu, jejak pendapat itu dilakukan untuk mengetahui gambaran
pendapat dari masyarakat di daerah dimana jejak pendapat ini dilakukan. Hal serupa
juga dijumpai dalam publikasi-publikasi penelitian ilmiah baik yang ditulis dalam
rangka penyelesaian studi mahasiswa maupun yang tertera dalam jurnal-jurnal
penelititan. Pada dasarnya semuanya menghendaki gambaran menyeluruh yang
didasarkan pada sebagian objek yang diteliti yang disebut sampel. Gambaran ini
dihasilkan oleh proses generalisasi atau disebut juga dengan proses induksi .Oleh
karena itu, agar diperoleh gambaran yang bisa mengungkapkan keadaan menyeluruh
yang sebenarnya, diperlukan dua hal, yaitu proses induksi yang dilakukan dengan cara
yang tepat, dan sampel yang tergolong baik. Dengan proses induksi yang tepat
diartikan sebagai proses yang menggunakan teknik-teknik analisis yang cocok untuk
permasalahan yang dikaji serta mengikuti kaidah-kaidah yang mendasarinya. Sampel
dikatakan baik apabila dapat menggambarkan semua sifat atau karakteristik dari
keseluruhan objek yang diteliti. Untuk dapat memperoleh sampel seperti ini,
diperlukan teknik yang disebut teknik sampling.
Terdapat beberapa definisi yang diperlukan untuk membahas teknik ini.
I.1. 1 Populasi dan Sampel
Populasi merupakan keseluruhan (totality) objek, baik itu dari hasil
menghitung maupun mengukur, yang dibatasi oleh kriteria tertentu. Objek populasi
tersebut terbagi menjadi dua bagian, yaitu objek yang bisa diraba/kongkret (tangiable)
dan objek yang tidak bisa diraba/abstrak (untangiable). Banyaknya objek yang ada
dalam populasi disebut ukuran populasi (population size) yang biasanya
dilambangkan dengan N. Ukuran populasi ini besarnya ada yang bisa dihitung
(countable) dan juga tidak terhitung (uncountable). Apabila ukuran populasi
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran S
berapapun besarnya, tapi masih bisa dihitung, maka populasi tersebut dinamakan
populasi terhingga (finite population). Jika ukuran populasi sudah sedemikian
besarnya sehingga sudah tidak bisa lagi dihitung, maka populasi itu dinamakan
populasi takhingga (infinite population). Apabila suatu penelitian dilakukan terhadap
semua anggota populasi, maka prosesnya dinamakan Sensus
Dalam suatu penelitian, seringkali peneliti tidak bisa memeriksa seluruh
anggota populasi (sensus). Oleh karena itu, hanya diambil sebagian saja dari anggota
populasi sehingga diperolehlah sampel yang besarnya dilambangkan dengan n.
Adapun proses pengambilan sebagian anggota populasi tersebut dinamakan sampling.
Gambaran mengenai proses sampling bisa dilihat dari ilustrasi berikut ini :
Gambar I. 1 Proses Sampling
Terdapat beberapa alasan sehingga peneliti cenderung lebih memilih proses
sampling daripada sensus, yaitu :
a. Mengurangi biaya, apabila kita melakukan penelitian terhadap sebagian dari
anggota populasi, maka akan berakibat pada penghematan biaya.
b. Masalah tenaga, jelas bahwa semakin banyak objek yang kita teliti, maka
akan berakibat pada semakin banyaknya tenaga yang kita butuhkan baik itu
tenaga pengumpul data / pencacah, pencatat / entri data maupun pengolah
data. Apabila ada keterbatasan untuk ketiga hal tersebut, maka sampling
merupakan alternative terbaik untuk dilakukan.
c. Efisiensi waktu, apabila diinginkan kesimpulan yang segera, maka sampling
akan lebih tepat untuk digunakan. Hal ini dikarenakan dengan memperkecil
Parameter

Statistik
p
s
x
POPULASI ( N )
SAMPEL ( n )
Alasan -alasan
Proses Induksi
Sampling
Sensus
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 6
banyaknya objek yang akan diteliti maka data akan lebih cepat diperoleh dan
dianalisis.
d. Tingkat ketelitian lebih besar, dalam suatu proses penelitian dari mulai
pengumpulan data, pancatatan, dan penganalisisan data harus dilakukan
dengan benar dan tepat. Apabila kita telah memakai tenaga-tenaga yang
berkualitas baik dan diberi latihan intensif, serta pengawasan terhadap
pekerjaan lapangan diperketat tetapi memberikan volume pekerjaan yang
besar dan cenderung monoton, maka akan menimbulkan kebosanan baik itu
dari pencacah maupun peneliti. Oleh karena itu, akan diperoleh data yang
kurang dapat dipercaya kebenarannya.
e. Penelitian bersifat destruktif (penelitian yang sifatnya merusak), sensus tidak
mungkin dilakukan untuk objek yang sifatnya merusak. Misalnya dalam
menguji golongan darah seseorang, maka tidak mungkin semua darah
dikeluarkan untuk diperiksa. Jadi dalam hal ini, sensus tidak mungkin lagi
untuk dilakukan.
f. Faktor ekonomis, yang dimaksud dengan faktor ekonomis adalah
kesepadanan antara biaya, tenaga dan waktu yang dikeluarkan dengan
informasi yang akan diperoleh. Apabila nilai dari infomasi tersebut tidak
sepadan dengan biaya, tenaga dan waktu, maka sensus menjadi tidak baik lagi
untuk dilakukan.
I. 1. 2 Unit Observasi
Suatu objek dimana perlakuan dilakukan disebut unit observasi. Ini merupakan
unit dasar dari observasi yang terkadang disebut elemen. Dalam penelitian tentang
perilaku masyarakat, maka individu masyarakat adalah unit observasi.
I. 1. 3 Populasi Target
Populasi Target merupakan keseluruhan kumpulan pengamatan/observasi
secara lengkap yang akan dipelajari. Menentukan populasi target merupakan langkah
awal yang penting pada saat seseorang akan melakukan penelitian. Dalam beberapa
keadaan sulit untuk menentukan populasi target. Sebagai contohnya, dalam
pemungutan suara dalam bidang politik, apakah target populasinya harus semua orang
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 7
dewasa yang layak memilih? Semua pemilih yang terdaftar? Semua orang yang
dipilih pada pemilihan terakhir? Pillihan dari target populasi akan memberikan efek
statistik yang sangat besar terhadap hasilnya. Jadi, dalam setiap penelitian seorang
peneliti pada langkah pertama strateginya harus menentukan secara jelas populasi
targetnya yaitu yang nantinya akan menjadi cakupan kesimpulan penelitian. Oleh
karena itu, apabila dalam sebuah hasil penelitian dikeluarkan kesimpulan, maka
menurut etika penelitian, kesimpulan itu hanya berlaku untuk populasi target yang
telah ditentukan.
I. 1. 4 Populasi yang disampel
Populasi yang disampel adalah populasi dimana sampel akan diambil. Pada
suatu saat tertentu setelah peneliti menentukan secara tegas populasi targetnya,
peneliti tidak bisa memperoleh keterangan mengenai populasi targetnya, sehingga
populasi yang ditelitinya berbeda (lebih kecil) dari populasi sasarannya.
Jadi dalam suatu penelitian survey, idealnya populasi yang disampel adalah
juga populasi target, namun keadaan ideal ini jarang terjadi. Contoh, dalam survey
masyarakat, populasi yang disampel biasanya lebih kecil dari populasi target, seperti
tampak dalam gambar berikut :
Populasi yang
disampel
Tidak termasuk
dalam kerangka
sampling
Tidak dapat
dijangkau
Menolak
merespon
Tidak dapat
dijangkau
Tidak layak
untuk di
survai
Populasi
Kerangka
sampling
Gambar I. 2 Populasi target dan populasi yang disampel
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 8
Populasi target dan populasi yang disampel dalam survey atau jajak pendapat
terhadap suatu kebijakan dari para pemilih melalui suatu telephone, maka yang
menjadi populasi target adalah semua pemilih yang terdaftar. Namun tidak semua
pemilih mempunyai telephone, dengan demikian pemilih yang mempunyai telephone
dan yang mau menelephone serta berhak merupakan populasi yang disampel.
I. 1. 5 Unit sampling
Unit sampling merupakan segala sesuatu yang oleh peneliti dijadikan kesatuan
(unit) yang nantinya akan menjadi objek pemilihan. Jadi unit sampling itu adalah unit
yang diambil sebagai sampel. Unit sampling ini bentuknya bisa individu yang berdiri
sendiri yang disebut satuan elementer (Elementary Unit), dan bisa juga kumpulan
individu yang disebut Cluster. Misalnya, apabila universitas dibagi ke dalam beberapa
fakultas dan dalam penelitian fakultas ini yang akan dipilih, maka fakultas tersebut
mejadi unit sampling. Tetapi apabila universitas dibagi menjadi beberapa jurusan dan
jurusan ini yang akan dijadikan objek penelitian, maka sekarang yang menjadi unit
samplingnya adalah jurusan.
I. 1. 6 Kerangka sampling
Kerangka sampling (sampling frame) adalah daftar unit sampling yang ada
dalam sebuah populasi. Dalam survey tentang pendapat masyarakat akan suatu
kebijakan, maka bila unit samplingnya adalah rumah tangga, daftar yang berisikan
rumah tangga, nomor rumah serta alamatnya dan karakteristik lain yang berkaitan,
disebut kerangka sampling.
Dalam teori sampling, apabila kita harus menyusun sampel, kemudian
terhadap data yang dikumpulkan dari sampel ini kita ingin melakukan analisis secara
statistis, maka sampel yang kita susun tadi harus merupakan sampel random. Sampel
random hanya bisa disusun apabila ada kerangka sampling. Oleh karena itu untuk bisa
memperoleh sampel random, kerangka sampling mutlak harus ada.
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 9
I. 1. 7 Bias

Parameter-parameter populasi hanya bisa diketahui nilainya jika penelitiannya sensus.
Dalam penelititan yang bukan sensus, untuk mengetahui nilai parameter tertentu,
dilakukan penaksiran melalui sampel.
Definisi :
Apabila dari sebuah populasi kita akan menaksir sebuah parameter dengan penaksir

, maka

disebut estimator untuk .


Contoh :
- Kita ingin menaksir parameter dengan X , maka X adalah estimator untuk

- Kita ingin menaksir parameter


2
dengan s
2
, maka s
2
adalah estimator untuk

2
- Kita ingin menaksir parameter dengan p, maka adalah estimator untuk p.
Apabila harga ekspektasi untuk sesuatu penaksir tidak sama dengan parameter yang
ditaksir maka penaksir itu dikatakan bias.
Definisi :
Apabila

merupakan penaksir untuk yang memenuhi persyaratan bahwa rata-rata


untuk semua

nilainya sama dengan , maka dikatakan

adalah penaksir tak bias


untuk .
Definisi:
Apabila parameter yang akan ditaksir adalah dan penaksirnya adalah

maka bias
didefinisikan sebagai
| )

( | E B =
Bias adalah selisih mutlak antara parameter yang ditaksir dengan ekspektasi
penaksirnya.
a. Bias dalam pemilihan unit sampel
Sampel yang baik adalah sampel yang bebas dari bias (bias dalam pemilihan
unit sampel) terjadi bila beberapa bagian dari populasi target tidak ada dalam populasi
yang disampel. Bila suatu survey dirancangkan untuk mempelajari pendapatan rumah
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 1u
tangga yang tinggal menetap (tidak termasuk komuter), maka taksiran rata-rata
pendapatan rumah tangga akan mungkin terlalu besar, sehingga memberikan taksiran
yang bias.
b. Bias dalam pengukuran
Sampel yang baik adalah juga sampel yang mempunyai sifat bahwa responden
merespon pertanyaan dengan akurat. Bias dalam pengkuran terjadi bila instrument
yang digunakan untuk mengukur cenderung akan memberikan hasil yang berbeda dari
yang sesungguhnya. Jadi instrument tersebut gagal untuk dapat mengukur apa yang
sebenarnya harus diukur.Mengukur apa yang seharusnya merupakan hal yang
memang sulit dalam penelitian sosial karena penelitian biasanya berkaitan dengan
pengukuran karakteristik manusia, yang kadang-kadang tidak bersedia untuk
mengatakan hal yang sebenarnya. Dla survey penelitian yang dilakukan terhadap
petani dalam rangka pemberian bantuan makanan maka mereka akan cenderung
merendahkan hasil pertaniannya dengan harapan memperoleh bantuan pangan.
I. 1. 8 Error sampling dan nonsampling
Dalam poling pendapat sering dijumpai pernyataan bahwa sampel yang
diambil menggunakan margin error sebesar 5%. Margin error menggambarkan
besarnya sampling error yang ingin diambil oleh peneliti, yaitu error yang dihasilkan
akibat penelitian menggunakan sampel (bukan populasi), Idealnya error harus sekecil
mungkin, namun bila memperkecil error berakibat bertambah besar sampel. Jika
peneliti mengambil sampel lain yang berbeda, maka jelas akan didapat nilai taksiran
yang juga berlainan. Error sampling biasanya dinyatakan dengan terminology
probabilitas.
Jadi error sampling merupakan selisih antara nilai parameter dengan nilai
statistik penaksirnya.
Definisi:
Apabila merupakan sebuah parameter dan

merupakan penaksir bagi maka error


sampling didefinisikan sebagai:
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 11
|

| =
Error sampling bisa pula berarti semua bentuk error yang ditimbulkan karena proses
sampling. Apabila kekeliruan yang terjadi bukan karena proses sampling maka
kekeliruan itu disebut non-sampling error. Sebagai contoh adalah kekeliruan
pengumpulan data sebagai akibat kekeliruan questioner, pemilihan unit sampel dan
ketidakakuratan merespon. Jadi non-sampling error adalah error yang tidak dapat
ditandai dari variabilitas satu sampel dengan sampel lainnya.
I. 1. 9 Presisi dan Akurasi

Presisi menunjukkan kekonsistenan atau keseragaman dari nilai penaksir.
Makin seragam nilai dari suatu penaksir, maka makin baik presisinya. Dengan kata
lain bahwa datanya semakin homogen. Dalam ukuran statistik, presisi dinyatakan
dengan standard error Jadi penaksir yang baik adalah penaksir yang memiliki
standard error paling kecil .
Sedangkan Akurasi menunjukkan jarak terhadap target. Dalam statistik, yang
menggambarkan akurasi adalah bias yaitu selisih antara penaksir dengan yang
ditaksir.
Gambaran mengenai presisi dan akurasi bisa dilihat dengan menggunakan
pemisalan berikut :

X X X X
X X X X X X XX
X X X X
X X X X
Gambar I. 3 Ilustrasi presisi dan akurasi dari suatu taksiran
Gambar di atas dimisalkan sebagai target panahan. Tiga orang pemanah
menembakkan anak panahnya masing-masing pada tiap target tersebut. Dari hasilnya
terlihat bahwa ternyata pemanah A memiliki tingkat presisi dan akurasi yang rendah,
Pemanah A Pemanah C Pemanah B
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 12
dalam arti bahwa hasil dari tembakannya tidak tepat sasaran dengan variasi yang tidak
konsisten. Sedangkan untuk pemanah B menghasilkan suatu tembakan yang konsisten
sehingga bisa dikatakan bahwa dia memiliki presisi yang tinggi, tetapi masih tidak
tepat sasaran atau akurasinya rendah. Untuk pemanah C memberikan kondisi yang
terbaik, yaitu memiliki presisi dan akurasi yang tinggi, artinya selain tepat sasaran,
juga hasil tembakannya konsisten. Dalam masalah sampling, kondisi seperti pemanah
C-lah yang diinginkan.
I. 1. 10 Rencana Sampling (Sampling Plan) dan Rancangan Sampling (Sampling
Design)

Ketika kita melakkukan proses sampling, maka secara tegas kita membedakan
apa yang dimaksud dengan Rencana Sampling dan Rancangan Sampling.
Rencana Sampling merupakan sebuah gambaran garis besar yg menyangkut :
1. Penentuan populasi sasaran
2. Penentuan bentuk dan ukuran satuan sampling
3. Penentuan ukuran sampel ( n )
4. Penentuan cara memilih satuan sampling
Apabila pada rencana sampling di atas kita menambahkan metode penaksiran/metode
analisis, maka rencana sampling meningkat menjadi Rancangan Sampling.
Gambar I. 4 Rencana Sampling dan Rancangan Sampling
I. 1. 11 Finite Population Correction (FPC)
Apabila kita berhadapan dengan penelitian yang memiliki ukuran populasi
terhingga, maka FPC harus dicantumkan pada rumus Standard Error. Jika
Rancangan Sampling
Rencana Sampling
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 1S
populasinya tak hingga, maka FPC dianggap sama dengan 1 dan tidak usah
dicantumkan dalam rumus Standard Error.
Bentuk dari FPC itu adalah
1

N
n N
, tetapi bentuk ini tidak bisa memberikan
keterangan mengenai beberapa hal yang penting. Oleh karena itu dalam pembicaraan
ita mengenai sampling, bentuk FPC yang akan kita gunakan adalah :

N
n
N
n N
1
Dengan menggunakan rumus

=
N
n
FPC 1 , maka diperoleh dua buah keterangan
yaiotu :
a.
N
n
, disebut sampling fraction, menyatakan berapa persen sampel yang kita buat
(dari populasi). Misalnya jika ada keterangan
N
n
= 0.15, maka berarti bahwa
ukuran sampel adalah 15 % dari populasinya.
b.
N
n
menyatakan besarnya peluang setiap satuan sampling untuk termasuk ke dalam
sampel berukuran n.
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 16
TINJAUAN MATA KULIAH
I. 3 Distribusi Sampling
Sebagaimana yang telah diuraikan sebelumnya bahwa dengan berbagai
alasan, peneliti cenderung melakukan sampling daripada sensus. Dalam
kenyataannya, akan terdapat lebih dari sebuah sampel berukuran n yang mungkin
yang bisa diambil dari populasi berukuran N. Adanya beberapa kemungkinan
sampel yang bisa diambil menunjukkan adanya bermacam-macam kombinasi data
populasi yang bisa terambil Akan tetapi dalam prakteknya hanya akan diambil
sebuah sampel untuk digunakan dalam penelitiannya, dengan kata lain bahwa
hanya akan diambil satu buah kombinasi data. Sampel yang diambil biasanya
dipilih secara acak, disebut dengan sampel acak. Selanjutnya dari sampel tersebut
dilakukan proses analisis sesuai dengan tujuan penelitiannya. Sebagai contohnya
adalah pada sampel yang bersangkutan akan diperoleh taksiran parameter populasi

dari ( merupakan lambang parameter populasi [ ]


2
, , , sedangkan

merupakan lambang penaksir parameter populasi [ ]


2
, , s p x ). Kumpulan nilai-nilai

pada sampel-sampel yang mungkin disebut sebagai distribusi sampling dari

.
Banyaknya kemungkinan sampel yang bisa diambil tergantung pada
proses pengambilan unit-unit populasinya. Berdasarkan proses memilihnya,
sampling terbagi ke dalam dua tipe, yaitu sampling dengan pengembalian dan
sampling tanpa pengembalian. Sampling dengan pengembalian merupakan suatu
proses pengambilan sampling dimana sampel yang telah terpilih dikembalikan
lagi ke dalam populasi sebelum pemilihan selanjutnya dilakukan, sehingga ada
kemungkinan suatu satuan sampling tertentu akan terpilih lebih dari sekali. Oleh
karena itu, jika sampling dilakukan dengan pengembalian, maka akan terdapat N
n
buah sampel yang berlainan. Adapun sampling tanpa pengembalian merupakan
suatu proses pengambilan sampel dimana satuan sampling yang telah terpillih
tidak dikembalikan lagi ke dalam populasi, sehingga setiap satuan sampling hanya
memiliki kesempatan terpilih satu kali. Oleh karena itu, jika sampling dilakukan
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 17
tanpa pengembalian, maka akan terdapat
( ) ! !
!
n N n
N
n
N

buah sampel yang


berlainan.
I. 3. 1 Distribusi sampling Rata-rata
Dikatakan distribusi sampling rata-rata karena tujuan dari penelitian ini
adalah untuk menaksir rata-rata dari populasi. Oleh karena ada beberapa
kemungkinan sampel yang akan terbentuk, maka untuk tiap-tiap sampel yang
bersangkutan juga akan terdapat beberapa rata-rata sampelnya. Anggap rata-rata
ini sebagai data baru, maka akan terbentuk suatu kumpulan data yang terdiri dari
rata-rata dari sampel-sampel. Dari kumpulan rata-rata tersebut dicari rata-rata dan
simpangan bakunya, maka akan diperoleh rata-rata dari rata-rata, disimbolkan
dengan
x
dan simpangan baku dari rata-rata, disimbolkan dengan
x
.
Sebagai contoh, pada tabel berikut terdapat data mengenai nilai intelegensi calon
legislatif yang menggunakan ijasah palsu. Terdapat 5 calon legislatif yang
mengunakan ijasah palsu dengan nilai intelegensi masing-masing 50, 60, 70, 80,
dan 90. Dari populasi 5 calon legislatif tersebut, diambil 2 sampel secara
berulang-ulang sampai semua kemungkinan sampel terambil.
No. Caleg Nilai Intelegensi
1
2
3
4
5
50
60
70
80
90
Dari data di atas diperoleh rata-rata populasi berikut :
70
5
350
1
=
=
=

=
N
X
N
i
i

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA Universitas Padjadjaran 18
dan simpangan bakunya adalah :
( )
( ) ( ) ( ) ( ) ( )
14214 , 14
5
1000
5
70 90 70 80 70 70 70 60 70 50
2 2 2 2 2
1
2
=
=
+ + + +
=

=
N
X
N
i
i

a. Apabila sampling dilakukan dengan pengembalian, maka diperoleh 5


2
= 25
buah kemungkinan sampel, yaitu :
Sampel Caleg yang terpilih Nilai Intelegensi
Rata-rata
Nilai Intelegensi
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
1 ; 1
1 ; 2
1 ; 3
1 ; 4
1 ; 5
2 ; 1
2 ; 2
2 ; 3
2 ; 4
2 ; 5
3 ; 1
3 ; 2
3 ; 3
3 ; 4
3 ; 5
4 ; 1
4 ; 2
4 ; 3
4 ; 4
4 ; 5
50 ; 50
50 ; 60
50 ; 70
50 ; 80
50 ; 90
60 ; 50
60 ; 60
60 ; 70
60 ; 80
60 ; 90
70 ; 50
70 ; 60
70 ; 70
70 ; 80
70 ; 90
80 ; 50
80 ; 60
80 ; 70
80 ; 80
80 ; 90
50
55
60
65
70
55
60
65
70
75
60
65
70
75
80
65
70
75
80
85
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 19
21
22
23
24
25
5 ; 1
5 ; 2
5 ; 3
5 ; 4
5 ; 5
90 ; 50
90 ; 60
90 ; 70
90 ; 80
90 ; 90
70
75
80
85
90
Tabel di atas merupakan distribusi sampel untuk nilai intelegensi. Terlihat dari
tabel di atas bahwa terdapat data baru sebanyak 25 rata-rata. Distribusi dari rata-
rata tersebut juga bisa disajikan ke dalam bentuk berikut :
Rata-rata
Nilai Intelegensi
Frekuensi P(X)
50
55
60
65
70
75
80
85
90
1
2
3
4
5
4
3
2
1
0,04
0,08
0,12
0,16
0,2
0,16
0,12
0,08
0,04
Selanjutnya dapat ditampilkan dalam bentuk grafik berikut :
Intelegensi
90.0 85.0 80.0 75.0 70.0 65.0 60.0 55.0 50.0
Intelegensi
F
r
e
q
u
e
n
c
y
6
5
4
3
2
1
0
Std. Dev = 10.21
Mean = 70.0
N = 25.00
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 2u
Dalam kenyataannya, suatu penelitian tidak pernah mengambil sampel secara
berulang-ulang seperti contoh di atas, namun contoh di atas memberi landasan
dalam melakukan estimasi nilai yang diperoleh dari sampel. Dari kumpulan rata-
rata di atas, diperoleh jumlah rata-rata = 1750. Maka rata-rata untuk ke 25 rata-
rata ini adalah :
70
25
1750
25
25
1
=
=
=

= i
i
X
X

Sedangkan simpangan baku ke 25 rata-rata tersebut juga dapat dihitung sebagai


berikut :
( )
( ) ( ) ( ) ( )
10
25
2500
25
70 90 ... 70 60 70 55 70 50
25
2 2 2 2
25
25
2
=
=
+ + +
=

= i
X
i
X
X

Ternyata terlihat bahwa rata-rata populasi = 70 dengan rata-rata dari ke-25 rata
tersebut sama, tetapi memiliki simpangan baku yang berbeda. Dari populasi
diperoleh simpangan bakunya = 14,14214 sedangkan dari ke-25 rata-rata
diperoleh simpangan baku = 10. Selanjutnya dapat dihitung :
10
2
14214 , 14
=
=
=
n
X

Ternyata berlaku :
n
X
X


=
=
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 21
Persamaan di atas juga dapat berlaku untuk kasus pengambilan sampel tanpa
pengembalian jika N cukup besar dibandingkan dengan n, dalam hal ini jika
% 5
N
n
.
b. Apabila sampling dilakukan tanpa pengembalian, maka diperoleh
10
! 2 ! ) 2 5 (
! 5
2
5
=

buah kemungkinan sampel, yaitu :


Sampel
Caleg yang
terpilih
Nilai
Intelegensi
Rata-rata Nilai
Intelegensi
1
2
3
4
5
6
7
8
9
10
1 ; 2
1 ; 3
1 ; 4
1 ; 5
2 ; 3
2 ; 4
2 ; 5
3 ; 4
3 ; 5
4 ; 5
50 ; 60
50 ; 70
50 ; 80
50 ; 90
60 ; 70
60 ; 80
60 ; 90
70 ; 80
70 ; 90
80 ; 90
55
60
65
70
65
70
75
75
80
85
Tabel di atas merupakan distribusi sampel untuk nilai intelegensi jika data yang
diambil tanpa pengembalian. Terlihat dari tabel di atas bahwa terdapat data baru
sebanyak 10 rata-rata. Distribusi dari rata-rata tersebut juga bisa disajikan ke
dalam bentuk berikut :
Rata-rata
Nilai Intelegensi
Frekuensi P(X)
55
60
65
70
75
1
1
2
2
2
0,1
0,1
0,2
0,2
0,2
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 22
80
85
1
1
0,1
0,1
Selanjutnya akan ditampilkan ke dalam bentuk grafik sebagai berikut :
Intelegensi
85.0 80.0 75.0 70.0 65.0 60.0 55.0
Intelegensi
F
r
e
q
u
e
n
c
y
2.5
2.0
1.5
1.0
.5
0.0
Std. Dev = 9.13
Mean = 70.0
N = 10.00
Dari kumpulan rata-rata di atas, diperoleh jumlah rata-rata = 490. Maka rata-rata
untuk ke 25 rata-rata ini adalah :
70
10
700
10
10
1
=
=
=

= i
i
X
X

Sedangkan simpangan baku ke 25 rata-rata tersebut juga dapat dihitung sebagai


berikut :
( )
( ) ( ) ( ) ( )
66 , 8
10
750
10
70 85 ... 70 65 70 60 70 55
10
2 2 2 2
10
25
2
=
=
+ + + +
=

= i
X
i
X
X

Ternyata rata-rata populasi = 70 sama dengan rata-rata dari ke-10 rata-rata


tersebut, tetapi memiliki simpangan baku yang berbeda. Dari populasi diperoleh
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 2S
simpangan bakunya = 14,14214 sedangkan dari ke-7 rata-rata diperoleh
simpangan baku = 8,66. Selanjutnya dapat dihitung :
66 , 8
1 5
2 5
2
14214 , 14
1
=

=
N
n N
n
X

Ternyata berlaku :
1

=
=
N
n N
n
X
X


Selanjutnya simpangan baku dari rata-rata tersebut, baik itu yang diambil dengan
pengembalian ataupun tanpa pengtembalian, dinamakan simpangan baku rata-
rata atau galat baku rata-rata. Ukuran ini menunjukkan variasi rata-rata sampel
sekitar rata-rata populasi .
I. 3. 2 Distribusi samplng Proporsi
Sebagaimana pada distribusi sampling rata-rata, pemberian nama disrtribusi
sampling proporsi atau disingkat distribusi proporsi ini dikarenakan tujuan dari
penelitiannya adalah untuk menaksir proporsi suatu peristiwa dari populasi.
Perhatikan Gambar I. 1, dimisalkan bahwa ukuran dari populasi adalah N dan
ukuran sampel yang diambil adalah n. Apabila dari populasi tersebut terdapat Y
buah peristiwa khusus yang akan diteliti, maka proporsi terjadinya peristiwa
tersebut adalah :
N
Y
=
Selanjutnya berdasarkan sampel yang diambil, ternyata peristiwa khusus yang
diperoleh ada sebanyak x buah, maka diperoleh statistik proporsi peristiwa tesebut
adalah :
n
x
p=
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 24
Oleh karena ada beberapa kemungkinan sampel yang akan terbentuk, maka untuk
tiap-tiap sampel yang bersangkutan juga akan terdapat beberapa proporsi
sampelnya. Apabila proporsi ini diperlakukan sebagai data baru, maka akan
terbentuk suatu kumpulan data yang terdiri dari proporsi dari sampel-sampel.
Sebagaimana pada distribusi rata-rata, dari kumpulan proporsi tersebut dicari rata-
rata dan simpangan bakunya, maka akan diperoleh rata-rata dari proporsi,
disimbolkan dengan
p
dan simpangan baku dari proporsi, disimbolkan dengan
p
. Ternyata, jika proses pengambilan sampel dilakukan tanpa pengembalian atau
jika kondisi populasi memiliki ukuran yang tidak terlalu besar dibandingkan
dengan data sampelnya, yaitu (n/N) > 5 %, maka :
( )
1
1


=
=
N
n N
n
p
p



selanjutnya jika proses pengambilan sampel dilakukan dengan pengembalian atau
kuran populasinya besar dibandingkan dengan ukuran sampel, yaitu (n/N) 5 %,
maka :
( )
n
p
p

=
=
1
I. 3. 3 Distribusi samplng Simpangan Baku
Seperti halnya pada pembahahasan sebelumnya, maka dari populasi yang
berukuran N yang kemudian diambil sampel beruikuran n, akan menghasilkan
beberapa kemungkinan sampel. Selanjutnya dari semua sampel yang mungkin
tersebut dicari simpangan bakunya, yaitu s, maka akan terdapat kumpulan dari
simpangan baku. Dari kumpulan tersebut, dihitung rata-ratanya,
s
dan simpangan
bakunya,
s
.
Jika populasi berdistriobusi normal, atau mendekati normal, maka distribusi
simpangan baku untuk n besar, biasanya n 100, sangat mendekati distribusio
normal dengan :
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 2S
n
s
s
2


=
=
dengan merupakan simpangan baku populasi.
Setelah mengetahui sifat dari distribusi sampel, bukan berarti harus
melakukan pengambilan sampel secara berulang-ulang sebagaimana yang telah
dijelaskan sebelumnya. Distribusi sampel yang telah dibicarakan tersebut
merupakan dasar penting bagi sebuah dalil yang disebut dalil limit pusat. Dalil
limit pusat tersebut menyatakan bahwa jika ada satu populasi dengan rata-rata ,
atau proporsi p, dengan simpangan baku (standar deviasi) yang besarnya
terhingga, maka distribusi sampel berdasarkan pengambilan sampel n secara acak
dan berulang-ulang memiliki beberapa sifat :
1. Rata-rata distribusi sampel untuk statistik

akan sama dengan parameter


populasi, .
2. Simpangan baku untuk parameter sampel akan sama dengan /n . Ukuran
ini juga dikenal sebagai standard error (SE). SE memegang peranan penting
pada estimasi parameter dan uji statistik.
3. Jika distribusi nilai pada populasi normal, maka disribusi sampel juga normal.
Tetapi yang lebih penting adalah jika distribusi nilai pada populasi tidak
normal, dengan jumlah sampel yang cukup besar, maka distribusi sampel
akan mendekati normal, tanpa tergantung dari distribusi nilai parameter
populasi.
Maka dengan asumsi besar sampel yang cukup, distribusi sampel x dapat
digambarkan sebagai berikut :
- Z

+ Z

/ 2 / 2
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 26
Pada gambar di atas menunjukkan menunjukkan sekian standar error dari rata-rata
distribusi sampel. Nilai merupakan taraf signifikansi yang menunjukkan derajat
kekeliruan yang diberikan.
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran Su
TINJAUAN MATA KULIAH
BAB II
SAMPLING ACAK SEDERHANA
II. 1 Pendahuluan
Sampling acak sederhana merupakan bentuk yang paling dasar dari jenis
sampling peluang yang memberikan dasar teori untuk proses sampling peluang
lainnya yang lebih komplek. Sampling Acak Sederhana ini merupakan suatu proses
memilih satuan sampling dari populasi sedemikian rupa sehingga setiap satuan
sampling dalam populasi mempunyai peluang yang sama besar untuk terpilih ke
dalam sampel dan peluang itu diketahui sebelum pemilihan dilakukan.Terdapat dua
cara dalam pengambilan sampling acak sederhana ini, yaitu dengan pengembalian
(with replacement), yang mana dalam proses ini adanya kemungkinan bahwa suatu
unit akan terpilih lebih dari satu kali dan tanpa pengembalian (without replacement)
yang mana semua unit yang terpilih tidak akan ada yang sama.
Sampling Acak Sederhana dengan pengembalian yang berukuran n dari
populasi yang berukuran N unit dapat digambarkan sebagai n buah sampel
independen yang berukuran 1. Satu unit dipilih secara acak dari populasi menjadi unit
sampel yang pertama, dengan peluang 1/N. Prosedur ini diulang sampai diperoleh
sampel yang berukuran n unit, yang mana bisa terjadi duplikasi unit sampling.
Pada populasi yang terbatas (finite population), suatu sampling yang memiliki
penggandaan unit tersebut tidak akan memberikan tambahan informasi. Oleh karena
itu, biasanya sampling tanpa pengembalian lebih disukai karena unit yang terpilih
tidak akan terjadi duplikasi. Sebuah sampel acak sederhana tanpa pengembalian yang
berukuran n dipilih sedemikian rupa sehingga setiap kemungkinan bagian dari n unit
dalam populasi memiliki peluang yang sama untuk terpilih menjadi anggota sampel.
Terdapat

n
N
kemungkinan sampel yang akan terbentuk. Oleh karena itu, peluang
terpilihnya beberapa individu dalam suatu sampel S dari n unit adalah :
( )
( )
!
! ! 1
N
n N n
n
N
S P

=

=
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran S1
Sebagai konsekuensi dari definisi ini, apabila dilakukan pemilihan dengan Sampling
Acak Sederhana ke dalam sampel yang berukuran n, maka peluang sesuatu unit akan
terpilih ke dalam sampel itu adalah
N
n
.
Proses sampling dengan Sampling Acak Sederhana digunakan apabila
memenuhi beberapa kondisi sebagai berikut :
1. Variabel yang akan diteliti keadaannya relatif homogen dan tersebar
merata di seluruh populasi.
2. Apabila bisa disusun secara lengkap kerangka sampling yang
menyangkut setiap satuan pengamatan yang ada dalam populasi.
II. 2 Keuntungan dan Kerugian Sampling Acak Sederhana
Keuntungan dari digunakannya Simple Random Sampling adalah memiliki
bentuk-bentuk rumus yang sederhana, tidak memerlukan pembobotan, dan semua
rmus statistika bisa digunakan.
Kerugiannya :
1. Ada kemungkinan bahwa sekalipun menggunakan randomisasi, satuan
sampling yang terpilih tidak tersebar merata atau randomisasi tidak
menjamin 100% bahwa pemilihan keadaannya menyebar merata.
2. Apabila ukuran populasi besar dan ukuran sampel besar maka pemilihan
secara simple random sampling secara manual menyulitkan.
II. 3 Proses Memilih Melalui Sampling Acak Sederhana
Dalam pemilihan unit sampling melalui sampling Acak Sederhana, diperlukan
adanya kerangka sampling yang tersusun secara lengkap. Setiap satuan sampling
dalam kerangka sampling tersebut diberi nomor urut dan banyaknya angka dalam
nomor-nomor tersebut sama untuk setiap satuan sampling.
Langkah:
1. Tentukan secara tegas Populasi sasaran
misal : Masyarakat di daerah A
2. Buat Kerangka sampling

Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran S2
No Nama Alamat
001 Awal Jl. Merkuri Raya 23
002 Arya Jl. Jakarta 24

.
.
.
262 Ending Jl. Cikaso 23
3. Tentukan ukuran sampel n
misal n=20
4. Lakukan proses pengambilan sampel
Apabila suatu target populasi telah ditentukan secara tegas dan dari populasi ini
akan disusun sebuah sampel melalui (SRS), maka selanjutnya harus dilakukan proses
pemilihan dari anggota sampelnya. Adapun proses memilih dalam Samping Acak
Sederhana banyak sekali caranya. Dalam buku ini hanya akan dibahas tiga cara yang
sering dilakukan, yaitu :
1. Simple Randomization (SR) / Pengacakan Secara Sederhana
2. Randomization Based on Remainder
3. Randomization Based on Permutation
II. 3. 1 Simple Randomization (SR) / Pengacakan Secara Sederhana
Langkah-langkah yang harus dilakukan dalam pengambilan sampel melalui Simple
Randomization :
1. Tentukan populasi penelitian secara tegas study population (populassi sasaran
dan populasi penelitian), yang sebaiknya sama dengna populasi sasaran
2. Tentukan secara tegas ukuran populasi
3. Tentukan bentuk satuan sampling dan susun kerangka sampling yang lengkap
4. Tentukan ukuran sampel berdasarkan perhitungan tertentu. Ukuran sampel
tersebut bisa ditentukan atas dasar statistis (statistical aspects) maupun
nonstatistis (nonstatistical aspects)
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran SS
5. Sediakan tabel angka random
6. Proses memilih :
a. Secara sembarang jatuhkan suatu benda ke atas tabel bilangan random
dan perhatikan angka berapa yang tertuju oleh benda tersebut
b. Satuan sampling selanjutnya diperoleh dengan cara membaca tabel
angka random ke bawah menurut kolom yang sesuai. Kalau masih
belum cukup, baca ke atas.
Catatan:
1. Simple Randomization adalah randomisasi yang palling sederhana, tetapi
banyak menghamburkan bilangan random.
2. Dala praktik, survai yang populasi sasarannya besar, Simpel Randomization
tidak dilakukan secara manual tetapi menggunakan komputer.
3. Semua angka random yang lebih besar dari N dilewat, angka randoom yang
sudah dipilih tidak dipilih lagi
4. Bilangan-bilangan random yang sudah dipakai , baik terpilih maupun tidak,
tidak boleh dipilih lagi dalam suatu proses pemilihan. Oleh karena itu sangat
disarankan agar pada saat menggunakan tabel angka random peneliti benar-
benar memperhatikan angka random mana yang sudah dipakai, dan sampai
mana peneliti terakhir menggunakan angka random.
5. Proses pemilihan seperti ini disebut Simple Random Sampling dan secara
matematis proses ini menjamin bahwa setiap satuan pengamatan dalam
populasi mempunyai kesempatan yang sama (peluang yang sama) untuk
terpilih yaitu peluang terpilih: n/N. Untuk tidak menghamburkan bilangan
random kita bisa menggunakan Simple Random Sampling melalui pendekatan
lain.
II. 3. 2 Randomization Based on Remainder (Pengacakan berdasarkan pada sisa
hasil pembagian)
Untuk menghemat bilangan random kita melakukan randomisasi atas dasar sisa hasil
pmbagian
Langkah kerja :
1. Tentukan populasi sassaran dan satuan samplingnya
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran S4
2. Susun kerangka sampling
3. Tentukan ukuran sampel
4. Sediakan tabel angka random, dari tabel ini kita mulai pada baris ke-1 kolom
ke-1. Sebagai catatan bahwa langkah tersebut dilakukan apabila yakin betul
bahwa tidak ada orang lain yang akan menggunakan kerangkan sampling yang
sama dengan tabel angka random yang sama pula.
5. Sebelum proses pemilihan dimulai, harus ditentukan secara tegas bilangan
random mana saja yang tidak boleh dipakai. Untuk keperluan ini kita susun
interval-interval
Catatan :
1. apabila diperoleh sisi pembagian bernilai nol, maka artinya adalah satuan
sampling yang terpilih adalah nomor yang terbesar.
2. Perhatikan bahwa yang dimaksud dengan sisa pembagian adalah sisa
pembagian dari bilangan random yang terpilih dengan penyebut N
3. Satuan sampling yang sudah terpilih (sisa pembagian yang sudah terpilih)
tidak boleh dipakai lagi
II. 3. 3 Randomization Based on Permutations
Dalam penelitian eksperimental seringkali peneliti harus membagi sekelompok
satuan sampling ke dalam beberapa kelompok secara acak sesuai dengan perlakuan
(treatment) yang akan dipakai. Pengacakan yang paling baik dalam hal ini adalah
pengacakan dengan menggunakan bilangan yang dipermutasikan (diubah-ubah)
secara acak, misalnya; 234, 243, 342, 324, 432, dan 423. Susun bilangan yang telah
dipermutasikan tersebut ke dalam sebuah tabel. Pilih secara acak baris ke berapa yang
akan dipakai dari tabel tersebut yang kemudian tabel ini harus dibacakan dari kiri ke
kanan untuk menentukan bilangan acak yang terpilih sebagai nomor untuk satuan
sampling.
II. 4 Bentuk-bentuk Estimasi
Sebagaimana yang telah diuraikan sebelumnya bahwa dalam proses
inferensial, terdapat dua kegiatan statistik, yaitu penaksiran parameter dan pengujian
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran SS
hipotesis. Adapun pembahasan yang akan diuraikan selanjutnya adalah mengenai
penaksiran parameter.
II. 4. 1 Estomator untuk rata-rata populasi (
x

) dan standar errornya ( ( ) X )


Dalil :
Apabila sebuah populasi berukuran N kita embentuk sebuah sampel berukuran n
melalui Sampling Acak Sederhana dan dari sampel tersebut diukur variat X yang
mempunyai tingkat pengukuran interval/rasio dengan hasil pengukuran x
1
, x
2
, , x
n
,
maka :
1. Estomatior tak bias untuk rata-rata populasi
x

adalah :

=
i
x
n
X
1
2. Estimator untuk standar error ( ) X adalah
( )
( )
( ) 1
;
2
2
2
2


=

n n
x x n
s
n
s
N
n N
X
i i

Apabila dari sebuah sampel berukuran n yang dipilih melalui Sampling Acak
Sederhana, kita bisa menghitung ( ) X , maka Bound of Error untuk rata-rata
didefinisikan sebagai :
( ) X t BE
n

1 ;
2
1


= =
secara teori, Bound of Error tersebut menyatakan kekeliruan terbesar yang mungkin
terjadi dengan derajat kepercayaan ( 1 - ) 100%. Secara fisik, Bound of Error adalah
setengah lebar taksiran.
II. 4. 3 Estomator untuk proporsi (persentase) dan standar errornya
Secara statistis kalo kita berbicara persentase, sebenarnya kita berbicara proporsi
(belum dikalikan 100%). Oleh karena itu dalam statistika, analisis mengenai
persentasse dilakukan atas dasar proporsi.
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran S6
Dalil :
Apabila dari sebuah populasi berukuran nN, kita membentuk sampel berukuran n
melalui sampling Acak sederhana, kemudian dari sampel tersebut kita men variabel X
yang sifatnya (tingkat pengukurannya) nominal dichotomus dengan harga pengukuran
:
x
i
= 1 jika satuan sampling bersifat A
x
i
= 0 jika satuan sampling bukan bersifat A
maka eestimator takbias untuk proporsi A dalam populasi didefinisikan sebagai :
1) estomator takbias untuk proporsi
B jika x
A jika x x
n
p
i
i i
0
1 ;
1
=
= =

2) estimator bias untuk standar error dari p adalah :
( )
( )
1
1


=
n
p p
N
n N
p
Sebagai catatan bahwa dalam praktik survay yang menyangkut penaksiran
parameter,ada sebuah perjanjian tak tertulis yang sifatnya optional, yaitu apabila
sampling fraction < 0,05 maka finite population fraction (fpc) dianggap 1. Ini artinya
dalam rumus standar Error tidak dimasukkan Fpc. Dalam hal inni diambil suatu
ketentuan berapa pun sampling fraction, Fpc akan tetap digunakan, sebab sekalipuun
n/N < o,o5apabila hasil pengukuran variabel X adalah bilangan-bilangan kecil, Fpc
besar pengaruhnya.
II. 5 Menentukan Ukuran Sampel
Setelah peneliti menentukan tujuan dari penelitiannya, maka selanjutnya perlu diambil
keputusan apakah akan dilakukan sensus atau sampling. Apabila proses yang akan
dilaksanakannya adalah sampling, maka diperlukan adanya suatu ketegasan berapa
ukuran sampel minimal yang sebaiknya diambil. Ukuran sampel ini akan memberi
isyarat mengenai managability of the research (kelayakan penenlitian). Ada dua dasar
pemikiran dalam menentukan ukuran sampel, yaitu ditentukan atas dasar oemikiran
statistis, dan atau ditentukan atas dasar pemikikran nonstatistis.
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran S7
II. 5. 1 Menentukan Ukuran Sampel Atas Dasar Pemikiran Non Statistis
Apabila dipandang dari sudut nonstatisti, ukran sampel ditentukan oleh beberapa
faktor, yaitu :
a. Ditentukan oleh waktu (time constraint / kendala waktu)
b. Ditentukan oleh biaya
c. Ditentukan oleh ketersediaan satuan sampling, akan lebih terasa di bidang
kedokteran
II. 5. 2 Menentukan Ukuran Sampel Atas Dasar Pemikiran Statistis
Ditinjau dari aspek statistis, ukuran sampel ditentukan oleh banyak faktor, yaitu :
a. Ukuran sampel ditentukan oleh bentuk parameter yang menjadi tolok ukur
analisis, dalam arti apakah kesimpulan yang akan kita ambil dasarnya rata-rata
( ), apakah persentase ( ), atau yang lainnya. Masalah bentuk parameter
uini erat kaitannya dengan tingkat pengukuran variabel yang kita hadapi,
apakah tingkat penggukurannya nominal, ordinal, interval, atau rasio.
b. Ukuran sampel ditentukan oleh tipe sampling yang digunakan, apakah
sampling peluang (Sampling Acak Sederhana, Sampling Sistematis, Sampling
Acak Stratifikasi, dan Sampling Klaster) atau sampling Nonpeluang.
c. Ukuran sampel ditentukan pula oleh tujuan penelitian, apakah bertujuan
untuk menaksir parameter atau menguji hipotesis.
d. Ukuran sampel ditentukan oleh sifat penelitian, apakah sifatnya
nonkomparatif atau komparatif.
e. Ukuran sampel ditentukan oleh variabilitas variabel (keseragaman variabel)
yang diteliti, makin tidak seragam variabel yang diteliti, makin besar ukuran
sampel minimal yang harus diambil.
f. Apabila tujuan penelitian semata-mata hanya membuat taksiran parameter,
maka ukuran sampel ditentukan oleh bound of error penaksiran dan derajat
kepercayaan yang dikehendaki ( ). Sedanghkan apabila tujuan penelitian
menenguji hipotesis, maka ukuran sampel ditentukan oleh berapa selisih
terkecil yang harus dinyatakan secara signifikan, tergantung pula pada level of
significant ( ) dan kuasa uji (1-)
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran S8
II. 5. 2. 1 Menentukan Ukuran Sample Apabila Tujuan Penelitiannya
Menaksir Rata - rata
Langkah kerja yang harus dilakukannya adalah sebagai berikut :
a. Tentukan dengan tegas bahwa tujuan penelitiannya adalah menaksir rata-rata
populasi ( )
b. Tentukan dengan tegas berapa derajat kepercayaan yang akan dipakai (pada
umumnya statistik klasik menggunakan derajat kepercayaan 95 % atau 90 %)
c. Tentukan bound of error penaksiran
d. Gunakan persamaan :
2
2 /
0
| || |

| || |

\ \\ \
| || |
= == =

S z
n
n
n
n
n
0
0
1 + ++ +
= == =
Keterangan :
S : Simpangan baku untuk variabel yang diteliti dalam populasi
: Bound of error yang bisa ditolelir / dikehendaki
( )
2
1

Z : Konstanta bilangan yang diperoleh dari tabel normal baku


Rumus di atas mengandung parameter S yang dalam praktik jarang sekali
diketahui, sebab S hanya diketahui apabila dilakukan sensus. Dalam
kenyataannya, S bisa diperoleh melalui cara-cara sebagai berikut :
a. Diperoleh dari hasil penelitian orang lain mengenai variabel yang sama
atau serupa yang sudah diterima secara akademik
b. Pendapat para pakar mengenai variabel yang sedang diteliti
c. Lakukan penelitian penjajagan (pilot survey)
d. Dengan menggunakan Demings Empirical Rule. Menurut Deming, ada
hubungan antara besarnya simpangan baku dengan besarnya rentang
(selisih data terbesar dengan data terkecilnya).
Aturan Deming :
- Jika variabel X adalah variabel dengan tingkat pengukuran interval
atau rasio mnegikuti distribusi yang bentuk kurvanya miring, baik
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran S9
miring ke kiri maupun miring ke kanan, maka hubungan antara
simpangan baku dengan rentang adalah :
S 0,25 R
Kurva di atas menunjukkan kurva
positif yang menggambarkan bahwa
nilai-nilai yang kecil cenderung
banyak, kemudian nilai yang besar
cenderung sedikit.
Sebagai contohnya adalah aktifitas di
pasar. Pada pukul 05.00 10.00 yang
belanja cenderung banyak, sedangkan
semakin siang semakin sedikit, bahkan
yang belanja mulai sepi.

Kurva menunjukkan kurva negatif, yang
menggambarkan bahwa nilai-nilai yang
kecil cenderunng lebih sedikit daripada
nilai-nilai yang besar.
Sebagai contohnya adalah pengunjung
pada caf-caf tenda. Pada pagi hari
nyaris tidak ada pengunjung. Tetapi di
sore hari, pengunjung mulai
berdatangan. Bahkan pada malam hari
terjadi penumpukkan pengunjung
hingga terjadi antrian. Kemudian
menjelang pukul 24.00 ke atas
pengunjung menjadi sepi lagi
- Apabila X mengikuti distribusi yang bentuk kurvanya normal,
maka hubungan antara simpangan baku dengan rentang adalah:
S 0,24 R
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 4u
- Jika X mengikuti distribusi yang kurvanya uniform, maka
hubungan antara simpangan baku dengan rentangnya adalah:
S 0,29 R
Nilai S yang diperoleh dari hasil penelitian orang lain bukanlah
merupakan simpangan baku populasi, melainkan simpangna baku
yang diperoleh dari sampel yaitu s. Tetapi karena penelitian
tersebut sudah diterima orang, maka s dianggap menjadi S. Ada
kemungkinan bahwa hasil penelitian mengenai vaiabel serupa
memberikan s yang berbeda. Dalam keadaan yang seperti ini
diambil n yang terbesar.
Dalam praktik, ukuran sampel bisa pula dilakukan berdasarkan
nilai-nilai yang diambil dari ukuran sampel sebesar n. Selanjutnya
digunakan Freunds Iterative Method, sebagai berikut :
1. Tentukan n
0
dengan persamaan berikut :
2
2 /
|

\
|
=

S Z
n
o
2. Substitusikan n
o
ke dalam persamaan :
( )
2
1 2 /
1
|
|

\
|
=

S t
n
o
n
3. Substitusikan n
1
ke dalam persamaan :
( )
2
1 2 /
2
1
|
|

\
|
=

S t
n
n
4. Substitusikan hasil dari langkah ketiga pada persamaan
langkah ketiga itu sendiri. Langkah dihentikan apabila hasil
yang diperoleh sama atau hampir sama dengan langkah yang
telah dilakukan sebelumnya. Diperolehlah nilai minimum dari
ukuran sampel berdasarkan nilai akhir dari iterasi.
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 41
Contoh Soal :
Seorang peneliti ingin mengetahui sejauh mana tingkat sadar hukum
masyarakat di daerah A. Untuk itu ia perlu mengambil sampel masyarakat.
Apabila ia menginginkan derajat keyakinan 95% bahwa kalaupun ada
perbedaan rata rata tingkat kesadaran hukum antara hasil sampel dengan rata
rata keseluruhan, perbedaan tersebut jangan lebih dari 5. Maka, bila Jumlah
penduduk dewasa masyarakat daerah A =500.000, ukuran sampel yang
diperlukan adalah:
2
2 /
0
| || |

| || |

\ \\ \
| || |
= == =

S z
n
227 586 . 226
5
) 84 . 3 ( 96 . 1
2
0
= == =
| || |

| || |

\ \\ \
| || |
= == = n
227 89 . 226
000 . 500
227
1
227
1
0
0
= == =
+ ++ +
= == =
+ ++ +
= == =
n
n
n
n
catatan:
Skor minimal :40
Skor maksimal : 200
R =160
Diketahui bahwa distribusi skor simetri. Maka
S=(0.24)160= 38.4
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 42
II.5.2.2 Menentukan Ukuran Sample Apabila Tujuan Penelitiannya
Menaksir Persentase (Proporsi)
Secara statistis, persentase itu dinyatakan dalam proporsi. Oleh karena itu,
menaksir persentase sama dengan menaksir proporsi. Untuk menentukan ukuran
sampel dengan tujuan penaksiran persentase, dapat dihitung dengan persamaan
berikut :
a. Jika sebelumnya ada keterangan sekunder mengenai dugaan harga
proporsi , maka rumusnya :
2
0 0 2 /
0
) 1 (
| || |
| || |

| || |


\ \\ \
| || |

= == =

z
n
N
n
n
n
1
1
0
0

+ ++ +
= == =
b. Jika belum ada keterangan sekunder mengenai dugaan
0
, maka
disarankan dipakai
0
= 0,5 sehingga rumusnya menjadi :
2
2 /
0
2
|

\
|
=

z
n
N
n
n
n
1
1
0
0

+ ++ +
= == =
Rumus ini adalah rumus ukuran sampel minimal yang terbesar , sebab
perkalian
0
(1 -
0
) akan merupakan perkalian terbesar nilainya jika dan
hanya jika
0
= 0,5
Contoh:
Seseorang ingin mendapat keterangan berapa persen di suatu daerah yang
tergolong pengangguran, bila derajat keyakinan dipilih 99% dengan bound of
error 5%. Diketahui bahwa banyaknya masyarakat di daerah tersebut adalah
12.000
664
05 . 0 2
575 . 2
2
2 2
2 /
0

|

\
|

=
|

\
|
=

z
n
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 4S
630 13 . 629
000 . 12
1 664
1
664
1
1
0
0
=

+
=

+
=
n
n
n
n
II.5.2.2 Menentukan Ukuran Sample Apabila Tujuan Penelitiannya Adalah
Melakukan Pengujian Hipotesis
A. Menentukan ukuran sampel bila penelitian bertujuan untuk menguji hipotesis
mengenai perbedaan rata rata dengan sampel independen
Gunakan rumus berikut
( )
2
2 2
1 1
2

+
=

S Z Z
n

untuk dan yang ditentukan
S adalah simpangan baku dari variabel yang diteliti, dimana diasumsikan
bahwa simpangan baku ini sama untuk kedua populasi.
menyatakan perbedaan rata rata yang menurut teori /tujuan penelitian
dianggap bermakna
Contoh:
Andaikan dalam suatu penelitian ingin diuji suatu hipotesis yang mengatakan bahwa
kinerja perusahaan BUMN lebih tinggi dibandingkan dengan non BUMN. Untuk itu
penelitian dilakukan. Yang menjadi unit sampling dalam penelitian ini adalah
perusahaan bak BUMN maupun non BUMN. Masalahnya berapa perusahaan yang
harus dijadikan sampel bila pengujian ingin mengambil resiko dan sebesar
masing masing 0.05. Bila menurut teori perbedaan skor rata rata kinerja antara
perusahan BUMN dan Non BUMN sebesar 10
dianggap bermakna dan menurut pengalaman skor terendah dari kinerja adalah 30
serta tertingi 150, maka kran sampel yang diperlukan adalah:
( )
2
2 2
1 1
2

+
=

S Z Z
n

=
( )
2
2 2
10
2 645 . 1 645 . 1 S +
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 44
dengan aturan Deming, maka 8 . 28 ) 30 150 ( 24 . 0 24 . 0 = = = R S S
Sehingga

( ) ( )
180 55 . 179
10
8 . 28 2 645 . 1 645 . 1
2
2 2
=
+
Jadi dperlukan paling sedikit masing 180 perusahaan BUMN dan non BUMN.
B. Menentukan ukuran sampel ila penelitian bertujuan untuk menguji hipotesis
mengenai perbedaan rata rata dengan sampel berpasangan
Gunakan rumus berikut
( )
2
2 2
1 1

+
=
d
S Z Z
n


d
S adalah simpangan baku dari perbedaaan skor populasi pertama dengan
populasi ke dua.
menyatakan perbedaan rata rata yang menurut teori /tujuan penelitian
dianggap bermakna
C. Menentukan ukuran sampel bila penelitian bertujuan untuk menguji hipotesis
tentang kebermaknaan korelasi
Untuk menentukan ukuran sampel yang dperlukan digunakan pendekatan berikut:
Ukuran sampel ditentukan secara iterasi dengan cara berikut. Tentukan ukuran
sampel melalui rumusan :
Pada iterasi pertama,
p
u ditentukan melalui persamaan berikut
|
|

\
|

+
=

1
1
log
2
1
p
u
di mana menyatakan perkiraan korelasi yang terjadi antara variabel X dan Y.
Untuk iterasi selanjutnya gunakan
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 4S
) 1 ( 2 1
1
log
2
1

+
|
|

\
|

+
=
n
u
p

demikian seterusnya sampai diperoleh nilai n yang stabil (konvergen).


Untuk berbagai nilai dan serta nilai , Machin and Campbel telah membuat tabel
ukuran sampel sehingga memudahkan untuk digunakan. (lihat lampiran 1.)
D. Menentukan ukuran sampel bila penelitian bertujuan untuk menguji hipotesis
tentang kebermaknaan
2
R dalam analisis regresi
Bila tujuannya untuk menguji kebermaknaan
2
R dalam analisis regresi,maka
ukuran sampel ditentukan melalui rumus:
1
2
+ + = k
f
L
n
dimana
2
2
2
1 R
R
f

=
k = banyaknya variabel bebas
L diperoleh dari tabel (lampiran 2) untuk dan yang ditentukan
2
R adalah koefisien determinasi terkecil yang besarnya diperkirakan baik
berdasarkan teori maupun pra survai.
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 49
TINJAUAN MATA KULIAH
BAB III
SAMPLING SISTEMATIS
III. 1 Pendahuluan
Sebuah sampel yang diperoleh dari penyeleksian satu unsur secara acak dari k
unsur yang pertama dalam sebuah kerangka sampling dan setiap unsur ke-k kemudian
disebut satu dalam k sampel sistematik. Jadi, suatu proses memilih dikatakan
sampling sistematik apabila dalam pemilihan itu dilakukan pemilihan sistematik
setelah terpilih bilangan acak, dengan syarat bahwa peluang terpilihnya N 1 .
Sampling sistematik digunakan apabila :
1. Bisa disusun kerangka sampling yang lengkap
2. Keadaan variabel yang sedang diteliti relatif homogen dan tersebar merata
di seluruh populasi
Sampling Sistematik memberikan sebuat alternatif yang berguna dari Sampling Acak
Sederhana untuk alasan sebagai berikut :
1. Sampling Sistematik lebih mudah untuk dilakukan dan oleh sebab itu lebih
sedikit subjek yang melakukan kesalahan wawancara daripada Sampling Acak
Sederhana.
2. Sampling Sistematik sering memberikan informasi yang lebih banyak
mengenai biaya per unit/satuan daripada yang diberikan Sampling Acak
Sederhana.
Pada umunya Sampling Sistematik merupakan penyeleksian secara acak pada
suatu unsur dari k unsur yang pertama dan kemudian penyeleksian pada setiap unsur k
sesudahnya. Prosedur ini lebih mudah dibentuk dan biasanya akan meminimalisir
kesalahan yang mungkin dilakukan oleh pewawancara daripada dalam proses
Sampling Acak Sederhana. Sebagai contohnya, akan menjadi lebih sulit apabila
menggunakan Sampling Acak Sederhana untuk menyeksi n = 50 orang pembeli pada
sebuah sudut jalan kota. Pewawancara tidak menentukan pembeli-pembeli mana yang
termasuk dalam sampelnya, karena ia tidak memiliki sampling framenya serta tidak
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran Su
mengetahui ukuran populasi ,N . Sebagai solusinya, ia dapat mengambil sampel
secara sistematik (katakanlah 1 dari 20 pembeli) hingga persyaratan sampelnya bisa
didapatkan. Ini akan menjadi sebuah prosedur yang mudah bahkan untuk
pewawancara yang tidak berpengalaman sekalipun dapat melakukannya.
Selain itu, lebih mudah untuk dilakukan dan lebih sedikit terjadinya kesalahan
dalam wawancara terhadap subjeknya. Sampling Sistematik sering memberikan
informasi yang lebih banyak per unit biaya daripada Sampling Acak Sederhana.
Sampling sistematik seringkali menyebar lebih seragam pada seluruh sendi populasi
sehingga dapat menghasilkan informasi yang lebih banyak mengenai populasinya
daripada data-data yang diperoleh dengan Sampling Acak Sederhana.
Pertimbangkan contoh berikut : Kita akan memilih salah satu dari 5 sampel secara
sistematik dari vouicher perjalanan sekumpulan data sebanyak N = 1000. (yaitu, n =
200 voucher) untuk menghitung proporsi dari voucher yang dicatat secara tidak
benar. Satu voucher menggambarkan proses acak dari 5 voucher yang pertama
(sebagai contohnya 3 ) dan setiap voucher sesudahnya menjadsi anggota sampel.
voucher Voucher yang menjadi sampel
1
2
3 3
4
5
6
7
8 8
9
10

996
997
998 998
999
1000
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran S1
Dimisalkan bahwa kebanyakan dari 500 voucher pertama telah diisi dengan benar,
tapi berkaitan dengan perubahan yang dialami oleh juru tulis, 500 voucher kedua akan
memiliki kesalahan yang banyak. Apabila proses sampling yang digunakan adalah
dengan Sampling Acak Sederhana, maka secara kebetulan bisa terpilih kebanyakan
(mungkin semua) dari 200 voucher adalah berasal dari salah satunya, baik itu pada
bagian kelompok pertama maupun yang kedua dan sebab itu taksiran untuk p menjadi
kurang sesuai Sebaliknya, Sampling Sistematik akan memilih jumlah yang sama dari
voucher pada kedua kelompok tersebut dan akan memberikan taksiran yang akurat .
III. 2 Bagaimana Menggambarkan Sampling Sistematik
Walaupun Sampel Acak Sederhana maupun Sampel Sistematik keduanya
memberikan alternativ yang berguna satu sama lainnya, metode dari pemilihan data
sampelnya berbeda. Suatu Sampel Acak Sederhana dari populasi dipilih dengan
menggunakan tabel bilangan acak. Akan tetapi metode-metode yang bervariasi dapat
digunakan dalam Sampling Sistematik. Peneliti dapat memilih 1 dari 3, 1 dari 5, atau
secara umum, 1 dari k sampel sisitematis.
Untuk mendapatkan suatu sampel sistematis berukuran n dari sebuah populasi
yang berukuran N, harus ditentukan k sistematis yang kurang atau sama dengan n/N.
k tidak bisa dipilih secara tepat apabila ukuran populasi tidak diketahui. Meskikpun
dapat ditentukan ukuran sampel secara pendekatan, namun harus memperkirakan nilai
k yang dibutuhkan untuk mencapai ukuran sampel (n). Jika nilai k yang dipilih terlalu
besar, ukuran sampel (n) yang diharuskan tidak akan diperoleh dengan menggunakan
1-dalam-k sampel sistematis dari populasinya. Hal ini tidak akan menjadi masalah
jika peneliti dapat menguanginya dan membuat 1-dalam-k sistematik sampling
lainnya hingga ukuran sampel yang telah ditentukan terpenuhi. Namun demikian,
dalam beberapa situasi tidak mungkin untuk memulai sampling sistematis yang
kedua.
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran S2
III. 3 Keuntungan Sampling Sistematik
Dibandingkan dengan sampling acak sederhana, sampling sisitematik
mempunyai kelebihan, yaitu :
1. standard Error yang didasarkan pada sampling sisitematik paling sedikit sama
presisinya dengan sampling acak sederhana
2. Mudah dilakukan
3. Pada keadaan tertentu, sampling sistematik bisa dilakukan sekalipun tidak ada
kerangka sampling.
III. 4 Kerugian Sampling Sistematik
Sampling sistematik bisa sangat merugikan apabila dalam kerangka sampling
terdapat periodisitas, teruitama periodisitas yang berhimpit / overlap dengan interval
pemilihan.
Sebagai contohnya adalah suatu penelitian yang akan dilakukan mengenai
tingkat kepuasan tamu hotel terhadap prosedur pelayanan di hotel tersebut.
Sampling frame yang digunakanya adalah daftar tamu yang hadir pada saat itu.
Berdasarkan tujuan kedatangannya, tamu hotel dibagi menjadi convention, bisnis,
weekend, liburan, government dan pelatihan. Celakanya , ternyata berdasarkan
sampling sistematik ternyata dalam kerangka sampling ada periodisitas yang overlap
dengan interval pemilihan, misalnya terus menrus terpilih tamu bisnis. Sehingga pada
akhirnya kurang bisa mencerminkan bagaiman tibgkat kepuasan keseluruhan tamu
yang ada.
III. 5 Menaksir Rata-rata Populasi dan Total
Sebagaimana yang telah berulangkali ditekankan bahwa maksud dari
kebanyakan suatu survey adalah menaksir satu atau lebih parameter dari populasi..
Taksiran untuk rata-rata populasi , , dari sampel sistematik menggunakan rata-rata
sampel, x sebagai berikut :
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran SS
Jika N tidak diketahui maka fpc, ( N n ) / N pada persamaan (3.2) dan (3.3)
dibuang. Ternyata bahwa taksiran varians dari
sy
x yang ada pada persamaan (3.2)
identik dengan taksiran varians untuk x yang dperoleh dengan menggunakan
Sampling acak Sederhana. Hal ini tidak menyiratkan bahwa varians populasi yang
bersangkutan sama. Varians dari x diperoleh dari persamaan :
( )
n N
n N
x V
2
1


|
|

\
|

=
Demikian juga varians dari
sy
x dapat dituliskan :
( ) ( ) { }

1 1
2
+ = n
n
x V
sy
dimana adalah koefisien korelasi antara observasi dalam sampel sisitematik yang
sama. Ketika N besar, kedua varians tersebut sama jika observasi dalam sebuah
sampel yang ditetapkan tidak berkorelasi ( 0).
Sebuah taksiran yang tak bias dari ( )
sy
x V tidak dapat diperoleh dengan
menggunakan data hanya dari satu sampel sistematik. Hal ini tidak berarti bahwa
suatu taksiran dari ( )
sy
x V tidak pernah bisa diperoleh. Untuk populasi tertentu,
ampling sistematik ekivalen dengan sampling acak sederhana, dan kita dapat
Penaksir Rata-rata Populasi, :
n
x
x
n
i
i
sy

=
= =
1
( 3.1 )
Varians taksiran untuk
sy
x :
( )
n
s
N
n N
x V
sy
2

\
|

= ( 3 . 2 )
Bound of Error taksiran tersebut :
( )
n
s
N
n N
Z x V Z
sy
2
2 2

\
|

= =

( 3 . 3 )
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran S4
mengambil ( )
sy
x V yang hampir sama dengan taksiran varians dari x berdasarkan
pada samping acak sederhana.
Untuk populasi yang mana hubungan ini terjadi? Untuk menjawab pertanyaan
tersebut kita harus mempertimbangkan tiga tipe populasi sebagai berikut :
1. Populasi Acak (Random Population)
2. Populasi Terurut (Ordered Populastion)
3. Populasi Berkala (Periodic Population)
III. 5. 1 Populasi acak
Definisi : Suatu populasi dikatakan acak apabila elemen-elemen dari populasi tersebut
berada dalam urutan yang acak.
Elemen-elemen dari sampel sistematik yang diambil dari populasi yang acak
diaharapkan akan heterogen dengan mendekati nol. Dengan demikian, ketika N
besar, varians dari
sy
x kira-kira sama dengan varians dari x yang berdasarkan pada
sampling acak sederhana, sampling sistematis dalam kasus ini ekivalen dengan
sangling acak sederhana. Sebagai contohnya, seorang peneliti ingin menentukan rata-
rata jumlah dari yang ditulis oleh dokter tertentu selama tahun sebelumnya.. Jika
frame (kerangka) mengandung daftar dokter-dokter, cukup beralasan untuk
mengasumsikan bahwa nama-nama pada daftrar tersebut tidak berhubungan dengan
banyaknya resep yang ditulis untuk obat tertentu. Oleh karena itu, kita pertimbangkan
bahwa populasinya acak. Suatu sampel sistematik akan ekivelan dengan sampel acak
sederhana untuk kasus tersebut.
III. 5. 2 Populasi Terurut
Suatu populasi dikatakan terurut apabila elemen-elemen dalam populasi
terurut dalam dalam jarak sesuai dengan pola tertentu
Dalam sebuah survey untuk menaksir efektivitas dari instruksi dalam suatu
kursus yang besar, pelajar diminta untuk mengevaluasi instrukutur mereka
berdasarkan skala numerik.. sebuah sampel kemudian diambil dari daftar evaluasi
yang disusun dalam urutan numerik yang menaik. Populasi dari pengukuran dimana
data sampel diambil dianggap sebuah populasi yag terurut.
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran SS
Suatu sampel sistematik yag diambil dari populasi yang terurut pada umumny
abersifat heterogen dengan 0,
( ) ( ) x V x V
sy

Dengan demikian, sebuah sampel sisitematik dari populasi terurut memberikan
indformasi yang lebih banyak per unit biayanya daripada sampel acak sederhana,
karena varians dari
sy
x yang diperoleh lebih kecil daripada varians dari x .
Jika tidak diperoleh taksiran ( )
sy
x V dari data sampel, suatu taksiran konservatif
untuk ( )
sy
x V dapat digunakan :
( )
|

\
|

=
N
n N
n
s
x V
sy
2

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA Universitas Padjadjaran S9
TINJAUAN MATA KULIAH
BAB IV
SAMPLING ACAK BERSTRATA
IV. 1 Pendahuluan
Salah satu metoda pengambilan sampel lain disamping Sampling Acak
Sederhana adalah Sampling Acak Bestrata. Sampling ini dilakukan apabila dalam
keadaan tertentu Sampling Acak Sederhana kurang baik untuk digunakan karena akan
memberikan presisi suatu taksiran yang rendah. Untuk itu kita perhatikan kasus yang
berikut. Misalkan di suatu daerah, pendapatan masyarakat bersifat heterogen, yakni
ada yang tergolong tinggi, menengah, atau rendah, dan melalui Sampling Acak
Sederhana akan diambil sampel dalam usaha menaksir rata-rata pendapatan
masyarakat tersebut, maka ada kemungkinan yang terambil ke dalam sampel
walaupun dilakukan secara acak, kebanyakan atau hanyalah mereka yang tergolong
berpenghasilan rendah. Bila rata-rata pendapatan dihitung dari sampel ini, maka rata-
rata tadi akan merupakan taksiran yang rendah (under estimate).
Telah diketahui bahwa metoda pengambilan sampel yang dilakukan dalam
rangka menaksir parameter populasi adalah metode yang dapat memberikan presisi
suatu taksiran yang tinggi. Diketahui pula bahwa presisi suatu taksiran diukur oleh
galat baku dari taksiran tersebut. Dari rumus galat baku-galat baku yang sudah kita
kenal, dalam Sampling Acak Sederhana, Tampak bahwa besar kecilnya galat baku
antara lain bergantung pada ukuran sampel. Makin besar ukuran sampel
menyebabkan makin kecilnya galat baku suatu penaksir, yang juga berarti semakin
tinggi presisi penaksir tersebut. Selain itu, variasi data, yang diukur oleh S
2
, juga bisa
menentukan besarnya galat baku. Dari rumus galat baku rata-rata misalnya, tampak
bahwa makin besar harga S
2
(artinya karakteristik populasi heterogen) akan juga
menyebabkan makin besarnya galat baku. Sebaliknya, semakin kecil (karakteristik
populasi relative homogen) akan menghasilkan galat baku yang kecil. Dengan
demikian Sampling Acak Sederhana akan memberikan presisi yang tinggi apabila
karakteristk populasi bersifat homogen. Dalam kasus ini, tampak bahwa pendapatan
bersifat heterogen yang berarti varians pendapatan, S
2
, juga akan besar. Oleh karena
itu, apabila sampel diambil melalui Sampling Acak Sederhana, akan memberikan
presisi yang rendah.
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 6u
Masuk akal kiranya, agar diperoleh presisi yang tinggi, sampel yang terambil
haruslah sampel yang didalamnya berisi misalnya, masyarakat yang dari semua
golongan pendapatan. Sampel seperti ini dapat diperoleh melalui Sampling Acak
Bestrata. Dalam Sampling Acak Bestrata populasi N dibagi ke dalam beberapa
kelompok sedemikian sehingga setiap kelompok mempunyai karakteristik yang
homogen. Kelompok-kelompok semacam ini disebut strata (tunggalnya disebut
stratum) dan dalam masing-masing stratum sampel diambil secara acak, yakni dengan
Sampling Acak Sederhana. Proses pembagian populasi ke dalam beberapa strata
disebut stratifikasi. Dalam kasus sebelumnya, populasi dibagi dalam tiga strata,
stratum pertama adalah masyarakat yang tergolong berpenghasilan tinggi, stratum
kedua yang berpenghasilan menengah, dan stratum ketiga masyarakat yang
berpenghasilan rendah.
Dalam bab ini, akan diuraikan Sampling Acak Berstrata untuk menaksir rata-
rata, proporsi serta total populasi. Namun sebelum lebih jauh membahasnya, perlu
diperhatikan terlebh dahulu beberapa notasi yang digunakan.
IV. 2 Notasi
Telah dikatakan bahwa populasi dibagi ke dalam kelompok-kelompok yang
disebut strata. Andaikan populasi dibagi dalam L strata, maka banyaknya unit serta
beberapa besaran karakteristik yang diperlukan dalam stratum dinyatakan dalam
notasi-notasi berikut, Indeks k dalam notasi menyatakan stratum ke-k, jadi k bisa
berharga 1, 2, , L.
N
h
banyaknya unit dalam stratum ke h
n
h
banyaknya unit dalam sampel yang diambil dari stratum ke h
y
hi
nilai pengamatan atau nilai karakteristik untuk unit ke-i dalam
stratum ke-h
N
N
W
h
h
= bobot stratum ke-h
f
h
fraksi sampling dalam stratum ke-h
h
hi
h
N
y
Y

= nilai rata-rata karakteristik dalam stratum ke-h
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 61
h
hi
h
n
y
y

= nilai rata-rata karakteristik sampel berukuran n
h
yang diambil dari
stratum ke-h
( )
1
2
2

=

h
h hi
h
N
Y y
S varians karakteristik dalam stratum ke-h
( )
1
2
2

=

h
h hi
h
n
Y y
s varians karakteristik sampel berukuran n
h
dari stratum ke-h
IV. 3 Prosedur Pengambilan Sampel
Seperti sudah dijelaskan, bahwa pembentukan strata atau stratifikasi
dimaksudkan untuk meningkatkan presisi suatu taksiran. Menigkatnya suatu presisi
akan bergantung kepada derajat homogenitas yang dicapai dalam strata, atau dapat
pula dikatakan bergantung pada seberapa besar variabilitas karakteristik yang akan
diukur direfleksikan diantara strata. Hal ini tentu saja pada gilirannya bergantung
kepada efektifitas pembentukan strata.
Dalam membentuk batas-batas stratum, perlu mengumpulkan semua informasi
yang dapat menolong mengklasifikasikan unit-unit menjadi kelompok-kelompok
populasi yang satu sama lain berbeda. Data masa lalu, intuisi, pertimbangan para ahli
di lapangan, atau kejelian seseorang dalam menerka dengan baik, semuanya bisa
digunakan secara efektif dalam membentuk atau membedakan strata satu dengan yang
lainnya.
Apabila secara cermat strata sudah terbentuk, maka sampel untuk masing-
masing stratum dipilih melalui metode Sampling Acak Sederhana. Karena dilakukan
dengan metode Sampling Acak Sederhana, maka tentunya harus tersedia kerangka
sampling dalam setiap stratum. Apabila sudah tersedia, maka dari N
1
, N
2
, , N
L
unit
diambil sampel secara acak, katakan berukuran n
1
, n
2
, , n
L
sehingga ukuran sampel
yang dibutuhkan, yakni,
n = n
1
+ n
2
+ + n
L
(4.1)
merupakan golongan ukuran-ukuran sampel setiap stratum.
Untuk lebih jelasnya, selanjutnya akan diuraikan langkah kerja dalam
membentuk strata untuk sebuah populasi sebaagai berikut :
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 62
1. Tentukan populasi sasaran dan tentukan populasi secara keseluruhan (N)
2. Berdasarkan variabel tertentu (kriteria tertentu) , populasi dibagi-bagi ke
dalam L buah strata
3. Untuk setiap strata lakukan pendaftaran satuan sampling sehingga untuk setiap
strata diperoleh kerangka sampling masing-masing dengan ukuran strata
masing-masing
4. Dari populasi tersebut kemudian ditentukan ukuran sampel n yang disebut
overall sample size. Menentukan ukuran sampel n tentu saja harus berdasarkan
kriteria tertentu.
5. Ukuran sampel sebesar n selanjutnya dialokasikan (disebarkan) ke seluruh
strata, yang kemudian disebut alokasi sampel (sample allocation)
Stratum I : n
1
Stratum I : n
2
Stratum I : n
3
sedemikian rupa sehingga :

=
=
L
i
i
n n
1

Stratum I : n
L
6. Dari setiap stratum kemudian dipilih satuan sampling melalui teknik Sampel
Acak Sederhana.
Oleh karena dari setiap stratum dilakukan secara Sampling Acak Sederhana, maka
keseluruhan proses disebut Sampling Acak Berstrata. Jika proses memilih dari
setiap stratum dilakukan secara sistematik, maka proses keseluruhan disebut
Sampling Acak Sistematis Berstrata.
Sebagai contoh, dibawah ini diberikan gambaran pembagian populasi menjadi
tiga buah stratum yang kemudian dilakukan prose Sampling Acak Berstrata :
N
1



N
2
.




N
3


n
1



n
1




n
1
N = N
1
+ N
2
+ N
3
n = n
1
+ n
2
+ n
3
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 6S
IV. 4 Taksiran Rata-rata Populasi
IV. 4. 1 Bentuk Taksiran
Seperti halnya Sampling Acak Sederhana maka akan diuraikan tiga penaksir
yang barangkali dilibatkan dalam penelitian. Penaksir ini adalah penaksir rata-rata,
proporsi dan total populasi.
Rata-rata nilai karakteristik populasi tiada lain adalah jumlah nilai
karakteristik dibagi banyaknya unit dalam populasi.

N
x
X
L
i h
Nh
i
hi
= =
=
1
(4.2)
atau bisa juga ditulis dengan :

N
X N
X
L
h
h h
=
=
1
(4.3)
X disebut rata-rata yang dibobot dengan bobot yang digunakan adalah
ukuran-ukuran stratum, yaitu N
h
. Kalau sampel dari setiap stratum diambil dengan
menggunakan Sampling Acak Sederhana, maka rata-rata nilai karakteristik dari
sampel dalam setiap stratum bisa ditentukan yaitu
h
n
i
hi
h
n
x
x
h

=
=
1
(4.4)
h
x ini tentu saja merupakan penaksir yang takbias untuk
h
X . Karena
h
x ini
merupakan penaksir yang takbias untuk
h
X , maka
h h
x N akan merupakan penaksir
total nilai karakteristik dalam stratum ke-h, sehingga apabila taksiran-taksiran total ini
kita jumlahkan, yakni
h h
x N , maka akan merupakan taksiran total nilai populasi.
Oleh karena itu, taksiran rata-rata nilai karakteristik populasi akan sama dengan
h h
x N dibagi oeh N. Taksiran rata-rata nilai karakteristik populasi dalam Sampling
Acak Berstrata diberi symbol
st
x . Oleh karenanya
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 64

N
x
x
L
h
h
st

=
=
1
(4.5)
Taksiran ini juga merupakan taksiran yang takbias untuk X .
Contoh 4. 1 :
Seorang peneliti mengadakan suatu survai untuk mengetahui berapa rata-rata hasil
penjualan lading per bulan milik para petani di suatu daerah. Dikeahui bahwa di
daerah tersebut terdapat 250 petani yang 60 diantaranya tergolong kelompok yang
mempunyai lading luas, 100 tergolong kelompok yang mempunyai ladang lumayan
luas, dan 40 petani tergolong mempunyai ladang kecil. Sampel yang diambil oleh
peneliti adalah 50 petani yang masing-masing kelompok diwakili oleh 15, 25, dan 10
petani. Dalam tiap kelompok petani-petani ini diambil dengan sampling acak
sederhana. Dari petani yang terpilih, rata-rata pendapatannya dihitung, lihat table (IV.
1) diperoleh :
Tabel IV. 1
PENJUALAN HASIL LADANG PER BULAN
MENURUT STRATA LUAS LADANG
(DALAM RATUSAN RIBU RUPIAH)
NO
STRATA LUAS LADANG
1 2 3
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
123
120
125
160
130
110
140
110
130
100
110
120
125
120
152
65
60
63
60
70
64
63
60
59
63
62
58
64
65
65
34
30
25
28
27
25
30
35
20
46
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 6S
16
17
18
19
20
21
22
23
24
25
60
50
55
62
60
60
64
62
40
46
Jumlah 1.875.000 1.500.000 300.000
h
x
125.000 60.000 30.000
s
h
16.053,48 6.416,13 7.149,20
= = = , 000 . 30 . , 000 . 60 . , 000 . 125 .
3 2 1
Rp x Rp x Rp x
maka pukul rata hasil penjualan ladang per bulan di daerah tersebut adalah
( )( ) ( )( ) ( )( )
=
+ +
=
, 500 . 73 .
200
000 . 30 40 000 . 60 100 000 . 125 60
Rp
x
st
IV. 4. 2 Galat Baku Rata-rata
Seperti telah kita ketahui dalam uraian sebelumnya, selain taksiran untuk suatu
parameter populasi, diperlukan juga varians atau galat baku dari taksiran tersebut agar
presisi dari penaksir dapat diukur. Apabila sampel diambil melalui prosedur Sampling
Acak Berstrata dan dari nilai karakteristik sampel ini akan ditaksir rata-rata populasi
X , oleh
st
x , maka varians dari
st
x , ditulis V (
st
x ) dapat ditentukan dengan
menggunakan persamaan berikut :
( ) |

\
|
=

=
L
h
h h
st
N
x N
V x V
1
(4.6)
yang apabila diuraikan menjadi
( )
h
h
L
h h
h h
h st
n
S
N
n N
N
N
x V
2
1
2
2
1

= (4.7)
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 66
atau
( )
h
h
L
h h
h h
h st
n
S
N
n N
W x V
2
1
2

=
|
|

\
|
= (4.8)
dengan w
h
menyatakan bobot stratum ke-h.
V(
st
x ) di atas besarnya besarnya bergantung antara lain pada
2
h
S yaitu varians nilai
karakteristik dalam stratum ke-h. Kenyataan, sering varians ini jarang diketahui
besarnya sehingga sulit bagi kita untuk menghitung V(
st
x ) melalui persamaan (4.8).
Oleh karena itu, V(
st
x ) bisa ditaksir. Taksiran untuk V(
st
x ) akan didasarkan pada
besarnya varians nilai karakteristik yang dihitung melalui sampel yang diambil dari
setiap stratum. Penaksir tersebut adalah :
( )
h
h
L
h h
h h
h st
n
s
N
n N
W x V
2
1
2


=
|
|

\
|
= (4.9)
2
h
s menyatakan varians nilai karakteristik stratum ke h yang dihitung dengan
menggunakan persamaan (). Dengan demikian galat baku dari rata-rata untuk
sampling berstrata adalah
( )
st st x
x V s = (4.10)
Dari contoh 4.1, melalui sampel yang diambil dari tiap stratum, besarnya varians atau
simpangan baku pendapatan petani dihitung. Dari 15 petani yag mempunyai ladang
luas, juga dari 25 petani serta 10 petani yang mempunyai ladang cukup dan kecil,
simpangan baku pendapatan dihitung. Hasilnya tampak pada tabel III. 1 berturut-turut
adalah :
s
1
= Rp. 16.053,48 , -
s
2
= Rp. 6.416,13 , -
s
3
= Rp. 7.149,20 , -
Maka dengan menggunakan persamaan () varians rata-rata petani di daerah tersebut
besarnya ditaksir oleh :
( )
( ) ( )
( )
603 , 1621797
10
20 , 7149
40
10 40
200
40
25
13 , 6416
100
25 100
200
100
15
48 , 16053
60
15 60
200
60

2 2
2 2 2 2
=

\
|
|

\
|

+
|

\
|
|

\
|
+
|

\
|
|

\
|
=
st
x V
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 67
sehingga galat bakunya adalah
( ) = = , 498 , 1273 .

Rp x V s
st st x
nilai tersebut untuk mengukur presisi dari
st
x .
Apabila varians suatu taksiran bisa ditentukan, maka interval taksirannya juga
bisa dicari. Sejalan dengan pembahasan Sampling Acak Sederhana, maka apabila
sampel diambil melalui Sampling Acak Berstrata, interval taksiran rata-rata dengan
derajat konfiden , dapat diperoleh dari :
st x st st x st
s Z x X s Z x

2
1
2
1
+ < < (4.11)
dimana

2
1
Z besarnya didapat dari tabel normal baku.
Contoh 4.2 :
Dalam contoh yang lalu, apabila diinginkan interval taksiran untuk rata-rata
pendapatan hasil ladang dengan = 5 %, maka interval taksiran tersebut adalah :
73.500 (1,96) (1273,498) < X < 73.500 + (1,96) (1273,498)
71003,94 < X < 75996,06
yang berarti bahwa dengan derajat keyakinan 95 % rata-rata penjualan hasil ladang
para petani di daerah tersebut terletak antara Rp. 71.004 , - dan Rp. 75.996,-.
IV. 5 Taksiran Persentase (Proporsi)
IV. 5. 1 Bentuk Taksiran

Seperti halnya pada taksiran untuk rata-rata, maka taksiran untuk proporsi juga
melibatkan besaran proporsi untuk setiap strata. Oleh karena itu, melalui Sampling
Acak Berstrata berukuran N, taksiran untuk proporsinya adalah :

=
|

\
|
=
L
i
i
i
st
p
N
N
P
1
dengan

=
=
i
n
j
ij i
x
n
p
1
1
x
ij
= 1 jika satuan sampling mempunyai karakteristik yang dicari
x
ij
= 0 jika satuan sampling tidak mempunyai karakteristik yang dicari
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 68
IV. 5. 2 Galat Baku Proporsi

Apabila sampel diambil melalui prosedur Sampling Acak Berstrata dan dari
nilai karakteristik sampel ini akan ditaksir proporsi populasi
st
, oleh P
st
, maka varians
dari P
st
, ditulis V(P
st
) dapat ditentukan dengan menggunakan persamaan berikut :
( )
( )
1
1
2
1

\
|
|
|

\
|
=

= i
i i i
L
i i
i i
st
n
p p
N
N
N
n N
P V (4.12)
yang apabila diuraikan menjadi
( ) ( )
( )
1
1 1
1
2

=

= i
i i
i
L
h
i i st
n
p p
N n N
N
P V (4.13)
IV. 6 Alokasi Sampel

Uraian yang lalu memperlihatkan pada kita bagaimana menentukan taksiran
rata-rata dan mengukur presisi taksiran rata-rata melalui galat baku taksiran tersebut
jika sampel diambil dengan Sampling Acak Berstrata. Ini bisa dilakukan apabila kita
sudah mengetahui besarnya ukuran sampel, n , dan besarnya ukuran-ukuran sampel
yang diambil dari setiap stratum,n
h
. Dari contoh 4.1 dan 4.2 misalnya, taksiran rata-
rata hasil penjualan,
st
x , serta variansnya, V(
st
x ), dapat dihitung karena besarnya
sampel yaitu 50 petani sudah ditentukan, demikian pula besarnya ukuran sampel
untuk setiap stratum, yaitu; 15, 25, dan 10 petani.
Masalah yang timbul tentunya adalah bagaimana menentukan bahwa sampel
berukuran 50 petani , dan dalam berapa bagian dari 50 petani ini diberikan untuk
setiap stratum. Dengan kata lain, bagaimana menentukan n dan bagaimana pula
mengalokasikan n ini ke dalam masing-masing stratum.
Dalam bagian ini akan diuraikan terlebih dahulu bagaimana mangalokasikan n
ke dalam setiap stratum, sehingga untuk n yang diketahui besarnya, n
h
bisa
ditentukan. Dalam Sampling Acak Berstrata, mengalokasikan n ke dalam setiap
stratum bisa ditempuh dalam beberapa cara. Cara yang paling seerhana adalah yang
disebut alokasi proporsional, yang akan diuraikan berikut ini.
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 69
IV. 6. 1 Alokasi Proporsional

Salah satu cara menentukan besarnya n
h
untuk n yang diketahui adalah alokasi
proporsional. Alokasi ini adalah alokasi yang paling sederhana. Ukuran-ukuran
sampel dari setiap stratum diambil proporsional terhadap ukuran stratumnya, N
h
.
Dengan alokasi ini, maka :
L h n
N
N
n
h
h
, ... , 2 , 1 ; = = (4.14)
sehingga berlaku bahwa
N
n
N
n
h
h
= yang menyatakan berapa bagian sampel diambil
dari populasi.
Contoh 4. 3 :
Dari contoh 4.1 nampak bahwa ukuran populasinya terdiri dari 200 petani, dan
masing-masing stratum berukuran N
1
= 60, N
2
= 100, dan N
3
= 40. Dari ukuran ini
akan diambil sampel berukuran 50 petani. Maka dengan alokasi proporsional,
banyaknya petani yang harus diambil dari setiap stratum adalah:
i pe n
i pe n
i pe n
tan 10 50
200
40
tan 25 50
200
100
tan 15 50
200
60
3
2
1
= =
= =
= =
dengan demikian, sampel-sampel yang diambil dari setiap stratum dari contoh di atas
merupakan sampel yang proporsional terhadap ukuran stratum.
Apabila alokasi sampel dilakukan dengan alokasi proporsional, maka
st
x
dengan variansnya yang masing-masing ditulis dalam persamaan () dan () dapat
disederhanakan menjadi :
n
x
x
L
h
n
i
hi
st
h

= =
=
1 1
(4.15)
yang merupakan rata-rata nilai karakteristik sampel, dan
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 7u
( )

=

=
L
h
h h
st
n
S
N
N
N
n N
x V
1
2
(4.16)
yang taksirannya adalah
( )

=

=
L
h
h h
st
n
s
N
N
N
n N
x V
1
2

(4.17)
dengan
2
h
s menyatakan varians nilai karakteristik yang dihitung dari sampel yang
diambil dari stratum ke-h, dihitung dengan menggunakan rumus (.)
Apabila rumus ini kita gunakan untuk contoh yang lalu, maka
( )
603 , 1621797
50
) 20 , 7149 (
200
40
50
) 13 , 6406 (
200
100
50
) 48 , 16053 (
200
60
200
50 200

2 2 2
=
|
|

\
|
+ +
|

\
|
=
st
x V
terlihat bahwa hasilnya sama dengan apabila digunakan persamaan ((())))
IV. 6. 2 Alokasi Optimal

Dalam alokasi proporsional, ukuran-ukuran sampel dari setiap stratum
ditentukan secara proporsional terhadap ukuran-ukuran stratum N
h
. Dalam keadaan
tertentu terdapat suatu kendala dalam menentukan ukuran sampel. Kendala tersebut
biasanya adalah biaya. Dalam sampling, dikenala apa yang disebut biaya samplilng.
Dengan biaya sampling diartikan sebagai biaya yang perlu disediakan apabila kita
akan melakukan pengambilan sampel. Oleh karena itu, tercakup di dalamnya biaya-
biaya merencanakan sampling, membentuk kerangka sampling, melatih pewawancara,
mengumpulkan data, menyusun dan mengolah data, keperluan secretariat, dan lain
sebagainya. Biaya sampling ini terbagi dalam dua bagian, yaitu biaya tetap, B
0
, dan
biaya-biaya tidak tetap, B
h
. Yang termasuk biaya tetap adalah biaya yang tidak
tergantung pada berapa besarnya ukuran sampel yang diambil dari setiap stratum,
termasuk di dalamnya adalah biaya-biaya keperluan secretariat, biaya sewa ruangan,
honor pegawai, dan sebagainya. Biaya tidak tetap adalah biaya untuk mendapatkan
data (melalui wawancara, angket, dan sebagainya) dari satu unut yang ada dalam
setiap stratum. Oleh karena itu, apabila biaya memperoleh data dari satu unit dalam
stratum pertama adalah B
1
rupiah, dan dari stratum ini akan diambil sampel berukuran
n
1
unit. Maka jumlah biaya yang diperlukan untuk mendapatkan data dari stratum
pertama adalah n
1
B
1
. Demikian pula untuk stratum ke dua, dengan biaya untuk
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 71
mendapatkan data dari satu unit sebesar B
2
rupiah, maka diperlukan sebanyak n
2
B
2
rupiah.
Secara umum, untuk stratum ke-h, diperlukan biaya n
h
B
h
rupiah. Oleh karena
itu, biaya yang diperlukan untuk mendapatkan data dari

=
h
n n unit adalah
h h
B n rupiah. Karena keseluruhan biaya sampling yang diperlukan merupakan
jumlah biaya tetap dan tidak tetap, maka seluruh biaya dapat dituliskan sebagai
berikut :

+ =
h h
B n B B
0
(4.18)
Untuk mempermudah perhitungan-perhitungan selanjutnya, hanya akan diperhatikan
biaya tidak tetap saja, yaitu:

= =
h h
B n B B B
0
(4.19)
Dengan menggunakan fungsi biaya, maka ukuran sampel dapat ditentukan melalui
dua cara: Pertama, dengan biaya sampling tertentu, yakni sebesar B, tentukan ukuran
sampel n, dan alokasikan n ini ke dalam setiap stratum sehingga dicapai presisi yang
maksimal (galat baku taksiran minimal). Ke dua, dengan presisi taksiran yang
dikehendaki, tentukan ukuran sampel n, lalu alokasikan n ini pada setiap stratum
sehingga biaya yang harus dikeluarkansekecil mungkin. Metode alokasi ukuran
sampel ini disebut Alokasi Optimal.
Dengan terminologi lain, alokasi optimal dapat dinyatakan seperti berikut,
tentukan n dan n
h
sedemikian rupa sehingga untuk B tertentu
st x
s minimal, atau
tentukan n sehingga untuk
st x
s tertentu B seminimal mungkin.
Kita perhatikan terlebih dahulu bagaimana menentukan n
h
untuk ukuran n
tertentu. Apabila alokasi optimal digunakan, maka ukuran sampel setiap stratum
dihitung melalui persamaan:
n
B S N
B S N
n
h h h
h h h
h
=

(4.20)
IV. 6. 3 Alokasi Neyman

Apabila biaya total per satuan sampling dalam setiap stratum (B
h
) sama, maka
penentuan alokasi sampling ke dalam setiap stratum dari persamaan 4.18 menjadi :
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 72
n
S N
S N
n
h h
h h
h
=

(4.21)
Alokasi di atas merupakan bentuk daro alokasi Neyman
IV. 6. 4 Alokasi Sembarang

Alokasi ini dilakukan dengan cara mengalokasikan sampling ke dalam strata
seimbang dengan syarat minimal dari sebuah stratum harus ada dua buah satuan
sampling yang diambil. Dalam praktik, alokasi seperti ini sama sekali tidak
disarankan, sebab alokasi tersebut bisa mengakibatkan standard error menjadi
membengkak yang harganya lebih besar daripada standard error Sampling Acak
Sederhana.
IV. 6. 5 Alokasi Sama Besar

Menurut kriterium ini, alokasi dilakukan atas dasar rumus

L
n
n
i
= (4.22)
Pada keadaan tertentu aloksai sma besar bisa menguntungkan, yaitu pada keadaan
yang disebut paired allocation.
IV. 7 Menentukan Ukuran Sampel

Sebagaimana telah diketahui, banyak sekali faktor yang ikut menentukan ukuran
sampel, dua diantaranya adalah tergantung kepada parameter yang akan ditaksir dan
tergantung kepada tipe samplingnya.
IV. 7. 1 Menentukan Ukuran Sampel Jika Akan Menaksir Rata-rata
Apabila parameter yang akan ditaksir adalah rata-rata dan tipe sampling
Sampling Acak Berstrata, maka ukuran sampel bisa diperoleh melalui persamaan
berikut :
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 7S
( )

=
+
|
|
|

\
|
=
L
i
i i
L
i i
i i
S N N
Z
w
S N
n
1
2 2
2
2
1
1
2 2

(4.23)
w
i
= n
i
/ n ; = bound of error
IV. 7. 2 Menentukan Ukuran Sampel Jika Akan Menaksir Proporsi

Selanjutnya jika parameter yang akan ditaksir adalah rata-rata dan tipe sampling
Sampling Acak Berstrata, maka ukuran sampel bisa diperoleh melalui persamaan
berikut :
( )
( )
( )

=
+
|
|
|

\
|

=
L
i
i i i
L
i i
i i i
N N
Z
w
N
n
1
2
2
2
1
1
2
1
1

(4.24)
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 78
TINJAUAN MATA KULIAH
BAB V
SAMPLING KLASTER
V. 1 Pendahuluan
Salah satu jenis sampling yang juga sering digunakan dalam praktek penelitian
adalah sampling klaster. Sampling ini dilakukan apabila peneliti ingin menekan biaya
sampling atau jika kerangka sampling yang memuat elemen/atau unit observasi tidak
tersedia. Sampling klaster adalah sampling dimana unit samplingnya adalah kumpulan
atau kelompok (cluster) elemen (unit observasi). Sebagai contoh, andaikan seorang
peneliti ingin mengetahui rata-rata pendapatan kepala keluarga disebuah kota besar.
Apabila Sampling acak sederhana atau sampling acak berstrata akan digunakan, maka
peneliti harus mempunyai kerangka sampling yang berisikan daftar kepala keluarga
dikota tersebut. Daftar keseluruhan nama kepala keluarga dikota yang besar seperti ini
pasti akan sulit diperoleh. kalaupun ada, dan SRS dilakukan maka sampel masyarakat
yang terambil bisa tersebar ke semua penjuru kota, dan ini akan melibatkan biaya
pengambilan sampel yang tinggi. Daftar yang mungkin bisa diperoleh adalah daftar
nama nama kelurahan dikota tersebut. Kelurahan adalah kumpulan kepala kepala
keluarga. Oleh karena itu kelurahan dipandang sebagai klaster.
Proses pegambilan sampling klaster dilakukan dengan memperhatikan
kerangka sampling yang berisikan daftar klaster , dalam contoh di atas daftar nama
kelurahan. Pengambilan sampel kemudian dilakukan dengan mengambil secara acak
klaster-klaster. Unit sampling yang berisikan klaster-klaster dinamakan unit sampling
utama (primary sampling unit) disingkat USU. Apabila semua unit observasi dalam
USU menjadi anggota sampel maka dikatakan bahwa proses pengambilan sampel
dilakukan dengan sampling klaster satu tahap. Namun apabila USU dibagi lagi ke
dalam unit yang lebih kecil, misalnya kelurahan dibagi lagi ke dalam Rukun-rukun
Warga maka rukun warga disebut unit sampling ke dua (secondary sampling unit)
disingkat USD. Apabila semua unit obervasi (elemen) dari USD menjadi anggota
sampel, maka dikatakan proses pengambilan sampel dilakukan dengan sampling
klaster dua tahap, demikian seterusnya.
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 79
Perhatikan persamaaan dan perbedaan sampling berstrata dan sampling klaster dalam
gambar berikut.
Sampling Acak Stratifikasi Sampling Klaster
Masing-masing elemen di dalam populasi
tepat berada dalam satu stratum
Masing-masing elemen di dalam populasi
tepat berada dalam satu klaster
Populasi dari H strata; stratum h memiliki
n
h
elemen
Sampling klaster satu tahap; Populasi dari
N klaster




.
































Mengambil secara SRS elemen-elemen
untuk setiap stratum
Mengambil klaster secara SRS kemudian
mengamati semua elemen di dalam
klaster yang terambil



.


















Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 8u
Varians penaksirnya tergantung pada
keragaman nilai-nilai di dalam strata
Klaster merupakan unit sampling, lebih
banyak klaster yang dijadikan sampel
maka lebih kecil variansnya. Varians dari
penaksirnya tergantung pada keragaman
antara rata-rata klaster
Untuk presisi yang terbaik, elemen-
elemen individu di dalam setiap stratum
harus memiliki nilai-nilai yang serupa ,
tetapi rata-rata sertiap statum satu sama
lain sedapat mungkin harus berbeda
Untuk presisi yang terbaik, elemen-
elemen individu di dalam masing-masing
klaster harus heterogen, dan rata-rata
klaster harus serupa satu sama lainnya.
V.2 Notasi notasi yang digunakan untuk Sampling Klaster Satu Tahap
Dalam sampling acak sederhana, unit-unit yang diambil sebagai sampel adalah
elemen-elemen yang diobservasi. Dalam sampling klaster, unit samplingnya adalah
klaster-klaster, dan elemen-elemen yang diobservasi adalah USD di dalam klaster-
klaster. Himpunan semestanya, U merupakan populasi dari N USU; S menandakan
sampel dari USU yang dipilih dari populasi USU, dan S
i
merupakan sampel dari USD
yang dipilih dari USU yang ke-i.
Berikut ini adalah notasi notasi yang akan digunakan dalam sampling klaster
khususnya bila ingin menaksir rata rata populasi:
N = banyaknya klaster dalam populasi
n = banyaknya klaster yang dipilih sebagai sample
i
m = banyaknya unit observasi (elemen) dalam klaster ke I, I=1,2, ,N
m =

=
n
i
i
m
n
1
1
rata rata ukuran klaster dalam sampel
M =

=
N
i
i
m
1
Banyaknya unit observasi (elemen) dalam populasi
N
M
M = rata rata ukuran klaster dalam Populasi
i
y = total semua observasi dalam klaster ke i
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 81
V.3 Proses Memilih dalam Sampling Klaster Satu Tahap
Dalam sampling klaster satu tahap, terjadi suatu kondisi dimana semua atau
tidak satupun elemen-elemen yang terkandung di dalam klaster (= USU) dijadikan
sebagai sampel. Sampling klaster satu tahap banyak digunakan pada kegiatan survai
yang memiliki biaya sampling untuk USD dapat diabaikan bila dibandingkan dengan
biaya sampling untuk USU. Misalnya untuk survai pendidikan, yang bertindak
sebagai USU adalah ruangan kelas; semua siswa dalam kelas yang terpilih yang
sebenarnya merupakan USD dijadikan sebagai objek analisis jika hanya sedikit biaya
ekstra yang perlukan daripada meneliti beberapa siswa saja dalam kelas terpilih
tersebut.
i) Populasi dibagi-bagi ke dalam N buah klaster atau Unit Sampling Utama
(USU). Keadaan variable Y dalam setiap klaster diusahakan se-heterogen
mungkin (dalam praktik tidak pernah bisa tercapai, terutama apabila yang
menjadi klaster adalah daerah atau kumpulan satuan-satuan sampling yang
ukurannya besar).
ii) Secara Simple Random Sampling dipilih n buah klaster.
iii) Pemilihan hanya dilakukan sekali yaitu memilih klaster ( memilih Unit
Sampling Utama / USU ). Oleh karena itu, semua unit sampling kedua
(USD) yang ada dalam klaster yang terpilih diperiksa.
Sebagai catatatan bahwa apabila kita akan menggunakan sampling klaster satu tahap
maka disarankan ukuran klaster relatif kecil. Ukuran klaster yang terlalu kecil bisa
merugikan, bisa pula menguntungkan.
Merugikan : Apabila yang sedang kita teliti adalah peristiwa-peristiwa yang
jarang terjadi (Rare Cases)
Contoh : Kematian ibu pada saat melahirkan (mortality)
Menguntungkan : Apabila peristiwa itu banyak terjadi (abundant cases).
V.4 Taksiran Rata-rata Populasi
Sampling klaster merupakan sampling acak sederhana dengan setiap unit
samplingnya mengandung sejumlah elemen-elemen. Oleh karena itu, taksiran rata-
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 82
rata populasi, , dan total, , serupa dengan taksiran-taksiran pada sampling acak
sederhana. Secara khusus, rata-rata sampel, y , merupakan taksiran yang baik dari
rata-rata populasi, .
Taksiran rata rata populasi adalah rata-rata sampel yang bentuknya adalah:

=
=
=
n
i
i
n
i
i
m
y
y
1
1
(5.1)
dan varians dari y adalah

( (( ( ) )) )
1 n
m y y
M Nn
n N
y V
n
1 i
2
i i
2


| || |

| || |

\ \\ \
| || |
= == =

= == =
) (

(5.2)
Dalam hal ini M dapat ditaksir dengan m jika M tidak diketahui.
Taksiran varians pada persamaan (5.2) merupakan taksiran yang bias dan taksiran
varians tersebut akan baik jika ukuran sampel yang diambil, n, besar, yaitu n 20.
Bias akan hilang jika masing-masing klaster, m
1
, m
2
, , m
N
, memiliki ukuran yang
sama.
Contoh:
Suatu survai dirancangkan untuk menaksir rata rata pengeluaran untuk keperluan
rumah tangga masyarakat disuatu kota. Karena daftar rumah tangga di daerah tersebut
tidak ada, maka dilakukanlah pengambilan sampel dengan cara klaster. Yang menjadi
klaster adalah Rukun rukun warga (RW) di daerah tersebut. Dari hasil sampel
diperoleh data berikut.
Tabel 5.1
RW
Banyaknya
Rumah
Tangga
Total Jumlah
Pengeluaran dari
Rumah Tangga
(dalam ribuan
rupiah)
RW
Banyaknya
Rumah
Tangga
Total Jumlah
Pengeluaran dari
Rumah Tangga
(dalam ribuan
rupiah
1 55 2210 11 73 2930
2 60 2390 12 64 2470
3 63 2430 13 69 2830
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 8S
4 58 2380 14 58 2370
5 71 2760 15 63 2390
6 78 3110 16 75 2870
7 69 2780 17 78 3210
8 58 2370 18 51 2430
9 52 1990 19 67 2730
10 71 2810 20 70 2880
Dari tabel ini maka 70 , , 63 , 60 , 55
20 3 2 1
= = = = m m m m , sehingga =

=
n
i
i
m
1
1303
Jadi rata rata pengeluaran dari sampel adalah
169 40
1303
52340
20
1 i
i
20
1 i
i
m
y
. = == = = == =

= == =
= == =

Untuk menghitung ( (( ( ) )) ) y V

diperlukan beberapa perhitungan sebagai berikut:


( (( ( ) )) ) ( (( ( ) )) ) ( (( ( ) )) )
38873600 1
2880 ... 2390 2210
y ... y y y
2 2 2
2
25
2
2
2
1
20
1 i
2
i
= == =
+ ++ + + ++ + + ++ + = == =
+ ++ + + ++ + + ++ + = == =

= == =
( (( ( ) )) ) ( (( ( ) )) ) ( (( ( ) )) )
86171 = == =
+ ++ + + ++ + + ++ + = == =
+ ++ + + ++ + + ++ + = == =

= == =
2 2 2
2
25
2
2
2
1
20
1 i
2
i
70 ... 60 55
m ... m m m
( (( ( ) )) )( (( ( ) )) ) ( (( ( ) )) )( (( ( ) )) ) ( (( ( ) )) )( (( ( ) )) )
3456230
70 2880 60 2390 55 2210
m y m y m y m y
20 20 2 2 1 1
20
1 i
i i
= == =
+ ++ + + ++ + + ++ + = == =
+ ++ + + ++ + = == =

= == =
...
...
Kemudian kita uraikan persamaan berikut:
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 84
( (( ( ) )) )
( (( ( ) )) )( (( ( ) )) ) ( (( ( ) )) ) ( (( ( ) )) )
668 248085
86171 17 40 3456230 17 40 2 138873600
m y m y y 2 y m y y
2
20
1 i
2
i
2
20
1 i
20
1 i
i i
20
1 i
2
i
2
i i
,
, ,
= == =
+ ++ + = == =
+ ++ + = == =

= == = = == = = == = = == =
Karena M tidak diketahui, maka sebagaimana yang telah dijelaskan sebelumnya, M
dapat ditaksir dengan m sebagai berikut :
15 , 65
20
1303
n
m
m
20
1 i
i
= = =

=
Apabila dimisalkan bahwa total Rukun Warga yang ada di daerah tersebut adalah
sebanyak 100 (N = 100), maka varians dari pengeluarannya adalah:
( )
( )( )( )
123 , 0
1 20
668 , 248085
15 , 65 20 100
20 100
1 n
m y y
M Nn
n N
) y ( V

2
n
1 i
2
i i
2
=

|
|

\
|

=

\
|
=

=
Dengan demikian, dengan kepercayaan mendekati 95%, taksiran interval untuk
pengeluaran tersebut adalah :
( (( ( ) )) ) 702 0 167 40 123 0 2 167 40 y V 2 y , , , ,

= == = = == =
Jadi taksiran yang paling baik dari rata-rata pengeluaran untuk keperluan rumah
tangga masyarakat di kota tersebut adalah 40,167, dan kekeliruan taksiran harus
kurang dari 0,702 dengan peluang mendekati 0,95.
V.5 Taksiran Total Populasi
Penaksir dari total populasi, , adalah sebagai berikut:


= == =
= == =
= == =
n
1 i
i
n
1 i
i
m
y
M y M
(5.3)
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 8S
penaksir varians dari y M adalah:
( (( ( ) )) )
( (( ( ) )) )
( (( ( ) )) )
( (( ( ) )) )
1 n
m y y
n
n N
N
1 n
m y y
M Nn
n N
N M
1 n
m y y
M Nn
n N
M y V M y M V
n
1 i
2
i i
n
1 i
2
i i
2
2 2
n
1 i
2
i i
2
2 2


| || |

| || |

\ \\ \
| || |
= == =


| || |

| || |

\ \\ \
| || |
= == =


| || |

| || |

\ \\ \
| || |
= == = = == =



= == =
= == =
= == =
) (

(5.4)
Contoh :
Dari contoh sebelumnya mengenai tingkat pengeluaran untuk keperluan rumah
tangga masyarakat di suatu kota, akan ditaksir total pengeluarannya. Dimisalkan
bahwa terdapat 5500 penduduk dari kota tersebut, maka nilai taksiran total
pengeluarannya adalah:
( (( ( ) )) )
5 220918
167 40 5500 y M
,
,
= == =
= == =
Sebelumnya telah diketahui nilai dari ( (( ( ) )) ) y V

, namun dari sekarang ini nilai M tidak


perlu lagi ditaksir dengan m. Dengan memanfaatkan nilai yang telah diperoleh
tersebut, maka dengan menggunakan kepercayan 95%, taksiran interval untuk
adalah sebagai berikut:
( (( ( ) )) ) ( (( ( ) )) )
( (( ( ) )) ) ( (( ( ) )) )
622 3858 5 220918
123 0 5500 2 5 220918
y V M 2 5 220918 y M V 2 y M
2
2
, ,
, ,



= == =
Seringkali banyaknya elemen dalam populasi tidak diketahui ketika akan digunakan n
klaster sampling. Maka penaksir y M tidak dapat digunakan, tetapi dapat digunakan
bentuk taksiran yang lain dari total populasi yang tidak bergantung pada M. Nilai

y ,
diperoleh dengan persamaan:
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 86

= == =
= == =
n
1 i
i
y
n
1
y

(5.5)
adalah rata-rata dari total klaster untuk sampel klaster yang berukuran n. Oleh kareba
itu,

y merupakan penaksir yang tak bias untuk rata dari total N klaster dalam
populasi. Begitu juga N

y merupakan penaksir yang tak bias untuk jumlah dari total
klaster atau total populasi, .
Adapun penaksir dari total populasi , yang tidak bergantung pada M adalah:

= == =
= == =
n
1 i
i
y
n
N
y N

(5.6)
Taksiran varians untuk y N :
( (( ( ) )) )
( (( ( ) )) )
1 n
y y
Nn
n N
N y V N y N V
n
1 i
2
i
2 2


| || |

| || |

\ \\ \
| || |
= == = = == =

= == =
) (

(5.7)
Jika ternyata variasi di antara ukuran-ukuran klaster besar dan jika ukuran klaster
sangat berkorelasi dengan total klaster, maka varians untuk N

y (persamaan 5.7)
pada umumnya lebih besar dari varians untuk y M (persamaan 5.4). Penaksir N

y
tidak menggunakan informasi yang mengenai ukuran-ukuran klaster m
1
, m
2
, , m
n
sehingga bisa mangakibatkan rendahnya presisi yang dimiliki.
Contoh :
Dengan menggunakan contoh soal sebelumnya, dimisalkan bahwa untuk menaksir
total pengeluaran ternyata banyaknya penduduk dari kota tersebut tidak diketahui.
Yang diketahui adalah banyak klaster yaitu N=100. Sebagai solusinya, dapat
digunakan persamaan (5.7) sebagai berikut:
( (( ( ) )) ) 261700 52340
20
100
y
n
N
y N
n
1 i
i
= == = = == = = == =

= == =

Selanjutnya untuk menentukan varians dari penaksirnya, maka terlebih dahulu dicari
persamaan berikut:
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 87
( (( ( ) )) )
( (( ( ) )) )
1899820
52340
20
1
138873600
y
n
1
y y y
2
n
1 i
n
1 i
2
n
1 i
i
2
i
2
i
= == =
= == =
| || |

| || |

\ \\ \
| || |
= == =

= == = = == = = == =
maka interval taksiran untuk total pengeluaran untuk pengeluaran rumah tangga
masyarakat adalah :
( (( ( ) )) )
( (( ( ) )) )
( (( ( ) )) )
( (( ( ) )) )
511 12648 261700
1 20
1899820
20 100
20 100
100 2 261700
1 n
y y
Nn
n N
N 2 y N
y N V 2 y N
2
n
1 i
2
i
2
,



| || |
| || |

| || |


\ \\ \
| || |



| || |

| || |

\ \\ \
| || |



= == =


V.6 Menentukan Ukuran Sampel untuk Menaksir Rata-rata dan Total Populasi
Banyaknya informasi dalam suatu sampel klaster dipengaruhi oleh dua faktor
yaitu banyaknya klaster dan ukuran relatif dari klaster. Sebagaimana telah kita
ketahui, ukuran dari batas-batas kekeliruan (bound of error) dari taksiran tergantung
kepada variasi di antara klaster. Dengan demikian harus disahakan untuk
memperoleh variasi yang kecil diantara totalnya.diasumsikan bahwa u8kuran klaster
(unit sampling) telah dipilih dan dianggap hanya sebagai masalh dari pemililhan
jumlah klaster, n.
Dari persamaan (5.2), taksiran varians dari y adalah
( )
2
k
2
s
M Nn
n N
) y ( V

\
|
=
dimana
( (( ( ) )) )
1 n
m y y
s
n
1 i
2
i i
2
k


= == =

= == =
(5.8)
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 88
Varians sebenarnya dari y sekitar:
( (( ( ) )) )
2
k
2
M Nn
n N
y V
| || |

| || |

\ \\ \
| || |
= == = ) (

(5.9)
dimana
2
k
merupakan varians populasi yang ditaksir dengan
2
k
s .
Karena tidak dketahui
2
k
atau rata-rata dari klaster M, pemilihan ukuran sampel,
yaitu banyaknya klaster yang perlu untuk memperoleh informasi khusus mengenai
parameter populasi menjadi sulit. Kesulitan ini dapat diatasi dengan menggunakan
metode yang sama dengan penggunaan pada taksiran rasio. Yaitu, digunakansebuah
taksiran dari
2
k
dan M, yang diperoleh dari survai pendahuluan, atau dipilih
sampel yang berukuran n elemen yang telah diambil dari penelitian
sebelumnya.Dengan demikian, seperti halnya pada semua permasalahan mengenai
penentuan ukuran sampel, pada standard deviasi penaksir dikalikan dengan dua
untuk memperoleh batas-batas kekeliruan dari taksiran (bound of error), . Batasan
ini menunjukkan nilai kekeliruan maksimum yang dirasa memiliki toleransi yang
sesuai, yaitu:
( (( ( ) )) ) y V 2 = == = (5.10)
dengan menggunakan persamaan (5.9), diperoleh pemecahan untuk n.
Kita memperoleh hasil yang sama ketika menggunakan y M untuk menaksir total
populasi , karena V( y M ) = M
2
V( y ).
Pendekatan ukuran sampel dengan tujuan untuk menaksir dengan batas kekeliruan
taksiran , adalah:
2
k
2
k
D N
N
n

+ ++ +
= == =
(5.11)
dimana
2
k
ditaksir dengan
2
k
s , dan
4
M
D
2 2

= == =
(5.12)
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 89
Apabila kita mengambil nilai pengali dari simpangan baku taksirannya adalah
2
z

,
yang merupakan pendekatan dari distribusi normal baku dengan melibatkan resiko
kekeliruan sebesar , maka diperoleh :
( (( ( ) )) ) y V z
2

= == =
(5.13)
sehingga nilai D berubah menjadi :
( (( ( ) )) )
2
2 2
2
z
M
D

= == =
(5.14)
Contoh:
Misalkan data pada tabel 5.1 merupakan sampel pendahuluan dari pengeluaran untuk
keperluan rumah tangga msyarakat di suatu kota. Berapa besar sampel yang harus
diambil untuk keperluan survai yang akan datang yang bertujuan untuk menaksir rata-
rata pengeluaran dengan batas kekeliruan dari taksirannya adalah 25 ribu rupiah?
Jawab:
( (( ( ) )) )
14 13057
1 20
668 248085
1 n
m y y
s
n
1 i
2
i i
2
k
,
,
= == =

= == =


= == =

= == =
nilai M dapat ditaksir dengan :
15 , 65
20
1303
n
m
m
20
1 i
i
= = =

=
Selanjutnya nilai D diperoleh adalah:
( ) ( )
64 , 663206
4
15 , 65 25
4
M
D
2 2 2 2
= =

=
maka ukuran sampel yang sebaiknya diambil adalah
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 9u
( (( ( ) )) )
( (( ( ) )) )
35 3676 34
14 13057 2656 683722 100
14 13057 100
D N
N
n
2
k
2
k
= == =
+ ++ +
= == =
+ ++ +
= == = ,
, ,
,

jadi 35 klaster sebaiknya dijadikan sebagai sampel.


V.7 Menentukan ukuran sampel apabila tujuan penelitiannya adalah menaksir
total populasi, , menggunakan y M , dengan batas kekeliruan dari
taksiran :
Dengan pola pemikiran yang sama, maka diperoleh persamaan ukuran sampel
yang harus diambil sebagai berikut:
2
k
2
k
D N
N
n

+ ++ +
= == =
(5.15)
dimana
2
k
ditaksir dengan
2
k
s , dan
2
2
N 4
D

= == =
(5.16)
atau apabila menggunakan kita mengambil nilai pengali dari simpangan baku
taksirannya adalah
2
z

, yang merupakan pendekatan dari distribusi normal baku


dengan melibatkan resiko kekeliruan sebesar , maka nilai D berubah menjadi :
( (( ( ) )) )
2
2
N z
D
2

= == =
(5.17)
Contoh:
Dengan menggunakan data pada tabel 5.1 kembali, anggap sebagai data yang
diperoleh merupakan data survai pendahuluan. Ingin diketahui berapa banyak sampel
yang harus diambil untuk menaksir total pengeluaran masyarakat untuk keperluan
rumah tangganya, , dengan batas kekeliruan 3000 ribu rupiah. Dimisalkan bahwa
terdapat 2000 penduduk di kota tersebut.
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 91
Jawab
Dengan menggunakan persamaan (5.15) dan menaksir
2
k
dengan
( (( ( ) )) )
14 13057
1 20
668 248085
1 n
m y y
s
n
1 i
2
i i
2
k
,
,
= == =

= == =


= == =

= == =
dan
( )
( )
225
100 4
3000
N 4
D
2
2
2
2
= =

=
maka diperoleh
( )
( )
37 72 , 36
14 , 13057 225 100
14 , 13057 100
D N
N
n
2
k
2
k
=
+
=
+

=
V.8 Taksiran Proporsi Populasi
Dimisalkan bahwa seorang peneliti akan menaksir proporsi dari populasi,
maka penaksir terbaik dari proporsi populasi, , adalah proporsi sampel, atau p.
Misal a
i
merupakan jumlah total dari elemen-elemen dalam klaster ke-i yang
memilkiki karakteristik yang dimaksud. Maka proporsi karakteristik tersebut dari
elemen-elemen dalam sampel yang berukuran n klaster adalah:

=
=
=
m
1 i
i
n
1 i
i
m
a
p
(5.18)
dimana m
i
menunjukkan banyaknya elemen di dalam klaster ke-i, i = 1, 2, .., n.
Catatan bahwa p memiliki bentuk yang sama dengan y (lihat persmaan ??), kecuali y
i
diganti dengan a
i
. Taksiran varians dari p serupa dengan y .
Taksiran varians dari p :
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 92
( )
( )
1 n
m p a
M n N
n N
p V

n
1 i
2
i i
2

|
|

\
|

=

=
(5.19)
Batas-batas Kekeliruan (Bound of The error) dari taksiran :
( )
( )
1 n
m p a
M n N
n N
Z p V

Z
n
1 i
2
i i
2
2 2

|
|

\
|

= =

=

(5.20)
dimana
2
Z

diperoleh dari tabel distribusi normal baku dengan taraf signifikansi .


Apabila kita mengambil nilai = 5%, maka diperoleh nilai
2
Z

mendekati 2 , maka
persamaan di atas menjadi :
( )
1 n
m p a
M n N
n N
2
n
1 i
2
i i
2

|
|

\
|

=

=
(5.21)
persamaan varians di atas merupakan penaksir yang baik hanya jika ukuran sampel,
n,besar, katakanlah n 20. Jika m
1
= m
2
= = m
N
, maka p merupakan penaksir tak
bias untuk , dan ( ) p V

merupakan penaksir yang tak bias dari varians p yang


sebenarnya untuk setiap ukuran sampel.
Contoh :
Sebagai lanjutan dari contoh sebelumnya, kepada masyarakat ditanyakan pula apakah
masyarakat di kota tersebut menempati rumah sewaan atau rumah milik sendiri.
Hasilnya disajikan dalam tabel 5.2 . Gunakan data pada tabel tersebut untuk menaksir
proprsi penduduk yang tinggal di rumah sewaan.
Tabel 5.2
Klaster
Banyaknya
Rumah
Tangga
( m
i
)
Banyaknya
Penyewa
( a
i
)
Klaster
Banyaknya
Rumah
Tangga
( m
i
)
Banyaknya
Penyewa
( a
i
)
1 55 25 11 73 32
2 60 36 12 64 22
3 63 26 13 69 19
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 9S
4 58 21 14 58 15
5 71 39 15 63 26
6 78 30 16 75 40
7 69 20 17 78 35
8 58 25 18 51 17
9 52 24 19 67 22
10 71 30 20 70 20
Dari data di atas diperoleh beberapa besaran sebagai berikut:
34742 m a 14728 a 524 a 86171 m 1303 m
20
1 i
i i
20
1 i
2
i
20
1 i
i
20
1 i
2
i
20
1 i
i
= = = = =

= = = = =
Penyelesaian:
Taksiran terbaik dari populasi penyewa adalah p, ditunjukkan dalam persmaan 5.18,
yaitu :
40 , 0
1303
524
m
a
p
m
1 i
i
n
1 i
i
= = =

=
=
untuk menaksir varians p. kita harus menghitung:
( )
( )( ) ( ) ( )
982 , 720
86171 40 , 0 34742 40 , 0 2 14728
m p m a p 2 a m p a
2
n
1 i
2
i
2
i i
n
1 i
2
i
n
1 i
2
i i
=
+ =
+ =

= = =
Karena M tidak diketahui, maka sebagaimana yang telah dijelaskan sebelumnya, M
dapat ditaksir dengan m sebagai berikut :
15 , 65
20
1303
n
m
m
20
1 i
i
= = =

=
Apabila dimisalkan bahwa total Rukun Warga yang ada di daerah tersebut adalah
sebanyak 100 (N = 100), maka varians dari proporsi penyewa adalah:
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 94
( )
( ) ( ) ( )
000358 , 0
1 20
982 , 720
15 , 65 20 100
20 100
1 n
m p a
M Nn
n N
) y ( V

2
n
1 i
2
i i
2
=

|
|

\
|

=

|
|

\
|
=

=
Dengan demikian, dengan kepercayaan mendekati 95%, taksiran interval untuk
proporsi penyewa adalah :
( ) 0378 , 0 40 , 0 000358 , 0 2 40 , 0 p V

2 p = =
Jadi taksiran yang paling baik dari proporsi penyewa masyarakat di kota tersebut
adalah 0,40 dan kekeliruan taksiran harus kurang dari 0,0378 dengan peluang
mendekati 0,95.
V.9 Menentukan ukuran sampel untuk menaksir proporsi
Taksiran dari proporsi populasi, , dengan batas unit dari kekeliruan taksiran
dinyatakan dengan
( ) = p V 2
Persamaan di atas dapat menjadi solusi untuk menentukan besarnya sampel yang
harus diambil, n dan prosedur solusinya serupa dengan persamaan 5.15, yaitu:
2
k
2
k
D N
N
n

+ ++ +
= == =
(5.15)
dimana
2
k
ditaksir dengan
2
k
s ;
( )
1
1
2
2

=
n
m p a
s
n
i
i i
k
dan
4
2 2
M
D

= (5.16)
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 9S
atau apabila menggunakan kita mengambil nilai pengali dari simpangan baku
taksirannya adalah
2
z

, yang merupakan pendekatan dari distribusi normal baku


dengan melibatkan resiko kekeliruan sebesar , maka nilai D berubah menjadi :
( )
2
2 2
2

=
z
M
D
(5.17)
Contoh:
Dimisalkan bahwa data pada tabel 5.2 dianggap sudah kadaluarsa. Selanjutnya
diperlukan suatu penelitian baru yang bertujuan untuk menaksir proporsi penduduk
yang menyewa rumah. Berapa banyak sampel yang harus diambil untuk memberikan
taksiran tersebut dengan batas 0,03 dari kekeliruan penaksiran?
Penyelesaian:
Taksiran terbaik dari
2
k
adalah yang dihitung dengan menggunakan tabel 5.2
sebagai berikut:
( )
946 37
1 20
982 720
1
1
2
2
,
,
n
m p a
s
n
i
i i
k
=

=
Karena M tidak diketahui, maka sebagaimana yang telah dijelaskan sebelumnya, M
dapat ditaksir dengan m sebagai berikut :
15 , 65
20
1303
n
m
m
20
1 i
i
= = =

=
selanjutnya dengan mengambil nilai = 5%, diperoleh nilai 96 1
2
, z =

, maka
diperoleh nilai D sebagai berikut:
( )
( ) ( )
( )
994 0
96 1
15 65 03 0
2
2 2
2
2 2
2
,
,
, ,
z
m
D = =

sehingga diperoleh ukuran sampel minimal yang harus diambil adalah:


( )( )
( )( ) ( )
28 62 27
946 37 994 0 100
946 37 100
2
2
=
+
=
+

= ,
, ,
,
D N
N
n
k
k
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 96
Dengan demikian, klaster yang harus diambil adalah sebanyak 28. Perhatikan bahwa
nilai 28 menunjukkan banyaknya sampel minimal yang harus di ambil. Oleh karena
itu, pengambilan sampel (klaster) yang lebih dari nilai tersebut tidak menjadi masalah
selama tidak ada faktor lain yang menjadi pertimbangan ukuran sampel seperti
masalah biaya, tenaga, waktu, dan lain sebagainya.
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 97
BAB VI
SAMPLING KLASTER DUA TAHAP
VI.1 Pendahuluan
Sampling klaster dua tahap merupakan perluasan dari konsep klaster sampling.
Sebagaimana yang telah dibahas pada bab sebelumnya mengenai sampling klaster
secara umum, ternyata klaster pada umumnya merupakan suatu kumpulan dari
elemen-elemen, seperti blok-blok rumah tangga. Sebuah klaster sering mengandung
begitu banyak elemen. Oleh karena itu, diperlukan suatu pengelompokkan kembali
dari elemen-elemen klaster yang telah terbentuk tersebut. Proses pengelompokkan
kedua dari klaster-klater pertama yang terbentuk itu menghasilkan suatu prosedur
sampling klaster dua tahap. Sebagai contohnya adalah apabila akan diteliti pendapat
masyarakat di suatu daerah, dalam hal ini kecamatan merupakan bentuk klaster yang
pertama. Akan tetapi dikarenakan adanya keterbatasan dana penelitian dan didukung
pula poleh suatu kondisi dimana elemen-elemen dalam kecamatan sangat heterogen
yang merupakan imbas dari heterogennya tiap desa, maka desa-desa dari tiap klaster
dijadikan sebagai klaster-kalster dari klaster pertama (kecamatan). Prosedur pemilihan
untuk klaster tahap dua dilakukan sama halnya seperti prosedur pemilihan pada
sampling klaster satu tahap. Oleh karena itu, di sini hanya akan terpilih desa-desa dari
klaster pertama yang terpilih saja. Sehingga hal akan berakibat pada penghematan
biaya apabila dibandingkan dengan memilih desa langsung sebagai klaster tahap
pertama. Hal ini dapat dipahami karena jika desa langsung dijadikan sebagai klaster
pertama, maka muncul suatu kemungkinan bahwa desa-desa yang terpilih sangat
berjauhan yang berakibat pada peningkatan biaya survai atau biaya pengambilan data.
Definisi VI.1
Sampling klaster dua tahap merupakan suatu sampel yang diperoleh dengan diawali
pemilihan sampel peluang dari klaster-klaster pertama yang kemudian memilih
sampel peluang dari elemen-elemen masing-masing klaster yang telah dijadikan
sampel pada tahap sebelumnya.
Pembahasan dalam buku ini hanya akan terbatas pada pemilihan masing-masing tahap
secara sampling acak sederhana. Sebagai contoh, suatu survai nasional terhadap
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 98
mahasiswa-mahasiswa di universitas yang ada di Indonesia mengenai opini mereka
terhadap pemilihan presiden secara langsung. Klaster-klaster dalam hal ini universitas
dapat dipilih secara sampling acak sederhana. Apabila prosedurnya sampling klaster
satu tahap, maka seluruh mahasiswa dari universitas yang tepilih dijadikan sebagai
objek yang diteliti.
VI. 2 Cara Pembuatan Sampel Klaster Dua Tahap
Masalah pertama dalam pemilihan sampel klaster dua tahap adalah pemilihan
klaster yang tepat. Terdapat dua kondisi yang diperlukan, yaitu:
1. Kedekatan geografis dari elemen-elemen dalam klaster
2. Ukuran klaster yang sesuai bagi administer/peneliti
Pemilihan klaster yang sesuai juga tergantung pada apakah diinginkan untuk
membuat sampel sedikit klaster dengan elemen-elemen dalam kalster yang banyak
atau sampel banyak klaster dengan elemen-elemen dalam klasternya yang sedikit.
Akhirnya, pemilihan tergantung pada biaya yang akan dikeluarkan. Klaster-klaster
yang besar cenderung memiliki elemen-elemen yang heterogen, dan karenanya suatu
sampel yang besar diharuskan untuk tiap-tiap klaster agar diperoleh taksiran yang
akurat dari parameter populasi. Sebaliknya, kalster-klaster yang kecil sering
mengandung elemen-elemen yang relatif homogen, dalam hal keakuratan informasi
mengenai karakteristik dari sebuah klaster, dapat diperoleh dengan memilih suatu
sampel yang kecil dari masing-masing klaster.
VI. 3 Taksiran Tak Bias Rata-rata Populasi dan Total Populasi
Sebagaimana yang telah dibahas pada bab sebelumnya, diperlukan suatu
taksiran untuiik rata-rata populasi, , atau total populasi, dan menempatkan batas-
batas kekeliruan (bound of error) dari taksiran, . Berikut adalah notasi-notasi yang
akan digunakan:
N = Banyaknya klaster dalam populasi
n = Banyaknya klaster yang terpilih secara sampel acak sederhana
M
i
= Banyaknya elemen dalam klaster ke-i
m
i
= Banyaknya elemen yang terpilih dalam secara sampel acak sederhana dari
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 99
kklaster ke-i

=
=
N
i
i
M M
1
= Banyaknya elemen dalam populasi
N
M
M = = Rata-rata ukuran klaster populasi
ij
y = Observasi ke-j dalam sampel dari klaster ke-i

=
=
i
m
j
ij
i
i
y
m
y
1
1
= rata-rata sampel untuk klaster ke-i
Dalam pembentukan suatu taksiran rata-rata populasi, , dapat dilakukan
dengan cara yang serupa dengan bahasan dari bab V mengenai sampling klaster satu
tahap. Persamaan (5.6) menunjukkan :

=
n
i
i
y
n
N
1
merupakan suatu penaksir yang tak bias untuk . Dengan demikian jika persamaan di
atas dibagi dengan M, diperoleh:

=
n
i
i
y
Mn
N
1
menjadi suatu peaksir yang tak bias untuk . Tetapi penaksir tersebut tidak dapat
dievaluasi karena tidak lagi diketahui total klaster, y
i
. Bagaimanapun juga, y
i
dapat
ditaksir dengan
i i
y M , dan dalam penggantian
i i
y M untuk y
i
, dimiliki suatu taksiran
tak bias untuk , yang dapat dihitung dari data sampel.
Penaksir tak bias untuk rata-rata populasi, :
n
y M
M
N

n
i
i i
=
|

\
|
=
1
(6.1)
pengambilannya secara sampling acak sederhana untuk setiap tahap.
Taksiran varians dari :
( )
|
|

\
|
|
|

\
|
+ |

\
|
|

\
|
=

= i
i
n
i i
i i
i b
m
s
M
m M
M
M nN
s
M n
N
n N
V

2
1
2
2
2
2
1 1
(6.2)
dengan
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 1uu
( )
1
1
2
2

=
n
M y M
s
n
i
i i
b
(6.3)
dan
( )
n ..., , , i
m
y y
s
i
n
i
i ij
i
2 1
1
1
2
2
=

=
(6.4)
Batas kekeliruan taksiran:
( ) = V

2 (6.5)
sebagaimana yang telah dibahas pada bab sebelumnya bahwa nilai pengali 2 diperoleh
dari pendekatan nilai tabel
2

Z untuk = 5 %.
Taksiran yang ditunjukkan pada persamaan (6.1) tergantung pada M yaitu
banyaknya elemen di dalam populasi. Sebuah metoda untuk menaksir ketika M
tidak diketahui akan dibahas pada bagian selanjutnya.
Sebagai catatan bahwa
2
i
s merupakan varians sampel untk sampel yang
terpilih pada klaster ke-i.
Penaksir tak bias dari total populasi dapat diperoleh dengan cara mengalikan
nilai dari taksiran tak bias rata-rata populasi dengan banyaknya elemen dalam
populasi seperti halnya penggunaan pada sampling acak sederhana. Dengan demikian,
M merupakan penaksir yang tak bias dari untuk sampling klaster dua tahap.
Taksiran Total Populasi, :
n
y M
N M
n
i
i i
=
= =
1
dengan mengasumsikan sampling acak sederhana pada tiap tahap.
Taksiran Varians dari

:
( ) ( )

=
|
|

\
|
|
|

\
|
+
|
|

\
|
|

\
|
=
=
n
i i
i
i
i i
i b
m
s
M
m M
M
n
N
s
n
N
N
n N
V

M V

1
2
2 2
2
2
dengan
2
b
s telah dibahas pada persamaan (6.3) dan
2
i
s pada persamaan (6.4)
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 1u1
Batas Kekeliruan Taksiran
( )
( ) =
=
V

M
V

2
2
2
VI. 4 Penaksir Rasio dari Rata-rata Populasi
Penaksir yang diberikan pada persamaan (6.1) bergantung pada jumlah total dari
elemen-elemen dalam populasi, M. Seringkali M tidak diketahui. Jika kondisinya
seperti itu, maka harus ditaksir dari data sampel. Penaksir untuk M diperoleh dengan
mengalikan rata-rata ukuran klaster,

=
n
i
i
n M
1
, dengan jumlah klaster dalam populasi,
N. Proses seperti merupakan suatu penaksir rasio, dilambangkan dengan
r
, karena
baik itu pembilang maupun penyebut keduanya merupakan variabel acak.
Taksiran Rasio Rata-rata Populasi :

=
=
=
n
i
i
m
i
i i
r
M
y M

1
1
Taksiran Varians dari
r
:
( )
|
|

\
|
|
|

\
|
+ |

\
|
|

\
|
=

=

i
i
n
i i
i i
i r
m
s
M
m M
M
M nN
s
M n
N
n N
V

2
1
2
2
2
2
1 1
dengan
( )
1
1
2 2
2

n
y M
s
n
i
r i i

dan
( )
n ..., , , i
m
y y
s
i
m
i
i ij
i
i
2 1
1
1
2
2
=

=

Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 1u2
Batas Kekeliruan Taksiran:
( )
r
V

= 2
Taksiran
r
adalah bias, tapi bias tersebut dapat diabaikan jika n besar.
Taksiran Proporsi Populasi
Suatu permasalaha dalam menaksir suatu proporsi populasi, , seperti proporsi
masyarakat yang menyukai produk tertentu. Suatu penaksir dapat diperoleh dengan
menggunakan (pada persamaan 6.1), atau
r
sebagaimana yang diberikan pada
persamaan (6.9), dan dengan mengambil nilai y
ij
= 1 atau 0 yang bergantung pada
kondisi apakah elemen ke-j dalam klaster ke-i termasuk ke dalam kategori yang
dimaksud atau tidak.
Oleh karena M selalu tidak diketahui, maka dibuat formula untk menaksir dengan
menggunakan suatu taksiran rasio yang sejalan dengan
r
yang diberikan pada
persamaan (6.9). Misalkan p merupakan proporsi dari elemen-elemen yang diambil
sebagai sampel dari klaster i yang termasuk pada kategori yang dimaksud.
Penaksir Proporsi Populasi :

=
=
=
n
i
i
n
i
i i
M
p M
p
1
1
Taksiran varians :
( )
|
|

\
|

|
|

\
|
+
|
|

\
|
|

\
|
=

=
1
1 1
1
2
2
2
2
i
i i
i
i i
n
i
i i
m
q p
M
m M
M
M nN
s
M n
N
n N
p V

dengan
( )
1
1
2 2
2

=
n
p p M
s
n
i
i i
r
dan
i i
p q = 1
Batas Kekeliruan Taksiran:
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 1uS
( ) p V

2 =
VI. 6 Sampling Klaster Berukuran Sama
Dimisalkan bahwa masing-masing klaster mengandung M elemen, yaitu:
M
1
= M
2
= = M
N
= M
Dalam kasus ini, merupakan hal yang wajar apabila sampel yang diambil pun
memiliki ukuran yang sama untuk tiap klaster, yaitu :
m
1
= m
2
= = m
N
=
m
Di bawah kondisi seperti ini, persamaan (6.1) menjadi:

=
=
=
=
|

\
|
=
|

\
|
=
n
i
i
n
i
i
n
i
i i
y
n
n
y M
M N
N
n
y M
M
N

1
1
1
1
yang ekivalen dengan rata-rata sampel secara keseluruhan

= =
=
n
i
m
j
ij
y
nm

1 1
1
dimana y
ij
merupakan ukuran ke j dalam klaster ke-i. Kondisi seperti ini dapat
terjadi dalam sampling produk-produk yang berbentuk paket (sebagai contohnya
masing-masing klaster terdiri atas 1 lusin / 24 kaleng sayuran) atau dalam sampling
barang-barang manufacture.
Persamaan (6.2) menjadi:
( ) ( ) ( )
m
MSW
N
f
nm
MSB
f V

\
|
+ =
1
1 1
2 1
dimana
M
m
N
n
f , f = =
2 1
( )

=
n
i
i
y
n
m
MSB
1
2
1
dan
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 1u4
( )
( )

=
= =
=

=
n
i
i
n
i
m
j
i ij
s
n
y y
m n
MSW
1
2
1 1
2
1
1
1
MSB (Between-Claster Mean Square) merupakan rata-rata kuadrat antar klaster dan
MSW (Within-Claster Mean Square) rata-rata kuadrat dalam klaster.
Dari persamaan 6.19 di atas, dapat dibuat suatu rangkaian observasi yang penting
pada karakteristikdari sampling klaster dua tahap sebgai beikut:
1. Jika N besar, ( )
nm
MSW
V

= dan hanya bergantung pada rata-rata klaster. Dengan


demikian, dapat dihasilkan suatu taksiran yang baik dari varians sekalipun
bentuk
2
i
s merpakan taksiran yang kurang baik untuk varians dalam klaster.
Hal ini bisa terjadi, sebagai contohnya, jika sampling sistematik digunakan
dalam klaster-klaster.
2. Jika M m= (atau f
2
= 1), maka samping klaster dua tahap dikurangi menjadi
samping klaster satu tahap, sebagaimana yang telah dibahas pada bab 5.
3. Jika n = N, maka
( ) ( )
nm
MSW
f V

2
1 =
yang merupakan taksiran varians yang diperoleh dalam suatu sampel acak
stratifikasi dengan n = N strata dan m observasi dari masing-masing strata.
Oleh karena itu, terlihat bahwa m mendekati M , sampling klaster dua tahap
memiliki proses yang sama dengan sampling kalster satu tahap. Ketika n
mendekati N, sampling klaster dua tahap berkelakuan seperti sampling acak
stratifikasi. Jika elemen-elemen di dalam klaster bersifat heterogen, maka harus
dijadikan sebagai sampel dalam penelitian.
Ketika N besar, taksiran varians
( ) MSB
nm
V

1
=
akan menaksir varian yang sebenarnya;
( )
(
(


+ =
m n
V

w
b
2
2
1
dengan
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 1uS
2
b
= varians di antara rata-rata klaster
dan
2
w
= varians di antara elemen-elemen dalam klaster-klaster.
Karena MSB/m menaksir
2
b
+
2
w
/m , dan MSW menaksir
2
w
, maka jika suatu
pola:
[ ] MSW MSB
m

1
akan menaksir
2
b
. Taksiran secara terpisah dari
2
b
dan
2
w
diperlukan untuk
perhitungan ukuran sampel.
Sebagaimana dalam kasus sampling acak stratifikasi, selanjutnya akan dicari
ukuran sampel m dan n yang akan meminimalkan ( ) V untuk biaya tertentu atau
meminimalkan total biaya sampling untuk ( ) V tertentu. Dimisalkan bahwa biaya
dari masing-masing klaster adalah c
1
dan biaya dari masing-masing elemen di
dalam klaster adalah c
2
. Maka biaya total adalah:
c = nc
1
+ nmc
2
Nilai m yang akan meminimumkan ( ) V untuk biaya tertentu, atau meminimalkan
c untk varians tertentu, diberikan melalui persamaan berikut:
2
2
1
2
c
c
m
b
w

=
Setelah m ditentukan, n diperoleh dari persamaan (6.21) jika ( ) V tertentu nilainya
atau dari persamaan (6.23) jika c tertentu. Sebagai catatan bahwa m meningkat
nilainya jika
2
w
meningkat dan m akan menurun jika
2
b
meningkat. Dengan
demikian, lebih banyak elemen-elemen dalam klaster yang dijadikan sebagai
sampel (dan karenanya, akan sedikit klaster yang akan dijadikan sebagai sampel)
sebagaimana
2
w
yang lebih besar bila dibandingkan dengan
2
b
.
VI. 7 Sampling Klaster Dua Tahap dengan Peluang Sebanding Ukuran
Oleh karena banyaknya elemen di dalam sebuah klaster berbeda-beda, sebuah
teknik yang seringkali menguntungkan untuk digunakan adalah mengambil
kklaster-klaster dengan peluang yang sebanding dengan ukurannya. Biasanya,
sampling psu digunakan pada tahap pertama dari prosedur sampling klaster dua
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 1u6
tahap karena elemen-elemen dalam klaster cenderung memiliki ukuran yang sama.
Oleh karena itu, akan diberikan taksiran dari dan untuk sampling klaser dua
tahap dimana tahap pertama dari samplingnya mempunyai peluang yang
sebanding dengan ukurannya.
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 1u9
TINJAUAN MATA KULIAH
BAB VIII
Klasifiklasi Sampling
VIII.1 Sampling Peluang
Ditinjau dari sudut kesempatan semua unit sampling untuk terpilih menjadi
anggota sampel, maka sampling terbagi dalam dua bagian yaitu sampling random dan
sampling nonrandom, atau disebut juga sampling peluang dan sampling nonpeluang.
Suatu proses pengambilan sampel dikatakan random bila semua unit sampling
mempunyai peluang untuk bisa terpilih menjadi anggota sampel. Apabila dalam
proses memilih satuan sampling dilibatkan unsur peluang sedemikian rupa sehingga
besarnya peluang setiap satuan sampling untuk terpilih diketahui besarnya, maka
sampling tersebut digolongkan ke dalam sampling peluang.
Pada sampling peluang, peluang tiap elemen untuk terpilih sebegai sampel
harus diketahui. Untuk tujuan ini, maka daftar elemen untuk memilih sampel
(kerangka sampling) harus tersedia. Ke dalam sampling peluang dapat digolongkan
beberapa teknik pengambilan sampel. Selain bagaimana teknik pengambilan sampel
yang harus dikerjakan agar setiap unit mempunyai peluang terambil menjadi anggota
sampel, dalam sampling peluang juga dibahas berapa banyak unit sampling yang
harus diambil.
a. Simpel Random Sampling (SRS)
Sampling Acak Sederhana ini merupakan suatu proses memilih satuan sampling
dari populasi sedemikian rupa sehingga setiap satuan sampling dalam populasi
mempunyai peluang yang sama besar untuk terpilih ke dalam sampel dan peluang itu
diketahui sebelum pemilihan dilakukan.Terdapat dua cara dalam pengambilan
sampling acak sederhana ini, yaitu dengan pengembalian (with replacement), yang
mana dalam proses ini adanya kemungkinan bahwa suatu unit akan terpilih lebih dari
satu kali dan tanpa pengembalian (without replacement) yang mana semua unit yang
terpilih tidak akan ada yang sama.
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 11u
Proses sampling dengan Sampling Acak Sederhana digunakan apabila
memenuhi beberapa kondisi sebagai berikut :
- Variabel yang akan diteliti keadaannya relatif homogen dan tersebar merata
di seluruh populasi.
- Apabila bisa disusun secara lengkap kerangka sampling yang menyangkut
setiap satuan pengamatan yang ada dalam populasi.
b. Systematic Sampling (SS)
Suatu proses memilih dikatakan sampling sistematik apabila dalam pemilihan
itu dilakukan pemilihan sistematik setelah terpilih bilangan acak, dengan syarat
bahwa peluang terpilihnya N 1 .
Sampling sistematik digunakan apabila :
1. Bisa disusun kerangka sampling yang lengkap
2. Keadaan variabel yang sedang diteliti relatif homogen dan tersebar merata
di seluruh populasi
c. Stratified Random Sampling (StRS)
Sampling ini dilakukan apabila dalam keadaan tertentu Sampling Acak
Sederhana kurang baik untuk digunakan karena akan memberikan presisi suatu
taksiran yang rendah. Sampling Acak Sederhana akan memberikan presisi yang
tinggi apabila karakteristk populasi bersifat homogen. Akan tetapi jika keadaan
populasi relative heterogen, maka kita akan menggunakan StRS. pembentukan strata
atau stratifikasi dimaksudkan untuk meningkatkan presisi suatu taksiran. Menigkatnya
suatu presisi akan bergantung kepada derajat homogenitas yang dicapai dalam strata,
atau dapat pula dikatakan bergantung pada seberapa besar variabilitas karakteristik
yang akan diukur direfleksikan diantara strata. Hal ini tentu saja pada gilirannya
bergantung kepada efektifitas pembentukan strata.
Dalam membentuk batas-batas stratum, perlu mengumpulkan semua informasi
yang dapat menolong mengklasifikasikan unit-unit menjadi kelompok-kelompok
populasi yang satu sama lain berbeda. Data masa lalu, intuisi, pertimbangan para ahli
di lapangan, atau kejelian seseorang dalam menerka dengan baik, semuanya bisa
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 111
digunakan secara efektif dalam membentuk atau membedakan strata satu dengan yang
lainnya.
Apabila secara cermat strata sudah terbentuk, maka sampel untuk masing-
masing stratum dipilih melalui metode Sampling Acak Sederhana. Karena dilakukan
dengan metode Sampling Acak Sederhana, maka tentunya harus tersedia kerangka
sampling dalam setiap stratum.
d. Cluster Sampling (CS)
Cluster sampling dilakukan apabila peneliti ingin menekan biaya sampling
atau jika kerangka sampling yang memuat elemen/atau unit observasi tidak tersedia.
Sampling klaster adalah sampling dimana unit samplingnya adalah kumpulan atau
kelompok (cluster) elemen (unit observasi).
Proses pegambilan sampling klaster dilakukan dengan memperhatikan
kerangka sampling yang berisikan daftar klaster. Pengambilan sampel kemudian
dilakukan dengan mengambil secara acak klaster-klaster. Unit sampling yang
berisikan klaster-klaster dinamakan unit sampling utama (primary sampling unit)
disingkat USU. Apabila semua unit observasi dalam USU menjadi anggota sampel
maka dikatakan bahwa proses pengambilan sampel dilakukan dengan sampling
klaster satu tahap. Namun apabila USU dibagi lagi ke dalam unit yang lebih kecil,
maka terdapat unit sampling ke dua (secondary sampling unit) disingkat USD.
Apabila semua unit obervasi (elemen) dari USD menjadi anggota sampel, maka
dikatakan proses pengambilan sampel dilakukan dengan sampling klaster dua
tahap, demikian seterusnya.
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 11S
TINJAUAN MATA KULIAH
BAB VII
RASIO, REGRESI, DAN SELISIH PENAKSIRAN
VII. 1 PENDAHULUAN
Penaksiran rata-rata dan total populasi dalam bab-bab sebelumnya didasari
dari sebuah sampel respon pengukuran, y
1
, y
2
, y
3
,...y
n
, seperti dengan simple random
sampling dan stratified random sampling. Kadang-kadang variabel-variabel lain
berkorelasi sangat dekat dengan respon y. Dengan mengukur y dan satu atau lebih
variabel-variabel tambahan, kita bisa mendapatkan informasi tambahan untuk
menaksir rata-rata populasi. Anda mungkin mengenal penggunaan variabel-variabel
tambahan untuk menaksir rata-rata dari sebuah respon y. Ini merupakan dasar dari
konsep korelasi dan rata-rata, untuk pengembangan dari prediksi persamaan relasi y
dan x dengan metode kuadrat terkecil. Topik ini umumnya terdapat di buku
pengenalan statistika ( Mendenhall, 1987, Bab 10 ).
Pada bab-bab sebelumnya diperlihatkan penaksir-penaksir sederhana dari
parameter-parameter dengan memanfaatkan respon pengukuran, y
1
, y
2
, y
3
,...y
n
;
bagaimana pun, penekanan utamanya didasarkan kepada desain sampel survey (
simple dan stratified sampling ). Sebaliknya, pada bab ini akan dijelaskan tiga cara
baru dari penaksiran berdasarkan penggunaan variabel tambahan x. Metode-metode
tersebut yaitu, rasio, regresi, dan selisih estimasi. Ketiganya membutuhkan dua
variabel pengukuran, x dan y , dalam setiap elemen sampel. Macam-macam desain
sampling bisa menggunakan ketiga metode di atas, tapi kita akan membicarakan
simple random sampling. Penaksiran rasio akan digunakan dalam stratified random
sampling untuk menunjukkan ide dasar bagaimana ketiga metode ini digunakan.
VII.2 SURVEY-SURVEY YANG MEMBUTUHKAN PENGGUNAAN
PENAKSIR RASIO
Penaksiran yang efisien dari total populasi kadang-kadang membutuhkan
penggunaan variabel tambahan. Kita ilustrasikan penggunaan dari rasio penaksir
dalam suatu situasi berikut ini. Harga yang dibayarkan untuk jeruk dalam pengiriman
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 116
yang besar berdasarkan dari isi gula dari berat pengiriman. Isi gula yang tepat tidak
bisa ditentukan sebelum pembelian dan penyaringan jus buah dari keseluruhan beban;
namun, bagaimana pun hal tersebut bisa kita taksir. Satu metode untuk menaksir hal
diatas yaitu pertama kali kita tentukan rata-rata isi gula dalam tiap jeruk,
y
,
kemudian mengalikannya dengan jumlah jeruk N dalam muatan. Kemudian kita
ambil sampel n jeruk secara acak dari muatan untuk menentukan isi gula y untuk
masing-masing jeruk. Rata-rata dari pengukuran , y
1
, y
2
, y
3
,...y
n
, akan menaksir
y
; y N akan menaksir total isi gula dalam muatan,
y
. Sayangnya, metode ini tidak
mungkin dilakukan karena terlalu membutuhkan banyak waktu dan biaya dalam
menentukan N (yaitu dalam menentukan jumlah jeruk dalam muatan).
Kita dapat menghindari untuk menghitung N dengan mencatat beberapa fakta.
Pertama, isi gula dalam tiap jeruk , y , berkorelasi cukup dekat dengan berat dari
jeruk, x; kedua, rasio dari total gula
y
dengan total berat dari muatan
x
sama dengan
rasio dari rata-rata isi gula dalam tiap jeruk
y
dengan rata rata berat jeruk
x
. Maka:
x
y
x
y
x
y
N
N

= =
untuk mengetahui total isi gula dari muatan, kita mendapatkan
) (
x
x
y
y

=
Kita dapat menaksir
y
dan
x
dengan menggunakan y dan x , rata-rata dari isi gula
dan berat jeruk dari sampel n jeruk. Kita juga dapat mengukur
x
, yang merupakan
total berat dari jeruk dalam muatan truk. Kemudian penaksiran rasio dari total isi gula

y
yaitu:
) (
x
y
x
y
=

atau, sama dengan ( mengalikan pembilang dan penyebut dengan n ).


) ( ) (
1
1
x
n
i
i
n
i
i
x
y
x
y
x
y

=
=

= =
Dalam kasus ini jumlah elemen populasi, N, tidak diketahui, dan karena itu
kita tidak dapat menggunakan penaksir sederhana y N untuk menaksir total populasi

y
. Jadi, penaksir rasio diperlukan untuk menyelesaikan objek penaksiran. Bagaimana
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 117
pun, jika N diketahui, kita punya pilihan apakah akan menggunakan penaksir y N
atau penaksir rasio untuk menaksir
y
. Jika y dan x kerkorelasi cukup tinggi, berarti x
memberikan kontribusi untuk memprediksi y, penaksir rasio harus lebih baik dari
y N , yang semata-mata tergantung pada y .
Dalam penjumlahan untuk mendapatkan total populasi
y
, sering ada paramete-
parameter lain yang terlibat. Kita mungkin akan menaksir rata-rata populasi
y
,
dengan menggunakan prosedur penaksiran rasio. Sebagai contoh, misalkan kita akan
menaksir rata-rata isi gula dalam tiap jeruk dalam pengiriman yang berskala besar.
Kita akan menggunakan rata-rata sampel y untuk menaksir
y
. Bagaimana pun, jika y
dan x berkorelasi, penaksir rasio yang menggunakan informasi dari variabel pembantu
x sering kali memberikan penaksir yang lebih tepat untuk
y
.
Rasio populasi merupakan parameter lain yang mungkin terlibat sebagai faktor
koreksi. Sebagai contoh, asumsikan kita akan menaksir rasio dari penjualan mobil
untuk tiga bulan pertama dalam tahun ini dengan total penjualan di periode yang sama
di tahun yang lalu. Misalkan
x
merupakan total penjualan dalam tiga bulan pertama
di tahun yang lalu, sedangkan
y
total penjualan dalam periode yang sama di tahun ini.
Kita perhatikan dalam penaksiran rasio yaitu:
x
y
R

=
Kosep dari penaksiran rasio di gunakan dalam analisis data untuk survey-
survey penting dan secara praktis digunakan oleh pemerintah, dunia bisnis, dan
peneliti di akademik. Sebagai contoh, indeks harga konsumen (IHK) sebenarnya
merupakan rasio dari harga-harga pembelian yang tetap dari barang-barang yang
konstan kualitas dan kuantitasnya untuk dua waktu. Sekarang ini, IHK merupakan
perbandingan harga hari ini dengan harga tahun 1967. IHK berdasarkan pada
pengumpulan data tiap bulan atau setiap beberapa bulan dari 24000 penetapan ( toko-
toko, rumah sakit-rumah sakit, dan lain-lain) yang dikumpulkan dari 85 kota di
seluruh negara. IHK digunakan untuk mengukur tingkat inflasi.
The Current Population Survey mendapatkan informasi pengangguran yang
menggambarkan tentang usia, jenis kelamin dan ras pengangguran, menggunakan
teknik penaksiran rasio. Sebagai contoh, jumlah rasio pengangguran ras kulit hitam
dengan yang sudah bekerja untuk area sampel tertentu bisa dikembangkan untuk
menghitung jumlah pengangguran ras kulit hitam di area yang lebih besar dengan cara
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 118
mengalikan rasio sampel dengan jumlah orang ras kulit hitam yang bekerja di area
yang lebih besar yang dimaksudkan sebelumnya.
Index Retail Nielsen bisa menyediakan rasio dari rata-rata harga penjualan
untuk dua merek produk yang bersaing atau satu produk dalam dua waktu yang
berbeda. The SAMI bisa menyediakan rasio jumlah persediaan untuk dua merek yang
bersaing.
Peramalan sering menggunakan teknik penaksiran rasio. Sebagai contoh, rasio
dari total periode pertama penjualan di tahun yang sedang berjalan dengan periode
yang sama di tahun yang lalu, bisa dilakukan dengan cara mengalikan total penjualan
tahun kemarin dengan rasio, untuk menaksir total penjualan tahun ini. Cara yang
serupa juga bisa digunakan untuk pertumbuhan populasi manusia.
Dalam penelitian di akademik, ahli sosiologi menghitung rasio total anggaran
untuk makanan tiap bulannya dengan jumlah penghasilan per bulannya dari suatu
keluarga, atau rasio dari jumlah anak dengan total orang yang bertempat tinggal di
unit-unit rumah. Para peneliti medis dapat menghitung potensi relatif dari suatu obat
baru dengan melihat rasio dari rata-rata jumlah permintaan obat baru dengan yang
diperlukan untuk mendapatkan respon tertentu, dengan rata-rata jumlah dari obat yang
standar yang diperlukan untuk mendapatkan respon yang sama.
Seperti yang bisa anda lihat, kemunkinan untuk mengaplikasikan penaksiran
rasio sangant banyak dan tidak akan berkesudahan. Bagaimana pun, kita akan
menggeser penekanan kita ke cara mendapatkan penaksir
y
,
y
, dan R; dan kita akan
mengaplikasikannya dengan angka untuk masing-masing penaksir. Dalam
melakukannya nanti, sewaktu-waktu kita akan membandingkan penaksir yang
dijelaskan dengan hasil-hasil di bab-bab sebelumnya.
VII.3 PENAKSIRAN RASIO MENGGUNAKAN SIMPLE RANDOM
SAMPLING
Kita asumsikan bahwa sampel acak sederhana dengan ukuran n didapatkan
dari populasi terhingga dengan N anggota populasi. Kemudian, bagaimana kita
menaksir rata-rata populasi
y
, total populasi
y
, dan rasio populasi R, dengan
memanfaatkan informasi di sampel y dan variabel tambahan x?
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 119
Penaksir dari rasio populasi R :

=
=
=
n
i
i
n
i
i
x
y
r
1
1
(7.1)
Taksiran varian dari r :

1
) (
1
) (
1
2
2
1
1

|
|

\
|
|

\
|
=
|
|
|
|

\
|
=

=
=
=

n
rx y
nN
n N
x
y
V r V
n
i
i i
i
n
i
i
n
i
i

(7.2)
Rentang kekeliruan penaksiran :

1
) (
1
2 ) ( 2
1
2
2

|
|

\
|
|

\
|
=

n
rx y
nN
n N
r V
n
i
i i
i

(7.3)
[Jika rata-rata dari populasi x,
x
tidak diketahui, kita gunakan

x untuk
memperkirakan persamaan (6.2) dan (6.3).]
Contoh 7.1 Dalam sebuah survei yang menyelidiki tentang trend pada real estate,
seorang peneliti tertarik pada perubahan relatif selama lebih dari 2 tahun
dalam nilai perkiraan rumah pada sebuah komunitas yang khusus. Sampel
acak sederhana dengan n = 20 rumah dipilih dari N = 1000 rumah dalam
komunitas tersebut. Dari pencatatan pajak, peneliti mendapatkan nilai
perkiraan untuk tahun ini ( y ) dan nilai sebenarnya dari 2 tahun yang lalu
( x ) untuk tiap sampel dengan n = 20 rumah. Dia berharap untuk
memperkirakan R, perubahan relatif pada nilai perkiraan untuk N = 1000
rumah, dengan menggunakan informasi pada sampel.
Data dari survei real estate ditunjukkan pada tabel 7.1. Kita telah
menambahkan kolom x
i
2
, y
i
2
dan x
i
y
i
, yang sangat penting untuk
menghitung ) (r V

.
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 12u
Dengan menggunakan data pada tabel 7.1, taksirlah R, perubahan relatif
pada penilaian real estate selama periode 2 tahun yang diberikan. Cari
juga rentang kekeliruan penaksiran.
Pembahasan
Taksiran R dengan menggunakan data sampel diperoleh dengan

lalu yang tahun rumah dari total nilai
rumah dari sebenarnya total nilai
x
y
r
i
i
i
2 20
20
20
1
20
1
=
|
|
|
|

\
|
=

=
=
dengan menggunakan tabel 6.1
07 . 1
5 . 154
7 . 164
= = r
Karena itu, kita menaksir bahwa nilai real estate telah naik kurang lebih 7
% selama 2 tahun periode pada daerah yang diteliti.
Tabel 7.1 Data dan perhitungan survei nilai real estate ( dalam $ 10,000 )
Rumah Nilai perkiraan 2 tahun
yang lalu ( xi )
Nilai sebenarnya
( yi )
xi
2
yi
2
xiyi
1 6.7 7.1 44.88 50.41 47.57
2 8.2 8.4 67.24 70.56 83.88
3 7.9 8.2 62.41 67.24 74.78
4 6.4 6.9 40.96 47.01 44.16
5 8.3 8.4 68.89 70.56 69.72
6 7.2 7.9 51.84 62.41 56.88
7 6.0 6.5 36.00 42.25 39.00
8 7.4 7.6 54.76 57.76 56.24
9 8.1 8.9 65.61 79.21 72.09
10 9.3 9.9 86.49 98.01 92.07
11 8.2 9.1 67.24 82.81 74.62
12 6.8 7.3 46.24 53.29 49.64
13 7.4 7.8 54.76 60.84 57.72
14 7.5 8.3 56.25 68.89 62.25
15 8.3 8.9 68.89 79.21 73.87
16 9.1 9.6 82.21 92.16 87.36
17 8.6 8.7 73.96 75.69 74.82
18 7.9 8.8 62.41 77.44 69.52
19 6.3 7.0 39.69 49.00 44.10
20 8.9 9.4 79.21 88.36 83.66
Jumlah 154.5 164.7 1210.55 1373.71 1288.95

Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 121
Rentang kesalahan penaksiran didapatkan dengan menggunakan persamaan
(7.3). Jalan singkat untuk menghitung

20
1
2
) (
i
i i
rx y adalah dengan


= = = =
+ =
20
1
20
1
2 2
20
1
2
20
1
2
2 ) (
i
i i
i
i
i
i
i
i i
y x r x r y rx y (7.4)
Nilai-nilainya didapatkan dari tabel 6.1 :

=
+ =
20
1
2 2
) 95 . 1288 )( 07 . 1 ( 2 ) 55 . 1210 ( ) 07 . 1 ( 71 . 1373 ) (
i
i i
rx y
= 1.3157
Dengan menggunakan persamaan (7.3)

1
) (
1
2 ) ( 2
1
2
2

|
|
|

\
|
|

\
|
=

n
rx y
x
nN
n N
r V
n
i
i i
=
19
) 3157 . 1 (
) 725 . 7 (
1
) 1000 ( 20
20 1000
2
1
2
2

=
|
|
|

\
|
|
|

\
|
n
i
= 0.015
Jadi, kita menaksir rasio dari nilai real estate sekarang dengan yang dua tahun
yang lalu menjadi r = 1.07 dan kita sungguh yakin bahwa kesalahan penaksiran
kurang dari 0.02. Karena itulah, rasio sebenarnya R untuk polpulasi seharusnya
berada diantara 1.05 dan 1.09. Dengan catatan bahwa rentang kesalahan dari
penaksiran cukup kecil. Karena itu r seharusnya menjadi penaksir yang cocok untuk
R.
Interval konfidensi untuk sampel besar yang didasai oleh teori distribusi
normal, seperti yang ditunjukkan dalam bagian 2, mengaplikasikan contoh rasi
estimasi dengan baik. Dengan demikian sebagai contoh, penaksiran inteval konfidensi
90 % untuk rasio R dalam bentuk
) ( 645 . 1 r V r

Taksiran varians r dapat dituliskan dalam berbagai bentuk. Salah satu yang
lebih khusus yang berguna untuk menunjukkan koefisien korelasi antara x dan y.
Korelasi ini dapat ditaksir oleh

y x
xy
S S
S
=
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 122
dimana
S
xy
=

n
i
i i
y y x x
n
1
) )( (
1
1
S
x
2
=
2
1
) (
1
1

n
i
i
x x
n
dan
S
y
2
=
2
1
) (
1
1

n
i
i
y y
n
Koefisien korelasi akan memegang peranan kunci pada diskusi selanjutnya.
Sekarang kita menuliskan
) 2 (
1 1
) (
2 2 2
2
y x x y
x
S S r S r S
n
f
r V

+
|
|

\
|

dimana f = n/N, fraksi sampling. Bentuk ini sering digunakan dengan perhitungan
yang ditampilkan dengan paket-paket perangkat lunak dari statistika stansar. Sebagai
contoh, Minitab membaca data pada sampel 7.1 adalah
N Mean Stdev
x 20 7.725 0.947
y 20 8.235 0.957

Korelasi antara x dan y adalah 0.966
Dari rangkuman ini,
( ) [ ]

+ |

\
|
|

\
|
|

\
|
=

) 957 . 0 )( 947 . 0 )( 966 . 0 )( 07 . 1 ( 2 ) 947 . 0 ( ) 07 . 1 ( 957 . 0 .


725 . 7
1
20
1
1000
20
1 ) (
2 2 2
2
r V
= 0.0000567
dan 2 ) (r V

= 0.015, dianggap sama dengan perhitungan yang di awal.


Ada analogi antara penaksir rasio dan analisis regresi klasik. Kami akan
memperkenalkan salah satu dari analogi dengan tujuan perhitungan, dan menggali
bagian lain dari hubungan tersebut nantinya. Dalam regresi klasik dalam populasi
yang tidak terbatas, seandainya kita membuat model
E (y
i
) = x
i
Selanjutnya, jika varian y
i
proporsional terhadap x
i
. Kemudian, analisis regresi yang
diboboti seharusnya digunakan, dengan bobot proporsi pada kedua variannya, atau
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 12S
1/x
i
dalam kasus ini. Kuadrat terkecil biasa dalam analisi regresi yang terbobot
dengan bobot 1/x
i
akan menghasilkan r sebagai penaksir . Standar deviasi dari
koefisien regresi akan hampir sama dengan perhitungan 2 ) (r V

kita yang pertama,


kecuali untuk koreksi populasi yang terbatas.
Hasil dari MINITAB untuk analisis regresi yang terbobot untuk data pada
contoh 7.1 adalah
Tre regress|or equal|or |s
y = 1.0Zx
Pred|ctor 6oef 8tdev t-rat|o p
No Corslar
x 1.002 0.00Z15 113.1 0.000

Jika taksiran koefisien 1.066 1.07 = r, dan
2 ) (r V

= 15 . 0 ) 00745 . 0 ( 98 . 0 2 =
adalah seperti hasil perhitungan kita yang diawal. Pendekatan ini tentunya membawa
kebosanan pada perhitungannya, tapi pengguna teknik ini seharusnya memiliki
pengetahuan tentang regresi klasik disamping yang ada di buku ini. ( t-rasio dan p-
value yang ditunjukkan diatas, jika dalam populasi normal yang tidak terbatas,
koefisien regresi akan berbeda secara signifikan terhadap nol).
Tehnik rasio untuk menaksir total populasi
y
diaplikasikan dalam penaksiran
toal isi gula dalam muatan truk jeruk. Penaksir sederhana dari N

y tidak dapat
digunakan karena kita tidak mengetahui N, total banyaknya jeruk dalam truk.
Prosedur penaksiran rasio berikut dapat diaplikasikan dalam menaksir
y
apakah N
diketahui atau tidak.
Penaksir rasio dari total populasi y

:
y

=
x x
n
i
i
n
i
i
r
x
y
=

=
=
) (
1
1
(7.5)
Varian dari taksiran y

:

2 2
) ( ) ( ) (
x x
y r V V = =

1
) (
1
1
2
2

|
|

\
|
|

\
|

=
n
rx y
nN
n N
n
i
i i
i

(7.6)
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 124
dimana
x
dan
x
adalah rata-rata populasi dan total, yang berturut-turut, dari variabel
acak x.
Rentang kesalahan dari penaksiran :
1
) (
1
2 ) ( 2
1
2
2
2
^

|
|

\
|
|

\
|
=

n
rx y
nN
n N
V
n
i
i i
x
x y

(7.7)
Dengan catatan meskipun kita tidak perlu mengetahui N atau
x
, kita harus
mengetahui
x
untuk menaksir
y
dengan menggunakan prosedur penaksiran rasio.

Contoh 7.2 Dalam sebuah penelitan untuk menaksir total banyaknya gula dalam
muatan truk jeruk, sebuah sampel acak dengan n = 10 jeruk dibuat
menjadi jus dan diukur beratnya. Total berat dari semua jeruk, didapatkan
dengan penimbangan pertama pada truk yang berisi muatan dengan
kemudian truk yang dikosongkan, didapatkan 1800 pon. Taksirlah
y
,
total jumlah gula pada jeruk, dan rentang kekeliruan penaksirannya
Tabel 7.2 Data untuk contoh 7.2
Jeruk Jumlah gula
(dalam pon)
Berat jeruk
(dalam pon)
1 0.021 0.40
2 0.030 0.48
3 0.025 0.43
4 0.022 0.42
5 0.033 0.50
6 0.027 0.46
7 0.019 0.39
8 0.021 0.41
9 0.023 0.42
10 0.025 0.44
Total 0.246 4.35

Gula yang terkandung dalam jeruk biasanya dicatat dalam derajat brix, yang
merupakan pengukur berapa pon gula padat per 100 pon jeruk. Untuk menghitungnya
kita akan menggunakan berapa pon kandungan yang sebenarnya untuk setiap jeruk.
Taksiran
y
dapat diperoleh dengan menggunakan persamaan (7.5):
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 12S
y
= r
x
= pon
x
y
x
i
i
i
i
79 . 101 ) 1800 (
35 . 4
246 . 0
) (
10
1
10
1
= =

=
=

Besarnya kekeliruan taksiran dapat dihitung dengan menggunakan versi modifikasi


dari persamaan (7.7). Karena N tidak diketahui dalam contoh ini, kita asumsikan
faktor koreksi populasi, (N-n)/N, mendekati nilai yang sama. Asumsi ini cukup
beralasan karena kita mengharapkan sedikitnya N = 4000 jeruk di dalam sebuah truk
kecil sekalipun. Rata-rata sampel x digunakan untuk menggantikan
x
pada
persamaan (7.7), karena
x
tidak diketahui. Dengan demikian persamaan (7.7) menjadi
) (

2
y
V =
1
) (
1 1
2
1
2
2
2

\
|
|

\
|

=
n
rx y
x n
n
i
i i
x

Gunakan persamaan (7.4), untuk menghitung :



= = = =
+ =
10
1
10
1
2 2
10
1
2
10
1
2
2 ) (
i
i i
i
i
i
i
i
i i
y x r x r y rx y
dimana
0566 . 0
35 . 4
246 . 0
10
1
10
1
= = =

=
=
i
i
i
i
x
y
r
Dari data,
006224 . 0 ) 025 . 0 ( ... ) 030 . 0 ( ) 021 . 0 (
2 2 2
10
1
2
= + + + =

= i
i
y
10839 . 0 ) 44 . 0 )( 025 . 0 ( ... ) 48 . 0 )( 030 . 0 ( ) 40 . 0 )( 021 . 0 (
9035 . 1 ) 44 . 0 ( ... ) 48 . 0 ( ) 40 . 0 (
10
1
2 2 2
10
1
2
= + + + =
= + + + =

=
=
i
i i
i
i
x y
x
435 . 0
10
35 . 4
= = x
Substitusikan ke dalam persamaan (7.4) didapat
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 126

= = = =
+ =
10
1
10
1
2 2
10
1
2
10
1
2
2 ) (
i
i i
i
i
i
i
i
i i
y x r x r y rx y
= 0.006224 + (0.0566)
2
(1.9035) - 2 (0.0566) (0.10839)
= 0.000052285
Maka kekeliruan penaksirannya adalah
1
) (
1 1
2 ) (

2
10
1
2
2
2

\
|
|

\
|
=

=
n
rx y
x n
V
i
i i
x y

= 3 . 6
9
000052285 . 0
) 435 . 0 (
1
10
1
) 1800 ( 2
2
2
=
|

\
|
(

\
|
Kesimpulannya, rasio penaksiran total gula dalam truk jeruk adalah
y
= 101.79 pon,
dengan kekeliruan penaksiran 7.3. Kita yakin bahwa total kandungan gula
y
berada
pada interval
101.79 6.3
sehingga, intervalnya berada pada 95.49 sampai 108.09 pon.
Selain itu, deskriptif statistik, yang diperlihatkan di bawah ini dari output
Minitab, dapat digunakan untuk menghitung ) (

r V , bagian utama dari ) (

y
V .
N Rata-rata Stdev
x 10 0.4350 0.0354
y 10 0.02460 0.00438
Korelasi x dan y = 0.991
Analisis regresi yang diboboti dengan garis lurus melalui titik pangkalnya
menghasilkan :
Persamaan regresinya adalah
y = 0.0566 x
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 127
Prediktor Koef Stdev rasio t p
Konstanta - - - -
x 0.056552 0.001719 32.90 0.000
Maka didapat,
) (

2 ) (

2 r V V
x y
=
= 2 (1800) (0.001719) = 6.19
yang sangat dekat dengan hasil yang diberikan oleh metode perhitungan yang
sebelumnya.
Anda akan mengatakan bahwa populasi berukuran N seringkali diketahui.
Oleh karena itu, peneliti harus memutuskan dalam kondisi bagaimana menggunakan
penaksir rasio x r
y
= lebih baik dibandingkan dengan menggunakan penaksir
koresponding y N , dimana kedua penaksir didasarkan pada SRS_Sampling Acak
Sederhana (lihat bagian 7.5). Umumnya, x r mempunyai varians yang lebih kecil
daripada y N apabila terdapat korelasi positif yang kuat antara x dan y, (dimana ,
koefisien korelasi antara x dan y, lebih besar dari ). Secara intuisi, pernyataan ini
masuk akal karena dalam penaksiran rasio kita menggunakan informasi tambahan dari
penambahan variabel x.
Jika peneliti lebih tertarik dengan rata-rata populasi daripada total populasi,
prosedur penaksiran rasio koresponding ditunjukkan dalam persamaan (7.8), (7.9),
dan (7.10).
Penaksir rasio rata-rata populasi
y
:
x x
n
i
i
n
i
i
y
r
x
y
= =

=
=
) (
1
1
(7.8)
Varians taksiran dari
y
:
1
) (
1
) (

) (

1
2
2
2 2

|
|

\
|
|

\
|
= =

=
n
rx y
nN
n N
r V V
n
i
i i
x
x x y

(7.9)
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 128
Taksiran kekeliruannya :
1
) (
2 ) (

2
1
2

\
|
=

=
n
rx y
nN
n N
V
n
i
i i
y
(7.10)
Catatan bahwa kita tidak perlu mengetahui
x
atau N untuk menaksir
y
ketika
menggunakan prosedur rasio; tetapi
x
harus kita ketahui.
Contoh 7.S
Sebuah perusahaan ingin menaksir rata-rata jumlah uang
y
yang dibayarkan kepada
karyawan untuk biaya pengobatan selama tiga bulan pertama pada kalender tahunan.
Laporan rata-rata setiap tiga bulan ini didapat dari laporan keuangan tahun
sebelumnya. Sampel acak sebanyak 100 karyawan diambil dari populasi sebanyak
1000 karyawan. Hasilnya dinyatakan sebagai berikut. Gunakan data tersebut untuk
memprediksi
y
dan untuk menempatkan kekeliruan penaksiran.
, 100 = n 1000 = N
Total tiga bulan terakhir :
1750
100
1
=

= i
i
y
Total tiga bulan koresponding tahun sebelumnya :
1200
100
1
=

= i
i
x
Total populasi
x
untuk tiga bulan koresponding tahun sebelumnya :
12500 =
x

, 650 , 31
2
100
1
=

=
i
i
y , 620 , 15
100
1
2
=

= i
i
x 35 . 059 , 22
100
1
=

= i
i i
x y
Solusi
Taksiran untuk
y
adalah
x y
r =
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 129
dimana
5 . 12
1000
500 , 12
= = =
N
x
x

Maka
23 . 18 ) 5 . 12 (
1200
1750
) (
100
1
100
1
= = =

=
=
x
i
i
i
i
y
x
y

Taksiran kekeliruan didapat dengan menggunakan persamaan (7.10); tetapi kita harus
menghitung terlebih dahulu

= = = =
+ =
100
1
100
1
2 2
100
1
2
100
1
2
2 ) (
i
i i
i
i
i
i
i
i i
y x r x r y rx y
= 31.650 + (1.4583)
2
(15,620) - (2.9166) (22,059.35)
= 441.68
Substitusikan ke dalam persamaan (7.10) memberikan taksiran kekeliruan :
1
) (
2 ) (

2
1
2

\
|
=

=
n
rx y
nN
n N
V
n
i
i i
y

= 42 . 0
99
68 . 441
) 1000 ( 100
100 1000
2 = |

\
|
Maka taksiran rata-rata jumlah uang yang dibayar kepada karyawan untuk biaya
pengobatan $18.23. Kita sangat yakin bahwa kekeliruan untuk taksiran
y
kurang
dari $0.42.
Untuk mengingat rumus taksiran rasio dari rata-rata populasi, total, atau rasio, kita
membuat asosiasi berikut. Rasio sampel r dinyatakan dalam rumus berikut

=
=
=
n
i
i
n
i
i
x
y
r
1
1

(7.11)
Penaksir R ,
y
, dan
y
adalah
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 1Su
r R =


(7.12)
x y
r =
(7.13)
x y
r =
(7.14)
Jadi kita hanya perlu mengetahui rumus r dan hubungannya dengan
y
dan .
y

Taksiran varians bisa diperoleh dengan mengingat rumus dasar,
1
) (
1
) (

1
2
2

|
|

\
|
|

\
|
=

=
n
rx y
nN
n N
r V
n
i
i i
x

(7.15)
Maka
) (

) (

2
r V V
x y
= (7.16)
) (

) (

2
r V V
x y
= (7.17)
VII.4 MENENTUKAN UKURAN SAMPEL
Kita menyatakan sebelumnya bahwa jumlah informasi yang dimuat dalam
sampel bergantung pada variasi dalam data (yang sering dikontrol dengan disain
sampling survey) dan jumlah observasi n yang termasuk dalam sampel. Setelah
disain sampling ditentukan, peneliti harus menentukan jumlah bagian-bagian yang
akan digambar. Kita akan menentukan ukuran sampel yang dibutuhkan untuk
menaksir parameter populasi R,
y
, atau
y
dalam B unit untuk sampling acak
sederhana dengan menggunakan penaksir rasio.
Catatan bahwa prosedur untuk memilih ukuran sampel n identik dengan yang
ditunjukkan pada bagian sebelumnya. Jumlah observasi yang dibutuhkan untuk
menaksir R, sebuah rasio populasi, dengan taksiran kekeliruan sebesar B diperoleh
dengan menetapkan dua standar deviasi dari penaksir rasio r sama dengan B dan
nyatakan untuk n. Sehingga kita harus menyelesaikan
B r V = ) ( 2 (6.18)
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 1S1
dengan B adalah bound of error dari penaksiran. Dan ) (
^
r V sebagai penaksir varians
dari r diperoleh melalui persamaan:
( )
1
1
) (
1
2
2
^

|
|

\
|
|

\
|
=

=
n
rx y
nN
n N
r V
n
i
i i
x

(7.19)
atau :
2
2
^
1
) ( s
nN
n N
r V
x
|
|

\
|
|

\
|
=

(7.20)
dengan
1
) (
1
2
2

n
rx y
s
n
i
i i
Varians populasi V(r) yang mendekati dapat diperoleh dari ) (
^
r V dengan mengganti
2
s oleh
2
. Maka jumlah observasi n yang diperlukan untuk menaksir R dengan
bound of error B dapat diperoleh dengan mencari solusi untuk n dari persamaan
berikut ini :
B
nN
n N
r V
x
=
|
|

\
|
|

\
|
=
2
2
1
2 ) ( 2

(7.21)
Ukuran sampel yang diperlukan untuk menaksir R dengan bound of error B
adalah :
2
2

+
=
ND
N
n (7.22)
dengan
4
2 2
x
B
D

=
Dalam kenyataan di lapangan kita seringkali dihadapkan pada permasalahan dalam
menentukan ukuran sampel karena
2
tidak diketahui. Jika informasi yang
diperlukan untuk menghitung
2
s sebagai penaksir dari
2
tidak tersedia, maka kita
mengambil sebuah sampel pendahuluan berukuran
'
n .
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 1S2
1
) (
'
1
2
2
^
'

n
rx y
n
i
i i

kemudian kita substitusikan hasil dari persamaan ini untuk
2
pada persamaan
(7.22), maka kita akan mendapatkan ukuran sampel yang mendekati. Jika
x
juga
tidak diketahui, maka
x
dapat digantikan oleh rata-rata sampel

x , yang dihitung
dari
'
n yang diperoleh pada penelitian pendahuluan.
Contoh7.4 : Sebuah perusahaan perakitan berkeinginan untuk menaksir rasio
perubahan hilangnya jam kerja karyawan dikarenakan sakit antara
tahun lalu dengan tahun ini. Sebuah penelitian pendahuluan dengan
'
n = 10 orang pekerja telah dilakukan, dan hasilnya disajikan pada
tabel di bawah. Catatan perusahaan menunjukkan bahwa jumlah
total jam kerja karyawan yang hilang karena sakit adalah sebesar
. 300 , 16 =
x
Dengan data yang telah tersedia kita akan
menentukan ukuran sampel yang diperlukan untuk menaksir R ,
dengan besarnya bound of error B = 0.01. Diasumsikan bahwa
perusahaan memiliki 1000 orang karyawan (N = 1000).
Pekerja Jam kerja karyawan
yang hilang untuk tahun
yang lalu, x
Jam kerja karyawan yang
hilang untuk tahun yang
sedang dijalani, y.
1
2
3
4
5
6
7
8
9
10
12
24
15
30
32
26
10
15
0
14
178
13
25
15
32
36
24
12
16
2
12
187
Pemecahan :
Pertama kita menghitung penaksir dari
2
dengan menggunakan data yang diperoleh
dari penelitian pendahuluan
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 1SS
9
) (
10
1
2
2
^

=

=
i
i i
rx y

Dengan :

= = = =
+ =
10
1
10
1
10
1
2 2 2
10
1
2
2 ) (
i i
i i
i
i i
i
i i
y x r x r y rx y
Kemudian, dari data yang disajikan pada tabel kita akan menentukan :

=
= + + + =
10
1
2 2 2 2
4463 ) 12 ( ... ) 25 ( ) 13 (
i
i
y
4066 ) 14 ( ... ) 24 ( ) 12 (
2 2 2
10
1
2
= + + + =

= i
i
x

= + + + = 4066 ) 12 )( 14 ( ... ) 42 )( 25 ( ) 13 )( 12 (
i i
y x
05 . 1
178
187
10
1
10
1
= = =

=
=
i
i
i
i
x
y
r

= = = =
+ =
10
1
10
1
10
1
2 2 2
10
1
2
2 ) (
i i
i i
i
i i
i
i i
y x r x r y rx y
625 . 31 ) 4245 )( 05 . 1 ( 2 ) 4066 ( ) 05 . 1 ( 4463
2
= + =
dan
3 . 16
9
625 . 31
9
) (
10
1
2
2
^
= =

= i
i i
rx y

006642 . 0
4
) 3 . 16 ( ) 01 . 0 (
4
2 2 2 2
= = =
x
B
D

3e|ararg ||la dapal rererlu|ar u|urar sarpe| yarg d|per|u|ar dergar rerggura|ar
persaraar (Z.22). 3eoaga| calalar oarWa :
3 . 16
1000
300 . 16
= = =
N
x
x

dan
006642 . 0
4
) 3 . 16 ( ) 01 . 0 (
4
2 2 2 2
= = =
x
B
D

dengan demikian
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 1S4
416 . 343
474 . 3 ) 006642 . 0 ( 1000
) 474 . 3 ( 1000
2
^
2
^
=
+
=
+
=

ND
N
n
Maka untuk menaksir R, tingkat perubahan jam kerja karyawan yang hilang karena
sakit, dengan bound of error dari penaksiran sebesar B = 0.01 jam kita memerlukan
sebanyak 344 orang karyawan untuk diteliti.
Dengan cara yang sama, kita dapat menentukan jumlah observasi n yang
diperlukan untuk menaksir rata-rata populasi
y
, dengan bound of error dari
penaksiran sebesar B. Ukuran sampel yang diperlukan untuk menaksir
y
diperoleh
dengan mencari solusi untuk n dari persamaan berikut :
B V
y
= ) ( 2
^
(7.23)
Persamaan tersebut juga dapat dinyatakan sebagai berikut :
B r V
x
= ) ( 2
Ukuran sampel yang diperlukan untuk menaksir
y
dengan bound of error
penaksiran B adalah :
2
2

+
=
ND
N
n
dengan
4
2
B
D =
Sebagai catatan bahwa untuk menentukan n pada persamaan (7.24) kita tidak perlu
mengetahui nilai
x
; namun demikian kita tetap memerlukan taksiran dari
2
, yang
bisa kita peroleh atau kita tentukan dari penelitian yang telah dilakukan sebelumnya.
Contoh 7.5 : Seorang peneliti berkeinginan untuk menaksir rata-rata
jumlah pohon per hektar pada sebuah kebun yang berukuran N
= 1000 hektar. Dia berencana mengambil sampel berukuran n
dari 1-hektar bidang tanah, kemudian menghitung y, jumlah
pohon untuk setiap bidang tanah. Dia juga memiliki pencitraan
dari kebun tersebut yang bisa digunakan untuk menaksir x,
jumlah pohon pada setiap bidang tanah untuk seluruh kebun,
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 1SS
sehingga dia juga mengetahui
x
. Tentukanlah ukuran sampel
yang diperlukan untuk menaksir
y
dengan bound of error dari
penaksiran sebesar B = 1.0.
Pemecahan : Diasumsikan bahwa informasi yang diperlukan untuk
kepentingan penelitian tidak tersedia, maka kita harus
mengadakan sebuah penelitian pendahuluan untuk menaksir
2
. Karena setiap harinya peneliti bisa memeriksa 10 bidang
tanah untuk menentukan y, jumlah seluruh pohon per bidang
tanah, maka tepat sekali jika kita menggunakan
'
n = 10 bidang
tanah pada penelitian pendahuluan.
Hasil dari penelitian disajikan pada tabel di bawah ini :
Bidang
tanah
Nilai
taksiran, x
Nilai
sebenarnya,
y.
1
2
3
4
5
6
7
8
9
10
23
14
20
25
12
18
30
27
8
31
208
25
15
22
24
13
18
35
30
10
29
221

Taksiran dari
2
dapat diperoleh melalui persamaan
9
) (
10
1
2
2
^

=

=
i
i i
rx y

Kemudian gunakanlah persamaan (7.4)

= = = =
+ =
10
1
10
1
10
1
2 2 2
10
1
2
2 ) (
i i
i i
i
i i
i
i i
y x r x r y rx y
Dari penelitian pendahuluan kita peroleh
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 1S6

=
= + + + =
10
1
2 2 2 2
5469 ) 29 ( ... ) 15 ( ) 25 (
i
i
y
4872 ) 31 ( ... ) 14 ( ) 23 (
2 2 2
10
1
2
= + + + =

= i
i
x

= + + + = 5144 ) 29 )( 31 ( ... ) 15 )( 14 ( ) 23 )( 22 (
i i
y x
06 . 1
208
221
10
1
10
1
= = =

=
=
i
i
i
i
x
y
r

= = = =
+ =
10
1
10
1
10
1
2 2 2
10
1
2
2 ) (
i i
i i
i
i i
i
i i
y x r x r y rx y

8992 . 37 ) 5144 )( 06 . 1 ( 2 ) 4872 ( ) 06 . 1 ( 5469
2
= + =
Dengan menggunakan persamaan (7.24), sekarang kita bisa menentukan n dengan
4
1
4 /
2
= = B D
56 . 16
21 . 4 ) 25 . 0 ( 1000
) 21 . 4 ( 100
2
2
=
+
=
+
=

ND
N
n
Maka untuk menaksir
y
, rata-rata jumlah pohon per 1-hektar bidang tanah, dengan
bound of error sebesar B = 1.0. kita memerlukan sebanyak 17 bidang tanah untuk
diteliti. Karena pada penelitian pendahuluan kita telah meneliti sebanyak 10 bidang
tanah, maka kita tinggal meneliti sisanya yaitu sebanyak 7 bidang tanah.
Ukuran sampel yang diperlukan untuk menaksir
y
dengan bound of error
sebesar B bisa didapatkan dengan mencari solusi untuk n dari persamaan berikut :
B V
y
= ) ( 2
^
(7.25)
persamaan di atas juga dapat ditulis sebagai berikut
B r V
x
= ) ( 2 (7.26)
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 1S7
Ukuran sampel yang diperlukan untuk menaksir
y
dengan bound of error B
adalah :
2
2

+
=
ND
N
n (7.27)
dengan
2
2
4N
B
D =
VII.5 TAKSIRAN REGRESI

Telah ditunjukan sebelumnya bahwa penaksir rasio lebih layak digunakan jika
hubungan antara y dan x adalah linier. Jika kenyataan dari hubungan linier antara
pengamatan ys dan xs, tetapi tidak harus salah satunya , lalu informasi tambahan
disediakan dengan bantuan variabel x yang didapat dari perhitungan taksiran regresi
dari rata-rata
y
. Harus diketahui
y
sebelum penaksir dapat dipakai, seperti yang
ada dalam taksiran rasio dari
y
.
Yang digarisbawahi memperlihatkan hubungan dasar antara ys dan xs yang
kadang menunjuk pada garis regresi dari y atas x.
Penaksir memberikan asumsi bahwa xs adalah variabel tetap dan ys adalah
variabel acaknya. Dapat kita pikirkan nilai x sebagai suatu yang telah diteliti, seperti
pendapatan seperempat bulan pertama tahun yang lalu, dan respon y sebagai variabel
acak yang belum di teliti, seperti pendapatan empat bulan berikutnya dari suatu
perusahaan untuk x yang telah diketahui. Peluang dari penaksir selanjutnya
tergantung hanya dari y untuk pasangan xs.
Penaksir Regresi dari rata-rata populasi
y

) ( x b y
x yL
+ = (7.28)
dimana

=
=


=
n
i
i
n
i
i i
x x
x x y y
b
1
2
1
) (
) )( (
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 1S8
Penaksir varians dari
yL

(
(

\
|

\
|
=

= =
n
i
n
i
i i yL
x x b y y
n Nn
n N
V
1 1
2 2 2
) ( ) (
2
1
) (

(7.29)
Penaksir batasan kesalahan
(
(

\
|

\
|
=

= =
n
i
n
i
i i yL
x x b y y
n Nn
n N
v
1 1
2 2 2
) ( ) (
2
1
2 ) ( 2 (7.30)
Ketika menghitung b dari pasangan penelitian (y
1,
x
1
),,(y
n
,x
n
), kita dapat
menggunakan fakta bahwa

=
=
=
=


n
i
i
n
i
i i
n
i
i
n
i
i i
x n x
y x n x y
x x
x x y y
1
2 2
1
1
2
1
) (
) )( (
Contoh 7.9
Perolehan nilai test matematika telah diberikan kepada 486 siswa yang terlebih dahulu
masuk perguruan tinggi tertentu. Dari semua siswa tersebut SRS dari n=10 siswa telah
diseleksi dan kemajuan mereka dalam kalkulus diteliti. Hasil akhir nilai kalkulus telah
dilaporkan, seperti telah diberikan pada tabel. Diketahui bahwa
y
=52 untuk 486
siswa yang mengambil test perolehan tsb. Taksir
y
untuk populasi ini, dan
tempatkan taksiran batasan kesalahannya.
Siswa Perolehan nilai test
(x)
Kalkulus akhir
(Y)
1 39 65
2 43 78
3 21 52
4 64 82
5 57 92
6 47 89
7 28 73
8 75 98
9 34 56
10 52 75
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 1S9
Penyelesaian
Hasil penghitungan
76 = y 46 = x
766 . 0
) 46 ( 10 634 , 23
) 76 )( 46 ( 10 854 , 36
2
1
2 2
1
=

=
=
n
i
i
n
i
i i
x n x
y x n x y
b
2056 ) (
1 1
2 2 2

= =
= =
n
i
n
i
i i
y n y y y

2474 ) (
1 1
2 2 2

= =
= =
n
i
n
i
i i
x n x x x
nilai observasi dari
yL
:
80 ) 46 52 )( 766 , 0 ( 76 ) ( = + = + x b y
x

juga
(
(

\
|

\
|
=

= =
n
i
n
i
i i yL
x x b y y
n Nn
n N
V
1 1
2 2 2
) ( ) (
2
1
) (


[ ] 397 , 7 ) 2474 ( ) 766 , 0 ( 2056
8
1
) 10 ( 486
10 486
2
= |

\
|
|
|

\
|
=
dan penaksir batasan kesalahannya adalah
4 . 5 ) ( 2 =
yL
v
Agar diketahui bahwa penaksir regresi dari
y
penurunan nilai y dari
x menjadi berkurang daripada
y
dan b nya positif.
Perhitungan untuk penaksir regresi dari rata-rata sejajar dengan analisis regresi
klasik dalam kasus populasi yang tak berhingga.dengan model
i i
x y E
1 0
) ( + =
untuk (x
i
,y
i
) data. Lalu penaksir kuadrat terkecil dari
i
adalah b, telah didapat dari
persamaan (7.28). juga hasil dari (7.29) menjadi
MSE
Nn
n N
v
yL
|

\
|
= ) (
dimana MSE adalah kesalahan rata-rata kuadrat yang biasa dari analisis regresi.
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 14u
Untuk ilustrasi, hasil analisis regresi minitab untuk data dalam contoh 7.9
sebagai berikut:
Persamaan regresi
x y 766 . 0 8 . 40 + =
Predictor Coef Stdev t-ratio p
Constant 40.784 8.507 4.79 0.000
X 0.7656 0.1750 4.38 0.002
s=8.704, R-sq=70.5%, R-sq(adj)=66.8%
Analisis varians
Source DF SS MS F p
Regresi 1 1450.0 1450.0 19.14 0.002
Error 8 606.0 75.8
Total 9 2056.0
Perhitungan b diperlihatkan sebagai koefisien dari x dalam persamaan regresi, atau
dalam kolom Coef berlawanan dengan predictor x dalam tabel. MSE dimasukan
dibawah MS berlawanan dengan Error dalam tabel analisis varians. Dengan
demikian,
MSE
Nn
n N
v
yL
|

\
|
= ) (
42 . 7 ) 8 . 75 (
) 10 ( 486
476
= =
dan
45 . 5 ) ( 2 =
yL
v
dimana sangat dekat dengan nilai yang terkandung dalam perhitungan yang lalu.
Pemeriksaaan yang lebih dekat dari data dalam kandungan gula dan berat
jeruk diberikan dalam contoh 7.2 disarankan bahwa penaksir rata-ratanya lebih layak
dari pada penaksir rasio.(Plot ari nilainya akan memperlihatkan bahwa garis regresi
tidak tampak) walau demikian, penaksir regresi dari total adalah bentuk
yL
N ,
khususnya n harus diketahui. Sejak penaksir rasio juga bekerja dengan baik dalam
kasus ini, menetapkan nomor dari jeruk dalam truk tidak akan mendapatkan biaya dan
waktu tambahan. Dalam kasus N yang lain akan diketahui atau mudah ditemukan.
Dengan demikian, kita harus hati-hati dalam memilih antara penaksir rasio dan
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 141
penaksir regresi ketika menaksir rata-rata populasi atau total. Akan dibahas lebih
lanjut dalam bagian 6.8.
VII.6 TAKSIRAN PERBEDAAN

Metode penaksiran perbedaan rata-rata populasi atau total sama dengan
metode regresi yang sesuai dengan nilai y atas dan bawah dengan jumlah yang
tergantung perbedaan ) ( x
x
. Akan tetapi, koefisien regresi b tidak dihitung.
Hasilnya, b dibuat sama.
Metode perbedaan lebih mudah untuk dipakai dibandingkan metode regresi
dan kerap kali bekerja lebih baik. Metode ini biasa digunakan dalam prosedur
pemeriksaan, dan akan kita pertimbangkan beberapa contoh dalam bagian ini.
Rumus dibawah ini bahwa sampling acak sederhana telah digunakan.
Perbedaan penaksir dari populasi
y
:
d x y
x x yD
+ = + = ) ( (7.31)
dimana
x y d =
Penaksir Varians dari
yD
:
1
) (
) (

1
2

\
|
=

=
n
d d
Nn
n N
V
n
i
i
yD
(7.32)
dimana
i i i
x y d =
Penaksir batasan kesalahan:
1
) (
2 ) (

2
1
2

\
|
=

=
n
d d
Nn
n N
V
n
i
i
yD
(7.33)
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 142
Contoh 7.10
Pemeriksa tertarik dalam membandingkan pemeriksaan nilai dari beberapa barang
dengan harga buku. Biasanya, harga buku diketahui untuk setiap barang dalam
populasi, dan pemeriksaan harga diperoleh untuk sebuah sampel dari barang tersebut.
Harga buku dapat digunakan untuk memperoleh taksiran yang baik dari total atau
rata-rata pemeriksaan nilai untuk populasi.
Sebuah populasi berisi 180 daftar barang dengan harga buku $13,320. x
i
adalah harga
buku dan y
i
pemeriksaan harga untuk barang yang ke-i. Sampel acak sederhana dari
n=10 barang diperlihatkan dalam tabel. Plot dari data tersebut, Gambar 6.1,
menunjukkan sepanjang garis lurus. Taksir nilai pemeriksaan rata-rata dari
y
dengan
metode perbedaan dan taksir varians dari
yD
.
Gambar 7.1 Plot y atas x untuk contoh 6.10.
50.00 100.00 150.00 200.00
x
50.00
100.00
150.00
200.00
y

sample nilai audit,y nilai buku,x d


1 9 10 -1
2 14 12 2
3 7 8 -1
4 29 26 3
5 45 47 -2
6 109 112 -3
7 40 36 4
8 238 240 -2
9 60 59 1
10 170 167 3
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 14S
Solusi
Diketahui 1 . 72 = y , 7 . 71 = x , dan 74 =
x

4 . 74 ) 7 . 71 1 . 72 ( 74 = + = + = d
x yD

dan juga,

(

\
|

= |

\
|


= =
n
i
i
n
i
i
d n d
n
d d
n
1
2 2
1
2
1
1
) (
1
1
27 . 6
9
) 4 . 0 ( 10 58
2
=

=
jadi
59 . 0 ) 27 . 6 (
10 ) 180 (
10 180
1
) (
) (

1
2
=
(

\
|
=

=
n
d d
Nn
n N
V
n
i
i
yD

VII.7 EFISIENSI RELATIF DARI PENAKSIR


Kita telah melihat bahwa rata-rata sample, penaksir rasio, penaksir regresi, dan
penaksir selisih semuanya bisa digunakan sebagai penaksir rata-rata populasi
y
.
Bagaimana kita mengetahui penaksir yang mana yang terbaik untuk situasi penarikan
sample tertentu? sebenarnya, kita selalu tidak bisa menjawabnya secara pasti, tetapi
ada beberapa pedoman yang membandingkan sifat-sifat dari penaksir-penaksir
tersebut. Salah satu pedomannya bisa diungkapkan dalam hal efisiensi relatif dari
penaksir.
Andaikan kita mempunyai dua penaksir
1
E dan
2
E untuk rata-rata . Jika
kedua
1
E dan
2
E adalah penaksir takbias, atau hampir takbias, dari , maka secara
umum kita sebaiknya memilih penaksir dengan varians terkecil sebagai penaksir
terbaik. Hal ini menghasilkan taksiran selang kepercayaan terpendek bagi . Varians
biasanya mengecil ketika ukuran sample membesar, jadi kita harus membandingkan
varians
1
E dan
2
E dengan asumsi ukuran sample sama untuk kedua penaksir. Sesuatu
hal yang mudah untuk menjelaskan ukuran relatif dari dua varians dengan melihat
pada rasionya. Rasio ini disebut dengan efisiensi relatif (relative efficiency),
dinotasikan RE, untuk dua penaksir. Kita membentuk rasio efisiensi relatif sehingga
nilainya yang besar mengutungkan bagi penaksir yang disebutkan pertama kali. Jadi,
efisiensi relatif dari
1
E ke
2
E (atau
1
E terhadap
2
E ) diberikan melalui
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 144

) (
) (
1
2
2
1
E V
E V
E
E
RE =
|
|

\
|
Jika ( )
2 1
E E RE besar (lebih besar dari 1), maka ) (
2
E V akan menjadi lebih besar
dari ) (
1
E V yang menguntungkan bagi
1
E sebagai penaksir . Harus diingat bahwa
ukuran sampel untuk
1
E dan
2
E harus sama dalam kalkulasi ini.
Andaikan ( ) 2
2 1
= E E RE . Hal ini menyatakan secara tidak langsung bahwa
) ( 2 ) (
1 2
E V E V = , yang mana merupakan kasus yang menguntungkan bagi
1
E . Cara
yang lain untuk membuat perbandingan ini adalah dengan menetapkan bahwa ukuran
sampel
2
E harus dua kali dari
1
E agar membuat
1
E dan
2
E ekuivalen dalam hal
varians. Jadi, RE bisa digagas dalam hal ekuivalensi ukuran sampel (atau usaha
penarikan sampel atau biaya penarikan sampel). 1 = RE menyatakan secara tidak
langsung bahwa dua penaksir ekuivalen; tidak menjadi masalah penaksir yang mana
yang kita gunakan.
RE biasanya didefinisikan dalam hal varians teoritis (varians populasi). Akan
tetapi, kita telah memberikan banyak varians taksiran dalam teks ini. Jadi, kita akan
melanjutkannya dalam semangat ini dan mendefinisikan

) (

) (

1
2
2
1
E V
E V
E
E
RE =
|
|

\
|

Sekarang kita harus hati-hati dalam menginterpetasi; bahwa ( ) 1


2 1
>

E E RE
tidak cukup mengartikan bahwa ) ( ) (
1 2
E V E V > , karena kita hanya berurusan dengan
penaksir varians, yang akan mengalami perubahan dari sampel ke sampel. Akan
tetapi, jika kita mempunyai sampel besar (dan karenanya menjadi penaksir varians
yang baik), nilai dari ( )
2 1
E E RE

akan sangat lebih besar dari 1 yang tentunya akan


betul-betul menunjukan bahwa
1
E mungkin menjadi penaksir terbaik.
Sekarang kita menghitung taksiran efisiensi relatif untuk pelbagai kombinasi
dari empat penaksir
y
yang telah disebutkan diatas. Pertama, bagaimanapun, kita
harus mempertimbangkan pertanyaan kebiasan, karena tidak tepat untuk
membandingkan varians bagi penaksir-penaksir yang bias. Rata-rata y dari sampel
acak sederhana selalu penaksir takbias dari
y
, jadi tidak ada masalah bias (setidak-
tidaknya secara teoritis) dalam berurusan dengan penaksir ini.
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 14S
Pada sisi lain, penaksir rasio
y
secara umum bias, karena x y r = secara
umum penaksir bias dari
x y
R = . Bias menjadi tidak berarti jika hubungan antara
y dan x jatuh sepanjang garis lurus yang bergerak melalui titik asal. Hampiran untuk
bias relatif dari r diberikan oleh:

|
|

\
|
|

\
|

x
s
y
s
x
s
Nn
n N
R
R r E
x
y
x

) (
2
2
dengan adalah koefisien korelasi sampel antara x dan y.
Mengenai bias dari dua penaksir lainnya, penaksir regresi takbias jika
hubungan antara y dan x (regresi y pada x) jatuh sepanjang garis lurus, tidak perlu
melalui titik asal. Penaksir selisih selalu takbias dalam penarikan sampel acak
sederhana.
Dalam membandingkan penaksir rasio dengan rata-rata sampel per elemen y ,
kita mempunyai

) (

) (

2
1
y
V
y V
E
E
RE

=
|
|

\
|



y x x y
y
s s r s r s
s
2
2 2 2
2
+
=
sekarang, ( ) 1 >

y RE
y
jika

2 2 2 2
2
y y x x y
s s s r s r s < +
atau

y x x
s s r s r 2
2 2
>
atau

y x x
s s rs 2
2
> (dengan asumsi 0 > r )
atau

y s
x s
s
rs
y
x
y
x
2
1
2
1
= >
Besaran x s
x
disebut koefisien variasi. Pada situasi dimana penaksir rasio biasa
digunakan, y adalah nilai yang diperbaharui dari x (pendapatan kuartal pertama dalam
satu tahun dibandingkan dengan pendapatan kuartal pertama tahun sebelumnya, nilai
audit melawan nilai buku, dan lain-lain). Dalam kasus seperti ini, koefisien variasi
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 146
dari y seharusnya sangat dekat dengan koefisien variasi dari x. Jadi, dalam situasi
seperti ini, penaksir rasio lebih efisien daripada rata-rata sampelper elemen penaksir
jika
2
1
> .
Secara keseluruhan, penaksir rasio akan lebih efisien daripada y jika variasi
diantara x relatif lebih kecil terhadap variasi diantara y dan korelasi antara x dan y
bernilai positif yang besar. Jika peneliti mempunyai pilihan seperti bagaimana
memilih nilai-x, ia sebaiknya memilih mereka hampir terus-menerus.
Perbandingan sederhana dari penaksir regresi dengan rata-rata per elemen
y dan penaksir rasio
y
membutuhkan beberapa modifikasi taksiran varians. Ingat
bahwa
) ( x b y
x yL
+ =
dengan b adalah penaksir kemiringan (slope) dari garis regresi. Varians taksiran dari
yL
telah diberikan (lihat persamaan (7.29) yaitu
( ) ( )
(

\
|

\
|
=

= =
n
i
n
i
i i yL
x x b y y
n Nn
n N
V
1 1
2 2
2
2
1
) (


Jika kita membuat sedikit perubahan dengan mengganti (n-2) oleh (n-1) pada
penyebutnya, kita akan mempunyai
[ ]
2 2 2
) (

x y yL
s b s
Nn
n N
V |

\
|

dan, karena

x
y
s
s
b =
) (

yL
V menjadi
( )
2 2
1 ) (

\
|

y yL
s
Nn
n N
V
Hampiran ) (

yL
V ini baik sepanjang n agak besar; (n-2) digunakan pada penyebut
untuk mencegah menaksir varians terlalu rendah (underestimation) yang serius dalam
situasi sampel kecil.
Dengan menggunakan hampiran varinas yang telah disederhanakan diatas,

( )
2 2 2
2
1
1
1

=
|
|

\
|
y
y yL
s
s
y
RE
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 147
yang akan lebih besar dari satu jika tidak samadengan nol. Pada faktanya, RE
besarnya bisa menjadi takhingga ketika mendekati satu. Jadi,
yL
selalu lebih
efisien dari y sebagai penaksir dari
y
. (akan tetapi, ingat bahwa
yL
akan
mempunyai masalah bias yang serius kecuali regresi y pada x benar-benar linear.)
Ketika membandingkan taksiran regresi dengan taksiran rasio,

( )
2 2
2 2 2
1
2

+
=
|
|

\
|
y
y x x y
y
yL
s
s s r s r s
RE
Pada kasus ini.
^
RE>1 akan menunjukan

2 2 2 2
2
y y x x
s s s r s r >
atau
( ) 0
2
>
x y
rs s
karena
x y
bs s = , maka ( ) 0
2
>
x x
rs bs
yang menunjukan
( )
2
r b >0
Jadi, penaksir regresi lebih efisien dari penaksir rasio kecuali b=r, dimana kasus
mereka ekuivalen.Kasus b=r akan terjadi ketika regresi y pada x linear melalui titik
asal dan varians y sebanding dengan x.

GAMBAR 7.2 Plot dari penerimaan kas (y) dengan banyaknya pembeli (x)
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 148
Situasi yang seperti ditunjukan pada gambar 6.2, dengan kasus penerimaan kas
untuk periode penjualan yang telah ditetapkan yang berhubungan dengan banyaknya
pembeli. Catatan bahwa nilai penerimaan melebar ketika x meningkat.
Penaksir selisih
) ( x y
x yD
+ =
selalu penaksir takbias dari pada penarikan sample acak sederhana, dan varians
taksirannya adalah

( )
1
) (

1
2

\
|
=

=
n
d d
Nn
n N
V
n
i
i
yD

bisa ditulis
( ) ( ) [ ]

=
|

\
|

\
|
=
n
i
i i yD
x x y y
n Nn
n N
V
1
2
1
1
) (


[ ]
y x x y
s s s s
Nn
n N
2
2 2
+ |

\
|
=
Dalam membandingkan penaksir selisih dengan rata-rata sample per elemen,
kita mempunyai


y x x y
y
y
yD
s s s s
s
RE

^
2 2
2
+
=
|
|

\
|
yang lebih besar dari satu ketika

2
2
x y x
s s s >
atau
s 2
y
s
x
> >> >
^

Jika variasi dalam xs dan ys sama, Penaksir difference akan menjadi lebih efisien
dibanding y ketika korelasi antara x dan y lebih besar dari
2
1
.
Ketika membandingkan penaksir regresi dengan penaksir difference kita
punya model
| || |

| || |

\ \\ \
| || |
+ ++ +
= == =
| || |
| || |

| || |


\ \\ \
| || |


2
2
y
y x
2
x
2
y
yD
yL
1
s
s s
2
s s
RE
^
^
^
^
^

Bahan Ajar Sampling - Yudhie Andriyana


Jurusan Statistika, FMIPA Universitas Padjadjaran 149
yang lebih baik lagi jika diuraikan
s s s
2
s
2
y
2
y x
2
x
^ ^
> >> >
atau
0
s s
2
y x
> >> > | || |

| || |

\ \\ \
| || |

^

Sejak x bs =
sy
^
penaksir regresi akan menjadi sama dengan penaksir difference bila
b=1. Di lain pihak, penaksir regresi akan menjadi lebih efisien daripada penaksir
difference.
Sekarng kita akan melihat beberapa nilai numeric dari efisiensi relative untuk
data yang telah kita analisis terlebih dahulu pada bab ini. Data dari table 7.1 dalam
real estate valuation diplotkan dalam gambar 7.3. Melihat point data tersebut yang
jatuh sepanjang garis lurus dengan kemiringan dekat dengan persamaan (dalam
kenyataan, b=0.977 untuk penaksir regresi) dan y mendekati 0. Untuk kasus ini
( (( ( ) )) )
0053 0
R
R
E r
.

Jadi nilai relative bias untuk penaksir ratio tidak terlalu berpengaruh.
Untuk data ini,
13 1
RE
y
yL
.
^
^
^
= == =
| || |
| || |

| || |


\ \\ \
| || |

dan
01 1
RE
y
yD
.
^
^
^
= == =
| || |
| || |

| || |


\ \\ \
| || |

jadi ketiga penaksir, regresi, ratio, dan difference adalah tentang persamaan yang ada
dalam penaksir varians. Salah satu dari ketiga penaksir tersebut bekerja dengan baik
untuk masalah menaksir

y
atau
y
dengan data tersebut. Tapi
96 14
y
RE
yL
.
^
^
= == =
| || |
| || |

| || |


\ \\ \
| || |

Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 1Su
jadi y bias menjadi penaksir yang buruk dari

y
, sebagai perbandingan salah satu
dari 3 penaksir membuat taksiran dari xs. Di lain pihak, itu membuat 15 kali atau
lebih pengamatan untuk mencapai sukses dalam varians yang sama dengan y adalah
yang terbagus dengan
yL
^
.
Data dari table 7.2 tentang kadar gula dengan berat jeruk, hal 159, yang telah
diplot dalam table 7.4. Disini, point data terdapat sepanjang garis lurus tapi
kemiringannya tidak cukup dekat dengan komunitas (kenyataannya, b=0.123) y
intercept signifikan berbeda dari 0. Nilai relative bias dari r = -0.00077 tidak terlalu
berpengaruh, tapi
79 16 RE
y
yL
.
^
^
^
= == =
| || |
| || |

| || |


\ \\ \
| || |


Hal ini mengimplikasikan akurasi yang lebih baik dalam mencapai sukses dalam
penaksiran

y
atau
y
yang dikerjakan oleh penaksir regresi lebih baik dari penaksir
ratio. Penaksir difference tidak dapat digunakan dalam masalah ini.
Dari contoh 7.9, kita mempunyai data nilai akhir kalkulus dengan nilai tes psikotes.
Kemiringan dalam garis ini tidak cukup dekat dengan komunitas (b=0.766) dan y
intercept jauh dari 0. Perhitungannya ditunjukan
84 4 RE
y
yL
.
^
^
^
= == =
| || |
| || |

| || |


\ \\ \
| || |


dan
22 1 RE
yD
yL
.
^
^
^
= == =
| || |
| || |

| || |


\ \\ \
| || |

Disini penaksir regresi biasanya lebih baik dari penaksir ratio, tapi penaksir difference
bias dipakai tetapi kurang efisien.
Untuk data dalam contoh 7.10, ketiga metode, ratio, regresi dan difference
sebenarnya sama; penaksir difference adalah yang paling mudah dihitung jadi itu
adalah pilihan yang masuk akal.
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 1S1
Dalam kesimpulan, analisis dari data bivariate harus selalu dimulai dengan
memplot titiknya. Jika titiknya jatuh sepanjang garis lurus permulaannya maka tepat
sekali mengambil penaksir difference, ketiga metode yang melibatkan xs dan ys
adalah mungkin. Agar penaksir difference bekerja dengan baik, kemiringan dari garis
harus cukup dekat dengan salah satu titiknya. Jika titiknya jatuh sepanjang garis lurus
tidak melalui garis normal, maka penaksir regresi adalah yang terbaik, dalam
hubungan dengan varians. Jika titiknya tidak jatuh sepanjang garis lurus, mungkin y
sebaiknya digunakan (atau untuk penanganan analisis regresi lebih detail).
VII.8 KESIMPULAN
Dengan mengukur variable Y dan variable tambahan X pada masing2 elemen
dalam sample, kita dapatkan informasi tambahan untuk menaksir parameter populasi
yang bersangkutan. Ketika korelasi positif yang kuat ada antara variable X dan Y ,
prosedur penaksiran ratio biasanya menyediakan taksiran yang lebih tepat dari

y
dan
y
daripada melakukan prosedur normal yang dihadirkan dalam bab sebelumnya.
Ukuran sample yang dibutuhkan dihadirkan untuk menaksir

y
,
y
dan R
dengan bound of error yang sama dengan B. pada masing masing kasus seseorang
harus mendapatkan penaksirdari
2
dari informasi sebelumnya atau study persiapan
untuk memperkirakan ukuran sample yang dibutuhkan.
Penaksiran regresi adalah salah satu teknik untuk menggabungkan informasi
pada variable tambahan. Metode ini biasanya lebih baik daripada metode penaksiran
ratio jika hubungan antara Y dan X adalah berupa garis lurus yang tidak melalui asal.
Walaupun metode ini bisa diterapkan dengan desain sampling apapun, kita
menitikberatkan pada sampling acak sederhana., ketika menyebutkan stratified
random sampling untuk kasus ratio.
Metode penaksiran pembeda dalam prinsipnya sama dengan dengan
penaksiran regresi .ini bekerja dengan baik ketika plot Y dengan X menampakkan
titik yang uniform pada garis lurus dengan slope unit.
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran 1S4
TINJAUAN MATA KULIAH
VIII. 2 Sampling Peluang
Sebuah proses sampling disebut sebagai sampling nonpeluang bila tidak
semua unit mempunyai peluang untuk terpilih atau dalam proses memilih satuan-
satuan sampling tidak dilibatkan peluangnya. Proses pemilihan tanpa melibatkan
peluang merupakan proses yang sederhana tetapi mempunyai kerugian yang sangat
besar, yaitu dalam analisis datanya tidak boleh digunakan test of significance, artinya
analsis inferensial secara statistis tidak diperkenankan (tidak valid).
Ke dalam sampling nonpeluang termasuk diantaranya adalah
a. Sampling Seadanya (Haphazard/Accidental Sampling)
Yaitu proses pengambilan sampel sedemikian sehingga unit sampling
diperoleh seadanya. Jadi siapa atau apa saja yang secara kebetulan ada bila
dipandang cocok sebagai sumber data, maka dapat digunakan sebagai sampel.
Contohnya, proses penelitian suatu fosil
b. Sampling Sukarela (Voluntary Sampling)
Yaitu sampling dimana unit sampling adalah mereka yang mau secara sukaela
menjadi anggota sampel. Jenis sampling ini banyak digunakan dalam
penelitian medis. Orang sebagai unit observasi diminta secara sukarela untuk
menjadi objek percobaan.
c. Purposive Sampling (Judgement Sampling)
Yaitu proses pengambilan sampling dipilih atas dasar pertimbangan seseorang.
Penelitian tentang pendapat masyarakat akan suatu kebijakan yang dillakukan
terhadap tokoh-tokoh mayarakat yang ditunjuk merupakan penelitian dengan
menggunakan purposive sampling.
d. Snowball Sampling
Dalam jenis sampling ini, unit sampling secara berangkai atas informasi yang
diberikan oleh unit sampling yang terpilih sebelumnya.
Contohnya seorang Dokter yang akan melakukan penelitian mengenai pasien
yang
Bahan Ajar Sampling - Yudhie Andriyana
Jurusan Statistika, FMIPA Universitas Padjadjaran
e. Quota Sampling
Merupakan suatu tipe sampling dengan menggunakan beberapa kuota sampai
pada kuota yang diinginkan. Tipe sampling ini sangat banyak digunakan
dalam penelitian pemasaran dan dalam penelitian pengumpulan pendapat
(opinion poll)
Contoh : Dalam suatu penelitian mengenai tingkat kepuasan konsumen
terhadap suatu produk rokok akan diambil sampel dengna beberapa ketentuan
berikut :
- Quota 1 : Akan diteliti sebanyak 300 konsumen yang telah menggunakan
produk tersebut (angka 300 merupakan hasil pertimbangan sebagai akibat dari
keterbatasan dana, tenaga, dan waktu)
- Quota 2 : Konsumen yang diambil adalah pria yang berusia 25 - 35 tahun
- Quota 3 : Tingkat pendidikan dari konsumen sekurang-kurangnya SMU.
f. Sampling Jenuh
Apabila sutau populasi memiliki anggota yang sedikit (dalam hal ini kurang
dari 30), maka semua elemennya bisa digunakan sebagai sampel. Proses
penarikan sampel seperti ini dinamakan Sampling Jenuh. Jadi dengan kata lain
bahwa sampling jenuh merupakan sensus.
Keuntungan sampling non pleuang adalah dari aspek kemudahan memperoleh unit
sampling. Namun, data yang dikumpulkan berdasarkan sampling jenis ini tidak dapat
digeneralisir atau tidak dapat dianalisis lebih jauh melalui alat analisis statistika.

Anda mungkin juga menyukai