Basis Data Vol 3 No 1 2008 List3

Jurnal Basis Data, ICT Research Center UNAS
Vol.3 No.1 Mei 2008 ISSN 1978-9483
STUDI PERBANDINGAN METODE SAMPLING ANTARA

SIMPLE RANDOM DENGAN STRATIFIED RANDOM
Nurhayati
Jurusan Sistem Informasi, Fakultas Teknologi Komunikasi dan Informatika, Universitas Nasional Jurusan
Manajemen Informatika, Fakultas Teknologi Komunikasi dan Informatika,
Universitas Nasional
Jl. Sawo Manila, Pejaten Pasar Minggu No.61, Jakarta 12520
Abstract
On this paper being exposed the detail of the simple and stratified random method that are
commonly in statistic. The slighty different be twen those method also being described. Hence
this lead to the implementation techniue.
Keywords: simple and stratified random method, statistic, data.
Abstrak
Aplikasi ilmu statistika banyak diterapkan dalam kehidupan ini. Salah satunya adalah
tentang metode penarikan sampel. Sebelum melakukan penarikan sampel, terlebih dahulu
dilakukan pengumpulan data. Menurut Webster’s New World Dictionary : data = thing
known or assumed, data berarti sesuatu yang diketahui atau dianggap. Diketahui berarti
sesuatu yang sudah terjadi, misalnya produksi beras tahun tertentu 30 juta ton, hasil
penjualan perusahaan “X” pada tahun 1993 mencapai 100 juta, sedangkan dianggap
merupakan sesuatu pendapat, hipotesis yang mungkin belum terjadi atau mungkin tidak
benar.
Kata kunci: Metode Simple Random Sampling, Stratified.
PENDAHULUAN
Dalam pengambilan suatu data terdapat dua metode pengumpulan data yaitu : sensus dan
sampling. Sensus dilakukan jika seluruh elemen / anggota diobservasi dan hasilnya merupakan
data sebenarnya (parameter) sedangkan sampling dilakukan jika sebagian saja anggota populasi
yang menjadi sampel diobservasi dan hasilnya merupakan data perkiraan (estimate). Peneliti
biasanya menggunakan pengumpulan data dengan menggunakan metode sampling, karena dengan
sampling kita dapat mengambil kesimpulan tentang keadaan populasi dengan hanya menarik
sebagian sampel untuk diobservasi tanpa mengobservasi populasi secara keseluruhan. Teknik
penarikan sampel terbagi menjadi dua yaitu :
a. Penarikan sampel secara acak / random (Probability Sampling )
Ciri-ciri dari probability sampling ini adalah setiap anggota populasi mempunyai kesempatan
yang sama untuk terpilih sebagai sampel, pemilihan sampel bersifat objektif, estimasi parameter
dapat dilakukan, bias dapat diperkirakan. Beberapa teknik penarikan sampel dengan probability
sampling adalah serbagai berikut :
Sampling acak sederhana (Simple Random Sampling )
Sampling acak sistematis (Systematic Random Sampling)
Sampling acak berlapis (Stratified Random Sampling)
18
Vol.3 No.1 Mei 2008 ISSN 1978-9483
Sampling acak kelompok (Clustered Random Sampling). b. Penarikan sampel tidak secara acak (Non
Probability Sampling)
Ciri-ciri dari non probability sampling ini adalah setiap anggota populasi tidak mempunyai
peluang yang sama untuk terpilih sebagai sampel, sifatnya subyektif, bias tidak dapat diperkirakan
besarnya, tidak dapat digunakan untuk estimasi parameter. Beberapa teknik penarikan sampel
dengan non probability sampling adalah sebagai berikut :
Sampling kemudahan (Convinience Sampling)
Sampling pertimbangan (Judgement Sampling) c. Quota Sampling
Snowball Sampling
Dalam probability sampling kerangka sampel mutlak diperlukan, kerangka sampel adalah suatu
daftar yang memuat semua anggota / elemen dari populasi yang akan dijadikan dasar bagi
pemilihan sampel.
Teknik penarikan sampel dengan SRS dilakukan jika suatu sampel dengan n elemen dipilih dari
suatu populasi dengan N elemen sedemikian rupa sehingga setiap kemungkinan sampel dengan n
elemen mempunyai kesempatan yang sama untuk terpilih. Cara pengambilan sampel sebanyak n
elemen dari suatu populasi dengan N elemen antara lain menggunakan :
Undian
Tabel acak, merupakan suatu daftar yang memuat angka -angka 0-9 yang frekuensi kemunculan
masing-masing angka sama
Data acak dari Simulasi Monte Carlo.
Dalam sampling acak be rlapis (Stratified Random Sampling ), metode penarikan sampel
dilakukan dengan cara membagi populasi menjadi populasi yang lebih kecil (stratum),
pembentukan stratum harus sedemikian rupa sehingga setiap sratum homogen berdasarkan suatu
atau beberapa kriter ia tertentu, kemudian dari setiap stratum diambil sampel secara acak.
Dalam suatu survei, biasanya teknik yang digunakan dievaluasi dengan melihat nilai standard
error (kesalahan baku). Suatu teknik yang memiliki nilai standard error yang lebih kecil dika
takan lebih efisien dibandingkan dengan teknik yang lain.
Dalam jurnal ini, saya mencoba membandingkan nilai standard error dari sampel yang dipilih
dengan teknik Simple Random Sampling (SRS) & Stratified Random Sampling dengan
menggunakan data bangkitan kemudian akan dievaluasi teknik mana yang lebih efisien.
Jurnal ini bertujuan untuk membandingkan efiensi kedua teknik penarikan sampel secara acak / random
(Probability Sampling), kedua desain sampel tersebut yaitu Simple Random Sampling
(SRS ) & Stratified Random Sampling .
Dalam jurnal ini saya hanya akan membahas tentang teknik penarikan sampel secara acak / random yang
hanya dibatasi pada Simple Random Sampling (SRS ) & Stratified Random Sampling dan perbandingan
efisiensi kedua teknik penarikan sampel tersebut. Data-data yang diobservasi merupakan data acak dari
simulasi Monte Carlo pada program Microsoft Quick Basic.
II. LANDASAN TEORI
Pengertian Tentang Sampel
Metode pengumpulan data dapat dilakukan melalui dua cara yaitu : sensus dan survei.
Sensus dilakukan apabila semua anggota populasi diobservasi atau diteliti, populasi memiliki arti
bahwa keseluruhan anggota atau elemen yang diobservasi dalam ruang lingkup penelitian. Dalam
sensus akan diperoleh gambaran yang sebenarnya dari keadaan populasi, sehingga parameter
yaitu suatu nilai yang dapat menggambarkan ciri / karakteristik populasi tersebut dapat diperoleh.
19
Vol.3 No.1 Mei 2008 ISSN 1978-9483
Penelitian melalui sensus kurang efisien karena memerlukan biaya, waktu, dan tenaga yang besar,
sebagai alternatifnya dilakukan metode pengumpulan data melalui survei yaitu jika sebagian saja
anggota populasi yang menjadi sampel diobservasi. Sampel adalah sebagian anggota dari populasi
yang dipilih sehingga diharapkan dapat mewakili populasinya. Dalam survei hasil yang diperoleh
merupakan data perkiraan (estimate) dan suatu nilai yang dapat menggambarkan ciri sampel
disebut dengan statistik .
Sampel digunakan dalam suatu penelitian yang didasarkan pada berbagai pertimbangan antara
lain sebagai berikut :
Seringkali tidak mungkin mengamati seluruh anggota populasi
Pengamatan terhadap seluruh anggota populasi dapat bersifat merusak

Menghemat waktu, biaya, dan tenaga
Mampu memberikan informasi yang lebih menyeluruh dan mendalam (komperhensif).
Tujuan dari dilakukannya penarikan sampel adalah untuk memperoleh data yang representatif
dalam kaitannya dengan populasi yang menjadi sasaran penelitian. Agar data yang diambil
berguna maka data tersebut haruslah objektif (sesuai dengan kenyataan yang sebenarnya),
representatif (mewakili keadaan yang sebenarnya), variansnya kecil, tepat waktu dan relevan
untuk menjawab persoalan yang sedang menjadi pokok bahasan.
Dalam mencapai tujuan tersebut, diperlukan penggunaan metode penarikan sampel yang
tepat agar dari sampel yang diambil dapat diperoleh sta tistik yang dapat
digunakan
sebagai penduga (estimator) bagi parameter populasi. Jika
adalah
suatu statistik yang akan
digunakan untuk mengestimasi nilai parameter ? maka perlu diperiksa apakah statistik tersebut
memenuhi sifat-sifat sebagai penduga yang baik. Beberapa sifat penduga adalah sebagai berikut :
Tidak bias (unbiased)
Suatu penduga dikatakan tidak bias apabila nilai yang diharapkan (expected value) dari statistik
adalah sama dengan nilai parameternya, atau dapat dituliskan :
(q ˆ ) = q
Efisien
Jika terdapat dua penduga yang tidak bias bagi parameter ?, yaitu
ˆ
q
ˆ
q
ˆ
q
ˆ
q
dan
1
maka
2
apabila :
lebih efisien dari
(qˆ )< V (qˆ ).

1 2
Konsisten
Suatu penduga dikatakan konsisten apabila varians penduga akan makin kecil jika sampelnya
diperbesar atau dapat dituliskan :
lim V (q ˆ )= 0
n®¥
Untuk mempermudah penarikan sampel biasanya dibuat kerangka sampel terlebih dahulu.
Kerangka sampel (sampling frame) merupakan suatu daftar yang memuat keseluruhan anggota
dari populasi sebagai dasar penarikan sampel.
Ukuran Sampel dan Kesalahan Baku / Standard Error (s.e)
Penetapan besarnya ukuran sampel dapat dilakukan apabila diketahui batas atas kesalahan
pendugaan dan atas dasar informasi keragaman dari anggota penyusun populasi dan tingkat
ketelitian yang diinginkan. Semakin besar keragaman dari anggota populasi maka semakin besar
ukuran sampel yang diperlukan, agar semakin banyak informasi yang dapat terambil.
20
Vol.3 No.1 Mei 2008

ISSN 1978-9483
Penarikan sampel yang berulang-ulang biasanya menghasilkan besaran suatu karakteristik

populasi yang berbeda -beda antar satu sampel ke sampel
lainnya. Dalam hal
ini standard error yang mencerminkan keheterogenan atau peluang munculnya perbedaan dari satu sampel
dengan sampel yang lain karena perbedaan anggota yang terpilih dari berbagai sampel
tersebut. Jika
suatu statistik yang digunakan untuk mengestimasi atau menduga
, maka suatu
ukuran yang akan menggambarkan keheterogenan sampel adalah :
V (q ˆ )=
2
(2.1)
[ˆ
E q -q ]
ˆ
Jika q
merupakan penduga tak bias bagi q
maka
E (q ˆ )= q
, sehingga :V (qˆ )= E [qˆ -

E (qˆ ) ] 2
(2.2)
( ˆ)
V q
Standard error adalah akar dari

atau dapat dituliskan :
s.e q ( ˆ )=
ˆ
( )
V q
(2.3)
Standard error merupakan ukuran tingkat ketelitian suatu penduga. Makin kecil standard error maka makin
teliti suatu penduga atau makin dekat dengan nilai parameter yang diperkirakan.
Contoh : jika
adalah statistik yang akan digunakan untuk mengestimasi
maka :
(2.4)
Di mana :
(N ® ¥).
s
2
= Var ( X i
)
m
Dari
contoh
s
2
nilai standard
error berbanding terbalik
dengan
dapat
disimpulkan bahwa
V (X
)=
jumlah sampel. Nilai standard error dapat diperkecil dengan cara memperbesar ukuran sampel,
tetapi upaya ini mengakibatkan peningkatan waktu, tenaga dan biaya survei. Sebagai alternatifnya
diplih suatu metode penarikan sampel yang akan menghasilkan standard error yang lebih kecil
untuk jumlah sampel yang sama.
Teknik Simple Random Sampling (SRS)
Metode SRS adalah metode yang digunakan untuk memilih sampel dari populasi dengan
cara sedemikian rupa sehingga setiap anggota populasi mempunyai peluang yang sama besar
untuk diambil sebagai sampel. Seluruh anggota populasi menjadi anggota dari kerangka sampel.
SRS biasa digunakan jika populasi bersifat homogen. Cara pengambilan sampel bisa dilakukan
dengan pengembalian atau tanpa pengembalian.
Populasi dalam Random Sampling dapat dibedakan menjadi dua kategori, yaitu :
Populasi Terbatas (Finite Population)
Suatu populasi dikatakan sebagai populasi terbatas jika jumlah anggota populasi
(N) dapat ditentukan.

SRS untuk populasi terbatas berukuran N adalah sampel yang dipilih sedemikian sehingga
masing-masing kemungkinan sampel berukuran n memiliki peluang yang sama untuk terpilih.
Populasi Tidak Terbatas (Infinite Population)
21
Vol.3 No.1 Mei 2008

ISSN 1978-9483
a.
Suatu populasi dikatakan sebagai populasi tidak
terbatas jika jumlah anggota
populasi tidak ditentukan atau dapat ditentukan tetapi sangat besar

SRS dari populasi tidak terbatas merupakan sampel yang dipilih sedemikian sehingga kondisi
berikut terpenuhi:
Masing-masing anggota dipilih dari populasi yang sama
Setiap anggota dipilih secara bebas (independent).
Metode pengambilan sampel dalam SRS
Dalam teknik penarikan sampel dengan SRS terdapat tiga metode yang dapat digunakan untuk
memilih elemen anggota sampel. Ketiga metode tersebut yaitu :
Undian (lotere),
Cara lotere dilakukan jika elemen populasinya sedikit (=100).
Tabel acak
Tabel acak merupakan tabel yang memuat bilangan atau angka -angka sedemikian rupa sehingga
dapat dipergunakan untuk memilih sampel secara acak, tabel acak dibuat sedemikian rupa
sehingga angka 0 hingga 9 yang frekuensi kemunculan masing-masing angka sama. Setiap baris
dan kolom dalam blok terdapat satu angka. Langkah-langkah penarikan sampel yang dapat
ditempuh adalah sebagai berikut :
Mendefinisikan populasi yang akan diteliti, kemudian tentukan individu-individu yang termasuk
anggota populasi tersebut serta karakteristik populasi yang akan diobservasi
Menentukan jumlah anggota populasi yang akan dipilih sebagai sampel

Memberikan nomor urut pada semua satuan sampel
Mengguna kan tabel acak untuk memilih individu sampel yang akan digunakan untuk mewakili
populasinya.
Prosedur penggunaan tabel acak adalah sebagi berikut :

Menentukan titik awal dan angka terpilih pada tabel angka random
Penentuan titik awal dilakukan dengan cara menjatuhkan pensil yang runcing dengan mata
tertutup (blind stab) atau menusuk dengan mata tertutup. Ujung pensil akan menunjuk suatu titik
awal pada tabel acak. Untuk melengkapi angkanya dapat ditambah beberapa angka di sebelah kiri
atau kanannya sesuai dengan digit yang ditentukan, hingga terpilih angka acak sebanyak yang
dibutuhkan.
Salin angka-angka yang terambil dari tabel acak
Untuk N = 10, salin satu digit

Untuk N = 100, salin dua digit
Untuk N = 1000, tiga digit
Untuk N = 10000, empat digit.
Tentukan kelipatan maksimal dari jumlah anggota populasi
Tujuan dari penentuan kelipatan maksimal yaitu agar diperoleh peluang yang sama bagi semua
individu anggota populasi.
Tentukan anggota populasi yang terambil sebagai sampel berdasarkan dari tabel acak. Jika
terdapat anggota populasi yang terambil dua kali, maka yang terakhir dibuang dan diganti
dengan angka yang berikutnya dari tabel acak.
Contoh : Dengan menggunakan tabel acak akan diambil 5 individu sampel dari populasi yang terdiri dari
22 orang. Langkah-langkah yang dapat ditempuh adalah sebagai berikut :
Jumlah N=22 dan n=5, angka kelipatan maksimal dari 22 yang berada di bawah 100 adalah 88,
berarti angka di atas 88 tidak dipakai
Apabila titik awal ditentukan dari tabel acak dan yang terpilih adalah baris ke-1 kolom-3, maka dapat
dicatat dua digit terakhir turun ke bawah sebagai
22
Vol.3 No.1 Mei 2008 ISSN 1978-9483
berikut : 36, 95, 27, 43, 37, 08, 20, 63 (mengambilnya dilebihkan dari kebutuhan untuk berjaga-
jaga bila ada angka terpilih yang sama).
3. Maka anggota populasi ya ng terpilih sebagai sampel adalah : a) Nomor (36-22) = anggota
populasi nomor 14
b) Nomor 95, tidak digunakan karena di atas 88 c) Nomor (27-22) = nomor 5

d) Nomor (43-22) = nomor 21 e) Nomor (37-22) = nomor 15 f) Nomor 8
Individu yang terpilih secara acak adalah anggota populasi nomor 14, 5, 21, 15 dan 8.
Simulasi Monte Carlo
Data lengkap acak dengan cara membangkitkan data dari simulasi Monte Carlo dengan program
Microsoft Quick Basic.
II.3.2 Estimasi dan ukuran sampel untuk data yang berasal dari sebaran normal
Tipe pendugaan mengenai populasi terbagi menjadi dua, yaitu pendugaan titik (point estimation) dan
pendugaan selang (interval estimation). Penduga titik adalah sebuah nilai tunggal yang digunakan untuk
menduga sebuah parameter populasi. Pendugaan interval tertentu dilakukan dengan membuat batas-batas
yang disebut dengan batas bawah dan batas atas dari selang pendugaan. Dalam selang pendugaan terdapat
tingkat kepercayaan dan selang kepercayaan. Tingkat kepercayaan adalah presentase dugaan selang
memenuhi parameter yang diduga apabila dilakukan pengambilan sampel berulang. Selang kepercayaan
adalah batas-batas nilai yang memenuhi pendugaan sesuai dengan tingkat kepercayaan yang dibuat. Tingkat
kepercayaan biasanya tidak diketahui, tetapi diganti dengan suatu nilai yang disimbolkan dengan “a” yaitu
peluang dugaan parameter tidak memenuhi selang. Sehingga a = 1 – (tingkat kepercayaan).
Peubah acak berdimensi (X1, X2, …, Xn ) merupakan n sampel dari suatu populasi berdistribusi
normal dengan rata-rata (µ ) dan varians (s²).
Estimasi titik dan estimasi selang untuk populasi terbatas
Penduga (estimator) dari rata-rata populasi µ untuk SRS pada populasi terbatas adalah sebagai
berikut :
Xi
(2.5)
mˆ =
=å
n
i=1
s2
ö
æN
-n
ö
V (X )= s
=
ç
÷
ç
÷
(2.6)
n
÷
N
ø
è
s2
æ
N -nö
(2.7)
s .e (X ) =
N
è
Jika s 2 tidak diketahui maka digunakan sˆ 2 = S 2 .

Sebagai penduga bagi varians
untuk SRS pada populasi terbatas adalah sebagai berikut :
æ
S
2
ö
æN
-n
ö
(2.8)
ˆ
2
ç
s
=
X
ç
n
÷
ç
N
÷
ø
è
ø
(2.9)
sˆ.e (
)= sˆ X
=
sˆ
2
X
n
2
S2 =å
(X i -X)
23
n-1
i=1

Vol.3 No.1 Mei 2008
ISSN 1978-9483
Di mana :
(2.10)
dengan S 2 adalah varians sampel

Penduga selang bagi µ jika standard deviasi populasi ( s) diketahui adalah sebagai berikut :
atau :
(2.11)
X - Za s
£ m £ X + Za s
X ± Za s
X
X
Keterangan
:
= rata-rata sampel
X
a
= 1 – (tingkat kepercayaan)
Za
= nilai Z (dari tabel Z)
= standard deviasi populasi

s2
n
= banyaknya anggota sampel
Jika
standard devia si
populasi
(s) tidak diketahui maka penduga selang untuk µ adalah
sebagai berikut :
atau :
(2.12)
X
- ta 2;Vsˆ
£m£
X
+ ta 2;V sˆ
X
± ta 2;V sˆ
Keterangan
:
= rata-rata sampel
X
= 1 – (tingkat kepercayaan)
ta
2;V
= nilai t (dari table t-student) dengan derajat bebas V = n-1
S
= standard deviasi sampel
n
Penentuan besarnya sampel (n) guna memperkirakan parameter (µ ) dengan margin error /
batas kesalahan maksimum yang dapat ditolerir sebesar

d, maka dapat ditentukan ukuran sampel
dengan perumusan sebagai berikut :
(2.13)
2
NZ
s2
n =
a
2
Z2 s2
+ Nd 2
a
(2.14)
d =Za
.s . e ( X )
2
Keterangan
:
N
= jumlah anggota populasi
s²
= varians populasi
(1-a)
= tingkat kepercayaan yang diinginkan
d
= Margin error
Besarnya
sampel (n)
biasanya
tidak diketahui
karena tergantung pada nilai varian dari
populasi (s²). Dalam mengatasi permasalahan tersebut nilai s² harus diperkirakan, misalkan
berdasarkan penelitian terdahulu, dilakukan penelitian pendahuluan, atau berdasarkan rumus
tertentu sebagai suatu pendekatan. Pendekatan rumus di mana selisih nilai pengamatan terbesar dan
s
»
terkecil (range) nilai observasi sekitar 4 simpangan baku (4s), dengan demikian rumus s menjadi :
2.
4
Estimasi titik dan estimasi selang untuk populasi tak terbatas
Penduga (estimator) dari mean populasi

µ untuk SRS pada populasi tak terbatas adalah
sebagai berikut :
æ
s
2
ö
V (X )=
(2.15)
sX
=
ç
n
÷
Xi
(2.16)
mˆ =
=å
i= 1
s2
s . e (X ) =
24
n
Vol.3 No.1 Mei 2008
ISSN 1978-9483
(2.17)
Penduga bagi varians
untuk SRS pada populasi tak terbatas adalah sebagai berikut :
æ
S
2
ö
(2.18)
sˆ
=
ç
n
÷
è
Penduga selang bagi µ jika standard deviasi populasi ( s) diketahui adalah sebagai berikut :
-Z
£m£
+Z
atau :
±Z
(2.19)
X
a
X
a
X
a
X
2
Jika standard deviasi populasi (s) tidak diketahui maka penduga selang untuk µ adalah sebagai
berikut :
-t
sˆ
£m£
+t
sˆ
atau :
±t
sˆ
(2.20)
a 2;V
a 2;V
a 2;V
Dalam penentuan besarnya sampel (n) pada populasi tak terbatas guna memperkirakan parameter
(µ ) dengan margin error / batas kesalahan maksimum yang dapat ditolerir sebesar d, dengan
menentukan margin error yang dapat ditolerir sebesar d maka dapat ditentukan ukuran sampel
dengan perumusan sebagai berikut :
Z
2
s2
(2.21)
n
=
a
d
2
Keterangan :
N
s²
= varians populasi
(1-a) = tingkat kepercayaan yang diinginkan
d
= Margin error
Estimasi dan ukuran sampel untuk data proporsi
Jika X1, X2, …, Xn merupakan peubah acak yang saling bebas yang berasal dari sebaran Bernoulli
(P), sehingga :
V (X i )=
PQ
E (X
i
)= P
(2.22)
Di mana :
Q
=1-P
Penduga dari proporsi P untuk SRS pada å

Estimasi titik dan estimasi selang untuk populasi populasi terbatas adalah sebagai berikut :
terbatas X
n
i
X
=p = P
2
i=1
è
æ PQ n
öæ ø
è
n
V (X )= s ø
n
ˆ
=ç
N -nö
÷ç
(2
.2
3)
(2
.2
4)
n
Penduga bagi varians ö
ˆ proporsi p untuk SRS pada
populasi terbatas adalah s
=p ˆ
n
sebagai berikut :
ˆ
=P
æ ç
è
pq
P
øè
öæ N - n ÷
ç
. (2.25) ø
2
÷
Jika P tidak diketahui maka
digunakan
25
Vol.3 No.1 Mei 2008
ISSN 1978-9483
sˆ . e (p ) = sˆ p
=
(2.26)
sˆ p 2
Di mana
: q =1-
p
X =
banyaknya anggota sampel yang masuk dalam kategori yang diteliti.
Selang kepercayaan untuk parameter P jika p adalah proporsi sukses dalam suatu peubah acak
berukuran n dan adalah sebagai berikut :
: n =
banyaknya
p-Za anggota
sampel
sˆ ˆ < P < p + Za
2
sˆ ˆ P
atau = proporsi
sukses
p ± Za
populasi
2
P sˆ ˆ
2
P (2.27)
= proporsi
sukses sampel 2
P
=1-p
a=1–
(tingkat
kepercayaan)
= nilai Z (dari
table Z)
Keterangan
Z
= varians populasi
Varians dala m proporsi untuk

variabel X dengan nilai 0 atau 1
sebesar PQ, maka untuk
menentukan n dalam menduga 2 (1-a) = tingkat kepercayaan
P varians (s²) diganti dengan yang diinginkan
PQ, sehingga rumus untuk = Margin error
menentukan ukuran sampel Ke
dalam proporsi untuk populasi ter Estimasi titik dan estimasi
tak terbatas adalah sebagai Z 2 an selang untuk populasi tak
berikut : PQ ga terbatas
(2.28) + Nd
2 n Penduga dari proporsi P untuk
: SRS pada populasi tak ter batas
N adalah sebagai berikut :
=
ju
NZ ml
2
PQ ah
an
gg
ota
po
n =
pul n
asi
a
a 2
P
Q
alah sebagai
berikut :
= p =
åX i
(2.29)
pq
(2.31)
2
æ
PQ
ö
i=1
V (X ) sˆ 2ˆ
=s =
(2.
ˆ 30)
ç
Pe
nd
ug
n
÷ a
ba
gi
var
ian
s
pro
n por
n si
p
unt P
uk
SR
S
pa
P
da
po
è pul
asi
tak
ø ter
bat
as
ad
sˆ
atau
p± 2
P
Za 2
sˆ
P
(2.32 2
P
Selang kepercayaan untuk )

parameter P jika p adalah
proporsi sukses dalam suatu
peubah acak berukuran n adalah
sebagai berikut :
p-Za
ˆ
sˆ ˆ
< P < p + Za ˆ
26
Vol.3 No.1 Mei 2008 ISSN 1978-9483
Keterangan :
P
= proporsi sukses populasi
p
= proporsi sukses sampel
q
=1
-p
a
=1
– (tingkat kepercayaan)
Za
= nilai Z (dari table Z)
n
Varians dalam proporsi untuk variabel X dengan nilai 0 atau 1 sebesar PQ, maka untuk
menentukan n dalam menduga P varians (s²) diganti dengan PQ, sehingga rumus untuk
menentukan ukuran sampel dalam proporsi untuk populasi tak terbatas adalah sebagai berikut :
n =
Z a2 PQ
(2.33)
2
2
d
Keterangan :
N
PQ
= varians populasi
(1-a)
= tingkat kepercayaan yang diinginkan
= Margin error
STRATIFIED RANDOM SAMPLING (SAMPEL ACAK TERSTRATIFIKASI)
Metode pengambilan sampel acak terstratifikasi adalah metode pemilihan sampel dengan cara
membagi populasi ke dalam kelompok-kelompok yang homogen yang disebut strata kemudian
sampel diambil secara acak dari tiap strata tersebut dan dibuat perkiraan untuk mewakili strata
yang bersangkutan. Perkiraan secara menyeluruh (over all estimation) diperoleh secara gabungan.
Apabila anggota-anggota populasi tidak bersifat homogen tetapi bisa dikelompokkan dalam
kelompok-kelompok yang relatif homogen, maka proses pengambilan sampelnya akan
menimbulkan bias karena keheterogenan yang terdapat dalam anggota populasi sehingga
berpengaruh terhadap informasi yang diperoleh dari variabel yang diteliti.
Stratified random sampling dapat dibedakan menjadi dua bagian, yaitu :
Sampel Terstratifikasi Proporsional (Proportionate Stratified Sampling )
Merupakan sampel terstratifikasi dengan populasi dibagi atas kelompok-kelompok yang homogen
(Strata). Dari masing-masing kelompok diambil sampel secara proporsional.
Ciri dari kelompok sampel : homogen pada satu kelompok, namun sangat berbeda antar kelompok
(varian besar).
Contoh : Seorang peneliti ingin mengetahui rata -rata pengeluaran per bulan karyawan suatu
perusahaan. Untuk mengetahui hal ini, para karyawan dibagi atas
latar belakang pendidikan sebagai berikut:

Latar Pendidikan
Jumlah Karyawan (Orang)
SD – SMP
100
SMA/ SMK
200
D3/ Akademi/ Politeknik
300
Perguruan Tinggi
100
2) Sampel Terstratifikasi Tidak Proporsional (Disproportionate Stratified Sampling )
27
Vol.3 No.1 Mei 2008 ISSN 1978-9483
Merupakan sampel terstratifikasi dengan populasi dibagi atas kelompok-kelompok yang homogen
(Strata). Dari masing-masing kelompok diambil sampel namun tidak proporsional.
Contoh : Seorang peneliti ingin mengetahui rata -rata pengeluaran per bulan karyawan suatu
perusahaan.Untuk mengetahui hal ini, para karyawan dibagi atas
latar belakang pendidikan sebagai berikut:
Latar Pendidikan
Jumlah Karyawan (Orang)
SD – SMP
10
SMA/ SMK
200
D3/ Akademi/ Politeknik
300
Perguruan Tinggi
50
Pengambilan sampel dengan stratified random sampling
Langkah-langkah penarikan sampel dalam metode Stratified Random Sampling adalah sebagai
berikut :
Tentukan dasar strarifikasi (strata)
Tempatkan setiap anggota dalam populasi pada strata yang sesuai
Tentukan ukuran sampel (n)
Tentukan jumlah sampel yang harus diambil dari setiap strata
Lakukan pengambilan sampel dari setiap strata dengan metode Simple Random Sampling.
Estimasi untuk data yang berasal dari sebaran normal
Peubah acak berdimensi (X1, X2, …, Xn ) merupakan n sampel dari suatu populasi berdistribusi
normal dengan rata-rata (µ ) dan varians (s²).
Estimasi titik dan estimasi selang untuk populasi terbatas
Pendugaan untuk rata-rata (µ) dengan L merupakan jumlah strata adalah sebagai berikut:
L
æ
(2.34)
Di mana :
=å
X
st
÷Xh
h =1
è
(2.35)
n
å h
X
hj
h
=
j =1
X
nh
Rata -rata sampel pada strata ke-h.
untuk
stratified random sampling pada populasi terbatas:
ù ú
V (X st )= sˆ
Di mana : X
st
=
2
N
2
å
1 Nh
nh
L
S h2 ê
2
Nh
éNh -nh
(2.36) ë
û
h=1
pada strata ke-h.

nh adalah sebagai berikut :
X -1
å (X nh
hj
h
(2.37)
S h2
=
j =1
Penduga selang bagi µ dengan tingkat

keyakinan (1-a)100%
-
) Penentuan besarnya sampel

h
ditentukan oleh tiga hal, yaitu :
deng Jumlah unit pengamatan tiap
an strata
adalah varians sampel
S 2
28
Vol.3 No.1 Mei 2008
ISSN 1978-9483
-Z
st a
s
2
£m£
+Z
st a
s
2
(2.38)
st
2
st
Tingkat variasi atau heterogenitas populasi dari setiap strata
Apabila nilai varians populasi tidak diketahui maka ada beberapa pendekatan yang bisa
dilakukan, antara lain sebagai berikut :
Berdasarkan penelitian terdahulu
Dilakukan penelitian pendahuluan

Menggunakan pendekatan rumus :
R
s »
4
Biaya pengambilan sampel per anggota setiap strata.
Jika besarnya sampel acak yaitu nilai n sudah ditentukan maka selanjutnya adalah
mengalokasikan n kesetiap strata. Alokasi sampel ke dalam setiap strata dipengaruhi oleh tiga
faktor, yaitu :
Banyaknya anggota dalam setiap strata
Tingkat heterogenitas atau variasi dari setiap strata
Biaya untuk memperoleh satu observasi dalam setiap strata.
Pengalokasian sampel kesetiap strata untuk stratified random sampling pada populasi terbatas
terbagi menjadi tiga metode, yaitu :
Alokasi Optimum
Metode alokasi optimum dapat digunakan jika bia ya penarikan sampel dan nilai variansnya
dianggap berbeda. Rumus untuk alokasi optimum adalah sebagai berikut :
S
h h
ö
2
N
ç
è
ø
2
÷
Z a 2 (å N
S
h h
N
C
h )ç å
2 d
2 2
+ Z a
é
N
å
S
÷ h N
2
h
h
S
C h
=
ê
C h
N
S
h
ê
=
ú
ún
å
ë
ê
h
û
nh
= ukura n tiap strata sampel

Sh
Di mana :
n
= ukuran (total) sampel
d
2
= kesalahan yang bisa ditolerir

=
b
i
a
y
a
N s
e
= ukuran (total) populasi t
i
Za a
p
= nilai distribusi normal baku (tabel-
Z) pada a tertentu u
n
i
t
s
a
m
p
Nh l
= standard deviasi strata i
= ukuran tiap strata populasi n
g
p
e
r
strata. Ch
(
2
.
4
0
)
(2.39)
29
Alokasi Neyman
Metode alokasi neyman dapat n =

digunakan jika biaya penarikan unit
sampel tiap strata dianggap sama
tetapi nilai variansnya berbeda.
Rumus untuk alokasi neyman
adalah sebagai berikut
:
a 2
2
Z a
h
( N S
2 å h
h )2
Vol.3 No.1 Mei 2008
ISSN 1978-9483
(2.41)
é
N h
Sh
ù
(2.42)
nh
= ê
ún
å
N
S
h h
Alokasi Proporsional
Metode alokasi proporsional dapat digunakan jika biaya penarikan sampel dan nilai
variansnya dianggap sama. Rumus untuk alokasi
proporsional adalah sebagai berikut :
NZ
å
N h
S h
2
2
n
n
= =
N
h
ù
a2 n
Z a
N
S
ê
h h
2
2
+
2
å
ú
N
2
st

N
2
untuk stratified random sampling pada

populasi terbatas
n
h
N
X
st
2
h
=1
sˆ
2
=
(2
.4
å N h2 3)
Sh
(2
2.
.4
Estimasi titik dan estimasi selang untuk populasi 4)
tak terbatas
X
(2.45)
L merupakan jumlah strata
Estimasi untuk data proporsi adalah sebagai berikut:
h
÷
(2.46) Ph = 1
Jika X1, X2, …, Xn merupakan L è
peubah acak yang saling bebas æ h
yang berasal dari sebaran N ø

Bernoulli (P). ö
Estimasi titik dan estimasi
P =
selang untuk populasi terbatas st å N
ç
Penduga dari proporsi P dengan
Ph =roporsi sukses pada sampel Juml pada strata
strata ke -h ah ke-h Jumlah
Ph suks sampel pada
Di mana : P es strata ke-h
sˆ 2 sˆ
Sebagai penduga Nh P
÷
bagi varians Pst

£
untuk stratified P
2
random sampling
pada populasi å £
terbatas adalah N2 Pst
sebagai berikut : +
h Z
a
h =1
sˆ
h P
2
1 st
Pengalokasian
è
sampel dalam
L
(2. proporsi pada
48 populasi terbatas
P ø
= ) kesetiap strata
terbagi menjadi tiga
Q metode, yaitu :
æ Penduga selang untuk
N P dengan tingkat
Alokasi Optimum
keyakinan (1-a ) st
-n adalah sebagai
Rumus untuk alokasi
ö berikut :
optimum pada data
(2.47) h
proporsi adalah
ç P sebagai berikut :
st
-Za 30
Vol.3 No.1 Mei 2008 ISSN 1978-9483
ø
ç
æ N
÷
2
d
2
N h +
Za (å N Ph Q C
PhQ h
2 h h
Z
h )ç
ö å a
2
å
N
÷ P
Q
h
C h
n =
2
é
N
C
å
ù
nh
=
ê
h
h
ú
Ph Q h n
ê
N h
D
Ph Q h i
m
a
ú n
a
:
n
=
u
k
u
r
a
n
(t
o
t
C h a
l)
s
a
m
p
e
l
N
=
u
k
ë u
r
a
n
(t
o
ê t
a
l)
p
o
p
û u
l
a
s
i
ú N
h
= ukuran tiap strata populasi = Proporsi populasi tiap strata
nh Qh
= ukuran tiap strata sampel = 1 - Ph
d Ch
= kesalahan yang bisa ditolerir = biaya setiap unit sampling per (
strata. 2
Za .
= nilai distribusi normal baku (tabel-Z) pada a 5
tertentu 0
)
Ph2 (2.49)
Alokasi Neyman
Rumus untuk alokasi optimum N h Ph Q h
pada data proporsi adalah sebagai
berikut :
ê
2
Z a
2 (å N h h
h
ú
) 2
n
= é ë
N
Ph Q h
û
ù
N
2 d
(2.51)
2 +
2
Z a
2
h
(2.52)
å
PhQ
h
=
Alokasi Proporsional é
N h
Rumus untuk alokasi ù
proporsional pada data
n
proporsi adalah sebagai
berikut :
n
=
(2.54)
NZ
ê
2
a
2 å ú
N h Ph Q h
(2.53)
N
2 d
2 2
+ Z a
N
å
P Q N
h h
h
2.
nh
Vol.3 No.1 Mei 2008

ISSN 1978-9483
Relatif efisien antara dua metode dapat ditunjukkan dengan r.e = Var(A) / Var(B),
jika
r.e>1 maka metode B dikatakan lebih efisien sebesar r.e kali dibandingkan dengan metode A.
IV. KESIMPULAN
Banyaknya anggota dalam setiap strata mempengaruhi tingkat ketelitian informasi yang diperoleh dari
sampel. Suatu sampel sebanyak 20 anggota dari populasi dengan 200 anggota akan menghasilkan
informasi dengan tingkat ketelitian yang lebih tinggi apabila dibandingkan dengan sampel sebanyak 20
anggota dari populasi sejumlah 20000 anggota. Strata dengan banyak anggota lebih baik diambil sampel
yang lebih besar daripada strata dengan elemen yang lebih sedikit.
Tingkat variasi atau heterogenitas dari setiap strata perlu diperhatikan. Strata yang sangat
heterogen harus diambil sampel yang lebih besar daripada strata yang relatif homogen.
Apabila biaya per anggota atau per observasi berbeda -beda dari strata ke strata maka strata
dengan biaya yang tinggi harus diambil sampel yang lebih kecil, dengan demikian akan
diperoleh biaya yang minimum.
DAFTAR PUSTAKA
Supranto J, M.A., Teknik Sampling Untuk Survei & Ekperimen, terbitan ketiga, penerbit PT
Rineka Cipta, 2000.
Walpole , R.E., Pengantar Statistika, edisi ketiga, penerbit PT Gramedia Pustaka Utama, Jakarta,
1995.
Sugiarto, Siagian, D, Sunaryanto, L.T, Oetomo, D.S, Teknik Sampling , penerbit PT Gramedia
Pustaka Utama, Jakarta, 2003.
Cochran, W.G, Sampling Techniques, 3d ed, John Wiley & Sons, New York, 1977.
Situs www.random sampling.com.
32

Basis Data Vol 3 No 1 2008 List3

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Basis Data Vol 3 No 1 2008 List3

Diunggah oleh

Hak Cipta:

Format Tersedia

Jurnal Basis Data, ICT Research Center UNAS

Vol.3 No.1 Mei 2008 ISSN 1978-9483

STUDI PERBANDINGAN METODE SAMPLING ANTARA

Jl. Sawo Manila, Pejaten Pasar Minggu No.61, Jakarta 12520

Keywords: simple and stratified random method, statistic, data.

Kata kunci: Metode Simple Random Sampling, Stratified.

Sampling acak berlapis (Stratified Random Sampling)

II. LANDASAN TEORI

Pengertian Tentang Sampel

Seringkali tidak mungkin mengamati seluruh anggota populasi

Pengamatan terhadap seluruh anggota populasi dapat bersifat merusak

Mampu memberikan informasi yang lebih menyeluruh dan mendalam (komperhensif).

Tidak bias (unbiased)

lebih efisien dari

(qˆ )< V (qˆ ).

Ukuran Sampel dan Kesalahan Baku / Standard Error (s.e)

Vol.3 No.1 Mei 2008

Penarikan sampel yang berulang-ulang biasanya menghasilkan besaran suatu karakteristik

ukuran yang akan menggambarkan keheterogenan sampel adalah :

, sehingga :V (qˆ )= E [qˆ -

Standard error adalah akar dari

Teknik Simple Random Sampling (SRS)

(N) dapat ditentukan.

Populasi Tidak Terbatas (Infinite Population)

Vol.3 No.1 Mei 2008

populasi tidak ditentukan atau dapat ditentukan tetapi sangat besar

Metode pengambilan sampel dalam SRS

Cara lotere dilakukan jika elemen populasinya sedikit (=100).

Menentukan jumlah anggota populasi yang akan dipilih sebagai sampel

Prosedur penggunaan tabel acak adalah sebagi berikut :

Untuk N = 10, salin satu digit

dengan angka yang berikutnya dari tabel acak.

b) Nomor 95, tidak digunakan karena di atas 88 c) Nomor (27-22) = nomor 5

Simulasi Monte Carlo

Jika s 2 tidak diketahui maka digunakan sˆ 2 = S 2 .

untuk SRS pada populasi terbatas adalah sebagai berikut :

Jurnal Basis Data, ICT Research Center UNAS

dengan S 2 adalah varians sampel

= standard deviasi populasi

= nilai t (dari table t-student) dengan derajat bebas V = n-1

batas kesalahan maksimum yang dapat ditolerir sebesar

dengan perumusan sebagai berikut :

Estimasi titik dan estimasi selang untuk populasi tak terbatas

Penduga (estimator) dari mean populasi

Vol.3 No.1 Mei 2008

Penduga bagi varians

untuk SRS pada populasi tak terbatas adalah sebagai berikut :

(1-a) = tingkat kepercayaan yang diinginkan

Estimasi dan ukuran sampel untuk data proporsi

Penduga dari proporsi P untuk SRS pada å

Jurnal Basis Data, ICT Research Center UNAS

Vol.3 No.1 Mei 2008

Varians dala m proporsi untuk

Selang kepercayaan untuk )

STRATIFIED RANDOM SAMPLING (SAMPEL ACAK TERSTRATIFIKASI)

latar belakang pendidikan sebagai berikut:

Pengambilan sampel dengan stratified random sampling

Estimasi untuk data yang berasal dari sebaran normal

Rata -rata sampel pada strata ke-h.

Penduga bagi varians

pada strata ke-h.

Penduga selang bagi µ dengan tingkat

) Penentuan besarnya sampel

Vol.3 No.1 Mei 2008