Anda di halaman 1dari 30

TUGAS KELOMPOK

TEKNIK SAMPLING

Disusun Oleh Kelompok 1:

Nama : 1. Selfinia (1301402)


2. Shella Permatasari (1301412)
3. Bonita Nurul Afifah (1301415)
4. Welgi Okta Irawan (1301416)
5. Al Raqna Sari (1301425)
Prodi : Matematika
Dosen : Yenni Kurniawati, S.si M.Si

Fakultas Matematika dan Ilmu Pengetahuan Alam


Universitas Negeri Padang
2016
Sampel Acak Sistematik
Pengertian Sampel Acak sistematik : adalah salah satu metode penarikan sampel dengan
menggunakan interval sampel dalam melakukan pemilihan sampel
Sampling sistematik muncul dikarenakan beberapa hal:
1. Sistematik random sampling lebih mudah dipakai di lapangan
2. Karakteristik sampel diharapkan bersifat representatif atau mewakili karakteristik
populasi, sehingga diharapkan sampel terpilih bersifat proporsional. Dengan sampling
acak hal ini sulit dijamin tercapai, karena bisa jadi sampel sudah mewakili karakteristik
populasi tetapi belum proporsional. Proporsional artinya jumlah sampel pada
karakteristik tertentu sudah sebanding dengan jumlah populasinya.
Karena alasan diatas maka diterapkan penarikan sampel secara sistematik, dengan hanya
mengambil satu angka random saja dan lainnya akan mengikuti dengan menghitung
intervalnya. Sistematik disini adalah sistematik linier.
Salah satu yang sederhana adalah penggunaan sistematik linear dengan cara sebagai
berikut:
N
n
a. Hitung interval, yaitu
b. Tentukan satu angka random yang lebih kecil atau sama dengan intervalnya. Angka
random ini selanjutnya disebut angka random pertama R1.
Angka random selanjutnya
R2 = R1 + I
R3 = R2 + I = R1 + 2I
.
.
Rn = Rn-1 + I = R1 + (n-1)I
Rn digunakan sebagai kontrol apakah penarikan sampel sudah benar.
Misal banyaknya unit dalam populasi N = 30 dan banyaknya unit dalam sampel n = 5,
maka I = 6 sehingga R1 < 6 katakan 2, maka yang harus dipilih adalah nomor 2, 8, 14,
20, dan 26 yang harus dicek dengan Rn = R1 + (n-1)I = 2 + 4(6) = 26.
Systematic Random Sampling Untuk Populasi Terbatas
Pada umumnya pengambilan sampel dengan metode acak sistematis bagi populasi yang
jumlah anggotanya terbatas dilakukan melalui tahapan berikut:
Menentukan ukuran sampel (n) yang akan diambil dari keseluruhan anggota populasi
(N).
Membagi anggota populasi menjadi k kelompok dengan ketentuan k harus lebih kecil
atau sama dengan N/n. Nilai k yang lebih besar dari N/n akan menyebabkan ukuran
sampel yang diinginkan tidak dapat diperoleh (kurang dari n). Bila ternyata besarnya
populasi (N) tidak diketahui, k tidak dapat ditentukan secara akurat, dengan demikian
harus dilakukan pendugaan nilai k yang dibutuhkan untuk menentukan ukuran sampel
sabesar n.
Menentukan secara acak satu unit sampel pertama dari kelompok pertama yang
terbentuk. Unit sampel kedua, ketiga dan selanjutnya kemudian diambil secara
sistematis dari kelompok kedua, ketiga dan selanjutnya.

Contoh:
Dari 100 orang kayawan ingin diambil secara acak sistematis 10 orang karyawan sebagai
sampel. Penyelesaiannya dapat dilakukan sebagai berikut:
1. Menentukan banyaknya kelompok :
k = 100/10 =10, berarti ada 10 kelompok (tidak boleh lebih dari 10 kelompok).
2. Memberikan nomor urut secara acak pada 100 orang karyawan tersebut dari 1, 2, 3,
sampai 100

3. Selanjutnya membagi keseluruhan anggota populasi menjadi 10 kelompok. Maka


akan diperoleh kelompok pertama (kelompok A) berisi karyawan dengan nomor urut 1
hingga 10, kelompok kedua ( kelompok B) dengan nomor urut 11 hingga 20 dan seterusnya
sampai kelompok J.
4 . Mengambil satu unit sampel secara acak pada kelompok A ( pertama ), misalnya
terambil karyawan nomor 3. setelah itu dilakukan pengambilan sampel pada kelompok yang
berikutnya untuk satuan sampel yang berada segaris (memiliki jarak yang sama ) dengan
sampel nomor 3 tersebut. Anggota populasi yang menjadi sampel dalam penelitian ini adalah
anngota populasi yang memiliki nomor sebagai berikut:
Kelompok : A B C D E F G H I J
No terpilih : 3 13 23 33 43 53 63 73 83 93
Systematic Random Sampling Untuk Populasi Tak Terbatas
Sama halnya dengan pengambilan sampel pada populasi yang terbatas, yang perlu
mendapat perhatian adalah penentuan nomor sampel terambil pada interval pertama, karena
nomor yang terpilih tersebut akan menjadi acuan bagi pengambilan sampel pada interval-
interval berikutnya.
Contoh :
Misalkan sebuah perusahaan konveksi, yang mempekerjakan karyawan dengan
system bergiliran ( shift) setiap 2 jam, akan meneliti apakah kesalahan produksi yang terjadi
diakibatkan oleh mesin (misalnya akibat keausan) atau oleh manusianya ( misalnya akibat
kejenuhan, kelelahan, dsb). Untuk mengetahui hal tersebut, maka diambil sampel dengan
menggunakan metode systematic random sampling. Hasil yang diperoleh adalah sebagai
berikut:

Kasus I
Pada shift pertama (Jam 08.00 10.00) diketahui 2,5% produk yang dihasilkan rusak
pada 30 menit pertama, 2,0% rusak pada 30 menit kedua, 2,3 % rusak pada menit ketiga dan
2,5 % rusak pada 30 menit keempat. Dapat diperhatikan bahwa untuk kasus seperti ini
seorang manajer pengendali mutu harus segera menghentikan produksi tanpa harus
menunggu shift kedua untuk mengurangi biaya yang diakibatkan oleh kegagalan produksi.
Dalam hal ini kemungkinan penyebab utama terjadinya kegagalan produksi adalah mesin dan
bukan manusianya. Kesimpulan ini diambil atas pertimbangan bila faktor manusia maka
kaitannya adalah faktor kelelahan/kejenuhan dengan berjalannya waktu. Dengan demikian
semakin lama pekerja bekerja, yang bersangkutan akan semakin lelah hingga akan lebih
banyak membuat kesalahan seiring dengan lamanya waktu bekerja. Dalam kasus ini
kecendrungan tersebut tidak tampak karena besarnya prosentase cacat ternyata tidak ada
kecendrungan untuk meningkat dengan berjalannya waktu sehingga dapat disimpulkan
bahwa penyebab cacat dalah mesin.

Kasus II
Misalnya hasil yang diperoleh adalah sebagai berikut: Pada shift pertama ternyata
dijumpai 0,9% produk yang cacat pada 30 menit pertama, 1% produk yang cacat pada 30
menit kedua, 1% produk cacat pada 30 menit ketiga dan 1,6% produk cacat pada 30 menit
keempat. Pada shift yang kedua dijumpai 0,7% produk yang cacat dalam 30 menit pertama,
0,9% produk cacat dalam 30 menit kedua, 1% produk yang cacat dalam 30 menit ketiga dan
1,5% produk yang cacat dalam 30 menit keempat. Dari pengambilan sampel terlihat bahwa
tingkat kerusakan semakin membesar pada 30 menit terakhir pada setiap shift. Atas dasar
hasil yang diperoleh dapat diambil dugaan sementara bahwa banyaknya produk cacat lebih
disebabkan karena kejenuhan pekerja setelah mereka bekerja selama 1,5 jam terus menerus.
Dengan demikian bilamana pengambilan sampel diteruskan, maka diperkirakan akan
diperoleh hasil yang menunjukkan faktor pekerja sebagai penyebab kerusakan.

7.3 Estimasi dari Sebuah Total dan Rataan Populasi


Tujuan dari kebanyakan survey sampel adalah untuk menduga satu atau lebih

parameter dari populasi. Kita akan menduga rataan populasi dari sebuah sampel

sistematic dengan menggunakan rataan sampel y . Hasil ini ditunjukkan didalam

persamaan (7.1).

Estimator untuk rataan populasi :


n

yi
^= y sy = i=1 (7.1)
n
Dimana sy menunjukkan sistematik sampling.

y st
Variansi Estimasi :
y sy
Kamu akan mengenal variansi estimasi untuk didalam persamaan 7.2. Variansi

y sy y
estimasi untuk serta variansi estimasi untuk sama-sama diperoleh dengan

menggunakan sampel acak sederhana. Variansi untuk y diberikan

2
Nn
V ( y )= ( ) (7.3)
n N 1
y st
Variansi untuk diberikan
2

V ( y st ) = [1+ ( n1 ) ] (7.4)
n

Dimana adalah sebuah ukuran untuk hubungan sepasang elemen didalam sampel

sistematik yang sama (selengkapnya dibahas didalam 7.7). Jika adalah mendekati 1,

maka element didalam sampel memiliki karakteristik ukuran yang sama, dan sistematik
sampel akan memberi hasil variansi lebih tinggi untuk rataan sampel dari pada sampel acak
sederhana.

Jika negatif, maka sampel sistematik mungkin lebih tepat dari pada sampel acak

sederhana. Hubungan bisa negatif jika elemen didalam sampel sistematik cenderung memiliki

perbedaan yang besar. Untuk yang mendakati 0 dan N berukuran sedang, sampel

sistematik ekuivalent dengan sampel acak sederhana.


V ( y sy )
Sebuah estimasi tak bias dari tidak dihasilkan dengan menggunakan data

hanya dengan satu sampel sistematik. Ketika sampel sistematik hampir ekuivalent dengan

V ( y sy )
sampel acak sederhana, kita akan menduga dengan variansi estimasi dari sampel

acak sederhana. Dalam situasi lain, rumus variansi sampel acak sederhana akan memberikan
sebuah batasan hasil yang tinggi atau rendah untuk variansi yang benar dari sampel
sistematik.

Definisi 7.2
Sebuah populasi adalah acak jika element dari populasi memiliki urutan yang acak.
Sebuah populasi berurutan jika element dari populasi memiliki nilai yang cenderung
meningkat atau menurun ketika kita mendaftarkannya.
Sebuah populasi berkala jika element dari sebuah populasi mempunyai nilai yang cenderung
berbentuk lingkaran keatas dan kebawah dan susunannya teratur ketika didaftarkan.
Grafik 7.1 hingga 7.3 menunjukkan contoh dari tipe populasi.
Populasi acak bisa terjadi ketika mendaftarkan berdasarkan alfabet dari tingkatan
murid pada saat ujian, karena disana secara umum tidak adal alasan kenapa murid-murid
yang alfabetnya di awal mendapatkan tingkatan yang lebih tinggi dari pada murid yang
alfabatnya di akhir.

Contoh 7.1
Pemerintahan pusat mencari berbagai indikator atas pencapaian industri didalam negeri
dengan mengumpulkan data tahunan, variabelnya seperti banyaknya karyawan dan daftar
gaji. Standar Klasifikasi Industri (SIC) membagi industri pabrik kedalam 140 kelompok.
Tabel 7.1 menunjukkan data jumlah karyawan untuk tahun 2000 dan 2001 dan rata-rata gaji
per tahun (dalam ribuan dolar) selama 2001 untuk suatu sampel 20 kelompok industri.
Sampel sistematik telah terpilih dari daftar 140 kelompok yang muncul didalam Statistik
abstrak untuk Amerika Serikat.
a. Dugalah jumlah rataan karyawan per pabrik di dalam SIC group dan tentukan batas
kesalahan estimasi.
b. Dugalah rata-rata hilangnya karyawan antara 2000 dan 2001 per Pabrik di dalam SIC
group dan tentukan batas kesalahan dari estimasi.

Penyelesaian :
Karena semua analisis statistik dimulai dengan sebuah plot data, pertama lihat urutan
karyawan dengan jumlah sampel (kurva 7.4) dan jumlah karyawan yang hilang (kurva 7.5).
disana daftar SIC memiliki elektronik yang lebih menguntungkan, transportasi, dan pabrik
industri peralatan medis mendekati ujung daftar. Ini adalah keadaan yang baik untuk
sistematik sampling, karena sebuah sampel acak sederhana bisa kehilangan data yang
lengkap. Pola ketika data karyawan hilang nilai sampel menjadi lebih seimbang, dengan
beberapa ukuran yang hilang sehingga mencapai akhir data. Selanjutnya, hal ini dapat
menguntungkan untuk sampel sistematik karena dapat menutupi jangkauan dari kerugian
nilai.

Tabel 7.1
Karyawan dan data gaji untuk sebuah sampel dari pabrik industri
Sampel SIC Description 2000 2001 2001
Karyawan Karyawan Rata-rata
(Ribuan) (Ribuan) gaji
(Ribuan)
1 204 Pabrik Penggilingan 122.4 122.2 34.9
Padi
2 212 Rokok 2.9 3.2 26.9

3 225 Penggilingan Kopi 120.1 98.6 25.0

4 233 Womens, misses, 169.9 137.3 23.0


and juniors
outerwear
5 241 Pembukuan 78.2 73.6 29.8

6 252 Peralatan kantor 80.4 69.2 32.5


7 265 Kontainer 219.4 207.2 32.8
paperboard dan
kotak
8 276 Bisnis pipa bermulut 42.0 36.5 33.5
banyak
9 284 Sabun, detergen, 156.0 149.2 37.8
bahan pembersih :
parfum, kosmetik,
dan perlengkapan
toilet
10 299 Aneka macam 13.2 14.1 41.9
produk minyak
tanah dan batu bara
11 313 Boot dan sepatu dan 1.1 0.8 26.1
pertemuan
12 322 Kaca dan pecah 67.6 60.0 32.9
belah, pemukul atau
penekan
13 329 Alat pengamplas, 74.0 67.1 34.4
asbes, dan aneka
macam
14 339 Bermacam-macam 26.8 25.4 35.7
bahan utama metal
15 347 Mantel, ukiran, dan 149.6 128.5 29.5
jasa
16 355 Perlengkapan 170.9 146.4 42.1
Khusus Industri
17 363 Peralatan rumah 106.3 104.8 30.6
tangga
18 372 Balon udara dan 466.6 450.5 49.5
tempat
19 382 Alat laboratorium 311.4 282.4 46.1
dan analitik, optik,
langkah-langkah,
dan instrumen
pengendalian
20 394 Boneka, mainan, 101.0 90.7 31.2
games, olahraga,
dan atletic
Rata-rata Nilai Tengah Standar
Deviasi
2001 Pekerja 20 113.4 94.6 105.6
2000-2001 Pekerja 20 10.61 7.25 10.29

Dari ringkasan statistik yang diberikan pada tabel 7.1 dan menggunakan rumus standar
sampel acak sederhana,analisis jumlah rata-rata karyawan adalah :
y sy =113.4

^ ( y sy )= 14020 1 ( 105.6 )2
V ( 140 20 )( )
2 V^ ( y sy )=2 ( 14020
140 )( 1
20 )
( 105.6 )=43.72
Dugaan jumlah rata-rata karyawan per industri adalah aproksimasi 113.4 ribu, lebih kurang
44 ribu.
Dengan cara yang sama kalkulasi jumlah karyawan yang hilang dugaan rata-ratanya adalah
10.61 ribu dengan batas kesalahan aproximasi 4.26 ribu.
Ini adalah sebuah ukuran banyaknya karyawan yang hilang dari pabrik dalam 1 tahun, tetapi
batas kesalahannya juga cukup berkaitan dengan sampel ukuran kecil, dan jumlah variabilitas
didalam data karyawan.
Dugaan dari sebuah populasi total membutuhkan pengetahuan total jumlah elemen N didalam
populasi ketika kita menggunakan prosedur di cahpter 4 dan 5. Contoh :
^ =N y

Dimana estimasi dari Sampel acak sederhana. Kita ingin mengetahui N untuk menduga

ketika kita menggunakan sampling sistematik. Ditunjukkan dalam persamaan (7.5 dan

7.6)

Estimator dari populasi total :


^ =N y sy
(7.5)

Variansi Estimasi :
2
V ( )( NNn )
^ ( N y sy ) =N 2 s
n (7.6)

Contoh 7.2
Data sampel sistematik 20 kelompok industri dari 140 populasi, ditunjukkan pada
contoh 7.1, yang menarik, estimasi jumlah populasi total karyawan yang hilang pada industri
U.S antara tahun 2000 dan 2001. Dari data yang disajikan, estimasi total dan tentukan batas
kesalahan estimasi.

Penyelesaian :
Estimasi rata-rata yang telah hilang 10.61 ribu dengan batas kesalahan aproximasi
4.26 ribu. estimasi total dengan mengalikan jumlah N=140. Rata-rata jumlah total karyawan
yang hilang adalah 1485 ribu dengan sebuah batas kesalahan estimasi 596 ribu. Kita mencoba
mengestimasi total data variabel dengan sampel kecil, dalam hal ini ketepatan hasil tidaklah
besar. Untuk mendapatkan ketepatan yang lebih besar, ukuran sampel harus ditingkatkan atau
desain sampling diubah, atau keduanya.

7.4 Estimasi dari Sebuah Proporsi Populasi


Seorang investigator menggunakan data dari sampel sistematik untuk menduga
sebuah proporsi populasi. Contohnya, untuk menentukan proporsi pemberi suara yang
datang, investigator mungkin menggunakan 1-k sampel sistematik dari data pemberi suara.
Estimator dari proposri populasi p yang diperoleh dari sampel sistematik ditunjukkan dengan

^psy . ^psy
Ketika sampel acak sederhana (section 4.5), properti dari paralel dari rataan

y sy
sampel jika

Estimator dari Proporsi populasi p:


n

yi
^psy = y sy = i=1 (7.7)
n

^psy
Variansi Estimasi dari :

^ ( ^p sy )= p^ sy q^ sy
V ( n1 )( NNn ) (7.8)

Contoh 7.3 :
1-dari-6 sampel sistematik diperoleh dari sebuah daftar pemberi suara untuk
mengestimasi proporsi pemberi suara (pemilih). Beberapa titik awal yang berbeda digunakan
untuk memastikan hasil sampel tidak terpengaruh dengan variansi perodik dalam populasi.
Hasil survey dilihat pada tabel berikut. Estimasi p, proporsi dari 5775 pemberi suara
(N=5775). Tentukan batas kesalahan estimasi

Penyelesaian :
Proporsi sampel
962

yi 652
=
^psy = i=1 = 962 0.678
962

Karena N besar dan beberapa titik awal acak telah dipilih dapat digambarkan dalam
sistematik sampling, dengan asumsi bahwa

^ ( ^p sy )= p^ sy q^ sy
V (
n1 )( NNn )
^psy .
Untuk memperoleh estimasi terbaik dari V ( Dengan batas kesalahan estimasi adalah
2 V^ ( ^psy )=2
( ^psy q^ sy
n1 )( Nn
N )

= 2 ( 0.678961x 0.322 )( 5772962


5775 ) = 0.028

Disini kita dapat mengestimasi 0.678 (67.8%) dari pemberi suara yang terdaftar. Kita dapat
mempercayainya dengan batas estimasi kurang dari 0.028 (2.8%)

7.5. Memilih Ukuran Sampel


Sekarang misalkan kita telah melakukan beberapa pengamatan dan penting untuk kita

memperkirakan atau mengestimasi suatu nilai dari rataan ( ) yang nilai nya tidak lebih

dari satuan B , maka mengharuskan kita untuk menentukan ukuran sampel yang pas untuk
menyelesaikan masalah itu , dengan menggunakan sebuah persamaan untuk menentukan nilai
n dibawah ini :
2 V ( y sy )=B (7.9)
2
Solusi dalam persamaan (7.9) , melibatkan nilai antara ( ) dan ( ) , yang

mana nilai keduanya harus diketahui ( setidaknya nilai perkiraan yang mendekati ) untuk
memecahkan permasalaan penentuan nilai n tersebut. walaupun kadang-kadang nilai dari
parameter ini dapat kita peroleh atau perkirakan jika ada data yang tersedia dari penelitian
yang pernah dilakukan sebelumnya.
Kita dapat menggunakan formula n untuk sebuah sampel acak sederhana , dimana
formula ini dapat memberikan sebuah sampel dengan ukuran yang besar untuk populasi yang
diamati , dan ukuran yang kecil untuk populasi berkala (periodic). seperti pertama kali

y sy
dituliskan , variansi dari ( ) dan ( y ) akan bernilai sama jika populasinya adalah

acak.

Ukuran sampel yang dibutuhkan untuk mengestimasi dengan sebuah nilai batas
kesalahan dari estimasi :
2
N
n=
( N 1 ) D+ 2 (7.10)

dimana :
2
B
D=
4
Example 7.4
Manajemen dari sebuah perusahaan pembayaran yang besar , tertarik untuk
menentukan jumlah rata-rata waktu keterlambatan pembayaran yang telah melewati batas
waktu yang ditetapkan . sebuah sampel acak sistematis dipilih untuk menggambarkan
permasalah tersebut , dari daftar nama berurut di ambil sejumlah N= 2500 pelanggan yang
telah melewati batas waktu pembayaran , dalam sebuah penelitian yang sama yang pernah

dilakukan pada tahun sebelumnya , diperolehlah variansi dari sampel yaitu s 2 =100 hari

keterlambatan . tentukanlah ukuran sampel yang dibutuhkan untuk mengestimasi jumlah rata-
rata waktu pembayaran yang telah melewati batas waktu , dengan nilai batas kesalahan
estimasi adalah 2 hari.
Solusi :
Kita dapat mengasumsikan bahwa populasi adalah acak , sehingga kita dapat
menggunakan persamaan (7.10) untuk menentukan nilai perkiraan dari ukuran sampel ,
2 2
dengan mengganti nilai ( ) dengan ( s ) dan mengartur nilai :

B2 4
D= = =1
4 4

kita mempunyai :
N 2 2500(100)
n= 2
= =96,19
( N 1 ) D+ 2499 ( 1 ) +100

Dimana , pada permasalah ini manajemen harus mengambil sampel kira-kira


sebanyak 97 pelanggan untuk mengestimasi jumlah rata-rata waktu keterlambatan
pembayaran yang telah melewati batas waktu pembayaran yang tidak lebih dari 2 hari.

Untuk menentukan ukuran sampel yng dibutuhkan untuk mengestimasi total ( )

dengan nilai batas kesalahan estimasi dengan jarak B , kita menggunakan metode yang
cocokpada section 4.4.
Dan ukuran sampel yang dibutuhkan untuk mengestimasi p yang kurang dari B satuan
, ditentukan dengan menggunakan formula ukuran sampel untuk mengestimasi p dengan
sampel acak sederhana .

Ukuran sampel yang dibutuhkan untuk mengestimasi P dengan nilai batas kesalahan
estimasi B
Npq
n=
( N 1 ) D+ pq (7.11)

dimana
2
Dalam sebuah situasi praktisq= , kita B
p1 tidak dapat
dan D=mengetahui nilai P , kita dapat
4
menentukan sebuah nilai perkiraan ukuran sampel dengan mengganti nilai p dengan sebuah
nilai estimasi. jika tidak ada informasi sebelumnya yang cocok untuk mengestimasi nilai p
,kit dapat menentukan sebuah pilihan ukuran sampel denag mengatur nilai p=0,5.

Exampel 7.5
Sebuah perusahaan periklanan , ingin memulai kampanye promosi untuk sebuah
produk baru , perusahaan ingin mengambil sampel pelanggan yang mampu dalam sebuah
komunitas yang kecil , untuk menentukan berapa banyak pelanggan yang setuju akan produk
tersebut . dengan menyisihkan atau memilih beberapa harga yang telah ada , dengan
melakukan wawancara secara personal atau perseorangan , peneliti telah menetapkan untuk
menjalankan system pengambilan sampel secara sistematik dari N=5000 daftar nama dalam
komunitas yang terdaftar dan dikumpulkan data dengan melakukan wawancara via telfon ,
tentukan ukuran sampel yang dibutuhkan untuk mengestimasi nilai p . proporsi dari orang
yang percaya bahwa produk itu akan diterima dengan nilai batas kesalahan dari estimasi
berjarak B=0,03 ( atau 3%)

Solusi
Ukuran sampel yang dibutuhkan untuk mengestimasi dapat ditentukan dengan
menggunakan persamaan (7.11) . walaupun tidak ada data yang tersedia sebelumnya untuk
product baru tersebut , kita masih dapat menentukan sebuah perkiraan ukuran sampel dengan
mengatur nilai p= 0,5 dalam persamaan (7.11) dan
2
B 2 (0,03)
D= = =0,000225
4 4

maka , ukuran sampel yang dibutuhkan adalah


Npq 5000 ( 0,5 ) (0,5)
n= = =909,240
( N 1 ) D+ pq 4999 ( 0,000225 ) + ( 0,5 )( 0,5)

dimana , perusahaan harus mewawancara sebanyak 910 orang untuk menentukan pelanggan
yang menerima produk bru tersebut dengan batas kesalahn kurang dari 3 %.
7.6. Pengulangan sistematik sampel
Pada bagian dalam section 7.3 diterangkan bahwa kita tidak dapat meng estimasi nilai

y st
variansi dari ( ) dari informasi yang terdapat pada sigle sistematik sampel , kecuali

pada sistematik sampel pembangkit untuk semua tujuan yang dilaksanakan pada sebuah
sampel acak.
ketika hasil ini terjadi , maka kita dapat menggunakan teknik pengambilan sampel secara
acak untuk mengestimasi dengan cara mengguraikan bagian pada 4.3, walaupun pada
kenyataan nya systematic sampel tidak sama atau eqivalen dengan sampel acak sederhana .

y st
sebuah metode alernatif harus kita gunakan untuk mengestimasi V( ) . pengulangan

sistematik sampel adalah suatu metode yang dapat digunakan.


Seperti nama nya ,pengulangan sistematik adalah suatu metode dengan mengharuskan
kita memilih lebih dari satu sitematik sampel . sebagai contoh , sepuluh 1-dari-50 sistematik
sampel , masing-masing berisikan 6 pengukuran , dapat diperoleh sekitar waktu yang sama
salah satu 1-dari-5 sistematik sampel berisikan 60 pengukuran , kedua cara menghasilkan 60
pengukuran untuk mengestimasi rataan populasi () , tetapi dengan cara pengulangan

y st
sistematik sampel mengizinkan kita untuk mengestimasi nilai V( ) dengan

n s=10
menggunakan kuadrat dari deviasi ( ) individu rataan sampel akan memperkiraan

tentang rataan mereka. rata-rata dari sepuluh rataan sampel (


^ ) akan mengestimasi rataan

polulasi ().
ns
Untuk memilih ( ) pengulangan sistematik sampel , kita harus menentukan jarak

dari elemen masing-masing sampel seterusnya secara terpisah , dengan demikian sepuluh 1-
n s=10 k ' =50 ) dari 6 pengukuran masing-masing berisi angka yang
dari-50 sapel ( ,

'
sama dari setiap pengukuran tunggal 1-dari-5 sampel ( k =5 ) , berisikan n=60 pengukuran.

ns
Untuk menentukan titik awal element sampel dari masing-masing ( ) sistematik

sampel , kita harus memilih secara acak suatu nomor pertama dari k elemen , kemudian

untuk elemen selajutnya dari masing-masing sampel kita dapat menambahkan k ' ,2 k ' dan

n
seterusnya dari nomor pertama sampai jumlah masing-masing sampel adalah ns telah

didapatkan.
Sebuah populasi tetap dengan N=960 elemen , yang manakita dapat membentuk suatu
daftar nomor berurutan . akan dipilih sebuah sistematik sampel dengan ukuran n=60 , kita
memilih k=N/n=16 dan sebuah angka acak dipilih antara 1 dan 16 sebagai titil awal. tentukan
cara yang dapat kita lakukan untuk memilih sepuluh pengulangan sistematik sampel dalam
kondisi yang sama dengan satu sistematik sampel ?
'
Pertama , kita memilih k =10k =10(16) =160 , kemudian , kita memilih 10 angka

acak antara 1 dan 160 . terakhir nilai konstan 160 kita tambahkan ke masing-masing titik
awal acak untuk mendapatkan sepuluh angka antara 161 an 320 , proses penambahan dengan
nilai konstan ini berlanjut sampai sepuluh sampel dengan ukuran 6 diperoleh.
Angka acak yang diperoleh dari 10 bilangan bulat antara 1 dan 160 adalah :
73 , 42 , 81 , 145 , 6 , 21 , 86 , 17 , 112 , 102
Angka yang diperoleh dari bilangan bulat sebagai titik awal dari sepuluh sistematik
sampel , ditunjujkan dalam table 7.2 , dan elemen kedua dalam masing-masing sampel
ditentukan dengan menanbahkan 160 pada bilangan pertama , dan elemen ketiga dengan
penjumlahan 160 pada elemen kedua , dan seterusnya.

Table 7.2
Hasil pemilihan dari pengulangan sistematik sampel
Pemilihan Elemen Elemen Elemen ke
titik awal kedua dalam ketiga dalam . enam dalam
secara acak sampel sampel sampel
6 166 326 806
17 177 337 817
21 181 341 821
42 202 362 842
73 233 393 873
81 241 401 881
86 246 406 886
102 262 422 902
112 272 432 912
145 305 462 945

ns
Kita memilih setidaknya 10 untuk memungkinkan kita mendapatkan rataan

y st
sampel yang cukup untuk memperoleh perkiraan yang memuaskan dari V( ), kita

'
memilih ( k ) untuk memberikan jumlah yang sama dari banyaknya pengukuran seperti

yang diperoleh dalam sigle sistematik sampel , yaitu :


k ' =k ns

Estimasi dari rataan populasi , dengan n s , 1-dari- k ' sistematik


sampel :
ns
y i
^=
i =1 ns

y i
dimana , mewakili rataan dari sistematik sampel ke i

Estimasi variansi dari ^ :


2
N n s y
^
V ( ^ )=
N
Kita juga dapat menggunakan pengulangan sistematiknsampel
s
( )
untuk mengestimasi(7.12)

dimana
y
ns

( i ^ )2
i=1
(7.13)
n s1
s 2 y =
total populasi ( ) jika N diketahui .

ns '
Estimasi dari total populasi () menggunakan 1-in- k sistematik sampel :
ns
y i
^ =N ^ =N (7.14)
i=1 ns

Estimasi variansi dari ^ :


2
^ ( ^ )=N 2 Nn s y
^ ( ^ )=N 2 V
V ( N )
ns (7.15)
Example :
Sebuah tempat membayaran izin masuk parkir dengan gerbang masuk per orangan ,
dan kantor parkir ingin mengestimasi rataan dari jumlah orang per mobil yang akan
mengunjungi terutama sekali pada liburan musim panas , dia tahu bahwa pada pengalaman
sebelumnya sekitar 400 mobil masuk ke dalam parkir , kemudian dia ingin mengambil 80
sampel mobil , untuk mendapatkan sebuah estimasi dari variansi , dia menggunakan teknik
pengulangan sistematik sampel dengan sepuluh sampel dari delapan mobil per masing-
masing. Dengan menggunakan data yang diberikan dalam tabel 7.3 , estimasi rata-rata dari
oarang yang datang per mobil dengan nilai batas kesalahan estimasi.

Solusi
Untuk satu sistematik sampel
N 400
k= = =5
n 80

n s=10
Dimana , untuk sampel ,

k ' =10 k =10 ( 5 )=50

10 Nombor acak yang terpilih antara 1 dan 50 adalah :


13 , 35 , 2 , 40 , 26 , 7 , 31 , 45 , 5 , 46
Mobil dengan nomor-nomor ini yang diperoleh dari pemilihan acak titik awal untuk
sistematik sampel.
y 1 y 2
Untuk tabel 7.3 hasil dari adalah rata-rata untuk baris pertama , dan adalah rata-

rata untuk baris kedua , dan seterusnya . dan estimasi dari adalah :
s y =0,675 ^ adalah :
Dengan , nilai batas eror dari

V^ ( ^ )=
( Nn
N Ns )
s y =
40080
400 10
( 0,675 )=0,19

Oleh karena itu , estimasi rataan terbaik dari orang yang datang per mobil adalah 4,16 (tambah atau
kurang 0,38 ).

7.7 Pembahasan lebih lanjut tentang estimator variansi


V ( y sy ) ,
Untuk mempelajari lebih lanjut tentang perilaku kita mungkin
melihat sampel sistematis dari elemen n sebagai sampel cluster yang dipilih dari
kemungkinan sampel cluster k dalam populasi yang diteliti. Menurut bagan,
pemikiran tentang populasi diatur dalam bentuk persegi panjang, seperti terlihat pada
tabel 7.4. di sini, N = nk. Sistematik sampling, seperti yang dibahas sebelumnya,
melibatkan secara acak memilih salah satu cluster k (baris) dan karena salah satu rata-
y sy
rata kemungkinan sampel k. Dengan kata lain, bisa mengambil nilai
y 1 , y 2 , , y k
dengan kemungkinan sama.
Kita tahu dari persamaan (7.4) bahwa
2
V ( y sy )= [ 1+ ( n1 ) ]
n

Dimana tindakan korelasi antara elemen cluster yang sama (korelasi


intracluster) dan terletak antara [1/(n-1)] dan 1.
Jika kita memiliki pengukuran populasi, seperti pada tabel 7.4, kita bisa
membuat analisis perhitungan jenis variansi antara rata-rata cluster kuadrat (MSB),
sampai rata-rata cluster kuadrat (MSW), dan total jumlah kuadrat (SST). Seperti
definisi ini
y
2
( i y )
R
n
MSB=
k1 i=1

k n
1
MSW =
k ( n1 ) i=1 j=1
( y ij y i )
2

k n
SST = ( y ij y )
2

i =1 j=1
Dimana y adalah keseluruhan rata-rata per elemen. Gunakan persamaan ini,
( k 1 ) nMSBSST
=
( n1 ) SST

Tabel 7.4
Bilangan Bilangan sampel
cluster 1 2 3 n Rata-rata
y 11 y 12 y 13 y1 n y 1
1
y 21 y 22 y 23 y2 n y 2
2
y 31 y 32 y 33 y3 n y 3
3

yk 1 yk 2 yk 3 y kn y k
k

Tabel 7.5
y i ^ ( y )
V
Bilanga Populasi (N=20)
n cluster 8152 5722 9504 8399 6423
1 8 5 9 8 6 7.2 0.405
2 1 7 5 3 4 4.0 0.750
3 5 2 0 9 2 3.6 1.845
4 2 2 4 9 3 4.0 1.275

Yang mana untuk nilai N = nk adalah mendekati.


MSBMST

( n1 ) MST

Di mana MST = SST/(nk-1)


Melihat dari persamaan (7.20), kita dapat melihat bahwa MSB merupakan hal
V ( y sy )
penting dalam membentuk . Jika MSB lebih kecil dibandingkan MST,

V ( y sy ) V ( y ) untuk sampel acak


akan menjadi negatif dan akan lebih kecil dari

sederhana. Dan sebaliknya, jika MSB lebih besar dari MST, akan positif dan
V ( y sy ) V ( y ) . MSB kecil hampir sama dengan cara cluster,
lebih besar dari
dengan demikian, kita harus memilih cluster untuk memiliki alat yang sama tetapi
sebanyak variasi internal yan mungkin.
Beberapa perhitungan pada populasi yang sebenarnya dari pengukuran akan
membantu kita memahami konsep ini. Tabel 7.7 menunjukkan populasi 20 digit acak
dibagi menjadi 4 kelompok, masing-masing dibagi 5 ukuran. Perhitungan Analisis
variansi (ANOVA), dengan cluster k = 4 dari n = 5 pengukuran menghasilkan nilai-
nilai dalam tabel (df = derajat kebebasan, SS = jumlah kuadrat, MS = rata-rata
kuadrat).

ANOVA
Source df ss MS
Faktor 3 42.20 14.07
Error 16 114.00 7.13
total 19 156.20

Dari sini kita mengetahui MSB = 14.07, MSW = 7.13, dan SST = 156.20.
Kemudian, gunakan persamaan (7.19),
3 ( 5 ) ( 14.07 )156.20
= =0.088
4 (156.20)

Kita seharusnya tidak terkejut bahwa ditutup dengan nol, karena data
hanya acak digit. Masing-masing cluster k seperti sampel acak sederhana dari
pengamatan n.

Tabel 7.6
Bilanga y ^ ( y )
V
Populasi (N = 20)
n
Cluster 1234 5678 9 10 11 12 13 14 15 16 17 18 19 20

1 1 5 9 13 17 9.0 6.0
2 2 6 10 14 18 10.0 6.0
3 3 7 11 15 19 11.0 6.0
4 4 8 12 16 20 12.0 6.0

Untuk situasi tidak acak, lihat tabel 7.6 yang mana populasi pertama 20
bilangan bulat dibagi menjadi 4 cluster pengamatan masing-masing. Perhitungan
ANOVA menghasilkan nilai pada tabel.

ANOVA
source df ss MS
Faktor 3 25.0 8.3
Error 16 640.0 40.0
total 19 665.0
Dari ini kita peroleh,
3 ( 5 ) ( 8.3 )665
= =0.203
5( 665)

Karena ini populasi yang sangat penting, produksi sistematis sampel yang penting,
kita mengestimasi nilai negatif lebih besar dari . Untuk populasi, sistematis
sampel menghasilkan perkiraan yang tepat untuk melakukan sampel acak sederhana.
Baik dengan perhitungan langsung atau dengan persamaan (7.4), kita dapat
y sy
menemukan variansi sejati dari untuk situasi dimana populasi diketahui.
Mengacu pada tabel 7.5, dimana masing-masing dari 4 nilai rata-rata sampel terjadi
dengan probabilitas yang sama.
y
V ( sy)=2.11

Dengan menggunakan persamaan (7.4)
y
2
V ( sy)= [1+ ( n1 ) ]
n

SST
[1+ ( n1 ) ]
n(kn)

1+ ( 4 )( 0.088 )=2.11
156.2

5(20)

Tabel 7.5 kolom sebelah kanan menunjukkan estimasi variansi dari sampel
sistematis individual (cluster) yang dapat diperoleh dengan menggunakan rumus dari
sampel acak sederhana dengan persamaan (7.2). Perhatikan bahwa keempat ini
estimasi variansi lebih kecil dari variansi benar, tetapi cukup dekat.
Dengan cara yang sama perhitungan untuk data pada tabel 7.6 menunjukkan
V ( y sy )=1.25 V ( y sy )
. Sekarang, 4 sampel estimasi pada tidak menunjukkan
nilai kebenaran. (semua 4 estimasi = 6.0). hal ini sama dengan pembahasan
sebelumnya, pada populasi ditunjukkan rumus sampel acak sederhana akan lebih
y sy
memperkirakan variansi sejati dari .
Apakah kita dapat melakukan hal ini? Bisakah kita temukan estimasi lain dari
V ( y sy )
yang mungkin lebih baik dari estimasi yang digunakan untuk sampel acak
sederhana? Baiknya, kita dapat menghasilkan leboh estimasi yang tidak baik dibanyak
kasus, terutama pada hal ini populasi linear lebih terkenal. Estimasi baru ini
y1 , y2 , , yn
didasarkan pada gagasan berikut. adalah sampel acak dengan

y
2 2
E( i)= dan V ( y i )= . Estimasi dari didasarkan pada ( y i y )2 ,

tapi jika kita mengetahui bahwa =0 , estimasi dari 2 akan menjadi y i2


dan y 2i /n 2
akan menjadi estimasi dari .
0 . Pilih 2 nilai sampel, yi yj
Sekarang, diduga dan dan

d d
d i = y i y j E( i )=0 V ( i)=2 2 . Jika kita membuat
. Ikuti bahwa dan

nd

perbedaan
nd
, kemudian d 2i /n d adalah estimasi dari 2 2 , dari estimasi
i=1

2 . Karena kita ingin memperkirakan rata-rata y sy


yang diperoleh dengan
nd
sampel perhitungan n dari populasi perhitungan N, estimasi menjadi
nd
^ d ( y sy )= N n 1 d 21
V
Nn 2 nd i=1

Dengan perbedaan yang terjadi, kita bisa membuat urutan perbedaan dengan
d i= y i +1 y i i=1, ,( n1)

Sebuah sampel ukuran n menghasilkan n-1 dengan urutan perbedaan dan jadi
persamaan (7.21) menjadi
n1
^ d ( y sy )= N n
V
1
d 21
Nn 2(n1) i=1

Lihat buku wolker (1984) untuk membahas ini dan estimasi variansi pada sistematis
sampel lainnya.

Tabel 7.7
Bilangan Selisih ^ d ( y sy )
V
cluster (nilai mutlak)
1 3 4 1 2 0.562
2 6 2 2 1 0.844
3 3 2 9 7 2.681
4 0 2 5 6 1.219
Untuk data acak digit pada tabel 7.5, urutan perbedaan diberikan pada tabel
^
7.7. Pada bagian kolom kanan diberikan perhitungan V d ( y sy ) dari persamaan
(7.22). Estimasi variansi ini yang cukup dekat dengan yang dihasilkan oleh rumus
sampel acak sederhana (lihat tabel 7.5) dan berada di lingkungan yang benar
y
V ( sy)=2.11 .

Pindah ke data integer untuk tsbel 7.6, kita melihat bahwa urutan perbedaan
disemua 4 sistematis sampel yang mungkin adalah (4, 4, 4, 4). Berdasarkan data ini,
^ d ( y sy )=1.20
V ^
untuk sistematis sampel. Catatan di sini bahwa V d ( y sy ) sangat

y
tertutup kebenarannya untuk V ( sy)=1.25 . juga, estimasi sampel acak

sederhana tidak bekerja sama sekali.


Sebuah aturan yang baik untuk membuat sampel kita harus menggunakan
estimasi variansi berdasarakan urutan perbedaan setiap kali menduga elemen populasi
untuk menjadi murni secara acak. Kita harus menggunakan estimasi variansi dari
sampel acak sederhana ketika kita memiliki alasan yang baik untuk percaya bahwa
unsur-unsur populasi murni acak.

Tabel 7.8
Bilanga ^p ^ ( ^p )
V ^ d ( ^p )
V
1001 0011 0011 1000 1110
n cluster

1 1 0 0 1 1 0.6 0.045 0.047


2 0 0 0 0 1 0.2 0.030 0.023
3 0 1 1 0 1 0.6 0.045 0.070
4 1 1 1 0 0 0.6 0.045 0.023

Tabel 7.9
Bilanga ^p ^ ( ^p )
V ^ d ( ^p )
V
0000 0000 0011 1111 1111
n cluster

1 1 0 0 1 1 0.4 0.045 0.023


2 0 0 0 1 1 0.4 0.045 0.023
3 0 0 1 1 1 0.6 0.045 0.023
4 1 0 1 1 1 0.6 0.045 0.023
Contoh 7.7
Kumpulan data TEMPS pada lampiran D dan disk menunjukkan daftar 88 stasiun
cuaca menurut abjad diseluruh negara. Hal ini diharapkan untuk memperkirakan rata-
rata curah hujan Januari diseluruh negara. Dengan sistematis sampel n = 8 pada
stasiun ini (seorang wartawan mungkin hanya memilih waktu untuk memanggil 8
stasiun). Pada kasus ini, k = 11, jadi dipilih secara acak 11 stasiun yang ada pada
daftar. (ternyata nomor sembilan yang terpilih). Curah hujan Januari (dalam inci)
untuk 8 sampel stasiun, antara lain
0.5, 1.8, 1.9, 4.7, 1.7, 0.7, 1.7, 2.8
Perkirakan rata-rata curah hujan Januari dari semua 88 stasiun dan tentukan batas
kesalahan estimasi.
Penyelesaian:
Sekarang diperoleh,
y sy =1.98

Dan
2
s =1.728

Gambar 7.6
Maka,
^ ( y sy )= Nn s 2= 888 ( 1.728 )=0.196
V
Nn 88 ( 8 )

Dan
2 V^ ( y sy )=0.89

Jika kita mempunyai


n1
^ d ( y sy )= N n
V
1
d2
Nn 2(n1) i=1 i

80 1
(21.75 )=0.176
88 ( 8 ) 2 ( 7 )

Dan
2 V^ d ( y sy ) =0.84

Contoh 7.8
Kumpulan data Sungai pada lampiran D dan disk menunjukkan rata-rata laju aliran
harian untuk sungai Florida. Misalkan kita memilih untuk memperkirakan rata-rata
laju aliran untuk musim gugur (Oktober, November, Desember) pada tahun 1977
dengan melihat setiap hari ke-10. Pertama memilih secara acak (4, dalam kasus ini)
antara 1 dan 10 menghasilkan n=9 pengukuran selama periode 3 bulan ini. Antara lain
(dalam kaki kubik perdetik) :
38, 24, 17, 11, 4.7, 7.5, 4.0, 2.6, 4.9
Perkirakan rata-rata laju aliran untuk periode selama penelitian.
Penyelesaian:
Persamaan (7.1) dan (7.2) diperoleh,
y sy =12.63

^ ( y sy )= 83 ( 139.838 )=14.018
V
92 ( 9 )

Dan
2 V^ ( y sy )=7.49

Gambar 7.7
Urutan perbedaan estimasi variansi diberikan
^ d ( y sy )= 83 348.03 =2.180
V
92 ( 9 ) 2 ( 8 )

Dan
2 V^ d ( y sy ) =2.95

SOAL SOAL

7.4 Seorang management dari perusahaan tertentu tertarik untuk mengestimasi proporsi dari
para pekerja yang mendapatkan bantuan yaitu sebuah polis investasi. 1 in 10 sampel
sistematik didapatkan dari para pekerja yang meninggalkan gedung saat hari terakhir kerja.
Gunakanlah data dalam tabel berikut untuk mengestimasi p, proporsi dari yang mendapatkan
polis investasi dan tentukanlah batas kesalahan dari estimasi.Asumsikanlah N = 2000

Sampel pekerja Respons

3 1

13 0

23 1

. .
. .
. .
1993 1
200

yi = 132
i=1

Penyelesaian :
200

^psy yi 132
= i=1 = 200 = 0,66
200

q^ sy ^psy
= 1- = 1-0,66 =0,34

p^ sy q^ sy N n
v^ ^psy N
( = n1 )

2 v^ ( ^psy ) =2
p^ sy q^ sy
n1
( N n)
(N )

=2 0,66 0,34
199
(2000199)
(2000)

=2 0,0011 0,9005

=2 0,00099055

= 2 0,0314

= 0,0629
Jadi , kita bisa mengestimasi proporsi para pekerja yang mendapatkan bantuan yaitu sebuah
polis investasi yaitu sebesar 0,66 dengan batas kesalahan dari proporsi yaitu 0,0629

7.5 Untuk situasi di atas pada latihan 7.4 , tentukanlah ukuran sampel yang dibutuhkan untuk
mengestimasi p dalam 0,01 unit.
Penyelesaian :

B2 (0,01)2
D= 4 = 4 = 0,000025

Npq
n= ( N 1 ) D+ pq

(2000 )( 0,66 ) (0,34)


= ( 1999 )(0,000025)+ ( 0,66 ) (0,34)
448,8
= 0,274

=1.636
Jadi ukuran sampel yang dibutuhkan untuk mengestimasi p dalam 0,01 unit adalah 1.636

Anda mungkin juga menyukai