TEKNIK SAMPLING
Contoh:
Dari 100 orang kayawan ingin diambil secara acak sistematis 10 orang karyawan sebagai
sampel. Penyelesaiannya dapat dilakukan sebagai berikut:
1. Menentukan banyaknya kelompok :
k = 100/10 =10, berarti ada 10 kelompok (tidak boleh lebih dari 10 kelompok).
2. Memberikan nomor urut secara acak pada 100 orang karyawan tersebut dari 1, 2, 3,
sampai 100
Kasus I
Pada shift pertama (Jam 08.00 10.00) diketahui 2,5% produk yang dihasilkan rusak
pada 30 menit pertama, 2,0% rusak pada 30 menit kedua, 2,3 % rusak pada menit ketiga dan
2,5 % rusak pada 30 menit keempat. Dapat diperhatikan bahwa untuk kasus seperti ini
seorang manajer pengendali mutu harus segera menghentikan produksi tanpa harus
menunggu shift kedua untuk mengurangi biaya yang diakibatkan oleh kegagalan produksi.
Dalam hal ini kemungkinan penyebab utama terjadinya kegagalan produksi adalah mesin dan
bukan manusianya. Kesimpulan ini diambil atas pertimbangan bila faktor manusia maka
kaitannya adalah faktor kelelahan/kejenuhan dengan berjalannya waktu. Dengan demikian
semakin lama pekerja bekerja, yang bersangkutan akan semakin lelah hingga akan lebih
banyak membuat kesalahan seiring dengan lamanya waktu bekerja. Dalam kasus ini
kecendrungan tersebut tidak tampak karena besarnya prosentase cacat ternyata tidak ada
kecendrungan untuk meningkat dengan berjalannya waktu sehingga dapat disimpulkan
bahwa penyebab cacat dalah mesin.
Kasus II
Misalnya hasil yang diperoleh adalah sebagai berikut: Pada shift pertama ternyata
dijumpai 0,9% produk yang cacat pada 30 menit pertama, 1% produk yang cacat pada 30
menit kedua, 1% produk cacat pada 30 menit ketiga dan 1,6% produk cacat pada 30 menit
keempat. Pada shift yang kedua dijumpai 0,7% produk yang cacat dalam 30 menit pertama,
0,9% produk cacat dalam 30 menit kedua, 1% produk yang cacat dalam 30 menit ketiga dan
1,5% produk yang cacat dalam 30 menit keempat. Dari pengambilan sampel terlihat bahwa
tingkat kerusakan semakin membesar pada 30 menit terakhir pada setiap shift. Atas dasar
hasil yang diperoleh dapat diambil dugaan sementara bahwa banyaknya produk cacat lebih
disebabkan karena kejenuhan pekerja setelah mereka bekerja selama 1,5 jam terus menerus.
Dengan demikian bilamana pengambilan sampel diteruskan, maka diperkirakan akan
diperoleh hasil yang menunjukkan faktor pekerja sebagai penyebab kerusakan.
parameter dari populasi. Kita akan menduga rataan populasi dari sebuah sampel
persamaan (7.1).
yi
^= y sy = i=1 (7.1)
n
Dimana sy menunjukkan sistematik sampling.
y st
Variansi Estimasi :
y sy
Kamu akan mengenal variansi estimasi untuk didalam persamaan 7.2. Variansi
y sy y
estimasi untuk serta variansi estimasi untuk sama-sama diperoleh dengan
2
Nn
V ( y )= ( ) (7.3)
n N 1
y st
Variansi untuk diberikan
2
V ( y st ) = [1+ ( n1 ) ] (7.4)
n
Dimana adalah sebuah ukuran untuk hubungan sepasang elemen didalam sampel
sistematik yang sama (selengkapnya dibahas didalam 7.7). Jika adalah mendekati 1,
maka element didalam sampel memiliki karakteristik ukuran yang sama, dan sistematik
sampel akan memberi hasil variansi lebih tinggi untuk rataan sampel dari pada sampel acak
sederhana.
Jika negatif, maka sampel sistematik mungkin lebih tepat dari pada sampel acak
sederhana. Hubungan bisa negatif jika elemen didalam sampel sistematik cenderung memiliki
perbedaan yang besar. Untuk yang mendakati 0 dan N berukuran sedang, sampel
hanya dengan satu sampel sistematik. Ketika sampel sistematik hampir ekuivalent dengan
V ( y sy )
sampel acak sederhana, kita akan menduga dengan variansi estimasi dari sampel
acak sederhana. Dalam situasi lain, rumus variansi sampel acak sederhana akan memberikan
sebuah batasan hasil yang tinggi atau rendah untuk variansi yang benar dari sampel
sistematik.
Definisi 7.2
Sebuah populasi adalah acak jika element dari populasi memiliki urutan yang acak.
Sebuah populasi berurutan jika element dari populasi memiliki nilai yang cenderung
meningkat atau menurun ketika kita mendaftarkannya.
Sebuah populasi berkala jika element dari sebuah populasi mempunyai nilai yang cenderung
berbentuk lingkaran keatas dan kebawah dan susunannya teratur ketika didaftarkan.
Grafik 7.1 hingga 7.3 menunjukkan contoh dari tipe populasi.
Populasi acak bisa terjadi ketika mendaftarkan berdasarkan alfabet dari tingkatan
murid pada saat ujian, karena disana secara umum tidak adal alasan kenapa murid-murid
yang alfabetnya di awal mendapatkan tingkatan yang lebih tinggi dari pada murid yang
alfabatnya di akhir.
Contoh 7.1
Pemerintahan pusat mencari berbagai indikator atas pencapaian industri didalam negeri
dengan mengumpulkan data tahunan, variabelnya seperti banyaknya karyawan dan daftar
gaji. Standar Klasifikasi Industri (SIC) membagi industri pabrik kedalam 140 kelompok.
Tabel 7.1 menunjukkan data jumlah karyawan untuk tahun 2000 dan 2001 dan rata-rata gaji
per tahun (dalam ribuan dolar) selama 2001 untuk suatu sampel 20 kelompok industri.
Sampel sistematik telah terpilih dari daftar 140 kelompok yang muncul didalam Statistik
abstrak untuk Amerika Serikat.
a. Dugalah jumlah rataan karyawan per pabrik di dalam SIC group dan tentukan batas
kesalahan estimasi.
b. Dugalah rata-rata hilangnya karyawan antara 2000 dan 2001 per Pabrik di dalam SIC
group dan tentukan batas kesalahan dari estimasi.
Penyelesaian :
Karena semua analisis statistik dimulai dengan sebuah plot data, pertama lihat urutan
karyawan dengan jumlah sampel (kurva 7.4) dan jumlah karyawan yang hilang (kurva 7.5).
disana daftar SIC memiliki elektronik yang lebih menguntungkan, transportasi, dan pabrik
industri peralatan medis mendekati ujung daftar. Ini adalah keadaan yang baik untuk
sistematik sampling, karena sebuah sampel acak sederhana bisa kehilangan data yang
lengkap. Pola ketika data karyawan hilang nilai sampel menjadi lebih seimbang, dengan
beberapa ukuran yang hilang sehingga mencapai akhir data. Selanjutnya, hal ini dapat
menguntungkan untuk sampel sistematik karena dapat menutupi jangkauan dari kerugian
nilai.
Tabel 7.1
Karyawan dan data gaji untuk sebuah sampel dari pabrik industri
Sampel SIC Description 2000 2001 2001
Karyawan Karyawan Rata-rata
(Ribuan) (Ribuan) gaji
(Ribuan)
1 204 Pabrik Penggilingan 122.4 122.2 34.9
Padi
2 212 Rokok 2.9 3.2 26.9
Dari ringkasan statistik yang diberikan pada tabel 7.1 dan menggunakan rumus standar
sampel acak sederhana,analisis jumlah rata-rata karyawan adalah :
y sy =113.4
^ ( y sy )= 14020 1 ( 105.6 )2
V ( 140 20 )( )
2 V^ ( y sy )=2 ( 14020
140 )( 1
20 )
( 105.6 )=43.72
Dugaan jumlah rata-rata karyawan per industri adalah aproksimasi 113.4 ribu, lebih kurang
44 ribu.
Dengan cara yang sama kalkulasi jumlah karyawan yang hilang dugaan rata-ratanya adalah
10.61 ribu dengan batas kesalahan aproximasi 4.26 ribu.
Ini adalah sebuah ukuran banyaknya karyawan yang hilang dari pabrik dalam 1 tahun, tetapi
batas kesalahannya juga cukup berkaitan dengan sampel ukuran kecil, dan jumlah variabilitas
didalam data karyawan.
Dugaan dari sebuah populasi total membutuhkan pengetahuan total jumlah elemen N didalam
populasi ketika kita menggunakan prosedur di cahpter 4 dan 5. Contoh :
^ =N y
Dimana estimasi dari Sampel acak sederhana. Kita ingin mengetahui N untuk menduga
ketika kita menggunakan sampling sistematik. Ditunjukkan dalam persamaan (7.5 dan
7.6)
Variansi Estimasi :
2
V ( )( NNn )
^ ( N y sy ) =N 2 s
n (7.6)
Contoh 7.2
Data sampel sistematik 20 kelompok industri dari 140 populasi, ditunjukkan pada
contoh 7.1, yang menarik, estimasi jumlah populasi total karyawan yang hilang pada industri
U.S antara tahun 2000 dan 2001. Dari data yang disajikan, estimasi total dan tentukan batas
kesalahan estimasi.
Penyelesaian :
Estimasi rata-rata yang telah hilang 10.61 ribu dengan batas kesalahan aproximasi
4.26 ribu. estimasi total dengan mengalikan jumlah N=140. Rata-rata jumlah total karyawan
yang hilang adalah 1485 ribu dengan sebuah batas kesalahan estimasi 596 ribu. Kita mencoba
mengestimasi total data variabel dengan sampel kecil, dalam hal ini ketepatan hasil tidaklah
besar. Untuk mendapatkan ketepatan yang lebih besar, ukuran sampel harus ditingkatkan atau
desain sampling diubah, atau keduanya.
^psy . ^psy
Ketika sampel acak sederhana (section 4.5), properti dari paralel dari rataan
y sy
sampel jika
yi
^psy = y sy = i=1 (7.7)
n
^psy
Variansi Estimasi dari :
^ ( ^p sy )= p^ sy q^ sy
V ( n1 )( NNn ) (7.8)
Contoh 7.3 :
1-dari-6 sampel sistematik diperoleh dari sebuah daftar pemberi suara untuk
mengestimasi proporsi pemberi suara (pemilih). Beberapa titik awal yang berbeda digunakan
untuk memastikan hasil sampel tidak terpengaruh dengan variansi perodik dalam populasi.
Hasil survey dilihat pada tabel berikut. Estimasi p, proporsi dari 5775 pemberi suara
(N=5775). Tentukan batas kesalahan estimasi
Penyelesaian :
Proporsi sampel
962
yi 652
=
^psy = i=1 = 962 0.678
962
Karena N besar dan beberapa titik awal acak telah dipilih dapat digambarkan dalam
sistematik sampling, dengan asumsi bahwa
^ ( ^p sy )= p^ sy q^ sy
V (
n1 )( NNn )
^psy .
Untuk memperoleh estimasi terbaik dari V ( Dengan batas kesalahan estimasi adalah
2 V^ ( ^psy )=2
( ^psy q^ sy
n1 )( Nn
N )
Disini kita dapat mengestimasi 0.678 (67.8%) dari pemberi suara yang terdaftar. Kita dapat
mempercayainya dengan batas estimasi kurang dari 0.028 (2.8%)
memperkirakan atau mengestimasi suatu nilai dari rataan ( ) yang nilai nya tidak lebih
dari satuan B , maka mengharuskan kita untuk menentukan ukuran sampel yang pas untuk
menyelesaikan masalah itu , dengan menggunakan sebuah persamaan untuk menentukan nilai
n dibawah ini :
2 V ( y sy )=B (7.9)
2
Solusi dalam persamaan (7.9) , melibatkan nilai antara ( ) dan ( ) , yang
mana nilai keduanya harus diketahui ( setidaknya nilai perkiraan yang mendekati ) untuk
memecahkan permasalaan penentuan nilai n tersebut. walaupun kadang-kadang nilai dari
parameter ini dapat kita peroleh atau perkirakan jika ada data yang tersedia dari penelitian
yang pernah dilakukan sebelumnya.
Kita dapat menggunakan formula n untuk sebuah sampel acak sederhana , dimana
formula ini dapat memberikan sebuah sampel dengan ukuran yang besar untuk populasi yang
diamati , dan ukuran yang kecil untuk populasi berkala (periodic). seperti pertama kali
y sy
dituliskan , variansi dari ( ) dan ( y ) akan bernilai sama jika populasinya adalah
acak.
Ukuran sampel yang dibutuhkan untuk mengestimasi dengan sebuah nilai batas
kesalahan dari estimasi :
2
N
n=
( N 1 ) D+ 2 (7.10)
dimana :
2
B
D=
4
Example 7.4
Manajemen dari sebuah perusahaan pembayaran yang besar , tertarik untuk
menentukan jumlah rata-rata waktu keterlambatan pembayaran yang telah melewati batas
waktu yang ditetapkan . sebuah sampel acak sistematis dipilih untuk menggambarkan
permasalah tersebut , dari daftar nama berurut di ambil sejumlah N= 2500 pelanggan yang
telah melewati batas waktu pembayaran , dalam sebuah penelitian yang sama yang pernah
dilakukan pada tahun sebelumnya , diperolehlah variansi dari sampel yaitu s 2 =100 hari
keterlambatan . tentukanlah ukuran sampel yang dibutuhkan untuk mengestimasi jumlah rata-
rata waktu pembayaran yang telah melewati batas waktu , dengan nilai batas kesalahan
estimasi adalah 2 hari.
Solusi :
Kita dapat mengasumsikan bahwa populasi adalah acak , sehingga kita dapat
menggunakan persamaan (7.10) untuk menentukan nilai perkiraan dari ukuran sampel ,
2 2
dengan mengganti nilai ( ) dengan ( s ) dan mengartur nilai :
B2 4
D= = =1
4 4
kita mempunyai :
N 2 2500(100)
n= 2
= =96,19
( N 1 ) D+ 2499 ( 1 ) +100
dengan nilai batas kesalahan estimasi dengan jarak B , kita menggunakan metode yang
cocokpada section 4.4.
Dan ukuran sampel yang dibutuhkan untuk mengestimasi p yang kurang dari B satuan
, ditentukan dengan menggunakan formula ukuran sampel untuk mengestimasi p dengan
sampel acak sederhana .
Ukuran sampel yang dibutuhkan untuk mengestimasi P dengan nilai batas kesalahan
estimasi B
Npq
n=
( N 1 ) D+ pq (7.11)
dimana
2
Dalam sebuah situasi praktisq= , kita B
p1 tidak dapat
dan D=mengetahui nilai P , kita dapat
4
menentukan sebuah nilai perkiraan ukuran sampel dengan mengganti nilai p dengan sebuah
nilai estimasi. jika tidak ada informasi sebelumnya yang cocok untuk mengestimasi nilai p
,kit dapat menentukan sebuah pilihan ukuran sampel denag mengatur nilai p=0,5.
Exampel 7.5
Sebuah perusahaan periklanan , ingin memulai kampanye promosi untuk sebuah
produk baru , perusahaan ingin mengambil sampel pelanggan yang mampu dalam sebuah
komunitas yang kecil , untuk menentukan berapa banyak pelanggan yang setuju akan produk
tersebut . dengan menyisihkan atau memilih beberapa harga yang telah ada , dengan
melakukan wawancara secara personal atau perseorangan , peneliti telah menetapkan untuk
menjalankan system pengambilan sampel secara sistematik dari N=5000 daftar nama dalam
komunitas yang terdaftar dan dikumpulkan data dengan melakukan wawancara via telfon ,
tentukan ukuran sampel yang dibutuhkan untuk mengestimasi nilai p . proporsi dari orang
yang percaya bahwa produk itu akan diterima dengan nilai batas kesalahan dari estimasi
berjarak B=0,03 ( atau 3%)
Solusi
Ukuran sampel yang dibutuhkan untuk mengestimasi dapat ditentukan dengan
menggunakan persamaan (7.11) . walaupun tidak ada data yang tersedia sebelumnya untuk
product baru tersebut , kita masih dapat menentukan sebuah perkiraan ukuran sampel dengan
mengatur nilai p= 0,5 dalam persamaan (7.11) dan
2
B 2 (0,03)
D= = =0,000225
4 4
dimana , perusahaan harus mewawancara sebanyak 910 orang untuk menentukan pelanggan
yang menerima produk bru tersebut dengan batas kesalahn kurang dari 3 %.
7.6. Pengulangan sistematik sampel
Pada bagian dalam section 7.3 diterangkan bahwa kita tidak dapat meng estimasi nilai
y st
variansi dari ( ) dari informasi yang terdapat pada sigle sistematik sampel , kecuali
pada sistematik sampel pembangkit untuk semua tujuan yang dilaksanakan pada sebuah
sampel acak.
ketika hasil ini terjadi , maka kita dapat menggunakan teknik pengambilan sampel secara
acak untuk mengestimasi dengan cara mengguraikan bagian pada 4.3, walaupun pada
kenyataan nya systematic sampel tidak sama atau eqivalen dengan sampel acak sederhana .
y st
sebuah metode alernatif harus kita gunakan untuk mengestimasi V( ) . pengulangan
y st
sistematik sampel mengizinkan kita untuk mengestimasi nilai V( ) dengan
n s=10
menggunakan kuadrat dari deviasi ( ) individu rataan sampel akan memperkiraan
polulasi ().
ns
Untuk memilih ( ) pengulangan sistematik sampel , kita harus menentukan jarak
dari elemen masing-masing sampel seterusnya secara terpisah , dengan demikian sepuluh 1-
n s=10 k ' =50 ) dari 6 pengukuran masing-masing berisi angka yang
dari-50 sapel ( ,
'
sama dari setiap pengukuran tunggal 1-dari-5 sampel ( k =5 ) , berisikan n=60 pengukuran.
ns
Untuk menentukan titik awal element sampel dari masing-masing ( ) sistematik
sampel , kita harus memilih secara acak suatu nomor pertama dari k elemen , kemudian
untuk elemen selajutnya dari masing-masing sampel kita dapat menambahkan k ' ,2 k ' dan
n
seterusnya dari nomor pertama sampai jumlah masing-masing sampel adalah ns telah
didapatkan.
Sebuah populasi tetap dengan N=960 elemen , yang manakita dapat membentuk suatu
daftar nomor berurutan . akan dipilih sebuah sistematik sampel dengan ukuran n=60 , kita
memilih k=N/n=16 dan sebuah angka acak dipilih antara 1 dan 16 sebagai titil awal. tentukan
cara yang dapat kita lakukan untuk memilih sepuluh pengulangan sistematik sampel dalam
kondisi yang sama dengan satu sistematik sampel ?
'
Pertama , kita memilih k =10k =10(16) =160 , kemudian , kita memilih 10 angka
acak antara 1 dan 160 . terakhir nilai konstan 160 kita tambahkan ke masing-masing titik
awal acak untuk mendapatkan sepuluh angka antara 161 an 320 , proses penambahan dengan
nilai konstan ini berlanjut sampai sepuluh sampel dengan ukuran 6 diperoleh.
Angka acak yang diperoleh dari 10 bilangan bulat antara 1 dan 160 adalah :
73 , 42 , 81 , 145 , 6 , 21 , 86 , 17 , 112 , 102
Angka yang diperoleh dari bilangan bulat sebagai titik awal dari sepuluh sistematik
sampel , ditunjujkan dalam table 7.2 , dan elemen kedua dalam masing-masing sampel
ditentukan dengan menanbahkan 160 pada bilangan pertama , dan elemen ketiga dengan
penjumlahan 160 pada elemen kedua , dan seterusnya.
Table 7.2
Hasil pemilihan dari pengulangan sistematik sampel
Pemilihan Elemen Elemen Elemen ke
titik awal kedua dalam ketiga dalam . enam dalam
secara acak sampel sampel sampel
6 166 326 806
17 177 337 817
21 181 341 821
42 202 362 842
73 233 393 873
81 241 401 881
86 246 406 886
102 262 422 902
112 272 432 912
145 305 462 945
ns
Kita memilih setidaknya 10 untuk memungkinkan kita mendapatkan rataan
y st
sampel yang cukup untuk memperoleh perkiraan yang memuaskan dari V( ), kita
'
memilih ( k ) untuk memberikan jumlah yang sama dari banyaknya pengukuran seperti
y i
dimana , mewakili rataan dari sistematik sampel ke i
dimana
y
ns
( i ^ )2
i=1
(7.13)
n s1
s 2 y =
total populasi ( ) jika N diketahui .
ns '
Estimasi dari total populasi () menggunakan 1-in- k sistematik sampel :
ns
y i
^ =N ^ =N (7.14)
i=1 ns
Solusi
Untuk satu sistematik sampel
N 400
k= = =5
n 80
n s=10
Dimana , untuk sampel ,
rata untuk baris kedua , dan seterusnya . dan estimasi dari adalah :
s y =0,675 ^ adalah :
Dengan , nilai batas eror dari
V^ ( ^ )=
( Nn
N Ns )
s y =
40080
400 10
( 0,675 )=0,19
Oleh karena itu , estimasi rataan terbaik dari orang yang datang per mobil adalah 4,16 (tambah atau
kurang 0,38 ).
k n
SST = ( y ij y )
2
i =1 j=1
Dimana y adalah keseluruhan rata-rata per elemen. Gunakan persamaan ini,
( k 1 ) nMSBSST
=
( n1 ) SST
Tabel 7.4
Bilangan Bilangan sampel
cluster 1 2 3 n Rata-rata
y 11 y 12 y 13 y1 n y 1
1
y 21 y 22 y 23 y2 n y 2
2
y 31 y 32 y 33 y3 n y 3
3
yk 1 yk 2 yk 3 y kn y k
k
Tabel 7.5
y i ^ ( y )
V
Bilanga Populasi (N=20)
n cluster 8152 5722 9504 8399 6423
1 8 5 9 8 6 7.2 0.405
2 1 7 5 3 4 4.0 0.750
3 5 2 0 9 2 3.6 1.845
4 2 2 4 9 3 4.0 1.275
sederhana. Dan sebaliknya, jika MSB lebih besar dari MST, akan positif dan
V ( y sy ) V ( y ) . MSB kecil hampir sama dengan cara cluster,
lebih besar dari
dengan demikian, kita harus memilih cluster untuk memiliki alat yang sama tetapi
sebanyak variasi internal yan mungkin.
Beberapa perhitungan pada populasi yang sebenarnya dari pengukuran akan
membantu kita memahami konsep ini. Tabel 7.7 menunjukkan populasi 20 digit acak
dibagi menjadi 4 kelompok, masing-masing dibagi 5 ukuran. Perhitungan Analisis
variansi (ANOVA), dengan cluster k = 4 dari n = 5 pengukuran menghasilkan nilai-
nilai dalam tabel (df = derajat kebebasan, SS = jumlah kuadrat, MS = rata-rata
kuadrat).
ANOVA
Source df ss MS
Faktor 3 42.20 14.07
Error 16 114.00 7.13
total 19 156.20
Dari sini kita mengetahui MSB = 14.07, MSW = 7.13, dan SST = 156.20.
Kemudian, gunakan persamaan (7.19),
3 ( 5 ) ( 14.07 )156.20
= =0.088
4 (156.20)
Kita seharusnya tidak terkejut bahwa ditutup dengan nol, karena data
hanya acak digit. Masing-masing cluster k seperti sampel acak sederhana dari
pengamatan n.
Tabel 7.6
Bilanga y ^ ( y )
V
Populasi (N = 20)
n
Cluster 1234 5678 9 10 11 12 13 14 15 16 17 18 19 20
1 1 5 9 13 17 9.0 6.0
2 2 6 10 14 18 10.0 6.0
3 3 7 11 15 19 11.0 6.0
4 4 8 12 16 20 12.0 6.0
Untuk situasi tidak acak, lihat tabel 7.6 yang mana populasi pertama 20
bilangan bulat dibagi menjadi 4 cluster pengamatan masing-masing. Perhitungan
ANOVA menghasilkan nilai pada tabel.
ANOVA
source df ss MS
Faktor 3 25.0 8.3
Error 16 640.0 40.0
total 19 665.0
Dari ini kita peroleh,
3 ( 5 ) ( 8.3 )665
= =0.203
5( 665)
Karena ini populasi yang sangat penting, produksi sistematis sampel yang penting,
kita mengestimasi nilai negatif lebih besar dari . Untuk populasi, sistematis
sampel menghasilkan perkiraan yang tepat untuk melakukan sampel acak sederhana.
Baik dengan perhitungan langsung atau dengan persamaan (7.4), kita dapat
y sy
menemukan variansi sejati dari untuk situasi dimana populasi diketahui.
Mengacu pada tabel 7.5, dimana masing-masing dari 4 nilai rata-rata sampel terjadi
dengan probabilitas yang sama.
y
V ( sy)=2.11
Dengan menggunakan persamaan (7.4)
y
2
V ( sy)= [1+ ( n1 ) ]
n
SST
[1+ ( n1 ) ]
n(kn)
1+ ( 4 )( 0.088 )=2.11
156.2
5(20)
Tabel 7.5 kolom sebelah kanan menunjukkan estimasi variansi dari sampel
sistematis individual (cluster) yang dapat diperoleh dengan menggunakan rumus dari
sampel acak sederhana dengan persamaan (7.2). Perhatikan bahwa keempat ini
estimasi variansi lebih kecil dari variansi benar, tetapi cukup dekat.
Dengan cara yang sama perhitungan untuk data pada tabel 7.6 menunjukkan
V ( y sy )=1.25 V ( y sy )
. Sekarang, 4 sampel estimasi pada tidak menunjukkan
nilai kebenaran. (semua 4 estimasi = 6.0). hal ini sama dengan pembahasan
sebelumnya, pada populasi ditunjukkan rumus sampel acak sederhana akan lebih
y sy
memperkirakan variansi sejati dari .
Apakah kita dapat melakukan hal ini? Bisakah kita temukan estimasi lain dari
V ( y sy )
yang mungkin lebih baik dari estimasi yang digunakan untuk sampel acak
sederhana? Baiknya, kita dapat menghasilkan leboh estimasi yang tidak baik dibanyak
kasus, terutama pada hal ini populasi linear lebih terkenal. Estimasi baru ini
y1 , y2 , , yn
didasarkan pada gagasan berikut. adalah sampel acak dengan
y
2 2
E( i)= dan V ( y i )= . Estimasi dari didasarkan pada ( y i y )2 ,
d d
d i = y i y j E( i )=0 V ( i)=2 2 . Jika kita membuat
. Ikuti bahwa dan
nd
perbedaan
nd
, kemudian d 2i /n d adalah estimasi dari 2 2 , dari estimasi
i=1
Dengan perbedaan yang terjadi, kita bisa membuat urutan perbedaan dengan
d i= y i +1 y i i=1, ,( n1)
Sebuah sampel ukuran n menghasilkan n-1 dengan urutan perbedaan dan jadi
persamaan (7.21) menjadi
n1
^ d ( y sy )= N n
V
1
d 21
Nn 2(n1) i=1
Lihat buku wolker (1984) untuk membahas ini dan estimasi variansi pada sistematis
sampel lainnya.
Tabel 7.7
Bilangan Selisih ^ d ( y sy )
V
cluster (nilai mutlak)
1 3 4 1 2 0.562
2 6 2 2 1 0.844
3 3 2 9 7 2.681
4 0 2 5 6 1.219
Untuk data acak digit pada tabel 7.5, urutan perbedaan diberikan pada tabel
^
7.7. Pada bagian kolom kanan diberikan perhitungan V d ( y sy ) dari persamaan
(7.22). Estimasi variansi ini yang cukup dekat dengan yang dihasilkan oleh rumus
sampel acak sederhana (lihat tabel 7.5) dan berada di lingkungan yang benar
y
V ( sy)=2.11 .
Pindah ke data integer untuk tsbel 7.6, kita melihat bahwa urutan perbedaan
disemua 4 sistematis sampel yang mungkin adalah (4, 4, 4, 4). Berdasarkan data ini,
^ d ( y sy )=1.20
V ^
untuk sistematis sampel. Catatan di sini bahwa V d ( y sy ) sangat
y
tertutup kebenarannya untuk V ( sy)=1.25 . juga, estimasi sampel acak
Tabel 7.8
Bilanga ^p ^ ( ^p )
V ^ d ( ^p )
V
1001 0011 0011 1000 1110
n cluster
Tabel 7.9
Bilanga ^p ^ ( ^p )
V ^ d ( ^p )
V
0000 0000 0011 1111 1111
n cluster
Dan
2
s =1.728
Gambar 7.6
Maka,
^ ( y sy )= Nn s 2= 888 ( 1.728 )=0.196
V
Nn 88 ( 8 )
Dan
2 V^ ( y sy )=0.89
80 1
(21.75 )=0.176
88 ( 8 ) 2 ( 7 )
Dan
2 V^ d ( y sy ) =0.84
Contoh 7.8
Kumpulan data Sungai pada lampiran D dan disk menunjukkan rata-rata laju aliran
harian untuk sungai Florida. Misalkan kita memilih untuk memperkirakan rata-rata
laju aliran untuk musim gugur (Oktober, November, Desember) pada tahun 1977
dengan melihat setiap hari ke-10. Pertama memilih secara acak (4, dalam kasus ini)
antara 1 dan 10 menghasilkan n=9 pengukuran selama periode 3 bulan ini. Antara lain
(dalam kaki kubik perdetik) :
38, 24, 17, 11, 4.7, 7.5, 4.0, 2.6, 4.9
Perkirakan rata-rata laju aliran untuk periode selama penelitian.
Penyelesaian:
Persamaan (7.1) dan (7.2) diperoleh,
y sy =12.63
^ ( y sy )= 83 ( 139.838 )=14.018
V
92 ( 9 )
Dan
2 V^ ( y sy )=7.49
Gambar 7.7
Urutan perbedaan estimasi variansi diberikan
^ d ( y sy )= 83 348.03 =2.180
V
92 ( 9 ) 2 ( 8 )
Dan
2 V^ d ( y sy ) =2.95
SOAL SOAL
7.4 Seorang management dari perusahaan tertentu tertarik untuk mengestimasi proporsi dari
para pekerja yang mendapatkan bantuan yaitu sebuah polis investasi. 1 in 10 sampel
sistematik didapatkan dari para pekerja yang meninggalkan gedung saat hari terakhir kerja.
Gunakanlah data dalam tabel berikut untuk mengestimasi p, proporsi dari yang mendapatkan
polis investasi dan tentukanlah batas kesalahan dari estimasi.Asumsikanlah N = 2000
3 1
13 0
23 1
. .
. .
. .
1993 1
200
yi = 132
i=1
Penyelesaian :
200
^psy yi 132
= i=1 = 200 = 0,66
200
q^ sy ^psy
= 1- = 1-0,66 =0,34
p^ sy q^ sy N n
v^ ^psy N
( = n1 )
2 v^ ( ^psy ) =2
p^ sy q^ sy
n1
( N n)
(N )
=2 0,66 0,34
199
(2000199)
(2000)
=2 0,0011 0,9005
=2 0,00099055
= 2 0,0314
= 0,0629
Jadi , kita bisa mengestimasi proporsi para pekerja yang mendapatkan bantuan yaitu sebuah
polis investasi yaitu sebesar 0,66 dengan batas kesalahan dari proporsi yaitu 0,0629
7.5 Untuk situasi di atas pada latihan 7.4 , tentukanlah ukuran sampel yang dibutuhkan untuk
mengestimasi p dalam 0,01 unit.
Penyelesaian :
B2 (0,01)2
D= 4 = 4 = 0,000025
Npq
n= ( N 1 ) D+ pq
=1.636
Jadi ukuran sampel yang dibutuhkan untuk mengestimasi p dalam 0,01 unit adalah 1.636