Anda di halaman 1dari 54

4

Simple Random Sampling


Studi Kasus
Apakah orang Amerika mengurangi konsumsi alkohol?
Jajak pendapat Gallup terhadap sekitar 1.200 orang Amerika yang dilakukan pada awal
1994 diarahkan untuk menentukan apakah konsumsi minuman beralkohol menurun.
Selain itu, perbedaan jenis kelamin (gender) dalam kebiasaan minum harus
diperhatikan. Pertanyaan dan persentase yang dihasilkan ditampilkan berikut.

Saya memiliki beberapa pertanyaan tentang minuman beralkohol. Apakah Anda


sesekali mengonsumsi minumal beralkohol seperti minuman keras, anggur atau bir?

Persentase konsumsi alkohol berdasarkan jenis kelamin

Laki-laki Perempuan Total

3 – 6 Juni 1994 70% 61% 65%


1992 72 57 64
1990 64 51 64
Selama 5 tahun terakhir, apakah konsumsi minuman beralkohol Anda meningkat,
menurun, atau tetap sama?

Persentase perubahan konsumsi alkohol selama 5 tahun terakhir

Juni 1984 Juni 1994

Meningkat 15% 7%
Menurun 29 41
Tetap 51 51
Tidak ada opini 5 1
Total 100% 100%
Apakah proporsi pria peminum menurun secara signifikan sejak 1992? Apakah
proporsi perempuan peminum menurun secara signifikan sejak 1992? Apakah proporsi
keseluruhan dari mereka yang mengurangi minum dalam 5 tahun terakhir berubah
sejak 1984? Apakah proporsi mereka yang konsumsinya tetap sama selama 5 tahun
terakhir secara signifikan lebih besar daripada proporsi mereka yang konsumsi
alkoholnya menurun? Metode yang disajikan dalam bab ini akan membantu kita
menemukan jawaban atas pertanyaan-pertanyaan tersebut.

4.0 Alat

Alat excel interaktif untuk melakukan perhitungan pada bab ini dapat ditemukan pada
CD yang menyertai buku ini. Di folder alat bab ini, anda akan menemukan file word
bernama bagian 4.0 (alat). Didalamnya tautan telah disediakan ke alat komputasi yang
relevan untuk bab ini. Dalam teks, kami menggunakan ikon (digambarkan di sebelah
kiri) sebagai pengingat persamaan yang telah kami buat dengan alat. Juga, data untuk
beberapa latihan bab tersedia melalui tautan di bagian itu.

4.1 Pengenalan
Tujuan dari survei sampel adalah untuk membuat kesimpulan tentang parameter
populasi dari informasi yang terkandung dalam sampel. Dua faktor mempengaruhi
jumlah informasi yang terkandung dalam sampel dan karenanya ketepatan prosedur
pembuatan inferensi kami. Yang pertama adalah ukuran sampel yang dipilih dari
populasi. Yang kedua adalah besarnya variasi data; variasi sering dapat dikendalikan
oleh cara memilih sampel. Prosedur untuk memilih sampel disebut contoh desain
survei. Untuk ukuran sampel tetap n, kami akan mempertimbangkan berbagai desain,
atau prosedur pengambilan sampel, untuk mendapatkan n pengamatan dalam sampel.
Karena observasi membutuhkan biaya, desain yang menyediakan penduga parameter
yang tepat untuk a ukuran sampel tetap menghasilkan penghematan biaya untuk
eksperimen. Desain dasar, atau teknik pengambilan sampel, yang disebut simple
random sampling dibahas dalam bab ini.

DEFINISI 4.1

Jika sampel berukuran n diambil dari populasi berukuran N sedemikian rupa


sehingga setiap sampel berukuran n memiliki peluang yang sama untuk terpilih,
prosedur pengambilan sampelnya adalah disebut sampling acak sederhana. Sampel
yang diperoleh disebut sampel acak sederhana.
Konsekuensi dari definisi ini bahwa semua elemen individu dalam suatu populasi
memiliki kesempatan yang sama untuk dipilih dan pemilihan elemen individu saling
independen: ada atau tidak adanya elemen tertentu dari sampel tidak mempengaruhi
probabilitas pemilihan elemen lainnya. Kami akan menggunakan sampling acak
sederhana untuk mendapatkan penduga untuk rata-rata populasi, total, dan proporsi.
Pertimbangkan masalah berikut. Seorang auditor federal akan memeriksa akun-
akun tersebut untuk sebuah rumah sakit kota. Catatan rumah sakit yang diperoleh dari
file data komputer menunjukkan total piutang tertentu, dan auditor harus
memverifikasi total ini. Jika ada 28.000 rekening terbuka di rumah sakit, auditor tidak
mampu meluangkan waktu untuk memeriksa setiap catatan pasien untuk mendapatkan
angka total piutang. Oleh karena itu, auditor harus memilih beberapa skema
pengambilan sampel untuk mendapatkan sampel pasien yang representative catatan.
Setelah memeriksa akun pasien dalam sampel, auditor kemudian dapat:
memperkirakan total piutang untuk seluruh rumah sakit. Jika gambar computer
terletak dalam kisaran tertentu dari estimasi auditor, angka komputer diterima sebagai
sah. Jika tidak, lebih banyak catatan rumah sakit harus diperiksa untuk kemungkinan
perbedaan antara gambar komputer dan data sampel.
Misalkan semua N = 28.000 catatan pasien dicatat dalam file komputer dan a
ukuran sampel n = 100 yang akan diambil. Sampel disebut sampel acak sederhana jika
setiap sampel yang mungkin dari n = 100 catatan memiliki peluang yang sama untuk
dipilih. Pengambilan sampel acak sederhana, yang membentuk dasar dari sebagian
besar desain pengambilan sampel yang dibahas dalam buku ini, adalah dasar dari
sebagian besar survei ilmiah.
Jajak pendapat Gallup yang dilakukan melalui survei telepon dimulai dengan
menstratifikasi bank nomor telepon ke berbagai wilayah geografis dan kemudian
memilih telepon secara acak nomor dalam wilayah ini dengan panggilan digit acak.
Sekali lagi, ide pengambilan sampel acak sederhana memainkan peran kunci,
meskipun desain sampel akhir jauh lebih banyak kompleks. (See Section 2.3 for more
details on Gallup.)
Auditor mempelajari sampel akun acak sederhana untuk memeriksa kepatuhan
terhadap kontrol audit yang ditetapkan oleh perusahaan atau untuk memverifikasi nilai
dolar aktual dari akun tersebut. Dengan demikian, mereka mungkin ingin
memperkirakan proporsi akunyang tidak sesuai dengan kontrol atau nilai total,
katakanlah, piutang. Riset pemasaran sering kali melibatkan sampel acak sederhana
dari calon pengguna suatu produk. Peneliti mungkin ingin memperkirakan proporsi
pembeli potensial yang lebih menyukai warna mobil atau rasa makanan tertentu.
Seorang rimbawan dapat memperkirakan volume kayu atau proporsi pohon yang
sakit di hutan dengan memilih titik-titik geografis di area yang dicakup oleh hutan dan
kemudian melampirkan plot dengan ukuran dan bentuk yang tetap (seperti lingkaran
dengan radius 10 meter) ke titik tersebut. titik. Semua pohon dalam plot sampel dapat
dipelajari, tetapi, sekali lagi, desain dasarnya adalah sampel acak sederhana. Pernah
bertanya- tanya mengapa acara televisi favorit Anda dibatalkan? Salah satu organisasi
pengambilan sampel paling terkenal di dunia adalah Nielsen Media Research, yang
menghasilkan peringkat untuk acara televisi. Peringkat ini menentukan apakah sebuah
acara tetap ditayangkan atau tidak. Berikut adalah pernyataan rinci tentang bagaimana
Nielsen melakukan tugas ini.
Istilah rating dan share adalah dasar bagi industri televisi. Keduanya adalah
persentase. Peringkat adalah persen dari alam semesta yang sedang diukur, paling
sering dibahas sebagai persen dari semua rumah tangga televisi. Dengan demikian,
peringkat selalu dapat diukur, dengan asumsi Anda mengetahui ukuran alam semesta
(rumah tangga TV, orang, wanita antara usia 18 dan 34, dan seterusnya). Bagian
adalah persentase rumah tangga atau orang yang menonton televisi pada saat suatu
program ditayangkan dan juga termasuk mereka yang menonton program tertentu.
Dengan demikian, suatu bagian tidak serta-merta mengikat kembali ke angka
sebenarnya, karena merupakan persentase dari angka yang terus berubah— perangkat
TV yang digunakan. Saham dapat berguna sebagai ukuran posisi kompetitif.
Nielsen Media Research terus mengukur tayangan televisi dengan sejumlah
sampel berbeda di seluruh Amerika Serikat. Langkah pertama adalah
mengembangkan sampel yang representatif. Ini harus dilakukan dengan proses
seleksi acak yang ditarik secara ilmiah. Tidak ada sukarelawan yang dapat diterima
atau akurasi statistik sampel akan terancam. Secara nasional, ada 5000 rumah tangga
televisi di mana meter elektronik (disebut People Meter) terpasang ke setiap TV,
VCR, kotak konverter kabel, parabola atau peralatan video lainnya di rumah. Meteran
terus merekam semua penyetelan yang disetel. Selain itu, kami meminta setiap
anggota rumah tangga tertentu untuk memberi tahu kami, ketika mereka menonton,
dengan menekan tombol yang telah ditentukan sebelumnya pada Pengukur Orang
yang juga ada. Dengan mencocokkan aktivitas tombol ini dengan informasi
demografis (usia/jenis kelamin) yang kami kumpulkan pada saat pengukur dipasang,
kami dapat mencocokkan penyetelan yang disetel—apa yang sedang ditonton—
dengan siapa yang menonton. Semua data ini ditransmisikan ke komputer Nielsen
Media Research di mana mereka diproses dan dirilis ke pelanggan kami setiap hari.
Selain layanan nasional ini, kami memiliki sistem pengukuran yang sedikit
berbeda di 55 pasar lokal. Di setiap pasar tersebut, Nielsen Media Research hanya
mengumpulkan informasi penyetelan setiap hari dari lebih dari 20.000 rumah
tambahan. Kami kemudian memproses data dan merilis apa yang kami sebut
"peringkat rumah tangga" setiap hari. Dalam hal ini kami dapat melaporkan saluran
atau program apa yang sedang ditonton, tetapi kami tidak memiliki bagian "siapa" dari
gambar tersebut. Untuk mengumpulkan informasi demografis lokal, kami secara
berkala (setidaknya empat kali per tahun) meminta sekelompok orang lain untuk
berpartisipasi dalam survei buku harian kami. Untuk perkiraan ini, kami menghubungi
orang-orang dari sekitar 1 juta rumah setiap tahun dan meminta mereka untuk melacak
menonton televisi selama satu minggu, merekam aktivitas menonton TV mereka
dalam buku harian. Ini dilakukan untuk semua 210 pasar televisi di Amerika Serikat
pada bulan November, Februari, Mei, dan Juli dan umumnya disebut sebagai
"sapuan".
Dua masalah yang sekarang dihadapi peneliti: (1) Bagaimana dia menggambar
sampel acak yang lebih sederhana, dan (2) bagaimana dia dapat memperkirakan
berbagai parameter populasi yang diinginkan? Topik- topik ini dibahas di bagian
berikut.

4.2 Bagaimana Menarik Sampel Acak Sederhana


Untuk menarik sampel acak sederhana dari populasi yang diinginkan tidak
semudah itu mungkin pertama kali muncul. Bagaimana kita dapat mengambil sampel
dari suatu populasi sedemikian rupa sehingga setiap sampel yang mungkin berukuran
n memiliki peluang yang sama untuk terpilih? Kita mungkin menggunakan penilaian
kita sendiri untuk "secara acak" memilih sampel. Teknik ini sering disebut sampling
serampangan. Teknik kedua, sampling representatif, melibatkan memilih sampel yang
kita anggap khas atau mewakili populasi. Pengambilan sampel yang serampangan dan
representatif tunduk pada bias penyidik, dan, lebih penting lagi, mereka mengarah
pada penduga yang sifatnya tidak dapat dievaluasi. Dengan demikian, tidak ada teknik
yang mengarah ke sampel acak sederhana.

Sampel acak sederhana dapat dipilih dengan menggunakan tabel angka acak.
Sebuah tabel bilangan acak ditunjukkan pada Lampiran A, Tabel A.2. Nomor acak
tabel adalah himpunan bilangan bulat yang dihasilkan sehingga dalam jangka panjang
tabel akan berisi semua sepuluh bilangan bulat (0, 1, . . , 9) dalam proporsi yang kira-
kira sama, tanpa tren dalam pola digit yang dihasilkan. Jadi, jika satu nomor dipilih
dari acakntitik dalam tabel, kemungkinannya sama untuk menjadi salah satu digit 0
hingga 9.

Memilih angka dari tabel dianalogikan dengan menggambar angka dari topi berisi
angka-angka itu pada potongan kertas yang tercampur rata. Misalkan kita ingin sampel
acak sederhana dari tiga orang untuk dipilih dari tujuh. Kita bisa menghitung orang
dari 1 sampai 7, letakkan secarik kertas yang berisi angka-angka ini (masing-masing
satu angka) slip) ke dalam topi, campur, dan tarik tiga, tanpa mengganti nomor yang
ditarik. Secara analog, kita bisa menjatuhkan titik pensil pada titik awal acak di
Lampiran A, Tabel A.2. Misalkan titik jatuh pada baris ke15 kolom 9 dan kami
memutuskan untuk menggunakan digit paling kanan (5, dalam hal ini). Prosedur ini
seperti menggambar 5 dari topi. Kita sekarang dapat melanjutkan ke segala arah untuk
mendapatkan nomor yang tersisa dalam sampel. Sup pose yang kami putuskan
sebelum mulai melanjutkan ke bawah halaman. Nomornya segera di bawah 5 adalah
2, jadi sampel kedua kami adalah nomor 2. Lanjutkan, kami selanjutnya datang ke 8,
tetapi hanya ada tujuh orang dalam populasi kami; maka, 8 harus diabaikan. Dua 5
lagi kemudian muncul, tetapi keduanya harus diabaikan karena orang 5 memiliki
sudah dipilih. (5 telah dihapus dari topi.) Akhirnya, kita sampai pada 1, dan sampel
kami yang terdiri dari tiga orang diisi dengan orang-orang bernomor 5, 2, dan 1.

Contoh 4.1

Untuk penyederhanaan, asumsikan ada N = 1000 catatan pasien dari mana sampel
acak n = 20 akan diambil. Kita tahu bahwa sampel acak sederhana akan diperoleh jika
setiap sampel yang mungkin dari n = 20 catatan memiliki peluang yang sama untuk
menjadi terpilih. Digit dalam Lampiran A, Tabel A.2, dan tabel bilangan acak lainnya,
dibangkitkan untuk memenuhi kondisi pengambilan sampel acak sederhana.
Menentukan rekaman mana yang akan dimasukkan dalam sampel berukuran n = 20.
Perhatikan bahwa titik awal apa pun dapat digunakan dan kita dapat bergerak di
tempat yang telah ditentukan sebelumnya arah. Jika lebih dari satu sampel yang akan
digunakan dalam masalah apapun, masing-masing harus memiliki titik awal yang
unik. Banyak program komputer, seperti MINITAB, dapat digunakan untuk
menghasilkan angka acak.

Solusi

Kita dapat menganggap akun sebagai nomor 001, 002, . . . ,999.000. Artinya, kita
memiliki 1000 nomor tiga digit, di mana 001 mewakili catatan pasien pertama, 999
Catatan pasien ke-999, dan 000 ke- 1000.
Lihat Lampiran A, Tabel A.2 dan gunakan kolom pertama; jika kita membuang dua
angka terakhir dari setiap angka, kita melihat bahwa angka tiga angka pertama yang
terbentuk adalah 104, yang kedua adalah 223, yang ketiga adalah 241, dan seterusnya.
Mengambil sampel acak 20digit, kami memperoleh angka-angka yang ditunjukkan pada
Tabel 4.1.
Jika catatan benar-benar diberi nomor, kami hanya memilih catatan dengan nomor
yang sesuai, dan catatan ini mewakili sampel acak sederhana sebanyak n=20 dari
N=1000 . Jika rekening pasien tidak diberi nomor, kita dapat merujuk ke daftar akun
dan hitung dari tanggal 1 hingga 10, 23, 70, dan seterusnya, hingga angka yang
diinginkan tercapai. Jika bilangan acak muncul dua kali, kemunculan kedua adalah
dihilangkan, dan nomor lain dipilih sebagai penggantinya.
Tabel 4.1 catatan pasien yang terpilih menjadi sampel
104 779 289 510
223 995 635 023
241 963 094 010
421 895 103 521
375 854 071 070

4.3 Estimasi Rata-rata dan Total Populasi


Kami telah menyatakan sebelumnya bahwa tujuan pengambilan sampel survei adalah
untuk menarik kesimpulan tentang suatu populasi dari informasi yang terkandung
dalam sampel. Salah satu cara untuk membuat inferensi adalah dengan mengestimasi
parameter populasi tertentu dengan menggunakan informasi sampel. Tujuan dari
survei sampel sering kali untuk memperkirakan rata-rata populasi, dilambangkan
dengan μτσ, atau total populasi, dilambangkan dengan τ. Jadi, auditor dalam Contoh
4.1 mungkin tertarik pada nilai dolar rata-rata untuk piutang atau total dolar jumlah
dalam akun-akun ini. Oleh karena itu, kami mempertimbangkan estimasi dua populasi
parameter, μ dan τ, di bagian ini.
Misalkan sampel acak sederhana dari n diambil, dan kita memperkirakan nilai rata-
rata per akun untuk total populasi catatan rumah sakit. Secara intuitif, kami
menggunakan rata-rata sampel
n

∑ yi
y= i=1
n
untuk memperkirakan μ. Penaksir ini dapat dibenarkan sebagai penduga yang tepat
dengan merujuk untuk diskusi dan contoh di Bagian 3.3. Pengambilan sampel acak
sederhana setara untuk pengambilan sampel acak tanpa penggantian dan dengan bobot
yang sama, seperti yang dijelaskan di sana. Untuk skema pengambilan sampel seperti
n
itu π i= dan penaksir populasi yang tidak bias total, τ, diberikan oleh
N
n n
yi y
τ^ =∑ =¿ ∑ i =N y ¿
i=1 π i i=1 n /N

Karena mean populasi berhubungan dengan total dengan persamaan τ/N = μ, mean
sampel akan menjadi penaksir tak bias dari mean populasi. Itu adalah,

E ( y )=μ

Tentu saja, nilai tunggal dari y memberi tahu kita sangat sedikit tentang rata-rata
populasi μ, kecuali jika kita mampu mengevaluasi kebaikan penduga kita. Oleh karena
itu, selain menaksir μ, kita ingin memberi batasan pada galat pendugaan. Untuk
mencapai ini kita membutuhkan varians dari estimator; untuk sampel acak sederhana
yang dipilih tanpa penggantian dari populasi berukuran N,

( )
2
σ N −n
V ( y )=
n N−1
Mempertimbangkan varians sampel
n
1
s2= ∑ ( y − y )2
n−1 i=1 i

Dapat ditunjukkan (lihat Lampiran A, Turunan) bahwa


N
E ( s )=
2 2
σ
N −1

Sehingga V ( y ) dapat diperintahkan secara tidak bias dari sampel dengan


( )
2
^ ( y )= 1− n s Varians estimator sama dengan yang diberikan dalam kursus
V
N n
pengantar kecuali bahwa itu dikalikan dengan faktor koreksi untuk menyesuaikan
pengambilan sampel dari populasi yang terbatas. Faktor koreksi memperhitungkan fakta
bahwa perkiraan berdasarkan sampel n = 10 dari populasi N = 20 item berisi lebih
banyak informasi tentang populasi daripada sampel n = 10 dari populasi N = 20.000.

Kembali ke contoh di Bagian 3.3 di mana sampel berukuran n = 2 dipilih dari populasi
{1, 2, 3, 4}, sekarang kita dapat mendemonstrasikan sifat rata-rata sampel yang
dijelaskan dalam rumus ini. Tabel 4.2 menunjukkan enam kemungkinan sampel ukuran 2
dan statistik sampel terkait. (Tiga kolom pertama dari tabel ini identik dengan yang ada
di Tabel 3.2.)

Jika satu pengamatan y dipilih secara acak dari populasi ini, maka y dapat mengambil
salah satu dari empat nilai yang mungkin, masing- masing dengan probabilitas 1⁄4.
Dengan demikian,

μ=E ( y )=∑ yp ( y ) =¿ 1 ( 14 )+ 2( 14 )+3( 14 )+ 4( 41 ) ¿


¿ ( 14 ) ( 1+2+3+ 4)
1
¿ ( 10 )
4

¿ 2.50

Tabel 4.2
Pengambilan sampel acak sederhana dari populasi, n=2
Sampel Probabilitas sampel, bobot yang sama τ^ y 2
s ^ ( y)
V
{1,2} 1/6 6 1.5 0.5 0.125
{1,3} 1/6 8 2.0 2.0 0.500
{1,4} 1/6 10 2.5 4.5 1.125
{2,3} 1/6 10 2.5 0.5 0.125
{2,4} 1/6 12 3.0 2.0 0.500
{3,4} 1/6 14 3.5 0.5 0.125
Dan
σ =V ( y )=E( y−μ) =∑ ( y−ω ) p ( y )
2 2 2

¿(1−2.5)2 ( 14 )+(2−2.5) ( 14 )+(3−2.5) +(4−2.5) ( 14 )


2 2 2

5
¿
4

Karena masing-masing rata-rata sampel ini dapat terjadi dengan probabilitas 16, kita
dapat menghitung 𝐸 ( y ) dan 𝑉( y ) . Dari definisi kami tentang nilai yang diharapkan,

E ( y )=∑ y p ( y )

¿ ( 1.5 ) ( 16 )+ ( 2.0) ( 16 )+ (2.5 ) ( 16 )+( 2.5 )( 61 )+( 3.0) ( 16 )+(3 , 5)( 16 )


¿ 2.50

¿μ

dan

V ( y )=E ( y−μ) =∑ ( y−μ) p ( y )


2 2

¿ ( 1.5−2.5 )2 ( 16 )+( 2.0−2.5) ( 16 )+ (2.5−2.5) ( 16 )+ ( 2.5−2.5 ) ( 16 )+( 3.0−2.5) ( 61 )+( 3.5−2.5) ( 16 )


2 2 2 2 2

¿ ( 2.5 ) ( 16 )
5
¿
12
Perlu diingat kembali bahwa untuk contoh ini σ = 5/4, N = 4, dan n = 2, kita memiliki

( ) ( )
2
σ N −n 5 /4 4−2
=
n N −1 2 4−1

¿ ( )=
5 2 5
8 3 12
Mempertimbangkan variansi sampel, dengan

E ( s2 ) =
( 0.5+ 2.0+4.5+ 0.5+2.0+0.5 ) 5
6
=
3 ()
¿ ( NN−1 ) σ 2

Juga,
(0.125+0.5+1.125+ 0.125+0.5+ 0.125) 5
E ( V^ ( y ) ) = =
6 12
¿V ( y)
Jadi, telah ditunjukkan bahwa

( )
2
σ N−n
E ( y )=μV ( y )=
n N−1
^ ( y ) adalah penaksir tak bias dari V ( y ). Hasil akhir dari bagian ini dapat diringkas
Dan untuk V
sebagai berikut.
Penduga rata-rata populasi μ:
n

∑ yi (4.1)
^μ= y= i=1
n
Varians yang diperkirakan pada (𝒚̅):
(4.2)
( )
2
^ ( y )= 1− n s
V
N n
Bound on the error pada estimasi:
(4.3)
2 √V^ ( y)=2
√( 1−
n s2
N n )
Kuantitas 1 – n/N disebut koreksi populasi hingga (fpc). Perhatikan bahwa faktor koreksi
ini sedikit berbeda dari yang ditemui dalam varians sebenarnya dari y. Ketika n tetap kecil relatif
terhadap ukuran populasi N, fpc mendekati satu. Secara praktis, fpc dapat diabaikan jika 1 – n/N
≥ .95, atau ekuivalen n ≤ (1/20) N, Dalam hal itu, varians yang diperkirakan dari y adalah
kuantitas yang lebih dikenal s 2 /n. Dalam banyak kasus, ukuran populasi tidak didefinisikan
dengan jelas atau tidak diketahui. Misalkan spesimen laboratorium yang sangat kecil dipilih dari
tangki besar gula mentah untuk mengukur kadar gula murni. Bagaimana N akan ditentukan tidak
jelas, tetapi secara umum dapat diasumsikan cukup besar. Oleh karena itu, fpc dapat diabaikan.
Jika sampel pemilih dipilih dari populasi suatu negara bagian, untuk mendapatkan N yang tepat
untuk titik waktu tersebut umumnya tidak mungkin. Sekali lagi, N dianggap besar dan fpc
diabaikan.
Beberapa tulisan menyajikan fpc sebagai (N - n)/N; lebih baik 1 – n/N karena ini
menyoroti peran fraksi pengambilan sampel n/N. Fraksi sampling sering dilambangkan dengan f
= n/N, dalam hal ini fpc dapat direpresentasikan sebagai 1 - f. Nanti di buku ini, ketika rumus
menjadi lebih rumit, dan singkatnya rumus menjadi lebih menarik, kita akan beralih ke notasi
terakhir ini.
Secara teori, jika dua standar deviasi bound on the error (sering disebut margin
kesalahan) dikurangkan dari dan ditambahkan ke mean sampel, interval kepercayaan yang
dihasilkan memiliki sekitar 95% peluang untuk menangkap mean populasi dalam batas-batasnya.
Hasil ini dibangun di atas teori yang mengharuskan rata-rata sampel yang bersangkutan memiliki
distribusi yang mendekati normal. Untuk mengilustrasikan cara kerjanya, kita kembali ke data
berat otak di Bagian 3.4 Gambar 3.4 menunjukkan bahwa, untuk data pada skala asli, distribusi
pengambilan sampel untuk rata-rata sampel ukuran 5 sangat miring. Gambar 3.6 menunjukkan
bahwa, untuk data dalam skala logaritmik, distribusi sampling rata-rata sampel terlihat cukup
normal. Bagaimana perilaku distribusi sampling ini?
Gambar 4.1
Interval kepercayaan untuk sampel dengan bobot, n=5
Gambar 4.2
Interval kepercayaan untuk sampel dengan bobot log, n=5

Tercermin dalam kinerja interval kepercayaan? Gambar 4.1 menunjukkan 50 interval


kepercayaan yang dibangun dari sampel acak berukuran 5 dengan dua standar deviasi yang
terikat pada kesalahan menggunakan data populasi asli untuk bobot otak. Hanya 28 interval
(56%) yang mencakup rata-rata populasi sebenarnya dari 394,5; banyak interval terlalu pendek
dan terletak terlalu jauh ke kiri.
Menggunakan metode yang sama pada data log-transformed menghasilkan interval pada
Gambar 4.2. Di sini, 48 dari interval yang dihitung (96%) mencakup rata-rata populasi 2,98.
Perbedaan yang cukup jauh! Tidak hanya itu, interval pada Gambar 4.2 juga lebih seragam
panjangnya. Pesan yang dapat dipetik adalah bahwa hasil dari bagian ini tidak akan berjalan
dengan baik kecuali ada jaminan yang memadai bahwa sampel yang diteliti memiliki distribusi
sampling yang tidak terlalu jauh dari normal. Tentu saja, itu pada dasarnya dapat dijamin jika
ukuran sampelnya besar. Anda dapat mempelajari sendiri pengambilan sampel populasi asli dan
populasi yang ditransformasi log menggunakan alat pengambilan sampel yang ditemukan di
Bagian 4.0 elektronik. Bootstrapping (Bagian 11.9) adalah opsi lain; lihat di Bagian 11.0
elektronik untuk alat bootstrap sampel tunggal.
Contoh 4.2
Mengacu pada audit rumah sakit pada Contoh 4.1. Misalkan sampel acak n = 200 akun dipilih
dari total populasi N = 1000. Rata-rata sampel dari akun-akun tersebut adalah y=$ 94.22 , dan
varians sampelnya adalah s2=445.21. Estimasi μ, rata-rata jatuh tempo untuk semua 1000
rekening rumah sakit, dan beri batasan pada bound on the error pada estimasinya.
Solusi
Digunakan y=$ 94.22 untuk memperkirakan μ. Sebuah batas pada kesalahan estimasi dapat
ditemukan dengan menggunakan Persamaan (4.3):

2 √ V^ ( y)=2
√( 1− )
n s2
N n
= (√ 1− 1000 ) 200 =2√ 1.7808=$ 2.67
200 445.21

Jadi, estimasi nilai rata-rata per akun, μ, menjadi y=$ 94.22 . Karena n adalah besar, rata-rata
sampel harus memenuhi kurang lebih distribusi normal, jadi $94.22 ± $2.67 interval kepercayaan
95% untuk rata-rata populasi.
Contoh 4.3
Sebuah sampel acak sederhana dari n = 9 catatan rumah sakit diambil untuk memperkirakan
jumlah rata-rata uang yang harus dibayar pada N = 484 rekening terbuka. Nilai sampel untuk
sembilan ini catatan tercantum dalam Tabel 4.3. Perkirakan μ, jumlah rata-rata yang belum
dibayar, dan tingkat kesalahan estimasi Anda.
Tabel 4.3
Jumlah uang yang terhutang
y1 33.50
y2 32.00
y3 52.00
y4 43.00
y5 40.00
y6 41.00
y7 45.00
y8 42.00
y9 39.00

Gambar 4.3
Box plot dari perhitungan data rumah sakit

Solusi
Seperti yang disarankan oleh analisis data yang baik, selalu bijaksana untuk membuat plot yang
sesuai dari data untuk melihat apakah sesuatu yang tidak biasa muncul. Gambar 4.3
menunjukkan box plot dari data tersebut, yang menunjukkan bahwa dua pengamatan agak tidak
biasa, dibandingkan dengan yang lain, satu di sisi yang tinggi dan satu di sisi yang rendah.
Mungkin penyelidik harus melihat kedua perhitungan ini lagi untuk melihat apakah keduanya
mewakili sesuatu yang berbeda dari perhitungan lain dalam sampel.
Perkiraan untuk 𝜇 adalah
9

∑ yi 368.00
y= i=1 = =$ 40.89
9 9

Untuk menemukan batas pada kesalahan estimasi, kita harus menghitung


n
s2=∑ ¿ ¿ ¿
i =1

dan gunakan Persamaan. (4.3) untuk mendapatkan batas kesalahan estimasi:

2 √ V^ ( y)=2
√( 1− )
n s2
N n
= (√ 1− 1000 ) 200
200 445.21

¿ 2 √ 3.8900=3.944=$ 3.94
Untuk meringkas perkiraan jumlah rata-rata uang yang terhutang per rekening , μ adalah
y=$ 40.89. Meskipun kami tidak dapat memastikan seberapa dekat y dengan μ, kami cukup
yakin bahwa kesalahan estimasi kurang dari $3.94.

Seperti yang telah kita lihat, banyak survei sampel dilakukan untuk memperoleh
informasi tentang total populasi. Auditor federal dalam Contoh 4.1 mungkin akan tertarik untuk
memverifikasi angka komputer untuk total piutang (dalam dolar) untuk N = 1000 akun terbuka.
Jumlah populasi dilambangkan dengan simbol τ. Karena

Nμ=r
kita tahu bahwa penaksir τ adalah N kali penaksir μ. Juga benar bahwa margin kesalahan untuk
memperkirakan total adalah N kali margin kesalahan untuk memperkirakan rata-rata.

Penaksir total populasi 𝑟:


n
N ∑ yi (4.4)
i =1
τ^ =N y=
n
Taksiran varians 𝑟:
(4.5)

( )( )
2 (4.4)
^ ( N y )=N 2 1− n
^ ( τ^ ) =V
V
s
N n
Bound on the error pada estimasi:
(4.6)

√ ( )( )
2
n s (4.4)
2 √ V^ (N y)=2 N 1−
2
N n
Contoh 4.4
Sebuah perusahaan industri khawatir tentang waktu yang dihabiskan setiap minggu oleh para
ilmuwan tertentu yang lembur untuk tugas-tugas biasa. Lembar catatan waktu dari sampel acak
sederhana n = 50 karyawan menunjukkan jumlah rata-rata waktu yang dihabiskan untuk tugas-
tugas ini adalah 10.13 jam, dengan varians sampel s2=2.25 . Perusahaan mempekerjakan N = 750
ilmuwan. Estimasikan jumlah total jam kerja yang hilang setiap minggu untuk tugas biasa dan
beri batasan pada bound on the error pada estimasinya.
Solusi
Kita tahu populasinya terdiri dari N = 750 ilmuwan yang berasal dari sampel acak diperoleh n =
50 lembar catatan waktu. Jumlah rata-rata waktu yang hilang untuk 50 karyawan y=10.31
jam/minggu. Karena itu, estimasi dari τ adalah
τ =N y=750 ( 10.31 )=7732.5 jam
Kedudukan bound on the error pada estimasi, gunakan Persamaan (4.7) untuk memperoleh
2 √V^ ( τ^ )=2 √ ¿ ¿
Dengan demikian, estimasi total waktu yang hilang adalah τ^ = 7732.5 jam. Maka diyakini bahwa
kesalahan estimasi kurang dari 307.4 jam.
4.4 Memilih Ukuran Sampel untuk Memperkirakan Rata-rata dan total Populasi
Pada titik tertentu dalam desain survei, seseorang harus membuat keputusan tentang
ukuran sampel yang akan dipilih dari populasi. Kita telah membahas prosedur pengambilan
sampel (sampling acak sederhana) tetapi tidak mengatakan apa pun tentang jumlah pengamatan
yang akan dimasukkan dalam sampel. Implikasi dari keputusan seperti itu jelas. Observasi
membutuhkan uang. Jika sampel terlalu besar, waktu dan tenaga akan terbuang percuma.
Sebaliknya, jika jumlah pengamatan yang dimasukkan dalam sampel terlalu kecil, kita telah
memberikan informasi yang tidak memadai untuk waktu dan usaha yang dikeluarkan lagi-lagi
menjadi pemborosan.
Jumlah pengamatan yang diperlukan untuk memperkirakan rata- rata populasi 𝜇 dengan
bound on the error pada estimasi besarnya B ditemukan dengan menetapkan 2SD dari estimator,
y sama dengan B dan selesakan pernyataan ini untuk n. Artinya, kita haruss memecahkan

(4.7)
2 √ V ( y)=B

Untuk n
^ ( y ), diberikan oleh
Ingatlah bahwa varians yang diperkirakan dari y , V

( )
2
^ ( y )= 1− n s
V (4.8)
N n
Juga,

( )
2
( ) σ N −n (4.9)
V y=
n N−1
Anda mungkin mengenali Persamaan. (4.9) dari pelajaran yang dikenal dengan pengantar
varians dari y , σ 2 /n, dikalikan dengan faktor
( N −n)
( N −1)

Ukuran sampel yang dibutuhkan sekarang dapat ditemukan dengan memecahkan persamaan
berikut untuk n:


(4.10)
2 √ V ( y)=2 (
σ 2 N −n
n N−1
=B )
Solusinya diberikan dalam Persamaan. (4.11).

Ukuran sampel yang diperlukan untuk memperkirakan 𝝁 dengan bound on the error
pada estimasi B:
2
Nσ (4.11)
n=
( N −1 ) D+ σ 2
dimana
2
B
D=
4

Solusi untuk 𝑛 dalam situasi praktis menghadirkan masalah karena varians populasi 𝜎2
tidak diketahui. Karena varians sampel 𝑠2 sering tersedia dari eksperimen sebelumnya, kita
dapat memperoleh perkiraan ukuran sampel dengan mengganti 𝜎2 dengan 𝑠2 dalam Persamaan
(4.11). Kami mengilustrasikan metode untuk menebak nilai 𝜎2 ketika sangat sedikit informasi
sebelumnya yang tersedia. Jika 𝑁 memiliki nilai yang besar, maka (𝑁 − 1) dapat diganti dengan
𝑁 dalam penyebut Persamaan (4.11).

Contoh 4.5
Jumlah rata-rata uang µ untuk piutang rumah sakit harus diestimasi. Meskipun tidak ada data
sebelumnya yang tersedia untuk memperkirakan varians populasi, diketahui bahwa sebagian
besar rekening berada dalam kisaran $100. Ada N=1000 rekening terbuka. Tentukan ukuran
sampel yang diperlukan untuk memperkirakan μ dengan bound on the error pada estimasi B =
$3.
Solusi
Kami membutuhkan estimasi 𝜎2, varians populasi. Karena rentang sering kali sama dengan
4SD (4𝜎), seperempat dari rentang akan memberikan nilai estimasi 𝜎. Karena itu,
Range 100
σ≈ = =25
4 4
dan
2
σ ≈¿
menggunakan persamaan (4.11), kita peroleh
2

n=
( N −1 ) D+ σ 2
dimana
2
B
D= =¿ ¿
4

jadi

1000(625)
n= =217.56
999 (2.25 )+ 625
Artinya, kita membutuhkan sekitar 218 pengamatan untuk memperkirakan 𝜇, rata-rata
perhitungan piutang, dengan bound on the error pada estimasi sebesar $3,00. Perhatikan bahwa
alat akan menunjukkan ukuran sampel 213 untuk interval kepercayaan 95% dengan margin
kesalahan $3.
Demikian juga, kita dapat menentukan jumlah pengamatan yang diperlukan untuk
memperkirakan total populasi 𝑟,dengan terikat pada kesalahan estimasi besarnya 𝐵. Ukuran
sampel yang diperlukan ditemukan dengan menetapkan 2SD penduga sama dengan 𝐵 dan
selesaikan ekspresi ini untuk n. Artinya, kita harus memecahkan
2 √ V ( N y )=B
atau, sama dengan
2 N √ V ( y)=B (4.12)

Ukuran sampel yang diperlukan untuk memperkirakan 𝑟 dengan kesalahan terikat B :


2

n=
( N −1 ) D+ σ 2 (4.13)
dimana
2
B
D= 2
4N

Contoh 4.6
Seorang peneliti tertarik untuk memperkirakan kenaikan berat badan total dalam 4 minggu untuk
N = 1000 anak ayam yang diberi ransum baru. Jelas, untuk menimbang satu per satu setiap anak
ayam akan memakan waktu dan membosankan. Oleh karena itu, tentukan jumlah anak ayam
yang akan dijadikan sampel dalam penelitian ini agar dapat diperkirakan τ dengan bound on the
error pada estimasi sebesar 1000 gram. Banyak penelitian serupa tentang nutrisi anak ayam telah
dilakukan di masa lalu. Menggunakan data dari studi ini, peneliti menemukan bahwa 𝜎2, varians
populasi kira-kira sama dengan 36,00 (gram)2. Tentukan ukuran sampel yang dibutuhkan.
Solusi
Kita dapat memperoleh perkiraan ukuran sampel menggunakan Persamaan. (4.13) dengan 𝜎2
sama dengan 36.00 dan
2 2
B 1000
D= = =0.25
4 4(1000)2
Yaitu,
2
Nσ 1000(36.00)
n= = =125.98
( N −1 ) D+ σ 999 ( 0.25 ) +36.00
2

Oleh karena, itu peneliti perlu menimbang n = 126 anak ayam untuk memperkirakan τ ,
pertambahan berat badan total untuk n = 1000 ekor ayam dalam 0 sampai 4 minggu, dengan
bound on the error pada estimasi sebesar 1000 gram. Perhatikan bahwa alat akan menunjukkan
ukuran sampel 123 untuk interval kepercayaan 95% dengan margin kesalahan 1000 gram.

4.5 Estimasi Proporsi Penduduk


Penyidik yang melakukan survei sampel sering kali tertarik untuk memperkirakan proporsi
populasi yang memiliki karakteristik tertentu. Misalnya, seorang pemimpin kongres sedang
menyelidiki manfaat dari usia pemilih 18 tahun. Penelitian ini dilakukan untuk memperkirakan
proporsi pemilih potensial di distrik antara usia 18 dan 21 tahun. Sebuah kelompok riset
pemasaran mungkin tertarik pada proporsi total pasar penjualan dalam persiapan diet yang
disebabkan oleh produk tertentu. Artinya, berapa persentase penjualan yang dicatat oleh produk
tertentu? Seorang pengelola hutan mungkin tertarik pada proporsi pohon dengan diameter 12 inci
atau lebih. Peringkat televisi sering kali ditentukan dengan memperkirakan proporsi masyarakat
yang menonton program tertentu.
Anda akan menyadari bahwa semua contoh ini menunjukkan karakteristik percobaan
binomial, yaitu pengamatan termasuk atau tidak termasuk dalam kategori minat. Misalnya, kita
dapat memperkirakan proporsi pemilih yang memenuhi syarat di suatu kabupaten tertentu
dengan memeriksa data sensus penduduk untuk beberapa daerah di dalam kabupaten tersebut.
Perkiraan proporsi pemilih berusia antara 18 dan 21 tahun untuk seluruh distrik akan menjadi
fraksi pemilih potensial dari daerah sampel yang termasuk dalam rentang usia ini.
Kami menunjukkan proporsi populasi dan penaksirnya masing-masing dengan simbol p
dan ^p. Sifat-sifat ^p untuk pengambilan sampel acak sederhana sejajar dengan rata-rata sampel
jika pengukuran respons didefinisikan sebagai berikut. Misalkan y i=0 jika elemen ke-i yang
diambil sampelnya tidak memiliki karakteristik yang ditentukan dan y i=1 jika memilikinya.
Maka jumlah total elemen dalam sampel berukuran n yang memiliki karakteristik tertentu adalah
n

∑ yi
i=1

Jika kita mengambil suatu sampel acak sederhana berukuran n , proporsi sampel ^padalah
fraksi dari unsur-unsur dalam sampel yang memiliki karakteristik yang diinginkan. Misalnya,
estimasi ^p dari proporsi pemilih yang berhak antara usia 18 dan 21 tahun di suatu distrik tertentu
adalah
jumlah pemilih yang dijadikan sample antara usia18 dan 21 tahun
^p=
jumlah pemilih yang dijadikan sampel
Atau
n

∑ yi
^p= i=1 = y
n
Dengan kata lain, 𝑝̂ adalah rata-rata dari nilai 0 dan 1 dari sampel. Demikian pula, kami dapat
menganggap proporsi populasi sebagai rata- rata dari nilai 0 dan 1 untuk seluruh populasi
(yaitu, ρ=μ ).

Penaksir proporsi populasi p:


n

∑ yi
^p= y= i=1
n (4.14)
Estimasi Varinsi ^p:

V (
^ = ( ^p )= 1− n ^p q^
N n−1 ) (4.15)
dimana:
q^ =1− ^p
Terikat pada kesalahan estimasi:

2 √V^ ( ^p )=2 (√ 1− Nn ) n−1


^p q^
(4.16)

Biasanya di sebagian besar teks statistik menggunakan var ( ^p )= ^p q^ /n sedangkan kami telah
menggunakan n−1 sebagai penyebut di sini. Estimasi variansi populasi yang tidak bias adalah
n
p^ q^ , dan ketika Anda membaginya dengan n dengan cara biasa untuk rata-rata sampel,
n−1
hasilnya seperti yang telah kami tunjukkan. Penaksir yang umum digunakan memang bias,
sedikit, tetapi konstruksinya lebih sederhana. Bias dalam penaksir yang umum digunakan
biasanya sangat kecil, jadi penggunaan formulasi yang lebih sederhana memiliki daya tarik yang
dapat dimengerti, tetapi kami telah memilih untuk menggunakan statistik yang tidak bias.

CONTOH 4.7
Sebuah sampel acak sederhana dari n=100 senior perguruan tinggi dipilih untuk memperkirakan
(1) fraksi dari N=300 senior yang melanjutkan ke sekolah pascasarjana dan (2) fraksi siswa yang
memiliki pekerjaan paruh waktu selama kuliah. Misalkan y i dan x i (i=1 , 2 ,. . . ,100 ) menyatakan
jawaban dari sampel siswa ke-i. Kami akan menetapkan y i=0 jika siswa ke-i tidak berencana
untuk menghadiri sekolah pascasarjana dan yi = 1 jika dia melakukannya. Demikian pula,
misalkan x i=0 jika dia tidak pernah bekerja paruh waktu selama kuliah dan x i=1 jika dia pernah.
Dengan menggunakan data sampel yang disajikan dalam tabel terlampir, perkirakan p1, proporsi
senior yang berencana untuk menghadiri sekolah pascasarjana, dan p2, proporsi senior yang
pernah memiliki pekerjaan paruh waktu selama karir kuliah mereka (termasuk musim panas).
Siswa y x
1 1 0
2 0 1
3 0 1
4 1 1
5 0 0
6 0 0
7 0 1
. . .
. . .
. . .
96 0 1
97 1 0
98 0 1
99 0 1
100 1 1
100 100

∑ yi =15 ∑ yi =65
i=1 i=1

SOLUSI
Solusi proporsi sampel dari persamaan. (4.14) di berikan oleh
n

∑ y i 15
^p1= i=1 = =0.15
n 100
dan
n

∑ yi 65
^p2= i=1 = =0.65
n 100
Batas kesalahan pendugaan p1 dan p2 berturut-turut adalah

2 √ V^ (p 1)=2
√( 1−
n ^p1 q^ 1
)
N n−1
=2 (√ 1− 100
300 )
(0.15)(0.85)
99
¿ 2 ( 0.0293 )=0.059
dan

2 √ V^ (p 2)=2
√( 1−
n ^p2 q^ 2
)
N n−1
=2
√( 1−
300)
100 (0.65)(0.35)
99
¿ 2 ( 0.0391 )=0.078
Dengan demikian, kami memperkirakan bahwa 0,15 (15%) dari senior berencana untuk
menghadiri sekolah pascasarjana, dengan batasan kesalahan estimasi sebesar 0,059 (5,9%). Kami
memperkirakan bahwa 0,65 (65%) senior telah melakukan pekerjaan paruh waktu selama kuliah,
dengan batas kesalahan estimasi sebesar 0,078 (7,8%).

Kami telah menunjukkan bahwa proporsi populasi p dapat dianggap sebagai rata-rata ( μ)
dari nilai 0 dan 1 untuk seluruh populasi. Oleh karena itu, masalah penentuan ukuran sampel
yang diperlukan untuk menaksir p ke dalam unit B harus dianalogikan dengan menentukan
ukuran sampel untuk pendugaan μ dengan batasan kesalahan estimasi B. Ingatlah bahwa ukuran
sampel yang diperlukan untuk pendugaan μ diberikan oleh
2

n=
( N −1 ) D+ σ 2 (4.17)

dimana D = B2 /4 [lihat Persamaan. (4.11)]. Ukuran sampel yang sesuai diperlukan untuk
memperkirakanp dapat ditemukan dengan mengganti 𝜎2 dalam Persamaan. (4.17) dengan
kuantitas pq.

Ukuran sampel yang diperlukan untuk mengestimasi p dengan batas kesalahan


perkiraan B:
Npq
n=
( N −1 ) D+ pq (4.18)

dimana
2
B
q=1− p dan D=
4
Dalam situasi praktis, kita tidak tahu p. Ukuran sampel perkiraan dapat ditemukan dengan
mengganti p dengan nilai perkiraan. Seringkali, perkiraan seperti itu dapat diperoleh dari survei
serupa di masa lalu. Namun, jika tidak ada informasi sebelumnya yang tersedia, kita dapat
mengganti p=0 ,5 menjadi Persamaan. (4.18) untuk mendapatkan ukuran sampel yang
konservatif (yang mungkin lebih besar dari yang dibutuhkan).

CONTOH 4.8
Pemimpin organisasi mahasiswa di sebuah perguruan tinggi ingin melakukan survei untuk
menentukan proporsi mahasiswa yang mendukung kode kehormatan yang diusulkan. Karena
mewawancarai N=2000 siswa dalam jangka waktu yang masuk akal hampir tidak mungkin,
tentukan ukuran sampel (jumlah siswa yang akan diwawancarai) yang diperlukan untuk
menaksir p dengan batas kesalahan pendugaan sebesar B=0 , 05 . Asumsikan bahwa tidak ada
informasi sebelumnya yang tersedia untuk memperkirakan p.
SOLUSI
Kami dapat memperkirakan ukuran sampel yang diperlukan ketika tidak ada informasi
sebelumnya yang tersedia dengan menetapkan p=0 ,5 dalam Persamaan. (4.18). Kita punya
2
B2 ( 0.05 )
D= = =0.000625
4 4
karenanya,
Npq
n=
( N −1 ) D+ pq
( 2000 )( 0.5 )( 0.5 ) 500
¿ =
( 1999 )( 0.000625 ) + ( 0.5 ) ( 0.5 ) 1.499
¿ 333.56
Artinya, 334 siswa harus diwawancarai untuk memperkirakan proporsi siswa yang mendukung
kode kehormatan yang diusulkan dengan terikat pada kesalahan estimasi B=0.05 .

CONTOH 4.9
Mengacu pada Contoh 4.8, misalkan, selain memperkirakan proporsi siswa yang menyukai
kode kehormatan yang diusulkan, pemimpin pemerintahan siswa juga ingin untuk
memperkirakan jumlah siswa yang merasakan pembangunan serikat siswa secara memadai
melayani kebutuhan mereka. Tentukan ukuran sampel gabungan yang diperlukan untuk survei
perkirakan, P1 proporsi yang mendukung kode kehormatan yang diusulkan, dan P2, proporsi
yang percaya serikat mahasiswa cukup melayani kebutuhannya, dengan batasan pada kesalahan
estimasi besaran B1 = 0.05 dan B2 = 0.07. Meskipun tidak ada informasi sebelumnya tersedia
untuk memperkirakan P1, sekitar 60% dari siswa percaya serikat. cukup memenuhi kebutuhan
mereka dalam survei serupa yang dijalankan tahun sebelumnya.
SOLUSI
Dalam contoh ini, kita harus menentukan ukuran sampel n yang memungkinkan kita
mengestimasi P1 dengan a terikat B1 = 0,05 dan P2 dengan B2 terikat = 0,07. Pertama, tentukan
ukuran sampel yang memenuhi setiap tujuan secara terpisah. Yang lebih besar dari keduanya
kemudian akan digabungkan ukuran sampel untuk survei untuk memenuhi kedua tujuan. Dari
Contoh 4.8, ukuran sampel diperlukan untuk memperkirakan P1 dengan terikat pada kesalahan
estimasi B1= 0,05 adalah n= 334 siswa. Kita dapat menggunakan data dari survei tahun
sebelumnya untuk menentukan ukuran sampel yang dibutuhkan untuk memperkirakan P2. Kita
punya
2
B2 ( 0.07 )
D= = =0.0001225
4 4
Dan karenanya, dengan P2=0 , 60
Npq
n=
( N −1 ) D+ pq
( 200 )( 0.6 )( 0.4 ) 480
¿ =
( 1999 )( 0.0001225 ) + ( 0.6 ) ( 0.4 ) 2.68877
¿ 178.52
Artinya, 179 siswa harus diwawancarai untuk memperkirakan p2, proporsi N = 2000 siswa yang
percaya serikat mahasiswa memenuhi kebutuhannya, dengan terikat pada kesalahan estimasi
sebesar 0,07. Ukuran sampel yang diperlukan untuk mencapai kedua tujuan dalam satu survei
adalah 334, lebih besar dari dua ukuran sampel.

4.6 Membandingkan Estimasi


Setelah mengestimasi parameter individual, seperti mean atau proporsi, kita sering ingin
membandingkan estimasi dua parameter. Pendapatan rata-rata untuk dua kelompok selama satu
tahun terakhir dapat dibandingkan dengan melihat perbedaan antara rata-rata sampel untuk
sampel acak pendapatan dari kedua kelompok. Sebagai contoh apakah Partai Republik menang
atas Demokrat dalam perlombaan kongres, hal dapat dinilai dengan melihat perbedaan antara
proporsi suara voting Partai Republik untuk dua jajak pendapat yang dilakukan beberapa
minggu terpisah.
Baik menggunakan cara atau proporsi, perbandingan biasanya dilakukan melalui
perbedaan. Dalam hal ini, hasil umum dapat dinyatakan sebelum melihat kasuskasus tertentu.
Untuk setiap dua variabel acak, 𝑦1 dan 𝑦2,
E ( y 1− y 2 ) =E ( y 1 )−E ( y 2)
Dan,
V ( y 1− y 2 ) =V ( y 1) −V ( y 2 )=2 cov ( y 1 , y 2 )

Jika y 1 dan y 2 independen, maka 2 cov ( y 1 , y 2 ) =0


Misalkan 𝑦1, … , 𝑦𝑛 adalah sampel acak dari populasi dengan mean 𝜇𝑦 dan 𝑥1, … , 𝑥𝑚 adalah
sampel acak bebas dari mean 𝜇𝑋, estimasi tak bias dari μ y −μ x adalah y−x karena
E ( y−x )= E ( y )−E ( x )=μ y μx
Lebih jauh,
V ( y−x )=V ( y )−V ( x )
dimana varians dari rata-rata sampel dapat diperkirakan seperti pada Persamaan. (4.2). Jika
kedua sampel tidak independen, beberapa informasi tentang cov ( y x ) harus tersedia.

CONTOH 4.10
Ikan menyerap merkuri saat air melewati insangnya, dan terlalu banyak merkuri membuat ikan
tidak layak untuk dikonsumsi manusia. Pada tahun 1994 negara bagian Maine mengeluarkan
peringatan peringatan kesehatan bahwa orang harus berhati-hati memakan ikan dari danau
Maine karena kadar merkuri yang tinggi. Sebelum peringatan, data tentang status danau Maine
dikumpulkan oleh Badan Perlindungan Lingkungan A.S (EPA) yang bekerja dengan negara
bagian. Ikan diambil dari sampel danau secara acak dan kandungan merkurinya diukur dalam
bagian per juta . Tabel 4.4 menunjukkan pilihan
Tabel 4.4
Kandungan merkuri di danau Maine menurut jenis dan bendungannya

Merkuri (Hg) ppm Jenis Danau Bendungan 1=ya, 0=tidak


1.050 2 1
0.230 2 1
0.100 3 0
- - -
- - -
- - -
0.430 2 1
0.160 1 0
0.490 3 0
SUMBER: R. Peck, L. Haugh, and A. Goodman, 1998, Statistical Case Studies, ASA-SIAM, 1-14

data dari sampel acak 35 danau. Danau tipe 1 bersifat oligotrofik (seimbang antara vegetasi
yang membusuk dan organisme hidup), danau tipe 2 bersifat eutrofik (laju peluruhan tinggi dan
sedikit oksigen), dan danau tipe 3 bersifat mesotrofik (antara dua keadaan lainnya). Tabel juga
menunjukkan apakah danau terbentuk di belakang bendungan. (a) Dengan membandingkan
danau tipe 1 dan 2, berapa perkiraan terbaik Anda tentang perbedaan rata-rata kadar merkuri
untuk kedua jenis danau ini? (b) Apakah ada cukup bukti untuk menyimpulkan bahwa rata-rata
kadar merkuri untuk danau tipe 2 berbeda dengan danau tipe 3?
Ringkasan statistik disediakan selanjutnya.
Type Count Mean Media Standar Deviation, s
1 4 0.22 0.20 0.103
2 15 0.74 0.68 0.582
3 16 0.50 0.44 0.272

Solusi
Langkah pertama adalah memplot data untuk melihat apakah ada pola yang tidak biasa muncul.
Gambar 4.4 menunjukkan box plot sejajar untuk pembacaan merkuri yang dibagi berdasarkan
tiga jenis danau. Ada sedikit kemiringan ke nilai yang lebih besar, dan danau tipe 2 memiliki
nilai yang lebih tinggi daripada tipe lainnya.
Gambar 4.4
Kandungan merkuri menurut jenis danau
Pencilan/outlier harus diingat saat menafsirkan hasil analisis statistik ini.
a. Untuk membandingkan rata-rata kandungan merkuri untuk danau tipe 1 dan tipe 2,
estimator dan batas yang sesuai adalah
( y 1− y 2 ± √ V^ ( y 1 ) +V^ ( y 2 ) )
¿(0.22−0.74)± 2
¿−0.52 ±0.32
4 √
0.1032 0.5 8 32
+
15

Estimasi Interval yang dihasilkan menyiratkan bahwa selisih


sebenarnya dalam rata-rata kandungan merkuri antara kedua jenis danau ini
dapat berada di mana saja antara -0,84 dan -0,20. Artinya, danau tipe 2 bisa
memiliki kandungan merkuri rata-rata antara 0,20 dan 0,84 ppm lebih tinggi
dibandingkan dengan danau tipe 1; setiap nilai perbedaan dalam interval ini
akan konsisten dengan data sampel yang diamati.
Jumlah total danau di negara bagian tersebut cukup besar, sehingga
fpcs diabaikan dalam analisis ini.
b. Untuk menjawab pertanyaan tentang bagaimana perbandingan antara danau tipe 2 dan
tipe 3, sekali lagi, kita dapat membuat perkiraan/estimasi interval yang sesuai.

( y 1− y 2 ± √ V^ ( y 1 ) +V^ ( y 2 ) )
¿(0.74−0.50)± 2

0.5 8 32 0.222
15
¿ 0.24 ± 0.33
+
16

Interval hasil pengukuran dari kedua jenis danau menunjukkan angka (-0,09 hingga
0,57) dimana interval ini mencakup nol yang mengartikan bahwa tidak ada perbedaan
signifikan dalam kandungan rata-rata merkuri antara kedua jenis danau. Berdasarkan data ini,
tidak ada cara untuk menyimpulkan bahwa salah satu jenis danau memiliki kandungan merkuri
yang lebih tinggi dari yang lain.
Analisis data yang hati-hati memerlukan pemeriksaan seberapa besar pengaruh pencilan
besar (2,50) pada data danau tipe 2 terhadap analisis. Dengan menghilangkan observasi ini,
kedua interval menjadi sedikit lebih pendek, yaitu (-0,61, -0,17) untuk bagian a dan (-0,12, 0,34)
untuk bagian b. Namun, kesimpulan utama dari bagian b tetap sama.

Ketika membandingkan rerata, kita hanya mempertimbangkan kasus sampel independen


karena kasus dependen menjadi terlalu rumit untuk ditangani pada level/tingkat ini. Namun,
ketika membandingkan proporsi, situasi dependen yang sering terjadi memiliki solusi yang
cukup sederhana. Misalkan sebuah jajak pendapat bertanya, "Apakah Anda mendukung
kebijakan luar negeri AS di Amerika Latin?" Opsi yang diberikan adalah

A. Ya ________
B. Tidak ________
C. Tidak memiliki pendapat _________

Dalam menghadapi jumlah respons "tidak memiliki pendapat" yang cukup besar, kita
ingin membandingkan proporsi yang memilih "ya" dengan proporsi yang memilih "tidak"
dengan melihat perbedaan antara jawaban tersebut. Untuk melihat ini, misalkan kita diizinkan
untuk melihat proporsi respons "ya" dan proporsinya tinggi - katakanlah sekitar 80%. Maka kita
tahu bahwa proporsi respons "tidak" harus rendah, di bawah 20%. Oleh karena itu, kedua
persentase sampel ini tidak hanya saling bergantung, tetapi juga berkorelasi negatif (atau
memiliki kovariansi negatif).

Ini adalah situasi pengambilan sampel multinomial karena setiap responden memiliki tiga
pilihan (lebih dari dua adalah kunci). Untuk dua proporsi sampel p 1 dan p 2yang muncul dari
sampel multinomial berukuran n ,

E ( ^p1− ^p2 ) = p1− p2

Dan

V ( ^p1−^p2 ) =V ¿

p 1 ( 1− p 1) p 2 ( 1− p2 ) p 1 p2
¿ + +2
n n n

(Kami mendapatkan tanda + di depan suku ketiga karena kovariansnya sendiri negatif.)
Karena pi diperkirakan oleh ^pi , mudah untuk menemukan estimator yang baik dari varians ini.

Contoh 4.11
Gagasan melarang merokok di tempat kerja telah ada sejak lama. Jajak pendapat Time/
Yankelovich terhadap 800 orang dewasa di negara A yang dilakukan pada 6–7 April 1994 (lihat
Waktu, 18 April 1994) bertanya:
Haruskah merokok dilarang dari tempat kerja, haruskah ada area khusus merokok, atau
haruskah tidak ada batasan?
Hasilnya diberikan pada Tabel 4.5. Berdasarkan sampel sekitar 600 bukan perokok dan 200
perokok, perkirakan (a) perbedaan sebenarnya antara proporsi yang memilih "larang" dan (b)
perbedaan sebenarnya antara proporsi bukan perokok yang memilih "larang" dan "area khusus".

Solusi
a. Proporsi yang memilih "dilarang" saling independen satu sama lain; nilai yang tinggi
pada satu proporsi tidak memaksa nilai yang rendah pada proporsi yang lain, karena
mereka berasal dari sampel yang independen. Dengan demikian, perkiraan yang sesuai
untuk perbedaan ini adalah
¿
¿ 0.36 ± 0.06
Jadi, perbedaan nyata antara 30% dan 42% akan konsisten dengan data ini.
b. Proporsi bukan perokok yang memilih “area khusus” bergantung pada proporsi yang
memilih “dilarang”; jika yang terakhir besar, yang pertama harus kecil.
Tabel 4.5
Hasil survei merokok
Bukan perokok Perokok

Dilarang 44% 8%

Daerah khusus 52% 80%

Tidak ada batasan 3% 11%

Ini adalah proporsi multinomial. Oleh karena itu, estimasi/perkiraan yang tepat
dari selisih/perbedaan sebenarnya adalah:
(0.52−0.44) ±2
√ (0.44)(0.56) (0.52)(0.4 8) (0.44)(0.52)
600
+
¿ 0.0 8 ± 0.0 8
600
+
600

Perbedaan nyata antara 0% dan 16% akan konsisten dengan data ini. Secara khusus, tidak
ada bukti kuat yang mengatakan bahwa, untuk populasi, kedua proporsi ini akan berbeda.

Telah dicatat bahwa batas 2SD pada kesalahan setara dengan perkiraan interval
kepercayaan sekitar 95%. Namun, jika dua interval seperti itu digunakan pada data yang sama,
kemungkinan bahwa kedua interval tersebut mengandung nilai parameter sebenarnya kurang dari
95%. Oleh karena itu, banyak perkiraan interval seharusnya tidak dibangun dari data sampel
yang sama kecuali ada penyesuaian untuk mempertimbangkan penggunaan yang berulang.
Kebanyakan buku tentang metode statistik standar menyajikan berbagai penyesuaian seperti itu,
tetapi tidak dibahas di sini. Sebaliknya, kami mengikuti filosofi membuat hanya beberapa
perbandingan yang bermakna, daripada membuat semua perbandingan yang mungkin, ketika
situasi memerlukan perbandingan.

Contoh 4.12
Sebuah survei terhadap 209 psikolog klinis berlisensi yang dipilih secara acak dari semua
profesional semacam itu di negara bagian B digunakan untuk mempelajari efek usia dan jenis
kelamin pada diagnosis gejala yang berkaitan dengan perasaan depresi pada pasien. Semua
psikolog membaca studi kasus yang sama, kecuali untuk perubahan usia dan jenis kelamin
pasien. Diagnosis yang dihasilkan dilaporkan pada Tabel 4.6. (a) Apakah usia tampaknya
mempengaruhi diagnosis depresi (berlawanan dengan diagnosis penyebab organik)? (b) Apakah
jenis kelamin tampaknya mempengaruhi diagnosis depresi.

Tabel 4.6
Diagonosis umum berdasrkan usia dan jenis kelamin pasien

Solusi
a. Kita dapat membuat banyak perbandingan untuk melihat pengaruh usia terhadap
diagnosis. Namun, untuk membatasi perbandingan tersebut, kita hanya akan
membandingkan usia yang sangat berbeda: 45 tahun dan 85 tahun. Dari semua peserta
yang kita perhatikan, 93% dari mereka yang berusia 45 tahun didiagnosis sebagai depresi
(39 dari 42 orang), sedangkan hanya 69% dari peserta yang berusia 85 tahun yang
didiagnosis sebagai depresi (25 dari 36 orang). Estimasi interval yang tepat adalah
(0.93−0.69)± 2
√ (0.93)(0.07) (0.69)(0.31)
42
¿ 0.24 ± 0.17
+
36

Ada bukti statistik yang mengatakan bahwa orang berusia 85 tahunlebih kecil
kemungkinannya untuk didiagnosis dengan depresi.
b. Sepintas, terlihat bahwa wanita mungkin lebih sering didiagnosis mengalami depresi
daripada pria. Namun, untuk memastikan perbedaan ini, kita perlu melihat interval
estimasi dari perbedaan proporsi tersebut.
(0.77−0. 84)±2
√ (0.77)(0.23) (0. 84)(0.16)
66
¿ 0.07 ± 0.13
+
77

Wanita mungkin tidak didiagnosis sebagai depresi lebih sering pada populasi pasien
tersebut. Perbedaan yang diamati ini bisa jadi hanya karena kesalahan pengambilan
sampel.

4.7 Ringkasan
Tujuan statistik adalah untuk membuat kesimpulan tentang satu atau lebih parameter
populasi dari informasi yang terkandung dalam sampel. Dua faktor yang mempengaruhi
kuantitas informasi dalam penyelidikan yang diberikan. Yang pertama adalah ukuran sampel.
Semakin besar ukuran sampel, semakin banyak informasi yang kita harapkan untuk diperoleh
tentang populasi. Kedua faktor adalah jumlah variasi dalam data. Variasi dapat dikontrol oleh
desain survei sampel, yaitu metode yang digunakan untuk memperoleh observasi.
Dalam bab ini, kita telah membahas jenis desain survei sampel yang paling sederhana,
yaitu, pengambilan sampel acak sederhana. Desain ini tidak berusaha mengurangi efeknya
variasi data pada kesalahan estimasi. Sebuah sampel acak sederhana berukuran n terjadi jika
setiap sampel n elemen dari populasi mempunyai peluang yang sama untuk terpilih. Tabel
bilangan acak cukup berguna dalam menentukan unsur-unsur yang untuk dimasukkan dalam
sampel acak sederhana.
Dalam mengestimasi mean populasi μ dan total τ, kita menggunakan mean sampel dan
jumlah sampel 𝑁𝑦̅, masing-masing. Masing-masing kedua penduga tidak bias; itu adalah E( y̅ ) =
μ dan E(Ny ̅ )=τ . Varians yang diestimasi dan batas kesalahan pendugaan adalah diberikan
untuk kedua penduga.
Kadang-kadang selama perancangan survei yang sebenarnya, peneliti harus memutuskan
seberapa banyak informasi yang diinginkan, yaitu seberapa besar batas kesalahan estimasi yang
dapat ditoleransi. Persyaratan ukuran sampel telah disajikan untuk memperkirakan μ dan τ
dengan batas tertentu pada kesalahan estimasi.
Parameter ketiga yang diestimasi adalah proporsi populasi p. Sifat-sifat ^p telah disajikan
dan terkait dengan sifat-sifat y̅ , penaksir dari rata-rata populasi μ. Memilih ukuran sampel untuk
memperkirakan p dengan batas tertentu pada kesalahan estimasi didasarkan pada prinsip yang
sama yang digunakan dalam memilih ukuran sampel untuk memperkirakan μdanτ .
terkadang penting untuk membandingkan rata-rata atau proporsi dengan mengestimasi
perbedaan di antara keduanya. Variansi dari perbedaan-perbedaan tersebut mudah diestimasi
untuk sampel-sampel yang independen. Satu kasus dependen yang dipertimbangkan adalah
dalam membandingkan proporsi multinomial, jenis yang sering muncul dalam survei sampel.

Studi Kasus

Apakah orang di Negara A sedang mengurangi konsumsi alkohol?

Jika jajak pendapat yang dibahas dalam studi kasus pembuka terdiri dari 1200 orang dewasa
yang dipilih secara acak, maka sekitar setengah dari responden seharusnya perempuan dan
setengahnya laki-laki. Oleh karena itu, ukuran sampel 600 akan digunakan untuk tanggapan
hanya dari pria atau wanita. "Apakah proporsi pria yang minum berkurang secara signifikan dari
tahun 1992 hingga 1994?" adalah pertanyaan tentang dua proporsi yang hampir independen.
Estimasi dan batas kesalahan ditemukan dengan:

( 0.72−0.70 ) ±2
√ ( 0.72 )( 0.2 8 ) ( 0.70 ) ( 0.30 )
600
+
600
=0.02 ±0.05
Dan oleh karena itu, tidak ada penurunan yang signifikan.

Estimasi dan batas untuk proporsi wanita yang serupa menghasilkan interval 0 , 04 ± 0 , 06,
sehingga tidak ada peningkatan yang signifikan dalam proporsi wanita juga. Perbandingan antara
proporsi orang yang mengurangi minum sebelum 1994 dengan mereka yang mengurangi minum
sebelum 1984 melibatkan perbedaan proporsi independen lagi, tetapi di sini ukuran sampelnya
1200 pada kedua kelompok. Estimasi dan batasannya diberikan oleh:

( 0.41−0.29 ) ±2
√ ( 0.41 )( 0.59 ) ( 0.29 ) ( 0.71 )
1200
+
1200
=0.12± 0.04

Ini menunjukkan peningkatan proporsi yang signifikan bagi mereka yang telah
mengurangi minum dan, pada kenyataannya, membenarkan judul artikel di mana data ini
muncul: “Jumlah Peminum Tetap Stabil, tetapi Minum Lebih Sedikit.” Perbandingan proporsi
yang mengalami penurunan minum selama lima tahun terakhir tahun dengan mereka yang tetap
sama (keduanya untuk 1994) melibatkan perbedaan proporsi tergantung. Estimasi dan terikat
pada kesalahan diberikan oleh:

( 0.41−0.51 ) ± 2
√ ( 0.41 ) ( 0.59 ) ( 0.51 )( 0.49 ) 2 ( 0.41 )( 0.51 )
1200
+
1200
+
1200
=−0.01± 0.06

Karena intervalnya tidak tumpang tindih dengan nol, perbedaan antara proporsi sampel
tampaknya mencerminkan perbedaan nyata antara proporsi populasi.

Latihan
Beberapa latihan dibawah ini memerlukan data; cari di Bagian 4.0 untuk mendapatkan link ke
data-data tersebut dalam file Excel.
1. Buat daftar semua kemungkinan sampel acak sederhana berukuran n = 2 yang dapat
dipilih dari populasi {0, 1, 2, 3, 4}. Hitung s2 untuk populasi dan untuk sampel.
2. Untuk sampel acak sederhana yang dihasilkan pada Latihan 4.1, hitung s2untuk setiap
sampel. Tunjukkan secara numerik bahwa
2 N 2
E(s ) σ
N −1

3. Anggap Anda ingin memperkirakan jumlah kelompok gulma tertentu di sebuah ladang.
Apa yang menjadi populasi, dan apa yang akan Anda gunakan sebagai unit sampling?
Bagaimana cara membuat bingkai sampel? Bagaimana cara memilih sampel acak
sederhana? Jika unit sampel adalah area seperti halaman persegi, apakah ukuran yang
dipilih untuk unit sampel memengaruhi akurasi hasil? Apa saja pertimbangan yang harus
dipertimbangkan dalam pemilihan ukuran unit sampling?
4. Dalam situasi berikut, manakah yang dapat Anda generalisasikan secara wajar dari
sampel ke populasi?
a. Anda menggunakan kelas statistik Anda untuk mendapatkan perkiraan persentase
siswa di sekolah Anda yang belajar setidaknya dua jam semalam.
b. Anda menggunakan pendapatan tahunan rata-rata para duta besar PBB untuk
mendapatkan perkiraan pendapatan perkapita rata-rata untuk dunia secara
keseluruhan.

c. Pada tahun 1996, jajak pendapat Gallup mengambil sampel 235 penduduk AS
berusia 18 hingga 29 tahun, untuk memperkirakan persentase dari semua
penduduk AS yang berusia 18 hingga 29 tahun yang mendukung pemotongan
pengeluaran sosial.

5. Deskripsikan jenis bias pemilihan sampel yang akan terjadi dari masing-masing metode
sampel di bawah ini.

a. Seorang siswa ingin menentukan rata-rata ukuran peternakan di sebuah kabupaten


di daerah C. Dia menjatuhkan beberapa butir beras secara acak pada peta
kabupaten tersebut dan menggunakan peternakan yang terkena butiran beras
sebagai sampel.
b. Dalam sebuah studi tentang apakah siswa berprestasi terbaik dalam hidupnya,
seorang profesor "mengunjungi wisuda sekolah menengah di seluruh Illinois dan
memilih 81 siswa untuk berpartisipasi. . . . Dia memilih siswa dari komunitas
yang paling beragam mungkin, dari sekolah-sekolah pedesaan kecil hingga
sekolah-sekolah subur kaya di dekat Chicago hingga sekolah-sekolah kota."
Sumber: Michael Ryan, "Do Valedictorians Succeed Big in Life?" Parade
Magazine, 17 Mei 1998, halaman 14–15.
c. Untuk memperkirakan persentase siswa yang lulus ujian Statistik Advanced
Placement pertama, seorang guru di sebuah forum diskusi internet untuk guru-
guru Statistik AP meminta guru-guru di forum tersebut untuk melaporkan kepada
dia berapa banyak siswa yang mengikuti ujian dan berapa banyak yang lulus.
d. Untuk mencari rata-rata panjang tali di dalam sebuah kantong, seorang siswa
mencampur tali-tali tersebut, memilih salah satu tali secara acak, mencampur lagi,
memilih lagi, dan seterusnya.
e. Pada tahun 1984, Ann Landers melakukan sebuah jajak pendapat tentang
kebahagiaan pernikahan wanita dengan meminta wanita untuk menulis kepada
dirinya.

6. Anda ingin mengetahui persentase rumah tangga di Negara A yang memiliki anak di
bawah usia 13 tahun yang tinggal di rumah. Setiap hari kerja, mulai dari pukul 9 pagi
hingga pukul 5 sore, pewawancara Anda akan menelepon rumah tangga dalam sampel
Anda. Setiap kali mereka berhasil menghubungi seseorang dalam sampel tersebut,
mereka akan bertanya, "Apakah Anda memiliki anak di bawah usia 13 tahun yang tinggal
di rumah Anda?" Pada akhirnya, Anda akan menghentikan upaya untuk menghubungi
rumah tangga yang tidak dapat dihubungi.

a. Apakah perkiraan Anda mengenai persentase rumah tangga di Negara A yang


memiliki anak di bawah usia 13 tahun yang tinggal di dalamnya kemungkinan akan
terlalu rendah, terlalu tinggi, atau cukup akurat?
b. Bagaimana contoh ini membantu menjelaskan mengapa pewawancara jajak pendapat
cenderung menelepon pada waktu makan malam?

7. Jika ingin memperkirakan jumlah rata-rata negara A yang pernah dikunjungi orang yang
tinggal di sebuah negara dengan menggunakan kriteria responden berusia minimal 40
tahun. Bagaimana tanggapan Anda mengenai kriteria responden minimal 40 tahun
apakah terlalu tinggi atau terlalu rendah? Bias yang mungkin terjadi sampel yang Anda
pilih adalah mereka yang tinggal di Rhode Island?

8. Untuk memperkirakan jumlah rata-rata anak per keluarga di kota tempat Anda tinggal,
Anda menggunakan kelas statistika Anda sebagai sampel praktis. Kemudian Anda
bertanya kepada setiap siswa berapa banyak anak dalam keluarganya. Bagaimana
menurut Anda mengenai rata-rata sampel lebih tinggi atau lebih rendah dari rata-rata
populasi? Jelaskan mengapa!

9. “Televisi hari ini lebih ofensif dari sebelumnya, katakanlah mayoritas 92% pembaca
yang mengambil bagian dalam sebuah dalam sebuah survei. Berapa persentase dari
seluruh publik yang menonton TV AS menurut Anda jika dikatakan "acara hari ini
lebih ofensif dari sebelumnya": lebih dari 92%, sedikit kurang dari 92%, atau hanya
sekitar 92%? Jelaskan mengapa demikian?
10. Bandingkan manfaat kedua metode pengambilan sampel SRS. Jika Anda
mendapatkan daftar semua siswa di kelas bahasa Inggris, kemudian melakukan
pengambilan sampel acak dari siswa tersebut dan mencari berapa banyak siswa
yang terdaftar di setiap kelas bahasa Inggris tersebut!

11. Tentukan apakah metode pengambilan sampel berikut menghasilkan sampel


acak sederhana siswa dari kelas yang terdiri dari 30 siswa. Jika tidak, jelaskan
mengapa!
a. Pilih enam siswa pertama pada lembar daftar kelas.
b. Pilih satu digit secara acak dan pilih siswa yang nomor teleponnya diakhiri
dengan digit itu.
c. Jika ruang kelas memiliki enam baris kursi dengan lima kursi di setiap baris,
pilih satu baris secara acak dan pilih semua siswa di baris itu.
d. Jika kelas terdiri dari 15 anak laki-laki dan 15 anak perempuan, berikan
nomor kepada anak laki-laki dari 1 sampai 15, dan anak perempuan nomor
dari 16 sampai 30. Kemudian gunakan tabel angka acak untuk memilih enam
nomor dari 1 sampai 30. Pilih siswa yang di berikan angka- angka dalam
sampel Anda.
e. Jika kelas terdiri dari 15 anak laki-laki dan 15 anak perempuan, tugaskan
anak laki-laki nomor dari 1 sampai 15, dan anak perempuan nomor dari 16
sampai 30. Kemudian gunakan tabel angka acak untuk memilih tiga angka
dari 1 sampai 15 dan tiga angka dari 16 sampai 30. Pilih siswa yang diberi
nomor tersebut dalam sampel.
f. Pilih secara acak sebuah huruf dari abjad bahasa Inggris dan pilih untuk
sampel para siswa yang nama belakangnya dimulai dengan huruf itu. Jika
tidak ada nama belakang yang dimulai dengan huruf itu, pilih secara acak
huruf lain dari alfabet.
12. Menurut Abstrak BPS tahun 2002, sekitar 60% anak berusia 18 dan 19 tahun terdaftar
di sekolah. Jika Anda mengambil sampel acak dari 40 anak berusia 18 dan 19 tahun
yang dipilih secara acak, apakah cukup mungkin untuk menemukan bahwa umur 32
tahun ada di sekolah?

13. Kumpulan data USPOP dalam Lampiran C mencantumkan angka penduduk per negara
bagian dari sensus tahun 2000. Pilih sampel acak sederhana dari lima keadaan.
Gunakan angka populasi 2000 untuk negara bagian sampel untuk memperkirakan total
populasi salah satu negara dan beri batasan pada kesalahan estimasi. Apakah jawaban
interval Anda termasuk jumlah penduduk yang diberikan dalam tabel? Apakah menurut
Anda setiap interval kepercayaan 95% yang mungkin berdasarkan sampel ukuran 5
akan mencakup total yang sebenarnya? Bandingkan interval dengan anggota kelas
lainnya dan hitung persentase interval yang diamati yang benar-benar menangkap total
sebenarnya.

14. Pejabat taman negara tertarik pada proporsi orang yang berkemah. Mereka memutuskan
untuk mengambil acak sampel sederhana dari pihak berkemah pertama yang
mengunjungi perkemahan. Jika kepala pihak ke-i sampel tidak memikirkan jarak
perkemahan memadai dan jika (i = 1, 2, . . , 30). Gunakan data dalam tabel terlampir
untuk memperkirakan p, proporsi pekemah yang menganggap jarak perkemahan
memadai. Tempatkan batas pada kesalahan estimasi.

15. Gunakan data pada soal nomor 14 untuk menentukan ukuran sampel yang diperlukan
untuk mengestimasi p dengan batas kesalahan estimasi besarnya B = 0,05.

16. Sebuah sampel acak sederhana dari 100 meter air dalam suatu komunitas untuk
memperkirakan konsumsi air rata-rata harian per rumah tangga selama musim
kemarau. Rata-rata sampel dan varians sampel ditemukan menjadi y ̅ = 12,5 dan s2 =
1.252. Jika kita berasumsi bahwa ada N = 10.000 rumah tangga dalam masyarakat,
perkirakan m, dan konsumsi harian rata-rata yang sebenarnya!

17. Dengan menggunakan data pada Latihan 4.16, perkirakan jumlah total gallon air, yang
digunakan setiap hari selama musim kemarau. Tempatkan batas pada kesalahan
estimasi.

18. Pengelola sumber daya lahan permainan hutan prihatin dengan ukuran populasi rusa dan
kelinci selama bulan-bulan musim dingin di hutan tertentu. Sebagai perkiraan ukuran
populasi, mereka mengusulkan penggunaan jumlah rata-rata kelompok penangkapan
untuk kelinci dan rusa per petak seluas 30 kaki persegi. Dari foto udara, hutan dibagi
menjadi N = 10.000
a. Grid 30 kaki persegi. Sebuah sampel acak sederhana n = 500 plot diambil, dan
diamati jumlah kelompok penangkapan untuk kelinci dan rusa. Hasil penelitian ini
dirangkum dalam tabel terlampir.
b. Perkirakan perbedaan ukuran rata-rata kelompok penangkapan per plot untuk kedua
hewan, dengan margin kesalahan yang sesuai

19. Seorang dokter gigi tertarik pada efektivitas pasta gigi baru. Sekelompok N = 1000
anak sekolah berpartisipasi dalam penelitian. Catatan pra-studi menunjukkan ada rata-
rata 2,2 rongga setiap enam bulan untuk kelompok. Setelah tiga bulan penelitian, dokter
gigi mengambil sampel

Jika n = 10 anak. Dengan menggunakan data pada tabel terlampir, perkirakan jumlah
ratarata rongga untuk seluruh kelompok dan beri batas pada kesalahan pendugaan!

20. Departemen permainan ikan suatu negara bagian prihatin dengan arah program
perburuannya di masa depan. Untuk menyediakan potensi yang lebih besar untuk
perburuan di masa depan, departemen ingin menentukan proporsi pemburu yang
mencari semua jenis burung buruan. Sampel acak sederhana n = 1000 dari N = 99.000
pemburu berlisensi diperoleh. Misalkan 430 menunjukkan bahwa mereka berburu
burung, Perkirakan p, proporsi pemburu berlisensi yang mencari burung buruan.
Berilah interval pada kesalahan estimasi tersebut!

21. Dengan menggunakan data pada nomor 19, tentukan ukuran sampel yang harus
diperoleh departemen tersebut untuk memperkirakan proporsi pemburu burung buruan,
mengingat kesalahan pendugaan besarnya B = 0,02.

22. Seorang auditor perusahaan tertarik untuk memperkirakan 𝑁𝑝̂, jumlah total voucher
𝑁 2 𝑉⃛ (𝑝̂ ) perjalanan yang salah diajukan. Dalam sampel acak sederhana n = 50
voucher yang diambil dari kelompok N = 250, 20 salah diajukan. Perkirakan jumlah
voucher dari N = 250 yang salah diajukan dan ikat pada kesalahan estimasi. [Petunjuk:
Jika p adalah proporsi populasi voucher yang salah, maka Np adalah totalnya jumlah
voucher yang salah. Penaksir Np adalah , yang memiliki `varians taksiran yang
diberikan oleh auditor perusahaan].

23. Seorang psikolog ingin memperkirakan waktu reaksi rata-rata terhadap stimulus di
antara 200 pasien di rumah sakit yang mengkhususkan diri pada gangguan saraf.
Sampel acak sederhana n = 20 pasien dipilih, dan waktu reaksi mereka diukur, dengan
hasil sebagai berikut:
𝑦̅ = 2.1 detik, 𝑠 = 0.4 detik

24. Dalam soal 23, seberapa besar sampel yang harus diambil untuk memperkirakan µ
dengan batas dari 1 detik pada kesalahan estimasi? Gunakan 1,0 detik sebagai perkiraan
deviasi standar populasi.

25. Sebuah studi sosiologis yang dilakukan di sebuah kota kecil meminta perkiraan proporsi
rumah tangga yang memiliki setidaknya satu anggota berusia di atas 65 tahun. Kota ini
memiliki 621 rumah tangga menurut direktori kota terbaru. Sebuah sampel acak
sederhana dari n = 60 rumah tangga dipilih dari direktori. Pada akhir pekerjaan
lapangan, dari 60 rumah tangga sampel, 11 rumah tangga berisi setidaknya satu anggota
berusia di atas 65 tahun. Perkirakan proporsi populasi sebenarnya p dan beri batas pada
kesalahan pendugaan!
26. Dalam soal 25, seberapa besar sampel yang harus diambil untuk memperkirakan p
dengan a terikat B = 0,08 pada kesalahan estimasi? Asumsikan proporsi sebenarnya p
kira-kira 0,2.

27. Seorang peneliti tertarik untuk mengestimasi jumlah total “hitungan pohon” (pohon
yang lebih besar dari ukuran yang ditentukan) di perkebunan N = 1500 hektar.
Informasi ini digunakan untuk menentukan total volume kayu untuk pohon di
perkebunan. Sebuah sampel acak sederhana dari n = 100 plot satu hektar dipilih, dan
setiap plot diperiksa untuk jumlah dari jumlah pohon. Rata-rata sampel untuk n = 100
plot satu area adalah dengan a varians sampel dari s 2 = 136. Perkirakan jumlah total
pohon yang dihitung di perkebunan dan tentukan interval batas pada kesalahan estimasi.

28. Dengan menggunakan hasil survei yang dijelaskan dalam soal 27 tentukan ukuran
sampel yang diperlukan untuk memperkirakan τ, jumlah total pohon di perkebunan,
dengan batas kesalahan perkiraan besarnya B = 1500.

29. Dalam sebuah survei terhadap 1000 orang dewasa dari masyarakat umum menunjukkan
bahwa 81% menganggap TV berkontribusi pada penurunan nilai-nilai keluarga. Jika
sampel dipilih secara acak, apa yang dapat Anda katakan tentang proporsi semua orang
dewasa yang berpikir TV berkontribusi pada penurunan nilai-nilai keluarga?
(Diskusikan apakah kondisi untuk menggunakan interval kepercayaan terpenuhi,
berikan interval kepercayaan itu sendiri, dan berikan interpretasi interval yang
digunakan).

30. (Pilihan ganda) Sebuah survei dilakukan untuk menentukan apa yang lebih disukai
orang dewasa di jasa online. Hasil survei menunjukkan bahwa 73% masyarakat
menginginkan layanan email, dengan margin kesalahan plus atau minus 4%. Apa yang
dimaksud dengan frasa “plus atau minus 4%”?
a. Mereka memperkirakan bahwa 4% dari populasi yang disurvei dapat berubah
pikiran antara waktu jajak pendapat dilakukan dan waktu survei diterbitkan.
b. Ada kemungkinan 4% bahwa persentase sebenarnya dari orang dewasa yang
menginginkan layanan email tidak akan berada dalam interval kepercayaan 69-
77%.
c. Hanya 4% dari populasi yang disurvei
d. tidak mungkin mendapatkan proporsi sampel yang diamati sebesar 73% kecuali
yang sebenarnya persentase semua orang dewasa yang menginginkan layanan
email adalah antara 62% dan 68%.
e. Probabilitas bahwa proporsi sampel berada dalam selang kepercayaan adalah 0,0

31. Diketahui bahwa sekitar 2% burung layang-layang memiliki bulu putih di tempat-
tempat bulu biasanya berwarna biru atau merah, tetapi sekitar 14% burung layang-
layang di beberapa tempat memiliki mutasi genetik seperti itu. Apakah para pencari
kembali percaya bahwa perbedaan tersebut dapat secara wajar dikaitkan dengan
kebutuhan atau apakah mutasi yang disebabkan radioaktivitas tergantung pada berapa
banyak burung layang-layang yang diperiksa. Itu ukuran sampel tidak dilaporkan dalam
artikel. Misalkan ukuran sampelnya adalah 500. Berapa yang harus dikatakan para
penelitian pada pers?

32. Pada bulan Maret 2001, sebuah Jajak Pendapat Gallup bertanya, “Bagaimana Anda
menilai kualitas lingkungan secara keseluruhan di negara ini saat ini—sangat baik, baik,
hanya adil, atau buruk?” Dari 1060 orang dewasa secara nasional, 46% memberikan
peringkat sangat baik atau baik. Apakah ini bukti yang meyakinkan bahwa kurang dari
setengah orang dewasa bangsa akan memberikan peringkat sangat baik atau baik?

33. dalam survei nasional baru-baru ini, 16.262 siswa di 151 sekolah menyelesaikan
kuesioner tentang aktivitas fisik. Siswa laki-laki (55,5%) secara signifikan lebih
mungkin daripada siswa perempuan (42,3%) pernah bermain di tim olahraga yang
dijalankan oleh sekolah mereka selama 12 bulan sebelum survei. Sumber: Pusat
Nasional untuk Pengendalian Penyakit dan Pencegahan, 1997 Sistem Pengawasan
Perilaku Risiko Pemuda. Periksa keakuratan pernyataan "secara signifikan lebih
mungkin," dengan asumsi bahwa ada jumlah yang sama dari siswa laki-laki dan
perempuan dalam survei ini dan bahwa sampelnya setara dengan sederhana contoh
acak.

34. Berapa rata-rata suhu tubuh dalam kondisi normal? Apakah sama untuk keduanya? pria
dan wanita? Peneliti medis yang tertarik dengan pertanyaan ini mengumpulkan data
dari banyak pria dan wanita. Sampel acak dari data tersebut tersedia melalui elektronik
Bagian 4.0

a. Perkirakan suhu tubuh rata-rata pria, dengan dua standar deviasi margin dari
kesalahan.
b. Apakah ada bukti bahwa suhu tubuh rata-rata pria berbeda dari suhu tubuh rata-
rata? suhu wanita? Jelaskan secara rinci.

35. Tabel terlampir menunjukkan harga eceran yang disarankan pabrik, jalan raya mil per
galon, dan berat untuk setiap kotak dalam dua sampel kendaraan yang berbeda. Itu
bagian atas tabel menunjukkan sampel acak dari lima model sedan keluarga (yang
mengatur mobil mewah, mobil sport, dan mobil konvertibel) dan bagian bawah
menunjukkan sampel acak dari lima model kendaraan utilitas sport.

Mpg Jalan
Sedans MSRP (dollar) Berat (pon)
raya

Buick
Century 20,020 29 3368
Custom

Chevrolet
Malibu 17,150 29 3051

Chrysler
Concorde 22,510 28 3488
LX

Ford
Taurus LX 18,550 27 3354

Toyota
Camry 20,415 32 3120
LE2

SUVs
Blazer
4WD LX 26,905 20 4049

Explorer
AWD XLT 30,185 19 4278

Jimmy
4WD SLT 30,225 20 4170
27,920 19 4465
Trooper S
Sumber: www.autoweb.com
a. Perkirakan perbedaan rata-rata harga model antara sedan
keluarga dan SUV diperkiraan interval kepercayaan 95%
b. Perkirakan perbedaan berat model rata-rata antara sedan
keluarga dan SUV diperkiraan interval kepercayaan 95%
c. Perkirakan perbedaan rata-rata mil jalan raya per galon antara
model keluarga sedan dan model SUV dalam interval
kepercayaan 95% perkiraan.
d. Di antara interval kepercayaan di atas, menurut Anda mana
yang memiliki "keyakinan" paling kecil?jelaskan
36. Pada akhir September 1994, terdapat sebuah penelitian yang
melibatkan 811 pemilih terdaftar di Kota A yang menunjukkan bahwa
57% dari responden tidak setuju dengan legalisasi perjudian kasino di
Kota A. Laporan artikel dari penelitian tersebut menyatakan bahwa
kesalahan pengambilan sampel sebesar 3,5%.
a. Apakah ini kesalahan pengambilan sampel yang benar untuk
dilaporkan?
b. Sebuah argumen statistik yang valid dibuat bahwa
“kebanyakan warga Kota A tidak menyetujui legalisasi kasino
di negara bagian pada waktu itu?” jelaskan.
c. Para pendukung kasino menyatakan bahwa hasil jajak
pendapat mereka hanya menunjukkan sedikit lebih dari
sepertiga dari total penduduk negara bagian yang menentang
kasino. Apakah ada faktor-faktor tertentu yang dapat
menyebabkan perbedaan hasil antara kedua jajak pendapat
tersebut? Misalnya, apakah faktor hasil polling yang
memengaruhi perbedaan tersebut?
37. Jajak pendapat Gallup menjelaskan kesalahan pengambilan sampel
dengan cara berikut:

Selama bertahun-tahun, para ahli statistik telah


mengembangkan cara yang cukup spesifik untuk mengukur akurasi
sampel, selama prinsip dasar probabilitas yang sama dalam seleksi
dipatuhi saat pengambilan sampel dilakukan. Contohnya, apabila kita
menggunakan prosedur pemilihan acak yang teliti dan mengambil
sampel 1000 orang dewasa nasional, hasilnya cenderung akurat
dengan margin kesalahan sebesar plus atau minus tiga poin persentase.
Oleh karena itu, apabila kita menemukan dalam sebuah jajak pendapat
bahwa persetujuan Presiden X sebesar 50%, margin kesalahan
menunjukkan bahwa kemungkinan besar persetujuan yang sebenarnya
berkisar antara 53% dan 47%.
Sangat tidak mungkin terjadi peringkat yang lebih tinggi atau
lebih rendah dari rentang tersebut. Secara lebih rinci, hukum
probabilitas menyatakan bahwa jika kita melakukan survei yang sama
100 kali dan meminta partisipan dalam setiap survei untuk menilai
kinerja Presiden X, maka pada 95 dari 100 jajak pendapat tersebut,
peringkatnya akan berada di antara 47% dan 53%. Hanya pada lima
survei yang kita dapat mengharapkan hasil yang lebih tinggi atau lebih
rendah dari rentang tersebut, yang disebabkan oleh kesalahan
kebetulan.
Sumber: www.gallop.com; “How Polls are Conducted.” Reprinted
with permission of the Gallup Organization.
Apakah Anda setuju dengan penjelasan ini? Apakah Anda
memiliki saran perubahan kata yang dapat meningkatkannya?
38. Seorang juru bicara Perusahaan AC memberikan penjelasan tentang
konsep ide-ide statistik yang menjadi dasar sistem peringkat. (D.
Cody, “Polls and Pollsters,” Sky, Oktober 1982, hal. 116):
Dia mengilustrasikan dengan contoh bahwa jika kita mencampurkan
70.000 kacang putih dan 30.000 kacang merah, kemudian mengambil
sampel sebanyak 1000 kacang, kemungkinan matematisnya adalah
bahwa jumlah kacang merah dalam sampel tersebut akan berada
antara 270 dan 330, atau sekitar 27% -33% dari sampel. Hal ini
diterjemahkan sebagai "peringkat" dari 30, dengan margin kesalahan
sebesar plus atau minus 3, dan memiliki jaminan keandalan statistik
sebesar 20 banding 1. Meskipun ukuran populasi berbeda-beda,
hukum statistik dasar akan tetap sama.
Tafsirkan dan berikan pembenarkan atas pernyataan ini dalam hasil bab
ini.
39. Salah satu pemain bisbol yang sangat handal di era modern, dikenal
dengan sebutan Mr. October oleh para penggemar bisbol karena dia
terlihat lebih unggul saat bermain di World Series. Selama musim
reguler, Mr. October mencatat 2584 kali mencapai base dalam 9864
upaya swing dengan rata-rata keberhasilan mencapai base (proportion
of hits) sebesar 0,262. Sedangkan saat bermain dalam Seri Kejuaraan
Liga, ia mencatat 37 kali mencapai base dalam 163 upaya swing
dengan rata-rata keberhasilan mencapai base sebesar 0,227. Saat
bermain dalam Seri Dunia, Mr. October mencatat 35 kali mencapai
base dalam 98 upaya swing dengan rata-rata keberhasilan mencapai
base sebesar 0,357. Apakah Anda pikir julukan itu dibenarkan,
berdasarkan data? Jelaskan alasan Anda.
40. Seorang auditor mendeteksi bahwa perusahaan tertentu secara teratur
melebih-lebihkan jumlah dolar persediaan karena keterlambatan
dalam pencatatan penarikan. Auditor ingin memperkirakan total
berlebihan jumlah pada 1000 item yang terdaftar dengan memperoleh
jumlah persediaan yang tepat (diaudit) pada sampel acak dari 15 item
dan membandingkan angka-angka yang tepat ini dengan jumlah yang
tercatat. Data untuk item sampel tersedia di Bagian 4.0 elektronik
(semua data dinyatakan dalam satuan dolar). Perkirakan jumlah total
yang dilebih-lebihkan pada 1000 jenis item dan batasi kesalahan
estimasi. (Abaikan fpcnya.)
41. Seorang auditor secara acak mengambil sampel 20 piutang dari 500
akun perusahaan tertentu. Auditor mencantumkan jumlah setiap akun
dan memeriksa untuk melihat apakah dokumen yang mendasarinya
sesuai dengan prosedur yang dinyatakan. Data tersedia melalui Bagian
4.0 elektronik (jumlah dalam dolar, Y = ya, N = tidak).
Perkirakan total piutang untuk 500 akun perusahaan dan
tempatkan kesalahan estimasi. Apakah menurut Anda rata-rata
piutang usaha untuk perusahaan melebihi $250? Mengapa?
42. Lihat Latihan 4.41. Dari data yang diberikan pada pemeriksaan
kepatuhan, perkirakan proporsi akun perusahaan yang gagal mematuhi
prosedur yang dinyatakan. Tempatkan ikatan pada kesalahan estimasi.
Apakah menurut Anda proporsi akun yang mematuhi prosedur yang
disebutkan melebihi 80%? Mengapa?
43. Tinjau skenario pada Contoh 4.10 tentang kandungan merkuri air di
danau Maine. Beberapa ahli berpendapat bahwa keberadaan
bendungan meningkatkan kandungan merkuri. Apakah ada bukti
signifikan tentang hal ini dalam data yang diberikan? Jelaskan alasan
statistik Anda.
44. Pada pertengahan tahun 1994 terjadi pemogokan yang mengakibatkan
berakhirnya musim Bisbol Liga Utama. Dalam jajak pendapat warga
Negara B terhadap 600 orang dewasa (Waktu, 22 Agustus 1994), 29%
menyalahkan para pemain atas pemogokan ini, 34% menyalahkan
pemilik, dan sisanya memiliki berbagai pendapat lain. Apakah bukti
menunjukkan bahwa proporsi sebenarnya yang menyalahkan pemain
dan pemilik, masing-masing, benar-benar berbeda?
45. Jajak pendapat terakhir sebelum pemilihan presiden tahun 1994 untuk
empat lembaga pemungutan suara menunjukkan hasil sebagai berikut:

Semua menyatakan Clinton sebagai pemenang. Apakah mereka


dibenarkan dalam klaim ini?
46. Lihat Latihan 4.45. Di sisi lain, berdasarkan survei terhadap 773
pemilih terdaftar di Kota A, jajak pendapat lain mengatakan
persaingan antara Clinton dan Bush "terlalu dekat." Saat itu, 39% dari
mereka yang disurvei menyukai Bush, dan 37% menyukai Clinton.
Apakah jajak pendapat Kota A benar dalam interpretasi datanya?
47. Sebuah studi untuk menilai sikap akuntan terhadap iklan layanan
mereka melibatkan pengiriman kuesioner ke 200 akuntan yang dipilih
dari daftar 1400 nama. Sebanyak 82 kuesioner yang dapat digunakan
dikembalikan. Ringkasan data untuk satu pertanyaan ditunjukkan pada
tabel terlampir. Kemungkinan iklan di masa depan (%)
Mereka yang telah
Semua responden
mengiklankan di
(82)
masa lalu (46)

22 35
Kepastian maya

4 5
Sangat mungkin

19 35
Agak mungkin

18 15
Sekitar 50–50

6 10
Agak tidak mungkin

12 0
Sangat tidak mungkin

15 0
Benar-benar tidak

4 0
Tidak ada respon
SUMBER: Traynor, K. 1984. Akuntansi Periklanan: Persepsi, Sikap dan Perilaku,Jurnal
Penelitian Periklanan, 23(6): 35–40. Hak Cipta © 1984 oleh Advertising Research
Foundation

a. Perkirakan proporsi populasi yang hampir pasti untuk beriklan di


masa depan.
b. Perkirakan proporsi penduduk yang memiliki paling sedikit
peluang 50-50 untuk beriklan di masa depan.
c. Di antara mereka yang beriklan di masa lalu, perkirakan proporsi
populasi yang tidak mungkin untuk beriklan lagi.
d. Di antara mereka yang beriklan di masa lalu, perkirakan proporsi
populasi yang memiliki paling sedikitpeluang 50-50 untuk beriklan
lagi.

Tempatkan batasan pada kesalahan estimasi dalam semua kasus.


Apakah bagian (c) dan (d) memerlukan asumsi lebih lanjut atas yang
dibuat untuk bagian (a) dan (b)?

48. Sebuah firma riset pemasaran memperkirakan proporsi pelanggan


potensial yang memilih merek lipstik tertentu dengan “secara acak”
memilih 100 wanita yang datang ke gerai mereka di pusat
perbelanjaan. Dari 100 sampel, 65 wanita menyatakan preferensi
untuk merek A.
a. Bagaimana Anda memperkirakan proporsi sebenarnya dari
wanita yang memilih merek A, dengan kemungkinan
kesalahan estimasi?
b. Apa target populasi dalam penelitian ini?
c. Apakah firma riset pemasaran memilih sampel acak sederhana?
d. Masalah tambahan apa yang Anda lihat dengan jenis
pengambilan sampel ini?
49. Sebuah kasus hukum sedang dirumuskan oleh serikat sekretaris yang
mengklaim bahwa mereka dibayar dengan upah rendah yang tidak adil
oleh majikan mereka. Ke-64 sekretaris di perusahaan itu memiliki gaji
tahunan rata-rata $18.300, dengan standar deviasi $400. Gaji rata-rata
untuk semua sekretaris di kota tempat perusahaan ini berada adalah
$20.100. Bisakah Anda mendukung klaim sekretaris dengan argumen
statistik? Jika demikian, nyatakan dengan hati-hati argumen ini dan
asumsi yang mendasarinya.
50. Equal Opportunity Employment Commission (EOEC) menuduh
sebuah perusahaan melanggar standar perekrutan minoritas, karena
dari 120 karyawannya hanya 30 yang bukan kulit putih. Di area pasar
tenaga kerja untuk perusahaan itu, 36% dari karyawan yang tersedia
dilaporkan bukan kulit putih. Bisakah Anda mendukung tuduhan
EOEC berdasarkan statistik? Nyatakan argumen Anda untuk
mendukung atau menentang tuduhan tersebut dengan memperhatikan
asumsi dengan cermat.

Pengambilan Sampel dari Populasi Sebenarnya

1. Data, dikumpulkan dengan sampling acak, dari survei kelas siswa


statistik pengantar ditunjukkan dalam Lampiran C Data Set
CLASSSUR dan pada disk yang menyertainya. Gunakan data ini
untuk menjawab pertanyaan berikut. Asumsikan ada 500 siswa di
kelas. Perhatikan bahwa data tidak "dipijat" untuk Anda; Anda
harus memutuskan organisasi dan ringkasan yang sesuai.
a. Perkirakan rata-rata populasi untuk salah satu variabel
pengukuran, seperti usia, nilai rata-rata (IPK), atau jam belajar.
b. Perkirakan proporsi populasi untuk salah satu variabel
kategori, seperti jenis kelamin, kelas, atau status pekerjaan.
c. Bandingkan rata-rata pada satu variabel untuk setidaknya dua
kelompok yang berbeda, seperti pria dan wanita.
d. Bandingkan proporsi pada satu variabel kategori untuk
setidaknya dua kelompok yang berbeda (yaitu, kedudukan
kelas atau lokasi tempat tinggal permanen)
2. Karakteristik populasi Negara B disediakan di Appendix C Data
Set USPOP dan pada disk. Gunakan data ini untuk menjawab
pertanyaan berikut
a. Dari sampel acak lima negara bagian, perkirakan jumlah
total orang yang berusia di atas 65 tahun di Negara B pada
tahun 2000. Kemudian, ubah perkiraan ini menjadi
perkiraan proporsi orang yang berusia di atas 65 tahun pada
tahun 2000. Lakukanlah perkiraan untuk menangkap nilai
sebenarnya?
b. Dari sampel acak lima negara bagian, perkirakan proporsi
orang yang hidup dalam kemiskinan di Negara B.
3. Identifikasi masalah di bidang minat Anda yang dapat
mengambarkan sampel acak sederhana untuk memperkirakan rata-
rata, total, atau proporsi populasi. Definisikan populasi dan unit
sampling dan membangun kerangka. Pilih sampel acak sederhana
dengan menggunakan tabel bilangan acak pada Lampiran A.
Kemudian kumpulkan data dan buat perhitungan yang diperlukan.
Beberapa proyek yang disarankan adalah sebagai berikut.
Bisnis: Perkirakan pendapatan kotor rata-rata untuk perusahaan
jenis tertentu di daerah Anda atau jumlah rata-rata yang dihabiskan
untuk hiburan di kalangan mahasiswa.
Ilmu Sosial: Perkirakan proporsi pemilih terdaftar yang mendukung
beberapa proposal politik saat ini atau jumlah rata-rata orang per
rumah tangga untuk bagian tertentu di kota Anda.
Ilmu fisika: Pertimbangkan percobaan laboratorium seperti
mengukur kekuatan tarik kawat atau diameter batang mesin.
Pengambilan pengamatan independen pada eksperimen semacam
itu dan memperlakukannya sebagai sampel acak sederhana.
Buatlah estimasi interval dari mean “populasi”. Di sini populasi
hanyalah konseptual (kita bisa melakukan banyak pengukuran dari
fenomena yang bersangkutan), dan rata-ratanya mewakili kekuatan
rata-rata kawat jenis ini atau diameter rata-rata batang.
Ilmu biologi: Perkirakan berat rata-rata hewan yang diberi
makanan tertentu untuk jangka waktu tertentu atau tinggi rata-rata
pohon di petak tertentu. Sebagai contoh menggunakan jumlah
daripada rata-rata, perkirakan jumlah total koloni serangga (dari
jenis tertentu) yang menyerang plot. Hati-hati di sini dalam
memilih unit sampling dan membangun kerangka.

Kegiatan Sampling – Acak Persegi Panjang

1. Tujuannya adalah untuk memilih sampel lima persegi panjang untuk


memperkirakan luas rata-rata dari 100 persegi panjang di layar. 1. Tanpa
mempelajari tampilan persegi panjang terlalu hati-hati, pilih lima yang
menurut Anda mewakili populasi persegi panjang pada halaman. Ini
adalah sampel penilaian Anda.
2. Temukan luas setiap persegi panjang (dalam hal jumlah sel) dalam sampel
lima hitung rata-rata sampel, yaitu, luas rata-rata persegi panjang dalam
sampel Anda.
3. Buat daftar rata-rata sampel Anda dengan rata-rata siswa lain di kelas.
Buatlah plot sarananya.
4. Jelaskan bentuk, pusat, dan penyebaran plot sampel ini dari sampel
penilaian.
5. Sekarang, buat lima angka acak yang berbeda antara 00 dan 99. (Persegi
panjang bernomor 100 dapat disebut 00.) Temukan persegi panjang yang
sesuai dengan angka acak Anda. Itulah hasil sampel acak yang anda
dapatkan dari lima persegi panjang.
6. Ulangi langkah 2–4, kali ini menggunakan sampel acak yang telah
dikerjakan sebelumnya.
7. Diskusikan bagaimana dua distribusi rata-rata sampel serupa dan
bagaimana mereka berbeda.
8. Metode mana yang menghasilkan rata-rata sampel yang menurut Anda
lebih baik jika tujuannya adalah menggunakan rata-rata sampel untuk
memperkirakan rata-rata populasi? (Distribusi sebenarnya dari luas persegi
panjang diberikan dalam tabel terlampir.)
Distribusi luas persegi panjang

Menghitung
Dearah

16
1

2
2

6
3

16
4

8
5

6
6

8
8

5
9

7
10

12 10
1
15

10
16

5
18

Anda mungkin juga menyukai