Anda di halaman 1dari 11

9.

10 Sampel Tunggal: Memperkirakan Proporsi

Penaksir titik proporsi pin percobaan binomial diberikan oleh


statistik + P = X / n, di mana X merepresentasikan jumlah keberhasilan
inntrials. Oleh karena itu, proporsi sampel ˆ p = x / n akan digunakan
sebagai estimasi titik parameter p.
Jika proporsi yang tidak diketahui ini tidak diharapkan terlalu
dekat dengan 0 atau 1, kita bisa menetapkan interval kepercayaan hanya
dengan mempertimbangkan distribusi sampling dari + P. Menentukan
kegagalan dalam setiap percobaan binomial dengan nilai 0 dan sukses oleh
nilai 1, jumlah keberhasilan, x, dapat diartikan sebagai jumlah dari nilai-
nilai hanya terdiri dari 0 dan 1, dan ˆ hanya sampel rata-rata dari nilai-nilai
ini. Karenanya, oleh Central Limit Theorem, cukup besar, + Pis kira-kira
normal didistribusikan dengan rata-rata.

dan varians

Karena itu, kita bisa menegaskannya

dan zα /2 adalah nilai di atas yang kita temukan luas α/2 di bawah standar
normal melengkung. Mengganti Z, kami menulis

Ketika besar, kesalahan sangat kecil diperkenalkan dengan mengganti


estimasi titik ˆ p = x / n untuk punder tanda radikal. Lalu kita bisa menulis
Di sisi lain, dengan memecahkan p dalam ketidaksetaraan kuadrat di atas,

kami mendapatkan bentuk lain dari interval kepercayaan untuk p dengan


batas

Untuk sampel acak ukuran n, proporsi sampel ˆ p = x / n dihitung, dan


perkiraan interval kepercayaan diri 100 (1 − α)% berikut untuk p dapat
diperoleh.

Sampel Besar Jika ˆ p adalah proporsi keberhasilan dalam sampel


acak ukuran nand ˆ q = 1 − ˆ p, perkiraan interval
Kepercayaan kepercayaan 100 (1 − α)%, untuk parameter
Interval untuk p binomial hal diberikan oleh (metode 1)

atau dengan (metode 2)

di mana zα / 2 adalah nilai-z yang meninggalkan area α / 2 ke kanan.

Saat ini kecil dan proporsi yang tidak diketahui diyakini mendekati
0 atau ke 1, prosedur interval kepercayaan yang ditetapkan di sini tidak
dapat diandalkan dan, oleh karena itu, tidak boleh digunakan. Untuk
berada di sisi yang aman, seseorang harus membutuhkan nˆp dan nˆ q
menjadi lebih besar atau sama dengan 5. Metode untuk menemukan
interval kepercayaan untuk pare parameter binomial juga berlaku ketika
distribusi binomial sedang digunakan untuk memperkirakan distribusi
hypergeometric, yaitu, ketika n adalah relatif kecil terhadap N, seperti
yang diilustrasikan oleh Contoh 9.14.

Perhatikan bahwa meskipun metode 2 menghasilkan hasil yang


lebih akurat, itu lebih rumit untuk dihitung, dan perolehan dalam akurasi
yang diberikannya berkurang ketika ukuran sampel cukup besar. Oleh
karena itu, metode 1 umumnya digunakan dalam praktik.

Contoh 9.14:
Dalam sampel acak n = 500 keluarga yang memiliki televisi di kota
Hamilton, Kanada, ditemukan bahwa x = 340 berlangganan HBO.
Temukan kepercayaan 95% Interval untuk proporsi sebenarnya dari
keluarga dengan televisi di kota ini berlangganan HBO.
Solusi:
Estimasi titik p adalah ˆ p = 340/500 = 0,68. Menggunakan Tabel
A.3, kami menemukan itu z0.025 = 1.96. Oleh karena itu, menggunakan
metode 1, interval kepercayaan 95% untuk p adalah

yang disederhanakan menjadi 0,6391 <p <0,7209.


Jika kita menggunakan metode 2, kita dapat memperolehnya

yang disederhanakan menjadi 0,6378 <p <0,7194. Rupanya, ketika n besar


(500 di sini), kedua metode menghasilkan hasil yang sangat mirip.
Jika ini adalah nilai pusat dari interval kepercayaan 100 (1 − α)%,
maka estimates p estimasi p tanpa error. Namun, sebagian besar waktu, ˆp
tidak akan persis sama dengan dan estimasi titik akan salah. Ukuran
kesalahan ini akan menjadi perbedaan positif yang memisahkan p dan ˆ p,
dan kita dapat 100 (1 − α)% yakin bahwa perbedaan ini tidak akan
melebihi . Kita dapat dengan mudah melihat ini jika kita
menggambar diagram dari a Interval kepercayaan tipikal, seperti pada
Gambar 9.6. Di sini kita menggunakan metode 1 untuk memperkirakan
kesalahan
Teorema 9.3: Jika ˆ p digunakan sebagai perkiraan p, kita bisa 100 (1 −
α)% yakin bahwa kesalahan tidak akan melebihi
Dalam Contoh 9.14, kami yakin 95% bahwa proporsi sampel ˆ p =
0,68 berbeda dari proporsi sebenarnya p dengan jumlah yang tidak
melebihi 0,04.
Pilihan Ukuran Sampel
Mari kita sekarang menentukan seberapa besar sampel diperlukan
untuk memastikan bahwa kesalahan masuk memperkirakan p akan kurang
dari jumlah yang ditentukan. Dengan Teorema 9.3, kita harus dipilih
sedemikian rupa
Teorema 9.4: Jika ˆ p digunakan sebagai perkiraan p, kita bisa 100 (1 −
α)% yakin bahwa kesalahan akan kurang dari jumlah yang ditentukan e
ketika ukuran sampel kira-kira

Teorema 9.4 agak menyesatkan karena kita harus menggunakan ˆp untuk


menentukan ukuran sampel n, tetapi ˆ p dihitung dari sampel. Jika estimasi
kasar p bisa dibuat tanpa mengambil sampel, nilai ini dapat digunakan
untuk menentukan. Kurang Seperti perkiraan, kita bisa mengambil sampel
awal ukuran n≥30 untuk menyediakan perkiraan p. Menggunakan
Teorema 9.4, kita dapat menentukan kira-kira caranya banyak pengamatan
diperlukan untuk memberikan tingkat akurasi yang diinginkan. Catat itu
nilai fraksional dari nare dibulatkan ke bilangan bulat berikutnya.

Contoh 9.15: Seberapa besar sampel diperlukan jika kita ingin menjadi
95% yakin bahwa perkiraan kami dari p dalam Contoh 9.14 adalah dalam
0,02 dari nilai sebenarnya?
Solusi: Mari kita memperlakukan 500 keluarga sebagai sampel awal,
memberikan perkiraan ˆp =0,68. Kemudian, dengan Teorema 9.4,

Karena itu, jika kita mendasarkan estimasi kita pada sampel acak
ukuran 2090, kita bisa 95% yakin bahwa proporsi sampel kami tidak akan
berbeda dari proporsi yang sebenarnya lebih dari 0,02.
Kadang-kadang, tidak praktis untuk mendapatkan estimasi untuk
digunakan menentukan ukuran sampel untuk tingkat kepercayaan tertentu.
Jika ini terjadi, batas atas untuk n ditetapkan dengan mencatat bahwa ˆ pˆ q
= ˆp (1 − ˆ p), yang harus paling banyak 1/4, karena ˆp harus berada di
antara 0 dan 1. Fakta ini dapat diverifikasi oleh menyelesaikan alun-alun.
Karenanya

yang selalu kurang dari 1/4 kecuali ketika ˆp = 1/2, dan kemudian ˆ pˆ q =
1/4. Karena itu, jika kita mengganti ˆ p = 1/2 ke dalam rumus untuk n
dalam Teorema 9.4 ketika, pada kenyataannya, p sebenarnya berbeda dari
l/2, tidak akan berubah menjadi lebih besar dari yang diperlukan untuk
yang ditentukan tingkat kepercayaan; sebagai hasilnya, tingkat
kepercayaan kita akan meningkat.
Teorema 9.5: Jika ˆ p digunakan sebagai perkiraan p, kita bisa setidaknya
100 (1 − α)% yakin akan hal itu kesalahan tidak akan melebihi jumlah
yang ditentukan e ketika ukuran sampel

Contoh 9.16: Seberapa besar sampel diperlukan jika kita ingin setidaknya
95% yakin bahwa kita Perkiraan p dalam Contoh 9.14 adalah dalam 0,02
dari nilai sebenarnya?
Solusi: Tidak seperti pada Contoh 9.15, kita sekarang akan
mengasumsikan bahwa tidak ada sampel awal diambil untuk memberikan
estimasi p. Akibatnya, kita bisa setidaknya 95% percaya diri bahwa
proporsi sampel kami tidak akan berbeda dari proporsi sebenarnya lebih
dari 0,02 jika kita memilih sampel ukuran

Membandingkan hasil dari Contoh 9.15 dan 9.16, kita melihat bahwa
informasi mengenai p, disediakan oleh sampel awal atau dari pengalaman,
memungkinkan kita untuk memilih sampel yang lebih kecil dengan tetap
mempertahankan tingkat akurasi yang kami butuhkan.

9.11 Dua Sampel: Memperkirakan Perbedaan antara Dua Proporsi


Pertimbangkan masalah di mana kami ingin memperkirakan
perbedaan antara dua parameter binomial p1 dan p2. Sebagai contoh, p1
mungkin proporsi perokok dengan kanker paru-paru dan p2 proporsi
bukan perokok dengan kanker paru-paru, dan masalahnya adalah
memperkirakan perbedaan antara dua proporsi ini. Pertama kita pilih
sampel acak independen dengan ukuran n1 dan n2 dari dua populasi
binomial dengan mean n1 p1 dan n2 p2 dan varians masing-masing n1 p1
q1 dan n2 p2 q2; maka kita menentukan angka x1 dan x2 orang dalam
setiap sampel dengan kanker paru-paru dan membentuk proporsi ˆ p1 = x1
/ nand ˆ p2 = x2 / n. Penaksir titik dari perbedaan antara dua proporsi, p1 −
p2, diberikan oleh statistik + P1− + P2. Oleh karena itu, perbedaan
proporsi sampel, ˆp1 − ˆ p2, akan digunakan sebagai estimasi titik p1 − p2.
Interval kepercayaan untuk p1 − p2 dapat ditetapkan dengan
mempertimbangkan distribusi sampling + P1− + P2. Dari Bagian 9.10 kita
tahu bahwa + P1 dan + P2 masing-masing terdistribusi secara normal,
dengan rata-rata p1 dan p2 dan varian p1q1 / n1 dan p2q2 / n2, masing-
masing. Memilih sampel independen dari dua populasi memastikan bahwa
variabel + P1 dan + P2 akan independen, dan kemudian oleh properti
reproduksi dari distribusi normal yang ditetapkan dalam Teorema 7.11,
kami menyimpulkan bahwa + P1− + P2 kira-kira terdistribusi normal
dengan rata-rata

dan varians

Karena itu, kita bisa menegaskannya

dimana

dan zα / 2 adalah nilai di atas yang kita temukan luas α / 2 di


bawah standar normal melengkung. Mengganti Z, kita menulis
Setelah melakukan manipulasi matematika yang biasa, kami
mengganti p1, p2, q1, dan q2 di bawah tanda radikal dengan estimasi
mereka ˆ p1 = x1 / n1, ˆp2 = x2 / n2, ˆ q1 = 1 − ˆ p1, dan ˆq2 = 1 − ˆ p2,
dengan ketentuan bahwa n1ˆ p1, n1ˆ q1, n2ˆ p2, dan n2ˆ q2 semuanya
lebih besar dari atau sama dengan 5, dan perkiraan berikut 100 (1 − α)%
kepercayaan Interval untuk p1 − p2 diperoleh.
Sampel Besar Kepercayaan Interval untuk p1 − p2:
Jika ˆ p1 dan ˆ p2 adalah proporsi keberhasilan dalam sampel acak
ukuran n1 dan n2, masing-masing, ˆ q1 = 1 − ˆ p1, danˆq2 = 1 − ˆ p2,
perkiraan 100 (1 −α)% interval kepercayaan untuk perbedaan dua
parameter binomial, p1 − p2, diberikan oleh

di mana zα / 2 adalah nilai-z yang meninggalkan area α / 2 ke kanan.

Contoh 9.17:
Perubahan tertentu dalam proses untuk pembuatan komponen
komponen sedang dipertimbangkan. Sampel diambil berdasarkan proses
yang ada dan yang baru untuk menentukan apakah proses baru
menghasilkan perbaikan. Jika 75 dari 1500 item dari proses yang ada
ditemukan cacat dan 80 dari 2000 item dari proses baru ditemukan rusak,
temukan interval kepercayaan 90% untuk yang sebenarnya perbedaan
dalam proporsi cacat antara proses yang ada dan yang baru.
Solusi:
Biarkan p1 dan p2 menjadi proporsi sebenarnya dari barang cacat
untuk proses yang ada dan baru, masing-masing. Oleh karena itu, ˆ p1 =
75/1500 = 0,05 dan ˆ p2 = 80/2000 = 0,04, dan estimasi titik p1 − p2
adalah

Menggunakan Tabel A.3, kami menemukan z0.05 = 1.645. Oleh


karena itu, menggantikannya ke dalam formula, dengan
kami menemukan interval kepercayaan 90% menjadi − 0,0017 <p1
− p2 <0,0217. Sejak Interval berisi nilai 0, tidak ada alasan untuk percaya
bahwa proses baru menghasilkan penurunan yang signifikan dalam
proporsi cacat dibandingkan yang ada metode.
Hingga saat ini, semua interval kepercayaan yang disajikan adalah
dalam bentuk
estimasi titik ± Ks.e. (estimasi titik),
di mana K adalah konstanta (baik untuk titik persen normal). Formulir ini
valid kapan parameternya adalah rata-rata, perbedaan antara rata-rata,
proporsi, atau perbedaan antara proporsi, karena simetri itu dan distribusi
Z. Namun, itu tidak mencakup varian dan rasio varian, yang akan dibahas
dalam Bagian 9.12 dan 9.13.

Latihan
Dalam rangkaian latihan ini, untuk estimasi mengenai satu proporsi,
gunakan hanya metode 1 untuk mendapatkan interval kepercayaan,
kecuali diinstruksikan sebaliknya.
9.51 Dalam sampel acak 1000 rumah di suatu tempat kota, ditemukan
bahwa 228 dipanaskan oleh minyak. Temukan 99% interval
kepercayaan untuk proporsi rumah di ini kota yang dipanaskan oleh
minyak menggunakan kedua metode yang disajikan pada halaman
297.
9.52 Hitung interval kepercayaan 95%, menggunakan keduanya metode
pada halaman 297, untuk proporsi cacat item dalam proses ketika
ditemukan bahwa sampel ukuran 100 menghasilkan 8 cacat.
9.53 (a) Sampel acak dari 200 pemilih di suatu kota adalah dipilih, dan 114
ditemukan untuk mendukung gugatan aneksasi. Temukan interval
kepercayaan 96% untuk sebagian kecil dari populasi pemilih
mendukung gugatan.
(b) Apa yang bisa kita nyatakan dengan keyakinan 96% tentang
kemungkinan ukuran kesalahan kami jika kami memperkirakan
fraksi pemilih yang mendukung gugatan pencaplokan menjadi 0,57?
9.54 Pabrikan pemutar MP3 melakukan set tes komprehensif pada fungsi
listriknya produk. Semua pemutar MP3 harus lulus semua tes
sebelum sedang dijual. Dari sampel acak 500 pemutar MP3, 15 gagal
satu atau lebih tes. Temukan interval kepercayaan 90% untuk
proporsi pemutar MP3 dari populasi yang lulus semua tes.
9.55 Sistem peluncuran roket baru sedang dipertimbangkan untuk
penyebaran roket jarak dekat kecil. Itu pengait sistem yang ada = 0,8
sebagai probabilitas peluncuran yang sukses. Sampel 40 peluncuran
percobaan dibuat dengan sistem baru, dan 34 berhasil.
(a) Bangun forp interval kepercayaan 95%.
(b) Apakah Anda menyimpulkan bahwa sistem baru lebih baik?
9.56 Seorang ahli genetika tertarik dengan proporsi Laki-laki Afrika yang
memiliki kelainan darah minor tertentu. Dalam sampel acak 100
laki-laki Afrika, 24 adalah ditemukan menderita.
(a) Hitung interval kepercayaan 99% untuk proporsi pria Afrika yang
memiliki kelainan darah ini.
(b) Apa yang bisa kita nyatakan dengan 99% kepercayaan tentang
kemungkinan ukuran kesalahan kita jika kita memperkirakan
proporsi laki-laki Afrika dengan kelainan darah ini 0,24?
9.57 (a) Menurut sebuah laporan di theRoanoke Times & World-News,
sekitar 2/3 dari 1600 orang dewasa disurvei melalui telepon
mengatakan mereka pikir program pesawat ulang-alik adalah
investasi yang baik untuk negara. Temukan interval kepercayaan
95% untuk proporsi Orang dewasa Amerika yang menganggap
program pesawat ulang-alik adalah investasi yang bagus untuk
negara ini.
(b) Apa yang bisa kita nyatakan dengan kepercayaan 95% tentang
kemungkinan ukuran kesalahan kami jika kami memperkirakan
proporsi orang dewasa Amerika yang memikirkan pesawat ulang-
alik Program investasi yang bagus menjadi 2/3?
9.58 Dalam artikel surat kabar yang disebut dalam Latihan 9,57, 32% dari
1600 orang dewasa yang disurvei mengatakan ruang AS Program
harus menekankan eksplorasi ilmiah. Bagaimana besar sampel orang
dewasa diperlukan untuk polling jika ada ingin menjadi 95% yakin
bahwa persentase yang diperkirakan akan berada dalam 2% dari
persentase yang sebenarnya?
9.59 Seberapa besar sampel dibutuhkan jika kita menginginkannya 96%
yakin bahwa proporsi sampel kami dalam Latihan 9,53 akan berada
dalam 0,02 dari fraksi sebenarnya dari populasi pemilih?
9.60 Seberapa besar sampel dibutuhkan jika kita mau 99% yakin bahwa
proporsi sampel kami dalam Latihan 9,51 akan berada dalam 0,05
dari proporsi rumah yang sebenarnya di kota yang dipanaskan oleh
minyak?
9.61 Seberapa besar sampel yang dibutuhkan dalam Latihan 9.52 jika kami
ingin menjadi 98% yakin bahwa proporsi sampel kami akan berada
dalam 0,05 dari proporsi proporsi yang benar?
9.62 Dugaan oleh anggota fakultas di departemen mikrobiologi di
Washington University School Kedokteran Gigi di St Louis,
Missouri, menyatakan itu masing-masing dua cangkir teh hijau atau
oolong hari akan memberikan fluoride yang cukup untuk melindungi
gigi Anda dari pembusukan. Seberapa besar sampel dibutuhkan
untuk memperkirakan persentase penduduk di kota tertentu yang
mendukung memiliki air mereka berfluoride jika seseorang ingin
berada di Setidaknya 99% yakin bahwa estimasi tersebut dalam 1%
dari persentase yang benar?
9.63 Suatu penelitian harus dilakukan untuk memperkirakan persentase
warga di kota yang memilih memiliki air berfluoridasi. Seberapa
besar sampel diperlukan jika diinginkan untuk setidaknya 95% yakin
bahwa perkiraan tersebut ada di dalam 1% dari persentase
sebenarnya?
9.64 Suatu penelitian harus dilakukan untuk memperkirakan proporsi
penduduk kota tertentu dan daerah pinggirannya yang mendukung
pembangunan pembangkit listrik tenaga nuklir di dekat kota.
Seberapa besar sampel diperlukan jika seseorang mau setidaknya
95% yakin bahwa estimasi tersebut ada di dalam 0,04 dari proporsi
sebenarnya penduduk yang mendukung pembangunan pembangkit
listrik tenaga nuklir?
9.65 Seorang ahli genetika tertentu tertarik pada proporsi pria dan wanita
dalam populasi yang memiliki kelainan darah minor. Dalam sampel
acak 1000 laki-laki, 250 ditemukan menderita, sedangkan 275 dari
1000 wanita yang diuji tampaknya memiliki kelainan tersebut.
Hitung interval kepercayaan 95% untuk perbedaan antara proporsi
pria dan wanita yang memiliki gangguan darah.
9.66 Sepuluh sekolah teknik di Amerika Serikat disurvei. Sampel berisi
250 listrik insinyur, 80 menjadi perempuan; 175 insinyur kimia, 40
menjadi wanita. Hitung interval kepercayaan 90% untuk perbedaan
antara proporsi wanita di Indonesia dua bidang teknik ini. Apakah
ada yang signifikan? perbedaan antara dua proporsi?
9.67 Uji klinis dilakukan untuk menentukan apakah a jenis inokulasi
tertentu memiliki efek pada kejadian penyakit tertentu. Sampel 1000
tikus itu disimpan dalam lingkungan yang terkendali untuk periode 1
tahun, dan 500 tikus diberi inokulasi. Dalam kelompok tidak
diinokulasi, ada 120 insiden penyakit, sedangkan 98 tikus dalam
kelompok yang diinokulasi mengontraknya. Ifp1 adalah probabilitas
kejadian penyakit pada tikus yang tidak diinokulasi dan
kemungkinannya kejadian pada tikus yang diinokulasi, hitung
interval kepercayaan 90% untuk p1 − p2.
9.68 Dalam studi Perkecambahan dan Kemunculan Brokoli, dilakukan
oleh Departemen Hortikultura di Virginia Tech, seorang peneliti
menemukan bahwa pada 5◦C, 10 biji brokoli dari 20 yang
berkecambah, sedangkan pada umur 15◦C, 15 dari 20 yang
berkecambah. Hitung interval kepercayaan 95% untuk perbedaan
antara proporsi perkecambahan pada dua suhu yang berbeda dan
putuskan jika ada perbedaan yang signifikan.
9,69 Survei terhadap 1.000 siswa menemukan bahwa 274 memilih tim
baseball profesional adalah tim favorit mereka. Disurvei serupa
melibatkan 760 siswa, 240 di antaranya pilih teamAas favorit
mereka. Hitung interval kepercayaan 95% untuk perbedaan antara
proporsi siswa yang menyukai tim. Dalam dua survei. Apakah ada
perbedaan yang signifikan?
9.70 Menurut USA Today (17 Maret 1997), wanita terdiri 33,7% dari staf
editorial di lokal Stasiun TV di Amerika Serikat pada tahun 1990
dan 36,2% pada tahun 1994. Anggaplah 20 karyawan baru
dipekerjakan sebagai editorial staf.
(a) Perkirakan jumlah yang akan menjadi wanita masing-masing
pada tahun 1990 dan 1994.
(B) Hitung interval kepercayaan 95% untuk melihat apakah ada
adalah bukti bahwa proporsi perempuan dipekerjakan sebagai staf
editorial lebih tinggi pada tahun 1994 dibandingkan tahun 1990.

Anda mungkin juga menyukai