Anda di halaman 1dari 19

SAMPLING DISTRIBUSI

2.1 INTRODUCTION SAMPLING

KATA PENGHANTAR

Pokok pembahasan di BAB distribusi sampling ini ada poin-poin penting yang dibahas.
BAB I memperkenalkan tentang beberapa kosakata statika dasar dan berguna dan membahas
konsep dasar pengumpulan data. Pada BAB II organisasi dan summarization data
ditekankan. Di sinilah kita menemukan konsep kecenderungan dan penyebaran sentral dan
mempelajari bagaimana menghitung ukuran deskriptif.

Pada BAB III kita diperkenalkan pada gagasan dasar probabilitas, dan pada BAB IV kita
mempertimbangkan konsep distribusi probabilitas. Konsep-konsep ini sangat penting untuk
memahami inferensi statistik, topik yang terdiri dari bagian utama buku ini.

Bab ini berfungsi sebagai jembatan antara materi sebelumnya, yang pada dasarnya
bersifat deskriptif, dan sebagian besar topik yang tersisa, yang telah dipilih dari wilayah
inferensi statistik.

2.1 SAMPLING DISTRIBUSI

Distribusi sampel menggunakan dua tujuan:

1. memungkinkan kita menjawab pertanyaan probabilitas tentang statistik sampel


2. teori yang diperlukan untuk membuat prosedur inferensi statistik valid.

statistik sampel adalah ukuran deskriptif, seperti mean, median, varians, atau standar
deviasi, yang dihitung dari data sampel. Pada bab berikut, kita akan melihat bagaimana
distribusi sampling membuat kesimpulan statistik valid.

Distribusi Sampling: Distribusi Sampling Konstruksi dapat dibangun secara empiris


saat pengambilan sampel dari populasi diskrit dan terbatas. Untuk membangun distribusi
sampling kita lanjutkan sebagai berikut:

1. Dari populasi ukuran N yang terbatas, secara acak gambarlah semua ukuran sampel
yang mungkin n.

2. Hitunglah statistik yang menarik untuk setiap sampel.


3. Buat daftar dalam satu kolom dengan berbagai nilai statistik yang berbeda, dan di
kolom lain tuliskan frekuensi terjadinya masing-masing nilai statistik pengamatan
yang berbeda.

Konstruksi distribusi sampling yang sebenarnya adalah usaha yang hebat jika populasi
memiliki ukuran yang cukup besar dan merupakan tugas yang tidak mungkin jika populasi
tidak terbatas. Dalam kasus tersebut, distribusi sampling dapat diperkirakan dengan
mengambil sejumlah besar sampel dengan ukuran tertentu.

Sampling Distributions: Karakteristik Penting Kami biasanya tertarik untuk mengetahui


tiga hal tentang distribusi sampling yang diberikan: mean, varians, dan bentuk fungsinya.

Kita dapat mengenali kesulitan dalam membangun distribusi sampling sesuai dengan
langkah-langkah yang diberikan di atas ketika populasinya besar. Kami juga mengalami
masalah saat mempertimbangkan pembangunan distribusi sampling saat populasi tidak
terbatas. Yang terbaik yang dapat kita lakukan secara eksperimental dalam kasus ini adalah
mendekati distribusi Kedua masalah ini dapat dihindarkan dengan cara matematika.
Meskipun prosedur yang terlibat tidak sesuai dengan tingkat matematis teks ini, distribusi
sampling dapat diturunkan secara matematis. Pembaca yang tertarik dapat berkonsultasi
dengan salah satu dari banyak buku teks statistik matematika, misalnya Larsen dan Marx (1)
atau Rice (2). Pada bagian berikut, beberapa distribusi sampling yang sering ditemui dibahas.

2.3 DISTRIBUSI MEAN SAMPEL

Distribusi sampling yang penting adalah distribusi mean sampel. Mari kita lihat bagaimana
kita bisa membangun distribusi sampling dengan mengikuti langkah-langkah yang diuraikan
di bagian sebelumnya.

CONTOH 5.3.1
Misalkan kita memiliki populasi dengan ukuran N = 5, terdiri dari usia lima anak yang
merupakan pasien rawat jalan di puskesmas. Usia adalah sebagai berikut:

x1 = 6; x2 = 8; x3 = 10; x4 = 12, and x5 = 14. Artinya, µ, dari populasi ini sama dengan
∑ xi/N = 10 dan variasi nya adalah:

∑( xi−µ) ² 40
Ơ² = = =8
N 5
Mari kita hitung ukuran lain dari dispersi dan tentukan dengan modal S sebagai berikut:

 
∑( xi−µ) ² 40
S² = = = 10
4 4
 

Kami akan merujuk ke kuantitas ini lagi di bab berikutnya. Kami ingin membuat distribusi
sampling dari mean sampel, x́, berdasarkan sampel dengan ukuran n = 2 yang diambil dari
populasi ini.

Solusi : Mari kita menggambarkan semua sampel berukuran n = 2 dari populasi ini. Sampel
ini, bersama dengan mean nya, ditunjukkan pada Tabel 5.3.1.

TABEL 5.3.1 Semua kemungkinan sampel dengan ukuran n = 2 dari populasi ukuran
N = 5. sampel di atas atau bawah hasil diagonal utama bila sampling tanpa
penggantian. Sampel mean berada dalam tanda kurung

Second Draw

6 8 10 12 14

6 6, 6 6, 8 6, 10 6, 12 6, 14
(6) (7) (8) (9) (10)
8, 6 8, 8 8,10 8, 12 8, 14
8 (7) (8) (9) (10) (11)
10, 6 10, 8 10,10 10, 12 10, 14
First Draw 10 (8) (9) (10) (11) (12)
12, 6 12, 8 12, 10 12, 12 12, 14
12 (9) (10) (11) (12) (13)
14, 6 14, 8 14, 10 14, 12 14, 14
14 (10) (11) (12) (13) (14)
TABEL 5.3.2 Distribusi sampling dihitung dari sampel dalam tabel 5.3.1

¯x Frekuensi Frekuensi Relatif

6 1 1/25
7 2 2/25
8 3 3/25
9 4 4/25
10 5 5/25
11 4 4/25
12 3 3/25
13 2 2/25
14 1 1/25
Total 25 25/25

Kita lihat dalam contoh ini bahwa, ketika pengambilan sampel dilakukan dengan
penggantian, ada 25 sampel yang mungkin. Secara umum, ketika pengambilan sampel
dilakukan dengan penggantian, jumlah sampel yang mungkin sama dengan N n.

Kita dapat membuat distribusi sampling x́ dengan mencantumkan berbagai nilai x́ dalam satu
kolom dan frekuensi kejadiannya di bidang lainnya, seperti pada Tabel 5.3.2.

Kita melihat bahwa data pada Tabel 5.3.2 memenuhi persyaratan untuk distribusi
probabilitas. Probabilitas individu lebih besar dari 0, dan jumlahnya sama dengan 1.
Gambar 5.3.1 Distribusi populasi dan distribusi sampling dari x́

Dikatakan sebelumnya bahwa kita biasanya tertarik pada fungsi distribusi sampling, mean,
dan variansnya. Sekarang kita mempertimbangkan karakteristik ini untuk distribusi sampling
dari mean sampel, x́.

2.11 Distribusi Sampling dari x́: Bentuk Fungsional


Mari kita lihat distribusi x́diplot sebagai histogram, bersamaan dengan distribusi
populasi, yang keduanya ditunjukkan pada Gambar 5.3.1. Kita mencatat perbedaan radikal
dalam penampilan antara histogram populasi dan histogram distribusi sampling dari x́.
Sedangkan yang terdistribusi secara merata, yang terakhir berangsur naik ke puncak dan
kemudian turun dengan simetri sempurna.
2.12 Distribusi Sampling dari x́: Mean

Sekarang mari kita hitung mean, yang akan kita sebut µ x́ , dari distribusi sampling
kita. Untuk melakukan ini, kita menambahkan 25 mean sampel dan membagi dengan 25.
Dengan demikian,
∑ xi 6+7+7+ 8+…+14 250
µx́ = = = = 10
Nn 25 25
Kita mencatat bahwa rata-rata distribusi sampling x́ memiliki nilai yang sama dengan rata-
rata populasi asli.
a. Distribusi Sampling dari x́: Varians
Akhirnya, kita bisa menghitung varians x́, yang kita sebutƠ 2x sebagai berikut:

(∑ x́ i−µ x́)²
Ơ 2x́ =
Nn
( 6−10 )2+ ( 7−10 )2 + ( 7−10 )2+ …+(14−10) ²
=
25
100
= =4
25

Kita mencatat bahwa varians dari distribusi sampling tidak sama dengan varians populasi.
Namun, menarik untuk diamati, bagaimanapun, varians distribusi sampling sama dengan
varians populasi dibagi dengan ukuran sampel yang digunakan untuk mendapatkan distribusi
sampling. Itu adalah,
Ơ² 8
Ơ 2x́ = = =4
n 2

2
Akar kuadrat dari varians distribusi sampling, √Ơ x́ = Ơ/ √ nadalah kesalahan standar rata-
rata atau, hanya, kesalahan standar.
Hasil ini bukan kebetulan tapi contoh karakteristik distribusi sampling pada umumnya, ketika
pengambilan sampel dilakukan dengan penggantian atau bila pengambilan sampel berasal
dari populasi tak terbatas. Untuk menggeneralisasi, kita membedakan antara dua situasi:
sampling dari populasi yang terdistribusi secara normal dan sampling dari populasi yang
tidak terdistribusi secara tidak normal.
b. Distribusi Sampling dari x́: Sampling Dari Distribusi Populasi Normal
Ketika pengambilan sampel berasal dari populasi yang terdistribusi normal, distribusi
mean sampel akan memiliki sifat berikut:
1. Distribusi dari x́ akan normal.
2. Mean, µx́, dari distribusi x́ akan sama dengan mean populasi dari mana sampel diambil.
3. Varians, Ơ 2x́ dari distribusi x́ akan sama dengan varians populasi dibagi dengan sampel.

Pengambilan Sampling Dari Populasi Terdistribusi Nonnormal


Untuk kasus pengambilan sampel dari populasi yang tidak terdistribusi secara normal, kita
mengacu pada teorema matematis penting yang dikenal sebagai teorema batas pusat.
Pentingnya teorema ini dalam inferensi statistik dapat dirangkum dalam pernyataan berikut.

Teorema Batas Tengah


Populasi suatu bentuk fungsional nonnormal dengan mean µ dan varians terbatas Ơ²,
distribusi sampling dari x́, dihitung dari sampel dengan ukuran n dari populasi ini, akan
memiliki mean µ dan varians Ơ²/n dan akan mendekati distribusi normal ketika ukuran
sampelnya besar.

Perumusan matematis dari teorema batas pusat adalah distribusi dari

x́ - µ
Ơ/√ n

mendekati distribusi normal dengan mean 0 dan varians 1 sebagai n → ∞. Perhatikan bahwa
teorema batas pusat memungkinkan sampel dari populasi yang tidak terdistribusi secara
normal dengan jaminan kira-kira hasil yang sama seperti yang akan diperoleh jika populasi
didistribusikan secara normal asalkan kita mengambil sampel yang besar.
Pentingnya ini akan menjadi jelas ketika kita mengetahui bahwa distribusi sampling
yang terdistribusi secara normal adalah alat yang hebat dalam inferensi statistik. Dalam kasus
mean sampel, kita yakin sekurang-kurangnya distribusi sampling yang kira-kira terdistribusi
normal di bawah tiga kondisi: (1) saat pengambilan sampel berasal dari populasi yang
terdistribusi normal; (2) ketika pengambilan sampel berasal dari populasi yang tidak
terdistribusi secara normal dan sampel berukuran besar; dan (3) ketika sampling berasal dari
populasi yang bentuk fungsinya tidak kita ketahui asalkan ukuran sampel kita besar.
Pertanyaan logis yang muncul pada saat ini adalah, Seberapa besar sampel harus
sesuai dengan teorema batas pusat untuk diterapkan? Tidak ada jawaban, karena ukuran
sampel yang dibutuhkan bergantung pada tingkat ketidaknormalan yang ada pada populasi.
Satu aturan praktis menyatakan bahwa, dalam situasi yang paling praktis, sampel dengan
ukuran 30 cukup memuaskan. Secara umum, perkiraan normalitas distribusi sampling x́
menjadi lebih baik dan lebih baik karena ukuran sampel meningkat.

Pengambilan Sampel Tanpa Penggantian


Hasil di atas telah diberikan dengan asumsi bahwa pengambilan sampel dilakukan
dengan penggantian atau sampel diambil dari populasi tak terbatas. Secara umum, kita tidak
melakukan sampel dengan penggantian, dan dalam situasi yang paling praktis diperlukan
sampel dari populasi yang terbatas; Oleh karena itu, kita perlu menjadi terbiasa dengan
perilaku distribusi sampling dari mean sampel dalam kondisi ini. Sebelum membuat
pernyataan umum, mari kita lihat kembali data pada Tabel 5.3.1. Sampel berarti hasil ketika
sampling tanpa penggantian adalah di atas diagonal utama, yang sama dengan yang di bawah
diagonal utama, jika kita mengabaikan urutan pengamatan. Kita melihat ada 10
kemungkinan sampel. Secara umum, ketika menggambar sampel dengan ukuran n dari
populasi berukuran terbatas N tanpa penggantian, dan mengabaikan urutan nilai sampel
diambil, jumlah sampel yang mungkin diberikan oleh kombinasi dari N yang diambil n setiap
kalinya. Dalam contoh kita sekarang kita miliki
N! 5! 5.4 .3!
ᶰCⁿ = = = = 10 contoh yang mungkin
n ! ( N −n ) ! 2! 3 ! 2!3!

Rata-rata dari 10 mean sampel adalah

µ x́ =
∑ x́ i =¿ 7+8+ 9+ …+13 = 100
ᶰCⁿ 10 10 = 10

Kita melihat bahwa sekali lagi mean dari distribusi sampling sama dengan mean populasi.
µx Variasi dari distribusi sampling ini ditemukan

Ơ 2x = =
∑ ( x́ i−µ x ) ² =¿ CC = 3
ᶰCⁿ

  

dan kita perhatikan bahwa saat ini varians dari distribusi sampling tidak sama dengan varians
populasi dibagi dengan ukuran sampel, karena Ơ 2x = 3 ≠ 8/2 = 4. Namun ada hubungan
menarik yang kita temukan dengan mengalikan Ơ²/n oleh (N – n)/ (N – 1). Itu adalah,

Ơ ² N −n 8 5−2
· = · =3
n N−1 2 4
Hasil ini memberitahu kita bahwa jika kita mengalikan varians dari distribusi sampling yang
diperoleh dari pengambilan sampel dengan penggantian, dengan faktor (N – n) / (N – 1),
kita memperoleh nilai variansi dari distribusi sampling yang dihasilkan saat pengambilan
sampel adalah tanpa penggantian. Kita dapat menggeneralisasi hasil ini dengan pernyataan
berikut.
Bila pengambilan sampel tanpa penggantian dari populasi yang terbatas, distribusi
sampling x́akan memiliki mean µ dan varians
 
Ơ ² N −n
Ơ 2x́ = ·
n N−1

Jika ukuran sampelnya besar, teorema batas pusat berlaku dan distribusi sampling x́ akan
mendekati distribusi normal.

Koreksi Populasi Yang Terbatas


Faktor (N – n)/ (N – 1) disebut koreksi populasi yang terbatas dan dapat diabaikan bila
ukuran sampel kecil dibandingkan dengan ukuran populasi. Bila populasi jauh lebih besar
dari pada sampel, perbedaan antara Ơ ²/¿n dan ¿/ n)[(N – n)/(N – 1)] akan diabaikan.
Bayangkan sebuah populasi dengan ukuran 10. 000 dan sampel dari populasi berukuran 25;
koreksi populasi yang terbatas akan sama dengan (10.000 – 25)/ (9999) = .9976. Untuk
mengalikan Ơ ²/ n dengan .9976 adalah hampir sama dengan mengalikannya dengan 1.
Kebanyakan ahli statistik berlatih tidak menggunakan koreksi populasi yang terbatas kecuali
sampel lebih dari 5 persen dari ukuran populasi. Artinya, koreksi populasi yang terbatas
biasanya diabaikan saat n/N ≤ .05.

Distribusi Sampling dari x́: Ringkasan


Mari kita ringkaskan karakteristik distribusi sampling x́ dalam dua kondisi.
1. Sampling berasal dari populasi terdistribusi normal dengan varians populasi yang
diketahui:
a) µx́ = µ
b) Ơ x́ = Ơ /√ n
c) Distribusi sampling dari x́ adalah normal.

2. Sampling berasal dari populasi yang tidak terdistribusi secara normal dengan varians
populasi yang diketahui:
a) µx́ = µ
b) Ơ x́ = Ơ /√ n, ketika n/N ≤ .05

Ơ x́ = ¿/√ n) √ N −n
N−1
c) Distribusi sampling dari x́ adalah kira kira normal.

Aplikasi
Seperti yang akan kita lihat di bab-bab selanjutnya, pengetahuan dan pemahaman tentang
distribusi sampling akan diperlukan untuk memahami konsep inferensi statistik. Penerapan
pengetahuan kita yang paling sederhana tentang distribusi sampling mean sampel adalah
menghitung probabilitas untuk mendapatkan sampel dengan rata-rata dari beberapa besaran
tertentu. Mari kita gambarkan dengan beberapa contoh.

CONTOH 5.3.2
Misalkan diketahui bahwa dalam populasi besar, panjang tengkorak biasanya terdistribusi
normal dengan mean 185,6 mm dan standar deviasi 12,7 mm. Berapakah probabilitas bahwa
sampel acak berukuran 10 dari populasi ini akan memiliki mean lebih besar dari 190?

Solusi
Kita tahu bahwa sampel tunggal yang sedang dipertimbangkan adalah salah satu
dari semua sampel ukuran 10 yang mungkin dapat diambil dari populasi, sehingga rata-rata
yang dihasilkannya adalah salah satu dari x́ yang merupakan distribusi sampling darix́, yang
secara teoritis , bisa berasal dari populasi ini.
Ketika kita mengatakan bahwa populasi yang kira-kira distribusikan, kita asumsikan
bahwa distribusi sampling x́akan didistribusikan secara normal. Kita juga tahu bahwa mean
( 12.7 )2
dan standar deviasi dari distribusi sampling sama dengan 185.6 dan
√ 10
= 12.7/ √ 10 =

4.0161, Kita berasumsi bahwa populasi besar relatif terhadap sampel sehingga koreksi
populasi yang terbatas dapat diabaikan.
Kita belajar di Bab 4 bahwa setiap kali kita memiliki variabel acak yang
terdistribusi normal, kita dapat dengan mudah mengubahnya menjadi distribusi standar
normal. Variabel acak kita sekarang adalah x́, rata-rata distribusinya adalah µ x́, dan standar
deviasinya adalah Ơ x́ = Ơ /√ n. Dengan memodifikasi secara tepat formula yang diberikan
sebelumnya, kita sampai pada rumus berikut untuk mengubah distribusi normal dari x́ ke
distribusi normal standar:
 
x́−µ x́
Z= (5.3.1)
Ơ /√n

Probabilitas yang menjawab pertanyaan kita diwakili oleh area di sebelah kanan x́=¿190 di
bawah kurva distribusi sampling. Daerah ini sama dengan luas di sebelah kanan dari :

190−185.6 4.4
Z= = = 1.10
4.0161 4.0161
GAMBAR 5.3.2 Distribusi populasi, distribusi sampling, dan distribusi normal standar,
Contoh 5.3.2: (a) distribusi populasi; (b) distribusi sampling dari x́untuk sampel berukuran
10; (c) distribusi normal standar.

Dengan melihat tabel normal standar, kita menemukan bahwa area di sebelah kanan 1.10
adalah 1.357; Oleh karena itu, kita mengatakan bahwa probabilitasnya adalah 1.357 bahwa
sampel berukuran 10 akan memiliki mean lebih besar dari 190.
Gambar 5.3.2 menunjukkan hubungan antara populasi asli, distribusi sampling ¯x
dan distribusi normal standar.

CONTOH 5.3.3
Jika rata-rata dan standar deviasi nilai besi serum untuk pria sehat masing-masing adalah 120
dan 15 mikrogram per 100 ml, berapakah probabilitas bahwa sampel acak dari 50 pria normal
akan menghasilkan rata-rata antara 115 dan 125 mikrogram per 100 ml?
Solusi
Bentuk fungsional populasi nilai besi serum tidak ditentukan, namun karena kita memiliki
ukuran sampel lebih besar dari 30, kita menggunakan batas pusat teorema dan kira-kira
distribusi sampling normal dari x́( dimana memiliki mean 120 dan standar deviasi 15/√ 50 =
2.1213 untuk standar normal. Probability nya adalah :

115−120 125−120
P(115 ≤ x́ ≤ 125) = P ( ≤z≤ )
2.12 2.12
= P (-2.36 ≤ z ≤ 2.36)
= .9909 - .0091
= .9818

2.5 DISTRIBUTION OF THE SAMPLE PROPORTION


Pada bagian sebelumnya kita telah membahas distribusi statistik samplingdihitung dari
variabel terukur. Kami sering tertarik, namun, dalam pengambilan sampeldistribusi statistik,
seperti proporsi sampel, yang dihasilkan dari hitungan atau frekuensidata.
CONTOH
Hasil [A-3] dari Survei Kesehatan dan Gizi Nasional 2009-2010
(NHANES), menunjukkan bahwa 35,7 persen orang dewasa A.S. berusia 20 ke atas
mengalami obesitas (obesitas sebagaididefinisikan dengan indeks massa tubuh lebih besar
dari atau sama dengan 30,0). Kami menunjuk populasi iniproporsi sebagai p ¼: 357. Jika kita
memilih secara acak 150 orang dari populasi ini, apa adanyaprobabilitas bahwa proporsi
sampel yang mengalami obesitas akan sama besar dengan 0,40?

Solusi: Untuk menjawab pertanyaan ini, kita perlu mengetahui sifat-sifat samplingdistribusi
proporsi sampel. Kami akan menunjuk proporsi sampeldengan simbol ^ p.Anda akan
mengenali kesamaan antara contoh ini dan itu
disajikan pada Bagian 4.3, yang membahas distribusi binomial. ItuVariabel obesitas adalah
variabel dikotomis,karena individu dapat diklasifikasikanmenjadi satu atau dua kategori yang
saling eksklusif: obesitas atau tidak
gendut. Pada Bagian 4.3, kami diberi informasi serupa dan diminta untuk melakukannyacari
nomor dengankarakteristik yang menarik, sedangkan kita ada di sinimencari proporsi dalam
sampel yang memiliki karakteristik minat.Kita bisa dengan tabel kemungkinan binomial yang
cukup besar, sepertiTabel B, tentukan probabilitas yang terkait dengan angka yang
sesuaidengan proporsi bunga. Seperti yang akan kita lihat, ini tidak perlu, karenaAda
prosedur alternatif yang tersedia, bila ukuran sampelnya besar, yaituumumnya lebih nyaman
Distribusi Sampling ^ p: Konstruksi
Distribusi sampling dariproporsi sampel akan dibangun secara eksperimental dengan cara
yang persis sama sepertidisarankan dalam hal mean aritmetika dan perbedaan antara dua
mean.Dari populasi, yang kita asumsikan terbatas, kita akan mengambil semua sampel yang
mungkindari ukuran tertentu dan untuk setiap sampel hitung proporsi sampel, ^ p. Kami akan
kemudiansiapkan distribusi frekuensi ^ p dengan mencantumkan berbagai nilai yang berbeda
dari pdengan frekuensi kejadiannya. Distribusi frekuensi ini (dan jugadistribusi frekuensi
relatif yang sesuai) akan merupakan distribusi samplingdari hal.

Distribusi Sampling ^ p: Karakteristik


Bila ukuran sampelBesar, distribusi proporsi sampel kira-kira terdistribusi normalberdasarkan
teorem batas pusat. Mean dari distribusi, m ^ p, yaitu,Rata-rata dari semua proporsi sampel
yang mungkin, akan sama dengan populasi sebenarnyaproporsi, p, dan varians dari distribusi,
s2 ^p, akan sama dengan p(1- p)/ n ataupq/n, dimana q =1-p. Untuk menjawab pertanyaan
probabilitas tentang p, maka, kita menggunakanrumus berikut:

Pertanyaan yang sekarang muncul adalah, Seberapa besar ukuran sampel yang harus
digunakandari perkiraannormal untuk menjadi valid? Kriteria yang banyak digunakan adalah
np dann(1-p) harus lebih besar dari 5, dan kita akan mematuhi peraturan itu dalam teks ini.
Kita sekarang berada dalam posisi untuk menjawab pertanyaan tentang obesitas
dalam sampel150 individu dari populasi di mana 35,7 persen mengalami obesitas. Karena
keduanya np danN(1-p) lebih besar dari 5(150x 357 = 53: 6 dan 150x643 = 96.5), dapat kita
katakan bahwa, dalamKasus ini, kira-kira terdistribusi normal dengan mean m ^ p; = p = 357
dans2 ^ = p(1- p)/n=(.357)x( 643)/ 150 = 00153. Probabilitas yang kita cari adalah area di
bawahkurva p yang ada di sebelah kanan 0,40. Daerah ini sama dengan daerah di bawah
standarkurva normal di sebelah kanan Transformasi ke standar distribusi normal telah
dilakukan dengan cara biasa. Nilai z ditemukan dengan membagi selisih antara nilai statistik
dan meannya dengan standar error statistik. Dengan menggunakan Tabel D kita menemukan
bahwa daerah di sebelah kanan z = 1.10 adalah 1 -. 8643 =.1357. Oleh karena itu, kita dapat
mengatakan bahwa probabilitas untuk mengamati p >40 dalam sampel acak dengan ukuran n
=150 dari populasi di mana p =. 357 adalah 0,1357.
Koreksi untuk Kontinuitas
Pendekatan normal dapat diperbaiki dengan menggunakan koreksi untuk kontinuitas,
perangkat yang membuat penyesuaian untuk fakta bahwa distribusi diskrit didekati dengan
distribusi kontinyu. Misalkan kita membiarkan x = np, jumlah sampel dengan karakteristik
yang menarik bila proporsinya adalah p. Untuk menerapkan koreksi kontinuitas, kita
menghitungnya
dimana q = 1 - p. Koreksi untuk kontinuitas tidak akan membuat banyak perbedaan ketika n
besar. Dalam contoh di atas np = 150(. 4)= 60, dan
dan P(p>. 40)= 1 – 8461 = . 1539, hasilnya tidak jauh berbeda dengan yang diperoleh tanpa
adanya kointegrasi untuk penyesuaian. Penyesuaian ini tidak sering dilakukan dengan tangan,
karena kebanyakan program komputer statistik secara otomatis menerapkan koreksi
kontinuitas yang sesuai bila diperlukan.
Contoh :
Blanche Mikhail [A-4] mempelajari penggunaan perawatan prenatal di antara perempuan
Afrika-Amerika berpenghasilan rendah. Dia menemukan bahwa hanya 51 persen dari wanita
ini memiliki asuhan prenatal yang memadai. Mari kita berasumsi bahwa untuk populasi
perempuan Afrika-Amerika berpenghasilan rendah yang serupa, 51 persen memiliki asuhan
prenatal yang memadai. Jika 200 wanita dari populasi ini ditarik secara acak, berapakah
probabilitas bahwa kurang dari 45 persen akan menerima asuhan prenatal yang memadai?
Solusi: Kita dapat mengasumsikan bahwa distribusi sampling p adalah kira-kira terdistribusi
normal dengan mp =. 51 dan s ^ p =(. 51)( 49)/200 =. 00125. Kami menghitung
Daerah di sebelah kiri -1.70 di bawah kurva normal standar adalah .0446. Oleh karena itu,
P(p<. 45) = P(z< -1. 70) = .0446.

2.6 DISTRIBUSI PERBEDAAN ANTARA DUA PROPORSI SAMPEL

Seringkali ada dua proporsi populasi dimana kita tertarik dan menginginkannya menilai
probabilitas yang terkait dengan perbedaan proporsi yang dihitung dari sampel diambil dari
masing-masing populasi ini. Distribusi sampling yang relevan adalah distribusi dari
perbedaan antara dua proporsi sampel.

Distribusi Sampling dari p̂1_ p̂2: Karakteristik Karakteristik dari distribusi sampling ini dapat
diringkas sebagai berikut:

Jika sampel acak independen dengan ukuran n1 dan n2 diambil dari dua populasi dari
variabel dikotomis dimana proporsi pengamatan dengan karakteristik minat pada kedua
populasi masing-masing adalah p1 dan p2, distribusi dari perbedaan antara proporsi sampel,
p̂1_ p̂2: kira-kira normal dengan mean

µ p̂1_ p̂2 = p1 – p2
dan varians

ketika n1 dan n2 besar.

Kami menganggap n1 dan n2 cukup besar ketika n1p1, n2p2, n1 (1-p1) dan n2 (1-p1)
semuanya lebih besar dari 5.

Distribusi Sampling dari p̂1_ p̂2 :

Konstruksi Untuk menyusun secara fisik distribusi sampling dari perbedaan antara
dua proporsi sampel, kita akan dilanjutkan dengan cara yang dijelaskan pada Bagian 5.4
untuk pembuatan sampling distribusi perbedaan antara dua sarana.

Dengan dua populasi yang cukup kecil, orang akan menggambar, dari populasi 1,
semua kemungkinan sampel acak sederhana dengan ukuran n1 dan menghitung, dari setiap
kumpulan data sampel, proporsi sampel p̂1. Dari populasi 2, satu akan menarik secara
independen semua kemungkinan sampel acak sederhana dengan ukuran n2 dan menghitung,
untuk setiap kumpulan data sampel, sampel proporsi p̂2. Seseorang akan menghitung
perbedaan antara semua kemungkinan pasangan sampel proporsi, di mana satu nomor
masing-masing pasangan adalah nilai p̂2 dan yang lainnya bernilai p̂2. Distribusi sampling
dari perbedaan antara proporsi sampel, kemudian, akan terdiri dari semua perbedaan yang
berbeda, disertai dengan frekuensi (atau relatif frekuensi) terjadinya. Untuk populasi terbatas
atau tak terbatas, kita bisa memperkirakannya Distribusi sampling perbedaan antara proporsi
sampel dengan gambar yang besar jumlah sampel acak sederhana yang sederhana dan
melanjutkan dengan cara yang adil dijelaskan.

Untuk menjawab pertanyaan probabilitas tentang perbedaan antara dua proporsi sampel,
maka, kita menggunakan rumus berikut:
CONTOH 5.6.1

Survei Wawancara Kesehatan Nasional 1999, yang dirilis pada tahun 2003 [A-7],
melaporkan hal itu 28 persen subjek mengidentifikasi diri sebagai orang kulit putih
mengatakan bahwa mereka telah mengalami penurunan sakit punggung selama tiga bulan
sebelum survei. Di antara subyek asal Hispanik, 21 persen melaporkan sakit punggung bagian
bawah. Mari kita asumsikan bahwa .28 dan 21 adalah proporsi untuk masing ras melaporkan
sakit punggung bawah di Amerika Serikat. Berapakah probabilitasnya sampel acak
independen dengan ukuran 100 yang diambil dari masing-masing populasi akan
menghasilkan nilai p̂1_ p̂2 sebesar 10.

Solusi: Kami berasumsi bahwa distribusi sampling dari p̂1_ p̂2 kira-kira normal dengan
mean.

m^1 _p2 ¼ :28 _ :21 ¼ :07

dan variance

Area yang sesuai dengan probabilitas yang kita cari adalah area di bawah kurva dari p̂ 1_ p̂2
di sebelah kanan 10. Transformasi ke distribusi normal standar memberi :
Meja Konsultasi D, kita temukan daerah di bawah kurva normal standar yang berada di
sebelah kanan z = 49 adalah 1 – 6879 = 3121. Probabilitas dari pengaruh perubahan .10,
maka, 3121.

CONTOH 5.6.2

Dalam Survei Wawancara Kesehatan Nasional 1999 [A-7], peneliti menemukan bahwa di
antara A.S. Orang dewasa berusia 75 tahun ke atas, 34 persen telah kehilangan semua gigi
alami mereka dan untuk orang dewasa A.S. usia dewasa 65-74, 26 persen telah kehilangan
semua gigi alami mereka. Asumsikan bahwa proporsi ini adalah parameter untuk Amerika
Serikat pada kelompok umur tersebut. Jika sampel acak 200 orang dewasa berabad-abad 65-
74 dan sampel acak independen dari 250 orang dewasa berusia 75 tahun atau lebih diambil.

Populasi ini, menemukan kemungkinan bahwa selisih persentase total gigi alami Kerugian
kurang dari 5 persen antara kedua populasi tersebut.

Solusi: Kami berasumsi bahwa distribusi sampling ^ p1? ^ p2 kira-kira normal. Perbedaan
rata-rata proporsi mereka yang kehilangan semua gigi mereka adalah

dan variance
area bunga di bawah kurva p1-p2 adalah bahwa di sebelah kiri 05 nilai z yang sesuai adalah

tabel konsultasi D kita temukan bahwa daerah di sebelah kiri z = - 70 adalah 0,2420.

Ringkasan

Bab ini berkaitan dengan distribusi sampling. Konsep distribusi sampling diperkenalkan, dan
distribusi sampling penting berikut ini tercakup:

1. Distribusi mean sampel tunggal.

2. Distribusi perbedaan antara dua sarana sampel. 3. Distribusi proporsi sampel.

4. Distribusi perbedaan antara dua proporsi sampel.

Memperketat pentingnya orang-orang yang percaya diri dan orang-orang yang tidak mampu
memahami mereka sebelum melanjutkan ke bab berikutnya.

Anda mungkin juga menyukai