Week ke - 7
SAMPLING DISTRIBUTIONS
Dalam bab ini, kita akan mempelajari tentang bagaimana rata-rata sampel (statistik) digunakan
untuk memperkirakan rata-rata populasi (parameter) dan bagaimana proporsi sampel (statistik)
digunakan untuk memperkirakan proporsi populasi (parameter).
Distribusi sampling dari adalah distribusi peluang dari semua nilai yang mungkin dari rata-rata
sampel.
Jika kita ambil sampel yang berbeda-beda dari populasi, akan dihasilkan rata-rata yang beragam.
Rata-rata sampel adalah penduga tidak bias karena rata-rata dari semua kemungkinan sampel
rata-rata sama dengan rata-rata populasi, (μ).
Contoh sederhana mengenai sifat tidak bias dari rata-rata sampel adalah sebagai berikut :
Misalkan suatu populasi terdiri dari 4 orang asisten yang diminta untuk melakukan update yan
sama ke suatu database sumber daya manusia. Jumlah kesalahan dari masing-masing asisten
adalah sebagai berikut:
Jika kita memilih 2 sampel asisten dengan pemulihan dari populasi tersebut, maka ada 16 sampel
yang mungkin (Nn = 42 = 16). Berikut adalah kemungkinan sampelnya:
rata-rata
sampel asisten error
sampel
1 1,1 3,3 3
2 1,2 3,2 2.5
3 1,3 3,1 2
4 1,4 3,4 3.5
5 2,1 2,3 2.5
6 2,2 2,2 2
7 2,3 2,1 1.5
8 2,4 2,4 3
9 3,1 1,3 2
10 3,2 1,2 1.5
11 3,3 1,1 1
12 3,4 1,4 2.5
13 4,1 4,3 3.5
14 4,2 4,2 3
15 4,3 4,1 2.5
16 4,4 4,4 4
Nilai standar deviasi dari semua kemungkinan rata-rata sampel disebut standard error dari rata-
rata, menyatakan bagaimana rata-rata sampel bervariasi dari sampel ke sampel.
Jika kita mengambil sampel dari populasi yang berdistribusi normal dengan rata-rata μ dan
standar deviasi σ, dengan ukuran sampel, n, maka distribusi sampling dari rata-rata juga
berdistribusi Normal dengan rata-rata dan standar deviasi
Contoh : Alat untuk mengisi box cereal di set untuk mengisi 368 gram per box. Dari
pengalaman sebelumnya diketahui bahwa isi box mengikuti distribusi Normal dengan standar
deviasi 15 gram. Jika dipilih 25 box cereal secara acak, berapa peluang rata-rata sampelnya
kurang dari 365 gram?
Jika sampel yang kita pilih berasal dari populasi yang tidak memiliki distribusi normal, maka
dapat Teorema Limit Pusat (Central Limit Theorem) akan sangat membantu dalam
mengidentifikasi bentuk distribusi sampling dari rata-rata sampel. Teorema Limit Pusat tersebut
adalah sebagai berikut:
Jika sampel acak sederhana dipilih dari suatu populasi dengan ukuran sampel cukup besar,
terlepas dari bentuk distribusi nilai-nilai individu dalam populasi, maka distribusi sampling dari
rata-rata sampel akan mendekati distribusi normal.
Berapa ukuran sampel yang cukup besar? Sebagai aturan umum, ahli statistik telah menemukan
bahwa untuk banyak distribusi populasi, ketika ukuran sampel setidaknya 30, maka distribusi
sampling rata-rata akan mendekati normal. Namun, Anda dapat menerapkan Teorema Limit
Pusat untuk ukuran sampel yang lebih kecil jika distribusi populasi berbentuk lonceng. Dalam
kasus di mana distribusi variabel sangat miring atau memiliki lebih dari satu modus, maka akan
diperlukan ukuran sampel yang lebih besar dari 30 untuk memastikan normalitas dalam distribusi
sampling rata-rata.
Gambar berikut menunjukkan bagaimana efek dari Teorema Limit Pusat untuk tiga jenis
populasi yang berbeda; setiap kolom mengacu pada salah satu populasi. Populasi I mengikuti
distribusi Normal. Populasi II sering disebut distribusi Uniform dan Populasi III berbentuk
seperti distribusi eksponensial. Baris 1 untuk sampel berukuran n =2, baris 2 untuk n=5, dan
baris 3 untuk n=30. Pada ukuran sampel = 2, kita melihat bahwa bentuk dari setiap distribusi
sampling berbeda dari bentuk distribusi populasi yang sesuai. Untuk ukuran sampel =5, kita
melihat bahwa bentuk distribusi sampling untuk populasi I dan II mulai terlihat mirip dengan
bentuk distribusi normal, dan pada ukuran sampel =30, bentuk semakin mirip dengan sebaran
normal.
Untuk variabel kategori yang memiliki dua kategori, seperti pelanggan menyukai merek A atau
pelanggan lebih suka merek B, misalnya kita tertarik pada proporsi pelanggan yang lebih
menyukai merek A.
Proporsi populasi, diberi simbol π, adalah proporsi item dengan karakteristik yang menjadi
perhatian dalam seluruh populasi. Proporsi sampel, diberi simbol oleh p, adalah proporsi item
dengan karakteristik yang menjadi perhatian dalam sampel. Proporsi sampel (statistik)
digunakan untuk memperkirakan proporsi populasi (parameter).
Proporsi Sample:
Nilai proporsi sampel, p, akan berada di antara 0 dan 1. Statistik p adalah penduga tidak bias dari
proporsi populasi (π).
Contoh: Diketahui bahwa proporsi populasi dari orang dewasa yamg menggunakan internet (π)
adalah 73%. Misalkan diambil contoh acak sebanyak 200 orang dewasa. Berapa peluang lebih
dari 80% orang dewasa menggunakan internet?
Sehingga, jika proporsi populasi 0.73, peluang bahwa 80% dari 200 orang dewasa menggunakan
internet adalah 1.29%.
1. Levine, D.M., Stephan, D. F., and Szabat, K. A. (2017). Statistics for Managers using
Microsoft Excel. 8th Ed. Global Edition Pearson Education. New Jersey. ISBN 13: 978-1-
292-15634-7. Chapter 7.
2. Anderson, David R., Sweeney, Dennis J., Williams, Thomas A. (2011). Statistics for
Business and Economics. 11th Ed. Cengage Learning. USA. ISBN 13: 978-0-324-78325-4.
Chapter 7.