Anda di halaman 1dari 10

LECTURE NOTES

Week ke - 7

SAMPLING DISTRIBUTIONS

COMP6334 - Probability and Statistics


LEARNING OUTCOMES
LO1: Explain the data and statistics (data, variables, sample, population)
LO2: Calculate descriptive measures, probability, discrete and continuous distribution and
sampling distribution
LO4: Interpret the result of calculation

OUTLINE MATERI (Sub-Topic):


• Types of Sampling Method
• Sampling Distributions
• Sampling Distribution of the Mean
• Sampling Distribution of the Proportion
• Central Limit Theorem

COMP6334 - Probability and Statistics


ISI MATERI
Dalam banyak situasi, mengumpulkan data dari populasi yang menjadi perhatian seringkali tidak
mungkin dilakukan karena memerlukan tenaga, waktu dan biaya yang banyak. Pengambilan
sampel seringkali diperlukan karena praktis dan juga diperlukan dalam kasus di mana
pengukuran melibatkan penghancuran unit yang diukur. Pengambilan sampel adalah prosedur
yang menggunakan sejumlah kecil unit populasi tertentu sebagai dasar untuk menarik
kesimpulan tentang seluruh populasi. Kesimpulan yang didasarkan pada statistik yang dihitung
dari sampel adalah untuk memperkirakan nilai parameter populasi. Distribusi sampling adalah
distribusi dari besaran-besaran statistik seperti rata-rata, simpangan baku, proporsi yang
dihasilkan dari sampel-sampel yang dipilih dari populasi.

Dalam bab ini, kita akan mempelajari tentang bagaimana rata-rata sampel (statistik) digunakan
untuk memperkirakan rata-rata populasi (parameter) dan bagaimana proporsi sampel (statistik)
digunakan untuk memperkirakan proporsi populasi (parameter).

Distribusi Sampling dari

Distribusi sampling dari adalah distribusi peluang dari semua nilai yang mungkin dari rata-rata
sampel.

Nilai harapan dari (

Jika kita ambil sampel yang berbeda-beda dari populasi, akan dihasilkan rata-rata yang beragam.
Rata-rata sampel adalah penduga tidak bias karena rata-rata dari semua kemungkinan sampel
rata-rata sama dengan rata-rata populasi, (μ).

Contoh sederhana mengenai sifat tidak bias dari rata-rata sampel adalah sebagai berikut :
Misalkan suatu populasi terdiri dari 4 orang asisten yang diminta untuk melakukan update yan
sama ke suatu database sumber daya manusia. Jumlah kesalahan dari masing-masing asisten
adalah sebagai berikut:

Asisten Jumlah kesalahan


1 3
2 2
3 1
4 4

COMP6334 - Probability and Statistics


Rata-rata dan standar deviasi populasi dapat dihitung sebagai berikut :

Jadi untuk data di atas:

Jika kita memilih 2 sampel asisten dengan pemulihan dari populasi tersebut, maka ada 16 sampel
yang mungkin (Nn = 42 = 16). Berikut adalah kemungkinan sampelnya:

rata-rata
sampel asisten error
sampel
1 1,1 3,3 3
2 1,2 3,2 2.5
3 1,3 3,1 2
4 1,4 3,4 3.5
5 2,1 2,3 2.5
6 2,2 2,2 2
7 2,3 2,1 1.5
8 2,4 2,4 3
9 3,1 1,3 2
10 3,2 1,2 1.5
11 3,3 1,1 1
12 3,4 1,4 2.5
13 4,1 4,3 3.5
14 4,2 4,2 3
15 4,3 4,1 2.5
16 4,4 4,4 4

Jika 16 rata-rata sampel tersebut dirata-ratakan maka akan diperoleh:

COMP6334 - Probability and Statistics


Karena rata-rata dari 16 rata-rata sampel sama dengan rata-rata populasi, maka rata-rata sampel
adalah penduga tak bias dari rata-rata populasi.

Standar Error dari (

Nilai standar deviasi dari semua kemungkinan rata-rata sampel disebut standard error dari rata-
rata, menyatakan bagaimana rata-rata sampel bervariasi dari sampel ke sampel.

Untuk contoh di atas :

Sampling dari Populasi Berdistribusi Normal

Jika kita mengambil sampel dari populasi yang berdistribusi normal dengan rata-rata μ dan
standar deviasi σ, dengan ukuran sampel, n, maka distribusi sampling dari rata-rata juga
berdistribusi Normal dengan rata-rata dan standar deviasi

Untuk menentukan peluang dapat dilakukan konversi ke Z dengan rumus :

Contoh : Alat untuk mengisi box cereal di set untuk mengisi 368 gram per box. Dari
pengalaman sebelumnya diketahui bahwa isi box mengikuti distribusi Normal dengan standar
deviasi 15 gram. Jika dipilih 25 box cereal secara acak, berapa peluang rata-rata sampelnya
kurang dari 365 gram?

COMP6334 - Probability and Statistics


Oleh karena itu, 15.87% dari semua kemungkinan 25 sampel box cereal, rata-ratanya kurang dari
365 gram.

Sampling dari Populasi Berdistribusi Non-Normal

Jika sampel yang kita pilih berasal dari populasi yang tidak memiliki distribusi normal, maka
dapat Teorema Limit Pusat (Central Limit Theorem) akan sangat membantu dalam
mengidentifikasi bentuk distribusi sampling dari rata-rata sampel. Teorema Limit Pusat tersebut
adalah sebagai berikut:

Teorema Limit Pusat:

Jika sampel acak sederhana dipilih dari suatu populasi dengan ukuran sampel cukup besar,
terlepas dari bentuk distribusi nilai-nilai individu dalam populasi, maka distribusi sampling dari
rata-rata sampel akan mendekati distribusi normal.

Berapa ukuran sampel yang cukup besar? Sebagai aturan umum, ahli statistik telah menemukan
bahwa untuk banyak distribusi populasi, ketika ukuran sampel setidaknya 30, maka distribusi
sampling rata-rata akan mendekati normal. Namun, Anda dapat menerapkan Teorema Limit
Pusat untuk ukuran sampel yang lebih kecil jika distribusi populasi berbentuk lonceng. Dalam
kasus di mana distribusi variabel sangat miring atau memiliki lebih dari satu modus, maka akan
diperlukan ukuran sampel yang lebih besar dari 30 untuk memastikan normalitas dalam distribusi
sampling rata-rata.

Gambar berikut menunjukkan bagaimana efek dari Teorema Limit Pusat untuk tiga jenis
populasi yang berbeda; setiap kolom mengacu pada salah satu populasi. Populasi I mengikuti
distribusi Normal. Populasi II sering disebut distribusi Uniform dan Populasi III berbentuk
seperti distribusi eksponensial. Baris 1 untuk sampel berukuran n =2, baris 2 untuk n=5, dan
baris 3 untuk n=30. Pada ukuran sampel = 2, kita melihat bahwa bentuk dari setiap distribusi
sampling berbeda dari bentuk distribusi populasi yang sesuai. Untuk ukuran sampel =5, kita
melihat bahwa bentuk distribusi sampling untuk populasi I dan II mulai terlihat mirip dengan
bentuk distribusi normal, dan pada ukuran sampel =30, bentuk semakin mirip dengan sebaran
normal.

COMP6334 - Probability and Statistics


Distribusi Sampling untuk Proporsi

Untuk variabel kategori yang memiliki dua kategori, seperti pelanggan menyukai merek A atau
pelanggan lebih suka merek B, misalnya kita tertarik pada proporsi pelanggan yang lebih
menyukai merek A.

Proporsi populasi, diberi simbol π, adalah proporsi item dengan karakteristik yang menjadi
perhatian dalam seluruh populasi. Proporsi sampel, diberi simbol oleh p, adalah proporsi item
dengan karakteristik yang menjadi perhatian dalam sampel. Proporsi sampel (statistik)
digunakan untuk memperkirakan proporsi populasi (parameter).

Proporsi Sample:

Nilai proporsi sampel, p, akan berada di antara 0 dan 1. Statistik p adalah penduga tidak bias dari
proporsi populasi (π).

COMP6334 - Probability and Statistics


Standar Error proporsi adalah:

Nilai Z untuk distribusi sampel dari proporsi adalah:

Contoh: Diketahui bahwa proporsi populasi dari orang dewasa yamg menggunakan internet (π)
adalah 73%. Misalkan diambil contoh acak sebanyak 200 orang dewasa. Berapa peluang lebih
dari 80% orang dewasa menggunakan internet?

Sehingga, jika proporsi populasi 0.73, peluang bahwa 80% dari 200 orang dewasa menggunakan
internet adalah 1.29%.

COMP6334 - Probability and Statistics


SIMPULAN
Distribusi sampling adalah distribusi dari besaran-besaran statistik seperti rata-rata, simpangan
baku, proporsi yang dihasilkan dari sampel-sampel yang dipilih dari populasi. Rata-rata sampel
adalah penduga tidak bias dari rata-rata populasi. Nilai standar deviasi dari semua kemungkinan
rata-rata sampel disebut standard error dari rata-rata, menyatakan bagaimana rata-rata sampel
bervariasi dari sampel ke sampel. Distribusi sampel dari rata-rata sampel yang diambil dari
populasi yang berdistribusi normal juga akan berdistribusi Normal. Distribusi sampel dari rata-
rata sampel yang diambil dari populasi yang tidak berdistribusi normal menurut Teorema Limit
Pusat (Central Limit Theorem) juga akan berdistribusi normal jika ukuran sampelnya besar.
Proporsi sampel juga merupakan penduga tidak bias dari proporsi populasi.

COMP6334 - Probability and Statistics


DAFTAR PUSTAKA

1. Levine, D.M., Stephan, D. F., and Szabat, K. A. (2017). Statistics for Managers using
Microsoft Excel. 8th Ed. Global Edition Pearson Education. New Jersey. ISBN 13: 978-1-
292-15634-7. Chapter 7.

2. Anderson, David R., Sweeney, Dennis J., Williams, Thomas A. (2011). Statistics for
Business and Economics. 11th Ed. Cengage Learning. USA. ISBN 13: 978-0-324-78325-4.
Chapter 7.

COMP6334 - Probability and Statistics

Anda mungkin juga menyukai