STATSDATA
Statistical Data Analyst
Distribusi Sampling I
Pada penulisan Ketujuh tentang Statistika Elementer ini, penulis akan memberikan bahasan
mengenai Distribusi Sampling bagian pertama kepada para pembaca untuk menambah
pengetahuan dan pemahaman mengenai Distribusi Sampling yang menjadi fokus penting
dalam kuantitas dari sampel mean untuk bahasan materi selanjutnya, yaitu Estimasi Interval
Parameter dan Pengujian Hipotesis. Pada bahasan ini, Distribusi Sampling yang diberikan
adalah Distribusi Sampling Mean dan Distribusi Sampling Selisih Dua Mean.
Distribusi Sampling.
Distribusi Sampling adalah distribusi probabilitas dari suatu Statistik (yaitu semua
pengamatan yang mungkin dari statistik untuk sampel dari suatu ukuran sampel yang
diberikan)[2]. Pada penulisan ini, diberikan distribusi sampling sebagai review statistik,
meliputi:
1. Distribusi Sampling Mean.
2. Distribusi Sampling Selisih Dua Mean.
www.statsdata.my.id Page 1
E-book Statistika Gratis... STATSDATA
Statistical Data Analyst
X ~ N (X , X2 )
Secara khusus dalam distribusi sampling mean terdapat dua prinsip penting, antara lain[2]:
1. Jika sampel diambil dengan pengembalian dari populasi terhingga, maka berlaku
2
X dan X2
n
2. Jika sampel diambil tanpa pengembalian dari populasi terhingga, maka berlaku
2 N n
X dan X2
n N 1
Standar deviasi dari Xbar menunjukkan besarnya Sampling Error yang diharapkan ketika
populasi Mean diestimasi oleh mean sampel (Xbar), sehingga ukuran ini sering disebut
sebagai standard error dari mean sampel (Xbar). Secara umum, standar deviasi dari suatu
Statistik (untuk pendugaan parameter) disebut sebagai standard error (SE) dari suatu
Statistik[2].
Jika peneliti melakukan sampling dari populasi dengan distribusi tidak diketahui (baik
terhingga maupun tak terhingga), distribusi sampling Xbar akan mendekati distrbusi Normal
dengan mean μ and varian σ2/n pada ukuran sampel sangat besar (n -> ∞). Hal ini sangat
berkaitan atau sesuai dengan teorema yang disebut Central Limit Theorem (CLT)[1].
Central Limit Theorem:
Jika Xbar adalah mean dari suatu sampel acak berukuran n yang diambil dari
populasi dengan mean μ dan varian terhingga σ2, maka bentuk limiting distribusi
X
dari Z untuk n -> ∞, adalah berdistribusi Normal Standar atau N(0,1).
n
Secara empiris[1], pendekatan distribusi Normal untuk Xbar akan secara umum baik jika
ukuran n ≥ 30, dengan diberikan distribusi populasi yang tidak miring (skewed). Jika n < 30,
maka pendekatan distribusi Normal baik hanya jika populasi tidak terlalu berbeda dari
distribusi Normal. Jika populasi diketahui berdistribusi Normal, maka distribusi Sampling
www.statsdata.my.id Page 2
E-book Statistika Gratis... STATSDATA
Statistical Data Analyst
Xbar akan mengikuti distribusi Normal secara tepat, serta tidak tergantung berapa kecil
ukuran sampel.
Sebagai Contoh, diberikan kasus waktu transportasi bus untuk perjalanan antara dua
kampus dari suatu Universitas. Waktu transportasi bus tersebut memiliki rata-rata sebesar
28 menit dan standar deviasi 5 menit. Pada bulan tertentu, bus tersebut digunakan untuk
mengantar penumpang sebanyak 40 kali. Berapa probabilitas rata-rata waktu transportasi
bus tersebut lebih dari 30 menit?
Penyelesaian:
Diberikan µ = 28 dan σ = 5 , serta ukuran sampel n = 40 dan xbar = 30.
PX 30 ?
X x
PX x P
/ n / n
30 28
PX 30 P Z
5 / 40
PX 30 PZ 2,53 1 PZ 2,53
Selanjutnya probablilitas ini diselesaikan dengan bantuan Tabel Normal Standar.
P( Z z ) FZ ( z ) ; z 2,53
P( Z 2,53) ... ?
z 0.00 … 0.03 …
: ↓
2.5 ------ → 0.9911
:
P(Z 2,53) 0,9911 .
maka
PX 30 1 PZ 2,53
PX 30 1 0,9911 0,0089
Probabilitas ini bernilai sangat kecil, maka peneliti dapat menduga bahwa rata-rata waktu
transportasi bus tersebut tidak lebih dari 30 menit.
www.statsdata.my.id Page 3
E-book Statistika Gratis... STATSDATA
Statistical Data Analyst
1. Inputkan nilai t = 2.30 kedalam cell A2 dan nilai v = 39 kedalam cell B2.
www.statsdata.my.id Page 4
E-book Statistika Gratis... STATSDATA
Statistical Data Analyst
X1 X 2 ~ N ( X X , X2 X )
1 2 1 2
Sebagaimana dalam distribusi sampling mean sebelumnya, maka juga berlaku dua prinsip
penting terkait distribusi sampling ini.
1. Jika sampel diambil dengan pengembalian dari 2 populasi terhingga, maka berlaku
12 22
X X 1 2 dan X2 1 X2
1 2
n1 n2
2. Jika sampel diambil tanpa pengembalian dari 2 populasi terhingga, maka berlaku
12 22 N1 N 2 n1 n2
X X 1 2 dan X2 1 X2
N N 2
n
1 n 2
1 2
1 2
www.statsdata.my.id Page 5
E-book Statistika Gratis... STATSDATA
Statistical Data Analyst
Central Limit Theorem (CLT)[1] juga dapat dengan mudah diterapkan untuk kasus distribusi
sampling selisih dua mean.
Jika dua sampel independen masing-masing berukuran n1 dan n2 diambil
secara acak dari dua populasi (diskrit atau kontinu) masing-masing dengan
mean 1 , 2 dan simpangan baku 1 , 2 maka selisih dua mean sampel
12 22
X X 1 2 dan X2 1 X2
1 2
n1 n2
Dengan demikian, statistik Z
( X1 X 2 ) X X ( X1 X 2 ) ( 1 2 )
Z 1 2
X X 12 22
1 2
n1 n2
Secara empiris[1], jika n1 dan n2 lebih besar atau sama dengan 30, maka pendekatan
distribusi Normal untuk distribusi Xbar1 – Xbar2 akan sangat baik ketika distribusi yang
mendasari tidak terlalu jauh dari distribusi Normal. Ketika n1 dan n2 kurang dari 30,
pendekatan Normal baik ketika populasi tidak berbeda jauh dari distribusi Normal.
Sebagai Contoh, diberikan kasus perbandingan Waktu Kering dari dua tipe Cat yang berbeda
(independen). Delapanbelas sampel media dicat dengan Cat tipe A dan ditunggu beberapa
jam sampai kering kemudian dicatat, selanjutnya perlakuan ini dilakukan sama untuk
pencatatan hasil Waktu Kering Cat tipe B. Standar deviasi populasi dari Waktu Kering Cat
tipe A dan B masing-masing bernilai 3,5 dan 7,5 . Dengan mengasumsikan mean Waktu
Kering sama untuk dua tipe cat ini, temukan probabilitas P(XbarA – XbarB > 1) dengan Xbar1
dan Xbar2 merupakan mean sampel Waktu Kering untuk sampel berukuran nA = nB = 18.
Penyelesaian:
Dari distribusi sampling XbarA – XbarB, diketahui distribusi mendekati distribusi Normal
dengan mean dan varian berikut.
A2 B2 3,5 7,5 11
X A XB
A B 0 dan X2 A XB
nA nB 18 18 18
www.statsdata.my.id Page 6
E-book Statistika Gratis... STATSDATA
Statistical Data Analyst
X A X B X X 1 XA XB
PX A X B 1 P A B
XA XB XA XB
(1) ( A B ) (1) (0)
PX A X B 1 P Z P Z
A2 B2 11 / 18
nA nB
PX A X B 1 PZ 1,28 1 PZ 1,28)
Selanjutnya probablilitas ini diselesaikan dengan bantuan Tabel Normal Standar.
P( Z z ) FZ ( z ) ; z 1,28
P( Z 1,28) ... ?
z 0.08 …
: ↓
1.2 → 0.8997
:
P(Z 1,28) 0,8997 .
maka
PX A X B 1 1 PZ 1,28)
PX A X B 1 1 0,8997 0,1003
Diperoleh probabilitas ini sebesar 0,1003 yang diartikan bahwa mean Waktu Kering antara
tipe Cat A dan B ada kemungkinan berbeda lebih dari 1 dengan probabilitas sebesar 10,03%.
Teorema untuk Distribusi t :
Dalam distribusi sampling selisih dua mean, digunakan juga distribusi t
dengan ketentuan bahwa varian populasi (σ12 dan σ22) tidak diketahui
sehingga digunakan nilai dugaan yaitu varian sampel (s12 dan s22), bentuk
( X X 2 ) ( 1 2 )
dari T 1 berdistribusi t dengan derajat bebas
s12 s 22
n1 n2
v = n1 + n2 – 2.
www.statsdata.my.id Page 7
E-book Statistika Gratis... STATSDATA
Statistical Data Analyst
Sebagai Contoh, diberikan kasus perbandingan waktu transportasi bus A dan bus B untuk
perjalanan antara dua kampus dari suatu Universitas. Diasumsikan waktu transportasi bus A
dan bus B adalah sama. Pada bulan tertentu, dua bus tersebut digunakan untuk mengantar
penumpang sebanyak 40 kali, sehingga diperoleh standar deviasi sampel bus A dan bus B
masing-masing sebesar 6 menit dan 12 menit. Berapa probabilitas selisih dua mean waktu
transportasi bus tersebut lebih dari 1? (Jika probabilitas ini melebihi 0,05 , maka peneliti
akan menduga bahwa Waktu transportasi bus A dan bus B adalah berbeda)
Penyelesaian:
Dari distribusi sampling XbarA – XbarB, diketahui distribusi mendekati Normal dengan mean
berikut.
X A XB
A B 0
( X A X B ) ( A B ) (1) ( A B )
PX A X B 1 P
s A2 s B2 s A2 s B2
n A n B n A nB
(1) ( A B ) (1) (0)
PX A X B 1 P T
P T
s A2 s B2 6 12
40 40
n A n B
PX A X B 1 PT 1,49
www.statsdata.my.id Page 8
E-book Statistika Gratis... STATSDATA
Statistical Data Analyst
1. Inputkan nilai t = 1.49 kedalam cell A2 dan nilai v = 78 kedalam cell B2.
Probabilitas ini telah melebihi 0,05 , sehingga peneliti dapat menduga bahwa Waktu
transportasi bus A dan bus B adalah berbeda.
REFERENSI
[1] Walpole, R.E., Myers, R.H., Myers, S.L., and Ye, K., (2012), Probability and Statistics for
Engineers and Scientists, Ninth Edition, Boston: Pearson Education.
[2] Weiss, N.A., (2012), Elementary Statistics, 8th Edition, Boston: Addison-Wesley.
www.statsdata.my.id Page 9