Anda di halaman 1dari 9

E-book Statistika Gratis...

STATSDATA
Statistical Data Analyst

Distribusi Sampling I

Pada penulisan Ketujuh tentang Statistika Elementer ini, penulis akan memberikan bahasan
mengenai Distribusi Sampling bagian pertama kepada para pembaca untuk menambah
pengetahuan dan pemahaman mengenai Distribusi Sampling yang menjadi fokus penting
dalam kuantitas dari sampel mean untuk bahasan materi selanjutnya, yaitu Estimasi Interval
Parameter dan Pengujian Hipotesis. Pada bahasan ini, Distribusi Sampling yang diberikan
adalah Distribusi Sampling Mean dan Distribusi Sampling Selisih Dua Mean.

Kebutuhan akan Distribusi Sampling.


Dalam statistika inferensi, terdapat hal penting dalam menyimpulkan Populasi yang
menjadi perhatian peneliti ketika hal ini menjadi tidak mungkin untuk mengamati seluruh
himpunan pengamatan yang membangun populasi. Sebagai contoh, percobaan untuk
menentukan rata-rata dari masa hidup suatu jenis bola lampu; Hal ini menjadi tidak
mungkin untuk menguji semua bola lampu yang diproduksi, sehingga peneliti pasti akan
menggunakan sebagian pengamatan dari populasi (Sampel) untuk membuat inferensi
mengenai populasi. Hal ini yang membuat peneliti mempertimbangkan kebutuhan dari
Sampling. Jika inferensi yang diberikan dari sampel untuk populasi bernilai valid, maka
sampel tersebut akan menjadi sampel yang Representatif (mampu menggambarkan
populasi)[1]. Namun, peneliti tidak bisa memastikan secara sempurna untuk inferensi ini,
sehingga diberikan suatu Sampling Error yang mengukur kesalahan dari penggunaan suatu
sampel untuk menduga karakteristik populasi[2].

Distribusi Sampling.
Distribusi Sampling adalah distribusi probabilitas dari suatu Statistik (yaitu semua
pengamatan yang mungkin dari statistik untuk sampel dari suatu ukuran sampel yang
diberikan)[2]. Pada penulisan ini, diberikan distribusi sampling sebagai review statistik,
meliputi:
1. Distribusi Sampling Mean.
2. Distribusi Sampling Selisih Dua Mean.

www.statsdata.my.id Page 1
E-book Statistika Gratis... STATSDATA
Statistical Data Analyst

Distribusi Sampling Mean.


Distribusi Sampling Mean adalah distribusi sampling untuk mean sampel (Xbar) dari suatu
populasi berukuran N. Mean sampel ini berdistribusi Normal dengan mean µXbar dan varian
σXbar2.

X ~ N (X ,  X2 )

Secara khusus dalam distribusi sampling mean terdapat dua prinsip penting, antara lain[2]:
1. Jika sampel diambil dengan pengembalian dari populasi terhingga, maka berlaku

2
 X   dan  X2 
n
2. Jika sampel diambil tanpa pengembalian dari populasi terhingga, maka berlaku

2  N n
 X   dan  X2   
n  N 1 
Standar deviasi dari Xbar menunjukkan besarnya Sampling Error yang diharapkan ketika
populasi Mean diestimasi oleh mean sampel (Xbar), sehingga ukuran ini sering disebut
sebagai standard error dari mean sampel (Xbar). Secara umum, standar deviasi dari suatu
Statistik (untuk pendugaan parameter) disebut sebagai standard error (SE) dari suatu
Statistik[2].
Jika peneliti melakukan sampling dari populasi dengan distribusi tidak diketahui (baik
terhingga maupun tak terhingga), distribusi sampling Xbar akan mendekati distrbusi Normal
dengan mean μ and varian σ2/n pada ukuran sampel sangat besar (n -> ∞). Hal ini sangat
berkaitan atau sesuai dengan teorema yang disebut Central Limit Theorem (CLT)[1].
Central Limit Theorem:
Jika Xbar adalah mean dari suatu sampel acak berukuran n yang diambil dari
populasi dengan mean μ dan varian terhingga σ2, maka bentuk limiting distribusi
X
dari Z  untuk n -> ∞, adalah berdistribusi Normal Standar atau N(0,1).

n

Secara empiris[1], pendekatan distribusi Normal untuk Xbar akan secara umum baik jika
ukuran n ≥ 30, dengan diberikan distribusi populasi yang tidak miring (skewed). Jika n < 30,
maka pendekatan distribusi Normal baik hanya jika populasi tidak terlalu berbeda dari
distribusi Normal. Jika populasi diketahui berdistribusi Normal, maka distribusi Sampling

www.statsdata.my.id Page 2
E-book Statistika Gratis... STATSDATA
Statistical Data Analyst

Xbar akan mengikuti distribusi Normal secara tepat, serta tidak tergantung berapa kecil
ukuran sampel.
Sebagai Contoh, diberikan kasus waktu transportasi bus untuk perjalanan antara dua
kampus dari suatu Universitas. Waktu transportasi bus tersebut memiliki rata-rata sebesar
28 menit dan standar deviasi 5 menit. Pada bulan tertentu, bus tersebut digunakan untuk
mengantar penumpang sebanyak 40 kali. Berapa probabilitas rata-rata waktu transportasi
bus tersebut lebih dari 30 menit?
Penyelesaian:
Diberikan µ = 28 dan σ = 5 , serta ukuran sampel n = 40 dan xbar = 30.
PX  30 ?
 X x 
PX  x   P  
 / n  / n 
 30  28 
PX  30  P Z  
 5 / 40 
PX  30  PZ  2,53  1  PZ  2,53
Selanjutnya probablilitas ini diselesaikan dengan bantuan Tabel Normal Standar.
P( Z  z )  FZ ( z ) ; z  2,53
P( Z  2,53)  ... ?

z 0.00 … 0.03 …
: ↓
2.5 ------ → 0.9911
:
P(Z  2,53)  0,9911 .

maka
PX  30  1  PZ  2,53
PX  30  1  0,9911  0,0089
Probabilitas ini bernilai sangat kecil, maka peneliti dapat menduga bahwa rata-rata waktu
transportasi bus tersebut tidak lebih dari 30 menit.

www.statsdata.my.id Page 3
E-book Statistika Gratis... STATSDATA
Statistical Data Analyst

Teorema untuk Distribusi t :


Dalam distribusi sampling mean, digunakan juga distribusi t dengan
ketentuan bahwa varian populasi (σ2) tidak diketahui sehingga
digunakan nilai dugaan yaitu varian sampel (s2), bentuk dari
X
T berdistribusi t dengan derajat bebas v = n – 1.
s
n
Catatan untuk Distribusi t:
 Distribusi t dapat diterapkan pada ukuran sampel baik kecil maupun besar. Secara empiris,
ukuran sampel kecil adalah n ≤ 30.
 Pada ukuran sampel sangat besar (n -> ∞), bentuk kurva distribusi t mendekati distribusi
Normal Standar (Z).
Sebagai Contoh, diberikan kasus waktu transportasi bus untuk perjalanan antara dua
kampus dari suatu Universitas. Waktu transportasi bus tersebut memiliki rata-rata sebesar
28 menit. Pada bulan tertentu, bus tersebut digunakan untuk mengantar penumpang
sebanyak 40 kali, sehingga diperoleh standar deviasi sampel sebesar 5,5 menit. Berapa
probabilitas rata-rata waktu transportasi bus tersebut lebih dari 30 menit?
Penyelesaian:
Diberikan µ = 28, serta ukuran sampel n = 40, s = 5,5 , v = n – 1 = 39, dan xbar = 30.
PX  30 ?
X x 
PX  x   P  
 s/ n s/ n 
 30  28 
PX  30  P T  
 5,5 / 40 
PX  30  PT  2,30
Selanjutnya probablilitas ini diselesaikan dengan bantuan Software Excel.
P(T  2,30)  ... ? v  39

Langkah-langkah penyelesaian dengan Software Excel:

1. Inputkan nilai t = 2.30 kedalam cell A2 dan nilai v = 39 kedalam cell B2.

2. Inputkan juga suatu Formula kedalam cell C2, yaitu: =TDIST(A2,B2,1) .

www.statsdata.my.id Page 4
E-book Statistika Gratis... STATSDATA
Statistical Data Analyst

maka diperoleh hasil


PX  30  PT  2,30
PX  30  0,0134
Probabilitas ini bernilai sangat kecil, maka peneliti dapat menduga bahwa rata-rata waktu
transportasi bus tersebut tidak lebih dari 30 menit ketika standar deviasi populasi tidak
diketahui.

Distribusi Sampling Selisih Dua Mean.


Distribusi sampling mean biasanya digunakan peneliti untuk meneliti satu populasi saja.
Terkadang peneliti juga tertarik meneliti pengamatan dari dua populasi dengan tujuan
untuk melakukan perbandingan antara populasi pertama dan populasi kedua. Dasar untuk
perbandingan itu adalah Selisih Dua Mean (μ1 − μ2) yang menggambarkan perbedaan dalam
makna populasi.
Misalkan terdapat dua populasi, yaitu: populasi pertama memiliki mean μ1 dan varian σ12,
dan populasi kedua mempunyai mean μ2 dan varian σ22. Misalkan juga statistik Xbar1
merupakan mean dari sampel acak berukuran n1 yang dipilih dari populasi pertama, dan
statistik Xbar2 adalah mean dari sampel acak berukuran n2 yang diambil dari populasi kedua.
Sampel dari populasi pertama independen terhadap sampel dari populasi kedua. Distribusi
Sampling Selisih Dua Mean adalah distribusi sampling untuk selisih dua mean sampel
(Xbar1 – Xbar2) dari dua populasi yang masing-masing berukuran N1 dan N2. Selisih dua
mean sampel ini berdistribusi Normal dengan mean µXbar1-Xbar2 dan varian σXbar1-Xbar22.

X1  X 2 ~ N ( X X ,  X2 X )
1 2 1 2

Sebagaimana dalam distribusi sampling mean sebelumnya, maka juga berlaku dua prinsip
penting terkait distribusi sampling ini.
1. Jika sampel diambil dengan pengembalian dari 2 populasi terhingga, maka berlaku

 12  22
 X X  1  2 dan  X2 1 X2  
1 2
n1 n2
2. Jika sampel diambil tanpa pengembalian dari 2 populasi terhingga, maka berlaku

  12  22  N1  N 2  n1  n2 
 X X  1   2 dan  X2 1  X2    
 N  N  2 

n
 1 n 2  
1 2
1 2

www.statsdata.my.id Page 5
E-book Statistika Gratis... STATSDATA
Statistical Data Analyst

Central Limit Theorem (CLT)[1] juga dapat dengan mudah diterapkan untuk kasus distribusi
sampling selisih dua mean.
Jika dua sampel independen masing-masing berukuran n1 dan n2 diambil
secara acak dari dua populasi (diskrit atau kontinu) masing-masing dengan
mean 1 ,  2 dan simpangan baku  1 ,  2 maka selisih dua mean sampel

X1  X2 akan berdistribusi mendekati Normal dengan nilai mean dan


varians berikut.

 12  22
 X X  1   2 dan  X2 1  X2  
1 2
n1 n2
Dengan demikian, statistik Z
( X1  X 2 )   X  X ( X1  X 2 )  ( 1   2 )
Z 1 2

 X X  12  22
1 2

n1 n2

merupakan suatu variabel Normal Standar.

Secara empiris[1], jika n1 dan n2 lebih besar atau sama dengan 30, maka pendekatan
distribusi Normal untuk distribusi Xbar1 – Xbar2 akan sangat baik ketika distribusi yang
mendasari tidak terlalu jauh dari distribusi Normal. Ketika n1 dan n2 kurang dari 30,
pendekatan Normal baik ketika populasi tidak berbeda jauh dari distribusi Normal.
Sebagai Contoh, diberikan kasus perbandingan Waktu Kering dari dua tipe Cat yang berbeda
(independen). Delapanbelas sampel media dicat dengan Cat tipe A dan ditunggu beberapa
jam sampai kering kemudian dicatat, selanjutnya perlakuan ini dilakukan sama untuk
pencatatan hasil Waktu Kering Cat tipe B. Standar deviasi populasi dari Waktu Kering Cat
tipe A dan B masing-masing bernilai 3,5 dan 7,5 . Dengan mengasumsikan mean Waktu
Kering sama untuk dua tipe cat ini, temukan probabilitas P(XbarA – XbarB > 1) dengan Xbar1
dan Xbar2 merupakan mean sampel Waktu Kering untuk sampel berukuran nA = nB = 18.
Penyelesaian:
Dari distribusi sampling XbarA – XbarB, diketahui distribusi mendekati distribusi Normal
dengan mean dan varian berikut.

 A2  B2 3,5 7,5 11
X A  XB
  A   B  0 dan  X2 A  XB     
nA nB 18 18 18

www.statsdata.my.id Page 6
E-book Statistika Gratis... STATSDATA
Statistical Data Analyst

Selanjutnya dengan menggunakan CLT diperoleh


(X A  X B )   X (X A  X B )  ( A   B )
A XB
Z 
X A XB  A2  B2

nA nB

maka P(XbarA – XbarB > 1) = … ? (dimana xbarA – xbarB = 1)

 X A  X B    X  X 1   XA  XB 
PX A  X B  1  P A B
 
  XA XB  XA XB 
 
 
 
 (1)  (  A   B )   (1)  (0) 
PX A  X B  1  P Z    P Z  
  A2  B2   11 / 18 
 
 nA nB 
PX A  X B  1  PZ  1,28  1  PZ  1,28) 
Selanjutnya probablilitas ini diselesaikan dengan bantuan Tabel Normal Standar.
P( Z  z )  FZ ( z ) ; z  1,28
P( Z  1,28)  ... ?

z 0.08 …
: ↓
1.2 → 0.8997
:
P(Z  1,28)  0,8997 .

maka
PX A  X B  1  1  PZ  1,28) 
PX A  X B  1  1  0,8997  0,1003
Diperoleh probabilitas ini sebesar 0,1003 yang diartikan bahwa mean Waktu Kering antara
tipe Cat A dan B ada kemungkinan berbeda lebih dari 1 dengan probabilitas sebesar 10,03%.
Teorema untuk Distribusi t :
Dalam distribusi sampling selisih dua mean, digunakan juga distribusi t
dengan ketentuan bahwa varian populasi (σ12 dan σ22) tidak diketahui
sehingga digunakan nilai dugaan yaitu varian sampel (s12 dan s22), bentuk
( X  X 2 )  ( 1   2 )
dari T  1 berdistribusi t dengan derajat bebas
s12 s 22

n1 n2
v = n1 + n2 – 2.

www.statsdata.my.id Page 7
E-book Statistika Gratis... STATSDATA
Statistical Data Analyst

Sebagai Contoh, diberikan kasus perbandingan waktu transportasi bus A dan bus B untuk
perjalanan antara dua kampus dari suatu Universitas. Diasumsikan waktu transportasi bus A
dan bus B adalah sama. Pada bulan tertentu, dua bus tersebut digunakan untuk mengantar
penumpang sebanyak 40 kali, sehingga diperoleh standar deviasi sampel bus A dan bus B
masing-masing sebesar 6 menit dan 12 menit. Berapa probabilitas selisih dua mean waktu
transportasi bus tersebut lebih dari 1? (Jika probabilitas ini melebihi 0,05 , maka peneliti
akan menduga bahwa Waktu transportasi bus A dan bus B adalah berbeda)
Penyelesaian:
Dari distribusi sampling XbarA – XbarB, diketahui distribusi mendekati Normal dengan mean
berikut.
X A  XB
 A  B  0

Selanjutnya dengan menggunakan Teorema untuk Distribusi t diperoleh


(X A  X B )  ( A   B )
T
s A2 s B2

nA nB

maka P(XbarA – XbarB > 1) = … ? (dimana xbarA – xbarB = 1)

 
 
 ( X A  X B )  (  A   B ) (1)  (  A   B ) 
PX A  X B  1  P  
 s A2 s B2 s A2 s B2 
   
 n A n B n A nB 
   
   
 (1)  (  A   B )  (1)  (0) 
PX A  X B  1  P T  
  P T 
 s A2 s B2  6 12 
   
   40 40 
 n A n B 
PX A  X B  1  PT  1,49

Selanjutnya probablilitas ini diselesaikan dengan bantuan Software Excel.


P(T  1,49)  ... ?
v  n1  n2  2  40  40  2  78

www.statsdata.my.id Page 8
E-book Statistika Gratis... STATSDATA
Statistical Data Analyst

Langkah-langkah penyelesaian dengan Software Excel:

1. Inputkan nilai t = 1.49 kedalam cell A2 dan nilai v = 78 kedalam cell B2.

2. Inputkan juga suatu Formula kedalam cell C2, yaitu: =TDIST(A2,B2,1) .


maka diperoleh hasil
PX A  X B  1  PT  1,49
PX A  X B  1  0,0701

Probabilitas ini telah melebihi 0,05 , sehingga peneliti dapat menduga bahwa Waktu
transportasi bus A dan bus B adalah berbeda.

REFERENSI
[1] Walpole, R.E., Myers, R.H., Myers, S.L., and Ye, K., (2012), Probability and Statistics for
Engineers and Scientists, Ninth Edition, Boston: Pearson Education.
[2] Weiss, N.A., (2012), Elementary Statistics, 8th Edition, Boston: Addison-Wesley.

www.statsdata.my.id Page 9

Anda mungkin juga menyukai