DISTRIBUSI SAMPLING
LUTFIA SEPTININGRUM
PROGRAM STUDI SISTEM INFORMASI
FAKULTAS REKAYASA INDUSTRI
2020
SASARAN PEMBELAJARAN
PENDAHULUAN
Distribusi sampling merupakan distribusi probabilitas suatu
statistik berdasarkan semua kemungkinan sampel dengan
karakteristik statistik yang berbeda-beda. Selanjutnya nilai
statistik dari sampel yang dipelajari akan dijadikan sebagai
penduga dari parameter populasinya.
Oleh karena itu distribusi sampling dikatakan sebagai dasar dari statistika
inferensia. Salah satu dalil terpenting dalam distribusi sampling adalah dalil batas
tengah atau dalil/teori limit pusat yang dalam Bahasa Inggris dikenal sebagai
Central Limit Theorem (CLT) di mana DISTRIBUSI NORMAL merupakan
pemahaman dasarnya.
DISTRIBUSI NORMAL
… relatif
APAKAH “NORMAL” ?
“NORMAL” gender Perempuan vs Laki-laki
Pengertian istilah “NORMAL”
Menurut aturan atau menurut pola yg umum;
sesuai dan tidak menyimpang dari suatu norma
atau kaidah; sesuai dengan keadaan yg biasa; tanpa
cacat; tidak ada kelainan.
Distribusi Normal sering disebut Distribusi Gauss, menghormati Karl Friedrics Gauss
(1977-1855) penemu bentuk persamaan normal. Distribusi Normal variatnya bersifat
kontinyu memiliki persamaan umum yang dapat membentuk sebuah kurva normal
sebagai berikut:
normal: 2
A
a a ≠ 2
platikurtik
B b
µ a= µ b x
Sifat-sifat Distribusi Normal
5) Luas daerah di bawah kurva f(x) dan di atas sumbu x selalu sama dengan satu
unit persegi, yaitu P( − x )=1. Oleh karena itu, karena kurvanya
simetrik garis tegak x = , maka luas dari garis tegak pada titik nol ke kiri
ataupun ke kanan adalah 0.5.
Fenomena Distribusi Normal
• Sekitar 68.27% dari kasus ada dalam daerah satu simpangan baku:
(x = + 1 ke kanan dan x = – 1 ke kiri).
• Sekitar 95.45% dari kasus ada dalam daerah dua simpangan baku:
(x = + 2 ke kanan dan x = – 2 ke kiri).
• Sekitar 99.73% dari kasus ada dalam daerah tiga simpangan baku:
(x = + 3 ke kanan dan x = – 3 ke kiri).
Tranformasi ke Normal Standar
Mencari probabilitas distribusi normal P(a < X < b) dilakukan dengan melakukan
transformasi nilai-nilai X menjadi nilai-nilai z atau angka baku Z : P (za < Z < zb).
P(a < X < b) → P (za < Z < zb).
1 − 1 − 12 Z 2
f ( x) = e 2 f ( z) = e
2 2
X −
Z=
Table entry
0<Z<
Table entry
− < Z <
− − 0
z z
Tabel Normal [1] dari Walpole
Cara mencari bagian-bagian
Luas dari Tabel z:
−
z
2. Hitung z sd. 2 desimal, misalnya:
P(Z < 1.96)=?
3. Lukis kurvanya, letakan harga z
pada sumbu x, tarik garis vertikal P(Z < 1.96)=?
hingga memotong kurva.
4. Luas yang tertera dalam daftar 0
1.96
z
adalah luas daerah sampai dengan
garis vertikal di titik z = 1.96.
Cara mencari bagian-bagian
Luas dari Tabel z:
0 z
1.96
LATIHAN 4.1
Mencari Probabilitas atau Luas Kurva Normal P(Z) dan Nilai Z
a. Mencari probabilitas atau luas area kurva normal P(Z)
1. Temukan probabilitas atau luas area di sebelah kiri Z = 1.98 ?
2. Temukan probabilitas atau luas area di sebelah kanan Z = –1.98 ?
3. Temukan probabilitas atau luas area antara Z = –1.98 dan Z = 1.98?
LATIHAN 4.1
Mencari Probabilitas atau Luas Kurva Normal P(Z) dan Nilai Z
a. Mencari probabilitas atau luas area kurva normal P(Z)
1. Temukan probabilitas atau luas area di sebelah kiri Z = 1.98 ?
2. Temukan probabilitas atau luas area di sebelah kanan Z = –1.98 ?
3. Temukan probabilitas atau luas area antara Z = –1.98 dan Z = 1.98?
SOLUSI:
1. P(Z < 1.98)?
Langkan 1: Gambarkan kurvanya!
Langkah 2: Cari luas area di bawah kurva normal
standar di sebelah kiri Z = 1.98
dengan menggunakan Tabel Z [1].
Diperoleh nilai 0.9761 atau: P(Z < 1.98)=?
0 z
z0?
b. Mencari nilai Z
1. Temukan nilai z0, sehingga probabilitas P(Z<z0) = 0.9761?
2. Temukan nilai z0,sehingga probabilitas P(Z>z0) = 0.9761?
3. Temukan nilai z1 dan z2 sehingga probabilitas P(z0<Z<z1) = 0.9522 areanya berada
di tengah?
SOLUSI:
2. P(Z>z0) = 0.9761?
Langkan 1: Gambarkan kurvanya!
Langkah 2: Cari terlebih dahulu luas P(Z<z0) yaitu
mengurangkan 1 dengan 0.9671:
P(Z<z0) = 1 – P(Z>z0) = 1 – 0.9671 =
0.0239
0.9761
Kemudian pada Tabel Z [1], temukan nilai z
nya disebelah kiri [–1.9] dan atasnya [.08]
sehingga z0 = –1.98.
0 z
P(Z> – 1.98) = 0.9761 Z0=?
SOLUSI:
1. P(X < 95)= ? Cari luas area di bawah kurva normal standar di
Langkan 1: Gambarkan kurvanya! sebelah kiri Z = –1 dengan menggunakan Tabel Z
[1], diperoleh nilai 0.1587.
Langkah 2: Hitung nilai Z untuk X = 95 dan µ =
100 dan = 5: P(X<95) = P(Z<–1) = 0.1587
X − 95 − 100 Langkah 3: Kesimpulan: Probabilitas talk time
Z= = = −1 SUATU baterai kurang dari 95 menit
5 sebesar 15.87%.
1. Kurang dari 95 menit?
2. Lebih dari 105 menit?
3. Antara 95 dan 100 menit?
SOLUSI:
2. P(X > 105)= ?
Langkan 1: Gambarkan kurvanya!
Langkah 2: Hitung nilai Z untuk X = 95 dan µ =
100 dan = 5:
X − 105 − 100
Z= = = −1
5
Cari luas area di bawah kurva normal standar di
sebelah kiri Z = 1 dengan menggunakan Tabel Z
[1] diperoleh 0.8413. Kemudian kurangkan 1
dengan 0.8413 sehingga diperoleh luas disebelak
Langkah 3: Kesimpulan: Probabilitas talk time
kanan Z =1 sebesar 0.1587:
SUATU baterai lebih dari 95 menit
P(Z>1) = 1 – P(Z<1) = 1 – 0.8413 = 0.1587 sebesar 15.87%.
1. Kurang dari 95 menit?
2. Lebih dari 105 menit?
3. Antara 95 dan 100 menit?
SOLUSI:
3. P(95< X < 105)= ?
Langkan 1: Gambarkan kurvanya!
Langkah 2: Pertama, hitung nilai z1 untuk X1 = 95
dan µ = 100 dan = 5:
Cari luas area di bawah kurva normal standar di
X1 − 95 − 100 sebelah kiri Z = 1 dengan menggunakan Tabel Z
z1 = = = −1 [1], diperoleh nilai 0.8413:
5
Cari luas area di bawah kurva normal standar di P(z2<1) = 0.8413
sebelah kiri Z = –1 dengan menggunakan Tabel Z
Ketiga, kurangkan luas z2 dengan z1:
[1], diperoleh nilai 0.1587:
P(95 < X < 100) = P(–1 < Z < 1)
P(z1<–1) = 0.1587 = P(z2<1) – P(z1<–1)
Kedua, hitung nilai z2 untuk X2 = 105 : = 0.8413 – 0. 1587 = 0.6826
X2 − 105 − 100 Langkah 3: Kesimpulan: Probabilitas talk time
z2 = = =1 SUATU baterai antara 95 dan 100 menit
5
sebesar 68.26%.
Kuis 4.1 |Diskusi Kelompok
Aplikasi Dist.
Normal
PARAMETER DAN STATISTIK
Sampling Error = ( – μ)
Nilai Error bisa bernilai (+) atau (-). Besar-kecilnya error yang akan menentukan
bersar-kecilnya ukuran sampel.
Diketahui data 8 buah data sampel: 48, 52, 54, 55, 58, 59, 60 dan 62. Hitung
Rata-rata Simpangannya?
xi − x 30
x = 56 RS = = = 3.75
n 8
Apa itu variansi ? Simpangan Baku?
Ukuran simpangan yang paling banyak digunakan adalah variansi dan simpangan
baku (standar deviasi).
N
2 = i =1 i =1
Sehingga simpangan bakunya: = 2
N 2
(x − x) i
2
Kemudian dari masing-masing sampel yang telah terambil dihitung sehingga diperoleh
suatu statistik tertentu seperti rataan, proporsi, standar deviasi, dsb. sebagai estimator
populasinya. Karena setiap ukuran statistik sampel memiliki sebuah distribusi sampling,
maka penamaan suatu distribusi sampling akan mengikuti nama dari statistik yang
dipelajari.
• Suatu statistik rataan, maka disebut Distribusi Sampling Rataan.
• Suatu statistik proporsi, maka disebut Distribusi Sampling Proporsi
• Suatu statistik variansi, maka disebut Distribusi Sampling Variansi dan sebagainya.
4.2 Distribusi Sampling Rataan
(Sampling Distribution of The Sample
Mean)
DISTRIBUSI SAMPLING RATAAN adalah distribusi rata-rata aritmetika dari seluruh
sampel acak berukuran n yang mungkin, yang dipilih dari sebuah populasi berukuran N.
Dikatakan distribusi sampling rata-rata karena tujuannya menaksir rata-rata atau mean
dari populasi.
Ketika semua sampel yang mungkin dengan ukuran n dipilih dengan pengembalian (With
Replacement) dari suatu populasi, distribusi sampling rataan untuk sebuah variabel
memiliki 2 sifat penting:
1. Mean dari rataan sampel akan sama 2. Standar deviasi rataan sampel akan
dengan mean populasi. lebih kecil dari standar deviasi dari
populasi, dan itu akan sama dengan
standar deviasi populasi dibagi dengan
akar kuadrat dari ukuran sampel.
Contoh Persoalan Distribusi Sampling Rataan
Misalnya:
Nilai-nilai populasi {1, 3, 5, 7} masing-masing ditulis di secarik kertas dan dimasukkan ke
dalam sebuah kotak. Dua slip kertas dipilih secara acak, dengan pengembalian (WR).
a. Carilah mean, varians, dan standar deviasi dari populasi?
x ( x − )2
Mean: = =4 Variance: = 2
=5 Standard Deviation: = 5 2.236
N N
43
c. Tentukan banyaknya (kemungkinan) sampel untuk pengambilan 2 slip kertas (n) dipilih secara acak,
dengan pengembalian (WR)?
𝑊𝑅 𝑁𝑛
Populasi
• Memperhatikan urutan (abba)
N Sampel 𝑁!
n 𝑁 𝑃𝑛 =
𝑁−𝑛 !
𝑊𝑂𝑅 • Tidak memperhatikan urutan (ab=ba)
Populasi 𝑁 𝑁!
Terbatas 𝑁 𝐶𝑛 = =
𝑛 𝑛! 𝑁 − 𝑛 !
Dimana: 𝑁 𝑃𝑛 > 𝑁 𝐶𝑛
44
4.2.1 Konsep Distriubsi Sampling Rataan
Distribusi Sampling
Populasi
Rata-rata
Parameter:
µ,
Statistik:
WR
Sampel
x1 , x 2 ,..., x N n
Nn
n
x x =
x = ni n
N
45
46
47
c. Gambarkan grafik distribusi probablility histrogram dari rataan sampelnya?
Daftar semua 16 sampel berukuran 2 yang mungkin Distribusi Peluang dari Rataan Sampel
dari populasi dan rata-rata masing-masing sampel
Perhatikan:
Bentuk histogram adalah
lonceng dan simetris, mirip
dengan kurva normal
48
d. Carilah mean, varians, dan standar deviasi dari rataan sampel?
Pada solusi a., sudah diperoleh:
x ( x − )2
Mean: = =4 Variance: = 2
=5 Standard Deviation: = 5 2.236
N N
Maka:
σ 𝑥ҧ𝑖 64
• Mean dari rataan sampelnya: 𝜇𝑥ҧ = 𝑛 = =4 (𝜇𝑥ҧ = 𝜇)
𝑁 16
σ 2
• Variansi dan Standar deviasi (𝑥ҧ 𝑖 − 𝜇) 40
𝜎𝑥ҧ 2 = = = 2.5
dari rataan sampelnya: 𝑁𝑛 16
→ 𝜎𝑥ҧ = 2.5 = 1.58
Atau:
𝜎 2.236
𝜎𝑥ҧ = = = 1.58
𝑛 2
49
RINGKASAN
Distribusi Sampling Rataan
4.2.2 Teorema Limit Pusat
(The Central Limit Theorem)
a. SAMPEL BESAR
Teorema Limit Pusat menjelaskan hubungan antara distribusi sampling rataan
sampel dan populasinya.
Normal Standar vs CLT
Misalkan baterai Li-Ion 1100 mAh memiliki mean talk time 100 menit berdistribusi normal
dengan simpangan baku 10 menit. Pertanyaan:
1. Carilah probabilitas SUATU baterai tertentu akan berumur kurang dari 98 menit?
2. Apabila random sampling sebanyak 25 buah baterai, berapa probabilitas baterei akan memiliki
umur rata-rata kurang dari 98 menit?
SOLUSI:
1. Menentukan probabilitas sebuah nilai P(Z<−0.2)=?
tertentu dari variabel random X:
P(X < 98)= ?
Untuk X = 98 dan µ = 100 dan = 10
0.4207
diperoleh:
X − 98 − 100 −0.2
0 Z
Z= = = −0.2
10 Kesimpulan: Probabilitas talk time SUATU
Dengan menggunakan Tabel Z [1], diperoleh: baterai kurang dari 98 menit
P(X<98) = P(Z<–0.2) = 0.4207 sebesar 42.07%.
Misalkan baterai Li-Ion 1100 mAh memiliki rataan talk time 100 menit berdistribusi normal
dengan simpangan baku 10 menit. Pertanyaan:
1. Carilah probabilitas SUATU baterai tertentu akan berumur kurang dari 98 menit?
2. Apabila random sampling sebanyak 25 buah baterai, berapa probabilitas baterei akan
memiliki umur rata-rata kurang dari 98 menit?
SOLUSI:
2. Menentukan probabilitas nilai rataan sampling
P(Z<−1)=?
: P( <98) = ?
Untuk n =25 (<30, tetapi asumsi berdistribusi
normal sehingga dapat digunakan CLT),
µ = 100 dan = 10 diperoleh: 0.1587
−1
0 Z
x − 98 − 100
Z= = = −1 Kesimpulan: Probabilitas rataan talk time
/ n 10 / 25
baterai dari 25 baterai kurang
Dengan menggunakan Tabel Z [1], diperoleh: dari 98 menit sebesar 15.87%.
P( <98) = P(Z<–1) = 0.1587
Kuis 4.2 |Diskusi Kelompok
Normal
Standar atau
CLT
b. SAMPEL KECIL
Pengenalan DISTRIBUSI – t
• Secara praktis, ketika tidak diketahui maka digunakan Distribusi–t
dengan menganggap hampiran normal.
• Distribusi–t biasanya disebut Distribusi Student mirip dengan Distribusi
Z karena keduanya setangkup dan berbentuk lonceng.
a
0 ta
Tabel Distribusi – t
• Memperhatikan kurvanya, jika luas α nya semakin besar (α → 1), maka nilai t
semakin kecil (t → – ).
• Dua hal yang perlu diperhatikan dalam Tabel Distribusi-t, yaitu:
1. Derajat kebebasan (degree of freedom) disingkat dengan db atau v dengan:
v = n -1.
2. Nilai a, yaitu luas daerah kurva di kanan dengan nilai (+t) atau di kiri
dengan nilai (–t).
a a a
0 0 ta
ta -ta= t1-a
Tabel Distribusi – t
• Oleh karena Distribusi t setangkup terhadap
rataan nol, maka t1-a = –ta , yaitu nilai t yang luas
sebelah kanannya (1–a) sama dengan nilai minus t
(–t) yang luas sebelah kirinya a. Dengan demikian,
nilai minus nilai t (–t) sama dengan nilai t yang a
luas bagian kanannya a. Jadi: t0.95 = –t0.05, t0.99 = – 0 ta
t0.01, dst.
Misalnya nilai t dengan derajat kebebasan v=14
sehingga luas di sebelah kirinya 0.025, atau luas di
sebelah kanannya 0.975 adalah:
t0.975 = –t0.025 = –2.145. a a
0
Contoh lainnya mencari luas P(–t0.025 < t < t0.05). -ta= t1-a ta
Maka luas di sebelah kanan t0.05 dan di sebelah kiri
–t0.025, maka jumlah luas antara –t0.025 dan t0.05
adalah:
(1–0.05–0.025) = 0.925.
Hubungan Distribusi-t dan Z
a a
0 − 0
ta z
Memilih CLT atau t-Student
CLT atau t–Student?
YA
Central Limit
Theorem*) *) n<30 harus berdistribusi normal
LATIHAN 4.4
Sampel Kecil dengan Distribusi-t
Manajer produksi sebuah pabrik baterai Litihium Ion 1100 mAh, menyatakan bahwa
baterainya memilik talk time 100 menit. Agar kualitas talk time tsb. dapat dipertahankan,
setiap hari dilakukan pengujian sebanyak 9 unit baterai. Bila nilai t yang dihitung antara –t0.05
dan t0.05, maka manajer akan mempertahankan keyakinannya.
Pertanyaan:
Jika rataan sampel 103 menit dengan simpangan x − 103 − 100
t= = = 4,5
baku 2 menit berasal dari populasi hampir s/ n 2/ 9
normal, kesimpulan apa yang dapat ditarik? Kesimpulan: Manajer merasa tidak puas karena
nilai 4,5 berada diluar batas nilai t yaitu –1.86 dan
SOLUSI: 1.86 sehingga kualitas talk time diluar dari yang
Persoalan distribusi rataan sampel dengan n kecil (9 diyakini yaitu 100 menit
<30) walaupun diasumsikan hampir normal tetapi
simpangan baku populasi tidak diketahui.
Dengan v = 8, dari Tabel t diperoleh t0.05 = 1.86.
Manajer akan mengetahui konsistensi kualitas talk
timenya bila sampel 9 baterai memberikan nilai t
antara –1.86 dan 1.86. Diketahui µ = 100 dan = 105 0.05 0.05
dan s = 2, maka: -1.86 0 1.86
1.155
Nilat t0.05?
Kuis 4.3 |Diskusi Kelompok
Distribusi
Rataan n
besar & kecil
b. Distribusi Sampling Selisih Rataan
Distribusi Sampling Selisih Rataan
LATIHAN 4.5
Suatu sampel berukuran n1 = 5 diambil secara acak dari populasi yang berdistribusi
normal dengan rataan 1 = 50 dan variansi σ21 = 9, dan rataan sampel 1 dihitung. Sampel
acak kedua berukuran n2 = 4 diambil dari populasi lain yang bebas dari yang pertama
yang juga berdistribusi normal, dengan rataan2 = 40 dan variansi σ22 = 4, dan rataan
sampel 2 dihitung.
Pertanyaan:
Cari nilai probabilitas selisih rataan sampel pertama dan kedua adalah kurang dari 8,2 ?
Solusi:
4.3 Distribusi Sampling Proporsi
a. Distribusi Sampling 1 Proporsi
Konsep Distribusi Sampling Proporsi
Distribusi Sampling
Proporsi
Populasi
N
Parameter:
X
p → =
N
p=
Statistik: → = pˆ
WOR
x pˆ1, pˆ 2 ,..., pˆ N Cn
Sampel
pˆ =
n
n
N Cn
p̂i p(1 − p) ( N − n)
pˆ = pˆ = .
N Cn
n ( N − 1)
Karena persoalan proporsi sejalan dengan percobaan binomial, maka berlaku
pendekatan normal terhadap binomial. Koreksi kontinuitas dapat diterapkan pada
nilai diskrit suatu variabel X dengan menambah atau mengurangkan0.5 satuan (cara
pertama) atau pada variabel proporsinya dengan menambah atau mengurangkan
0.5/n (cara kedua).
LATIHAN 4.6
Diketahui sebanyak 10% dari ibu-ibu rumah tangga di Bandung memakai detergen Ringso untuk
mencuci pakaiannya. Misalkan dari populasi tersebut diambil sampel berukuran 100, maka:
Pertanyaan:
1. Tentukan rata-rata dan simpangan
baku sampel dari populasi ibu-ibu
rumah tangga yang memakai Ringso?.
Anggap populasi normal.
2. Bila dari sampel tersebut terdapat
paling sedikit 15 ibu rumah tangga
yang memakai Ringso, tentukan
probabilitasnya?
SOLUSI:
b. Distribusi Sampling 2 Proporsi
Distribusi sampling 2 proporsi yang berasal dari 2 populasi merupakan persoalan selisih dua
parameter binomial, yaitu distribusi probabilitas yang dapat terjadi dari selisih statistik
proporsi 2 sampel yang berasal dari parameter 2 populasinya.
LATIHAN 4.7
Lima persen barang di gudang timur cacat, sedangkan barang yang cacat di gudang barat sebanyak 10%.
Bila sampling acak sebanyak 200 barang dari gudang timur dan 300 barang dari gudang barat dari kedua
populasi normal.
Pertanyaan:
Tentukan probabilitas barang yang cacat dalam gudang barat 2% lebih banyak dibanding gudang timur?
SOLUSI: