Anda di halaman 1dari 15

9.

Penentuan Model
Distribusi Secara Empiris
OUTLINE

 Kertas Probabilitas

 Pengujian Keabsahan dari Distribusi yang


Diasumsikan/test statistik untuk validitas pdf
tertentu
Pendahuluan (1)
Penetapan secara empiris pdf (model distribusi);
a) Secara teoritis dapat diduga, yaitu berdasarkan sifat proses fisik :
- nilai ekstrim  pdf nilai ekstrim (pdf gumbel, log poisson,…)
- antrian  eksponensial
- gabungan dari efek individual, tidak ada yang dominan; normal.
b) Secara empiris, yaitu berdasarkan data yang dikumpulkan :
1. visualisasi dari diagram frequency : (kualitatif)
2. plotting pada kertas probabilitas
- kertas gumbel
- kertas log normal
- kertas normal
- kertas log poisson
jika dihasilkan garis lurus, maka data-data tersebut cocok
dengan pdf yang bersangkutan, karena kertas probabilitas
menghasilkan garis lurus jika data-data yang cocok.
(kualitatif).
Pendahuluan (2)
3. melakukan test statistik : terdapat pdf anggapan :
Test statistik tsb disebut : goodness of fit test untuk pdf. Test ini
bersifat kuantitatif. Ada kepastian suatu asumsi diterima atau
ditolak untuk tingkat keandalan tertentu. Dan jika dua pdf diterima
untuk suatu set data, maka dapat diputuskan dengan pasti pdf mana
yang lebih tepat.
Dua test yang biasa dipakai : i) Kolmogorov – Smirnov Test
ii) Chi Square Test
Kertas Probabilitas (1)
 Kertas untuk memplot data eksperimental dari kumulatif
frekuensi (probabilitas)
 Spesifik untuk pdf tertentu
 Dibuat umunya dengan transformasi skala, sehingga terdapat
suatu hubungan yang linier antara probabilitas kumulatif dari nilai
variabel.

Cara memplot data eksperimental :


1. Misal ada N pengamatan
2. Urut data dari kecil ke besar
3. Hitung plotting position (probabilitynya)
a. Hazen (m-½)/N
b. Kimball
c. dll
d. yang paling sederhana : Prob = m/(N+1)
Kertas Probabilitas (2)
4. Plot titik teoritis
5. Berdasarkan jenis distribusi, tarik garis teoritis
6. Lihat secara visual apakah titik-titik mendekati garis lurus
tersebut
7. Ambil kesimpulan sendiri, diterima atau tidak.
A. Kertas Distribusi Normal (1)
Data diurutkan Mis. Data tinggi badan (cm)
Mean = 165,5 cm dan Std. Dev. = 10
Mis. prob data ke 15 = 15/30+1 = 0,48
m Xi P(X<Xi) = m/(n+1)
f (x)
1 150 0,03
2 154 0,06
Pdf N(165.5,10)
3 155 0,09
x teori
eksperimen
175

x  x  1 xa x
170 (1, x   ) x x  x  1
f (x)
x
165
(0, x) x  x
S
160 x
s
155
(S)   f(s) dx
150 (S) 
0,16 0,5 0,84
x  x
S
-2 -1 0 1 2 x xa   x x
Sa  S=0 S=1
x
A. Kertas Distribusi Normal (2)
Persamaan garis : y = ax + b  ((Y-Y1)/(Y2-Y1))= ((X-X1)/(X2-X1))
xx s0 xx
   s  x  x  s  x
 
x   x 1 0 
diperoleh untuk
x  x X(s) 0,5
 x  X 0,84  x karena 0,84 x
 s 1
x

xp  x
Slope = x p   x   , karena slope =
x
s s

Misal diambil s = 2
Maka slope =  x  2    x  
2
Memplot garis teoritis : dari pdf nya  dengan min. 2 harga untuk
menentukan garisnya
Memplot data eksperimen : dari plot-plot data.
Menentukan pdf nya juga tergantung kertas yang dipakai.
x

170
Xa

  = selisih probabilitasnya
165  yang menentukan tingkat
kecenderungan data terhadap garis
160 teoritis

155

150 (S)
P( X  Xa) P( X  Xa)

teoritis eksperimen
A. Kertas Pdf Log Normal
x

XM = Xmedian.
ln x  
ln X M   Variabel standard = s  
 1. Jika s = 0, (S) = 0,5  ln XM = 
ln X M
2. Jika s = 1, = 0,84  ln X0,84 = ln XM
+  maka  slope
(S) dari garis = 
Skala Log

(S)
0,5 0,84
S(linier)
0 1
Prosedur :
1. Urut kecil – besar
2. Hitung Pexp = m/(n+1)
3. Plot

4. Hitung  & tarik
(S) garis teoritis melalui 2 titik
a. s = 0, = 0,5  X0,5 = XM
b. s = 1, (S) = 0,84  X0,84 = XM + 
5. Nilai sendiri (teoritis) apakah linier atau tidak.
Test Statistik Untuk Validitas Pdf Tertentu (1)
(Goodness of Fit Test)

Digunakan untuk memeriksa seberapa jauh kecocokan antara asumsi pdf


tertentu dengan data. Mis. Dari survey/data diperoleh X1,… Xn.
Diasumsikan data tersebut mengikuti pdf normal. Dit. Apakah dapat
diterima untuk keandalan tertentu dan seberapa jauh kecocokan
tersebut ?.
Ada 2 test.
Test 1 : Kolmogorov – Smirnov (KS) Test
Test 2 : Chi Square Test

KS Test
Membandingkan frekuensi kumulatif teoritis dan frekuensi kumulatif
eksperimen. Sebut perbedaan
D = Pteoritis – Peks.
Test Statistik Untuk Validitas Pdf Tertentu (2)
(Goodness of Fit Test)

a. Hitung Dn = maks |F(x) – Sn(x)| ; F(x)  teoritis dan Sn(x) 


eksperimental
b. KS Test  menghitung perbedaan max antara data teoritis.
P Dn  Dn   1   harga Dn ditabulasikan merupakan fungsi
dari n & α.
Dn  Dn  asumsi pdf tersebut dapat diterima dengan taraf nyata
(significance level) α.
jika ternyata 2 atau lebih pdf memiliki Dn  Dn, maka diambil pdf
yang paling kecil.

Contoh :
Data tinggi mhs statistik (tabel) Lihat Tabel A4.

- Asumsikan normal
- Apakah dapat diterima dengan taraf nyata 10%, Dn = D9 10% = 0,37
Test Statistik Untuk Validitas Pdf Tertentu (3)
(Goodness of Fit Test)

Ctt.
- Pteoritis N dihitung dengan
probabilitas distribusi normal.
- Pteoritis Log N dihitung dengan
probabilitas distribusi Log normal.

Dn =D = 0,37
10%
9
Dmaks = 0.0995 < 0.37  pdf normal dapat diterima dengan taraf nyata 10%
Dmaks = 0.1023 < 0.37  pdf Log normal dapat diterima dengan taraf nyata 10%
Terdapat 2 nilai, sehingga dilihat yang terkecil :
Dnormal < Dlog normal
0.0995 < 0.1023, maka pdf normal lebih tepat datanya daripada log normal.
Test Statistik Untuk Validitas Pdf Tertentu (4)
(Goodness of Fit Test)
Chi Square Test
Membandingkan “nilai frekuensi
observasi” dengan nilai frekuensi f (x) e
teoritis.
n
e e
Ctt: Jika parameter dari pdf teoritis n n
diestimasi dari data yang e e
dikumpulkan maka degree of n n
freedom harus dikurangi dgn
banyaknya parameter x
yang diestimasi.

155
160
165
170

175
180
C1-α, f adalah nilai x dari tabel. Untuk
memakai test Chi Square, sebaiknya
K≥5; Ni≥5.
K = jumlah kelas/selang data ; N =
jumlah data tiap kelas.
Test Statistik Untuk Validitas Pdf Tertentu (5)
(Goodness of Fit Test)
Distr. Normal

C1-α, f
dof =k-2=6-2=4
α ditentukan sendiri.

Ctt.
(1)KS test tidak perlu membagi data dalam kelas sehingga masalah K≥5 ;
ni≥5 tidak ada.
(2)Jika 2 test dengan taraf nyata tertentu diterima, maka yang lebih
baik adalah yang mempunyai nilai test lebih kecil baik untuk KS test
atau chi square test.

Anda mungkin juga menyukai