Anda di halaman 1dari 53

Materi 5

Pengujian Hasil Bilangan Random



Ir. Risma A. Simanjuntak, MT


Teknik Industri
Fakultas Teknologi industri
Institut Sains & Teknologi AKPRIND
Yogyakarta

Kompetensi
Memahami pengertian distribusi probabilitas

Memahami penggunaan distribusi probabilitas
dalam simulasi

Mengetahui teknik pengujian

Dapat memvalidasi algoritma simulasi dengan
pengujian Goodness of Fit
Pokok Bahasan
Pengujian pembangkit bilangan random

Frequency test
(Kolmogorof-Smirnov atau Chi Square)

Runs test


Pengantar
Suatu bilangan acak mempunyai dua sifat
statistik yang penting, yaitu keseragaman dan
ketidaktergantungan (uniformity and
independence). Untuk mendapatkan sifat yang
diinginkan dari bilangan acak secara pasti, maka
sejumlah pengujian harus dilakukan
Hasil bilangan random yang baik :
Bilangan random yang dihasilkan benar-benar
tampak dari distribusi U(0,1)

Tidak ada korelasi antar bilangan random
(independence)

Beberapa pengujian :
Frequency test (Kolmogorof-Smirnov atau Chi
Square)
Runs test
Autocorrelation test
Gap test
Poker test
Test untuk uniform
Hipotesa :
Ho : Ri ~ U(0, 1)
H1 : Ri ~ U(0, 1)
Independence
Hipotesa :
Ho : Ri ~ Independently
H1 : Ri ~ Independently
1. Frequency Test
Kolmogorof-Smirnov
digunakan untuk sample kecil

Fn (x) = Number of Xi / N

F (X
i
) = i / n
Langkah-langkah
1. Rangking data mulai dari yang terkecil sampai
terbesar
R1 < R1 < < RN

2. Hitung
D
+
= max { i / N - Ri }
D
-
= max { R
i
- (i 1) / N }

3. Hitung D = max ( D
+
, D
-
)

Langkah (lanjut) :
4. Tentukan nilai kritis (table) dari table
dengan tingkat kepercayaan dan sample N

5. Jika nilai hitung lebih besar dari nilai table
maka data tersebut berdistribusi uniform atau
distribusi tertentu
Test distribusi
Distribusi uniform :
F(x) = 1/(b-a) x a < x < b

a = 0 dan b = 1

Distribusi eksponensial
f(x) = 1/ . e
-x/
untuk x > 0

F(x) = 1
e-x /
untuk x > 0
Contoh 1. Test Kolmogorof Smirnov

Distribusi uniform
Misalkan hasil bilangan pembangkitan : 0.44 ,
0.81 , 0.14 , 0.05 , 0.93

Test apakah data tersebut berdistribusi
uniform

Dengan tingkat kepercayaan = 0.05
Penyelesaian :
Untuk sample kecil ---- test Kolmogorof Smirnov

R
1
0.05 0.14 0.44 0.81 0.93
i/N 0.20 0.40 0.60 0.80 1.00
i / N - R
i
0.15 0.26 0.16 - 0.07
R
i -
(i 1) / N 0.05 - 0.04 0.21 0.13
Dari table = 0.05 dan N = 5 adalah 0,565
Nilai hitung < nilai table : 0.26 < 0.565
Berarti berdistribusi uniform

******
Contoh 2. Test Kolmogorof Smirnov

Distribusi eksponensial

Berdasarkan pengamatan didapat data interval waktu
kedatangan sebagai berikut :

3.10 0.20 12.10 1.40 0.05 7.00 10.90 13.70
5.30 9.10

Tes data tersebut apakah berdistribusi eksponensial
Penyelesaian :
Sample kecil ---- test Kolmogorof Smirnov
No X
i
F(x
i
) i/n i/n F(x
i
) F(x
i
) (i-1) / n
1 3.10 0.049 0.1 0.051 0.049
2 3.30 0.052 0.2 0.148 -0.048
3 15.40 0.244 0.3 0.056 0.044
4 16.80 0.267 0.4 0.133 -0.033
5 16.85 0.267 0.5 0.233 -0.133
6 23.85 0.379 0.6 0.221 -0121
7 34.75 0.552 0.7 0.148 -0.048
8 48.45 0.769 0.8 0.031 0.069
9 53.75 0.853 0.9 0.047 0.053
10 62.85 0.998 1.0 0.002 0.098
D
+
= 0.233 D
-
= 0.098
Dari table X2 0.05 , 10 = 0.409 ;

nilai hitung = 0.233

Nilai hitung < nilai table : 0.233 < 0.409

Berarti berdistribusi eksponensial




*****
Contoh 3. Test Chi Square

Untuk Distribusi uniform
Misalkan :
Hasil bilangan pembangkitan bilangan sebanyak
100 kali seperti data dibawah ini

Test apakah data tersebut berditribusi uniform

Tingkat keyakinan 5%
Data pengamatan
0.34 0.90 0.25 0.89 0.87 0.44 0.12 0.21 0.46 0.67
0.83 0.76 0.79 0.64 0.70 0.74
0.06 0.99 0.02
0.47 0.30 0.05
0.79 0.42
0.99 0.49
0.37 0.49
0.72 0.05
0.06 0.62
0.18 0.26 0.97 0.88 0.64 0.47 0.60 0.11 0.29 0.78
Pdf dari distribusi uniform :

f(x) = untuk a x b

a = 0 dan b 1 maka f(x) = x

X
0
2
= (O
i
E
i
)
2 /
E
i
E
i
= n/m ------ E
i
= n.p
i



dx
a b
1
Contoh perhitungan :

p
i
= f
x
(x) dx

P
i
=


dx
a b
1
= x
10


= 0.10 0 = 0.10

E = n.p
1
= 100 x 0.10 = 10

20

P
2
= x
10




Dst
Penyelesaian :

Interval Freg
Pengamatan
O
i

Freg Harapan
E
i

( O
i
- E
i
)
2
/ E
i

0.00-0.10 8 10 0.4
0.10-0.20 8 10 0.4
0.20-0.30 10 10 0.0
0.30-0.40 9 10 0.1
0.40-0.50 12 10 0.4
0.50-0.60 8 10 0.4
0.60-0.70 10 10 0.0
0.70-0.80 14 10 1.6
0.80-0.90 10 10 0.0
0.90-1.00 11 10 0.1
Total 100 100 3.4
Dari table X2 0.05 , 9 = 16,9 ;

nilai hitung = 3.4

Nilai hitung < nilai table : 3.4 < 16.9

Berarti data berdistribusi uniform



******
Contoh 4 Berdistribusi Eksponensial

Berdasarkan data pengamatan kedatangan yang dilakukan

sebanyak 60 kali pengamatan

Test data tersebut apakah benar berdistribusi eksponensial

dengan tingkat kepercayaan 5%

12 07 26 06 18 15 44 28 09 44 16 19 37 29 08
10 09 18 35 17 20 31 08 24 15 18 30 11 28 68
07 19 04 26 25 37 46 09 18 14 07 34 26 09 49
09 16 32 07 04 06 23 08 36 19 05 21 09 03 22
Data pengamatan
Penyelesaian :
Menentukan banyaknya interval kelas
Range : X
max
- X
min

K = (1 + log 30)

P = Range / k


a. Tentukan interval kelas dan frekuensi

Kelas Frekuensi Data
00 - 10 19 07 06 09 08 09 .. .. ..
10 20 16 12 18 15 16 19 10 .. .. ..
20 30 12 26 28 29 24 28 .. .. ..
30 40 8 37 35 31 30 37 .. .. ..
40 50 4 44 40 46 49
50 60 0
60 70 1 68
Pdf dari distribusi eksponensial :

f(x) = 1/ . e-
x/
untuk x > 0


CDF distribusi eksponensial :

F(x) = 1 e-
x

/
untuk x > 0

Pi = Fx (ai) - Fx (ai-1)

Fx (ai) = Fx (10) = 1 - e-
10

/ 20.1
= 0.392

Fx (ai-1) = Fx (0) = 1 -
e-0 / 20.1
= 0

Pi = P1 = 0.392 0 = 0.392

Maka E1 = n.p1 = 60 x 0.392 = 23.52

b. Perhitungan Chi Sguare Test

Kelas Freg
Penga
matan
(O
i
)
Freg
Harap
an
(E
i
=n.p
i
)
(O
i
E
i
)
2
/ E
i

00 10 19 23.52 0.869
10 20 16 14.31 0.200
20 30 12 8.69 1.261
30 40 8 5.29 1.388
40 50 4 3.21 1.236
50 70 1 4.97
T o t a l 60 60 4.954
Jika frekuensi lebih kecil dari 5 dapat
dikombinasikan dengan frek yang terdekat

Dari table X2 0.05 , 5 = 7.81 ;
nilai hitung = 4.954

Nilai hitung < nilai table : 4.954 < 7.81

Berarti berdistribusi eksponensial


*******

2. Uji Run (Runs Test)
Runs up and Runs down
Uji ini menggunakan metode naik run dan turun
run .

Suatu run didefinisikan sebagai rangkaian dari
suatu kejadian (event) yang sama yang
didahului dan di ikuti oleh kejadian yang
berlainan.
Run test (lanjut)
Panjang dari run adalah jumlah dari kejadian
yang timbul dalam run.

Analisa uji run dideskripsikan sebagai bilangan
yang nilainya di atas rata-rata diberi tanda + dan
yang nilainya di bawah rata-rata akan diberi
tanda -. Kemudian jumlah panjang (b) dari run
untuk setiap tanda dijumlahkan.

Run test (lanjut)
Formula yang digunakan adalah :

N = n
1
+ n
2


Keterangan :
n1 = jumlah bilangan di atas rata-rata
n2 = jumlah bilangan di bawah rata-rata.
N = Jumlah panjang dari run
Run test (lanjut)
Untuk nilai n1 atau n2 > 20, nilai b cukup
beralasan bila didekati oleh distribusi normal, N.
Pendekatan ini dapat digunakan untuk menguji
ke tidak tergantungan dari sejumlah angka yang
dibangkitkan oleh suatu generator. Oleh karena
itu, uji statistik normal standar dapat
dikembangkan dengan menggunakan mean dari
jumlah pengamatan run,b dan membaginya
dengan standar deviasi.
( )
( )
( )
| |
2
1
2
2 1 2 1
2 1
1
. . 2 . . 2
2
1
. . 2
0



=
N N
N n n n n
N
n n
b
Z
Uji statistik tersebut adalah :


Kegagalan untuk menolak hipotesis
ketidaktergantungan
terjadi jika Z/2 Zo Z/2
dimana adalah tingkat kepercayaan.
Nilai kritis dan penolakannya dapat dilihat
seperti gambar dibawah ini :

Daerah Penerimaan Hipotesis
Z/2 Z/2
Daerah penerimaan
Gambar 1 Daerah Penerimaan Hipotesis
Contoh Run Test
0,63 0,72 0,79 0,81 0,52 0,94 0,83 0,93 0,87 0,67
0,54 0,83 0,89 0,55 0,88 0,77 0,74 0,95 0,82 0,86
0,43 0,32 0,36 0,18 0,08 0,19 0,18 0,27 0,36 0,34
0,31 0,45 0,49 0,43 0,46 0,35 0,25 0,39 0,47 0,41
Urutan runs up dan runs down sebagai
berikut :
+ + + - +

- +

- - -
+ + - +

- - +

- +

-
- +

- - +

- - +

+ -
- + +

-

+

- - + +

-
Menentukan :
n
1
= 18

n
2
= 22

N = n
1
+ n
2
= 22+ 18 = 40

b = 17

Untuk menentukan mean digunakan formula :

2
1 . . 2
2 1
+ =
N
n n
b



= 20,3

2
1
40
22 . 18 . 2
+ =
Untuk menentukan variasi digunakan
formula :
( )
( ) 1
. . 2 . . 2
2
2 1 2 1
2


=
N N
N n n n n
b
o
9,54
( )
( ) 1 40 40
40 22 . 18 . 2 22 . 18 . 2
2


Untuk uji statistiknya digunakan formula
( )
( )
( )
| |
2
1
2
2 1 2 1
2 1
1
. . 2 . . 2
2
1
. . 2
0



=
N N
N n n n n
N
n n
b
Z
= - 1,07
54 , 9
3 , 20 17
Test hipotesa
Nilai uji statistik Z
0,025
= 1,96 , berada dalam
daerah penerimaan , yang menyatakan bahwa
bilangan-bilangan acak yang dibangkitkan tersebut
tidak bergantung satu dengan yang lainnya




*******
Replikasi
Replikasi mempunyai pengertian bahwa setiap
menjalankan dan menghentikan simulasi
dengan cara yang sama dan menggunakan set
parameter input yang sama pula (identical part)
tetapi menggunakan masukan bilangan random
yang terpisah (independent part) untuk
membangkitkan hasil-hasil simulasi
Panjang waktu simulasi yang diinginkan setiap
replikasi disebut length of replication.
Jumlah Replikasi

Pendekatan yang digunakan dalam
simulasi adalah dengan membangkitkan
data dalam jumlah yang cukup kemudian
dilakukan pengulangan (replikasi) untuk
dapat menganalisa hasil dari simulasi
yang dijalankan.
Metode yang umum untuk
menentukan jumlah replikasi adalah
dengan melakukan beberapa
percobaan menggunakan berbagai
bilangan acak berbeda untuk
mendapatkan mean dan deviasi
standar dari variabel yang diukur.
Menentukan panjang simulasi
N =
2
2 2
K
SD Z

Keterangan :
K = akurasi yang diinginkan dari variabel simulasi
p = tingkat akurasi
SD = standart deviasi data observasi
N = rata-rata dari jumlah variabel simulasi
Z = deviasi normal standar

dengan nilai K = p.
x
x


Z = 1,96 (dengan tingkat kepercayaan = 95%)

a. K = p.
x





2
2 2
K
SD Z
( ) ( )
( )
2
2 2
204 , 1441
93 , 9361 96 , 1


162,10
162 ~

= 5% x 28824,08 = 1441,204
Rangkuman
Satu cara yang sering digunakan dalam
menetapkan distribusi probabilistik dari
variabel yang ada adalah dengan
menganalisa data-data historis.

Rangkuman (lanjut)
Lakukan simulasi untuk sejumlah besar
pengamatan. Jumlah replikasi yang sesuai
dengan cara yang sama dengan jumlah yang
tepat dari suatu sampel dalam eksperimen
aktual. Uji statistik yang umum mengenai
signifikansi yang dapat digunakan. Dengan
simulasi komputer, jumlah sampel yang dapat
dilakukan sangat

Soal soal
1. Dengan menggunakan KS dan tingkat kepercayaan
0,05 , test data tersebut apakah berdistribusi
eksponensial 29,02, 06, 33, 18, 23, 07, 01, 37, 47, 14,
03, 21, 31, 07, 05, 09, 11,15, 24

2. Misalkan 22 batches dari hasil yang sudah
dibangkitkan 5.7, 22.8, 17.4, 14.9, 20.1, 24.5, 24.7,
19.5, 16.3, 18.0, 21.3, 23.6, 23.9, 18.2, 18.8, 21.3,
20.6, 17.7, 19.4, 19.9, 16.8, 21.2, dengan confidence
level 95%. Hitung , mean, variance dan uji statistik
Kunci Jawaban

1. Berdistribusi eksponensial


2. Mean = 14,33
Variance = 3,59
Z = - 0,93