Anda di halaman 1dari 27

BAB III

ANALISIS DAN PERANCANGAN SISTEM

3.1 Gambaran Umum

Pada tugas akhir ini kami menerapkan Quality of Service dari Web Service

untuk diklasifikan menggunakan Random Forest. Dimana klasifikasi ini

mempermudah kita untuk melihat mana web service bagus dan mana web service

yang kurang bagus dipakai. Jadi kita tidak kesusahan memilih web service yang

bagus dan kurang bagus.

Disini kita akan melakukan input dari kelima variable. Setelah kita

melakukan input, program akan melakukan klasifikasi menggunakan algoritma

Random Forest sampai selesai. Kemudian setelah klasifikasi selesai, program akan

menghasilkan hasil dari proses klasifikasi. Hasil dari proses klasifikasi ini ada 4

hasil, yaitu Bronze, Silver, Gold dan Platinum.

Data yang digunakan dalam tugas akhir ini adalah data dari Al-Masri, E.,

and Mahmooud, Q.H.: Investigating Web Services on the World Wide Web.

Datanya yaitu Response Time, Availability, Troughput, Successibility dan

Reliability.

20
3.2 Rancangan Sistem

Gambar 3.1 : Alur rancangan sistem

Gambar 3.1 merupakan alur rancangan sistem yang mana client me-request

ke server berupa data diagnosa dari atribut-atribut klasifikasi, lalu server akan

mengolah data menggunakan algoritma yang sudah ditentukan dan server akan me-

response ke client dengan mengirim informasi berupa kualitas web service apakah

Bronze, Silver, Gold atau Platinum.

21
3.2.1 Flowchart Sistem Web Service

START

Response Time,
Availability,
Troughput,
Successibility,
Reliability

Klasifikasi
menggunakan
Random Forest

Informasi prediksi
Kualitas Web
Service

Menampilkan
informasi Kualitas
Web Service

END

Gambar 3.2 : Flowchart system web service

Gambar 3.2 merupakan flowchart yang digunakan pada klasifikasi web

service. Pertama memasukkan 5 variabel yang digunakan untuk mencari kualitas

web service tersebut. Kemudian kelima variabel tersebut diklasifikasi

menggunakan Algoritma Random Forest. Setelah kelima variabel dihitung

menggunakan Random Forest, akan ditampilkan informasi prediksi Kualitas Web

Service. Apakah kualitas tersebut termasuk golongan bronze, silver, gold atau

platinum.

22
3.2.2 Flowchart Function Klasifikasi Algoritma Random Forest

START
Klasifikasi Menggunakan
Random Forest

Pengelompokan
Data Training secara
Random

Decision Tree

Tree

Data
Testing

Untuk Setiap
Tree

Rata-rata dari semua


voting tree menjadi
prediksi Random Forest

RETURN
Informasi Kualitas Web
Service

Gambar 3.3 : Flowchart Algoritma Random Forest

23
Gambar 3.3 merupakan langkah-langkah proses klasifikasi menggunakan

algoritma Random Forest. Algoritma Random Forest dipilih karena

keakuratannya tinggi, dan efektif pada data training yang besar.

3.3 Prediksi Kualitas Web Service Menggunakan Algoritma Random Forest

Pada tahap ini akan dijelaskan mengenai gambaran singkat tentang apa saja

proses dari prediksi web service. Secara umum proses prediksi terdiri dari persiapan

data/input, proses atau pengolahan data, dan output berisi informasi prediksi web

service.

3.3.1 Persiapan Data

Data yang digunakan pada tugas akhir ini ada 5 atribut, diskritisasi atribut

akan dijelaskan pada table 3.1 :

Tabel 3.1 Diskritisasi atribut dataset web service (standarisasi TIPHON)

Class Diskritisasi
fast (<10290) , slow
X1 Response Time
(>10291)
low (<33) , medium
X2 Avaliability
(34-36) , high (>67)
low (<15) , high
X3 Troughput
(>16)
low (<33) , medium
X4 Successibility
(34-36) , high (>67)
low (<33) , medium
X5 Reliability
(34-36) , high (>67)

24
bronze (1) , silver
X6 Class (2) , gold (3) ,
platinum (4)

Tabel 3.2 Data dari web service

Response
Availability Troughput Successibility Reliability Class
Time
Slow High High High High Bronze
Slow High Low Medium High Gold
Slow High Low High Medium Gold
Slow High Low High Medium Platinum
Slow High Low High High Bronze
Slow High Low High High Bronze
Slow High Low Medium Medium Platinum
Slow High Low Medium Medium Platinum
Slow High Low High Medium Platinum
Fast High Low High Medium Platinum
Slow High Low High Medium Silver
Slow High Low High Medium Gold
Slow High High High High Silver
Slow High High High High Silver
Slow Medium Low Medium Low Platinum
Slow High High High High Bronze
Slow High Low High High Silver
Slow High Low High Medium Platinum
Slow High Low High High Silver
Slow High Low Medium Medium Platinum
Slow Medium Low Medium Low Platinum
Slow Medium Low Medium Medium Platinum
Slow High Low High Medium Platinum
Slow Medium Low Medium High Gold
Slow High High Medium High Bronze
Slow High High High High Bronze
Slow High High High High Bronze
Slow High Low High High Bronze
Slow High Low High High Silver
Slow High Low High High Silver
Slow High Low High High Silver
Slow High Low High High Silver
Slow High Low High High Bronze

25
Slow High High High High Bronze
Slow Medium Low Medium High Silver
Slow High High High High Bronze
Slow High Low High High Silver
Slow High Low High High Bronze
Slow High Low High Medium Gold
Slow High Low Medium High Gold
Slow High Low High Medium Silver
Slow High Low High Medium Silver
Slow High High Medium High Silver
Slow Medium Low Medium High Platinum
Slow High High High High Bronze
Slow High Low Medium High Gold
Slow High Low High Medium Gold
Slow High Low High High Silver
Slow High Low High Medium Gold
Slow High Low Medium Medium Platinum
Slow High Low High High Silver
Slow High Low Medium High Silver
Slow Medium Low Medium High Silver
Slow High Low High Medium Platinum
Slow High Low High High Gold
Slow High Low High High Bronze
Slow High High High Medium Gold
Slow High High Medium High Gold
Slow Medium Low Low High Platinum
Slow High Low High Medium Platinum
Slow High Low High High Silver
Slow High Low Medium Medium Platinum
Slow High Low High Medium Gold
Slow High Low Medium High Platinum
Slow Medium Low Medium High Platinum
Slow High Low High High Bronze
Slow High Low High High Silver
Slow High High High High Bronze
Slow High Low Medium High Gold
Slow High Low High High Bronze
Slow High Low High Medium Gold
Slow High High Medium High Silver
Slow High Low Medium High Gold
Slow High Low Medium High Gold

26
Slow High High Medium High Bronze
Slow High Low High High Bronze
Slow High High High High Bronze
Slow High Low High High Gold
Slow High Low High Medium Platinum
Slow High High Medium High Silver
Slow High Low Medium High Gold
Fast High Low High Medium Gold
Slow High Low High Medium Platinum
Slow High Low High Medium Platinum
Slow High Low Medium Medium Platinum
Slow High Low High Medium Gold
Slow High High High High Bronze
Slow High Low High Medium Gold
Slow High Low High Medium Gold
Slow High Low High Low Platinum
Slow High Low High High Bronze
Slow High High High High Bronze
Slow High High High High Bronze
Slow High Low High Medium Gold
Slow High Low High Medium Silver
Slow High Low High High Silver
Slow High Low High High Bronze
Slow High Low Medium High Gold
Slow Low Low Low High Platinum
Slow High Low High High Silver

Data yang digunakan dalam tugas akhir ini harus seimbang antara data web

service yang bagus dan yang kurang bagus. Pada atribut X6 angka yang digunakan

untuk input yaitu bronze, silver, gold dan platinum.

27
3.3.2 Klasifikasi menggunakan algoritma Random Forest

Algoritma Random Forest menggunakan klasifikasi dari setiap tree sebagai

penentuan kelas. Algoritma Random Forest bekerja ketika data training telah di

proses sehingga menghasilkan banyak tree selanjutnya memprediksi dengan

menguji data testing ke setiap tree dan menghitung rata-rata voting sebagai acuan

menentukan prediksi kelas Random Forest.

Langkah 1 :

Sebelumnya dataset dibagi menjadi per 25 dataset untuk menghasilkan 4

subset dataset dari 100 dataset.

Cluster 1 :

Tabel 3.3 : Tabel Data Klasifikasi Web Service

X1 X2 X3 X4 X5 X6
Slow high High High high Bronze
Slow high Low medium high Gold
Slow high Low High medium Gold
Slow high Low High medium Platinum
Slow high Low High high bronze
Slow high Low High high bronze
Slow high Low medium medium platinum
Slow high Low medium medium platinum
Slow high Low High medium platinum
Fast high Low High medium platinum
Slow high Low High medium silver
Slow high Low High medium gold
Slow high High High high silver
Slow high High High high silver
Slow medium Low medium low platinum
Slow high High High high bronze
Slow high Low High high silver

28
Slow high Low High medium platinum
Slow high Low High high silver
Slow high Low medium medium platinum
Slow medium Low medium low platinum
Slow medium Low medium medium platinum
Slow high Low High medium platinum
Slow medium Low medium high gold
Slow high High medium high bronze

Langkah 2 :

Sebelumnya kita hitung dahulu entropy umum dari table X6 diatas :

5 5 5 5 4 4 11 11
- Entropy(Class) = − 25 𝑙𝑜𝑔2 − 𝑙𝑜𝑔2 25 − 𝑙𝑜𝑔2 25 − 𝑙𝑜𝑔2 25 =
25 25 25 25

1,87

Lalu menghitung entropy dari setiap atribut dengan rumus sebagai berikut :

Entropy(Sv) = − 𝒑𝟏 𝒍𝒐𝒈𝟐 𝒑𝟏 − 𝒑𝟐 𝒍𝒐𝒈𝟐 𝒑𝟐 − 𝒑𝟑 𝒍𝒐𝒈𝟐 𝒑𝟑 − 𝒑𝟒 𝒍𝒐𝒈𝟐 𝒑𝟒

Setelah menghitung entropy(S), lalu meghitung Gain(S,A) sebagai berikut :

|𝑺𝒗|
Gain(S,A) = Entropy(Class)- ∑ |𝑺| 𝑬𝒏𝒕𝒓𝒐𝒑𝒚(𝑺𝒗)

- Entropy(Response Time)

5 5 5 5 4 4 10 10
Slow = − 24 𝑙𝑜𝑔2 − 𝑙𝑜𝑔2 24 − 𝑙𝑜𝑔2 24 − 𝑙𝑜𝑔2 24 = 1,90
24 24 24 24

0 0 0 0 0 0 1 1
Fast = − 1 𝑙𝑜𝑔2 1 − 𝑙𝑜𝑔2 1 − 𝑙𝑜𝑔2 1 − 𝑙𝑜𝑔2 1 = 0
1 1 1

24 1
Gain(Response Time) = 1,87 – ((25)*1,90)- ((25)*0)= 0,046

29
- Entropy(Availability)

0 0 0 0 0 0 0 0
Low = − 0 𝑙𝑜𝑔2 0 − 𝑙𝑜𝑔2 0 − 𝑙𝑜𝑔2 0 − 𝑙𝑜𝑔2 0 = 0
0 0 0

0 0 0 0 1 1 3 3
Medium = − 4 𝑙𝑜𝑔2 4 − 𝑙𝑜𝑔2 4 − 𝑙𝑜𝑔2 4 − 𝑙𝑜𝑔2 4 = 0,81
4 4 4

5 5 5 5 3 3 8 8
High = − 21 𝑙𝑜𝑔2 − 𝑙𝑜𝑔2 21 − 𝑙𝑜𝑔2 21 − 𝑙𝑜𝑔2 21 = 1,92
21 21 21 21

0 4 21
Gain(Availability) = 1,87 – ((25)*0)- ((25)*0,81) - ((25)*1,92)= 1,56

- Entropy(Troughput)

2 2 3 3 4 4 11 11
Low = − 20 𝑙𝑜𝑔2 − 𝑙𝑜𝑔2 20 − 𝑙𝑜𝑔2 20 − 𝑙𝑜𝑔2 20 = 1,68
20 20 20 20

3 3 2 2 0 0 0 0
High = − 5 𝑙𝑜𝑔2 5 − 𝑙𝑜𝑔2 5 − 𝑙𝑜𝑔2 5 − 𝑙𝑜𝑔2 5 = 0,97
5 5 5

20 5
Gain(Troughput) = 1,87 – ((25)*1,68)- ((25)*0,97)= 0,33

- Entropy(Successibility)

0 0 0 0 0 0 0 0
Low = − 0 𝑙𝑜𝑔2 0 − 𝑙𝑜𝑔2 0 − 𝑙𝑜𝑔2 0 − 𝑙𝑜𝑔2 0 = 0
0 0 0

1 1 0 0 2 2 6 6
Medium = − 9 𝑙𝑜𝑔2 9 − 𝑙𝑜𝑔2 9 − 𝑙𝑜𝑔2 9 − 𝑙𝑜𝑔2 9 = 1,22
9 9 9

4 4 5 5 2 2 5 5
High = − 16 𝑙𝑜𝑔2 − 𝑙𝑜𝑔2 16 − 𝑙𝑜𝑔2 16 − 𝑙𝑜𝑔2 16 = 1,92
16 16 16 16

0 9 16
Gain(Successibility) = 1,87 – ((25)*0)- ((25)*1,22) - ((25)*1,92)= 0,20

- Entropy(Reliability)

30
0 0 0 0 0 0 2 2
Low = − 2 𝑙𝑜𝑔2 2 − 𝑙𝑜𝑔2 2 − 𝑙𝑜𝑔2 2 − 𝑙𝑜𝑔2 2 = 0
2 2 2

0 0 1 1 2 2 9 9
Medium = − 12 𝑙𝑜𝑔2 − 𝑙𝑜𝑔2 12 − 𝑙𝑜𝑔2 12 − 𝑙𝑜𝑔2 12 = 1,04
12 12 12 12

5 5 4 4 2 2 0 0
High = − 11 𝑙𝑜𝑔2 − 𝑙𝑜𝑔2 11 − 𝑙𝑜𝑔2 11 − 𝑙𝑜𝑔2 11 = 1,49
11 11 11 11

2 12 11
Gain(Reliability) = 1,87 – (( )*0)- (( )*1,04) - (( )*1,49)= 0,71
25 25 25

Langkah 3 :

Menentukan Root node dipilih Gain terbesar dari setiap node maka atribut

Availability terpilih sebagai Root node, untuk selanjutnya dalam penentuan Internal

node hingga Leaf node maka atribut Availability tidak di ikutsertakan lagi dalam

penentuan node selanjutnya hingga Leaf node terpilih.

Langkah 4 :

Setelah Root node terpilih, menentukan internal node dengan menghitung jumlah

total kasus yang dominan lebih banyak. Availability : High menjadi penentu

internal node selanjutnya, Dengan data pada tabel 3.3.

Tabel 3.4 : Tabel Data Pembentukan Internal node 1

X1 X2 X3 X4 X5 X6
Slow high High high high bronze
Slow high Low medium high gold
Slow high Low high medium gold
Slow high Low high medium platinum
Slow high Low high high bronze
Slow high Low high high bronze
Slow high Low medium medium platinum
Slow high Low medium medium platinum

31
Slow high Low high medium platinum
Fast high Low high medium platinum
Slow high Low high medium silver
Slow high Low high medium gold
Slow high High high high silver
Slow high High high high silver
Slow high High high high bronze
Slow high Low high high silver
Slow high Low high medium platinum
Slow high Low high high silver
Slow high Low medium medium platinum
Slow high Low high medium platinum
Slow high High medium high bronze

- Entropy(Response Time)

5 5 5 5 3 3 7 7
Slow = − 20 𝑙𝑜𝑔2 − 𝑙𝑜𝑔2 20 − 20 𝑙𝑜𝑔2 20 − 20 𝑙𝑜𝑔2 20 = 1,94
20 20

0 0 0 0 0 0 1 1
Fast = − 1 𝑙𝑜𝑔2 1 − 𝑙𝑜𝑔2 1 − 1 𝑙𝑜𝑔2 1 − 1 𝑙𝑜𝑔2 =0
1 1

10 1
Gain(Response Time) = 1,87 – ((21)*1,94)- ((21)*0) = 0,022

- Entropy(Troughput)

2 2 3 3 3 3 8 8
Low =− 16 𝑙𝑜𝑔2 − 𝑙𝑜𝑔2 16 − 16 𝑙𝑜𝑔2 − 16 𝑙𝑜𝑔2 = 1,78
16 16 16 16

3 3 2 2 0 0 0 0
High = − 𝑙𝑜𝑔2 − 𝑙𝑜𝑔2 − 𝑙𝑜𝑔2 − 𝑙𝑜𝑔2 = 0
5 5 5 5 5 5 5 5

16 5
Gain(Troughput) = 1,87 – ((21)*1,78)- ((21)*0,97) = 0,28

- Entropy(Successibility)

0 0 0 0 0 0 0 0
Low = − 0 𝑙𝑜𝑔2 0 − 𝑙𝑜𝑔2 0 − 𝑙𝑜𝑔2 0 − 𝑙𝑜𝑔2 0 = 0
0 0 0

32
1 1 0 0 1 1 3 3
Medium= − 5 𝑙𝑜𝑔2 5 − 𝑙𝑜𝑔2 5 − 5 𝑙𝑜𝑔2 5 − 5 𝑙𝑜𝑔2 = 1,37
5 5

4 4 5 5 2 2 5 5
High = − 16 𝑙𝑜𝑔2 − 𝑙𝑜𝑔2 16 − 𝑙𝑜𝑔2 16 − 𝑙𝑜𝑔2 16 = 1,92
16 16 16 16

0 5 16
Gain(Successibility) = 1,87–((0)*0)- ((21)*1,37)- ((21)*1,92) = 0,08

- Entropy(Reliability)

0 0 0 0 0 0 0 0
Low = − 0 𝑙𝑜𝑔2 0 − 𝑙𝑜𝑔2 0 − 0 𝑙𝑜𝑔2 0 − 0 𝑙𝑜𝑔2 =0
0 0

0 0 1 1 2 2 8 8
Medium= − 11 𝑙𝑜𝑔2 − 𝑙𝑜𝑔2 11 − 11 𝑙𝑜𝑔2 − 11 𝑙𝑜𝑔2 = 1,10
11 11 11 11

5 5 4 4 1 1 0 0
High = − 10 𝑙𝑜𝑔2 − 𝑙𝑜𝑔2 10 − 10 𝑙𝑜𝑔2 − 10 𝑙𝑜𝑔2 = 1,36
10 10 10 10

0 11 10
Gain(Reliability) = 1,87 – ((21)*0)- ((10)*1,10) - ((21)*1,36)= 0,65

Langkah 5 :

Untuk penentuan internal node dari percabangan Availaibility-High ada

Reliability dengan nilai Gain 0,65. Lalu untuk percabangan internal node

selanjutnya dipilih melalui jumlah kasus terbanyak dari Root node : Availability-

High dan Internal node 1 : Reliability. Didapatkan 2 instance dari Reliability

yaitu Medium dan High.

Menentukan Internal node 2 dari Reliability-Medium dengan data pada

tabel berikut :

X1 X2 X3 X4 X5 X6
Slow high Low High medium gold

33
Slow high Low High medium platinum
Slow high Low medium medium platinum
Slow high Low medium medium platinum
Slow high Low High medium platinum
Fast high Low High medium platinum
Slow high Low High medium silver
Slow high Low High medium gold
Slow high Low High medium platinum
Slow high Low medium medium platinum
Slow high Low High medium platinum

- Entropy(Response Time)

0 0 1 1 2 2 7 7
Slow = − 10 𝑙𝑜𝑔2 − 𝑙𝑜𝑔2 10 − 10 𝑙𝑜𝑔2 − 10 𝑙𝑜𝑔2 = 1,16
10 10 10 10

0 0 0 0 0 0 1 1
Fast = − 1 𝑙𝑜𝑔2 1 − 𝑙𝑜𝑔2 1 − 1 𝑙𝑜𝑔2 1 − 1 𝑙𝑜𝑔2 =0
1 1

10 1
Gain(Response Time) = 1,87 – ((11)*1,16)- ((11)*0) = 0,82

- Entropy(Troughput)

0 0 1 1 2 2 8 8
Low = − 11 𝑙𝑜𝑔2 − 𝑙𝑜𝑔2 11 − 11 𝑙𝑜𝑔2 − 11 𝑙𝑜𝑔2 = 1,10
11 11 11 11

0 0 0 0 0 0 0 0
High = − 0 𝑙𝑜𝑔2 0 − 𝑙𝑜𝑔2 0 − 0 𝑙𝑜𝑔2 0 − 0 𝑙𝑜𝑔2 =0
0 0

11 0
Gain(Troughput) = 1,87 – (( )*1,10)- (( )*0) = 0,77
11 0

- Entropy(Successibility)

0 0 0 0 0 0 0 0
Low = − 0 𝑙𝑜𝑔2 0 − 𝑙𝑜𝑔2 0 − 0 𝑙𝑜𝑔2 0 − 0 𝑙𝑜𝑔2 =0
0 0

0 0 0 0 0 0 3 3
Medium= − 3 𝑙𝑜𝑔2 3 − 3
𝑙𝑜𝑔2 3 − 3 𝑙𝑜𝑔2 3 − 3 𝑙𝑜𝑔2 3
=0

34
0 0 1 1 2 2 5 5
High = − 8 𝑙𝑜𝑔2 8 − 𝑙𝑜𝑔2 8 − 8 𝑙𝑜𝑔2 8 − 8 𝑙𝑜𝑔2 = 1,30
8 8

0 3 8
Gain(Successibility) = 1,87 – ((0)*0)- ((11)*0) - ((11)*1,30) = 0,93

Hasil dari penghitungan Internal node : Reliability-Medium di dapat atribut

yaitu Successibility dengan Gain sebesar 0,93.

Selanjutnya dipilih melalui jumlah kasus terbanyak dari Root node :

Availability-High, Internal node 1 : Reliability-Medium dan Successibility yaitu

Successibility-High sebagai berikut :

X1 X2 X3 X4 X5 X6
Slow high low high medium gold
Slow high low high medium platinum
Slow high low high medium platinum
Fast high low high medium platinum
Slow high low high medium silver
Slow high low high medium gold
Slow high low high medium platinum
Slow high low high medium platinum

- Entropy(Response Time)

0 0 1 1 2 2 4 4
Slow = − 7 𝑙𝑜𝑔2 7 − 𝑙𝑜𝑔2 7 − 7 𝑙𝑜𝑔2 7 − 7 𝑙𝑜𝑔2 = 1,38
7 7

0 0 0 0 0 0 1 1
Fast = − 1 𝑙𝑜𝑔2 1 − 𝑙𝑜𝑔2 1 − 1 𝑙𝑜𝑔2 1 − 1 𝑙𝑜𝑔2 =0
1 1

7 1
Gain(Response Time) = 1,87 – ((8)*1,38)- ((8)*0) = 0,66

- Entropy(Troughput)

35
0 0 1 1 2 2 5 5
Low = − 8 𝑙𝑜𝑔2 8 − 𝑙𝑜𝑔2 8 − 8 𝑙𝑜𝑔2 8 − 8 𝑙𝑜𝑔2 = 1,30
8 8

0 0 0 0 0 0 0 0
High = − 0 𝑙𝑜𝑔2 0 − 𝑙𝑜𝑔2 0 − 0 𝑙𝑜𝑔2 0 − 0 𝑙𝑜𝑔2 =0
0 0

8 0
Gain(Troughput) = 1,87 – ((8)*1,30)- ((0)*0) = 0,57

Hasil dari penghitungan Internal node : Successibility-high di dapat atribut yaitu

Response Time dengan Gain sebesar 0,66. Sehingga di putuskan lah Response Time

menjadi Internal node 2.

Selanjutnya Menentukan Internal node 3 dari Reliability-high dengan data

pada tabel sebagai berikut :

X1 X2 X3 X4 X5 X6
Slow high high high high bronze
Slow high low medium high gold
Slow high low high high bronze
Slow high low high high bronze
Slow high high high high silver
Slow high high high high silver
Slow high high high high bronze
Slow high low high high silver
Slow high low high high silver
Slow high high medium high bronze

- Entropy(Response Time)

5 5 4 4 1 1 0 0
Slow = − 10 𝑙𝑜𝑔2 − 𝑙𝑜𝑔2 10 − 10 𝑙𝑜𝑔2 − 10 𝑙𝑜𝑔2 = 1,36
10 10 10 10

0 0 0 0 0 0 0 0
Fast = − 1 𝑙𝑜𝑔2 1 − 𝑙𝑜𝑔2 1 − 1 𝑙𝑜𝑔2 1 − 1 𝑙𝑜𝑔2 =0
1 1

36
10 0
Gain(Response Time) = 1,87 – ((10)*1,36)- ((10)*0) = 0,51

- Entropy(Troughput)

2 2 2 2 1 1 0 0
Low = − 5 𝑙𝑜𝑔2 5 − 𝑙𝑜𝑔2 5 − 5 𝑙𝑜𝑔2 5 − 5 𝑙𝑜𝑔2 = 1,52
5 5

3 3 2 2 0 0 0 0
High = − 5 𝑙𝑜𝑔2 5 − 𝑙𝑜𝑔2 5 − 5 𝑙𝑜𝑔2 5 − 5 𝑙𝑜𝑔2 = 0,97
5 5

5 5
Gain(Troughput) = 1,87 – ((10)*1,52)- ((10)*0,97) = 0,62

- Entropy(Successibility)

0 0 0 0 0 0 0 0
Low = − 0 𝑙𝑜𝑔2 0 − 𝑙𝑜𝑔2 0 − 0 𝑙𝑜𝑔2 0 − 0 𝑙𝑜𝑔2 =0
0 0

1 1 0 0 1 1 0 0
Medium= − 2 𝑙𝑜𝑔2 2 − 𝑙𝑜𝑔2 2 − 2 𝑙𝑜𝑔2 2 − 2 𝑙𝑜𝑔2 = 1,00
2 2

4 4 4 4 0 0 0 0
High = − 8 𝑙𝑜𝑔2 8 − 𝑙𝑜𝑔2 8 − 8 𝑙𝑜𝑔2 8 − 8 𝑙𝑜𝑔2 = 1,00
8 8

0 2 8
Gain(Successibility) = 1,87 – ((10)*0)- ((10)*1,00) - ((10)*1,00) = 0,87

Hasil dari penghitungan Internal node : Reliability-high di dapat atribut

yaitu Successibility dengan Gain sebesar 0,87.

Selanjutnya dipilih melalui jumlah kasus terbanyak dari Root node : Availability-

High, Internal node 2 : Reliability-high dan Successibility yaitu Successibility-High

sebagai berikut :

X1 X2 X3 X4 X5 X6
Slow high high high High bronze
Slow high low high High bronze

37
Slow high low high High bronze
Slow high high high High silver
Slow high high high High silver
Slow high high high High bronze
Slow high low high High silver
Slow high low high High silver

- Entropy(Response Time)

4 4 4 4 0 0 0 0
Slow = − 8 𝑙𝑜𝑔2 8 − 𝑙𝑜𝑔2 8 − 8 𝑙𝑜𝑔2 8 − 8 𝑙𝑜𝑔2 = 1,00
8 8

0 0 0 0 0 0 0 0
Fast = − 0 𝑙𝑜𝑔2 0 − 𝑙𝑜𝑔2 0 − 0 𝑙𝑜𝑔2 0 − 0 𝑙𝑜𝑔2 =0
0 0

8 0
Gain(Response Time) = 1,87 – ((8)*1,00)- ((8)*0) = 1,87

- Entropy(Troughput)

2 2 2 2 0 0 0 0
Low = − 4 𝑙𝑜𝑔2 4 − 𝑙𝑜𝑔2 4 − 4 𝑙𝑜𝑔2 4 − 4 𝑙𝑜𝑔2 = 1,30
4 4

2 2 2 2 0 0 0 0
High = − 4 𝑙𝑜𝑔2 4 − 𝑙𝑜𝑔2 4 − 4 𝑙𝑜𝑔2 4 − 4 𝑙𝑜𝑔2 =0
4 4

4 4
Gain(Troughput) = 1,87 – ((8)*1,00)- ((8)*1,00) = 0,87

Hasil dari perhitungan Internal node 2 : Reliability-high di dapat atribut

Response Time dengan Gain sebesar 1,87. Sehingga diputuskan lah Response Time

menjadi Internal node 3. Sehingga diputuskanlah Troughput dan Response Time

menjadi Leaf node. Begitu pula dengan Cluster 2 berbentuk tree dengan proses

decision tree seperti diatas, sehingga tree dari Cluster 1 dan Cluster 2 terbentuk

sebegai berikut :

38
Availability

Low Medium High

Bronze Platinum Reliability

Low Medium High

Bronze Successibility Silver

Low Medium High

Bronze Platinum Response Time

Slow Fast

Troughput Platinum

Low High

Platinum Platinum

Gambar 3.4 : Tree 1

Pada tree diatas kita lihat tree sudah tertata. Pertama kita mendapatkan

Availability. Pada Availability terdapat 3 sub-tree, low dimasuki bronze dan

medium dimasuki platinum, sedangkan high diisi oleh parameter Reliability.

Kemudian pada Reliability terdapat 3 sub-tree, low dimasuki bronze dan high

dimasuki silver, sedangkan medium diisi oleh parameter Successibillity. Lalu pada

Successibility terdapat 3 sub-tree, low dimasuki bronze dan medium dimasuki

39
platinum, sedangkan high diisi oleh parameter Response Time. Pada Response

Time terdapat 2 sub-tree, fast dimasuki platinum sedangkan slow diisi parameter

Troughput. Dan yan terakhir adalah Troughput, terdapat 2 sub-tree, low dan high

keduanya diisi oleh platinum.

Availability

Low Medium High

Bronze Troughput Reliability

Low High Low Medium High

Platinum Silver Bronze Gold Bronze

Gambar 3.5 : Tree 2

Tree kedua juga sudah tertata. Pertama kita mendapatkan Availability.

Availability terdapat 3 sub-tree, low dimasuki bronze sedangkan medium dan high

diisi oleh parameter Troughput dan Reliability. Pada Troughput terdapat 2 sub-tree,

low dimasuki platinum dan high dimasuki silver. Sedangkan Reliability terdapat 3

sub-tree, low dan high dimasuki bronze dan medium dimasuki gold.

40
Langkah 5 :

Menguji data testing dari tree-tree yang sudah tumbuh, dengan sebuah

dataset yang belum diketahui kelasnya, data testing telah disiapkan pada tabel

sebagai berikut :

Tabel 3.7 : Tabel Data Pengujian Data Baru

X1 X2 X3 X4 X5 X6
Fast Medium Low Low High -
Slow High High Medium Low -

Terdapat 2 data testing yang akan di uji dengan 2 tree yang sudah terbentuk,

dan setiap data akan diuji dari setiap tree sehingga diambil suara terbanyak dari 2

tree sebagai acuan dalam menentukan kelas.

Data testing 1 :

X1 X2 X3 X4 X5 X6
Fast High High Low Medium -

Tree 1 menyimpulkan data testing 1 masuk dalam kelas Bronze, dengan rule “ IF

X2 = high AND X5 = medium AND X4 = low THEN Class = Bronze ”. Sebaliknya

dengan Tree 2 menyimpulkan masuk dalam kelas Gold dengan rule “ IF X2 = high

AND X5 = medium THEN Class = Gold “, sehingga kurang efisien jika Tree yang

di uji hanya 2.

41
Data testing 2 :

X1 X2 X3 X4 X5 X6
Slow High High Medium Low -

Tree 1 menyimpulkan data testing 2 masuk dalam kelas Bronze dengan rule “ IF

X2 = high AND X5 = low THEN Class = Bronze “. Sebaliknya dengan Tree 2

menyimpulkan masuk dalam kelas Bronze dengan rule “ IF X2 = high AND X5 =

low THEN Class = Bronze “, sehingga data testing 2 masuk dalam kelas Bronze.

42
3.4 Antarmuka (User Interface)

3.4.1 Tampilan Halaman Awal

Pada gambar 3.7 merupakan tampilan halaman Sistem diagnosa kualitas

web service menggunakan algoritma Random Forest berbasis web server :

SISTEM DIAGNOSA KUALITAS WEB SERVICE


MENGGUNAKAN ALGORITMA RANDOM FOREST

Home

Diagnosa

DIAGNOSA SEKARANG

Gambar 3.6 : Desain web halaman awal

Halaman ini yaitu halaman awal pada Sistem Diagnosa Web Service. Pada

field “ diagnosa sekarang “ digunakan untuk menuju halaman Diagnosa web

service.

3.4.4 Tampilan Menu Diagnosa Web Service

Pada gambar 3.7 merupakan tampilan Menu Diagnosa Web Service

43
SISTEM DIAGNOSA KUALITAS WEB SERVICE
MENGGUNAKAN ALGORITMA RANDOM FOREST

Home
Masukkan data informasi web service yang akan anda diagnosa
Diagnosa
Response Time :

Availability :

Troughput :

Successibility :

Reliability :

Submit Reset

Gambar 3.7 : Desain Web Diagnosa Web Service

44
SISTEM DIAGNOSA KUALITAS WEB SERVICE
MENGGUNAKAN ALGORITMA RANDOM FOREST

Home
Web Service yang anda masukkan telah masuk ke kelas Gold.
Diagnosa

Gambar 4.1 : Hasil Proses Desain Web Diagnosa

Pada tampilan desain menu Diagnosa berisi field-field pengisian informasi oleh

user yang mana akan di proses oleh server untuk di diagnosa. Pada textfield

“Response Time”, “Availability”, “Troughput”, “Successibility” dan

“Reliability”. Ketika data selesai di proses dan menghasilkan suatu informasi

apakah masuk kelas bronze, silver, gold atau platinum dalam diagnosa web service,

45
sistem menganalisa jika web service terserbut masuk kelas gold maka akan

menampilkan informasi “GOLD!”.

3.5 Skenario Pengujian

Pada skenario pengujian ini terdapat 2 parameter yang akan diuji, yaitu

akurasi dan presisi.

1. Akurasi

Untuk pengujian akurasi, dimana data testing dari hasil prediksi akan di

cocokan dengan data aktualnya untuk mengetahui tingkat keakuratan.

Berikut rumus dari akurasi :

(𝑇𝑃 + 𝑇𝑁)
𝐴𝑘𝑢𝑟𝑎𝑠𝑖 =
(𝑇𝑃 + 𝐹𝑃 + 𝑇𝑁 + 𝐹𝑁)

2. Presisi

Untuk pengujian presisi, dimana data aktual akan dicocokkan berkali-kali

yang akan menghasilkan hasil dari presisi tersebut.

Berikut rumus dari presisi :

(𝑇𝑃)
𝑃𝑟𝑒𝑠𝑖𝑠𝑖 =
(𝑇𝑃 + 𝐹𝑃)

46

Anda mungkin juga menyukai