Anda di halaman 1dari 30

KLASIFIKASI

Mengenal metode klasifikasi, secara sederhana algoritma klasifikasi


pada data mining merupakan sebuah catatan record data hendak
diklasifikasikan kedalam salah satu dari sekian klasifikasi data yang
tersedia pada variabel tujuan berdasarkan nilai-nilai “variabel
prediktor”.  

Cara KerjaAlgoritma klasifikasi 


Klasifikasi dalam data mining bekerja pada data historis atau data
sejarah. Data historis disebut data latihan atau training data. histori
data digunakan sebagai cara mendapatkan pengetahuan dan disebut
data pengalaman.
Mengetahui Proses pembentukan Klasifikasi data
mining
Secara sederhana ada 3 proses pemecahan masalah klasifikasi diantaranya:
1. Data historis atau data pengalaman 
2. Data historis akan diproses menggunakan algoritma klasifikasi 
3. Klassifikasi menghasilkan pengetahuan yang dipresentasikan dalam bentuk
diagram pohon keputusan”decission tree”

Untuk memecahkan masalah klasifikasi data mining sedikitnya ada 6 algoritma


klasifikasi data data mining diantaranya:
4.Algoritma CART (Classification and Regreesion Trees)  
5.Algoritma mean vektor  
6.Algoritma k-nearest neighbor  
7.Algoritma ID3 
8. Algoritma C4.5 
9. Algoritma C5.0
Contoh Masalah Klasifikasi Data Mining
Sebagai contoh fiktif ada 8 data nasabah yang telah memperoleh kredit mikro dari bank
mikroba. Data tersebut meliputi besarnya tabungan dengan jenis kategori(rendah, sedang
dan tinggi), besar aset nasabah dengan kategori(rendah, sedang, tinggi), besarnya
pendapatan nasabah per tahun dan resiko kredit dengan kategori (baik dan buruk) dari
ilustrasi data nasabah ini dapat menghasilkan suatu pengetahuan untuk menggolongkan
resiko kredit seorang nasabah pada masa mendatang berdasarkan tabungan , aset dan
pendapatan apabila ada pengajuan kredit nasabah kesembilan, kesepuluh dan seterusnya.
Data tabungan, aset dan pendapatan merupakan dasar untuk menentukan resiko kredit
disebut sebagai variabel prediktor. Resiko kredit berdasarkan variabel prediktor disebut
variabel tujuan”target variabel”
Data tabungan, asset, pendapatan dan resiko kredit nasabah Bank
Bhatara Putra
Nasabah Tabungan Aset Pendapatan Resiko Kredit
A Sedang Tinggi 75 Baik
B Rendah Rendah 50 Buruk
C Tinggi Sedang 25 Buruk
D Sedang Sedang 50 Baik
E Rendah Sedang 100 Baik
F Tinggi Tinggi 25 Baik
G Rendah Rendah 25 Buruk
H Sedang Sedang 75 Baik

  P

 
sabah kesembilan, kesepuluh, kesebelah dan seterusnya, kita dapat
Mengklasifikasikan (menggolongkan) resiko kredit para nasabah tersebut, apabila diketahui
Tabungan, asset dan pendapatan mereka.
• Dari contoh kasus klasifikasi data nasabah diatas maka dapat
diperoleh pengetahuan yang dapat diaplikasikan kepada mereka
yang berpotensi menjadi nasabah kesembilan, kesepuluh dan
seterusnya.
• Data ini akan dijadikan sebagai input bagi suatu algoritma
• Keluaran dari algoritma ini secara sederhana dapat
direpresentasikan dalam bentuk pohon keputusan
Berikutnya akan membahas secara detail algoritma yang dapat menghasilkan pohon
keputusan.
Algoritma ini disebut Classification and regression tree (CART).
 Algoritma CART (Classification and Regreesion Trees)

Langkah-langkah algoritma CART adalah sebagai berikut:

• Langkah pertama adalah menyusun calon cabang seluruh variable predictor


secara lengkap (exhaustive). Daftar yang berisi calon cabang disebut daftar
calon cabang mutkhir.
• Langkah kedua adalah menilai kinerja keseluruhan calon cabang yang ada
pada daftar calon cabang mutakhir dengan jalan menghitung nilai besaran
kesesuain (s|t)
• Langkah ketiga adalah menentukan calon cabang manakah yang akan
dijadikan cabang, dengan memilih calon cabang yang memiliki nilai
kesesuaian (s|t) terbesar. Setelah itu menggambarkan percabangan. Jika
tidak ada lagi noktah keputusan, pelaksanaan algoritma CART akan dihentikan.
Namun jika masih terdapat noktah keputusanpelaksanaan algoritma dilanjutkan
dengan kembali ke langkah kedua, dengan terlebih dahulu membuang calon
cabang yang telah berhasil menjadi cabang sehingga mendapatkan daftar
calon cabang mutakhir yang baru
𝐂𝐨𝐧𝐭𝐨𝐡
  : 𝐔𝐧𝐭𝐮𝐤 𝐊𝐚𝐬𝐮𝐬 𝐍𝐚𝐬𝐚𝐛𝐚𝐡 𝐁𝐚𝐧𝐤 𝐁𝐡𝐚𝐭𝐚𝐫𝐚 𝐏𝐮𝐭𝐫𝐚

Langkah pertama (iterasi-1)

 Menyusun calon cabang (candidate split).


 Penyusunan ini dilakukan terhadap seluruh variabel predictor
secara lengkap (exhaustive)
 Pada kasus ini yg menjadi variabel predictor seluruhnya adalah
tabungan, aset dan pendapatan.
𝐇𝐚𝐬𝐢𝐥
  𝐥𝐚𝐧𝐠𝐤𝐚𝐡 𝐩𝐞𝐫𝐭𝐚𝐦𝐚 𝐮𝐧𝐭𝐤 𝐤𝐚𝐬𝐮𝐬 𝐝𝐢 𝐚𝐭𝐚𝐬 :

   cabang untuk variabel predictor tabungan adalah sebagai berikut:


Calon
1. Tabungan = Rendah , dan tabungan = (sedang, tinggi)
2. Tabungan = sedang, dan tabungan = (rendah, tinggi)
3. Tabungan = tinggi, dan tabungan = (rendah, sedang)

Calon cabang untuk variabel predictor aset adalah sebagai berikut


4. Aset = Rendah , dan aset = (sedang, tinggi)
5. Aset = sedang, dan aset = (rendah, tinggi)
6. Aset = tinggi, dan aset = (rendah, sedang)

Pada variabel predictor pendapatan yang sifatnya numeric, calon cabang yg


dapat diusulkan adalah sbb:
7. Pendapatan
8. Pendapatan
9. Pendapatan
Daftar calon cabang mutakhir masalah nasabah
Bank Bhatara Putra (Iterasi -1)
Nomor calon Calon Cabang Kiri Calon Cabang Kanan
cabang
1 Tabungan= = rendah Tabungan= = (Sedang, tinggi)
22 Tabungan
Tabungan =
= sedang
sedang Tabungan
Tabungan =
= (rendah,
(rendah, tinggi)
tinggi)
33 Tabungan
Tabungan = = tinggi
tinggi Tabungan
Tabungan = = (rendah
(rendah sedang)
sedang)
4 Aset = rendah Aset = (Sedang, tinggi)
4 Aset = rendah Aset = (Sedang, tinggi)
5 Aset = sedang Aset = (rendah, tinggi)
5 Aset = sedang Aset = (rendah, tinggi)
6 Aset = tinggi Aset = (rendah sedang)
6 Aset = tinggi Aset = (rendah sedang)
7 Pendapatan 25.000 Pendapatan 25.000
7
8 Pendapatan 50.000 Pendapatan 50.000
8
9 Pendapatan 75.000 Pendapatan 75.000
9
Lalu, bagaimana kita menentukan:
 Calon cabang manakah yang akan benar-benar menjadi cabang
noktah keputusan, dan
 Calon cabang manakah yang tidak atau belum akan menjadi cabang
nooktah keputusan
Langkah 2 : Menilai Kinerja
  

mutakhir
Caranya:
 kinerja dari setiap calon cabang akan diukur melalui ukuran yg disebut
kesesuaian (goodness).
 Kesesuaian dari calon cabang s pada noktah keputusan t dilambang kan
dengan dan didefinisikan sebagai

Dengan :

𝑡  𝑅 =𝑐𝑎𝑙𝑜𝑛 𝑐𝑎𝑏𝑎𝑛𝑔 𝑘𝑎𝑛𝑎𝑛 𝑑𝑎𝑟𝑖 𝑛𝑜𝑘𝑡𝑎h 𝑘𝑒𝑝𝑢𝑡𝑢𝑠𝑎𝑛 𝑡


  = 𝑗𝑢𝑚𝑙𝑎h 𝑐𝑎𝑡𝑎𝑡𝑎𝑛 𝑝𝑎𝑑𝑎 𝑐𝑎𝑙𝑜𝑛 𝑐𝑎𝑏𝑎𝑛𝑔 𝑘𝑖𝑟𝑖 𝑡 𝐿
𝑃 𝐿
𝑗𝑢𝑚𝑙𝑎h 𝑐𝑎𝑡𝑎𝑡𝑎𝑛 𝑝𝑎𝑑𝑎 𝑑𝑎𝑡𝑎 𝑙𝑎𝑡𝑖h𝑎𝑛
  𝑗𝑢𝑚𝑙𝑎h 𝑐𝑎𝑡𝑎𝑡𝑎𝑛 𝑝𝑎𝑑𝑎 𝑐𝑎𝑙𝑜𝑛 𝑐𝑎𝑏𝑎𝑛𝑔 𝑎𝑛𝑎𝑛 𝑡 𝑅
𝑃 𝑅=
𝑗𝑢𝑚𝑙𝑎h 𝑐𝑎𝑡𝑎𝑡𝑎𝑛 𝑝𝑎𝑑𝑎 𝑑𝑎𝑡𝑎 𝑙𝑎𝑡𝑖h𝑎𝑛
  𝑗𝑢𝑚𝑙𝑎h 𝑐𝑎𝑡𝑎𝑡𝑎𝑛 𝑏𝑒𝑟𝑘𝑎𝑡𝑒𝑔𝑜𝑟𝑖 𝑗 𝑝𝑎𝑑𝑎 𝑐𝑎𝑙𝑜𝑛 𝑐𝑎𝑏𝑎𝑛𝑔 𝑘𝑖𝑟𝑖 𝑡 𝐿
𝑃 ( 𝑗|𝑡 𝐿 )=
𝑗𝑢𝑚𝑙𝑎h 𝑐𝑎𝑡𝑎𝑡𝑎𝑛 𝑝𝑎𝑑𝑎 𝑛𝑜𝑘𝑡𝑎h 𝑘𝑒𝑝𝑢𝑡𝑢𝑠𝑎𝑛 𝑡

  𝑗𝑢𝑚𝑙𝑎h 𝑐𝑎𝑡𝑎𝑡𝑎𝑛 𝑏𝑒𝑟𝑘𝑎𝑡𝑒𝑔𝑜𝑟𝑖 𝑗 𝑝𝑎𝑑𝑎 𝑐𝑎𝑙𝑜𝑛 𝑐𝑎𝑏𝑎𝑛𝑔 𝑘𝑖𝑟𝑖 𝑡 𝑅


𝑃 ( 𝑗|𝑡 𝑅 )=
𝑗𝑢𝑚𝑙𝑎h 𝑐𝑎𝑡𝑎𝑡𝑎𝑛 𝑝𝑎𝑑𝑎 𝑛𝑜𝑘𝑡𝑎h 𝑘𝑒𝑝𝑢𝑡𝑢𝑠𝑎𝑛𝑡

 
Q(s|t) =

. Q(s|t)
Hasil perhitungan nilai kesesuaian bagi tiap calon cabang yang masih terdapat
dalam daftar calon cabang mutakhir, yaitu

 Tabel : Perhitungan nilai kesesuaian untuk calon cabang 1,2,3,4,5,6,7,8,9


Nomor Resiko Kredit
calon
cabang
1
1 3/8=0,375
3/8=0,375 5/8=0,625
5/8=0,625 Baik
Baik 1/3
1/3 =
= 0,333
0,333 4/5
4/5 =
= 0,8
0,8 0,46875
0,46875 0,933
0,933 0,4375
0,4375
Buruk
Buruk 2/3
2/3 =
= 0,667
0,667 1/5
1/5 =
= 0,2
0,2
2
2 3/8=0,375
3/8=0,375 5/8=0,625
5/8=0,625 Baik
Baik 3/3
3/3 =
= 11 2/5
2/5 =
= 0,4
0,4 0,46875
0,46875 1,2
1,2 0,5625
0,5625
Buruk
Buruk 0/3
0/3 =
= 00 3/5
3/5 =
= 0,6
0,6
3 2/8=0,250 6/8=0,75 Baik ½ = 0,5 4/6 = 0,667 0,375 0,333 0,125
3 2/8=0,250 6/8=0,75 Baik
Buruk ½
½== 0,5
0,5 4/6
2/6 =
= 0,667
0,333 0,375 0,333 0,125
Buruk ½ = 0,5 2/6 = 0,333
4 2/8=0,250 6/8=0,75 Baik 0/2 = 0 5/6 = 0,833 0,375 1,667 0,625
4 2/8=0,250 6/8=0,75 Baik
Buruk 0/2
2/2 =
= 01 5/6
1/6 =
= 0,833
0,167 0,375 1,667 0,625
Buruk 2/2 = 1 1/6 = 0,167
5 4/8=0,500 4/8=0,500 Baik ¾ = 0,75 2/4 = 0,5 0,5 0,5 0,25
5 4/8=0,500 4/8=0,500 Baik
Buruk ¾
¼ = 0,75
0,25 2/4 = 0,5 0,5 0,5 0,25
Buruk ¼ = 0,25 2/4 = 0,5
6 2/8=0,250 6/8=0,75 Baik 2/2 = 1 3/6 = 0,5 0,375 1 0,375
6 2/8=0,250 6/8=0,75 Buruk
Baik 0/2
2/2 = 01 3/6 = 0,5 0,375 1 0,375
Buruk 0/2 = 0 3/6 = 0,5
7 3/8=0,375 5/8=0,625 Baik 1/3 = 0,333 4/5 = 0,8 0,46875 0,933 0,4375
7 3/8=0,375 5/8=0,625 Buruk
Baik 2/3
1/3 =
= 0,667
0,333 1/5
4/5 =
= 0,2
0,8 0,46875 0,933 0,4375
8 5/8=0,625 3/8=0,375 Buruk
Baik 2/3
2/5 = 0,667
= 0.4 1/5
3/3 = 0,2
= 1 0,46875 1,2 0,5625
8 5/8=0,625 3/8=0,375 Buruk
Baik 3/5
2/5 = 0,6
= 0.4 0/3
3/3 = 01
= 0,46875 1,2 0,5625
9 7/8=0,875 1/8=0,125 Buruk
Baik 3/5
4/7 =
= 0,6
0,571 0/3
1/1 =
= 01 0,21875 0,857 0,1875
Buruk 3/7 =- 0,429 0/1 = 0
9 7/8=0,875 1/8=0,125 Baik 4/7 = 0,571 1/1 = 1 0,21875 0,857 0,1875
Buruk 3/7 =- 0,429 0/1 = 0
Langkah ketiga (iterasi-1)
  Menentukan calon cabang manakah yang akan benar-benar
dijadikan cabang.
 Hal ini dilakukan dengan memilih calon cabang yang memiliki nilai
kesesuaian terbesar.
 Setelah itu gambarkan percabangan sesuai hasil menjalankan
algoritma.
Dari table tampak bahwa calon cabang no 4 adalah calon cabang dengan nilai kesesuaian
terbesar, maka cabang inilah yang akan kita pilih sebagai cabang tada tahap ini
Sehingga kita peroleh pohon keputusan bagi masalah klasifikasi data nasabah Bank Bhatara
Putra (iterasi -1), sbb:

Noktah Dasar
Aset = Rendah
Vs
Aset = (sedang, Tinggi)

 𝑨𝒔𝒆𝒕 =𝑹𝒆𝒏𝒅𝒂𝒉  𝑨𝒔𝒆𝒕 =( 𝑺𝒆𝒅𝒂𝒏𝒈 , 𝑻𝒊𝒏𝒈𝒈𝒊)

Noktah Keputusan
Noktah Dasar Catatan : nasabah
Resiko Buruk A,C,D,E,F,H
(nasabah : B, G)
Dari gambar, tampak bahwa:
Noktah keputusan masih ada sehingga kita harus kembali ke langkah kedua
dan kali iniu kita telah memulai iterasi-2

Langkah kedua Algoritma CART (iterasi-2)


 Menilai kinerja dari keseluruhan calon cabang yg ada pada
daftar calon cabang mutakhir.
 Utk saat ini, daftar calon cabang mutakhir berasal dari daftar
sejenis sebelumnya, dengan membuang calon cabang yg telah
berhasil menjadi cabang pada langkah-langkah sebelumnya,
seperti yg terlihat pada table berikut:
Daftar calon cabang mutakhir masalah nasabah Bank Bhatara Putra
(Iterasi -2)setelah cabang no 4 dihilangkan

Nomor calon Calon Cabang Kiri Calon Cabang Kanan


cabang
1 Tabungan= = rendah Tabungan= = (Sedang, tinggi)
22 Tabungan
Tabungan =
= sedang
sedang Tabungan
Tabungan =
= (rendah,
(rendah, tinggi)
tinggi)
33 Tabungan
Tabungan = = tinggi
tinggi Tabungan
Tabungan = = (rendah
(rendah sedang)
sedang)
5 Aset = sedang Aset = (rendah, tinggi)
5 Aset = sedang Aset = (rendah, tinggi)
6 Aset = tinggi Aset = (rendah sedang)
6 Aset = tinggi Aset = (rendah sedang)
7 Pendapatan 25.000 Pendapatan 25.000
7
8 Pendapatan 50.000 Pendapatan 50.000
8
9 Pendapatan 75.000 Pendapatan 75.000
9
Perhitungan nilai kesesuai kembali dihitung !
 Hasilnya :
Nomor Resiko Kredit
calon
cabang
11 1/6=0,167
1/6=0,167 5/6=0,833
5/6=0,833 Baik
Baik 1/1=
1/1= 11 4/5
4/5 =
= 0,8
0,8 0,277778
0,277778 0,933
0,933 0,25926
0,25926
Buruk
Buruk 0/1 =
0/1 = 00 1/5 =
1/5 = 0,2
0,2
22 3/6=0,5
3/6=0,5 3/6=0,500
3/6=0,500 Baik
Baik 3/3
3/3 =
= 11 2/3
2/3 =
= 0,667
0,667 0,5
0,5 0,667
0,667 0,33333
0,33333
Buruk
Buruk 0/3
0/3 =
= 00 1/3
1/3 =
= 0,333
0,333
3 2/6=0,333 4/6=0,667 Baik ½ = 0,5 4/4 = 1 0,4444 1 0,44444
3 2/6=0,333 4/6=0,667 Baik
Buruk ½
½== 0,5
0,5 4/4
0/4==01 0,4444 1 0,44444
Buruk ½ = 0,5 0/4= 0
4
4
5 4/6=0,667 2/6=0,333 Baik ¾ = 0,75 2/2 = 1 0,4444 0,5 0,22222
5 4/6=0,667 2/6=0,333 Buruk
Baik ¼
¾== 0,25
0,75 0/2
2/2 =
= 01 0,4444 0,5 0,22222
6 2/6=0,333 4/6=0,667 Buruk
Baik ¼
2/2==0,25
1 0/2
3/4 = 00,75 0,4444 0,5 0,22222
Buruk 0/2 = 0 1/4 = 0,25
67 2/6=0,333 4/6=0,667 Baik 2/2
1/2 = 10,5 3/4
4/4 = 0,75
1 0,4444 0,5
1 0,22222
0,44444
Buruk 0/2
1/2 = 00,5 1/4
0/4==00,25
87 3/6=0,5
2/6=0,333 3/6=0,5
4/6=0,667 Baik 2/3
1/2 = 0.667
0,5 3/3
4/4 = 1 0,5
0,4444 0,667
1 0,33333
0,44444
Buruk 1/3 = 0,5
1/2 0,333 0/3 =00
0/4=
98 5/6=0,833
3/6=0,5 1/6=0,167
3/6=0,5 Baik
Baik 4/5
2/3 =
= 0,8
0.667 1/1
3/3 =
= 11 0,277778
0,5 0,400
0,667 0,11111
0,33333
Buruk
Buruk 1/5=- 0,2
1/3 = 0,333 0/1
0/3 =
= 00
9 5/6=0,833 1/6=0,167 Baik 4/5 = 0,8 1/1 = 1 0,277778 0,400 0,11111
Buruk 1/5=- 0,2 0/1 = 0
Langkah ketiga (iterasi-2)
  Menentukan calon cabang manakah yang akan benar-benar
dijadikan cabang.
 Hal ini dilakukan dengan memilih calon cabang yang memiliki nilai
kesesuaian terbesar.
 Setelah itu gambarkan percabangan sesuai hasil menjalankan
algoritma.
Dari table tampak bahwa calon cabang no 3 dan 7 adalah calon cabang dengan nilai
kesesuaian terbesar, maka salah satu cabang inilah yang akan kita pilih sebagai cabang tada
tahap ini
Sehingga kita peroleh pohon keputusan bagi masalah klasifikasi data nasabah Bank Bhatara
Putra (iterasi -2), sbb:
Noktah Dasar
Aset = Rendah
Vs
Aset = (sedang, Tinggi)
𝑨𝒔𝒆𝒕 =𝑹𝒆𝒏𝒅𝒂𝒉 𝑨𝒔𝒆𝒕 =( 𝑺𝒆𝒅𝒂𝒏𝒈 , 𝑻𝒊𝒏𝒈𝒈𝒊)
   

Noktah Terminasi
Resiko Buruk Noktah Keputusan (A)
(nasabah : B, G) Catatan : A,C,D,E,F,H

𝑻𝒂𝒃𝒖𝒏𝒈𝒂𝒏=𝒕𝒊𝒏𝒈𝒈𝒊
 
𝑻𝒂𝒃𝒖𝒏𝒈𝒂𝒏=(𝒓𝒆𝒏𝒅𝒂𝒉 , 𝒔𝒆𝒅𝒂𝒏𝒈 )
 

Noktah Keputusan (B) Noktah Terminasi


Catatan : C, F Resiko Baik
(catatan : A,D,E,H)
Dari gambar, tampak bahwa:
Noktah keputusan masih ada sehingga kita harus kembali ke langkah kedua
dan kali iniu kita telah memulai iterasi-3

Langkah kedua Algoritma CART (iterasi-3)


 Menilai kinerja dari keseluruhan calon cabang yg ada pada
daftar calon cabang mutakhir.
 Utk saat ini, daftar calon cabang mutakhir berasal dari daftar
sejenis sebelumnya, dengan membuang calon cabang yg telah
berhasil menjadi cabang pada langkah-langkah sebelumnya,
seperti yg terlihat pada table berikut:
Daftar calon cabang mutakhir masalah nasabah Bank Bhatara Putra
(Iterasi -3)setelah cabang no 3 dihilangkan

Nomor calon Calon Cabang Kiri Calon Cabang Kanan


cabang
1 Tabungan= = rendah Tabungan= = (Sedang, tinggi)
22 Tabungan
Tabungan =
= sedang
sedang Tabungan
Tabungan =
= (rendah,
(rendah, tinggi)
tinggi)
55 Aset
Aset =
= sedang
sedang Aset
Aset =
= (rendah,
(rendah, tinggi)
tinggi)
6 Aset = tinggi Aset = (rendah sedang)
6 Aset = tinggi Aset = (rendah sedang)
7 Pendapatan 25.000 Pendapatan 25.000
7
8 Pendapatan 50.000 Pendapatan 50.000
8
9 Pendapatan 75.000 Pendapatan 75.000
9
Perhitungan nilai kesesuai kembali dihitung !
 Hasilnya :
Nomor Resiko Kredit
calon
cabang
11 0/2=0
0/2=0 2/2=1
2/2=1 Baik
Baik 00 1/2
1/2 =
= 0,5
0,5 00 11 00
Buruk
Buruk 00 1/2 =
1/2 = 0,5
0,5
22 0/2=0
0/2=0 2/2=1
2/2=1 Baik
Baik 00 1/2
1/2 =
= 0,5
0,5 00 11 00
Buruk
Buruk 00 1/2
1/2 =
= 0,5
0,5
3
3
4
45 ½=0,5 ½=0,5 Baik 0/1=0 1/1 = 1 0,5 2 1
Buruk 1/1=1 0/1 = 0
5 ½=0,5 ½=0,5 Baik 0/1=0 1/1 = 1 0,5 2 1
6 ½=0,5 ½=0,5 Baik
Buruk 1/1 =1
1/1=1 0/1=0
0/1 = 0 0,5 2 1
Buruk 0/1 = 0 1/1=1
76 2/2=1
½=0,5 0/2=0
½=0,5 Baik
Baik 1/2
1/1 =
= 0,5
1 0/2=0
0/1=0 00,5 12 01
Buruk
Buruk 1/2
0/1 =
= 0,5
0 0/2=
1/1=10
8 2/2=1 0/2=0 Baik 1/2 = 0,5 0 0 1 0
7 2/2=1 0/2=0 Buruk
Baik 1/2
1/2 =
= 0,5
0,5 00/2=0 0 1 0
9 2/2=1 0/2=0 Buruk
Baik 1/2
1/2 = 0,5
= 0,5 0/2=
0 0 0 1 0
8 2/2=1 0/2=0 Buruk
Baik 1/2
1/2 =
= 0,5
0,5 00 0 1 0
Buruk 1/2 = 0,5 0
9 2/2=1 0/2=0 Baik 1/2 = 0,5 0 0 1 0
Buruk 1/2 = 0,5 0
Dari table tampak bahwa calon cabang no 5 dan 6 adalah calon cabang dengan nilai
kesesuaian terbesar, maka salah satu cabang inilah yang akan kita pilih sebagai cabang tada
tahap ini
Sehingga kita peroleh pohon keputusan bagi masalah klasifikasi data nasabah Bank Bhatara
Putra (iterasi -3), sbb:
Pohon keputusan bagi nasabah Bank Bhatara Putra
Iterasi-3
Noktah Dasar
Aset = Rendah
Vs
𝑨𝒔𝒆𝒕 =𝑹𝒆𝒏𝒅𝒂𝒉 Aset = (sedang, Tinggi)
  𝑨𝒔𝒆𝒕 =( 𝑺𝒆𝒅𝒂𝒏𝒈 , 𝑻𝒊𝒏𝒈𝒈𝒊)
 

Noktah Terminasi
Resiko Buruk Noktah Keputusan (A)
(nasabah : B, G) Catatan : A,C,D,E,F,H

𝑻𝒂𝒃𝒖𝒏𝒈𝒂𝒏=𝒕𝒊𝒏𝒈𝒈𝒊
 
𝑻𝒂𝒃𝒖𝒏𝒈𝒂𝒏=(𝒓𝒆𝒏𝒅𝒂𝒉 , 𝒔𝒆𝒅𝒂𝒏𝒈 )
 

Noktah Terminasi
Noktah Keputusan (B)
Resiko Baik
𝑨𝒔𝒆𝒕 =𝑺𝒆𝒅𝒂𝒏𝒈 Catatan : C, F 𝑨𝒔𝒆𝒕 =𝑻𝒊𝒏𝒈𝒈𝒊
    (catatan : A,D,E,H)

Noktah Terminasi
Noktah Terminasi
Resiko Buruk
Resiko Baik
(catatan : C)
(catatan : F)
Pada gambar diatas terdapat 2 jenis bentuk
noktah.
• Pertama berbentuk elips disebut noktah
keputusan noktah ini masih akan bercabang
noktah ini merupakan suatu catatan misalnya
“nasabah” belum dapat ditentukan
klasifikasinya apakah nasabah ini
mempunyai resiko kredit baik atau buruk.
Noktah keputusan pertama disebut noktah
dasar.
• Kedua noktah berbentuk persegi panjang
disebut noktah terminasi yang tidak akan
bercabang lagi karena pada noktah ini
nasabah sudah ditentukan klasifikasinya.
Bagaimana cara membaca gambar pohon keputusan yang dihasilkan oleh algoritma
klasifikasi diatas?

• Pertama pada noktah dasar nasabah(A, B, C, D, E, F, G, H) pertama dilihat dari seberapa besar
aset nasabah?
• Jika klasifikasi aset tergolong rendah, maka dapat diklasifikasikan sebagai nasabah dengan
resiko kredit buruk.
• Namun, bila aset termasuk sedang atau tinggi, resiko kredit belum bisa dikatakan baik atau
buruk noktah ini disebut noktah keputusan A sebab merupakan noktah keputusan yang pertama
dihasilkan dengan catatan(A,C,D,E,F,H).
• Noktah keputusan A dilakukan percabangan dilihat dari besarnya tabungan nasabah bila,
tabungan termasuk rendah atau sedang dapat diklasifikasikan nasabah dengan resiko kredit baik
(A,D,E,H).
• Bila tabungan tinggi, maka belum bisa diklasifikasikan apakah baik atau buruk termasuk
noktah keputusan. Noktah ini disebut Noktah B sebab merupakan noktah keputusan kedua
yang dihasilkan.
• Noktah B dilakukan percabangan lagi berdasarkan seberapa besar aset nasabah?
• Bila, aset termasuk tinggi nasabah (F), maka termasuk nasabah dengan resiko kredit baik jika
nilai aset termasuk sedang, maka diklasifikasikan sebagai nasabah dengan resiko kredit buruk.
• Dari contoh kasus klasifikasi data nasabah diatas maka dapat diperoleh pengetahuan
yang dapat diaplikasikan kepada mereka yang berpotensi menjadi nasabah kesembilan,
kesepuluh dan seterusnya.
• Data ini akan dijadikan sebagai input bagi suatu algoritma
• Keluaran dari algoritma ini secara sederhana dapat direpresentasikan dalam bentuk
pohon keputusan

Berikutnya akan membahas secara detail algoritma yang dapat menghasilkan pohon
keputusan seperti diatas. Algoritma ini disebut Classification and regression tree (CART).

Anda mungkin juga menyukai