Anda di halaman 1dari 5

KLASIFIKASI DATA DENGAN METODE DECISION TREE UNTUK

MENENTUKAN HASIL AKHIR PERMAINAN TIC-TAC-TOE


1
Devota Rachmania Hardask, 2 Annisa Cinintya Risam
1
5210100026, 2 5210100082
1,2
Jurusan Sistem Informasi – Fakultas Teknologi Informasi – Institut Teknologi Sepuluh Nopember
Kampus ITS Sukolilo Surabaya 60111, Indonesia
1
devotarachmania@gmail.com, 2 annisa.risam@gmail.com

Abstract—Dalam dunia ilmu data mining, salah satu metode sehingga dapat memperoleh olahan data yang tepat dan dapat
utamanya adalah Classification. Yang mana dapat diselesaikan menemukan langkah untuk memenangkan permainan tersebut.
dengan beberapa pendekatan, yaitu salah satunya adalah
menggunakan Decision Tree.
Di dalam paper ini akan dijelaskan mengenai bagaimana
langkah-langkah yang harus diambil untuk dapat memenangkan II. TINJAUAN PUSTAKA
permainan tic-tac-toe, yang walaupun merupakan sebuah A. Tic Tac Toe Game
permainan yang sederhana tetapi juga membutuhkan pemikiran
panjang untuk dapat meletakkan lambang yang tepat pada Tic-tac-toe atau juga dikenal dengan nama Noughts dan
ruang yang tepat. Cross adalah sebuah permainan yang biasa dimainkan dengan
Metodologi yang digunakan adalah distribusi data yang kertas dan pensil untuk dua pemain, yaitu X dan O, yang
dibagi menjadi pengambilan dan analisis data, serta melakukan bergiliran menandai ruang dalam grid 3 x 3. Pemain berhasil
analisis decision tree yang dibagi menjadi pembuatan dengan menempatkan tiga tanda masing-masing dalam sebuah
tools Weka dan mendapatkan hasil dari decision tree tersebut. horizontal, vertical, atau diagonal memenangkan permainan.
Data didapatkan melalui website UCI Machine Learning (WIKIPEDIA, 2013)
Repository, dimana data tersebut berjumlah 958 yang terbagi ke
dalam 9 atribut dan 1 kelas.
Melalui hasil perbandingan percentage split didapatkan
informasi bahwa persentase correctly classified instances dengan
nilai paling besar yaitu pada persentase tingkat 90 yaitu Gambar II-1 Contoh permainan dimenangkan oleh pemain
sejumlah 87.5%. Serta jika dilihat dari incorrectly classified pertama (X)
instances pada tingkat persentase 90% didapatkan nilai terkecil
yaitu 12.5%. B. Decision Tree
Classification adalah proses untuk menemukan model atau
Keywords—Tic-tac-toe; Endgame; Decision Tree; Entropy fungsi yang menjelaskan atau membedakan konsep atau kelas
data, dengan tujuan untuk dapat memperkirakan kelas dari
I. PENDAHULUAN suatu objek yang labelnya tidak diketahui. Model itu sendiri
Dalam dunia ilmu data mining, maka sudah tidak asing jika bisa berupa aturan “jika-maka”, berupa decision tree,
mendengar ada empat macam metode utama, yaitu: formula matematis atau neural network [4].
Classification, Association Rules, Clustering, dan Anomaly.
Namun pembahasan kali ini akan mengarah pada metode Decision Tree (pohon keputusan) adalah suatu metode dari
classification. Yaitu dengan menggunakan pendekatan jenis classification untuk mengetahui aksi apa yang akan
Decision Tree. Disamping itu terdapat data test yang akan diuji dipakai untuk mengambil suatu keputusan.
akurasinya. Menurut Putri [1], Decision Tree (DT) merupakan salah
Tic-tac-toe merupakan sebuah permainan yang satu perangkat utama dalam melakukan pengambilan
menggunakan alat berupa kertas dan pensil dalam keputusan. Melalui metode tersebut, kita dapat melakukan
pengoperasiannya. Setiap pemain dapat menggunakan lambang proses pengambilan keputusan secara terstruktur, dengan
X dan O, untuk menandai ruang grid 3x3 secara bergiliran, dan mempertimbangkan alternatif-alternatif keputusan dan hasil
pemain dengan penempatan tiga tanda berturut-turut secara yang ada, dan mengkalkulasikan risiko dan payoff dari tiap
horizontal, vertical, ataupun diagonal dapat memenangkan alternatif keputusan yang diambil.
pertandingan tersebut. Akan tetapi permainan tersebut tidaklah Pada sumber lainnya [3] menjelaskan bahwa untuk
mudah, dan dibutuhkan pemikiran panjang yang cermat untuk melakukan induksi terhadap metode DT dapat dilakukan
menempatkan lambang tersebut secara tepat sehingga dapat dengan berbagai algoritma perhitungan:
memenangkan permainan tesebut.
Hunt’s Algorithm (one of the earliest)
Oleh karena itu, melalui data test permainan yang CART
didapatkan, penulis ingin mengklasifikasikan data yang ada, ID3, C4.5
SLIQ,SPRINT

1
Pada metode DT, dikenal dua istilah umum yaitu Binary Entropy(t )   p( j | t ) log 2 p( j | t )
Split dan Multi-way Split. Binary split digunakan untuk
j
membagi value atribut menjadi dua pengelompokan atau lebih.
Gunanya adalah untuk menghitung DT mana yang paling C1 0 P(C1) = 0/6 = 0 P(C2) = 6/6 = 1
optimal. Sedangkan Multi-way split digunakan untuk tiap-tiap C2 6 Entropy = – 0 log 0 – 1 log 1 = – 0 – 0 = 0
value atribut yang berbeda.
C1 1 P(C1) = 1/6 P(C2) = 5/6
C. Algoritma ID3 C2 5 Entropy = – (1/6) log2 (1/6) – (5/6) log2
Iterative Dichotomiser 3 (ID3) merupakan sebuah metode C1 2 (1/6)
P(C1)= 0.65
= 2/6 P(C2) = 4/6
yang digunakan untuk membangkitkan pohon keputusan. C2 4 Entropy = – (2/6) log2 (2/6) – (4/6) log2
Algoritma pada metode ini berbasis pada Occam’s razor: lebih (4/6) = 0.92
memilih pohon keputusan yang lebih kecil (teori sederhana)
dibanding yang lebih besar. Tetapi tidak dapat selalu
menghasilkan pohon keputusan yang paling kecil dan karena D. WEKA
itu occam’s razor bersifat heuristik. Occam’s razor WEKA (Waikato Environment for Knowledge Analysis)
diformalisasi menggunakan konsep dari entropi informasi. adalah suatu perangkat lunak pembelajaran mesin yang
Berikut algoritma dari ID3 : populer ditulis dengan Java, yang dikembangkan di
Universitas Waikato di selandia baru. WEKA adalah
perangkat lunak gratis yang tersedia di bawah GNU General
Public License. Pada WEKA menyediakan penggunaan teknik
klasifikasi menggunakan pohon keputusan dengan algoritma
J48. Teknik klasifikasi dan algoritma yang digunakan di
WEKA disebut classifier.
E. J48 pada WEKA

J48 merupakan open source Java sebagai pelaksana


algoritma C4.5 di aplikasi WEKA data mining.
C4.5 sendiri adalah algoritma yang digunakan untuk
menghasilkan decission tree atau pohon keputusan yang
dikembangkan oleh Ross Quinlan. C4.5 merupakan
perpanjangan dari algoritma ID3. Pohon-pohon keputusan yang
Adapun sample data yang digunakan oleh ID3 memiliki dihasilkan oleh C4.5 dapat digunakan untuk melakukan
beberapa syarat, yaitu: klasifikasi dan untuk alasan ini, C4.5 sering disebut sebagai
1. Deskripsi atribut-nilai. Atribut yang sama harus classifier statistik. (WIKIPEDIA, 2013)
mendeskripsikan tiap contoh dan memiliki jumlah
nilai yang sudah ditentukan. III. METODOLOGI
2. Kelas yang sudah didefinisikan sebelumnya. Suatu Tahapan metodologi yang dilakukan untuk dapat
atribut contoh harus sudah didefinisikan, karena menghasilkan decision tree dari data permainan tic-tac-toe
mereka tidak dipelajari oleh ID3. adalah dijelaskan di dalam Gambar 2 di bawah ini.
3. Kelas-kelas yang diskrit. Kelas harus digambarkan
dengan jelas. Kelas yang kontinu dipecah-pecah A. Distribusi Data
menjadi kategori-kategori yang relatif, misalnya saja
metal dikategorikan menjadi “hard, quite hard,
flexible, soft, quite soft”. a. Pengambilan Data b. Analisis Data
4. Jumlah contoh (example) yang cukup. Karena
pembangkitan induktif digunakan, maka dibutuhkan
test case yang cukup untuk membedakan pola yang
valid dari peluang suatu kejadian.
Pemillihan atribut pada ID3 dilakukan dengan properti B. Analisis Decision Tree
statistik, yang disebut dengan information gain. Gain
mengukur seberapa baik suatu atribut memisahkan training a. Pembuatan dengan
b. Hasil Decision Tree
example ke dalam kelas target. Atribut dengan informasi Weka
tertinggi akan dipilih. Dengan tujuan untuk mendefinisikan
gain, pertama-tama digunakanlah ide dari teori informasi yang Gambar III-1 Metodologi yang dilakukan
disebut entropi. Entropi mengukur jumlah dari informasi yang
ada pada atribut. Penjelasan dari langkah-langkah metodologi tersebut
Contoh perhitungan Entropy adalah: adalah sebagai berikut:

2
A. Distribusi Data  di dalam langkah pertama ini Tabel IV-1 Distribusi Data tic-tac-toe
dibagi menjadi dua, yaitu proses pengambilan data
serta analisis dari data yang telah didapatkan.
a. Pengambilan data:
Pada langkah ini dilakukan proses
pengambilan data yang berasal dari
website UCI Machine Learning
Repository.
b. Analisis data:
Di dalam langkah ini dilakukan analisis
data yang telah didapatkan. Yaitu
menjelaskan atribut-atribut yang dimiliki,
serta keterangan-keterangan yang
didapatkan dari informasi data tersebut.
B. Analisis Decision Tree pada langkah
metodologi ini terdapat dua langkah di dalamnya,
yaitu pembuatan decision tree dengan
menggunakan tools Weka serta bagaimana proses
mendapatkan hasil decision tree tersebut.
a. Pembuatan dengan Weka:
Pada langkah ini, dilakukan tahap-tahap
pembuatan decision tree menggunakan
tools Weka.
b. Hasil Decision Tree:
Kemudian pada langkah ini didapatkan
hasil berupa decision tree dan kemudian b. Analisis Data
keterangan mengenai hasil yang Tabel 4.3 merupakan tampilan tabel yang berisi data yang
didapatkan. telah didapatkan melalui sumber. Keterangan dari tabel di atas
IV. ANALISIS adalah:

Sesuai dengan alur metodologi, maka tahapan analisis yang Tabel IV-2 analisis data tic-tac-toe
akan dilakukan adalah terhadap berikut ini:
A. Distribusi Data Nama Atribut Keterangan Atribut
Top-left-square x, o, b
a. Pengambilan Data Top-middle-square x, o, b
Data didapatkan melalui website UCI Machine Learning Top-right-square x, o, b
Repository, dimana data tersebut berjumlah 958 yang terbagi Middle-left-square x, o, b
ke dalam 9 atribut dan 1 kelas. Data tersebut adalah sebagai Middle-middle-square x, o, b
berikut. Middle-right-square x, o, b
Bottom-left-square x, o, b
Bottom-middle-square x, o, b
Bottom-right-square x, o, b
Class Postive, negative

Keterangan:
 x  jika pemain menandai ruang dengan tanda X
 o  jika pemain menandai ruang dengan tanda O
 b  jika pemain tidak menandai ruang (kosong)

B. Analisis Decision Tree


a. Pembuatan Dengan Weka
Untuk dapat menemukan pohon keputusan dari data yang
diperoleh, maka sebelumnya terdapat langkah-langkah yaitu:
 Mengubah data keseluruhan menjadi format .csv
 Memasukkan data ke dalam Weka, dimana dari
proses tersebut akan menghasilkan visualisasi data
sebagai berikut.

3
Warna biru menunjukkan kelas positive sedangkan warna
merah menunjukkan kelas negative. Kemudian terdapat
sembilan bagian tabel yang menunjukkan masing-masing hasil
visualisasi dari setiap atribut. Atribut tersebut merupakan
langkah-langkah jawaban yang dipilih oleh masing-masing
pemain.
 Kemudian langkah selanjutnya adalah masuk ke
dalam tab menu classify, kemudian memilih
classifier yaitu J-48 dan menggunakan pilihan tes
percentage split untuk dapat menghitung nilai
ketepatan maupun kesalahan yang ada di dalam
data tersebut. Untuk dapat melakukan
perbandingan, maka dibuatlah tabel percentage
split seperti pada tabel III.3 yang dapat
digunakan untuk membandingkan tingkat
Gambar IV-1 hasil visualisasi data error/correct data tic-tac-toe berdasarkan
persentage split yang dimiliki.

Tabel IV-3 percentage split (%) data tic-tac-toe

Percentage Correctly Incorrectly Mean Root Relative Root Total


Split Classified Classified Absolute Mean Absolute Relative Number of
Instances Instances Error Squared Error Squared Instances
(%) Error Error
573 289 109.6641
10 0.3703 0.5259 83.6955 % % 862
(66.4733 %) (33.5267 %)

521 245 105.9987


20 0.3835 0.5052 84.9268 % % 766
(68.0157 %) (31.9843 %)

527 144
30 0.2754 0.4348 60.4564 % 91.6311 % 671
(78.5395 %) (21.4605 %)

451 124
40 0.2617 0.4251 57.4967 % 89.864 % 575
(78.4348 %) (21.5652 %)

383 96
50 0.2414 0.4052 53.2533 % 85.6986 % 479
(79.9582 %) (20.0418 %)

308 75
60 0.2332 0.395 51.6696 % 84.2528 % 383
(80.4178 %) (19.5822 %)

228 59
70 0.2283 0.4017 50.9345 % 86.1362 % 287
(79.4425 %) (20.5575 %)

161 31
80 0.1923 0.3709 43.4186 % 80.4313 % 192
(83.8542 %) (16.1458 %)

84 12
90 0.1318 0.3156 30.0419 % 68.8202 % 96
(87.5 %) (12.5 %)
 Setelah adanya perbandingan tersebut maka dapat classifier yaitu J-48 dan menggunakan pilihan tes
diketahui tingkat persentase split dari data yang percentage split 66%, maka akan didapatkan hasil
salah maupun yang benar. Kemudian jika masuk decision tree sebagai berikut.
ke dalam tab menu classify, kemudian memilih

4
Gambar IV-2 hasil decision tree

Di dalam hasil pohon keputusan tersebut, tampak bahwa classified instances pada tingkat persentase 90% didapatkan
perbedaan dari masing-masing pemain ketika memilih tanda, nilai terkecil yaitu 12.5%.
dan di urutan ruang yang berbeda maka akan mengeluarkan
hasil akhir yang berbeda pula yaitu menang atau kalah.
DAFTAR PUSTAKA
V. SIMPULAN [1] WIKIPEDIA. (2013, October 14). C4.5 Algorithm. Retrieved from
WIKIPEDIA: http://en.wikipedia.org/wiki/C4.5_algorithm
Terdapat beberapa kesimpulan yang bisa diperoleh dari
hasil analisis diatas, antara lain: [2] WIKIPEDIA. (2013, October 23). Tic-tac-toe. Retrieved from
WIKIPEDIA: http://en.wikipedia.org/wiki/Tic-tac-toe
1) Melalui hasil perbandingan percentage split didapatkan [3] Aha, D. W. (1991, August 19). Retrieved from
informasi bahwa persentase correctly classified instances http://archive.ics.uci.edu/ml/datasets/Tic-Tac-Toe+Endgame
dengan nilai paling besar yaitu pada persentase tingkat 90
yaitu sejumlah 87.5%. Serta jika dilihat dari incorrectly

Anda mungkin juga menyukai