Anda di halaman 1dari 10

Implementasi Algoritma Decision Tree Untuk Klasifikasi

Gangguan Jaringan Komputer Kantor Daerah Bandung


Valerian Leony Bianto1
1
Fakultas Teknologi Informasi, Universitas Advent Indonesia
e-mail: *11982010@unai.edu

Abstrak

Data mining adalah salah satu bidang yang banyak diminati orang, karena sangat berguna untuk
berbagai jenis kebutuhan dalam aktivitas manusia. Data mining dikenal juga dengan Knowledge Discovery
in Database (KDD) dalam jurnal ilmiah. Data mining juga banyak digunakan untuk aplikasi bisnis ataupun
komersial dan juga bahkan untuk penelitian, pendidikan, pelatihan, pembuatan prototype, serta
pengembangan aplikasi yang mendukung semua langkah proses machine learning termasuk persiapan
data, visualisasi hasil, validasi dan pengoptimalan. Pada penelitian ini penulis menggunakan data mining
untuk mengklasifikasikan gangguan jaringan menggunakan decision tree.

Kata Kunci: Data mining, Decision tree, Rapid Miner, Klasifikasi

I m plem entation of the Decision Tree Algorithm for P rediction


of Bandung R egional Office Com puter N etw ork Disturbances

Abstract

Data mining is a field that is of great interest to people because it is very useful for various types of
needs in human activities. Data mining is also known as Knowledge Discovery in Database (KDD) in
scientific journals. Data mining is also widely used for business or commercial applications and even for
research, education, training, prototyping, and development of applications that support all steps of the
machine learning process including data preparation, result visualization, validation, and optimization. In
this study, the authors use data mining to classify network disturbances using a decision tree.

K eyw ords: Data mining, Decision tree, Rapid Miner, Clasiffication


1. Pendahuluan

Data Mining yang dikenal sebagai knowledge, adalah salah satu bidang yang berkembang pesat

karena besarnya kebutuhan akan nilai tambah dari tumpukan database skala besar yang terakumulasi

sejalan dengan pertumbuhan teknologi informasi yang sangat pesat. Data mining itu sendiri adalah proses

penggalian informasi untuk menemukan pola yang signifikan dalam jumlah data dalam database untuk

mengubahnya menjadi pengetahuan. Data mining dikenal juga dengan Knowledge Discovery in Database

(KDD) dalam jurnal ilmiah[1]. Proses pengumpulan dan ekstraksi informasi tersebut dapat dilakukan

menggunakan software dengan bantuan perhitungan statistika dan matematika, ataupun teknologi Artificial

Intelligence (AI). Fungsi dalam data mining meliputi fungsi deskripsi, fungsi evaluasi, fungsi prediksi, fungsi

klasifikasi, fungsi klasifikasi, dan fungsi asosiasi. Dalam data mining, prediksi dan klasifikasi banyak

digunakan untuk menganalisis data yang dapat menggambarkan kelas data atau memprediksi data di masa

depan. Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat dilakukan, yaitu

Deskripsi, Estimasi, Prediksi, Klasifikasi, Pengklasteran, Asosiasi. Salah satu teknik yang sering digunakan

adalah teknik Klasifikasi. Metode yang digunakan yaitu metode Klasifikasi dengan algoritma C4.5.

Pohon keputusan adalah algoritma pembelajaran mesin yang menggunakan seperangkat aturan untuk

membuat keputusan dalam struktur seperti pohon yang memodelkan kemungkinan hasil, biaya sumber

daya, manfaat, dan potensi konsekuensi atau risiko. Konsepnya adalah memasukkan algoritma dengan

instruksi bersyarat yang berisi cabang-cabang untuk mewakili langkah-langkah keputusan yang dapat

menghasilkan hasil yang menguntungkan. Klasifikasi adalah proses mencari kumpulan pola atau fungsi

yang mendeskripsikan atau memisahkan kelas data satu dengan lainnya, untuk dapat digunakan untuk

memprediksi data yang belum memiliki kelas data tertentu[2]. Decision Tree adalah sebuah struktur pohon,

dimana setiap knot pohon merepresentasikan atribut yang telah diuji, setiap cabang merupakan suatu

pembagian hasil uji, dan node daun merepresentasikan kelompok kelas tertentu. Level node teratas dari

sebuah Decision Tree adalah node akar yang biasanya berupa atribut yang paling memiliki pengaruh

terbesar pada suatu kelas tertentu. Pada proses mengklasifikasi data yang tidak diketahui, nilai atribut akan

2
diuji dengan cara mempelajari jalur dari knot akar sampai knot akhir dan kemudian akan diprediksi kelas

yang dimiliki oleh suatu data baru tertentu.

RapidMiner adalah perangkat lunak sumber terbuka. RapidMiner adalah sooftware untuk

penambangan data, penambangan teks, dan analitik prediktif. RapidMiner menggunakan berbagai teknik

deskriptif dan prediktif untuk memberikan wawasan kepada pengguna sehingga mereka dapat membuat

keputusan terbaik.

Pada penelitian sebelumnya Syaiful Bahri[3] mengguakan data mining untuk mengkalsifikasi dan

memprediksi juara English Premier League dengan menggunakan decision tree dan software rapid miner.

Dengan hasil algoritma yang digunakan adalah menunjukkan bahwa club yang dapat menjuarai English

Premier League adalah club yang dapat memperoleh goal diatas 65, dan point yang dicapai harus diatas

89 point di setiap akhir musim. Dan juga penelitian yang dilakukan oleh Sanni Ucha Putri[1] dimana

mengimplementasi data mining untuk memprediksi penyakit diabetes dengan algoritma C4.5. dan

menggunakan Rapid Miner membuahkan hasil, di mana prediksi menggunakan metode tersebut mencapai

nilai akurasi yang cukup tinggi yaitu sebesar 90% dan rule yang di hasilkanpun mencapai tingakat

kebenaran mendekati 100%

Pada penelitian ini penulis akan melakukan klasifikasi data jarigan komputer untuk memprediksi

gangguan jaringan pada komputer berdasarkan data yang telah di olah dengan algoritma Decision Tree

dengan mengunakan rapid miner.

2. Metode Penelitian

Data Mining

Data mining merupakan pencarian trend atau pola yang akan dicari dalam database yang besar untuk

pengambilan keputusan diwaktu yang akan datang[4]. Data mining adalah sekumpulan proses untuk

mempelajari nilai tambah dari suatu kumpulan data berupa pengetahuan yang tidak diketahui secara

manual. Penambangan data sebenarnya memiliki akar panjang dalam bidang ilmiah seperti kecerdasan

3
buatan, pembelajaran mesin, statistik, dan basis data. Penerapan teknik pada data mining untuk

menemukan pola tersembunyi. Dengan kata lain, data mining adalah proses penggalian pola dari data.

Penambangan data menjadi alat penting untuk mengubah data ini menjadi informasi. Ini biasanya

digunakan dalam berbagai praktik pembuatan profil seperti pemasaran, pengawasan, deteksi penipuan,

dan penemuan ilmiah. Ini telah digunakan selama bertahun-tahun oleh perusahaan, akademisi, dan

pemerintah untuk mengolah data dalam jumlah besar seperti rencana perjalanan penumpang maskapai,

data sensus, dan pemindai supermarket untuk membuat riset pasar.

Fitur penting dari data mining adalah volume datanya sangat besar, meskipun gagasan dari bidang

studi terkait dapat diterapkan pada masalah penambangan data, skalabilitas dalam hal ukuran data menjadi

kriteria baru yang penting. Pengelompokan data mining terdiri dari deskripsi, estimasi, prediksi, asosiasi,

pengklusteran, dan klasifikasi. Dalam klasifikasi, terdapat target variabel kategori. Sebagai contoh,

penjenisan gaji bisa dipisahkan bagian dalam tiga kategori, yaitu gaji tinggi, gaji sedang dan gaji rendah.

Kemudian kepada melekatkan gaji seorang pegawai, dipakai kebiasaan kelompok bagian dalam keterangan

mining. Secara umum proses klasifikasi dapat dilakukan dalam dua tahap, yaitu proses belajar dari suau

data pelatihan dan klasifikasi kasus. Pada proses, algoritma klasifikasi memproses data training yang

kemudian menghasilkan sebuah model. Setelah model diuji dan dapat diterima, pada tahap klasifikasi,

model tersebut digunakan untuk memprediksi kelas dari kasus baru untuk membantu proses pengambilan

keputusan Decision tree adalah salah satu metode klasifikasi yang paling banyak digunakan karena mudah

untuk diinterpretasi oleh manusia. Data mining merupaka proses yang menggunakan teknik statistik,

Matematika, kecerdasan buatan, dan machine learning untuk mengektraksi dan mengindentifikasi informasi

yang bermanfaat dan pengetahuan yang terakit dari berbagai database besar[5].

Decision Tree

Pohon keputusan adalah metode klasifikasi dan prediksi yang sangat kuat dan populer. Dimana

metode pohon keputusan mengubah data yang sangat besar menjadi pohon keputusan yang dapat

mewakili aturan. Aturan-aturan ini mudah dipahami atau ditafsirkan karena ditulis dalam bahasa alami yang

4
dapat dimengerti. Pohon keputusan juga berguna untuk mengeksplorasi data dan menemukan hubungan

tersembunyi antara sekumpulan kandidat variabel input dan variabel target[6]. Jadi pengelompokan inil

yang digunakan untuk menyusun kelas yang terdapat dari data. misalnya untuk Decision Tree maka kelas-

kelasnya digambarkan berbentuk pohon. Klasifikasi adalah cara menemukan kumpulan pola atau fungsi-

fungsi yang mendeskripsikan dan memisahkan kelas data satu dengan lainnya, untuk dapat digunakan

untuk memprediksi data yang belum memiliki kelas data tertentu.

Rapid miner

RapidMiner adalah platform data ilmu pengetahuan yang dikembangkan oleh perusahaan yang

mempunyai nama yang sama, yang menyediakan lingkungan terpadu untuk machine learning, deep

learning, text mining, dan analisis prediktif. Aplikasi ini digunakan untuk aplikasi bisnis ataupun komersial

dan juga untuk penelitian, pendidikan, pelatihan, pembuatan prototype dengan cepat, serta

pengembangan aplikasi yang mendukung semua langkah proses machine learning termasuk persiapan

data, visualisasi hasil, validasi dan pengoptimalan. RapidMiner dikembangkan dengan model open core[7].

RapidMiner memiliki sekitar 500 operator penambangan data, termasuk operator input, output, manipulasi

data, dan visualisasi. RapidMiner adalah perangkat lunak mandiri untuk analisis data dan sebagai mesin

penambangan data yang dapat diintegrasikan ke dalam produk Anda. RapidMiner ditulis dalam Java,

sehingga dapat bekerja di semua sistem operasi.

3. Hasil

Dalam penlitian ini data sampel yang digunakan adalah 12 data tracking jaringan pada komputer.

Setelah data sudah di dapatkan, maka ditentukan beberapa atribut yang ada seperti: waktu, paket,

frekuensi, prioritas, gangguan. Dan sebagai hasil nya adalah prediksi apakah jaringan komputer akan

normal atau mengalami gangguan. Dan berikut ini adalah data-data dari jaringan komputer yang akan

diolah dengan decision tree. Berikut ini adalah langkah-langkah untuk membangun tree dan rule

5
No Waktu Paket Frekuensi Prioritas Gangguan
1 Pendek Besar Sedang Rendah Gangguan
2 Pendek Kecil Rendah Tinggi Gangguan
3 Panjang Besar Sedang Tinggi Normal
4 Panjang Kecil Tinggi Rendah Normal
5 Pendek Besar Tinggi Tinggi Gangguan
6 Panjang Kecil Rendah Tinggi Gangguan
7 Panjang Kecil Tinggi Rendah Gangguan
8 Panjang Kecil Sedang Rendah Normal
9 Panjang Besar Tinggi Tinggi Normal
10 Panjang Kecil Sedang Rendah Gangguan
11 Pendek Besar Sedang Tinggi Normal
12 Panjang Besar Rendah Tinggi Normal

Gambar 1 Tabel Data

Data yang sudah ada kemudian diolah menggunakan RapidMiner menggunakan Perfomance yang

berfungsi sebagai validasi dan reabilitas data untuk mencari keakuratan data. Data yang akurat maka akan

dilakukan pengolahan data untuk mencari hasil dari gangguan jaringan komputer dengan menggunakan

RapidMiner dan mengambil keputusan dari hasil pengolahan data menggunakan RapidMiner yang

dilakukan.

Gambar 2 Tabel dataset pada rapid miner

6
Lalu setelah di input ke dalam rapid miner di lakukan pemodelan di rapid miner dengan menggunakan

algoritma decision tree.

Gambar 3 Design dari proses olah data di rapid miner

Lalu langkah selanjutnya adalah men-run dari hasil proses yang telah di buat dan untuk

mengimplementasikan algoritma terhadap data yang ada sehingga dapat muncul hasil dari decision tree

tersebut.

7
Gambar 4 Decision tree dari dataset

Dan juga dilakukan perhitungan perfomance atau confusion matrix untuk dapat melihat akurasi dari

model yang telah dibuat. Dan berikut ini hasil dari confusion matrix nya:

Gambar 5 Hasil dari Confusionn Matrix

4. Pembahasan/Kesimpulan

Dari hasil olah data yang ada yang di olah menggunakan rapid miner dengan algoritma decision tree

telah didapat outputnya berbentuk pohon keputusan pada gambar 4.

Berdasarkan dari tree dari gambar 4, makan telah diketahui bahwa pohon keputusan telah terbentuk.

Dan setelah didapatkan tree tersebut, kemudian dirubah menjadi rule, dan berikut ini adalah bentuk rule

berdasarkan tree diatas:

8
R1: jika waktu=panjang ^ paket=besar maka jaringan komputer=normal

R2: jika waktu=panjang ^ paket=kecil maka jaringan komputer=gangguan

R3: jika waktu=pendek ^ frekuensi=rendah maka jaringan komputer=gangguan

R4: jika waktu=pendek ^ frekuensi=sedang ^ prioritas=rendah maka jaringan komputer=gangguan

R5: jika waktu=pendek ^ frekuensi=sedang ^ prioritas=tinggi maka jaringan komputer=normal

R6: jika waktu=pendek ^ frekuensi=tinggi maka jaringan komputer=gangguan

Berdasarkan pengolahan data menggunakan rapid miner didapat nilai akurasi dari hasil confusion

matrix nya sebesar 83.33%

Saran

Berdasarkan penelitian di atas dan berdasarkan hasil output tersebut terdapat beberapa saran untuk

penelitian berikutnya dimana hasil dari akurasi dengan decision tree adalah 83.33%, maka dari itu di

penelitian selanjutnya bisa menggunakan metode atau algoritma yang lainnya yang mungkin lebih tinggi

untuk tingkat akurasi dengan demikian bisa mendapatkan hasil yang maksimal.

5. Daftar Pustaka

[1] S. U. Putri, E. Irawan, and F. Rizky, “Implementasi Data Mining Untuk Prediksi Penyakit Diabetes
Dengan Algoritma C4.5,” vol. 2, no. 1, p. 8, 2021.
[2] Y. Rosela, “IMPLEMENTASI KLASIFIKASI DECISION TREE MENGANALISA STATUS PENJUALAN
BARANG MENGGUNAKAN C4.5 (Studi Kasus: Pt.Matahari Department Store Medan Mall),” vol. 7, p. 8,
2019.
[3] S. Bahri and A. Lubis, “METODE KLASIFIKASI DECISION TREE UNTUK MEMPREDIKSI JUARA,” p. 8,
2020.
[4] S. Wahyuni, “IMPLEMENTASI RAPIDMINER DALAM MENGANALISA DATA MAHASISWA DROP OUT,”
vol. 10, p. 4, 2017.
[5] Y. Mardi, “Data Mining : Klasifikasi Menggunakan Algoritma C4.5,” Edik Inform., vol. 2, no. 2, pp. 213–
219, Feb. 2017, doi: 10.22202/ei.2016.v2i2.1465.

9
[6] “Bahri and Lubis - 2020 - METODE KLASIFIKASI DECISION TREE UNTUK MEMPREDIKSI.pdf.”
[7] R. Nofitri and N. Irawati, “ANALISIS DATA HASIL KEUNTUNGAN MENGGUNAKAN SOFTWARE
RAPIDMINER,” JURTEKSI J. Teknol. Dan Sist. Inf., vol. 5, no. 2, pp. 199–204, Jul. 2019, doi:
10.33330/jurteksi.v5i2.365.

10

Anda mungkin juga menyukai