Abstrak
Data mining adalah salah satu bidang yang banyak diminati orang, karena sangat berguna untuk
berbagai jenis kebutuhan dalam aktivitas manusia. Data mining dikenal juga dengan Knowledge Discovery
in Database (KDD) dalam jurnal ilmiah. Data mining juga banyak digunakan untuk aplikasi bisnis ataupun
komersial dan juga bahkan untuk penelitian, pendidikan, pelatihan, pembuatan prototype, serta
pengembangan aplikasi yang mendukung semua langkah proses machine learning termasuk persiapan
data, visualisasi hasil, validasi dan pengoptimalan. Pada penelitian ini penulis menggunakan data mining
untuk mengklasifikasikan gangguan jaringan menggunakan decision tree.
Abstract
Data mining is a field that is of great interest to people because it is very useful for various types of
needs in human activities. Data mining is also known as Knowledge Discovery in Database (KDD) in
scientific journals. Data mining is also widely used for business or commercial applications and even for
research, education, training, prototyping, and development of applications that support all steps of the
machine learning process including data preparation, result visualization, validation, and optimization. In
this study, the authors use data mining to classify network disturbances using a decision tree.
Data Mining yang dikenal sebagai knowledge, adalah salah satu bidang yang berkembang pesat
karena besarnya kebutuhan akan nilai tambah dari tumpukan database skala besar yang terakumulasi
sejalan dengan pertumbuhan teknologi informasi yang sangat pesat. Data mining itu sendiri adalah proses
penggalian informasi untuk menemukan pola yang signifikan dalam jumlah data dalam database untuk
mengubahnya menjadi pengetahuan. Data mining dikenal juga dengan Knowledge Discovery in Database
(KDD) dalam jurnal ilmiah[1]. Proses pengumpulan dan ekstraksi informasi tersebut dapat dilakukan
menggunakan software dengan bantuan perhitungan statistika dan matematika, ataupun teknologi Artificial
Intelligence (AI). Fungsi dalam data mining meliputi fungsi deskripsi, fungsi evaluasi, fungsi prediksi, fungsi
klasifikasi, fungsi klasifikasi, dan fungsi asosiasi. Dalam data mining, prediksi dan klasifikasi banyak
digunakan untuk menganalisis data yang dapat menggambarkan kelas data atau memprediksi data di masa
depan. Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat dilakukan, yaitu
Deskripsi, Estimasi, Prediksi, Klasifikasi, Pengklasteran, Asosiasi. Salah satu teknik yang sering digunakan
adalah teknik Klasifikasi. Metode yang digunakan yaitu metode Klasifikasi dengan algoritma C4.5.
Pohon keputusan adalah algoritma pembelajaran mesin yang menggunakan seperangkat aturan untuk
membuat keputusan dalam struktur seperti pohon yang memodelkan kemungkinan hasil, biaya sumber
daya, manfaat, dan potensi konsekuensi atau risiko. Konsepnya adalah memasukkan algoritma dengan
instruksi bersyarat yang berisi cabang-cabang untuk mewakili langkah-langkah keputusan yang dapat
menghasilkan hasil yang menguntungkan. Klasifikasi adalah proses mencari kumpulan pola atau fungsi
yang mendeskripsikan atau memisahkan kelas data satu dengan lainnya, untuk dapat digunakan untuk
memprediksi data yang belum memiliki kelas data tertentu[2]. Decision Tree adalah sebuah struktur pohon,
dimana setiap knot pohon merepresentasikan atribut yang telah diuji, setiap cabang merupakan suatu
pembagian hasil uji, dan node daun merepresentasikan kelompok kelas tertentu. Level node teratas dari
sebuah Decision Tree adalah node akar yang biasanya berupa atribut yang paling memiliki pengaruh
terbesar pada suatu kelas tertentu. Pada proses mengklasifikasi data yang tidak diketahui, nilai atribut akan
2
diuji dengan cara mempelajari jalur dari knot akar sampai knot akhir dan kemudian akan diprediksi kelas
RapidMiner adalah perangkat lunak sumber terbuka. RapidMiner adalah sooftware untuk
penambangan data, penambangan teks, dan analitik prediktif. RapidMiner menggunakan berbagai teknik
deskriptif dan prediktif untuk memberikan wawasan kepada pengguna sehingga mereka dapat membuat
keputusan terbaik.
Pada penelitian sebelumnya Syaiful Bahri[3] mengguakan data mining untuk mengkalsifikasi dan
memprediksi juara English Premier League dengan menggunakan decision tree dan software rapid miner.
Dengan hasil algoritma yang digunakan adalah menunjukkan bahwa club yang dapat menjuarai English
Premier League adalah club yang dapat memperoleh goal diatas 65, dan point yang dicapai harus diatas
89 point di setiap akhir musim. Dan juga penelitian yang dilakukan oleh Sanni Ucha Putri[1] dimana
mengimplementasi data mining untuk memprediksi penyakit diabetes dengan algoritma C4.5. dan
menggunakan Rapid Miner membuahkan hasil, di mana prediksi menggunakan metode tersebut mencapai
nilai akurasi yang cukup tinggi yaitu sebesar 90% dan rule yang di hasilkanpun mencapai tingakat
Pada penelitian ini penulis akan melakukan klasifikasi data jarigan komputer untuk memprediksi
gangguan jaringan pada komputer berdasarkan data yang telah di olah dengan algoritma Decision Tree
2. Metode Penelitian
Data Mining
Data mining merupakan pencarian trend atau pola yang akan dicari dalam database yang besar untuk
pengambilan keputusan diwaktu yang akan datang[4]. Data mining adalah sekumpulan proses untuk
mempelajari nilai tambah dari suatu kumpulan data berupa pengetahuan yang tidak diketahui secara
manual. Penambangan data sebenarnya memiliki akar panjang dalam bidang ilmiah seperti kecerdasan
3
buatan, pembelajaran mesin, statistik, dan basis data. Penerapan teknik pada data mining untuk
menemukan pola tersembunyi. Dengan kata lain, data mining adalah proses penggalian pola dari data.
Penambangan data menjadi alat penting untuk mengubah data ini menjadi informasi. Ini biasanya
digunakan dalam berbagai praktik pembuatan profil seperti pemasaran, pengawasan, deteksi penipuan,
dan penemuan ilmiah. Ini telah digunakan selama bertahun-tahun oleh perusahaan, akademisi, dan
pemerintah untuk mengolah data dalam jumlah besar seperti rencana perjalanan penumpang maskapai,
Fitur penting dari data mining adalah volume datanya sangat besar, meskipun gagasan dari bidang
studi terkait dapat diterapkan pada masalah penambangan data, skalabilitas dalam hal ukuran data menjadi
kriteria baru yang penting. Pengelompokan data mining terdiri dari deskripsi, estimasi, prediksi, asosiasi,
pengklusteran, dan klasifikasi. Dalam klasifikasi, terdapat target variabel kategori. Sebagai contoh,
penjenisan gaji bisa dipisahkan bagian dalam tiga kategori, yaitu gaji tinggi, gaji sedang dan gaji rendah.
Kemudian kepada melekatkan gaji seorang pegawai, dipakai kebiasaan kelompok bagian dalam keterangan
mining. Secara umum proses klasifikasi dapat dilakukan dalam dua tahap, yaitu proses belajar dari suau
data pelatihan dan klasifikasi kasus. Pada proses, algoritma klasifikasi memproses data training yang
kemudian menghasilkan sebuah model. Setelah model diuji dan dapat diterima, pada tahap klasifikasi,
model tersebut digunakan untuk memprediksi kelas dari kasus baru untuk membantu proses pengambilan
keputusan Decision tree adalah salah satu metode klasifikasi yang paling banyak digunakan karena mudah
untuk diinterpretasi oleh manusia. Data mining merupaka proses yang menggunakan teknik statistik,
Matematika, kecerdasan buatan, dan machine learning untuk mengektraksi dan mengindentifikasi informasi
yang bermanfaat dan pengetahuan yang terakit dari berbagai database besar[5].
Decision Tree
Pohon keputusan adalah metode klasifikasi dan prediksi yang sangat kuat dan populer. Dimana
metode pohon keputusan mengubah data yang sangat besar menjadi pohon keputusan yang dapat
mewakili aturan. Aturan-aturan ini mudah dipahami atau ditafsirkan karena ditulis dalam bahasa alami yang
4
dapat dimengerti. Pohon keputusan juga berguna untuk mengeksplorasi data dan menemukan hubungan
tersembunyi antara sekumpulan kandidat variabel input dan variabel target[6]. Jadi pengelompokan inil
yang digunakan untuk menyusun kelas yang terdapat dari data. misalnya untuk Decision Tree maka kelas-
kelasnya digambarkan berbentuk pohon. Klasifikasi adalah cara menemukan kumpulan pola atau fungsi-
fungsi yang mendeskripsikan dan memisahkan kelas data satu dengan lainnya, untuk dapat digunakan
Rapid miner
RapidMiner adalah platform data ilmu pengetahuan yang dikembangkan oleh perusahaan yang
mempunyai nama yang sama, yang menyediakan lingkungan terpadu untuk machine learning, deep
learning, text mining, dan analisis prediktif. Aplikasi ini digunakan untuk aplikasi bisnis ataupun komersial
dan juga untuk penelitian, pendidikan, pelatihan, pembuatan prototype dengan cepat, serta
pengembangan aplikasi yang mendukung semua langkah proses machine learning termasuk persiapan
data, visualisasi hasil, validasi dan pengoptimalan. RapidMiner dikembangkan dengan model open core[7].
RapidMiner memiliki sekitar 500 operator penambangan data, termasuk operator input, output, manipulasi
data, dan visualisasi. RapidMiner adalah perangkat lunak mandiri untuk analisis data dan sebagai mesin
penambangan data yang dapat diintegrasikan ke dalam produk Anda. RapidMiner ditulis dalam Java,
3. Hasil
Dalam penlitian ini data sampel yang digunakan adalah 12 data tracking jaringan pada komputer.
Setelah data sudah di dapatkan, maka ditentukan beberapa atribut yang ada seperti: waktu, paket,
frekuensi, prioritas, gangguan. Dan sebagai hasil nya adalah prediksi apakah jaringan komputer akan
normal atau mengalami gangguan. Dan berikut ini adalah data-data dari jaringan komputer yang akan
diolah dengan decision tree. Berikut ini adalah langkah-langkah untuk membangun tree dan rule
5
No Waktu Paket Frekuensi Prioritas Gangguan
1 Pendek Besar Sedang Rendah Gangguan
2 Pendek Kecil Rendah Tinggi Gangguan
3 Panjang Besar Sedang Tinggi Normal
4 Panjang Kecil Tinggi Rendah Normal
5 Pendek Besar Tinggi Tinggi Gangguan
6 Panjang Kecil Rendah Tinggi Gangguan
7 Panjang Kecil Tinggi Rendah Gangguan
8 Panjang Kecil Sedang Rendah Normal
9 Panjang Besar Tinggi Tinggi Normal
10 Panjang Kecil Sedang Rendah Gangguan
11 Pendek Besar Sedang Tinggi Normal
12 Panjang Besar Rendah Tinggi Normal
Data yang sudah ada kemudian diolah menggunakan RapidMiner menggunakan Perfomance yang
berfungsi sebagai validasi dan reabilitas data untuk mencari keakuratan data. Data yang akurat maka akan
dilakukan pengolahan data untuk mencari hasil dari gangguan jaringan komputer dengan menggunakan
RapidMiner dan mengambil keputusan dari hasil pengolahan data menggunakan RapidMiner yang
dilakukan.
6
Lalu setelah di input ke dalam rapid miner di lakukan pemodelan di rapid miner dengan menggunakan
Lalu langkah selanjutnya adalah men-run dari hasil proses yang telah di buat dan untuk
mengimplementasikan algoritma terhadap data yang ada sehingga dapat muncul hasil dari decision tree
tersebut.
7
Gambar 4 Decision tree dari dataset
Dan juga dilakukan perhitungan perfomance atau confusion matrix untuk dapat melihat akurasi dari
model yang telah dibuat. Dan berikut ini hasil dari confusion matrix nya:
4. Pembahasan/Kesimpulan
Dari hasil olah data yang ada yang di olah menggunakan rapid miner dengan algoritma decision tree
Berdasarkan dari tree dari gambar 4, makan telah diketahui bahwa pohon keputusan telah terbentuk.
Dan setelah didapatkan tree tersebut, kemudian dirubah menjadi rule, dan berikut ini adalah bentuk rule
8
R1: jika waktu=panjang ^ paket=besar maka jaringan komputer=normal
Berdasarkan pengolahan data menggunakan rapid miner didapat nilai akurasi dari hasil confusion
Saran
Berdasarkan penelitian di atas dan berdasarkan hasil output tersebut terdapat beberapa saran untuk
penelitian berikutnya dimana hasil dari akurasi dengan decision tree adalah 83.33%, maka dari itu di
penelitian selanjutnya bisa menggunakan metode atau algoritma yang lainnya yang mungkin lebih tinggi
untuk tingkat akurasi dengan demikian bisa mendapatkan hasil yang maksimal.
5. Daftar Pustaka
[1] S. U. Putri, E. Irawan, and F. Rizky, “Implementasi Data Mining Untuk Prediksi Penyakit Diabetes
Dengan Algoritma C4.5,” vol. 2, no. 1, p. 8, 2021.
[2] Y. Rosela, “IMPLEMENTASI KLASIFIKASI DECISION TREE MENGANALISA STATUS PENJUALAN
BARANG MENGGUNAKAN C4.5 (Studi Kasus: Pt.Matahari Department Store Medan Mall),” vol. 7, p. 8,
2019.
[3] S. Bahri and A. Lubis, “METODE KLASIFIKASI DECISION TREE UNTUK MEMPREDIKSI JUARA,” p. 8,
2020.
[4] S. Wahyuni, “IMPLEMENTASI RAPIDMINER DALAM MENGANALISA DATA MAHASISWA DROP OUT,”
vol. 10, p. 4, 2017.
[5] Y. Mardi, “Data Mining : Klasifikasi Menggunakan Algoritma C4.5,” Edik Inform., vol. 2, no. 2, pp. 213–
219, Feb. 2017, doi: 10.22202/ei.2016.v2i2.1465.
9
[6] “Bahri and Lubis - 2020 - METODE KLASIFIKASI DECISION TREE UNTUK MEMPREDIKSI.pdf.”
[7] R. Nofitri and N. Irawati, “ANALISIS DATA HASIL KEUNTUNGAN MENGGUNAKAN SOFTWARE
RAPIDMINER,” JURTEKSI J. Teknol. Dan Sist. Inf., vol. 5, no. 2, pp. 199–204, Jul. 2019, doi:
10.33330/jurteksi.v5i2.365.
10