Anda di halaman 1dari 3

Nama : Yahya As-Shiddiq

NIM : 2018610043

CLASSIFIER SELECTION MODELS FOR INTRUSION DETECTION SYSTEM (IDS)

Anurag Jain, BhupendraVerma and J. L. Rana

Rajiv Gandhi Technical University, Bhopal, Indi

3. SELECTION OF CLASSIFIERS

Dalam makalah ini kami menyediakan semacam pengantar untuk beberapa teknik klasifikasi. Berbagai
teknik sistem deteksi intrusi dilaporkan dalam bagian ini.

3.1. K-Means

Untuk mengatasi masalah pengelompokan utama, K-means [3] adalah algoritma pembelajaran tanpa
pengawasan yang paling umum dan paling sederhana, yang juga dapat melakukan partisi otomatis
tanggal ke dalam kelompok k. Motif utama dari mendefinisikan k centroid dan kemudian
menghubungkannya, adalah untuk menetapkan setiap instance ke pusat cluster terdekat dan untuk
memperbarui setiap pusat cluster untuk menjadi rata-rata dari instance konstituennya.

3.2. Bayes Net

Bayesian net juga disebut jaringan kepercayaan milik keluarga model grafis probabilistik. Ini digunakan
untuk menandakan pengetahuan struktur grafis dari model ini digunakan untuk mewakili pengetahuan
tentang domain rancu dari dataset. Ketergantungan probabilistik antara variabel acak yang sesuai
diwakili oleh tepi model ini. Secara formal, node mewakili variabel, dan arc mengkodekan dependensi
kondisional antara variabel. Jaringan Bayesian adalah Directed Acyclic Graphs (DAG). Status variabel
acak dan Tabel Kemungkinan Bersyarat (CPT) berisi di setiap node.

3.4. J48

J48 adalah pengklasifikasi sumber terbuka dari algoritma C4.5 dan implementasinya di Java. C4.5 adalah
program yang membuat pohon keputusan berdasarkan pada set data input berlabel [5]. Algoritma ini
dikembangkan oleh Ross Quinlan. Pohon keputusan yang dihasilkan oleh C4.5 dapat digunakan untuk
klasifikasi, dan untuk alasan ini, C4.5 sering disebut sebagai pengelompokan statistik. Algoritma J48
dirancang dengan fitur-fitur yang dengan mudah mengatasi celah yang ada di ID3. Kerugian utama dari
C4.5 adalah CPU membutuhkan waktu dan dibutuhkan memori sistem. Untuk klasifikasi masalah pohon
keputusan digunakan. Dalam teknik ini, model didasarkan pada pohon untuk proses klasifikasi. Setelah
pohon dibangun, hasil klasifikasi harus menerapkan setiap tuple dalam basisdata.
3.5. ID3

Algoritma ID3, yang dikembangkan oleh J. Ross dan Quinlan pada tahun 1979, adalah contoh
pembelajaran simbolik dan induksi aturan [6], teknik pembelajaran mesin untuk mengklasifikasikan
data. Ini adalah algoritma pembelajaran terawasi yang menggunakan pohon keputusan berdasarkan
perhitungan matematika. itu melakukan pencarian serakah top-down melalui pelatihan yang diberikan
ditetapkan untuk menguji setiap atribut di setiap node, untuk membangun pohon keputusan. ID3 adalah
algoritma pembelajaran Keputusan yang sangat berguna.

3.6. NBTree

NB Tree adalah pendekatan hybrid yang sangat terukur untuk basis data besar. Secara umum, ini
mengungguli pohon keputusan dan pengklasifikasi naif bayes saja [7]. Ini sangat cocok untuk kasus-
kasus di mana banyak atribut yang relevan untuk klasifikasi. dalam kasus seperti itu, basis data besar
dan interpretasi dari classifier diinginkan, dan atribut tidak harus independen (yaitu atribut tidak
tergantung kondisi). NBTree secara signifikan meningkatkan kinerja konstituennya dengan mendorong
pengklasifikasi yang sangat akurat. Meskipun tidak ada satu pun pengelompokan mengungguli semua
yang lain di setiap domain, NBTree berkinerja dengan baik dalam banyak kasus serta meningkatkan
dengan baik sehubungan dengan akurasi. Seperti pada pohon keputusan, ambang batas untuk atribut
kontinu dipilih menggunakan teknik minimalisasi entropi standar.

3.7. Fuzzy Logic

Logika fuzzy, yang diusulkan oleh LoftiZadeh pada 1960-an, meskipun teori ini relatif lebih baru, teori ini
telah membuktikan nilainya dalam sejumlah aplikasi industri [8]. Pendekatan fuzzy menawarkan
kemampuan untuk menerapkan logika pada nilai lunak (set fuzzy atau "derajat kebenaran") daripada
nilai keras (garing atau benar / salah), untuk membuat kerangka penalaran yang mendasari (sistem
pakar, pohon keputusan, dll.) Lebih digeneralisasi , memungkinkannya cocok untuk berbagai masalah.

3.8. Support Vector Machine

Support Vector Machines (SVMs), generasi baru pembelajaran algoritma, serangkaian algoritma
pembelajaran yang diawasi terkait, dikembangkan oleh Vladimir Vapnik pada pertengahan 90-an [9].
SVM digunakan untuk klasifikasi dan regresi. SVM berada di garis depan bidang Machine Learning,
karena keanggunan dan fondasi matematisnya yang kuat dari optimisasi dan teori pembelajaran
statistik. Ini secara formal didefinisikan oleh hyperplane yang memisahkan, menjadikannya sebuah
classifier diskriminatif. Dengan demikian, Untuk satu set data pelatihan berlabel tertentu, SVM
memberikan hyperplane optimal untuk mengkategorikan contoh baru.
3.9. Decision Table

Terdiri dari dua atribut pada setiap tingkat hirarki [10], tabel keputusan adalah rincian hirarki data.
Kolom penting (Atribut) untuk mengklasifikasikan data diidentifikasi, dan model yang dihasilkan
ditampilkan secara grafis sebagai serangkaian diagram kue, dengan bantuan visualisasi yang
menyertainya. Beberapa level, yang mewakili atribut yang semakin penting, dapat dimuat dalam
visualisasi. Hal ini dilakukan dengan bantuan kue, di mana, setiap kue dapat dibagi menjadi kue yang
lebih kecil untuk mewakili atribut terpenting berikutnya.

Anda mungkin juga menyukai