ABSTRAK
Penggunaan perangkat lunak anti virus maupun firewall dapat membantu mencegah serangan
terhadap suatu host. Namun mencegah serangan saja tidaklah cukup, terlebih bila host yang diserang
merupakan suatu sistem atau server yang penting. Mengingat pentingnya masalah suatu serangan jaringan
komputer, ada berbagai penelitian yang mencoba mengukur keadaaan tersebut. Berdasarkan penelitian
penulis, penggunaan dataset KDD CUP 99 untuk dijadikan pengukuran basis penelitian, dan merupakan
suatu kumpulan dari data record atau laporan intrusi serangan pada jaringan komputer yang dapat digunakan
sebagai alat dan acuan data latih dan uji untuk mendeteksi ancaman serangan. Penelitian ini melakukan
penggalian informasi berdasarkan pengujian pada 260 data sampel terhadap pengambilan data balance untuk
mengklasifikasi ke 5 kelas yakni Normal, Denial of Service (DoS), User to Root (U2R), Remote to Local
(R2L) dan Probe sebagai pembelajaran mesin suatu serangan jaringan komputer pada dataset KDD CUP 99.
Dilakukan seleksi fitur dengan metode Fast Correlation Based Filter sebelum dilakukan tahapan klasifikasi
metode Modified K-Nearest Neighbor yang digunakan. Hasilnya sistem yang dibangun memiliki tingkat
akurasi sebesar 90,38% dengan perbandingan data latih dan data uji yaitu 80:20 dengan nilai k = 3.
Kata Kunci : Dataset KDD CUP 99, Denial of Service, Fast Correlation Based Filter, Modified K-
Nearest Neighbor, Normal, Probe, Remote to Local dan User to Root.
.
ABSTRACT
Use of anti-virus software or firewalls can help prevent attacks on a host. But preventing attacks is not
enough, especially if the host is attacked is an important system or server. Given the importance of the
problem of a computer network attack, there are various studies that try to measure the circumstances. Based
on the author's research, the use of KDD CUP 99 dataset to be used as the measurement of research base,
and is a collection of data record or attack intrusion reports on computer networks that can be used as a tool
and reference of training and test data to detect threats of attack. This research performs extracting
information based on testing on 260 sampled data to collect balance data to classify into 5 class is Normal,
Denial of Service (DoS), User to Root (U2R), Remote to Local (R2L) and Probe as machine learning an
attack computer network on the KDD CUP 99 dataset. Selection of features using the Fast Correlation Based
Filter method is performed before the classification stage of the Modified K-Nearest Neighbor method is
used. The result of the built system has an accuracy of 90.38% with the comparison of training data and test
data is 80:20 with the value k = 3.
Keywords : Dataset KDD CUP 99, Denial of Service, Fast Correlation Based Filter, Modified K-
Nearest Neighbor, Normal, Probe, Remote to Local dan User to Root.
b. Data Preprocessing
Tahap data processing ini menggunakan Hitung entropy