1. Apa yang dimaksud dengan Klasifikasi pada data mining?
2. Sebutkan contoh klasifikasi pada data mining! 3. Jelaskan algoritma Nearest Neighbour Classification (K-Nearest Neighbour) minimal dari 3 ahli pakar! 4. Bagaimana proses K-Nearest Neighbour pada klasifikasi? 5. Implementasikan klasifikasi dengan menggunakan algoritma K-Nearest Neighbour terhadap dataset berikut ini dan lakukan langkahnya dengan rinci! RAM Price (Rupiah) Brand 8 4299000 Oppo 4 2439000 Oppo 8 4360000 Oppo 8 5999000 Oppo 8 4950000 Oppo 8 4599000 Samsung Galaxy 6 5600000 Samsung Galaxy 8 5199000 Samsung Galaxy 4 2099000 Samsung Galaxy 6 2679000 Samsung Galaxy 6 2965000 Oppo 8 2880000 Oppo 3 1450000 Oppo 3 1640000 Oppo 4 2400000 Oppo 8 3749000 Samsung Galaxy 8 4500000 Samsung Galaxy 4 2319000 Samsung Galaxy 6 3359000 Samsung Galaxy 3 1425000 Samsung Galaxy JAWABAN
1. Klasifikasi data mining merupakan proses menemukan definisi kesamaan
karakteristik dalam suatu kelompok atau kelas (class). Klasifikasi data mining menjadi salah satu metode yang paling umum untuk digunakan. Metode ini dilakukan bertujuan untuk memperkirakan kelas dari suatu objek yang label- nya belum diketahui. 2. Contoh klasifikasi data mining yang mudah dipahami: a. Ada 8 mobil yang terdiri dari milik beberapa manufacturer seperti Mitsubishi, Nissan, dan Toyota: - GR Supra, GR Corolla, dan GR Yaris merupakan klasifikasi dari manufacturer Toyota. - Lancer Evolution IX dan Eclipse GSX merupakan klasifikasi manufacturer Mitsubishi. - Sedangkan GT-R R35 Nismo, Sentra, dan Silvia S15 merupakan klasifikasi manufacturer Nissan. b. Paus Orca/Paus Pembunuh (Orcinus Orca) memiliki variasi yang berbeda di setiap kelasnya. Ada tipe A, B, C, dan D: - Tipe A adalah orca terbesar dan hidup di perairan terbuka, dan memakan paus minke. - Tipe B adalah orca yang berukuran sedikit lebih kecil, agak kelabu, memiliki penutup mata yang besar, dan memakan anjing laut. - Tipe C adalah orca yang terkecil dari jenisnya. Mereka memiliki penutup mata miring, warna keabu-abuan, dan memakan ikan cod Antartika. - Tipe D adalah orca yang paling berbeda secara penampilannya. Memiliki dahi bulat mirip paus pilot, sirip lebih sempit dan runcing, gigi lebih kecil, dan bintik putih lebih kecil di dekat mata. Mereka hidup di perairan yang sangat tidak ramah, yaitu lautan yang bergolak dan dingin di luar lingkaran Antartika. Karena itu, para ahli mengusulkan nama "paus pembunuh subantarctic" sebagai nama umum. 3. Metode K-Nearest Neighbour menurut para pakar: a. Menurut Liantoni, F. (2016), Algoritma K-Nearest Neighbor (KNN) adalah sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut. Data pembelajaran diproyeksikan ke ruang berdimensi banyak, dimana dimensi masing-masing merepresentasikan fitur dari data. b. Menurut Kurniawan, Y.I (2020), K-Nearest Neighbor (KNN) adalah sebuah metode untuk melakukan klasifikasi terhadap objek yang jaraknya paling dekat dengan objek tersebut. Hal ini memudahkan dalam pencarian klasifikasi atau penentuan prediksi dari sebuah variabel. c. Menurut Bicego, M(2016), K-nearest Neighbor (KNN) adalah aturan klasifikasi yang banyak digunakan dan mudah diimplementasikan. KNN menetapkan nilai “x” ke kelas yang paling dekat di antara titik K yang ada. Sehingga dapat menentukan titik manakah yang paling dekat berdasarkan jarak yang telah ditentukan sebelumnya.
Maka dapat disimpulkan, bahwa K-nearest Neighbor (KNN) adalah aturan
klasifikasi terhadap objek/subjek berdasarkan variable yang paling dekat dengan titik K yang ada. Sehingga variable tersebut dapat ditentukan titik yang paling dekat dengan objek/subjek yang akan di klasifikasikan.
4. Proses Klasifikasi K-Nearest Neighbor:
Metode KNN melakukan klasifikasi terhadap objek berdasarkan data objek/subjek yang akan di klasifikasikan dengan cara menetapkan nilai “x” tersebut ke kelas yang paling dekat di antara titik K yang ada. Sehingga dapat menentukan titik manakah yang paling dekat berdasarkan jarak yang telah ditentukan sebelumnya. 5. Berikut adalah hasil dengan caran KNN methods. Hasil bisa dilihat langsung melalui link google colabs yang saya buat: https://colab.research.google.com/drive/1381lyrLTBMc4dloL84MscVm3-C_- Fdwu?usp=sharing Referensi
1. Liantoni, F. (2016). Klasifikasi Daun Dengan Perbaikan Fitur Citra
Menggunakan Metode K-Nearest Neighbor. Ultimatics : Jurnal Teknik Informatika, 7(2), 98-104. https://doi.org/https://doi.org/10.31937/ti.v7i2.356 2. Bicego, M., & Loog, M. (2016, December). Weighted K-nearest neighbor revisited. In 2016 23rd International Conference on Pattern Recognition (ICPR) (pp. 1642-1647). IEEE. 3. Kurniawan, Y. I., & Barokah, T. I. (2020). Klasifikasi Penentuan Pengajuan Kartu Kredit Menggunakan K-Nearest Neighbor. Jurnal Ilmiah Matrik, 22(1), 73-82.