No Judul Penulis Objek Metode Masalah Langkah Penelitian Hasil Penelitian
Penelitian 1 Sistem Simanjuntak, Jurnal K-Nearest Banyaknya 1. Pre-Processing Penelitian ini Information M., & berbahasa Neighbor dokumen - Tokenizing menghasilkan Retrieval Panjaitan, J. inggris di dengan akademik di - Stemming tingkat Menggunakan (2021) berbagai Cosine berbagai bidang (menggunakan keberhasilan f- K-Nearest kategori seperti Similarity menyebabkan algoritma measures sebesar Neighbour Matematika, dan TF-IDF banyak potter) 0.5193 dengan dalam Ilmu mahasiswa - Stopword nilai k=41. Klasifikasi Kesehatan, merasa sulit Removal Didapatkan hasil Jurnal Bahasa Teknologi, Ilmu untuk memilah - Pattern bahwa 30 Inggris Sosial dan dan menentukan Discovery dokumen testing Humaniora, dan dokumen mana 2. Mengolah yang digunakan Ilmu Fisika. yang dapat dokumen menjadi terklasifikasi digunakan bentuk vector dan sesuai dengan Dokumen yang sebagai study melakukan kategori digunakan literature. perbandingan sebenarnya. berjumlah 150 Sehingga antara vector data yang dibutuhkan dokumen Namun, pada terdiri dari 40 sistem menggunakan beberapa kasus data training information Cosine Similarity terjadi kesalahan dan 30 data retrieval yang untuk dikarenakan testing. mampu mendapatkan nilai jumlah token mengelompokkan similaritas suatu pada data training jurnal. jurnal mempengaruhi 3. Melakukan sorting nilai cosine dari nilai similarity. similaritas berdasarkan nilai terbesar hingga terkecil lalu dilakukan klasifikasi dengan algoritma K-NN 2 Penerapan Hendriyanto, Data judul K-Nearest Saat ini 1. Pre-Processing Implementasi Algoritma K- M. D., & Sari, berita fakta dari Neighbor peredaran berita - Cleaning algoritma K-NN Nearest B. N. (2022)) situs detikcom dengan TF- hoax meluas - Case Folding dalam penelitian Neighbor dan IDF dan dengan sangat - Tokenizing ini menghasilkan dalam cnnindonesia Confusion cepat dan sulit - Stopword hasil yang sangat Klasifikasi dan judul berita Matrix untuk Removal baik dengan Judul Berita hoax dari situs ditanggulangi. - Stemiing akurasi tertinggi Hoax turnbackhoax. Oleh karena itu 2. Transformation sebesar 93.33%, Data yang perlu adanya Memboboti setiap precision sebesar diambil pengelompokan kata dengan TF- 100%, recall merupakan data antara berita hoax IDF sebesar 80%, dan pada tanggal 24 dan fakta. 3. Data Mining F1-Score sebesar November Melakukan 88.89% sehingga 2021-22 Januari klasifikasi dengan dapat dikatakan 2022. Algoritma K-NN. bahwa algoritma Menggunakan K-NN cocok Data berjumlah nilai k yang telah untuk 75 judul berita ditentukan dan mengklasifikasi fakta dan 75 dilakukan split judul berita hoax. judul berita data. hoax. Pada data 4. Evaluation Selain itu dapat terdapat 4 Menerapkan diketahui bahwa atribut yaitu Confusion Matrix penggunaan tanggal, judul, berupa hasil skenario 1 sumber dan dengan nilai (90:10), skenario label, tetapi accuracy, 2 (80:20), dan hanya atribut precision, recall, skenario 3 judul dan label dan F1-Score. (70:30) ternyata yang mempengaruhi digunakan. hasil akurasi.