Anda di halaman 1dari 2

STATE OF THE ART

No Judul Penulis Objek Metode Masalah Langkah Penelitian Hasil Penelitian


Penelitian
1 Sistem Simanjuntak, Jurnal K-Nearest Banyaknya 1. Pre-Processing Penelitian ini
Information M., & berbahasa Neighbor dokumen - Tokenizing menghasilkan
Retrieval Panjaitan, J. inggris di dengan akademik di - Stemming tingkat
Menggunakan (2021) berbagai Cosine berbagai bidang (menggunakan keberhasilan f-
K-Nearest kategori seperti Similarity menyebabkan algoritma measures sebesar
Neighbour Matematika, dan TF-IDF banyak potter) 0.5193 dengan
dalam Ilmu mahasiswa - Stopword nilai k=41.
Klasifikasi Kesehatan, merasa sulit Removal Didapatkan hasil
Jurnal Bahasa Teknologi, Ilmu untuk memilah - Pattern bahwa 30
Inggris Sosial dan dan menentukan Discovery dokumen testing
Humaniora, dan dokumen mana 2. Mengolah yang digunakan
Ilmu Fisika. yang dapat dokumen menjadi terklasifikasi
digunakan bentuk vector dan sesuai dengan
Dokumen yang sebagai study melakukan kategori
digunakan literature. perbandingan sebenarnya.
berjumlah 150 Sehingga antara vector
data yang dibutuhkan dokumen Namun, pada
terdiri dari 40 sistem menggunakan beberapa kasus
data training information Cosine Similarity terjadi kesalahan
dan 30 data retrieval yang untuk dikarenakan
testing. mampu mendapatkan nilai jumlah token
mengelompokkan similaritas suatu pada data training
jurnal. jurnal mempengaruhi
3. Melakukan sorting nilai cosine
dari nilai similarity.
similaritas
berdasarkan nilai
terbesar hingga
terkecil lalu
dilakukan
klasifikasi dengan
algoritma K-NN
2 Penerapan Hendriyanto, Data judul K-Nearest Saat ini 1. Pre-Processing Implementasi
Algoritma K- M. D., & Sari, berita fakta dari Neighbor peredaran berita - Cleaning algoritma K-NN
Nearest B. N. (2022)) situs detikcom dengan TF- hoax meluas - Case Folding dalam penelitian
Neighbor dan IDF dan dengan sangat - Tokenizing ini menghasilkan
dalam cnnindonesia Confusion cepat dan sulit - Stopword hasil yang sangat
Klasifikasi dan judul berita Matrix untuk Removal baik dengan
Judul Berita hoax dari situs ditanggulangi. - Stemiing akurasi tertinggi
Hoax turnbackhoax. Oleh karena itu 2. Transformation sebesar 93.33%,
Data yang perlu adanya Memboboti setiap precision sebesar
diambil pengelompokan kata dengan TF- 100%, recall
merupakan data antara berita hoax IDF sebesar 80%, dan
pada tanggal 24 dan fakta. 3. Data Mining F1-Score sebesar
November Melakukan 88.89% sehingga
2021-22 Januari klasifikasi dengan dapat dikatakan
2022. Algoritma K-NN. bahwa algoritma
Menggunakan K-NN cocok
Data berjumlah nilai k yang telah untuk
75 judul berita ditentukan dan mengklasifikasi
fakta dan 75 dilakukan split judul berita hoax.
judul berita data.
hoax. Pada data 4. Evaluation Selain itu dapat
terdapat 4 Menerapkan diketahui bahwa
atribut yaitu Confusion Matrix penggunaan
tanggal, judul, berupa hasil skenario 1
sumber dan dengan nilai (90:10), skenario
label, tetapi accuracy, 2 (80:20), dan
hanya atribut precision, recall, skenario 3
judul dan label dan F1-Score. (70:30) ternyata
yang mempengaruhi
digunakan. hasil akurasi.

Anda mungkin juga menyukai