1. PENDAHULUAN
Covid-19 atau singkatan dari Corona Virus Disease 2019 merupakan jenis virus terbaru yang baru
diketahui pada tahun 2019 yang menyebabkan penyakit menular mulai dari flu biasa hingga penyakit
pernapasan yang lebih parah, seperti Middle East Respiratory Syndrome (MERS) dan Severe Acute
Respiratory Syndrome (SARS) dan dapat menyebabkan kematian [1]. World Health Organization (WHO)
memberitahukan kasus baru Pneumonia di kota Wuhan, Hubei, China yang mengidentifikasi jenis baru novel
coronavirus, nama Coronavirus Disease 2019 resmi ditetapkan oleh WHO. Tingkat penyebaran covid-19
lebih luas dibandingkan dengan SARS namun tingkat kematian SARS mencapai 9,6% dibanding tingkat
kematian covid-19 yang masih dibawah 5% [2]. Pandemi Covid-19 telah melanda dunia yang telah
melumpuhkan banyak faktor pendukung kehidupan dalam hal ekonomi, sosial dan keamanan. Akibat dari
pandemi covid -19 tatanan kehidupan dan tantangan akibat krisis kesehatan global ini melanda semua negara
di dunia, termasuk Indonesia [3].
Kasus pertama covid-19 ditemukan di Indonesia pada tanggal 2 Maret 2020 berawal dari kasus
tersebut terjadi penambahan kasus positif covid-19 di setiap harinya, kasus penambahan tiap harinya tidak
dapat diperkirakan jumlahnya sehingga penanganan seperti menyediakan layanan, fasilitas dan tenaga medis
tak dapat terprediksi [6]. Sehingga dari adanya kasus pertama tersebut pemerintah Indonesia telah
mengumumkan jumlah kasus covid-19 yang dikonfirmasi, kasus yang pulih serta kasus kematian setiap
harinya. Saat ini jumlah kasus yang telah terkonfirmasi yaitu 4.286.278 juta orang dengan kasus aktif
sebanyak 18.891 kasus dan dinyatakan sembuh sebanyak 4.123.267 kasus dan 144.220 orang dinyatakan
meninggal [4]. Angka ini semakin bertambah sejak 2020 dan kembali menurun dengan adanya vaksin.
Kebanyakan orang yang sudah terinfeksi virus covid-19 akan mengalami penyakit pernapasan hingga
memerlukan perawatan. Banyaknya pasien yang berada di rumah sakit dan kapasitas tenaga medis menjadi
permasalahan utama yang dihadapi di berbagai daerah. Pasien dengan tingkat infeksi tinggi memerlukan
prioritas penanganan yang lebih dibandingkan dengan pasien dengan gejala ringan [3]. Tenaga medis
tentunya memerlukan bantuan untuk menangani banyak pasien sekaligus untuk mengklasifikasi status pasien
berdasarkan status pasien secara otomatis untuk mengurangi kelelahan tenaga medis serta meminimalisir
resiko penanganan yang terlambat terhadap pasien [5].
Penelitian sebelumnya menggunakan algoritma naïve bayes dan mendapatkan akurasi 96,67%
dengan menggunakan 156 record dan 4 atribut yaitu jenis kelamin, usia, kewarganegaraan dan provinsi dan 1
label, selain mendapatkan akurasi yang tinggi juga mendapatkan nilai presisi sebesar 92% dan nilai recall
98,72%. Tujuan utama dari penelitian sebelumnya yaitu untuk memprediksi nilai probabilitas dengan
algoritma Naïve Bayes yang digunakan untuk mengklasifikasikan data pasien Covid-19 [3].
Pada penelitian ini bertujuan untuk meningkatkan akurasi yang sebelumnya 96,67% menjadi lebih
tinggi dengan menggunakan algoritma yang berbeda, pada penelitian terdahulu [3] menggunakan algoritma
naïve bayes dan pada penelitian ini menggunakan algoritma K-Nearest Neighbor (K-NN) dan metode
average untuk mencari data yang hilang. Pada penelitian ini menggunakan 171 record dengan 4 atribut yaitu
gender, age, nationality, province dan 1 label, dari 171 record terdapat 15 record yang mengalami missing
value sehingga untuk menemukan data yang missing value tersebut pada penelitian ini menggunakan metode
average. Pada penelitian sebelumnya menggunakan 156 record dengan 4 atribut dan 1 label. Penelitian ini
bertujuan untuk memberikan solusi untuk mengklasifikasikan status pasien covid-19 secara otomatis
berdasarkan gejala yang dialami oleh pasien. Klasifikasi yang dilakukan menggunakan algoritma utama K-
Nearest Neighbor (KNN) dan metode penunjang yaitu metode average untuk menaikkan akurasi pada
penelitian ini dan untuk memperbaiki missing value.
2. METODE
Penelitian ini meningkatkan akurasi dari penelitian terdahulu menggunakan algoritma K-Nearest
Neighbor (KNN) dan metode average. Metode yang digunakan dalam penelitian ini dimulai dengan: Studi
Literatur, Pengumpulan Dataset, Metode yang Diusulkan, Perhitungan dan Validasi Hasil. Penjelasan setiap
langkah akan dijelaskan sebagai berikut:
2.1. Studi Literatur
Pada bagian ini akan dijelaskan mengenai studi literatur dan metode apa saja yang akan digunakan
pada penelitian ini. Metode yang digunakan yaitu K-Nearest Neighbor (K-NN) dan metode average. K-
Nearest Neighbor (K-NN) merupakan salah satu algoritma untuk klasifikasi data pada suatu objek
berdasarkan sejumlah K data training yang memiliki jarak paling dekat atau tetangga terdekat dengan objek
tersebut [9]. K-NN digunakan untuk mengklasifikasikan objek baru berdasarkan atribut dan sampel data
training [10-11], berikut rumus algoritma K-NN : (a) Kedekatan biasanya ada di nilai 0-1, (b) 0 mempunyai
arti kasus sangat tidak mirip, sedangkan untuk 1 berarti kasus sangat mirip.
Metode Single Moving Average adalah suatu metode prediksi yang dilakukan dengan mengambil
sekelompok nilai pengamatan, mencari nilai rata-rata tersebut sebagai prediksi untuk periode yang akan
datang, adapun karakteristik khusus dari metode ini yaitu: (a) untuk menentukan prediksi pada periode yang
akan datang memerlukan data historis selama jangka waktu tertentu. (b) semakin panjang jangka waktu
moving average, efek pelicinan akan semakin halus. Adapun rumus dari metode prediksi ini yaitu sebagai
berikut.
𝑌𝑡 + 𝑌𝑡 − 1 + 𝑌𝑡 − 2 + ⋯ 𝑌𝑡 − 𝑛 + 1
𝐹𝑡 + 1 =
𝑁
dimana :
Ft +1 = nilai prediksi periode t+1
Yt = data aktual periode t
Adapun langkah – langkah perhitungan prediksi menggunakan metode Single Moving Average
sebagai berikut:
1. Pengumpulan data yang akan dijadikan data perhitungan pada metode Single Moving Average.
2. Menentukan hasil pengolahan data historis menggunakan metode Single Moving Average.
3. Menghitung error dari hasil prediksi.
4. Hasil akhir diperoleh setelah melalui proses perhitungan prediksi dan perhitungan error dari hasil error
dapat dilihat apakah hasil prediksi bisa dipakai atau tidak.
Dalam penelitian ini menggunakan record dengan jumlah 4 atribut yaitu jenis kelamin, usia,
kewarganegaraan, provinsi dan 1 label yaitu keadaan saat ini dan ditampilkan pada tabel 1.
Pada tabel 2 adalah hasil dataset yang sudah dikonversi menjadi numeric, dimana ada gender angka
1 menandakan male dan angka 2 mempunyai arti female, pada nationality angka 1 untuk kewarganegaraan
Indonesia dan 2 untuk Warga Negara Asing, untuk provinsi terdapat 10 jenis yang berbeda yaitu angka 1
untuk DKI Jakarta, 2 untuk Banten, 3 untuk Jawa Barat, 4 untuk Bali, 5 untuk Yogyakarta, 6 untuk Jawa
Tengah, 7 untuk Kepulauan Riau, 8 untuk Jawa Timur, 9 untuk Kalimantan Barat dan 10 untuk Sulawesi
Utara, pada label terdapat 1 label dengan 3 kondisi yaitu 1 untuk pasien yang sembuh, 2 untuk pasien yang
diisolasi dan 3 untuk pasien yang meninggal.
Metode analisa data pada penelitian ini menggunakan algoritma K-Nearest Neighbor (K-NN) dan
Distance Weighted K-NN (DWK-NN). Diagram alir metode K-Nearest Neighbor (K-NN) dapat dilihat
dalam gambar 1.
3. PEMBAHASAN HASIL
Dataset yang digunakan didapatkan dari data pasien Indonesia-Coronavirus yang tersedia di website
Kaggle. Atribut yang terdapat dalam kumpulan data pasien adalah gender, age, nationality, province. Status
pasien ada tiga yaitu isolated, realeased dan deceased. Isolated mempunyai arti pasien yang dinyatakan
isolasi, released mempunyai arti pasien dinyatakan sembuh dan deceased mempunyai arti pasien dinyatakan
meninggal. Tujuan penelitian yaitu untuk memberikan solusi untuk mengklasifikasikan status pasien covid-
19 secara otomatis berdasarkan gejala yang dialami oleh pasien dengan menggunakan algoritma K-Nearest
Neighbor (K-NN) dan metode Single Moving Average untuk mencari data missing value.
Pada perhitungan manual yang telah dipaparkan mendapatkan 97,076% dan klasifikasi error
5,847%, sedangkan menggunakan aplikasi pengukur klasifikasi mendapatkan hasil akurasi sebesar 94,12%,
recall 94,12% dan precision sebesar 100%. Nilai precision menunjukkan seberapa tepat prediksi dalam
mengenali data sesuai kelas aslinya, sedangkan nilai recall menunjukkan kemampuan performa keseluruhan
dari model yang dibangun. Dalam penelitian ini memiliki nilai recall 94,12%, precision dan recall bersama-
sama digunakan untuk menunjukan seberapa baik prediksi suatu model pengklasifikasi.
4. KESIMPULAN
Berdasarkan penelitian yang telah dilakukan maka dapat ditarik kesimpulan bahwa algoritma K-
Nearest Neighbor (K-NN) dapat memprediksi pasien yang mengidap covid-19 mendapatkan nilai akurasi
sebesar 97,076% menggunakan perhitungan manual. Maka hasil nilai akurasi pada algoritma K-Nearest
Neighbor berkategori Good Classification. Sehingga dari penelitian sebelumnya menggunakan algoritma
naïve bayes mendapatkan nilai akurasi sebesar 96,67%, pada penelitian ini terdapat peningkatan akurasi
0,402%. Pada penelitian selanjutnya peneliti memberikan saran yaitu menambah algoritma yang berguna
untuk menambah atau meningkatkan hasil akurasi.
REFERENCES
[9] Darmayanti, I., Subarkah, P., Anunggilarso, L. R., & Suhaman, J. (2021). Prediksi Potensi Siswa Putus
Sekolah Akibat Pandemi Covid-19 Menggunakan Algoritme K-Nearest Neighbor. JST (Jurnal Sains
dan Teknologi), 10(2), 230-238.
[10] Wang, B., & Mao, Z. (2020). A dynamic ensemble outlier detection model based on an adaptive k-
nearest neighbor rule. Information Fusion, 63(May), 30–40. https://doi.org/10.1016/j.inffus.2020.05.
001
[11] Hardianti, W., Indriani, F., & Nugroho, R. A. (2018). ANALISIS PERBANDINGAN ALGORITMA
DISTANCE-WEIGHTED KNN DAN ALGORITMA KNN PADA PREDIKSI MASA STUDI
MAHASISWA. Soliter, 1, 108-117.
[12] Lidya, S.K., Sitompul, O.S. & Efendi, S. 2015. Sentiment Analysis Pada Teks Bahasa Indonesia
Menggunakan Support Vector Machine (SVM) Dan K-Nearest Neighbor (K-NN). Seminar Nasional
Teknologi Informasi dan Komunikasi 2015, pp. 1-8
[13] Gou, J. & Xiong, T. 2011. A Novel Weighted Voting for K-Nearest Neighbor Rule. Journal of
Computer 6(5): 833-840
[14] “Kaggle” [Online]. Availabe: www.kaggel.com
[15] Naufal Hay’s, R., & Adrean, R. (2017). Sistem Informasi Inventory Berdasarkan Prediksi Data
Penjualan Barang Menggunakan Metode Single Moving Average Pada CV. Agung Youanda.
ProTekInfo (Pengembangan Riset dan Observasi Teknik Informatika), 4, 29-33.