Anda di halaman 1dari 6

AMRI (Analisa, Metode, Rekayasa, Informatika)

Vol. 1, No. 1, April 2022, pp. 16~21


DOI: 10.12487/AMRI.v1i1.xxxxx  16

KLASIFIKASI PASIEN COVID-19 DI INDONESIA


MENGGUNAKAN METODE K-NEAREST NEIGHBOR

Luthfiatul Mustaghfiroh1, Misherinastasia Hesty Ariani2, Bijanto3


1,2,3
Program Studi Informatika, Fakultas Teknik Informatika, Sekolah Tinggi Teknik Pati, Pati 59119

Artikel Info ABSTRAK


Kata kunci: Covid-19 atau singkatan dari Corona Virus Disease 2019 merupakan jenis
virus terbaru yang baru diketahui pada tahun 2019 yang menyebabkan
Covid-19 penyakit menular mulai dari flu biasa hingga penyakit pernapasan yang lebih
K-Nearest Neighbor parah, seperti Middle East Respiratory Syndrome (MERS) dan Severe Acute
Average Respiratory Syndrome (SARS) dan dapat menyebabkan kematian. Pada
Klasifikasi penelitian ini bertujuan untuk meningkatkan akurasi yang sebelumnya
96,67% menjadi lebih tinggi dengan menggunakan algoritma yang berbeda,
pada penelitian terdahulu menggunakan algoritma naïve bayes dan pada
penelitian ini menggunakan algoritma K-Nearest Neighbor (K-NN) dan
metode average untuk mencari data yang hilang. Pada penelitian ini
menggunakan 171 record dengan 4 atribut yaitu gender, age, nationality,
province dan 1 label, dari 171 record terdapat 15 record yang mengalami
missing value sehingga untuk menemukan data yang missing value tersebut
pada penelitian ini menggunakan metode average mendapatkan nilai akurasi
sebesar 97,076% menggunakan perhitungan manual. Maka hasil nilai akurasi
pada algoritma K-Nearest Neighbor berkategori Good Classification.
Sehingga dari penelitian sebelumnya menggunakan algoritma naïve bayes
mendapatkan nilai akurasi sebesar 96,67%, pada penelitian ini terdapat
peningkatan akurasi 0,402%.
Penulis Korespondensi :
Luthfiatul Mustaghfiroh,
Program Studi Informatika
Fakultas Teknik Informatika
Sekolah Tinggi Teknik Pati, Pati 59119
Email : luthfiatulm234@gmail.com

1. PENDAHULUAN
Covid-19 atau singkatan dari Corona Virus Disease 2019 merupakan jenis virus terbaru yang baru
diketahui pada tahun 2019 yang menyebabkan penyakit menular mulai dari flu biasa hingga penyakit
pernapasan yang lebih parah, seperti Middle East Respiratory Syndrome (MERS) dan Severe Acute
Respiratory Syndrome (SARS) dan dapat menyebabkan kematian [1]. World Health Organization (WHO)
memberitahukan kasus baru Pneumonia di kota Wuhan, Hubei, China yang mengidentifikasi jenis baru novel
coronavirus, nama Coronavirus Disease 2019 resmi ditetapkan oleh WHO. Tingkat penyebaran covid-19
lebih luas dibandingkan dengan SARS namun tingkat kematian SARS mencapai 9,6% dibanding tingkat
kematian covid-19 yang masih dibawah 5% [2]. Pandemi Covid-19 telah melanda dunia yang telah
melumpuhkan banyak faktor pendukung kehidupan dalam hal ekonomi, sosial dan keamanan. Akibat dari
pandemi covid -19 tatanan kehidupan dan tantangan akibat krisis kesehatan global ini melanda semua negara
di dunia, termasuk Indonesia [3].
Kasus pertama covid-19 ditemukan di Indonesia pada tanggal 2 Maret 2020 berawal dari kasus
tersebut terjadi penambahan kasus positif covid-19 di setiap harinya, kasus penambahan tiap harinya tidak
dapat diperkirakan jumlahnya sehingga penanganan seperti menyediakan layanan, fasilitas dan tenaga medis
tak dapat terprediksi [6]. Sehingga dari adanya kasus pertama tersebut pemerintah Indonesia telah
mengumumkan jumlah kasus covid-19 yang dikonfirmasi, kasus yang pulih serta kasus kematian setiap
harinya. Saat ini jumlah kasus yang telah terkonfirmasi yaitu 4.286.278 juta orang dengan kasus aktif
sebanyak 18.891 kasus dan dinyatakan sembuh sebanyak 4.123.267 kasus dan 144.220 orang dinyatakan

Journal homepage: http://publikasi.dinus.ac.id/index.php/amri


AMRI (Analisa, Metode, Rekayasa, Informatika), Vol. 1, No. 1, April 2022: 16 - 21  17

meninggal [4]. Angka ini semakin bertambah sejak 2020 dan kembali menurun dengan adanya vaksin.
Kebanyakan orang yang sudah terinfeksi virus covid-19 akan mengalami penyakit pernapasan hingga
memerlukan perawatan. Banyaknya pasien yang berada di rumah sakit dan kapasitas tenaga medis menjadi
permasalahan utama yang dihadapi di berbagai daerah. Pasien dengan tingkat infeksi tinggi memerlukan
prioritas penanganan yang lebih dibandingkan dengan pasien dengan gejala ringan [3]. Tenaga medis
tentunya memerlukan bantuan untuk menangani banyak pasien sekaligus untuk mengklasifikasi status pasien
berdasarkan status pasien secara otomatis untuk mengurangi kelelahan tenaga medis serta meminimalisir
resiko penanganan yang terlambat terhadap pasien [5].
Penelitian sebelumnya menggunakan algoritma naïve bayes dan mendapatkan akurasi 96,67%
dengan menggunakan 156 record dan 4 atribut yaitu jenis kelamin, usia, kewarganegaraan dan provinsi dan 1
label, selain mendapatkan akurasi yang tinggi juga mendapatkan nilai presisi sebesar 92% dan nilai recall
98,72%. Tujuan utama dari penelitian sebelumnya yaitu untuk memprediksi nilai probabilitas dengan
algoritma Naïve Bayes yang digunakan untuk mengklasifikasikan data pasien Covid-19 [3].
Pada penelitian ini bertujuan untuk meningkatkan akurasi yang sebelumnya 96,67% menjadi lebih
tinggi dengan menggunakan algoritma yang berbeda, pada penelitian terdahulu [3] menggunakan algoritma
naïve bayes dan pada penelitian ini menggunakan algoritma K-Nearest Neighbor (K-NN) dan metode
average untuk mencari data yang hilang. Pada penelitian ini menggunakan 171 record dengan 4 atribut yaitu
gender, age, nationality, province dan 1 label, dari 171 record terdapat 15 record yang mengalami missing
value sehingga untuk menemukan data yang missing value tersebut pada penelitian ini menggunakan metode
average. Pada penelitian sebelumnya menggunakan 156 record dengan 4 atribut dan 1 label. Penelitian ini
bertujuan untuk memberikan solusi untuk mengklasifikasikan status pasien covid-19 secara otomatis
berdasarkan gejala yang dialami oleh pasien. Klasifikasi yang dilakukan menggunakan algoritma utama K-
Nearest Neighbor (KNN) dan metode penunjang yaitu metode average untuk menaikkan akurasi pada
penelitian ini dan untuk memperbaiki missing value.

2. METODE
Penelitian ini meningkatkan akurasi dari penelitian terdahulu menggunakan algoritma K-Nearest
Neighbor (KNN) dan metode average. Metode yang digunakan dalam penelitian ini dimulai dengan: Studi
Literatur, Pengumpulan Dataset, Metode yang Diusulkan, Perhitungan dan Validasi Hasil. Penjelasan setiap
langkah akan dijelaskan sebagai berikut:
2.1. Studi Literatur
Pada bagian ini akan dijelaskan mengenai studi literatur dan metode apa saja yang akan digunakan
pada penelitian ini. Metode yang digunakan yaitu K-Nearest Neighbor (K-NN) dan metode average. K-
Nearest Neighbor (K-NN) merupakan salah satu algoritma untuk klasifikasi data pada suatu objek
berdasarkan sejumlah K data training yang memiliki jarak paling dekat atau tetangga terdekat dengan objek
tersebut [9]. K-NN digunakan untuk mengklasifikasikan objek baru berdasarkan atribut dan sampel data
training [10-11], berikut rumus algoritma K-NN : (a) Kedekatan biasanya ada di nilai 0-1, (b) 0 mempunyai
arti kasus sangat tidak mirip, sedangkan untuk 1 berarti kasus sangat mirip.

√∑𝑛𝑖=1 𝑓(𝑇1 − 𝑆𝑖 )𝑥𝑤𝑖


𝑠𝑖𝑚𝑖𝑙𝑎𝑟𝑖𝑡𝑦(𝑇, 𝑆) =
𝑊𝑡

dengan penjelasan sebagai berikut:


T = Data yang akan diprediksi,
S = Data yang sudah ada,
n = jumlah atribut dari masing – masing kasus,
i = atribut individu antara 1 – n,
f = fungsi similarity atribut i antara kasus T dan kasus S,
w = bobot yang diberikan kepada atribut ke-i

Berikut tahapan – tahapan pada algoritma K-NN [9] :


a. Menentukan nilai dari parameter k (jumlah tetangga paling dekat) terlebih dahulu.
b. Melakukan perhitungan Euclidian distance pada suatu objek terhadap data training yang diberikan.
c. Melakukan pengurutan terhadap hasil pada langkah b dari yang tertinggi sampai yang terendah.
d. Melakukan pengumpulan terhadap kategori Y (Klasifikasi Nearest Neighbor dari suatu objek berdasarkan
nilai k).
e. Membuat keputusan nearest neighbor dari suatu objek dengan cara mengambil hasil nilai yang
terbanyak/sering muncul objek tersebut.

Klasifikasi Pasien Covid-19 di Indonesia (Luthfiatul Mustaghfiroh)


18  ISSN: 1693-6930

Metode Single Moving Average adalah suatu metode prediksi yang dilakukan dengan mengambil
sekelompok nilai pengamatan, mencari nilai rata-rata tersebut sebagai prediksi untuk periode yang akan
datang, adapun karakteristik khusus dari metode ini yaitu: (a) untuk menentukan prediksi pada periode yang
akan datang memerlukan data historis selama jangka waktu tertentu. (b) semakin panjang jangka waktu
moving average, efek pelicinan akan semakin halus. Adapun rumus dari metode prediksi ini yaitu sebagai
berikut.

𝑌𝑡 + 𝑌𝑡 − 1 + 𝑌𝑡 − 2 + ⋯ 𝑌𝑡 − 𝑛 + 1
𝐹𝑡 + 1 =
𝑁

dimana :
Ft +1 = nilai prediksi periode t+1
Yt = data aktual periode t
Adapun langkah – langkah perhitungan prediksi menggunakan metode Single Moving Average
sebagai berikut:
1. Pengumpulan data yang akan dijadikan data perhitungan pada metode Single Moving Average.
2. Menentukan hasil pengolahan data historis menggunakan metode Single Moving Average.
3. Menghitung error dari hasil prediksi.
4. Hasil akhir diperoleh setelah melalui proses perhitungan prediksi dan perhitungan error dari hasil error
dapat dilihat apakah hasil prediksi bisa dipakai atau tidak.

2.2. Pengumpulan Dataset


Dataset berupa data publik diperoleh melalui website Kaggle [14]. Dataset ini yang nantinya akan
diolah dan dilatih untuk menghasilkan prediksi status pasien. Data yang telah diambil mengalami missing
value yaitu terdapat beberapa data yang hilang atau kosong, sehingga sebelum benar – benar diolah data akan
diolah menggunakan algoritma K-Nearest Neighbor (K-NN) untuk memperbaiki data yang hilang tersebut.

Tabel 1. Dataset yang belum diolah


Gender Age Nationality Province Current_state
Female 31 Indonesia DKI Jakarta Released
Female 64 Indonesia DKI Jakarta Released
Female 33 Indonesia DKI Jakarta Released
Female 34 Indonesia DKI Jakarta Isolated
Male 55 Indonesia DKI Jakarta Isolated
Male 36 Indonesia DKI Jakarta Released
Female 54 Indonesia DKI Jakarta Released
Male 55 Indonesia DKI Jakarta Released
Female 55 Indonesia DKI Jakarta Released
Male 29 Foreigner DKI Jakarta Isolated

Dalam penelitian ini menggunakan record dengan jumlah 4 atribut yaitu jenis kelamin, usia,
kewarganegaraan, provinsi dan 1 label yaitu keadaan saat ini dan ditampilkan pada tabel 1.

Tabel 2. Dataset yang sudah dikonversi dalam bentuk numeric


Gender Age Nationality Province Current_State
2 31 1 1 1
2 64 1 1 1
2 33 1 1 1
2 34 1 1 2
1 55 1 1 2
1 36 1 1 1
2 54 1 1 1
1 55 1 1 1
2 55 1 1 1
1 29 2 1 2

Pada tabel 2 adalah hasil dataset yang sudah dikonversi menjadi numeric, dimana ada gender angka
1 menandakan male dan angka 2 mempunyai arti female, pada nationality angka 1 untuk kewarganegaraan
Indonesia dan 2 untuk Warga Negara Asing, untuk provinsi terdapat 10 jenis yang berbeda yaitu angka 1
untuk DKI Jakarta, 2 untuk Banten, 3 untuk Jawa Barat, 4 untuk Bali, 5 untuk Yogyakarta, 6 untuk Jawa
Tengah, 7 untuk Kepulauan Riau, 8 untuk Jawa Timur, 9 untuk Kalimantan Barat dan 10 untuk Sulawesi
Utara, pada label terdapat 1 label dengan 3 kondisi yaitu 1 untuk pasien yang sembuh, 2 untuk pasien yang
diisolasi dan 3 untuk pasien yang meninggal.

AMRI (Analisa, Metode, Rekayasa, Informatika), Vol. 1, No. 1, April 2022: 16 - 21


AMRI (Analisa, Metode, Rekayasa, Informatika), Vol. 1, No. 1, April 2022: 16 - 21  19

2.3. Metode yang Diusulkan


Pada penelitian ini menggunakan algoritma K-Nearest Neighbor (K-NN) dan metode average yang
merupakan turunan dari algoritma K-NN. Alur penelitian secara umum yang dilakukan pada penelitian ini
adalah sebagai berikut:
1. Studi Pustaka
Di tahap awal dalam pengerjaan penelitian ini, peneliti mengumpulkan informasi tentang Covid-19 serta
metode yang tepat untuk pembuatan model. Pengumpulan informasi dilakukan baik dari jurnal, buku,
serta dari web terkait.
2. Pencarian Data
Tahap selanjutnya peneliti mencari data Covid-19 yaitu data tentang penambahan jumlah pasien di
Indonesia per harinya.
3. Pengamatan Metode
Setelah data diperoleh, tahapan selanjutnya yaitu mempelajari metode yang dapat digunakan untuk
membuat model dan melakukan klasifikasi. Pada tahap ini juga diamati pengembangan algoritma utama
K-Nearest Neighbor (K-NN).
4. Mengimplementasikan Sistem
Pada tahap terakhir dilakukan pengimplementasian dengan mengaplikasikan metode K-NN dan metode
Distance Weighted K-NN pada data Covid-19 untuk memperoleh model klasifikasi kasus Covid-19 di
Indonesia. Alur Penelitian secara umum dapat dibuat pada Gambar 1.

Gambar 1. Alur Penelitian Secara Umum

Metode analisa data pada penelitian ini menggunakan algoritma K-Nearest Neighbor (K-NN) dan
Distance Weighted K-NN (DWK-NN). Diagram alir metode K-Nearest Neighbor (K-NN) dapat dilihat
dalam gambar 1.

2.4 Perhitungan Missing Value, Akurasi dan Klasifikasi Error


Dari 171 record 15 diantaranya mengalami missing value sehingga untuk menemukan data yang
hilang tersebut pada penelitian ini menggunakan metode missing value sehingga hasilnya sebagai berikut.

𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑎𝑡𝑎 221


Gender : = = 1,416
𝑏𝑎𝑛𝑦𝑎𝑘 𝑑𝑎𝑡𝑎 156

𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑎𝑡𝑎 7505


Age : 𝑏𝑎𝑛𝑦𝑎𝑘 𝑑𝑎𝑡𝑎 = = 48,108
156

𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑎𝑡𝑎 165


Nationality : 𝑏𝑎𝑛𝑦𝑎𝑘 𝑑𝑎𝑡𝑎 = 156 = 1,057

𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑎𝑡𝑎 287


Province :𝑏𝑎𝑛𝑦𝑎𝑘 𝑑𝑎𝑡𝑎 = 156 = 1,839

Klasifikasi Pasien Covid-19 di Indonesia (Luthfiatul Mustaghfiroh)


20  ISSN: 1693-6930

𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑎𝑡𝑎 339


Current_state : = 166 = 2,042
𝑏𝑎𝑛𝑦𝑎𝑘 𝑑𝑎𝑡𝑎

Untuk perhitungan akurasi mendapatkan 97,076% dengan menggunakan algoritma K-Nearest


Neighbor (K-NN) dan menggunakan aplikasi mendapatkan akurasi 94,12% berikut adalah perhitungan
akurasi secara manual.

𝑗𝑢𝑚𝑙𝑎ℎ 𝑝𝑟𝑒𝑑𝑖𝑘𝑠𝑖 𝑏𝑒𝑛𝑎𝑟 166


x100% = 171 = 97,076%
𝑗𝑢𝑚𝑙𝑎ℎ 𝑠𝑒𝑚𝑢𝑎 𝑝𝑟𝑒𝑑𝑖𝑘𝑠𝑖

Serta perhitungan klasifikasi error mendapatkan 5,847% berikut perhitungannya.

𝑗𝑢𝑚𝑙𝑎ℎ 𝑚𝑖𝑠𝑠𝑖𝑛𝑔 𝑝𝑎𝑑𝑎 𝑙𝑎𝑏𝑒𝑙 10


x100% = 171 = 5,847%
𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑎𝑡𝑎

3. PEMBAHASAN HASIL
Dataset yang digunakan didapatkan dari data pasien Indonesia-Coronavirus yang tersedia di website
Kaggle. Atribut yang terdapat dalam kumpulan data pasien adalah gender, age, nationality, province. Status
pasien ada tiga yaitu isolated, realeased dan deceased. Isolated mempunyai arti pasien yang dinyatakan
isolasi, released mempunyai arti pasien dinyatakan sembuh dan deceased mempunyai arti pasien dinyatakan
meninggal. Tujuan penelitian yaitu untuk memberikan solusi untuk mengklasifikasikan status pasien covid-
19 secara otomatis berdasarkan gejala yang dialami oleh pasien dengan menggunakan algoritma K-Nearest
Neighbor (K-NN) dan metode Single Moving Average untuk mencari data missing value.
Pada perhitungan manual yang telah dipaparkan mendapatkan 97,076% dan klasifikasi error
5,847%, sedangkan menggunakan aplikasi pengukur klasifikasi mendapatkan hasil akurasi sebesar 94,12%,
recall 94,12% dan precision sebesar 100%. Nilai precision menunjukkan seberapa tepat prediksi dalam
mengenali data sesuai kelas aslinya, sedangkan nilai recall menunjukkan kemampuan performa keseluruhan
dari model yang dibangun. Dalam penelitian ini memiliki nilai recall 94,12%, precision dan recall bersama-
sama digunakan untuk menunjukan seberapa baik prediksi suatu model pengklasifikasi.

4. KESIMPULAN
Berdasarkan penelitian yang telah dilakukan maka dapat ditarik kesimpulan bahwa algoritma K-
Nearest Neighbor (K-NN) dapat memprediksi pasien yang mengidap covid-19 mendapatkan nilai akurasi
sebesar 97,076% menggunakan perhitungan manual. Maka hasil nilai akurasi pada algoritma K-Nearest
Neighbor berkategori Good Classification. Sehingga dari penelitian sebelumnya menggunakan algoritma
naïve bayes mendapatkan nilai akurasi sebesar 96,67%, pada penelitian ini terdapat peningkatan akurasi
0,402%. Pada penelitian selanjutnya peneliti memberikan saran yaitu menambah algoritma yang berguna
untuk menambah atau meningkatkan hasil akurasi.

REFERENCES

[1] A. Puji, “Coronavirus” [online] Available: www.hellosehat.com


[2] E Tim Kerja Kementerian Dalam Negeri, D. S. “Pedoman Umum Menghadapi Pandemi Covid-19 bagi
Pemerintah Daerah” Jakarta, Indonesia: Kementerian Dalam Negeri RI 2020, [Online] Available.
[3] Liliana, D. Y., Maulana, H., & Setiawan, A. (2021). Data Mining untuk Prediksi Status Pasien Covid-19
dengan Pengklasifikasi Naïve Bayes. MULTINETICS, 7(1), 48-53.
[4] “Peta Sebaran” [Online] Availabel: “www.covid19.go.id”
[5] L. K. Kumar and P. J. A. Alphonse, “Automatic Diagnosis of COVID-19 Disease using Deep
Convolutional Neural Network with Multi-Feature Channel from Respiratory Sound Data : Cough,
Voice, and Breath Reference : To appear in : Received Date : Revised Date : Accepted Date : Abstract
:,” Alexandria Eng. J., 2021, doi: 10.1016/j.aej.2021.06.024.
[6] Arianto, F. S. D., & Noviyanti, P. (2020). Prediksi Kasus Covid-19 Di Indonesia Menggunakan Metode
Backpropagation Dan Fuzzy Tsukamoto. JurTI (Jurnal Teknologi Informasi), 4(1), 120-127.
[7] Yuliska, Y., & Syaliman, K. U. (2020). Peningkatan Akurasi K-Nearest Neighbor Pada Data Index
Standar Pencemaran Udara Kota Pekanbaru. IT Journal Research and Development, 5(1), 11-18.
[8] Syaliman, K. U. (2018). Peningkatan Akurasi pada Metode Klasifikasi K-Nearest Neighbor
Menggunakan Local Mean Based dan Distance Weight K-Nearest Neighbor.

AMRI (Analisa, Metode, Rekayasa, Informatika), Vol. 1, No. 1, April 2022: 16 - 21


AMRI (Analisa, Metode, Rekayasa, Informatika), Vol. 1, No. 1, April 2022: 16 - 21  21

[9] Darmayanti, I., Subarkah, P., Anunggilarso, L. R., & Suhaman, J. (2021). Prediksi Potensi Siswa Putus
Sekolah Akibat Pandemi Covid-19 Menggunakan Algoritme K-Nearest Neighbor. JST (Jurnal Sains
dan Teknologi), 10(2), 230-238.
[10] Wang, B., & Mao, Z. (2020). A dynamic ensemble outlier detection model based on an adaptive k-
nearest neighbor rule. Information Fusion, 63(May), 30–40. https://doi.org/10.1016/j.inffus.2020.05.
001
[11] Hardianti, W., Indriani, F., & Nugroho, R. A. (2018). ANALISIS PERBANDINGAN ALGORITMA
DISTANCE-WEIGHTED KNN DAN ALGORITMA KNN PADA PREDIKSI MASA STUDI
MAHASISWA. Soliter, 1, 108-117.
[12] Lidya, S.K., Sitompul, O.S. & Efendi, S. 2015. Sentiment Analysis Pada Teks Bahasa Indonesia
Menggunakan Support Vector Machine (SVM) Dan K-Nearest Neighbor (K-NN). Seminar Nasional
Teknologi Informasi dan Komunikasi 2015, pp. 1-8
[13] Gou, J. & Xiong, T. 2011. A Novel Weighted Voting for K-Nearest Neighbor Rule. Journal of
Computer 6(5): 833-840
[14] “Kaggle” [Online]. Availabe: www.kaggel.com
[15] Naufal Hay’s, R., & Adrean, R. (2017). Sistem Informasi Inventory Berdasarkan Prediksi Data
Penjualan Barang Menggunakan Metode Single Moving Average Pada CV. Agung Youanda.
ProTekInfo (Pengembangan Riset dan Observasi Teknik Informatika), 4, 29-33.

Klasifikasi Pasien Covid-19 di Indonesia (Luthfiatul Mustaghfiroh)

Anda mungkin juga menyukai