Abstrak
Corona Virus 2019 atau yang sering disebut COVID-19 merupakan penyakit menular oleh sindrom
pernafasan akut parah SARSCoV-2. Angka kasus COVID–19 di Indonesia tiap harinya terus
mengalami peningkatan. Berdasarkan data per 24 Mei 2021 dari World Health Organization, total
kumulatif kasus di Indonesia adalah 1.781.127 kasus, menempati posisi negara keempat dengan kasus
tertinggi di Asia dibawah India, Turkey dan Iran. Salah satu metode awal untuk mengidentifikasi
penyakit ini adalah dengan menggunakan Computerised Tomography atau CT-Scan. Penelitian ini
dilakukan dengan mengklasifikasikan paru-paru yang terkena penyakit Covid-19 dan Pneumonia
menggunakan Model Machine Learning Suport Vector machines (SVM). Dataset yang digunakan
bersumber dari tim research Qatar University dan University of Dhaka yang berkolaborasi dengan
dokter setempat yang diakses melalui kaggle.com. Dataset tersebut terdiri dari 3586 citra pengidap
Covid-19, 5982 citra pengidap Pneumonia, dan 10162 citra paru-paru normal. Proses klasifikasi
diawali dengan melakukan penghitungan Gray Level Co-Ocurence matriks 4 sudut yakni 0, 45, 90,
dan 135 yang kemudian hasil dari masing masing matriks tersebut akan diekstraksi fitur-fitur berupa
dissimilarity, correlation, homogeneity, contrast, ASM, dan energy. Proses pengujian dilakukan
dengan menggunakan beberapa variabel untuk seleksi fitur PCA yakni n_component 2 sampai 24.
Akurasi akhir yang didapatkan menggunakan metode klasifikasi SVM adalah sebesar 76,2% dari
PCA n_components = 14.
Keywords : Covid-19, Pneumonia, GLCM, PCA, SVM, Klasifikasi, Ekstraksi Fitur
1. PENDAHULUAN tekstur dengan metode GLCM yang
Corona Virus 2019 atau yang sering selanjutnya akan direduksi dengan
disebut COVID-19 merupakan penyakit menggunakan metode PCA sehingga
menular oleh sindrom pernafasan akut parah mempercepat proses klasifikasi dan yang
SARSCoV-2 [1]. Angka kasus COVID–19 di terakhir adalah melakukan klasifikasi
Indonesia tiap harinya terus mengalami menggunakan Metode SVM dengan
peningkatan. Berdasarkan data per 24 Mei menggunakan fitur-fitur yang telah direduksi.
2021 dari World Health Organization, total Metode ekstraksi fitur GLCM pada
kumulatif kasus di Indonesia adalah penelitian sebelumnya digunakan oleh
1.781.127 kasus, menempati posisi negara Muhamad Saenudin dan kawan-kawan
keempat dengan kasus tertinggi di Asia (2021) dengan hasil akurasi sebesar 80.35%
dibawah India, Turkey dan Iran [2]. [3], Varela-Santos dengan hasil akurasi
Identifikasi catat pada paru-paru yang tertinggi sebesar 94.30% [4]. Selanjutnya
disebabkan oleh Covid-19 dan Pneumonia pada penelitian yang dilakukan oleh Turker
dapat dilakukan dengan mendapatkan fitur dan kawan-kawan (2020) menggunakan
metode klasifikasi SVM mendapatkan hasil Risha Ambar Wati (2020) dalam
akurasi sebesar 97% [5], penelitian yang penelitiannya yang berjudul “Klasifikasi
sama juga dilakukan oleh Umut Ozkaya dan Pneumonia Menggunakan Metode Support
kawan-kawan dan mendapatkan hasil yang Vector Machine” yang mengklasifikasikan 2
baik yakni 98% [6]. Berdasarkan hasil class menggunakan GLCM dan model SVM
penelitian yang telah dilakukan, metode dengan akurasi 62.66% [8].
ekstraksi fitur GLCM dan klasifikasi SVM Marwa M. Eid dan kawan-kawan
memiliki performa yang sangat bagus, (2021) dalam penelitiannya yang berjudul
disamping itu ekstraksi fitur GLCM memiliki “Efficient Pneumonia Detection for Chest
kecocokan dengan dataset yang berhubungan Radiography Using ResNet-Based SVM”
dengan tekstur dari kantong dan saluran untuk mengklasifikasikan antara pengidap
udara pada paru-paru [7]. Sedangkan metode pneumonia maupun normal dengan akurasi
klasifikasi SVM sangat cocok untuk dataset 88.665% [9].
yang memiliki kolom dan baris dalam jumlah Umut Ozkaya1 dan kawan-kawan
besar yang tidak memungkinkan untuk (2020) dalam penelitiannya yang berjudul
dilakukan metode klasifikasi secara linear “Corona Virus (COVID-19) Classification
[7]. Using Deep Features Fusion and Ranking
Tujuan dari penelitian ini adalah untuk Technique” menggunakan model CNN dan
melakukan klasifikasi pada penyakit paru- klasifikasi SVM menghasilkan akurasi
paru menggunakan fitur-fitur dari gray level sebesar 98.27% [6].
co-occurrence (GLCM) yang kemudian fitur Saban Ozturk dan kawan-kawan (2020)
tersebut akan direduksi dengan metode PCA dalam penelitiannya yang berjudul
dan terakhir adalah melakukan klasifikasi “Classification of COVID-19 Patients from
menggunakan metode SVM. Pada saat Chest CT Images using Multi-Objective
dilakukan seleksi fitur juga akan didapatkan Differential Evolution–Based Convolutional
fitur-fitur terbaik yang bisa digunakan untuk Neural Networks” menghasilkan akurasi
proses klasifikasi. sebesar 93.5% [5].
2. TINJAUAN PUSTAKA Muhamad Saenudin dan kawan-kawan
2.1 Penelitian Terkait (2021) dalam penelitiannya yang berjudul
Untuk mendukung penelitian ini, maka “Classification of Covid-19 Using Feature
dibutuhkan beberapa penelitian terdahulu Extraction GLCM and SVM Algorithm”
yang dijadikan sebagai rujukan. Adapun melakukan klasifikasi menggunakan hasil x-
penelitian terdahulu yang berkaitan dengan ray citra paru-paru dengan algoritma GLCM
karya tulis ini adalah : dan SVM, hasilnya menunjukan bahwa
Turker dan kawan-kawan (2020) dalam akurasi tertinggi sebesar 90.47% ketika d = 1
penelitiannya yang berjudul “A novel Covid- dan akurasi terendah sebesar 80.35% ketika d
19 and Pneumonia Classification Method = 3 [3].
Based on F-transform” menggunakan metode Saban Ozturk dan kawan-kawan (2021)
FFT untuk melakukan ekstraksi fitur pada dalam penelitiannya yang berjudul
citra hasil x-ray paru-paru yang terdeteksi “Classification of Coronavirus (COVID‐19)
normal, Covid-19, dan Pneumonia, dan from X‐ray and CT Images Using Shrunken
kemudian melakukan perbandingan Features” melakukan klasifikasi
menggunakan model KNN dan SVM, menggunakan hasil x-ray citra paru-paru
hasilnya adalah SVM classifier dengan dengan algoritma sAE dan PCA
akurasi 97% [5]. menghasilkan akurasi masing-masing sebesar
86.54% dan 94.23% untuk 495 sampel [10].
Sergio Varela-Santos dan kawan- Dataset yang digunakan pada penelitian
kawan (2021) dalam penelitiannya yang ini berasal dari kaggle dengan link :
berjudul “A new Approach for Classifying www.kaggle.com/tawsifurrahman/covid19-
Coronavirus COVID-19” berdasarkan hasil radiography-database yang dikumpulkan oleh
x-ray citra paru-paru menggunakan ekstraksi tim research dari Qatar University di Doha,
fitur dan neural network menghasilkan Qatar dan University of Dhaka di Bangladesh
akurasi tertinggi sebesar 94.30% [4]. yang juga berkolaborasi dengan tim dokter
2.2 Covid-19 dari Pakistan dan Malaysia. Dataset tersebut
Severe Acute Respiratory Syndrome terdiri dari citra paru-paru normal sebanyak
Coronavirus (SARS-COV-2) adalah sebuah 10162 citra, Pneumonia sebanyak 1345 citra
penyakit menular yang disebabkan oleh virus dan Covid-19 sebanyak 3616 citra. Citra
corona. Coronavirus (COVID-19) menyerang merupakan gambar yang berasal dari CT-
sistem pernapasan dimulai dari hidung, Scan dan keseluruhannya berukuran 299 x
mulut, tenggorokan bahkan untuk kasus 299 pixel, memiliki warna grayscale, dan
terparah bisa sampai sampai ke paru – paru. berformat .png dan .jpg.
penyakit ini juga dapat memicu gejala Citra paru-paru memiliki beberapa fitur
demam dan batuk (Pneumonia) sehingga yang bisa dijadikan data untuk dibawa ke
terjadi perubahan jaringan organ paru – paru model klasifikasi. Fitur-fitur tersebut harus
[1]. dianalisis sehingga didapatkan fitur terbaik
2.3 Pneumonia sebagai pembeda antara jenis satu dengan
Pneumonia adalah jenis penyakit pada lainnya.
paru paru yang biasanya disebabkan oleh
virus, jamur, bakteri atau parasit. Virus yang
paling umum menjadi penyebab utama
penyakit ini adalah Adenoviruses,
Rhinovirus, Influenza Virus, Respiratory Normal Covid Pneumonia
Syncytial Virus (RSV) dan Parainfluenza Gambar 1. Perbandingan paru-paru normal,
Virus, sedangkan bakteri yang biasanya Covid-19, dan Pneumonia.
menyebabkan Pneumonia yaitu Pada gambar diatas dapat diambil
Streptococcus dan Mycoplasma Pneumonia. diagnosa awal bahwa fitur yang paling
Virus-virus atau bakteri-bakteri tersebut membedakan antara ke-3 citra tersebut
menyebabkan paru-paru terutama di bagian adalah tekstur. Sebagai contoh pada citra
alveolus (mikroskopik udara mengisi paru-paru normal, warna tekstur cenderung
kantong dari paru yang berfungsi untuk lebih gelap yang menandakan bahwa paru-
menyerap oksigen dari atmosfer) menjadi paru sepenuhnya terisi udara tanpa ada
radang dan dengan penimbunan cairan gangguan dari penyakit manapun. Pada citra
seperti lendir [11]. paru-paru Covid-19, warna tekstur sedikit
lebih putih dan terdapat noise seperti kapas di
bagian sebelah kanan bawah. Selanjutnya
yang terakhir adalah citra Pneumonia yang
dimana hampir keseluruhan bagian
mengalami kerusakan karena penyakit ini
menyerang kantung udara paru-paru
sehingga terisi cairan atau nanah.
3. METODE PENELITIAN Dari analisis dataset tersebut dapat
3.1 Analisis Dataset disimpulkan bahwa fitur yang paling
membedakan antara citra yang satu dengan menggunakan metode K-Means clustering.
lainnya adalah fitur tekstur, dan salah satu K-Means clustering menggunakan nilai
metode ekstraksi fitur tekstur terbaik yang variabel K = 2, sehingga didapatkan citra
ada sekarang adalah metode Gray Level Co- gelap (paru-paru) dan citra terang (tulang,
occurrence Matrix (GLCM). daging, dan urat di paru paru). Setelah itu
3.2 Perancangan Algoritma dilanjutkan dengan mengambil bounding box
Langkah awal algoritma klasifikasi paru-paru. Objek yang ada di dalam
penyakit Covid-19 dan Pneumonia pada bounding box paru-paru akan diambil,
paru-paru adalah dengan melakukan sedangkan yang di luarnya akan dibuang
preprocessing, dilanjuti dengan melakukan [12], algoritma ini digunakan karena pada
ekstraksi fitur menggunakan metode GLCM dasarnya distribusi warna pada paru paru
dan metode PCA, yang terakhir adalah tidak tetap dan memiliki variasi konstras
membuat model Machine Learning yang berbeda, maka dari itu perlu digunakan
menggunakan metode SVM. Proses proses segmentasi yang adaptif yang tepat,
modeling menggunakan 2 jenis, yakni yakni K-Means segmentation.
menggunakan 2 class dan 3 class. Proses Kemudian datanya akan dilakukan
seleksi fitur sampai modeling juga balancing, dimana akan diambil 1000 sampel
mengalami beberapa kali pengulangan demi secara acak untuk masing masing label.
mengetahui n-components terbaik yang dapat 3.4 Ekstraksi Fitur GLCM
digunakan untuk proses seleksi fitur. Tahap GLCM adalah salah satu metode
akhir dari klasifikasi ini adalah melakukan ekstraksi fitur yang bekerja dengan cara
proses validasi yang akan menghasilkan nilai menghitung nilai ketetanggaan antar pixel
akurasi. yang memiliki intensitas dan orientasi abu-
abu dari suatu sudut. Arah atau orientasi
suatu sudut direpresentasikan dalam derajat
yang terbentuk dari sudut 0o, 45o, 90o dan
135o [13].
Ada beberapa fitur yang akan
diekstraksi dari GLCM yakni contrast,
correlation, energy, homogeneity,
dissimilarity, entropy dan ASM [14]. Berikut
adalah adalah rumus dari parameter yang
sering digunakan dalam melakukan ekstraksi
fitur pada GLCM:
levels−1
contrast = ∑ ❑ Pi , j (i− j)2
i , j=0
levels−1
dissimilarity= ∑ ❑ Pi , j∨i− j∨¿
Gambar 2. Flowchart algoritma klasifikasi citra. i , j=0
levels−1
Pi , j
h omogeneity = ∑ ❑
3.3 Preprocessing i , j=0 1+(i− j)2
Preprocessing citra yang dilakukan ini levels−1