Anda di halaman 1dari 6

Jurnal Statistika, Vol. 10, No.

1, 2022

IMPLEMENTASI SPECTRAL CLUSTERING ALGORITHM UNTUK


PENGELOMPOKAN SASARAN VAKSINASI COVID-19 DI
INDONESIA
Millenia Winadya Putri, *Indah Manfaati Nur, Rochdi Wasono
Program Studi Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas
Muhammadiyah Semarang

e-mail : indahmnur@unimus.ac.id

ABSTRAK
Pandemi COVID-19 dalam kurun waktu dua tahun berhasil menginfeksi jutaan
orang di seluruh dunia dan menyebabkan banyak kematian. Guna menghentikan
penyebaran virus, pemerintah melakukan tindakan yaitu menerapkan protokol kesehatan
dan mewajibkan vaksinasi kepada masyarakat. Namun, kegiatan vaksinasi masih lamban
untuk mencapai target. Maka dari itu, dalam penelitian ini akan dilakukan suatu
pengelompokan untuk mengetahui tingkat persebaran vaksinasi di Indonesia menurut
provinsi dengan data jumlah vaksinasi per-kategori masyarakat pada tanggal 1 Februari
2022. Salah satu algoritma pengelompokan dalam Data Mining yaitu Spectral Clustering.
Pengelompokan spektral merupakan teknik yang mengikuti pendekatan konektivitas,
dimana metode ini mengklasifikasikan titik-titik yang terhubung atau berbatasan langsung.
Penelitian ini menghasilkan 3 klaster untuk masing-masing kategori, yaitu klaster daerah-
daerah yang memiliki tingkat persebaran vaksinasi tinggi, sedang, dan rendah. Evaluasi
klaster diukur menggunakan Davies-Bouldin Index (DBI) dengan rata-rata nilai DBI tiap
kategori yaitu 1,01422.

Keyword: COVID-19, Vaksinasi, Data Mining, Spectral Clustering, DBI


PENDAHULUAN Severe Acute Respiratory Syndrome
Coronavirus 2019 atau umum (SARS). Kasus terkonfirmasi pada tahun
disebut COVID-19 merupakan jenis 2020-2021, jutaan orang dari seluruh
dunia jatuh sakit dan meninggal dunia di
penyakit menular melalui udara yang
setiap harinya dan Indonesia menjadi
pertama kali muncul pada Desember
2019 di Wuhan, China dan sedang salah satu negara yang paling terdampak
menjadi pandemi global sejak awal tahun pandemi COVID-19. Kondisi tersebut
memberikan dampak langsung kepada
2020 hingga saat ini. Virus ini
masyarakat dunia, tidak terkecuali
menyebabkan penyakit infeksi saluran
pernapasan, dari flu biasa sampai infeksi masyarakat Indonesia sehingga
yang serius seperti Middle East pemerintah Indonesia memberlakukan
Respiratory Syndrome (MERS) dan penerapan protokol kesehatan di seluruh

26
Jurnal Statistika, Vol. 10, No. 1, 2022

aspek kegiatan. Namun, protokol pertimbangan penggunaan datanya dalam


kesehatan dinilai kurang mampu dalam penelitian. Pengelompokan didasarkan
mencegah risiko penularan COVID-19. pada setiap kelompok masyarakat
penerima vaksin.
Oleh karena itu, pemerintah perlu
melakukan tindakan intervensi lain yang Penelitian ini sangat penting
efektif guna memutus rantai penyebaran dilakukan karena dampak negatif yang
virus yaitu melalui upaya vaksinasi. diakibatkan oleh pandemi ini tidak akan
Tujuan utama vaksinasi yaitu untuk terselesaikan dengan cepat jika kasus
menurunkan angka kesakitan dan terkonfirmasi positif COVID-19 masih
kematian yang disebabkan oleh COVID- tinggi. Dampak yang dihasilkan tidak
19, mencapai kekebalan dan melindungi hanya pada sektor kesehatan saja, namun
masyarakat dari COVID-19, kemudian dampak serius terjadi pada sektor lain,
puncaknya dapat menjaga masyarakat seperti sektor sosial, sektor ekonomi,
dan perekonomian (Kemenkes RI Dirjen sektor industri, serta sektor pariwisata
P2P, 2020). yang tidak dapat beroperasi secara
maksimal. Sehingga, dengan adanya
Vaksinasi diberlakukan kepada
penelitian ini diharapkan mampu
masyarakat dengan mengacu pada
kelompok yang telah ditetapkan oleh mengetahui daerah-daerah yang masih
pemerintah agar vaksin yang akan sedikit tingkat vaksinasinya agar dapat
diberikan merupakan vaksin yang sesuai dilakukan tindakan pendistribusian
dengan kondisi atau keadaan vaksin dan target sasaran vaksinasi segera
penerimanya. Kelompok masyarakat terpenuhi.
tersebut dibagi menjadi lima, yaitu
Lansia, Masyarakat Umum dan Rentan, METODE PENELITIAN
Petugas Publik, SDM Kesehatan, serta
Usia 12-17 Tahun (Direktorat Jenderal Sumber Data dan Variabel Penelitian
Pencegahan dan Pengendalian Penyakit
(P2P), 2020). Saat ini, vaksinasi belum Jenis penelitian ini adalah kuantitatif
juga dapat mencapai target sasaran. dengan desain cross sectional dimana
Karenanya pemerataan kegiatan vaksinasi populasi penelitian adalah seluruh
di seluruh wilayah Indonesia harus masyarakat Indonesia dengan sampel
ditinjau lebih dalam lagi untuk kelompok masyarakat penerima vaksin,
mengupayakan terpenuhinya target yaitu Lansia, Masyarakat Umum dan
sasaran vaksinasi COVID-19 nasional. Rentan, Petugas Publik, SDM Kesehatan,
Upaya tersebut dapat dilakukan dengan serta Usia 12-17 Tahun. Data yang
melakukan suatu penelitian untuk digunakan merupakan data jumlah
meninjau persebaran vaksinasi yaitu vaksinasi COVID-19 per-Provinsi tiap
dengan mengelompokkan wilayah mana kelompok masyarakat pada tanggal 1
saja yang kegiatan vaksinasinya masih Februari 2022. Data tersebut adalah data
rendah, dilihat dari total masyarakat di sekunder yang didapatkan dari laman
wilayah tersebut yang sudah website vaksin.kemkes.go.id. Penelitian
mendapatkan vaksin dosis pertama. ini dilakukan menggunakan beberapa
Belum sempurnanya pelaksanaan tahapan, yaitu pengumpulan data, analisis
vaksinasi dosis pertama menjadi deskriptif dengan descriptive statistics,
data pre-processing, pengelompokan

27
Jurnal Statistika, Vol. 10, No. 1, 2022

data menggunakan algoritma Spectral pelaksanaan vaksinasi paling tinggi antara


Clustering, serta evaluasi klaster dengan lain, provinsi jawa tengah untuk kategori
nilai Davies-Bouldin Index (DBI). lansia, provinsi jawa barat untuk kategori
masyarakat umum dan rentan, kategori
Metode Analisis petugas publik, serta kategori usia 12-17
tahun, dan provinsi jawa timur untuk
Langkah analisis yang digunakan dalam kategori sdm kesehatan.
penelitian ini adalah sebagai berikut:
Data Pre-processing
1. Menyiapkan data akan dianalisis.
2. Mendeskripsikan data dengan analisis Tabel 2. Hasil Standarisasi Data
Lansia Masyarakat Petugas Sdm Usia 12-17
deskriptif untuk mengetahui Umum &
Rentan
Publik Kesehatan Tahun

gambaran umum kegiatan vaksinasi 1 0.12506198 -0.2306964 -0.02490849 -0.125060601 -0.43404743


2 0.26454564 0.273595 0.45284048 0.517404394 0.91081771
COVID-19 menurut provinsi di 3 -0.19315414 -0.1717328 -0.09322556 0.008958858 0.07211049
Indonesia. … … … … … …
32 0.05335381 0.4525591 0.25640544 0.137151384 0.22662308
3. Membentuk Matriks Similaritas. 33 0.0403646 -0.1779333 0.25316004 -0.098607729 -0.09554145
34 -0.45400451 -0.4030999 -0.42284204 0.071370225 -0.40153314
4. Membentuk Matriks Diagonal.
5. Membentuk Matriks Laplacian.
Tahap preprocessing dilakukan untuk
6. Menghitung eigenvalue dan
mempersiapkan data sehingga siap
eigenvector.
digunakan. Pada penelitian ini,
7. Mengelompokkan data dengan
preprocessing yang dilakukan yaitu
K-Means Clustering.
scaling data dengan metode standarisasi.
8. Menginterpretasi hasil klaster
berdasarkan karakteristik tiap klaster. Clustering Data
9. Mengevaluasi hasil klaster dengan
nilai DBI. Proses pengelompokan data
dilakukan dengan algoritma Spectral
HASIL DAN PEMBAHASAN Clustering, dimana terdapat beberapa
tahap perhitungan matriks didalamnya.
Analisis Deskriptif Berikut tahapan pada Spectral Clustering:
Tabel 1. Hasil Statistika Deskriptif Membentuk Matriks Similaritas
Lansia Masyarakat Petugas SDM 12-17

Umum & Rentan Publik Kesehatan Tahun Matriks similaritas dibentuk


Min 7198 152832 73699 8922 22487 menggunakan metode k-nearest
Mean 278166 2190584 829366 59539 4379170 neighbors dimana prinsip kerjanya yaitu
Median 804134 927556 334921 35063 206549
mencari jarak terdekat antara data yang
Max 1954096 14353940 4809415 275413 2532656
akan dievaluasi dengan k tetangga
(neighbors) terdekatnya yang dihitung
dengan rumus euclidean distance
Berdasarkan tabel, informasi yang (yudhana dkk, 2020). Pada penelitian ini,
dapat diambil yaitu provinsi dengan inisialisasi nilai k menggunakan nilai 10
pelaksanaan vaksinasi paling rendah, dengan pertimbangan nilai k yang
antara lain provinsi papua barat untuk optimum adalah tidak terlalu kecil dan
kategori lansia, kategori masyarakat tidak terlalu besar, serta
umum dan rentan, serta kategori usia 12- mempertimbangkan jumlah data. Hasil
17 tahun, provinsi kalimantan utara untuk similarity matrix direpresentasikan
kategori petugas publik dan kategori sdm dengan angka 0 dan 1 dimana 0 berarti
kesehatan. Sedangkan provinsi dengan antar data tidak berdekatan dan 1 berarti

28
Jurnal Statistika, Vol. 10, No. 1, 2022

antar data saling berdekatan yang dapat Tabel 5. Matriks Laplacian


V1 V2 V3 … V32 V33 V3
dilihat pada tabel berikut: 1 0 0 0.003086420 … 0 0.00308642
4
0
0
Tabel 3. Matriks Similaritas 2 0.006944444 0 0.006944444 … 0.006944444 0.00694444
4
0

V1 V2 V3 … V32 V33 V34 3 0.002066116 0 0 … 0 0.00206611 0


6
1 0 0 1 … 0 1 0 … … … … … … … …
32 0.006944444 0.00694444 0.006944444 … 0 0.00694444 0
2 1 0 1 … 1 1 0 4 4
33 0.002066116 0 0.002066116 … 0 0 0
3 1 0 0 … 0 1 0 34 0 0 0 … 0 0 0
… … … … … … … …
32 1 1 1 … 0 1 0
Menghitung nilai eigen dan vektor
33 1 0 1 … 0 0 0
eigen
34 0 0 0 … 0 0 0

Eigenvalue dan eigenvector


Membentuk Matriks Diagonal berguna untuk menghasilkan data baru
yang merepresentasikan karakteristik
Matriks derajat atau matriks
kesamaan antar data dengan lebih dalam
diagonal ini merepresentasikan jumlah
(Rohmah & Sugiyarto, 2021). Pertama,
data yang saling terhubung atau
dilakukan penghitungan nilai eigenvalue
berdekatan berdasarkan matriks
dan setelah diketahui maka selanjutnya
similaritas (Ramdan & Hermawan,
dibentuk eigenvector berdasarkan tiga
2012). Matriks diagonal merupakan
eigenvalue. Pada tahap ini, pembentukan
matriks identitas dimana seluruh elemen
eigenvector dilakukan untuk setiap
bernilai 0 kecuali pada diagonal
kategori agar terbentuk cluster pada
utamanya. Hasil matriks diagonal
setiap kategori. Berikut adalah salah satu
ditunjukkan pada tabel berikut:
tabel eigenvector yang telah terbentuk:
Tabel 4. Matriks Diagonal
V1 V2 V3 … V32 V33 V34 Tabel 6. Vektor Eigen Kategori Lansia
1 9 0 0 … 0 0 0 Lansia
2 0 6 0 … 0 0 0 V1 V2 V3
3 0 0 11 … 0 0 0 0.015459 0.149946 -0.176856
… … … … … … … … 0.041982 0.172369 -0.176125
32 0 0 0 … 6 0 0 ... ... ...
33 0 0 0 … 0 11 0 0.015459 0.149946 -0.176856
34 0 0 0 … 0 0 10 0.015459 0.149946 -0.176856
0.159922 0.024471 0.225777
Membentuk Matriks Laplacian
Tabel 7. Vektor Eigen Kategori Masyarakat
Matriks laplacian merupakan Umum dan Rentan
matriks representasi dari sebuah graf. Masyarakat Umum dan Rentan
Matriks laplacian ini sebagai komponen V1 V2 V3
utama yang nantinya akan digunakan -0.044850 0.132246 0.170200
untuk mengelompokkan data dengan -0.007392 0.157138 0.169071
spectral clustering. Berikut adalah tabel ... ... ...
matriks laplacian yang dihitung -0.007392 0.157138 0.169071
berdasarkan rumus yang ternormalisasi -0.007392 0.157138 0.169071
atau normalized laplacian: 0.089633 -0.271547 -0.012696

29
Jurnal Statistika, Vol. 10, No. 1, 2022

Tabel 8. Vektor Eigen Kategori Petugas Tabel 11. Klaster Kategori Lansia
Publik Cluster Rata-Rata Anggota
Yogyakarta, Sumatera Utara, Sumatera Selatan,
Petugas Publik 1 742051,2 NTB, Lampung, Jawa Timur, Jawa Tengah,
V1 V2 V3 Jawa Barat, DKI Jakarta, Banten, Bali
Sumatera Barat, Sulawesi Tengah, Riau, NTT,
-0.044850 0.132246 0.170200 Maluku, Kep. Riau, Kep. Bangka Belitung,
-0.007392 0.157138 0.169071 2 64841,93 Kalimantan Timur, Kalimantan Tengah,
Kalimantan Selatan, Kalimantan Barat, Jambi,
... ... ... Bengkulu, Aceh
-0.007392 0.157138 0.169071 Sulawesi Utara, Sulawesi Tenggara, Sulawesi
3 43004,67 Selatan, Sulawesi Barat, Papua Barat, Papua,
-0.007392 0.157138 0.169071 Maluku Utara, Kalimantan Utara, Gorontalo
0.089633 -0.271547 -0.012696
Tabel 12. Klaster Kategori Masyarakat
Tabel 9. Vektor Eigen Kategori SDM Umum dan Rentan
Kesehatan Cluster Rata-Rata Anggota
SDM Kesehatan Sulawesi Tenggara, Sulawesi Tengah,
Sulawesi Barat, Papua Barat, Papua, Maluku
V1 V2 V3 1 309742,0909
Utara, Maluku, Kep. Bangka Belitung,
Kalimantan Utara, Gorontalo, Bengkulu
-0.036878 0.041504 -0.175717
Yogyakarta, Sumatera Barat, Sulawesi Utara,
0.020902 0.130311 -0.179792 Riau, NTT, Kep. Riau, Kalimantan Timur,
2 922800,3333
Kalimantan Tengah, Kalimantan Selatan,
... ... ... Kalimantan Barat, Jambi, Aceh
0.020902 0.130311 -0.179792 Sumatera Utara, Sumatera Selatan, Sulawesi
3 5453198,182 Selatan, NTB, Lampung, Jawa Timur, Jawa
-0.031818 0.073207 -0.179155 Tengah, Jawa Barat, DKI Jakarta, Banten, Bali
-0.021582 0.105289 -0.180983
Tabel 13. Klaster Kategori Petugas Publik
Tabel 10. Vektor Eigen 12-17 Tahun Cluster Rata-Rata Anggota
Usia 12-17 Tahun Yogyakarta, Sumatera Utara, Sumatera Selatan,
1 2006020,091 Sulawesi Selatan, Riau, Jawa Timur, Jawa
V1 V2 V3 Tengah, Jawa Barat, DKI Jakarta, Banten, Bali
-0.110434 0.271789 -0.018881 Sumatera Barat, Sulawesi Utara, Sulawesi
Tenggara, Sulawesi Tengah, Papua, NTB, Kep.
-0.066353 -0.166045 0.170886 2 266373,1
Bangka Belitung, Kalimantan Tengah,
Kalimantan Selatan, Kalimantan Barat, Aceh
... ... ...
Sulawesi Barat, Papua Barat, NTT, Maluku
-0.008237 -0.144110 0.172721 3 651699,9167
Utara, Maluku, Lampung, Kep. Riau,
Kalimantan Utara, Kalimantan Timur, Jambi,
0.060488 -0.087296 0.172536 Gorontalo, Bengkulu
-0.029839 0.292290 0.014116
Tabel 14. Klaster Kategori SDM Kesehatan
Mengelompokkan Data dengan K- Cluster Rata-Rata Anggota
Sulawesi Utara, Sulawesi Tenggara, Sulawesi
Means Tengah, Sulawesi Barat, Papua Barat, Papua,
1 17417,21429 Maluku Utara, Maluku, Kep. Riau, Kep. Bangka
Hasil eigenvector setiap kategori Belitung, Kalimantan Utara, Kalimantan
Tengah, Gorontalo, Bengkulu
selanjutnya dikelompokkan Sumatera Barat, Riau, NTT, NTB, Lampung,
menggunakan k-means. Hasil cluster 2 38975,44444 Kalimantan Timur, Kalimantan Selatan,
Kalimantan Barat, Jambi
diinterpretasikan berdasarkan nilai rata- Yogyakarta, Sumatera Utara, Sumatera Selatan,
rata dari data vaksinasi covid-19. Hasil 3 129970 Sulawesi Selatan, Jawa Timur, Jawa Tengah,
Jawa Barat, DKI Jakarta, Banten, Bali, Aceh
cluster persebaran vaksinasi tinggi,
sedang, dan rendah ditunjukkan pada
tabel di bawah ini:

30
Jurnal Statistika, Vol. 10, No. 1, 2022

Tabel 15. Klaster Kategori Usia 12-17 Tahun DAFTAR PUSTAKA


Cluster Rata-Rata Anggota
Yogyakarta, Sulawesi Utara, Sulawesi Tengah,
Kep. Riau, Kep. Bangka Belitung, Kalimantan
[1] Direktorat Jenderal Pencegahan dan
1 777650
Tengah, Jawa Timur, Jawa Tengah, Jawa Barat,
Bengkulu
Pengendalian Penyakit (P2P).
Sumatera Utara, Sumatera Selatan, Sumatera (2020). "Pedoman pencegahan dan
Barat, Sulawesi Selatan, Riau, NTT, NTB,
2 419367,0625 Lampung, Kalimantan Timur, Kalimantan pengendalian coronavirus disease
Selatan, Kalimantan Barat, Jambi, DKI Jakarta,
Banten, Bali, Aceh (covid-19)". Jakarta: Kementerian
Sulawesi Tenggara, Sulawesi Barat, Papua
3 50290,875 Barat, Papua, Maluku Utara, Maluku, Kesehatan RI.
Kalimantan Utara, Gorontalo

[2] Kemenkes RI Dirjen P2P. (2020).


Evaluasi Data "Kementerian Kesehatan Republik
Tahap evaluasi dilakukan Indonesia, Tentang Petunjuk Teknis
menggunakan davies-bouldin index (dbi) Pelaksanaan Vaksinasi Dalam
untuk menentukan hasil cluster paling Rangka Penanggulangan Pandemi
optimal dari proses clustering. Penentuan Corona Virus Disease 2019 (Covid-
cluster optimal dapat disimpulkan
19)". Kementerian Kesehatan RI,
melalui nilai dbi yang terendah atau dapat
dikatakan bahwa semakin rendah nilai 5(1), 1.
dbi, maka semakin baik hasil cluster yang
[3] Ramdan, D., dan Hermawan, G.
didapatkan. Berikut adalah tabel nilai dbi
masing-masing kategori: (2012). "Pemanfaatan Metode
Adjacency Matrix untuk Optimasi
Tabel 16. Tabel Nilai DBI
Kategori DBI
Rute Jalan Berbasis Web". Jurnal
Lansia 0,9910664 Komputer dan Informatika, 1(1),
Masyarakat Umum & Rentan 1,022632 59-63.
Petugas Publik 1,039109
SDM Kesehatan 0,9899738
Usia 12-17 Tahun 1,028337
[4] Rohmah, Q., dan Sugiyarto. (2021).
"Implementasi Algoritma Spectral
KESIMPULAN DAN SARAN Clustering untuk Analisis
Berdasarkan hasil dan diskusi Sentimen". Jurnal Ilmiah
penelitian ini, dapat disimpulkan bahwa Pendidikan Matematika, 9(1), 27-
setiap kategori masyarakat 36.
dikelompokkan menjadi tiga klaster,
yaitu klaster dengan tingkat vaksinasi [5] Yudhana, A., Sunardi., dan Hartanta,
tinggi, sedang, dan rendah. Evaluasi hasil A. J. S. (2020). "Algoritma K-NN
klaster menunjukkan nilai yang hampir dengan Euclidean Distance untuk
sama sehingga dapat terlihat bahwa Prediksi Hasil Penggergajian Kayu
anggota-anggota pada suatu klaster di
Sengon". Transmisi 22(4): 123-129.
masing-masing kategori tidak jauh
berbeda. Titik fokus berada pada tingkat
vaksinasi rendah karena nantinya klaster
tersebut yang akan diperhatikan untuk
proses pendistribusian vaksin agar target
sasaran vaksinasi cepat tercapai.

31

Anda mungkin juga menyukai