Abs Trak
Abs Trak
Abstrak
Penyakit tidak menular (PTM) merupakan penyebab kematian utama baik di dunia maupun
Indonesia. Meskipun memiliki kondisi tersebut, kebijakan Indonesia belum berfokus pada PTM.
Media untuk menggambarkan kondisi PTM Indonesia secara keseluruhan sangatlah terbatas.
Jawa Timur memiliki jumlah kasus kematian disebabkan oleh PTM terbanyak dan merupakan
penyumbang populasi tua terbanyak di Indonesia. Dalam penelitian ini dilakukan upaya
menggambarkan kondisi PTM di Jawa Timur. Data yang digunakan dalam penelitian ini
merupakan faktor-faktor kerawanan PTM yang berasal dari data Riskesdas Jawa Timur tahun
2018. Metode yang digunakan dalam penelitian ini adalah clustering ensemble based k-means.
Setelah melalui uji validasi dengan Davies-Bouldin index, Calinski Harabasz index, dan Silhoutte
index, diperoleh bahwa clustering ensemble based k-means dengan k=3 merupakan solusi
terbaik. Berdasarkan hasil clustering, didapat 3 kelompok kerawanan yaitu rendah, sedang, dan
tinggi. Wilayah dengan kerawanan PTM tinggi merupakan wilayah dengan karakteristik diabetes
melitus, obesitas sentral, hipertensi, konsumsi makanan manis, dan kurang aktivitas fisik yang
lebih tinggi dibandingkan kelompok kerawanan lain. Wilayah tersebut merupakan wilayah
dengan urbanisasi tinggi yaitu Kota Surabaya, Kota Madiun, Kota Mojokerto, Kota Pasuruan,
Kota Probolinggo, Kota Malang, Kota Blitar, Kabupaten Gresik, dan Kabupaten Sidoarjo.
Abstract
Non-communicable diseases (NCDs) are the main causes of death in both the world and
Indonesia. Despite these conditions, Indonesia's policy does not focus on PTM. Media to describe
the condition of PTM Indonesia as a whole is very limited. East Java has the highest number of
deaths caused by PTM and is the largest contributor to the elderly population in Indonesia. So
this study an attempt will be made to describe the condition of PTM in East Java. The data used
in this study are PTM susceptibility factors from the publication of Riskesdas East Java in 2018.
The method used is clustering ensemble based k-means. After going through the validation test
with BD index, CH index, and Silhoutte index, it was found that clustering ensemble based on k-
means with k=3 is the best solution. There are groups of susceptibility, labelled as low, medium,
and high. Areas with high NCDs susceptibility are areas with characteristics of diabetes mellitus,
central obesity, hypertension, consumption of sweet foods, and lack of physical activity that are
higher than other groups. These areas are areas with high urbanization, namely city of Surabaya,
Madiun, Mojokerto, Pasuruan, Probolinggo, Malang, Blitar, and regency of Gresik, and
Sidoarjo.
1
ISSN: 1978-1520
1. PENDAHULUAN
2
IJCCS ISSN: 1978-1520
dengan melakukan analisis cluster, kelompok wilayah yang paling membutuhkan penanganan
dapat diprioritaskan sesuai dengan hasil labelling pada cluster terbentuk.
Dalam analisis clustering, kita sering dihadapkan pada permasalahan kualitas data yang tak
menentu, baik noise, outlier, maupun terjadi pelanggaran klasik. Beberapa algoritma clustering
khususnya algoritma tunggal tak dapat mentolerir permasalahan tersebut. Penggunaan algoritma
clustering tunggal pada data noise, outlier dan terjadi pelanggaran klasik menyebabkan penentuan
jumlah cluster (kelompok) pada data menjadi kurang tepat. Clustering ensemble merupakan salah
satu penyelesaian terhadap permasalahan tersebut. Dalam penelitian Topchy, Jain, & Punch
(2005); Strehl & Ghosh, 2002 menyatakan bahwa clustering ensemble cocok dan lebih powerfull
digunakan untuk berbagai jenis dataset serta robust pada data yang mengandung noise dan outlier.
Selain itu, clustering ensemble dapat digunakan pada data yang tidak berdistribusi normal
(Chrisinta, Sumertajaya, & Indahwati, 2020). Oleh karena itu, penelitian ini akan menggunakan
analisis cluster ensemble untuk menggambarkan kondisi kerawanan PTM di Jawa Timur. Adapun
tujuan yang ingin dicapai dalam penelitian ini adalah untuk mengetahui gambaran umum
kerawanan PTM, mendapatkan hasil pengelompokkan melalui clustering ensemble, mendapatkan
jumlah cluster yang optimal melalui uji validitas, dan mendapatkan karakteristik dari masing-
masing kelompok faktor kerawanan PTM di kabupaten/ kota Provinsi Jawa Timur tahun 2018.
2. METODOLOGI
banyaknya jumlah cluster pada inisiasi berbeda dalam algoritma pengulangan yang sama
merupakan teknik yang mudah diimplementasikan dan memiliki kompleksitas yang rendah
(Alizadeh, Minaei, & Parvin, 2014).
Generative mechanism dengan pendekatan menggunakan variasi banyaknya jumlah cluster
pada inisiasi awal dalam algoritma pengulangan yang sama dengan menggunakan k-means
menurut Wu, Ma, Cao, Tian, & Alabdulkarim (2018) adalah dengan me-running sebanyak 𝑀 kali
dengan nilai 𝑘 fixed dan center cluster awal yang berbeda, berikut tahapannya:
1. Memilih sebanyak 𝑘 data secara random dari 𝑋 sebagai center cluster awal, lalu menetapkan
objek data ke dalam cluster yang center cluster-nya terdekat. Pengklasteran tersebut
didasarkan pada jarak Euclidean:
𝑝
𝐸 = ∑ ∑ 𝐷(𝑥𝑗 , 𝑐𝑖 ) (3)
𝑖=1 𝑥𝑗 𝜖𝐶𝑖
Pada tahap fungsi konsensus, anggota ensemble yang telah terbentuk pada tahap
sebelumnya akan dikombinasikan untuk mendapat hasil clustering final. Terdapat beberapa
algoritma dalam menentukan fungsi konsensus. Penelitian yang dilakukan oleh (Strehl & Ghosh,
2002) mengemukakan bahwa terdapat tiga pendekatan yang efektif dalam fungsi konsensus, salah
satunya yaitu Cluster-based Similarity Partitioning Algorithm (CSPA). CSPA akan melakukan
pengelompokan hierarki pada tumpukan matriks konsensus untuk mendapatkan label kelas
konsensus.
4
IJCCS ISSN: 1978-1520
1 𝑘
𝐷𝐵 = ∑ 𝑚𝑎𝑥𝑅𝑖,𝑗 (7)
𝑘 𝑖=1
Silhouette Index merupakan indeks dalam bentuk grafik yang ditemukan oleh Peter J.
Rousseeuw pada tahun 1986. Sesuai dengan namanya indeks ini menggunakan grafik siluet untuk
mewakili setiap cluster (Rousseeew, 1987). Nilai rata-rata dari lebar siluet menggambarkan
evaluasi validitas hasil cluster sehingga dapat digunakan untuk memilih cluster yang sesuai.
Dalam Rousseeew (1987), rentang nilai SI adalah -1 hingga 1, semakin mendekati 1, hasil cluster
semakin baik, jika nilai berkisar nol (0), hasil klaster menunjukkan pengelompokkan yang tidak
jelas. Sedangkan untuk pengklasteran dengan nilai silhouette indeks mendekati -1 menujukkan
bahwa pengelompokkan tersebut merupakan pengelompokkan yang salah. Menurut, penelitian
lain yaitu (Charrad, Ghazzali, Boiteau, & Niknafs, 2012) dan (Zhao, Sun, Shimizu, & Kadota,
2018) indeks silhouette yang mendekati 1 menunjukkan bahwa hasil cluster lebih optimal. Untuk
menghitung nilai indeks silhouette berikut formulanya (Khairati, Adlina, Hertono, & Handari,
2019).
𝑁
1
𝑆𝐼 = ∑ 𝑠𝑥𝑖 , (11)
𝑁
𝑖=0
(𝑏𝑞.𝑖 − 𝑎𝑝.𝑖 )
𝑠𝑥𝑖 = ,𝑝 ≠ 𝑞 , (12)
max{𝑏𝑞.𝑖 − 𝑎𝑝.𝑖 }
𝑏𝑞.𝑖 = min 𝑑𝑞.𝑖 , 𝑞 = 1, … , 𝑘 (13)
𝑛𝑞
1
𝑑𝑞.𝑖 = ∑ 𝑑(𝑥𝑖 , 𝑦𝑗 ) , (14)
𝑛𝑞
𝑗−1
𝑛𝑝
1
𝑎𝑝.𝑖 = ∑ 𝑑(𝑥𝑖 , 𝑦𝑘 ) , (15)
𝑛𝑞
𝑘−1
Keterengan:
𝑠𝑥𝑖 : nilai setiap titik pada himpunan data
𝑥𝑖 : titik pada cluster p
𝑦𝑗 : titik pada cluster q
𝑎𝑝.𝑖 : rata-rata jarak titik 𝑥𝑖 ke setiap titik pada cluster p
𝑑𝑞.𝑖 : rata-rata jarak titik 𝑥𝑖 ke setiap titik pada cluster q
5
ISSN: 1978-1520
Unit analisis dalam penelitian ini adalah batas wilayah administratif yaitu terdiri dari 29
kabupaten dan 9 kota di Provinsi Jawa Timur. Data yang digunakan dalam penelitian ini
merupakan data sekunder, yaitu data dari Publikasi Riset Kesehatan Dasar (Riskesdas) Provinsi
Jawa Timur 2018. Data tersebut berupa data prevalensi diabetes militus berdasarkan diagnosa,
prevalensi hipertensi berdasarkan diagnosa, proporsi konsumsi makanan manis, proporsi
konsumsi minuman manis, proporsi konsumsi makanan asin, proporsi konsumsi makanan
berlemak/berkolesterol/gorengan, proporsi kurang konsumsi buah dan sayur, proporsi kurang
aktivitas fisik, proporsi perokok harian, dan prevalensi obesitas sentral. Riskesdas merupakan
survei yang dilakukan oleh Badan Penelitian dan Pengembangan Kesehatan (Badan Litbangkes)
berkerja sama dengan BPS.
Analisis dalam penelitian ini dilakukan menggunakan bantuan aplikasi Rstudio. Berikut
tahapan analisis yang dilakukan untuk mencapai tujuan penelitian:
1. Melakukan analisis eksploratori untuk melihat gambaran setiap faktor PTM kabupaten/kota
di Jawa Timur tahun 2018 yaitu menyajikan mean, standar deviasi, nilai minimum, dan nilai
maksimum menggunakan fungsi Summary(var)
2. Melakukan pengamatan mengenai korelasi antar variabel dengan bantuan fungsi
corrplot(var) pada packagess corrplot
3. Melakukan scalling pada data dikarenakan data memiliki varians yang sangat berbeda antar
variabel. Scalling menggunakan fungsi sweep(data) yang dilakukan berdasarkan selisih
antara nilai minimum dan nilai maksimum.
4. Melakukan clustering ensemble menggunakan packagess dicer. Pertama melakukan
generative mechanism menggunakan fungsi yang bernama consensus_cluster. Dengan
mempertimbangkan kompleksitas dan kemudahan interpretasi, fungsi consensus_cluster
yang digunakan adalah sebagai berikut:
“clustgroup<- consensus_cluster(var, nk=2:5,reps= 1000,
Algorithms=c("km"), distance=c("euclidean"))”
5. Membentuk consensus class dengan cara melakukan ensemble (penggabungan) dari seluruh
anggota ensemble pada generative mechanism sebelumnya. Pembentukan consensus class
menggunakan fungsi consensus yaitu CSPA (Cluster-based Similarity Partitioning
Algorithm) yang terdapat pada packages dicer.
6. Mem-visualisasikan consensus class menggunakan fungsi fvis_cluster yang terdapat dalam
packagess factoextra.
7. Untuk mendapatkan jumlah klaster optimal, menggunakan tiga indeks validitas yaitu indeks
BD, indeks CH, dan Indeks Silhouette. Indeks BD dan CH dihitung dengan bantuan packages
clustersim sedangkan indeks Silhoutte dihitung menggunakan bantuan packagess cluster dan
packages HSAUR.
8. Mengembalikan data hasil cluster ke dalam satuan asli dengan fungsi mutate untuk
mendapatkan mean dan median dari data asli hasil clustering ensemble.
9. melakukan labelling pada hasil pengelompokkan clustering. Guna memudahkan
pengambilan keputusan pada labelling, melakukan scoring pada masing-masing nilai mean
cluster. Cluster dengan nilai mean variabel kerawanan PTM tertinggi mendapatkan skor 2,
mean sedang mendapatkan skor 1 dan mean terendah mendapatkan skor 0. Skor tersebut
selanjutnya dijumlahkan pada masing-masing cluster terbentuk. Cluster dengan skor tertinggi
merupakan cluster (kelompok) dengan tingkat kerawanan yang tinggi.
10. Melakukankah pemetaan wilayah dengan aplikasi Qgis
6
IJCCS ISSN: 1978-1520
(a) (b)
(d)
(c)
Sumber: Hasil olah data
Gambar 1. Hasil clustering ensemble. (a). k=2. (b) k=3. (c) k=4. (d) k=5.
Berdasarkan Gambar 2, hasil clustering ensemble k=2 dan k=3 tidak memiliki
kabupaten/kota yang saling tumpuk antar cluster-nya. Tidak adanya saling tumpuk
menandakan bahwa centroid antar cluster memiliki jarak yang dapat jelas dipisahkan.
Hasil clustering k=3 menunjukkan bahwa antar cluster memiliki jarak yang cukup jauh,
sehingga diprediksi merupakan hasil clustering ensemble terbaik. Namun untuk
memutuskan clustering ensemble terbaik dan teroptimal akan dilakukan uji validasi
terlebih dahulu.
Nilai dim pada hasil fviz merupakan dua dimensi yang diperoleh dari hasil analisis
komponen utama (Kassambara, 2017). Oleh fungsi fviz, seluruh variabel yang digunakan,
dianalisis dengan analisis komponen utama sehingga menghasilkan dua dimensi yang dapat
mewakili variabel yang digunakan. Jika kita lihat pada dimensi 1 sebesar 34,5 persen dan dimensi
2 sebesar 23,5 persen hal tersebut mengandung arti bahwa variasi yang dapat dijelaskan oleh
8
IJCCS ISSN: 1978-1520
kedua dimensi adalah 58 persen. Sehingga variabel yang digunakan dapat menjelaskan variasi
kerawanan PTM sebesar 58 persen, dan sisanya dijelaskan oleh variabel yang tidak digunakan
dalam penelitian.
Berdasarkan kajian literatur, variabel konsumsi alkohol sangat mempengaruhi PTM, namun
demikian penelitian ini tidak menggunakan variabel ini karena ketersedian dan kevalidatan data
variabel ini. di Indonesia konsumsi alkohol merupakan tindakan yang dipandang tabu dan
melanggar hukum agama oleh masyarakat karena mayoritas penduduk Indonesia beragama islam.
Selain itu, karena dianggap tabu, masyarakat yang mempunyai kebiasaan mengkonsumsi alkohol
umumnya menutupi hal tersebut, sehingga data yang diperoleh sangat kecil dan mungkin tidak
sesuia dengan kenyataan di lapangan. Faktanya, beberapa kasus kematian dikarenakan komplikasi
konsumsi alkohol sering dilaporkan.
Menurut Suhaeni, dkk. (2018) nilai DBI yang terkecil menunjukkan hasil cluster yang
terbaik. Selanjutnya, menurut Charrad, dkk.(2012) nilai CHI yang yang semakin besar
menunjukkan hasil yang lebih baik. Untuk SI, menurut Rousseeuw (1987), Charrad, dkk.(2012),
dan Zhao, dkk.(2018), apabila nilai SI semakin mendekati 1 maka hasil cluster semakin optimal.
Berdasarakan (Tabel 2) hasil uji validasi dari ketiga ukuran di atas, didapat kesimpulan bahwa
clustering ensemble berdasakan k-means dengan k=3 merupakan hasil cluster yang paling
optimal. Selanjutnya, guna melakukan evaluasi terhadap masing-masing cluster pada clustering
ensemble berdasakan k-means dengan k=3 digunakan grafik silhouette dari SI sebagai berikut:
9
ISSN: 1978-1520
Berdasarkan hasil uji Silhoutte (Gambar 10) terlihat bahwa clusterpertama mempunyai nilai
silhouette sebesar 0,39. Sedangkan, cluster kedua dan cluster ketiga memiliki nilai di atas 0,5.
Apabila nilai silhoutte semakin mendekati nilai 1 maka hasil pengklasteran dapat dikatakan
semakin optimal. Sebaliknya, apabila nilai indeks silhoutte mendekati -1, hasil pengklasteran
dapat dikatakan semakin tidak optimal. Nilai rata-rata silhoutte yang selanjutnya disebut dengan
indeks silhoutte pada penelitian ini adalah 0,45 dimana hasilnya bernilai positif dan lebih
mendekati nilai 1 sehingga dapat dikatakan hasil pengklasteran telah optimal.
Berdasarkan karakteristik cluster, didapat hasil bahwa kelompok cluster ketiga merupakan
kelompok yang memiliki tingkat kerawanan PTM paling tinggi dibanding kelompok lainnya. Hal
tersebut dapat dilihat melalui Tabel 5, cluster ketiga memiliki 5 variabel dengan nilai rata-rata
tertinggi dan 4 variabel dengan nilai rata-rata sedang sehingga hasil scorring bernilai 14. Berikut
karakteristik masing-masing cluster:
10
IJCCS ISSN: 1978-1520
Cluster pertama merupakan kelompok yang memiliki kerawanan untuk terkena PTM pada
tingkat sedang. Cluster ini memiliki 4 variabel dengan nilai rata-rata tertinggi, 4 variabel dengan
nilai rata-rata sedang, dan skor penilaian kerawanan sebesar 12. selanjutnya cluster pertama akan
disebut dengan kelompok wilayah dengan tingkat kerawanan sedang. cluster kedua ini merupakan
kelompok yang memiliki kerawanan paling rendah, yang selanjutnya disebut dengan kelompok
wilayah dengan tingkat kerawanan rendah. Cluster ketiga merupakan kelompok dengan skor
penilaian kerawanan tertinggi sehingga selanjutnya cluster ketiga ini disebut dengan wilayah
yang memiliki tingkat kerawanan tinggi. Selanjutnya, berdasarkan tingkat kerawanan untuk
terkena penyakit PTM, Kabupaten/Kota di Jawa Timur dapat dipetakan sebagai berikut:
Tabel 1. Keterangan wilayah pada peta tingkat kerawanan PTM di Jawa Timur tahun 2019
Tingkat Tingkat
Kode Wilayah Kode Wilayah
Kerawanan PTM Kerawanan PTM
(1) (2) (3) (1) (2) (3)
11
ISSN: 1978-1520
5.1. Kesimpulan
Berdasarkan pembahasan di atas, tujuan penelitian telah tercapai dengan hasil berupa:
1. Berdasarkan gambaran faktor kerawanan PTM terlihat bahwa kebiasaan kurang konsumsi
buah dan sayur masih sangat tinggi di Jawa Timur.
2. Dengan menggunakan analisis clustering ensemble berdasarkan k-means dengan k=2 sampai
k=5, jarak euclidien, dan fungsi consensus berupa CSPA didapat hasil pengelompokkan
clustering ensemble k=2 sampai k=5.
3. Berdasarkan uji validitas yang digunakan dalam penelitian ini yaitu Davies Bouldin Index
(DBI), Calinski-Harabasz Index (CHI), dan Silhouette Index (SI) disimpulkan clustering
ensemble dengan k=3 merupakan clustering paling optimal untuk mengelompokkan
kabupaten/kota di Jawa Timur berdasakan faktor kerawanan PTM.
4. Berdasarkan hasil clustering ensemble, berikut karakteristik yang terbentuk :
Cluster 1:Merupakan wilayah dengan kerawanan PTM sedang. Memiliki karakteristik konsumsi
minuman manis tinggi, konsumsi makanan asin tinggi, konsumsi makanan berlemak
dan berkolesterol tinggi, dan kebiasaan merokok tinggi.
Cluster 2:Merupakan wilayah dengan kerawanan PTM rendah. Memiliki karakteristik kebiasaan
kurang konsumsi buah dan sayur tinggi.
Cluster 3:Merupakan wilayah dengan kerawanan PTM tinggi. Memiliki karakteristik diabetes
melitus tinggi, hipertensi tinggi, obesitas sentral tinggi, konsumsi makanan manis
tinggi, dan aktifitas fisik masyarakatnya rendah.
5.2. Saran
12
IJCCS ISSN: 1978-1520
Berdasarkan proses analisis dan kesimpulan yang didapatkan, terdapat beberapa saran yang
diberikan. Saran tersebut adalah sebagai berikut:
1. Pemerintah Indonesia sebaiknya segera meningkatkan kualitas sistem data berkaitan PTM di
Indonesia. Peningkatan kualitas sistem data PTM akan memudahkan pemerintah dalam
memantau dan mengevaluasi penanganan PTM sehingga kebijakan yang tepat dapat
diterapkan.
2. Pemerintah kabupaten/kota di Jawa Timur sebaiknya memprioritaskan perbaikan
perencanaan wilayah perkotaan dimana menunjang aktivitas fisik masyarakat. Hal tersebut
dikarenakan dalam penelitian ini didapatkan hasil bahwa wilayah yang memiliki tingkat
kerawanan PTM tinggi merupakan wilayah yang memiliki tingkat urbanisasi tinggi yang
memiliki karakteristik aktivitas fisik rendah dan faktor metabolik yang tinggi. Perbaikan
perencanaan wilayah perkotaan perlu dilakukan terutama pada promosi pentingnya
transportasi umum, jalan kaki, dan kehidupan aktif sebagai kebiasaan hidup, serta
pembangunan fasilitas olahraga umum.
3. Pemerintah kabupaten/kota di Jawa Timur sebaiknya meningkatkan edukasi masyarakat
mengenai makanan dan gizi sehat serta menerapkan pajak dan regulasi terhadap larangan
merokok pada wilayah dengan kerawanan PTM sedang. Hal tersebut dikarenakan wilayah
dengan kerawanan PTM sedang memiliki karakteristik merokok harian yang tinggi dan pola
diet yang tidak baik.
4. Untuk peneliti selanjutnya diharapkan dapat menambah beberapa variabel seperti konsumsi
alkohol, pola tidur, dan konsumsi omega3. Peneliti selanjutnya juga dapat melakukan uji
regresi antara hasil pengelompokan kerawanan PTM dengan variabel sosial-ekonomi-
demografi. Peneliti selanjutnya juga dapat menerapkan clustering ensemble berdasarkan
generative mechanism lain pada penelitiannya guna mengelompokkan suatu permasalahan.
DAFTAR PUSTAKA
(Bappenas), (2019). Rancangan Teknokratik: Rencana Pembangunan Jangka Menengah Nasional 2020-
2024. Jakarta.
Aizenman, N. (2020, Oktober 16). How To Reduce Human Suffering: 3 Lessons From A Seminal Public
Health Study. Retrieved from NPR. Diakses pada tanggal 7 Juni 2021 melalui
https://www.npr.org/sections/goatsandsoda/2020/10/16/924458813/how-to-reduce-human-
suffering-3-lessons-from-a-seminal-public-health-study
Alizadeh, H., Minaei, B., & Parvin, H. (2014). Cluster Ensemble Selection Based on a New Cluster Stability
Measure. Intelligent Data Analysis , 389-408.
Alqurashi, T., & Wang, W. (2019). Clustering Ensemble Method. International Journal of Machine
Learning and Cybernetics, 1227-1246.
Bates, A., & Kalita, J. (2016). Counting Cluster in Twitter Posts. SoDA.
Charrad, M., Ghazzali, N., Boiteau, V., & Niknafs, a. (2012). NbClust Package. An Examination of indices
for Determining the Number of Clusters. HAL .
Choi, K. H., Park, M. S., Kim, J. A., & Lim, J.-A. (2015). Associations Between Excessive Sodium Intake
and Smoking and Alcohol Intake Among Korean Men: KNHANES V. Internationaal Journal of
Environmental Research and Public Health, 15540-15549.
Cini, K., Sawyer, S., Ancha, A., Brown, A., Pearson, O., & Azzopardi, P. (2018). Towards A
Comprehensive NCD Reporting Framework For Indonesia. The Australia-Indonesia Centre.
Haregu, T. N., Wekesah, F. M., Mohamed, S. F., Mutua, M. K., Asiki, G., & Kyobutungi, C. (2018).
Patterns of non-communicable disease and injury risk factors in Kenyan adult population : a cluster
analysis. BMC Public Healrh 18.
Htet, A. S., Bjertness, M. B., Sherpa, L. Y., Kjøllesdal, M. K., Oo, W. M., Meyer, H. E., . . . Bjertness, E.
(2016). Urban-rural differences in the prevalence of non-communicable diseases risk factors among
25–74 years old citizens in Yangon Region, Myanmar: a cross sectional study. BMC Public Health.
13
ISSN: 1978-1520
IHME. (2020, Oktober 15). GBD Compare: Indonesia Both Sexes, All ages, Deaths per 100.000. Retrieved
from Institute for Health Metrics and Evaluation. Diakses pada tanggal 26 Januari 2021 melalui
http://ihmeuw.org/5cqy
IHME. (2020, Oktober 15). GBD Compare: Non-communicable diseases Both sexes, All ages, Deaths.
Retrieved from Institute for Health Metrics and Evaluation. Diakses pada tanggal 26 Januari 2021
melalui http://ihmeuw.org/5cr4
Kartika, L. A., Afifah, E., & Suryani, I. (2016). Asupan lemak dan aktivitas fisik serta hubungannya dengan
kejadian hipertensi pada pasien rawat jalan. Jurnal Gizi dan Dieteik Indonesia vol 4, 139-146.
Kassambara, A. (2017). Practical Guide To Cluster Analysis in R: Unsupervised Machine Learning.
STHDA.
Khairati, A., Adlina, A. A., Hertono, G. F., & Handari, B. D. (2019). Kajian Indeks Validitas pada
Algoritma K-Means Enhanced dan K-Means MMCA. Prosiding Seminar Nasional Matematika 2,
161-170.
Murningtyas, F. S., Larasati, M. D., Rahmawati, A. Y., & Prihatin, S. (2020). Besar Risiko Faktor Fisiologis
dan Faktor Perilaku terhadap Kejadian Sindrom Metabolik. Jurnal Riset Gizi, 11-17.
Rousseeew, P. J. (1987). Sihouettes: A Graphical Aid to The Interpretation and Validation of Cluster
Analysis. Journal of Computational and Applied Mathematics 20, 53-65.
Silva, J. P., Gunathunga, M., & Jayasinghe, S. (2016). Mapping Unhealthy Behavior Among Economically
Active Men Using GIS In Suburban And Rural Areas Of Sri Langka. Asia Pac J Public Health: 28
(1 Suppl), 10S-16S.
Strehl, A., & Ghosh, J. (2002). Cluster Ensembles - A Knowledge Reuse Framework for Combining
Multiple Partitions. Journal of Machine Learning Research 3 , 583-617.
Suhaeni, C., Kurnia, A., & Ristiyanti. (2018). Perbandingan Hasil Pengelompokan menggunakan Analisis
Cluster Berhirarki, K-Means Cluster. dan Cluster Ensemble (Studi Kasus Data Indikator Pelayanan
Kesehatan Ibu Hamil). Media Informasi Vol 14, 31-38.
Trisnadewi, N. W., Widarsih, N. L., & Pramesti, T. A. (2019). Hubungan Obesitas Sentral dan Aktivitas
Fisik dengan Kejadian Diabetes Melitus Tipe 2 Puskesmas III Denpasar Utara. Bali Medika Jurnal.
Vol 6: 2, 119-129
UNFPA, (2014). UNFPA Indonesia Monograph Series No 1: Indonesia on the Treshold of Population
Ageing. Jakarta : UNFPA
Voster, H. (2002). The Emergence of Cardiovaskular Disease during Urbanisation of Africans. Public
Health Nutrition: 5(1A), 239-243.
WHO. (2011). Global Status Report on Noncommunicable Diseases 2010. Geneva: World Health
Organization.
WHO. (2013). Global action plan for the prevention and control of NCDs 2013-2020. Geneva: World
Health Organization. Retrieved from World Health Organization. Diakses pada tanggal 12 Desember
2020 melalui https://www.who.int/nmh/global_monitoring_framework/en/
Wu, X., Ma, T., Cao, J., Tian, Y., & Alabdulkarim, A. (2018). A Comparative Study of Clustering Ensemble
Algorithms. Computers and Electrical Engineering - Elsevier, 603-615.
Zhao, S., Sun, J., Shimizu, K., & Kadota, K. (2018). Silhouette Scores for Arbitrary Defined Groups in
Gene Expression Data and Insights into Differential Expression Results. Biological procedures
online, 20, 5.
LAMPIRAN
2. Obesitas Sentral Merupakan prevalensi obesitas sentral (kumpulan lemak abdominal berlebih yang terdapat
di daerah abdomen atau perut) yaitu jumlah pada penduduk usia ≥ 15 tahun . Dengan lingkar
perut pada : Laki-laki > 90 cm dan Perempuan > 80 cm dibagi dnegan jumlah penduduk
usia ≥ 15 tahun yang diukur lingkar perut
3. Hipertensi Merupakan prevalensi hipertensi menurut diagnosa dokter, yaitu ART yang pernah
didiagnosis hipertensi oleh dokter dibagi dengan ART umur ≥ 18 tahun
14
IJCCS ISSN: 1978-1520
4. Konsumsi Makanan Manis Merupakan Proporsi pola kebiasaan konsumsi makanan manis ≥ 1 kali per hari, yaitu ART
usia ≥ 3 tahun dengan pola kebiasaan konsumsi makanan manis ≥ 1 kali per hari dibagi
semua ART usia ≥ 3 tahun
5. Konsumsi Minuman Manis Merupakan Proporsi pola kebiasaan konsumsi minuman manis ≥ 1 kali per hari, yaitu ART
usia ≥ 3 tahun dengan pola kebiasaan konsumsi minuman manis ≥ 1 kali per hari dibagi
semua ART usia ≥ 3 tahun
6. Konsumsi Makanan Asin Merupakan Proporsi pola kebiasaan konsumsi makanan asin ≥ 1 kali per hari, yaitu ART
usia ≥ 3 tahun dengan pola kebiasaan konsumsi makanan asin ≥ 1 kali per hari dibagi semua
ART usia ≥ 3 tahun
7. Konsumsi Makanan Merupakan Proporsi pola kebiasaan konsumsi makanan Berlemak/ Berkolesterol/Gorengan
Berlemak/ ≥ 1 kali per hari, yaitu ART usia ≥ 3 tahun dengan pola kebiasaan konsumsi makanan
Berkolesterol/Gorengan Berlemak/ Berkolesterol/Gorengan ≥ 1 kali per hari dibagi semua ART usia ≥ 3 tahun
8. Kurang Konsumsi Merupakan Proporsi pola kebiasaan konsumsi buah/sayur <5 porsi per hari dalam
Buah/Sayur seminggu, yaitu 100 % dikurangi ART usia ≥ 5 tahun dengan pola kebiasaan konsumsi
buah/sayur ≥ 5 porsi per hari dalam seminggu dibagi semua ART usia ≥ 5 tahun
9. Merokok harian Merupakan proporsi pola kebiasaan merokok, yaitu ART usia ≥ 10 tahun dengan pola
kebiasaan merokok setiap hari dibagi semua ART usia ≥ 10 tahun
10. Kurang Aktivitas Fisik Merupakan proporsi kurang aktivitas fisik pada penduduk umur ≥ 10 tahun, yaitu ART usia
≥ 10 tahun dengan pola kebiasaan kurang aktifitas fisik dibagi dengan semua ART usia ≥
10 tahun
15