Abs Trak

Hari, Tanggal Seminar : Rabu, 30 Juni 2021
Ruang/Sesi/ Pukul Seminar : R. 266/ 2/ 09.30-10.30 WIB
Penerapan Clustering Ensemble pada Kabupaten/Kota

Rawan Penyakit Tidak Menular di Jawa Timur
‘Aisyah Baratut Taqiyyah*1, Tiodora Hadumaon Siagian2

1
IVSK1/211709514
e-mail: *1211709514@stis.ac.id, 2theo@stis.ac.id
Abstrak
Penyakit tidak menular (PTM) merupakan penyebab kematian utama baik di dunia maupun
Indonesia. Meskipun memiliki kondisi tersebut, kebijakan Indonesia belum berfokus pada PTM.
Media untuk menggambarkan kondisi PTM Indonesia secara keseluruhan sangatlah terbatas.
Jawa Timur memiliki jumlah kasus kematian disebabkan oleh PTM terbanyak dan merupakan
penyumbang populasi tua terbanyak di Indonesia. Dalam penelitian ini dilakukan upaya
menggambarkan kondisi PTM di Jawa Timur. Data yang digunakan dalam penelitian ini
merupakan faktor-faktor kerawanan PTM yang berasal dari data Riskesdas Jawa Timur tahun
2018. Metode yang digunakan dalam penelitian ini adalah clustering ensemble based k-means.
Setelah melalui uji validasi dengan Davies-Bouldin index, Calinski Harabasz index, dan Silhoutte
index, diperoleh bahwa clustering ensemble based k-means dengan k=3 merupakan solusi
terbaik. Berdasarkan hasil clustering, didapat 3 kelompok kerawanan yaitu rendah, sedang, dan
tinggi. Wilayah dengan kerawanan PTM tinggi merupakan wilayah dengan karakteristik diabetes
melitus, obesitas sentral, hipertensi, konsumsi makanan manis, dan kurang aktivitas fisik yang
lebih tinggi dibandingkan kelompok kerawanan lain. Wilayah tersebut merupakan wilayah
dengan urbanisasi tinggi yaitu Kota Surabaya, Kota Madiun, Kota Mojokerto, Kota Pasuruan,
Kota Probolinggo, Kota Malang, Kota Blitar, Kabupaten Gresik, dan Kabupaten Sidoarjo.
Kata kunci—clustering ensemble, Penyakit Tidak Menular, k-means
Abstract
Non-communicable diseases (NCDs) are the main causes of death in both the world and
Indonesia. Despite these conditions, Indonesia's policy does not focus on PTM. Media to describe
the condition of PTM Indonesia as a whole is very limited. East Java has the highest number of
deaths caused by PTM and is the largest contributor to the elderly population in Indonesia. So
this study an attempt will be made to describe the condition of PTM in East Java. The data used
in this study are PTM susceptibility factors from the publication of Riskesdas East Java in 2018.
The method used is clustering ensemble based k-means. After going through the validation test
with BD index, CH index, and Silhoutte index, it was found that clustering ensemble based on k-
means with k=3 is the best solution. There are groups of susceptibility, labelled as low, medium,
and high. Areas with high NCDs susceptibility are areas with characteristics of diabetes mellitus,
central obesity, hypertension, consumption of sweet foods, and lack of physical activity that are
higher than other groups. These areas are areas with high urbanization, namely city of Surabaya,
Madiun, Mojokerto, Pasuruan, Probolinggo, Malang, Blitar, and regency of Gresik, and
Sidoarjo.
Keywords—clustering ensemble, Non-communicable diseases, k-means
1
 ISSN: 1978-1520
1. PENDAHULUAN
Terjadinya transisi epidemiologi mengakibatkan penyakit tidak menular (PTM) menjadi

penyebab kematian utama tak hanya di dunia namun juga di Indonesia. Berdasarkan data yang
diperoleh dari visualisasi (IHME, 2020), PTM menyebabkan 77.83% kematian dari total kematian
yang terjadi pada tahun 2019 di Indonesia. Dikutip dari website National Public Radio (NPR),
menurut Christoper Murray dari Institut for Health Metrics and Evaluation (IHME) menyatakan
bahwa lebih dari 80 persen masalah kesehatan di Indonesia merupakan PTM (Aizenman, 2020).
Murray juga menambahkan, meskipun memiliki kondisi tersebut, kebijakan Indonesia belum
berfokus pada PTM. Pernyataan Murray tersebut sesuai dengan keadaan di Indonesia.
Berdasarkan RPJMN 2020-2024, indikator PTM yang menjadi target pembangunan adalah hanya
menurunkan prevalensi merokok remaja dan menjaga agar prevalensi obesitas tidak meningkat
(Bappenas, 2019). Kedua indikator tersebut belumlah mampu menyelesaikan permasalahan
PTM di Indonesia.
Indonesia belum memiliki suatu ukuran untuk menggambarkan kondisi PTM secara
keseluruhan misalnya data jumlah penduduk yang meninggal akibat PTM dan jumlah kasus PTM.
Guna menggambarkan kondisi PTM, Indonesia hanya menggunakan data dari hasil Riskesdas
yang dilakukan setiap 5 tahun sekali, yaitu berupa data prevalensi penyakit kardiovaskuler,
diabetes, kanker, dan pernapasan kronis. Padahal cakupan untuk PTM lebih luas dari data yang
tersedia tersebut (Cini, et al., 2018). Keabsenan data tersebut dikarenakan PTM merupakan
penyakit yang susah untuk diukur di Indonesia. Dapat dikatakan susah untuk diukur karena pasien
PTM di Indonesia mempunyai kecenderungan untuk melakukan penanganan terhadap PTM
ketika sudah menjadi akut bahkan telah terjadi komplikasi.
Berdasarkan data IHME (2020), provinsi di Indonesia yang memiliki jumlah kasus
kematian disebabkan oleh PTM terbanyak adalah Jawa Timur. Selain itu, hasil Sensus Penduduk
2010 menunjukkan Provinsi Jawa Timur merupakan penyumbang populasi tua terbanyak di
Indonesia yaitu sebesar 21,6 persen. Menurut Sri Moertiningsih Adioetomo dan Ghazy
Mujahid diprediksi peningkatan jumlah lansia di Jawa Timur akan menjadi yang tercepat
di Indonesia yaitu sebesar 24,2 persen selama tahun 2010-2035 (UNFPA, 2014). Dimana
populasi lansia sangatlah rentan terkena PTM. Meskipun demikian, dalam RPJMD tahun 2019-
2024 Provinsi Jawa Timur belum menunjukkan adanya target dalam penanganan PTM. Kondisi
tersebut membuat Jawa Timur menjadi provinsi yang harus segera mendapatkan perhatian dan
penanganan serius untuk mengurangi kerawanan PTM.
Salah satu tindakan pencegahan untuk mengurangi kerawanan PTM adalah penanganan
berbasis kelompok/populasi (WHO, 2011). Penanganan PTM berbasis populasi merupakan
penanganan yang cocok digunakan pada negara berpendapatan rendah menengah karena
memerlukan biaya yang lebih murah dibandingkan penangan individu namun dengan hasil yang
tetap efektif. Langkah utama untuk melakukan penanganan PTM berbasis populasi adalah dengan
mengetahui gambaran kerawanan pada berbagai populasi. Dengan keterbatasan data mengenai
PTM, tindakan yang dapat dilakukan di Indonesia adalah dengan membedakan ataupun
mengelompokkan suatu populasi berdasarkan faktor-faktor kerawanan PTM.
Dalam mengamati perbedaan faktor kerawanan PTM antar kelompok populasi, Silva,
Gunathunga, & Jayasinghe (2016) melakukan pemetaan faktor risiko PTM terhadap kelompok
populasi yang berbeda dengan menggunakan Sistem Informasi Geografis (SIG). Penelitian yang
tersebut menganalisis perbedaan unhealthy behavior berupa pola konsumsi alkohol dan pola
konsumsi rokok pada laki-laki pelaku ekonomi daerah pinggiran kota dan perdesaan di Sri Lanka
untuk mengidentifikasikan beban PTM. Sedangkan penelitian yang dilakukan Haregu, dkk.,
(2018) menggunakan clustering K-Medians guna menangkap perbedaan faktor-faktor risiko PTM
terhadap berbagai kelompok sosial demografi di Kenya. Penelitian ini akan berupaya
menggambarkan kondisi PTM di Indonesia, khususnya Jawa Timur melalui clustering terhadap
faktor kerawanan PTM. Meskipun hasil dari analisis cluster tidak berupa besaran nilai, akan tetapi
2
IJCCS ISSN: 1978-1520
dengan melakukan analisis cluster, kelompok wilayah yang paling membutuhkan penanganan
dapat diprioritaskan sesuai dengan hasil labelling pada cluster terbentuk.
Dalam analisis clustering, kita sering dihadapkan pada permasalahan kualitas data yang tak
menentu, baik noise, outlier, maupun terjadi pelanggaran klasik. Beberapa algoritma clustering
khususnya algoritma tunggal tak dapat mentolerir permasalahan tersebut. Penggunaan algoritma
clustering tunggal pada data noise, outlier dan terjadi pelanggaran klasik menyebabkan penentuan
jumlah cluster (kelompok) pada data menjadi kurang tepat. Clustering ensemble merupakan salah
satu penyelesaian terhadap permasalahan tersebut. Dalam penelitian Topchy, Jain, & Punch
(2005); Strehl & Ghosh, 2002 menyatakan bahwa clustering ensemble cocok dan lebih powerfull
digunakan untuk berbagai jenis dataset serta robust pada data yang mengandung noise dan outlier.
Selain itu, clustering ensemble dapat digunakan pada data yang tidak berdistribusi normal
(Chrisinta, Sumertajaya, & Indahwati, 2020). Oleh karena itu, penelitian ini akan menggunakan
analisis cluster ensemble untuk menggambarkan kondisi kerawanan PTM di Jawa Timur. Adapun
tujuan yang ingin dicapai dalam penelitian ini adalah untuk mengetahui gambaran umum
kerawanan PTM, mendapatkan hasil pengelompokkan melalui clustering ensemble, mendapatkan
jumlah cluster yang optimal melalui uji validitas, dan mendapatkan karakteristik dari masing-
masing kelompok faktor kerawanan PTM di kabupaten/ kota Provinsi Jawa Timur tahun 2018.
2. METODOLOGI
2.1. Penyakit Tidak Menular

Penyakit tidak menular (PTM) merupakan suatu penyakit yang tidak dapat ditularkan dan
ditransmisikan dari seseorang kepada orang lain. WHO mencetuskan sebuah kerangka kerja
pemantauan global guna mencegah PTM dan faktor risiko utamanya (WHO, 2013). Dalam
kerangka kerja tersebut terdapat dua faktor menyebabkan seseorang menderita penyakit tidak
menular yaitu faktor behavioral dan faktor metabolik. Faktor behavioral terdiri dari konsumsi
alkohol berbahaya, rendahnya konsumsi buah sayur, kurangnya aktivitas fisik, konsumsi garam
berlebbih, konsumsi lemak jenuh, dan merokok. Sedangkan faktor risiko metabolik terdiri dari
kenaikan gula darah, kenaikan tekanan darah, kelebihan berat badan dan obesitas, serta kenaikan
kolesterol total.
Faktor metabolik dapat didefinisikan sebagai kumpulan faktor kelainan metabolik yang
berhubungan dengan PTM seperti hipertensi, kadar gula darah puasa tinggi, dan obesitas sentral
(Murningtyas, Larasati, Rahmawati, & Prihatin, 2020). Sedangkan faktor risiko behavioral
merupakan kumpulan faktor kebiasaan yang tidak baik yang secara tidak langsung dapat
mempengaruhi PTM meliputi pola makan tidak sehat, kurang aktifitas fisik, merokok, dan
mengkonsumsi alkohol (WHO, 2013).
2.2. Clustering Ensemble

clustering ensemble merupakan sebuah metode clustering yang menggabungkan beberapa
partisi dari satu set objek ke dalam satu cluster konsolidasi tanpa perlu mengakses fitur maupun
algoritma yang menentukan partisi tersebut (Strehl & Ghosh, 2002). Berdasarkan penelitian yang
dilakukan Strehl & Ghosh (2002), Wu, Ma, Cao, Tian, & Alabdulkarim (2018) dan Alqurashi &
Wang (2019) clustering ensemble memiliki tahapan sebagai berikut:
1. Tahap pertama adalah menghasilkan anggota ensemble (Generative mechanism).
2. Tahap kedua adalah mengkombinasikan anggota ensemble tersebut untuk mendapatkan
partisi final (Fungsi Konsensus).
Tahap generative mechanism memilik tujuan untuk meng-generate 𝑚 model-model
clustering sebagai anggota untuk membentuk ensemble. Salah satu cara dalam melakukan
penndekatan teknik generate yang dikemukakan oleh Strehl & Ghosh (2002) adalah
menggunakan variasi banyaknya ataupun lokasi dari pusat cluster awal dalam algoritma
pengulangan yang sama. Misalnya dengan menerapkan k-means. Menggunakan variasi
3
 ISSN: 1978-1520
banyaknya jumlah cluster pada inisiasi berbeda dalam algoritma pengulangan yang sama
merupakan teknik yang mudah diimplementasikan dan memiliki kompleksitas yang rendah
(Alizadeh, Minaei, & Parvin, 2014).
Generative mechanism dengan pendekatan menggunakan variasi banyaknya jumlah cluster
pada inisiasi awal dalam algoritma pengulangan yang sama dengan menggunakan k-means
menurut Wu, Ma, Cao, Tian, & Alabdulkarim (2018) adalah dengan me-running sebanyak 𝑀 kali
dengan nilai 𝑘 fixed dan center cluster awal yang berbeda, berikut tahapannya:
1. Memilih sebanyak 𝑘 data secara random dari 𝑋 sebagai center cluster awal, lalu menetapkan
objek data ke dalam cluster yang center cluster-nya terdekat. Pengklasteran tersebut
didasarkan pada jarak Euclidean:
𝑝
𝐷(𝑥𝑗 , 𝑐𝑖 ) = ‖𝑥𝑗 − 𝑐𝑖 ‖ = √∑(𝑥𝑗𝑠 − 𝑐𝑖𝑠 )2 (1)

2
𝑠=1
2. Memperbaharui center cluster baru sebagai centroid di setiap cluster dengan melihat rata-rata
anggota
1
𝑐𝑖 = ∑ 𝑥𝑗 (2)
𝑁𝑖
𝑥𝑗 𝜖𝐶𝑖
3. Mengulangi tahap 1 dan 2 hingga tidak terdapat perubahan dalam centroid atau fungsi
eucledian minimum
𝑘
𝐸 = ∑ ∑ 𝐷(𝑥𝑗 , 𝑐𝑖 ) (3)
𝑖=1 𝑥𝑗 𝜖𝐶𝑖
Pada tahap fungsi konsensus, anggota ensemble yang telah terbentuk pada tahap
sebelumnya akan dikombinasikan untuk mendapat hasil clustering final. Terdapat beberapa
algoritma dalam menentukan fungsi konsensus. Penelitian yang dilakukan oleh (Strehl & Ghosh,
2002) mengemukakan bahwa terdapat tiga pendekatan yang efektif dalam fungsi konsensus, salah
satunya yaitu Cluster-based Similarity Partitioning Algorithm (CSPA). CSPA akan melakukan
pengelompokan hierarki pada tumpukan matriks konsensus untuk mendapatkan label kelas
konsensus.
2.3. Index Validitas

Davies-Bouldin (DB) Index merupakan indeks yang menggunakan kohesi dan separasi
untuk mengukur validitas cluster pada sebuah metode pengklasteran ( (Suhaeni, Kurnia, &
Ristiyanti, 2018); (Bates & Kalita, 2016). Pada indeks DB ini, clustering dengan hasil maksimum
merupakan cluster yang mempunyai nilai DB yang terkecil (Suhaeni, Kurnia, & Ristiyanti, 2018).
Menurut (Bates & Kalita, 2016)perhitungan indeks DB dimulai dengan menghitung dispersi
masing-masing cluster sebagai simpangan baku antara setiap data dalam cluster dengan centroid
(Persamaan 6). Selain itu, indeks DB juga menghitung jarak antar cluster sebagai jarak antara
masing-masing pasangan cluster. Selanjutnya, untuk setiap pasangan cluster, dispersi cluster
tersebut dijumlahkan dan kemuadian dibagi dengan jarak antar kedua cluster. 𝑅𝑖 merupakan
ukuran kesamaan cluster ( (Bates & Kalita, 2016) Untuk mendapat nilai indeks DB, langkah
terakhir adalah menemukan rata-rata dari ukuran kesamaan (𝑅𝑖 ) maksimum.
1
𝑆𝑖 = ∑ 𝐷(𝑥𝑗 , 𝑐𝑖 ) (4)
𝑁𝑖
∀𝜖𝐶𝑖
2
𝑑𝑖𝑗 = ‖𝑐𝑖 − 𝑐𝑗 ‖ (5)
𝑆𝑖 + 𝑆𝑗
𝑅𝑖,𝑗= (6)
𝑑𝑖𝑗
4
1 𝑘
𝐷𝐵 = ∑ 𝑚𝑎𝑥𝑅𝑖,𝑗 (7)
𝑘 𝑖=1
Calinski-Harabasz (CH) Index diperoleh dengan cara mengalikan perbandingan separation

dan compactness dengan faktor normalisasi (Khairati, Adlina, Hertono, & Handari, 2019).
Separation merupakan nilai Sum of Square between cluster (SSB), compactness merupakan nilai
Sum of Square within-cluster (SSW). Semakin besar nilai index CH menunjukkan hasil cluster
yang lebih baik (Charrad, Ghazzali, Boiteau, & Niknafs, 2012).
𝑘
𝑆𝑆𝐵 = ∑ 𝑁𝑖 (𝑥̅𝑖 − 𝑥̅ ) (𝑥̅𝑖 − 𝑥̅ )𝑇 (8)

𝑖=1
𝑘
𝑆𝑆𝑊 = ∑ ∑ (𝑥𝑗 − 𝑥̅𝑖 )(𝑥𝑗 − 𝑥̅𝑖 )𝑇 (9)

𝑖=1 𝑥𝑖 ∈𝐶𝑖
𝑡𝑟𝑎𝑐𝑒(𝑆𝑆𝐵) 𝑁−𝑘
𝐶𝐻 = × (10)
𝑡𝑟𝑎𝑐𝑒 (𝑆𝑆𝑊) 𝑘−1
Silhouette Index merupakan indeks dalam bentuk grafik yang ditemukan oleh Peter J.
Rousseeuw pada tahun 1986. Sesuai dengan namanya indeks ini menggunakan grafik siluet untuk
mewakili setiap cluster (Rousseeew, 1987). Nilai rata-rata dari lebar siluet menggambarkan
evaluasi validitas hasil cluster sehingga dapat digunakan untuk memilih cluster yang sesuai.
Dalam Rousseeew (1987), rentang nilai SI adalah -1 hingga 1, semakin mendekati 1, hasil cluster
semakin baik, jika nilai berkisar nol (0), hasil klaster menunjukkan pengelompokkan yang tidak
jelas. Sedangkan untuk pengklasteran dengan nilai silhouette indeks mendekati -1 menujukkan
bahwa pengelompokkan tersebut merupakan pengelompokkan yang salah. Menurut, penelitian
lain yaitu (Charrad, Ghazzali, Boiteau, & Niknafs, 2012) dan (Zhao, Sun, Shimizu, & Kadota,
2018) indeks silhouette yang mendekati 1 menunjukkan bahwa hasil cluster lebih optimal. Untuk
menghitung nilai indeks silhouette berikut formulanya (Khairati, Adlina, Hertono, & Handari,
2019).
𝑁
1
𝑆𝐼 = ∑ 𝑠𝑥𝑖 , (11)
𝑁
𝑖=0
(𝑏𝑞.𝑖 − 𝑎𝑝.𝑖 )
𝑠𝑥𝑖 = ,𝑝 ≠ 𝑞 , (12)
max{𝑏𝑞.𝑖 − 𝑎𝑝.𝑖 }
𝑏𝑞.𝑖 = min 𝑑𝑞.𝑖 , 𝑞 = 1, … , 𝑘 (13)
𝑛𝑞
1
𝑑𝑞.𝑖 = ∑ 𝑑(𝑥𝑖 , 𝑦𝑗 ) , (14)
𝑛𝑞
𝑗−1
𝑛𝑝
1
𝑎𝑝.𝑖 = ∑ 𝑑(𝑥𝑖 , 𝑦𝑘 ) , (15)
𝑛𝑞
𝑘−1
Keterengan:
𝑠𝑥𝑖 : nilai setiap titik pada himpunan data
𝑥𝑖 : titik pada cluster p
𝑦𝑗 : titik pada cluster q
𝑎𝑝.𝑖 : rata-rata jarak titik 𝑥𝑖 ke setiap titik pada cluster p
𝑑𝑞.𝑖 : rata-rata jarak titik 𝑥𝑖 ke setiap titik pada cluster q
2.4. Metode Pengumpulan Data
5
 ISSN: 1978-1520
Unit analisis dalam penelitian ini adalah batas wilayah administratif yaitu terdiri dari 29
kabupaten dan 9 kota di Provinsi Jawa Timur. Data yang digunakan dalam penelitian ini
merupakan data sekunder, yaitu data dari Publikasi Riset Kesehatan Dasar (Riskesdas) Provinsi
Jawa Timur 2018. Data tersebut berupa data prevalensi diabetes militus berdasarkan diagnosa,
prevalensi hipertensi berdasarkan diagnosa, proporsi konsumsi makanan manis, proporsi
konsumsi minuman manis, proporsi konsumsi makanan asin, proporsi konsumsi makanan
berlemak/berkolesterol/gorengan, proporsi kurang konsumsi buah dan sayur, proporsi kurang
aktivitas fisik, proporsi perokok harian, dan prevalensi obesitas sentral. Riskesdas merupakan
survei yang dilakukan oleh Badan Penelitian dan Pengembangan Kesehatan (Badan Litbangkes)
berkerja sama dengan BPS.
2.5. Metode Analisis
Analisis dalam penelitian ini dilakukan menggunakan bantuan aplikasi Rstudio. Berikut
tahapan analisis yang dilakukan untuk mencapai tujuan penelitian:
1. Melakukan analisis eksploratori untuk melihat gambaran setiap faktor PTM kabupaten/kota
di Jawa Timur tahun 2018 yaitu menyajikan mean, standar deviasi, nilai minimum, dan nilai
maksimum menggunakan fungsi Summary(var)
2. Melakukan pengamatan mengenai korelasi antar variabel dengan bantuan fungsi
corrplot(var) pada packagess corrplot
3. Melakukan scalling pada data dikarenakan data memiliki varians yang sangat berbeda antar
variabel. Scalling menggunakan fungsi sweep(data) yang dilakukan berdasarkan selisih
antara nilai minimum dan nilai maksimum.
4. Melakukan clustering ensemble menggunakan packagess dicer. Pertama melakukan
generative mechanism menggunakan fungsi yang bernama consensus_cluster. Dengan
mempertimbangkan kompleksitas dan kemudahan interpretasi, fungsi consensus_cluster
yang digunakan adalah sebagai berikut:
“clustgroup<- consensus_cluster(var, nk=2:5,reps= 1000,
Algorithms=c("km"), distance=c("euclidean"))”
5. Membentuk consensus class dengan cara melakukan ensemble (penggabungan) dari seluruh
anggota ensemble pada generative mechanism sebelumnya. Pembentukan consensus class
menggunakan fungsi consensus yaitu CSPA (Cluster-based Similarity Partitioning
Algorithm) yang terdapat pada packages dicer.
6. Mem-visualisasikan consensus class menggunakan fungsi fvis_cluster yang terdapat dalam
packagess factoextra.
7. Untuk mendapatkan jumlah klaster optimal, menggunakan tiga indeks validitas yaitu indeks
BD, indeks CH, dan Indeks Silhouette. Indeks BD dan CH dihitung dengan bantuan packages
clustersim sedangkan indeks Silhoutte dihitung menggunakan bantuan packagess cluster dan
packages HSAUR.
8. Mengembalikan data hasil cluster ke dalam satuan asli dengan fungsi mutate untuk
mendapatkan mean dan median dari data asli hasil clustering ensemble.
9. melakukan labelling pada hasil pengelompokkan clustering. Guna memudahkan
pengambilan keputusan pada labelling, melakukan scoring pada masing-masing nilai mean
cluster. Cluster dengan nilai mean variabel kerawanan PTM tertinggi mendapatkan skor 2,
mean sedang mendapatkan skor 1 dan mean terendah mendapatkan skor 0. Skor tersebut
selanjutnya dijumlahkan pada masing-masing cluster terbentuk. Cluster dengan skor tertinggi
merupakan cluster (kelompok) dengan tingkat kerawanan yang tinggi.
10. Melakukankah pemetaan wilayah dengan aplikasi Qgis
6
3. HASIL DAN PEMBAHASAN
3.1. Gambaran Umum Faktor Kerawanan PTM

Pada penelitian ini, cakupan variabel yang digunakan dalam clustering ensemble terdiri dari
10 variabel kerawanan PTM pada 38 kabupaten/kota di Jawa Timur pada tahun 2018. Variabel
tersebut terdiri dari 3 variabel merupakan faktor metabolik dan 7 variabel merupakan faktor
behavioral. Berikut gambaran umum dari setiap variabel yang digunakan dalam penelitian:
Tabel 1. Gambaran umum faktor kerawanan PTM
Standar Nilai Nilai
Variabel Mean
Deviasi Minimum Maximum
(1) (2) (3) (4) (5)
Diabetes Melitus 2.091 0.8524 0.750 4.220
Obesitas Sentral 30.590 6.7444 18.230 44.180
Hipertensi 7.988 1.3987 4.240 10.890
Makanan Manis 30.670 7.3231 14.550 50.690
Minuman Manis 57.400 11.6162 24.030 80.860
Makanan Asin 27.470 10.5574 4.710 49.710
Makanan
50.190 15.0384 12.680 75.200
Berkolesterol
Kurang Buah dan
93.820 5.1629 74.210 99.690
Sayur
Merokok 23.490 2.8654 18.740 29.920
Kurang Aktivitas
26.160 7.5750 16.170 43.870
Fisik
Sumber: Publikasi Riskesdas Jawa Timur 2018, diolah
Tabel 1 menunjukkan bahwa berdasarkan rata-rata antar wilayah kabupaten/kota di Jawa

Timur, terdapat 2 orang dari 100 penduduk memiliki gangguan dibetes melitus pada tahun 2018.
Terdapat 31 orang dari 100 penduduk yang berusia sama dengan atau di atas 15 tahun yang
mengalami obesitas sentral. Terdapat 8 orang dari 100 penduduk yang berusia sama dengan atau
di atas 18 tahun yang pernah didiagnosa mengalami hipertensi oleh dokter. Selanjutnya, 31 persen
dari seluruh penduduk yang berusia sama dengan atau di atas 3 tahun memiliki kebiasaan
mengkonsumsi makanan manis minimal 1 kali dalam sehari, 57 persen memiliki kebiasaan
mengkonsumsi minuman manis minimal 1 kali dalam sehari, dan 50 persen memiliki kebiasaan
mengkonsumsi makanan berlemak dan berkolesterol minimal 1 kali dalam sehari.
Selanjutnya, 94 persen dari seluruh penduduk berusia sama dengan atau 5 tahun ke atas
memiliki kebiasaan mengkonsumsi buah dan sayur kurang dari anjuran WHO yaitu 5 porsi per
hari dalam seminggu terakhir. 23 persen dari seluruh penduduk berusia minimal 10 tahun ke atas
memiliki kebiasaan merokok setiap hari dan 26 persen memiliki kebiasaan kurang melakukan
aktifitas fisik. Berdasarkan nilai standar deviasi variabel kerawanan PTM, terlihat bahwa terjadi
ketidakmerataan antar wilayah kabupaten/kota di Jawa Timur. Ketidakmerataan tersebut
menandakan bahwa kabupaten/kota di Jawa Timur mempunyai faktor risiko PTM yang berbeda
antara satu wilayah dengan wilayah lainnya.
3.2. Hasil Clustering Ensemble

Clustering ensemble merupakan suatu metode clustering yang menggabungkan beberapa
partisi berbentuk algoritma maupun fitur menggunakan fungsi consensus sehingga terbentuk hasil
clustering akhir. Dalam analisis cluster ensemble, terdapat generative mechanism yang
merupakan tahapan penggabungan atau disebut ensemble. Ensemble tersebut menurut Strehl dan
Ghosh (2002) dapat dilakukan dengan berbagai cara salah satunya dengan menggunakan
ensemble terhadap inisiasi pada algoritma yang sama. Pada tahap generative mechanism tersebut,
7
 ISSN: 1978-1520
akan dihasilkan sebuah matriks consensus. Selanjutnya, untuk melakukan pengelompokan,

matriks consensus akan diproses oleh fungsi konsensus. Terdapat beberapa fungsi konsesus, salah
satunya adalah Cluster-based Similarity Partitioning Algorithm (CSPA). CSPA akan melakukan
pengelompokan hierarki pada tumpukan matriks konsensus untuk mendapatkan label kelas
konsensus. Dalam penelitian ini, digunakan analisis cluster ensemble dengan generative
mechanism berupa beda iterasi pada algoritma k-means. Nilai k yang digunakan dalam generative
mechanism adalah 2,3,4,dan, 5. Pada tahapan generative mechanism juga digunakan jarak
ecluidean dan repitisi sebanyak 1000 kali. Selanjutnya, matriks konsensus diproses oleh CSPA
sehingga menghasilkan pengelompokkan sebagai berikut:
(a) (b)
(d)
(c)
Sumber: Hasil olah data
Gambar 1. Hasil clustering ensemble. (a). k=2. (b) k=3. (c) k=4. (d) k=5.
Berdasarkan Gambar 2, hasil clustering ensemble k=2 dan k=3 tidak memiliki
kabupaten/kota yang saling tumpuk antar cluster-nya. Tidak adanya saling tumpuk
menandakan bahwa centroid antar cluster memiliki jarak yang dapat jelas dipisahkan.
Hasil clustering k=3 menunjukkan bahwa antar cluster memiliki jarak yang cukup jauh,
sehingga diprediksi merupakan hasil clustering ensemble terbaik. Namun untuk
memutuskan clustering ensemble terbaik dan teroptimal akan dilakukan uji validasi
terlebih dahulu.
Nilai dim pada hasil fviz merupakan dua dimensi yang diperoleh dari hasil analisis
komponen utama (Kassambara, 2017). Oleh fungsi fviz, seluruh variabel yang digunakan,
dianalisis dengan analisis komponen utama sehingga menghasilkan dua dimensi yang dapat
mewakili variabel yang digunakan. Jika kita lihat pada dimensi 1 sebesar 34,5 persen dan dimensi
2 sebesar 23,5 persen hal tersebut mengandung arti bahwa variasi yang dapat dijelaskan oleh
8
kedua dimensi adalah 58 persen. Sehingga variabel yang digunakan dapat menjelaskan variasi
kerawanan PTM sebesar 58 persen, dan sisanya dijelaskan oleh variabel yang tidak digunakan
dalam penelitian.
Berdasarkan kajian literatur, variabel konsumsi alkohol sangat mempengaruhi PTM, namun
demikian penelitian ini tidak menggunakan variabel ini karena ketersedian dan kevalidatan data
variabel ini. di Indonesia konsumsi alkohol merupakan tindakan yang dipandang tabu dan
melanggar hukum agama oleh masyarakat karena mayoritas penduduk Indonesia beragama islam.
Selain itu, karena dianggap tabu, masyarakat yang mempunyai kebiasaan mengkonsumsi alkohol
umumnya menutupi hal tersebut, sehingga data yang diperoleh sangat kecil dan mungkin tidak
sesuia dengan kenyataan di lapangan. Faktanya, beberapa kasus kematian dikarenakan komplikasi
konsumsi alkohol sering dilaporkan.
3.3. Uji Validasi

Uji validasi pada analisis cluster digunakan untuk menetukan cluster terbaik dari beberapa
hasil cluster berbeda. Namun, dalam penelitian ini, uji validasi pada clustering ensemble
berdasarkan k-means berbeda inisiasi digunakan untuk menetukan ukuran clustering ensemble
terbaik. Dalam penelitian ini, digunakan tiga ukuran guna memutuskan mana ukuran clustering
ensemble yang paling optimal, paling optimal, paling maksimum, dan terbaik, ketiga ukuran
validasi tersebut adalah Davies Bouldin Index (DBI), Calinski-Harabasz Index (CHI), dan
Silhouette Index (SI)
Tabel 3. Uji Validasi
K cluster
DBI CHI SI
ensemble
(1) (2) (3) (4)
2 1,9763 9,1699 0,32
3 1, 2477 13,8917 0,45
4 1,5023 12,5358 0,36
5 1,3478 10,9292 0,31
Menurut Suhaeni, dkk. (2018) nilai DBI yang terkecil menunjukkan hasil cluster yang
terbaik. Selanjutnya, menurut Charrad, dkk.(2012) nilai CHI yang yang semakin besar
menunjukkan hasil yang lebih baik. Untuk SI, menurut Rousseeuw (1987), Charrad, dkk.(2012),
dan Zhao, dkk.(2018), apabila nilai SI semakin mendekati 1 maka hasil cluster semakin optimal.
Berdasarakan (Tabel 2) hasil uji validasi dari ketiga ukuran di atas, didapat kesimpulan bahwa
clustering ensemble berdasakan k-means dengan k=3 merupakan hasil cluster yang paling
optimal. Selanjutnya, guna melakukan evaluasi terhadap masing-masing cluster pada clustering
ensemble berdasakan k-means dengan k=3 digunakan grafik silhouette dari SI sebagai berikut:
9
 ISSN: 1978-1520

Gambar 2. Visualisasi silhouette index
Berdasarkan hasil uji Silhoutte (Gambar 10) terlihat bahwa clusterpertama mempunyai nilai
silhouette sebesar 0,39. Sedangkan, cluster kedua dan cluster ketiga memiliki nilai di atas 0,5.
Apabila nilai silhoutte semakin mendekati nilai 1 maka hasil pengklasteran dapat dikatakan
semakin optimal. Sebaliknya, apabila nilai indeks silhoutte mendekati -1, hasil pengklasteran
dapat dikatakan semakin tidak optimal. Nilai rata-rata silhoutte yang selanjutnya disebut dengan
indeks silhoutte pada penelitian ini adalah 0,45 dimana hasilnya bernilai positif dan lebih
mendekati nilai 1 sehingga dapat dikatakan hasil pengklasteran telah optimal.
3.4. Karakteristik Cluster yang terbentuk

Untuk mengetahui karakteristik cluster yang telah terbentuk, digunakan nilai rata-rata dan
standar deviasi pada setiap variabel faktor kerawanan PTM pada masing-masing cluster. Nilai
rata-rata tersebut akan digunakan sebagai dasar dalam pelabelan setiap cluster. Berikut rata-rata
dan standar deviasi variabel faktor risiko PTM pada masing-masing cluster:
Tabel 4. Rata-rata dan standar deviasi variabel faktor risiko PTM pada masing-masing klaster
Rata-Rata Standar Deviasi
Faktor risiko PTM Cluster
Cluster 2 Cluster 3 Cluster 1 Cluster 2 Cluster 3
1
(1) (2) (3) (4) (5) (6) (7)
Diabetes Melitus 1,81 1,12 3,22 0,4248 0,2852 0,6075
Obesitas Sentral 28,46 22,33 39,61 3,8450 2,9370 2,6640
Hipertensi 8,19 5,66 8,68 1,0030 1,1480 1,1580
Makanan Manis 31,64 22,09 32,74 7,2380 7,1090 4,6750
Minuman Manis 62,29 34,52 57,61 7,9310 9,4860 3,0230
Makanan Asin 30,94 17,84 24,29 10,7560 5,3050 8,3310
Makanan Berlemak/Berkolesterol/ Berminyak 55,54 25,90 50,01 11,6800 10,0800 12,2500
Kurang Buah dan Sayur 93,16 97,28 93,60 5,8510 2,2090 3,9890
Merokok 24,83 21,55 21,37 2,3170 3,8590 1,5200
Kurang Aktivitas Fisik 22,23 31,37 32,60 5,2500 6,1270 7,1600
Sumber: hasil olah data
Berdasarkan karakteristik cluster, didapat hasil bahwa kelompok cluster ketiga merupakan
kelompok yang memiliki tingkat kerawanan PTM paling tinggi dibanding kelompok lainnya. Hal
tersebut dapat dilihat melalui Tabel 5, cluster ketiga memiliki 5 variabel dengan nilai rata-rata
tertinggi dan 4 variabel dengan nilai rata-rata sedang sehingga hasil scorring bernilai 14. Berikut
karakteristik masing-masing cluster:
10
Tabel 5. Karakteristik PTM pada masing-masing cluster

kelompok Karakteristik Skor
Nilai Tertinggi (2) Nilai Sedang (1) Nilai Rendah (0)
(1) (2) (3) (4)
Konsumsi minuman manis, Diabetes mellitus, obesitas Kurang buah dan sayur dan kurang 12
makanan asin ,makanan sentral, hipertensi, makanan aktifitas fisik
Cluster 1
berlemak dan berkolesterol manis
dan kebiasaan merokok
Kurang konsumsi buah dan Kebiasaan merokok dan kurang Diabetes mellitus, obesitas sentral , 4
sayur . aktivitas fisik. hipertensi , konsumsi minuman
Cluster 2 manis, konsumsi makanan manis,
konsumsi makanan asin, konsumsi
makanan berlemak dan berkolesterol.
Diabetes mellitus, obesitas Minuman manis, makanan Kebiasaan merokok 14
sentral , hipertensi , konsumsi asin, makanan berlemak dan
Cluster 3
makanan manis , dan kurang berkolesterol, kurang konsumsi
aktivitas fisik. buah dan sayur
Cluster pertama merupakan kelompok yang memiliki kerawanan untuk terkena PTM pada
tingkat sedang. Cluster ini memiliki 4 variabel dengan nilai rata-rata tertinggi, 4 variabel dengan
nilai rata-rata sedang, dan skor penilaian kerawanan sebesar 12. selanjutnya cluster pertama akan
disebut dengan kelompok wilayah dengan tingkat kerawanan sedang. cluster kedua ini merupakan
kelompok yang memiliki kerawanan paling rendah, yang selanjutnya disebut dengan kelompok
wilayah dengan tingkat kerawanan rendah. Cluster ketiga merupakan kelompok dengan skor
penilaian kerawanan tertinggi sehingga selanjutnya cluster ketiga ini disebut dengan wilayah
yang memiliki tingkat kerawanan tinggi. Selanjutnya, berdasarkan tingkat kerawanan untuk
terkena penyakit PTM, Kabupaten/Kota di Jawa Timur dapat dipetakan sebagai berikut:

Gambar 3. Pemetaan kerawanan PTM di Jawa Timur tahun 2018
Tabel 1. Keterangan wilayah pada peta tingkat kerawanan PTM di Jawa Timur tahun 2019
Tingkat Tingkat
Kode Wilayah Kode Wilayah
Kerawanan PTM Kerawanan PTM
(1) (2) (3) (1) (2) (3)
11
 ISSN: 1978-1520
Tinggi 15 Sidoarjo Sedang 11 Bondowoso

25 Gresik 12 Situbondo
71 Kota Kediri 13 Probolinggo
72 Kota Blitar 14 Pasuruan
73 Kota Malang 16 Mojokerto
74 Kota Probolinggo 17 Jombang
75 Kota Pasuruan 18 Nganjuk
76 Kota Mojokerto 19 Madiun
77 Kota Madiun 20 Magetan
78 Kota Surabaya 21 Ngawi
Sedang 01 Pacitan 22 Bojonegoro
02 Ponorogo 23 Tuban
03 Trenggalek 24 Lamongan
05 Blitar 79 Kota Batu
06 Kediri Rendah 04 Tulungagung
07 Malang 26 Bangkalan
08 Lumajang 27 Sampang
09 Jember 28 Pamekasan
10 Banyuwangi 29 Sumenep
Wilayah dengan kerawanan tinggi (berwarna merah) mayoritas merupakan wilayah

perkotaan, hal tersebut sesuai dengan penelitian yang dilakukan (Htet, et al., 2016) dan (Voster,
2002). Wilayah dengan tingkat urbanisasi yang tinggi umumnya memiliki kebiasaan kurang
beraktifitas fisik dan memiliki kerawanan pada faktor metabolik. Wilayah dengan kerawanan
sedang memiliki kebiasaan diet yang kurang baik, dan kebiasaan merokok yang tinggi, namun
aktivitas fisik lebih baik dibandingkan wilayah lainnya. Wilayah dengan kerawanan rendah,
merupakan wilayah yang berada di pulau Madura ditambah Kabupaten Tulungagung.
4. KESIMPULAN DAN SARAN
5.1. Kesimpulan
Berdasarkan pembahasan di atas, tujuan penelitian telah tercapai dengan hasil berupa:
1. Berdasarkan gambaran faktor kerawanan PTM terlihat bahwa kebiasaan kurang konsumsi
buah dan sayur masih sangat tinggi di Jawa Timur.
2. Dengan menggunakan analisis clustering ensemble berdasarkan k-means dengan k=2 sampai
k=5, jarak euclidien, dan fungsi consensus berupa CSPA didapat hasil pengelompokkan
clustering ensemble k=2 sampai k=5.
3. Berdasarkan uji validitas yang digunakan dalam penelitian ini yaitu Davies Bouldin Index
(DBI), Calinski-Harabasz Index (CHI), dan Silhouette Index (SI) disimpulkan clustering
ensemble dengan k=3 merupakan clustering paling optimal untuk mengelompokkan
kabupaten/kota di Jawa Timur berdasakan faktor kerawanan PTM.
4. Berdasarkan hasil clustering ensemble, berikut karakteristik yang terbentuk :
Cluster 1:Merupakan wilayah dengan kerawanan PTM sedang. Memiliki karakteristik konsumsi
minuman manis tinggi, konsumsi makanan asin tinggi, konsumsi makanan berlemak
dan berkolesterol tinggi, dan kebiasaan merokok tinggi.
Cluster 2:Merupakan wilayah dengan kerawanan PTM rendah. Memiliki karakteristik kebiasaan
kurang konsumsi buah dan sayur tinggi.
Cluster 3:Merupakan wilayah dengan kerawanan PTM tinggi. Memiliki karakteristik diabetes
melitus tinggi, hipertensi tinggi, obesitas sentral tinggi, konsumsi makanan manis
tinggi, dan aktifitas fisik masyarakatnya rendah.
5.2. Saran
12
Berdasarkan proses analisis dan kesimpulan yang didapatkan, terdapat beberapa saran yang
diberikan. Saran tersebut adalah sebagai berikut:
1. Pemerintah Indonesia sebaiknya segera meningkatkan kualitas sistem data berkaitan PTM di
Indonesia. Peningkatan kualitas sistem data PTM akan memudahkan pemerintah dalam
memantau dan mengevaluasi penanganan PTM sehingga kebijakan yang tepat dapat
diterapkan.
2. Pemerintah kabupaten/kota di Jawa Timur sebaiknya memprioritaskan perbaikan
perencanaan wilayah perkotaan dimana menunjang aktivitas fisik masyarakat. Hal tersebut
dikarenakan dalam penelitian ini didapatkan hasil bahwa wilayah yang memiliki tingkat
kerawanan PTM tinggi merupakan wilayah yang memiliki tingkat urbanisasi tinggi yang
memiliki karakteristik aktivitas fisik rendah dan faktor metabolik yang tinggi. Perbaikan
perencanaan wilayah perkotaan perlu dilakukan terutama pada promosi pentingnya
transportasi umum, jalan kaki, dan kehidupan aktif sebagai kebiasaan hidup, serta
pembangunan fasilitas olahraga umum.
3. Pemerintah kabupaten/kota di Jawa Timur sebaiknya meningkatkan edukasi masyarakat
mengenai makanan dan gizi sehat serta menerapkan pajak dan regulasi terhadap larangan
merokok pada wilayah dengan kerawanan PTM sedang. Hal tersebut dikarenakan wilayah
dengan kerawanan PTM sedang memiliki karakteristik merokok harian yang tinggi dan pola
diet yang tidak baik.
4. Untuk peneliti selanjutnya diharapkan dapat menambah beberapa variabel seperti konsumsi
alkohol, pola tidur, dan konsumsi omega3. Peneliti selanjutnya juga dapat melakukan uji
regresi antara hasil pengelompokan kerawanan PTM dengan variabel sosial-ekonomi-
demografi. Peneliti selanjutnya juga dapat menerapkan clustering ensemble berdasarkan
generative mechanism lain pada penelitiannya guna mengelompokkan suatu permasalahan.
DAFTAR PUSTAKA
(Bappenas), (2019). Rancangan Teknokratik: Rencana Pembangunan Jangka Menengah Nasional 2020-
2024. Jakarta.
Aizenman, N. (2020, Oktober 16). How To Reduce Human Suffering: 3 Lessons From A Seminal Public
Health Study. Retrieved from NPR. Diakses pada tanggal 7 Juni 2021 melalui
https://www.npr.org/sections/goatsandsoda/2020/10/16/924458813/how-to-reduce-human-
suffering-3-lessons-from-a-seminal-public-health-study
Alizadeh, H., Minaei, B., & Parvin, H. (2014). Cluster Ensemble Selection Based on a New Cluster Stability
Measure. Intelligent Data Analysis , 389-408.
Alqurashi, T., & Wang, W. (2019). Clustering Ensemble Method. International Journal of Machine
Learning and Cybernetics, 1227-1246.
Bates, A., & Kalita, J. (2016). Counting Cluster in Twitter Posts. SoDA.
Charrad, M., Ghazzali, N., Boiteau, V., & Niknafs, a. (2012). NbClust Package. An Examination of indices
for Determining the Number of Clusters. HAL .
Choi, K. H., Park, M. S., Kim, J. A., & Lim, J.-A. (2015). Associations Between Excessive Sodium Intake
and Smoking and Alcohol Intake Among Korean Men: KNHANES V. Internationaal Journal of
Environmental Research and Public Health, 15540-15549.
Cini, K., Sawyer, S., Ancha, A., Brown, A., Pearson, O., & Azzopardi, P. (2018). Towards A
Comprehensive NCD Reporting Framework For Indonesia. The Australia-Indonesia Centre.
Haregu, T. N., Wekesah, F. M., Mohamed, S. F., Mutua, M. K., Asiki, G., & Kyobutungi, C. (2018).
Patterns of non-communicable disease and injury risk factors in Kenyan adult population : a cluster
analysis. BMC Public Healrh 18.
Htet, A. S., Bjertness, M. B., Sherpa, L. Y., Kjøllesdal, M. K., Oo, W. M., Meyer, H. E., . . . Bjertness, E.
(2016). Urban-rural differences in the prevalence of non-communicable diseases risk factors among
25–74 years old citizens in Yangon Region, Myanmar: a cross sectional study. BMC Public Health.
13
 ISSN: 1978-1520
IHME. (2020, Oktober 15). GBD Compare: Indonesia Both Sexes, All ages, Deaths per 100.000. Retrieved
from Institute for Health Metrics and Evaluation. Diakses pada tanggal 26 Januari 2021 melalui
http://ihmeuw.org/5cqy
IHME. (2020, Oktober 15). GBD Compare: Non-communicable diseases Both sexes, All ages, Deaths.
Retrieved from Institute for Health Metrics and Evaluation. Diakses pada tanggal 26 Januari 2021
melalui http://ihmeuw.org/5cr4
Kartika, L. A., Afifah, E., & Suryani, I. (2016). Asupan lemak dan aktivitas fisik serta hubungannya dengan
kejadian hipertensi pada pasien rawat jalan. Jurnal Gizi dan Dieteik Indonesia vol 4, 139-146.
Kassambara, A. (2017). Practical Guide To Cluster Analysis in R: Unsupervised Machine Learning.
STHDA.
Khairati, A., Adlina, A. A., Hertono, G. F., & Handari, B. D. (2019). Kajian Indeks Validitas pada
Algoritma K-Means Enhanced dan K-Means MMCA. Prosiding Seminar Nasional Matematika 2,
161-170.
Murningtyas, F. S., Larasati, M. D., Rahmawati, A. Y., & Prihatin, S. (2020). Besar Risiko Faktor Fisiologis
dan Faktor Perilaku terhadap Kejadian Sindrom Metabolik. Jurnal Riset Gizi, 11-17.
Rousseeew, P. J. (1987). Sihouettes: A Graphical Aid to The Interpretation and Validation of Cluster
Analysis. Journal of Computational and Applied Mathematics 20, 53-65.
Silva, J. P., Gunathunga, M., & Jayasinghe, S. (2016). Mapping Unhealthy Behavior Among Economically
Active Men Using GIS In Suburban And Rural Areas Of Sri Langka. Asia Pac J Public Health: 28
(1 Suppl), 10S-16S.
Strehl, A., & Ghosh, J. (2002). Cluster Ensembles - A Knowledge Reuse Framework for Combining
Multiple Partitions. Journal of Machine Learning Research 3 , 583-617.
Suhaeni, C., Kurnia, A., & Ristiyanti. (2018). Perbandingan Hasil Pengelompokan menggunakan Analisis
Cluster Berhirarki, K-Means Cluster. dan Cluster Ensemble (Studi Kasus Data Indikator Pelayanan
Kesehatan Ibu Hamil). Media Informasi Vol 14, 31-38.
Trisnadewi, N. W., Widarsih, N. L., & Pramesti, T. A. (2019). Hubungan Obesitas Sentral dan Aktivitas
Fisik dengan Kejadian Diabetes Melitus Tipe 2 Puskesmas III Denpasar Utara. Bali Medika Jurnal.
Vol 6: 2, 119-129
UNFPA, (2014). UNFPA Indonesia Monograph Series No 1: Indonesia on the Treshold of Population
Ageing. Jakarta : UNFPA
Voster, H. (2002). The Emergence of Cardiovaskular Disease during Urbanisation of Africans. Public
Health Nutrition: 5(1A), 239-243.
WHO. (2011). Global Status Report on Noncommunicable Diseases 2010. Geneva: World Health
Organization.
WHO. (2013). Global action plan for the prevention and control of NCDs 2013-2020. Geneva: World
Health Organization. Retrieved from World Health Organization. Diakses pada tanggal 12 Desember
2020 melalui https://www.who.int/nmh/global_monitoring_framework/en/
Wu, X., Ma, T., Cao, J., Tian, Y., & Alabdulkarim, A. (2018). A Comparative Study of Clustering Ensemble
Algorithms. Computers and Electrical Engineering - Elsevier, 603-615.
Zhao, S., Sun, J., Shimizu, K., & Kadota, K. (2018). Silhouette Scores for Arbitrary Defined Groups in
Gene Expression Data and Insights into Differential Expression Results. Biological procedures
online, 20, 5.
LAMPIRAN
Lampiran 1. Definisi Operasional Variabel Penelitian

No Variabel Definisi Operasional
1. Diabetes Melitus Merupakan prevalensi Diabetes Melitus berdasarkan diagnosis dokter (semua umur), yaitu
ART yang pernah didiagnosis oleh dokter dibagi ART semua umur.
2. Obesitas Sentral Merupakan prevalensi obesitas sentral (kumpulan lemak abdominal berlebih yang terdapat
di daerah abdomen atau perut) yaitu jumlah pada penduduk usia ≥ 15 tahun . Dengan lingkar
perut pada : Laki-laki > 90 cm dan Perempuan > 80 cm dibagi dnegan jumlah penduduk
usia ≥ 15 tahun yang diukur lingkar perut
3. Hipertensi Merupakan prevalensi hipertensi menurut diagnosa dokter, yaitu ART yang pernah
didiagnosis hipertensi oleh dokter dibagi dengan ART umur ≥ 18 tahun
14
4. Konsumsi Makanan Manis Merupakan Proporsi pola kebiasaan konsumsi makanan manis ≥ 1 kali per hari, yaitu ART
usia ≥ 3 tahun dengan pola kebiasaan konsumsi makanan manis ≥ 1 kali per hari dibagi
semua ART usia ≥ 3 tahun
5. Konsumsi Minuman Manis Merupakan Proporsi pola kebiasaan konsumsi minuman manis ≥ 1 kali per hari, yaitu ART
usia ≥ 3 tahun dengan pola kebiasaan konsumsi minuman manis ≥ 1 kali per hari dibagi
semua ART usia ≥ 3 tahun
6. Konsumsi Makanan Asin Merupakan Proporsi pola kebiasaan konsumsi makanan asin ≥ 1 kali per hari, yaitu ART
usia ≥ 3 tahun dengan pola kebiasaan konsumsi makanan asin ≥ 1 kali per hari dibagi semua
ART usia ≥ 3 tahun
7. Konsumsi Makanan Merupakan Proporsi pola kebiasaan konsumsi makanan Berlemak/ Berkolesterol/Gorengan
Berlemak/ ≥ 1 kali per hari, yaitu ART usia ≥ 3 tahun dengan pola kebiasaan konsumsi makanan
Berkolesterol/Gorengan Berlemak/ Berkolesterol/Gorengan ≥ 1 kali per hari dibagi semua ART usia ≥ 3 tahun
8. Kurang Konsumsi Merupakan Proporsi pola kebiasaan konsumsi buah/sayur <5 porsi per hari dalam
Buah/Sayur seminggu, yaitu 100 % dikurangi ART usia ≥ 5 tahun dengan pola kebiasaan konsumsi
buah/sayur ≥ 5 porsi per hari dalam seminggu dibagi semua ART usia ≥ 5 tahun
9. Merokok harian Merupakan proporsi pola kebiasaan merokok, yaitu ART usia ≥ 10 tahun dengan pola
kebiasaan merokok setiap hari dibagi semua ART usia ≥ 10 tahun
10. Kurang Aktivitas Fisik Merupakan proporsi kurang aktivitas fisik pada penduduk umur ≥ 10 tahun, yaitu ART usia
≥ 10 tahun dengan pola kebiasaan kurang aktifitas fisik dibagi dengan semua ART usia ≥
10 tahun
15

Abs Trak

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Abs Trak

Diunggah oleh

Hak Cipta:

Format Tersedia

Hari, Tanggal Seminar : Rabu, 30 Juni 2021

Ruang/Sesi/ Pukul Seminar : R. 266/ 2/ 09.30-10.30 WIB

Penerapan Clustering Ensemble pada Kabupaten/Kota

‘Aisyah Baratut Taqiyyah*1, Tiodora Hadumaon Siagian2

e-mail: *1211709514@stis.ac.id, 2theo@stis.ac.id

Kata kunci—clustering ensemble, Penyakit Tidak Menular, k-means

Keywords—clustering ensemble, Non-communicable diseases, k-means

Terjadinya transisi epidemiologi mengakibatkan penyakit tidak menular (PTM) menjadi

2.1. Penyakit Tidak Menular

2.2. Clustering Ensemble

𝐷(𝑥𝑗 , 𝑐𝑖 ) = ‖𝑥𝑗 − 𝑐𝑖 ‖ = √∑(𝑥𝑗𝑠 − 𝑐𝑖𝑠 )2 (1)

2.3. Index Validitas

Calinski-Harabasz (CH) Index diperoleh dengan cara mengalikan perbandingan separation

𝑆𝑆𝐵 = ∑ 𝑁𝑖 (𝑥̅𝑖 − 𝑥̅ ) (𝑥̅𝑖 − 𝑥̅ )𝑇 (8)

𝑆𝑆𝑊 = ∑ ∑ (𝑥𝑗 − 𝑥̅𝑖 )(𝑥𝑗 − 𝑥̅𝑖 )𝑇 (9)

2.4. Metode Pengumpulan Data

2.5. Metode Analisis

3. HASIL DAN PEMBAHASAN

3.1. Gambaran Umum Faktor Kerawanan PTM

Tabel 1 menunjukkan bahwa berdasarkan rata-rata antar wilayah kabupaten/kota di Jawa

3.2. Hasil Clustering Ensemble

akan dihasilkan sebuah matriks consensus. Selanjutnya, untuk melakukan pengelompokan,

3.3. Uji Validasi

Sumber: Hasil olah data

3.4. Karakteristik Cluster yang terbentuk

Tabel 5. Karakteristik PTM pada masing-masing cluster

Sumber: Hasil olah data

Tinggi 15 Sidoarjo Sedang 11 Bondowoso

Wilayah dengan kerawanan tinggi (berwarna merah) mayoritas merupakan wilayah

4. KESIMPULAN DAN SARAN

Lampiran 1. Definisi Operasional Variabel Penelitian

Anda mungkin juga menyukai