Anda di halaman 1dari 8

KOMIK (Konferensi Nasional Teknologi Informasi dan Komputer) ISSN 2597-4645 (media online)

Volume 2, Nomor 1, Oktober 2018 ISSN 2597-4610 (media cetak)

PENERAPAN CLUSTERING PADA PENDUDUK YANG MEMPUNYAI KELUHAN


KESEHATAN DENGAN DATAMINING K-MEANS
Nurul Rofiqo, Agus Perdana Windarto, Dedy Hartama

STIKOM Tunas Bangsa, Pematangsiantar, Indonesia


Email: 1nurul.rofiqo@gmail.com
Abstrak
Penelitian ini bertujuan melakukan pemanfaatan Algoritma Clushtering dalam pengelompokan jumlah penduduk
yang mempunyai keluhan kesehatan dengan algoritma K-means di Indonesia. Sumber data penelitian ini
dikumpulkan berdasarkan dokumen-dokumen keterangan Jumlah penduduk provinsi yang memiliki keluhan
kesehatan yang dihasilkan oleh Badan Pusat Statistik Nasional. Data yang digunakan dalam penelitian ini adalah
data dari tahun 2013-2017 yang terdiri dari 34 provinsi. Metode yang digunakan dalam penelitian ini adalah
Algoritma K-means. Data akan diolah dengan melakukan clushtering dalam 3 clushter yaitu clusther tingkat
keluhan kesehatan tinggi, clusther tingkat keluhan kesehatan sedang dan rendah. Centroid data untuk cluster
tingkat populasi tinggi 37.48, Centroid data untuk cluster tingkat populasi sedang 27.08, dan Centroid data untuk
cluster tingkat populasi rendah 14.89. Sehingga diperoleh penilaian berdasarkan indeks penduduk yang memiliki
keluhan kesehatan dengan 7 provinsi tingkat keluhan kesehatan tinggi yaitu Jawa Tengah, Di Yogyakarta, Bali,
Nusa Tenggara Barat, Nusa Tenggara Timur, Kalimantan Selatan, Gorontalo, 18 provinsi tingkat keluhan
kesehatan sedang, dan 9 provinsi lainnya termasuk tingkat keluhan kesehatan rendah. Hal ini dapat menjadi
masukan kepada pemerintah untuk memberikan perhatian lebih pada penduduk di setiap daerah yang memiliki
keluhan kesehatan tinggi melalui peningkatan pelayanan kesehatan masyarakat agar penduduk Indonesia menjadi
lebih sehat tanpa adanya keluhan kesehatan.
Kata kunci: data mining, keluhan kesehatan, clustering, k-means, penduduk Indonesia
Abstract
This study aims to utilize Clushtering Algorithm in grouping the number of people who have health complaints
with the K-means algorithm in Indonesia. The source of this research data was collected based on the documents
of the provincial population which had health complaints produced by the National Statistics Agency. The data
used in this study are data from 2013-2017 consisting of 34 provinces. The method used in this research is K-
means Algorithm. Data will be processed by clushtering in 3 clushter, namely clusther high health complaints,
clusther moderate and low health complaints. Centroid data for high population level clusters 37.48, Centroid
data for moderate population level clusters 27.08, and Centroid data for low population level clusters 14.89. So
that obtained an assessment based on the population index that has health complaints with 7 provinces of high
health complaints, namely Central Java, Yogyakarta, Bali, West Nusa Tenggara, East Nusa Tenggara, South
Kalimantan, Gorontalo, 18 provinces of moderate health complaints, and 9 other provinces including low health
complaints. This can be an input to the government to give more attention to residents in each region who have
high health complaints through improving public health services so that the Indonesian population becomes
healthier without health complaints.
Keywords: data mining, health complaints, clustering, K-means, Indonesian residents

1. PENDAHULUAN
Keluhan kesehatan adalah gangguan terhadap kondisi fisik maupun jiwa, termasuk karena kecelakaan, atau
hal lain yang menyebabkan terganggunya kegiatan sehari-hari. Pada umumnya keluhan kesehatan utama yang
banyak dialami oleh penduduk adalah panas, sakit kepala, batuk, pilek, diare, asma/sesak nafas, sakit gigi. Orang
yang menderita penyakit kronis dianggap mempunyai keluhan kesehatan walaupun pada waktu survei (satu bulan
terakhir) yang bersangkutan tidak kambuh penyakitnya. Ada beberapa upaya yang dapat kita lakukan dalam
menanggulangi masalah keluhan kesehatan seperti peningkatan gizi, penambahan fasilitas kesehatan, pelaksanaan
imunisasi, penyediaan pelayanan kesehatan gratis, pengadaan obat generik, penambahan jumlah tenaga medis, dan
melakukan penyuluhan tentang arti pentingnya kebersihan dan pola hidup sehat. Kualitas pelayanan kesehatan,
termasuk didalamnya penanganan keluhan masyarakat, dipengaruhi oleh ketersediaan sarana dan prasarana
termasuk dana. Dalam hal ini diharapkan kepada pemerintah untuk melakukan evaluasi penanganan keluhan untuk
memperbaiki atau meningkatkan pelayanan kesehatan. Undang-Undang Nomor 36 Tahun 2009 tentang Kesehatan
menyatakan bahwa upaya kesehatan adalah setiap kegiatan dan/atau serangkaian kegiatan yang dilakukan secara
terpadu, terintegrasi dan berkesinambungan untuk memelihara dan meningkatkan derajat kesehatan masyarakat

Page | 216
http://ejurnal.stmik-budidarma.ac.id/index.php/komik
KOMIK (Konferensi Nasional Teknologi Informasi dan Komputer) ISSN 2597-4645 (media online)
Volume 2, Nomor 1, Oktober 2018 ISSN 2597-4610 (media cetak)

dalam bentuk pencegahan penyakit, peningkatan kesehatan, pengobatan penyakit, dan pemulihan kesehatan oleh
pemerintah dan/atau masyarakat (pasal 1), setiap orang berhak mendapatkan lingkungan yang sehat bagi
pencapaian derajat kesehatan (pasal 6), setiap orang berhak untuk mendapatkan informasi dan edukasi tentang
kesehatan yang seimbang dan bertanggung jawab (pasal 7), setiap orang berhak memperoleh informasi tentang
data kesehatan dirinya termasuk tindakan dan pengobatan yang telah maupun yang akan diterimanya dari tenaga
kesehatan (pasal 8).
Data yang digunakan dalam penelitian ini berdasarkan dokumen-dokumen yang dihasilkan oleh Badan Pusat
Statistik Nasional melalui situs https://www.bps.go.id. Dalam hal ini peneliti mengangkat topik penduduk yang
memiliki keluhan kesehatan menurut provinsi dimana proses metode yang dilakukan adalah clustering. Hasil dari
cluster dapat dijadikan masukan bagi pemerintah agar provinsi yang masuk kedalam clushter tinggi mendapat
perhatian lebih. Proses clushter dibagi kedalam 3 (tiga) cluster yakni keluhan kesehatan tinggi, keluhan kesehatan
sedang dan keluhan kesehatan rendah. Analisis cluster adalah suatu analisis statistik yang bertujuan memisahkan
obyek kedalam beberapa kelompok yang mempunyai sifat berbeda antar kelompok yang satu dengan yang lain.
Dalam analisis ini tiap-tiap kelompok bersifat homogen antar anggota dalam kelompok atau variasi obyek
dalam kelompok yang terbentuk sekecil mungkin. Algoritma yang biasa digunakan dalam data mining yaitu
algoritma ID3[1]–[3], C4.5[1], [4]–[8], K-Means[9], [10][11]–[13], Naive Bayes[14], [15], Support Vector
Machines[2], Apriori[16] dan beberapa algoritma data mining lainnya. Algoritma K-Means dapat digunakan untuk
meneliti berbagai macam hal, diantaranya penelitian terkait [17] yang melakukan penelitian mengenai clushtering
dalam mengelompokkan jumlah desa/kelurahan yang memiliki sarana kesehatan menurut provinsi dengan k-
means. Sehingga diperoleh penilaian berdasarkan indeks Desa/Kelurahan Yang Memiliki Sarana Kesehatan
dengan 4 provinsi tingkat sarana kesehatan tinggi yaitu Sumatera Utara, Jawa Barat, Jawa Tengah, Jawa Timur,
14 provinsi tingkat sarana kesehatan sedang, dan 16 provinsi lainnya termasuk tingkat sarana kesehatan rendah.
Rohmawati[18] mengelompokkan data pelamar beasiswa Bantuan Belajar Mahasiswa (BBM), untuk pengukuran
kinerja algoritma, Pengukuran ini di lihat dari hasil cluster dengan menghitung nilai kemurnian (purity measure)
dari masing – masing cluster yang di hasilkan.

2. TEORITIS
2.1 Data Mining
Data mining adalah suatu metode pengolahan data untuk menemukan pola yang tersembunyi dari data
tersebut. Hasil dari pengolahan data dengan metode data mining ini dapat digunakan untuk mengambil keputusan
di masa depan. Data mining ini juga dikenal dengan istilah pattern recognition [19][12]. Data mining merupakan
metode pengolahan data berskala besar oleh karena itu data mining ini memiliki peranan penting dalam bidang
industri, keuangan, cuaca, ilmu dan teknologi. Secara umum kajian data mining membahas metode-metode seperti,
clustering, klasifikasi, regresi, seleksi variable, dan market basket analisis [19].

2.2 Clustering
Analisis Pengelompokan / Clustering merupakan proses membagi data dalam suatu himpunan ke dalam
beberapa kelompok yang kesamaan datanya dalam suatu kelompok lebih besar daripada kesamaan data tersebut
dengan data dalam kelompok lain. Potensi clustering adalah dapat digunakan untuk mengetahui struktur dalam
data yang dapat dipakai lebih lanjut dalam berbagai aplikasi secara luas seperti klasifikasi, pengolahan gambar,
dan pengenalan pola[17].

2.3 K-Means
K-Means merupakan suatu algoritma yang digunakan dalam pengelompokkan secara pertisi yang
memisahkan data ke dalam kelompok yang berbeda – beda [20].

3. ANALISA DAN PEMBAHASAN


Dalam penelitian ini metode yang digunakan yaitu metode Data Mining sebagai berikut :
1. Tahap pengumpulan data,
2. Tahap pengolahan data,
3. Tahap Clustering dan
4. Tahap Analisis

3.1. Tahap Pengumpulan Data


Pengumpulan data dalam penelitian ini diambil berdasarkan dokumen-dokumen keterangan Jumlah
penduduk provinsi yang memiliki keluhan kesehatan yang dihasilkan dari Publikasi Statistik Indonesia dan diolah

Page | 217
http://ejurnal.stmik-budidarma.ac.id/index.php/komik
KOMIK (Konferensi Nasional Teknologi Informasi dan Komputer) ISSN 2597-4645 (media online)
Volume 2, Nomor 1, Oktober 2018 ISSN 2597-4610 (media cetak)

dari hasil Survei Sosial Ekonomi Nasional/Susenas, Badan Pusat Statistik Nasional. Data yang digunakan dalam
penelitian ini adalah data dari tahun 2013-2017 yang terdiri dari 34 provinsi.

3.2. Tahap Pengolahan Data


Data yang telah diperolah akan diolah terlebih dahulu untuk dapat diclustering. Dalam tahap sebelumnya,
data setiap provinsi akan dijumlah setiap aspeknya sehingga pada tahapan ini sudah diperoleh perhitungan nilai
yang akan diproses pada tahap clustering.

3.3. Tahap Clustering


Clustering merupakan klasifikasi tanpa pengawasan dan merupakan proses partisi sekumpulan objek data
dari satu set menjadi beberapa kelas. Hal ini dapat dilakukan dengan menerapkan berbagai persamaan dan langkah-
langkah mengenai jarak algoritma, yaitu dengan Euclidean Distance[21]. Analisis kluster ialah metode yang
dipakai untuk membagi rangkaian data menjadi beberapa grup berdasarkan kesamaan- kesamaan yang telah
ditentukan sebelumnya [22]. Dalam menentukan cluster berdasarkan data yang telah tersedia, dibutuhkan sebuah
flowchart untuk memudahkan dalam menentukan alur perhitungan sebagai alur untuk menemukan hasil dari
penerapan cluster terhadap data yang akan diproses. Berikut adalah flowchart dalam menentukan cluster dengan
K-Means [15].

3.4.Tahap Analisis
Pada tahapan ini dilakukan analisis data jumlah penduduk yang memiliki keluhan kesehatan. Data yang
diperoleh diolah dengan menggunakan perhitungan bobot dari tiap indeks. Pada tahapan sebelumnya, telah
ditentukan akan dicluster ke dalam 3 cluster yakni cluster tingkat keluhan kesehatan tinggi, cluster tingkat keluhan
kesehatan sedang dan cluster tingkat keluhan kesehatan rendah. Pada tahapan inilah akan dianalisis hasilnya.
Dalam melakukan clustering, data yang diperoleh akan dihitung terlebih dahulu berdasarkan hasil rata-rata
jumlah penduduk yang mengalami keluhan kesehatan menurut Provinsi. Data tersebut kemudian diakumulasikan
dan diambil nilai rata-rata nya, yaitu :
Tabel 1. Nilai rata-rata setelah data alternatif diakumulasikan
Provinsi RATA-RATA Provinsi RATA-RATA
ACEH 27,61 NUSA TENGGARA BARAT 34,45
SUMATERA UTARA 22,86 NUSA TENGGARA TIMUR 34,64
SUMATERA BARAT 29,67 KALIMANTAN BARAT 25,22
RIAU 27,02 KALIMANTAN TENGAH 25,41
JAMBI 22,26 KALIMANTAN SELATAN 35,04
SUMATERA SELATAN 26,80 KALIMANTAN TIMUR 21,59
BENGKULU 27,69 KALIMANTAN UTARA 14,89
LAMPUNG 28,98 SULAWESI UTARA 26,02
KEP, BANGKA BELITUNG 28,59 SULAWESI TENGAH 29,17
KEP, RIAU 22,42 SULAWESI SELATAN 24,68
DKI JAKARTA 30,22 SULAWESI TENGGARA 26,75
JAWA BARAT 28,34 GORONTALO 35,84
JAWA TENGAH 33,30 SULAWESI BARAT 28,85
DI YOGYAKARTA 37,48 MALUKU 19,05
JAWA TIMUR 30,52 MALUKU UTARA 16,04
BANTEN 28,94 PAPUA BARAT 20,00
BALI 33,30 PAPUA 17,68

Setelah diakumulasikan dan dicari nilai rata-rata maka akan didapatkan nilai dari setiap variable. Kemudian
data tersebut akan masuk ke tahapan clustering dengan menerapkan algoritma K-means untuk mengcluster data
menjadi tiga cluster.

3.5. Centroid Data


Dalam penerapan algoritma K-means dihasilkan nilai titik tengah atau centroid dari data yang didapat dengan
ketentuan bahwa clusterisasi yang diinginkan adalah 3. Penentuan titik cluster ini dilakukan dengan mengambil
nilai terbesar (maksimum) untuk cluster tinggi (C1), nilai rata-rata (average) untuk cluster sedang (C2) dan nilai
terkecil (minimum) untuk cluster rendah (C3). Nilai titik tersebut dapat diketahui pada tabel berikut:

Page | 218
http://ejurnal.stmik-budidarma.ac.id/index.php/komik
KOMIK (Konferensi Nasional Teknologi Informasi dan Komputer) ISSN 2597-4645 (media online)
Volume 2, Nomor 1, Oktober 2018 ISSN 2597-4610 (media cetak)

Tabel 2. Centroid Data Awal (Iterasi 1)


Centroid
Max (C1) 37,48
Average (C2) 27,08
Min (C3) 14,89
3.6 Clustering Data
Dengan menggunakan centroid tersebut maka dapat dicluster data yang telah didapat menjadi 3 cluster.
Proses cluster dengan mengambil jarak terdekat dari setiap data yang diolah. Dari data jumlah penduduk yang
mengalami keluhan kesehatan didapatkan pengelompokan pada iterasi 1 untuk 3 cluster tersebut. Cluster penduduk
tinggi (C1) yakni Jawa Tengah, DI Yogyakarta, Bali, Nusa Tenggara Barat, Nusa Tenggara Timur, Kalimantan
Selatan dan Gorontalo. Cluster penduduk sedang (C2) yakni 22 Provinsi dan cluster penduduk rendah (C3) yakni
5 provinsi lainnya. Proses pencarian jarak terpendek, pengelompokan data pada iterasi 1 dan Clustering atas dapat
digambarkan pada tabel dan gambar berikut:
Tabel 3. Perhitungan Jarak Pusat Cluster Iterasi 1
JARAK
PROVINSI RATA-RATA C1 C2 C3 TERPENDEK
ACEH 27,61 9,87 0,53 12,72 0,53
SUMATERA
UTARA 22,86 14,62 4,23 7,97 4,23
SUMATERA
BARAT 29,67 7,81 2,59 14,78 2,59
RIAU 27,02 10,46 0,06 12,13 0,06
JAMBI 22,26 15,21 4,82 7,38 4,82
SUMATERA
SELATAN 26,80 10,67 0,28 11,92 0,28
BENGKULU 27,69 9,79 0,60 12,80 0,60
LAMPUNG 28,98 8,50 1,90 14,09 1,90
KEP, BANGKA
BELITUNG 28,59 8,88 1,51 13,71 1,51
KEP, RIAU 22,42 15,06 4,66 7,53 4,66
DKI JAKARTA 30,22 7,26 3,14 15,33 3,14
JAWA BARAT 28,34 9,14 1,26 13,45 1,26
JAWA
TENGAH 33,30 4,18 6,21 18,41 4,18
DI
YOGYAKARTA 37,48 0,00 10,40 22,59 0,00
JAWA TIMUR 30,52 6,96 3,44 15,63 3,44
BANTEN 28,94 8,54 1,86 14,05 1,86
BALI 33,30 4,18 6,22 18,41 4,18
NUSA
TENGGARA
BARAT 34,45 3,03 7,37 19,56 3,03
NUSA
TENGGARA
TIMUR 34,64 2,83 7,56 19,76 2,83
KALIMANTAN
BARAT 25,22 12,26 1,86 10,33 1,86
KALIMANTAN
TENGAH 25,41 12,07 1,68 10,52 1,68
KALIMANTAN
SELATAN 35,04 2,43 7,96 20,16 2,43
KALIMANTAN
TIMUR 21,59 15,88 5,49 6,71 5,49
KALIMANTAN
UTARA 14,89 22,59 12,19 0,00 0,00

Page | 219
http://ejurnal.stmik-budidarma.ac.id/index.php/komik
KOMIK (Konferensi Nasional Teknologi Informasi dan Komputer) ISSN 2597-4645 (media online)
Volume 2, Nomor 1, Oktober 2018 ISSN 2597-4610 (media cetak)

JARAK
PROVINSI RATA-RATA C1 C2 C3 TERPENDEK
SULAWESI
UTARA 26,02 11,46 1,07 11,13 1,07
SULAWESI
TENGAH 29,17 8,31 2,08 14,28 2,08
SULAWESI
SELATAN 24,68 12,80 2,40 9,79 2,40
SULAWESI
TENGGARA 26,75 10,72 0,33 11,87 0,33
GORONTALO 35,84 1,64 8,76 20,95 1,64
SULAWESI
BARAT 28,85 8,63 1,77 13,96 1,77
MALUKU 19,05 18,42 8,03 4,17 4,17
MALUKU
UTARA 16,04 21,44 11,04 1,15 1,15
PAPUA BARAT 20,00 17,48 7,09 5,11 5,11
PAPUA 17,68 19,79 9,40 2,80 2,80
Tabel 4. Hasil Pengelompokan Iterasi 1
PROVINSI C1 C2 C3 PROVINSI C1 C2 C3
ACEH 1 NUSA TENGGARA BARAT 1
SUMATERA UTARA 1 NUSA TENGGARA TIMUR 1
SUMATERA BARAT 1 KALIMANTAN BARAT 1
RIAU 1 KALIMANTAN TENGAH 1
JAMBI 1 KALIMANTAN SELATAN 1
SUMATERA SELATAN 1 KALIMANTAN TIMUR 1
BENGKULU 1 KALIMANTAN UTARA 1
LAMPUNG 1 SULAWESI UTARA 1
KEP, BANGKA BELITUNG 1 SULAWESI TENGAH 1
KEP, RIAU 1 SULAWESI SELATAN 1
DKI JAKARTA 1 SULAWESI TENGGARA 1
JAWA BARAT 1 GORONTALO 1
JAWA TENGAH 1 SULAWESI BARAT 1
DI YOGYAKARTA 1 MALUKU 1
JAWA TIMUR 1 MALUKU UTARA 1
BANTEN 1 PAPUA BARAT 1
BALI 1 PAPUA 1
Proses K-means akan terus beriterasi sampai pengelompokan data sama dengan pengelompokan data iterasi
sebelumnya. Dengan kata lain, proses akan terus melakukan iterasi sampai data pada iterasi terakhir sama dengan
iterasi sebelumnya. Setelah mendapatkan nilai titik tengah atau centroid, proses sama dilakukan dengan mencari
jarak terdekat. Proses pencarian jarak terpendek, pengelompokan data pada iterasi terakhir dan Clustering data
dapat digambarkan pada tabel berikut:
Tabel 5. Centroid Data Iterasi 4
Centroid
Max (C1) 34,86
Average (C2) 27,80
Min (C3) 19,64
Tabel 6. Perhitungan Jarak Pusat Cluster Iterasi 4
JARAK
PROVINSI RATA-RATA C1 C2 C3
TERPENDEK
ACEH 27,61 7,26 0,20 7,96 0,20
SUMATERA
UTARA 22,86 12,01 4,95 3,21 3,21
SUMATERA
BARAT 29,67 5,20 1,86 10,02 1,86
Page | 220
http://ejurnal.stmik-budidarma.ac.id/index.php/komik
KOMIK (Konferensi Nasional Teknologi Informasi dan Komputer) ISSN 2597-4645 (media online)
Volume 2, Nomor 1, Oktober 2018 ISSN 2597-4610 (media cetak)

JARAK
PROVINSI RATA-RATA C1 C2 C3
TERPENDEK
RIAU 27,02 7,84 0,78 7,38 0,78
JAMBI 22,26 12,60 5,54 2,62 2,62
SUMATERA
SELATAN 26,80 8,06 1,00 7,16 1,00
BENGKULU 27,69 7,18 0,12 8,04 0,12
LAMPUNG 28,98 5,88 1,18 9,34 1,18
KEP, BANGKA
BELITUNG 28,59 6,27 0,79 8,95 0,79
KEP, RIAU 22,42 12,44 5,38 2,78 2,78
DKI JAKARTA 30,22 4,65 2,41 10,57 2,41
JAWA BARAT 28,34 6,52 0,54 8,70 0,54
JAWA
TENGAH 33,30 1,57 5,49 13,65 1,57
DI
YOGYAKARTA 37,48 2,61 9,67 17,83 2,61
JAWA TIMUR 30,52 4,34 2,72 10,88 2,72
BANTEN 28,94 5,92 1,14 9,30 1,14
BALI 33,30 1,57 5,49 13,65 1,57
NUSA
TENGGARA
BARAT 34,45 0,42 6,64 14,80 0,42
NUSA
TENGGARA
TIMUR 34,64 0,22 6,84 15,00 0,22
KALIMANTAN
BARAT 25,22 9,65 2,59 5,57 2,59
KALIMANTAN
TENGAH 25,41 9,46 2,40 5,76 2,40
KALIMANTAN
SELATAN 35,04 0,18 7,24 15,40 0,18
KALIMANTAN
TIMUR 21,59 13,27 6,21 1,95 1,95
KALIMANTAN
UTARA 14,89 19,98 12,92 4,76 4,76
SULAWESI
UTARA 26,02 8,85 1,79 6,37 1,79
SULAWESI
TENGAH 29,17 5,70 1,36 9,52 1,36
SULAWESI
SELATAN 24,68 10,18 3,12 5,04 3,12
SULAWESI
TENGGARA 26,75 8,11 1,05 7,11 1,05
GORONTALO 35,84 0,97 8,03 16,19 0,97
SULAWESI
BARAT 28,85 6,01 1,05 9,21 1,05
MALUKU 19,05 15,81 8,75 0,59 0,59
MALUKU
UTARA 16,04 18,83 11,77 3,61 3,61
PAPUA BARAT 20,00 14,87 7,81 0,35 0,35
PAPUA 17,68 17,18 10,12 1,96 1,96
Tabel 7. Hasil Pengelompokan Iterasi 4

PROVINSI C1 C2 C3 PROVINSI C1 C2 C3
NUSA
1 TENGGARA 1
ACEH BARAT

Page | 221
http://ejurnal.stmik-budidarma.ac.id/index.php/komik
KOMIK (Konferensi Nasional Teknologi Informasi dan Komputer) ISSN 2597-4645 (media online)
Volume 2, Nomor 1, Oktober 2018 ISSN 2597-4610 (media cetak)

NUSA
SUMATERA 1 TENGGARA 1
UTARA TIMUR
SUMATERA KALIMANTAN
1 1
BARAT BARAT
KALIMANTAN
1 1
RIAU TENGAH
KALIMANTAN
1 1
JAMBI SELATAN
SUMATERA KALIMANTAN
1 1
SELATAN TIMUR
KALIMANTAN
1 1
BENGKULU UTARA
SULAWESI
1 1
LAMPUNG UTARA
KEP, BANGKA SULAWESI
1 1
BELITUNG TENGAH
SULAWESI
1 1
KEP, RIAU SELATAN
SULAWESI
1 1
DKI JAKARTA TENGGARA
JAWA BARAT 1 GORONTALO 1
JAWA SULAWESI
1 1
TENGAH BARAT
DI
1 1
YOGYAKARTA MALUKU
MALUKU
1 1
JAWA TIMUR UTARA
PAPUA
1 1
BANTEN BARAT
BALI 1 PAPUA 1

3.7 Analisa Data


Pada iterasi 4, pengelompokan data yang dilakukan terhadap 4 cluster dengan iterasi 1 didapatkan hasil yang
sama. Dari 34 data jumlah penduduk berdasarkan provinsi dapat dikertahui, 7 provinsi cluster tingkat tinggi 18
provinsi cluster tingkat sedang dan 9 provinsi lainnya termasuk cluster tingkat rendah.

4. KESIMPULAN
Untuk melakukan penilaian terhadap hasil populasi keluhan kesehatan penduduk menurut provinsi dapat
menerapkan metode clustering K-Means. Data diolah untuk memperolah nilai dari penduduk dengan keluhan
kesehatan menurut provinsi. Data tersebut diolah menggunakan Ms. Excel untuk ditentukan nilai centroid dalam
3 cluster yaitu cluster tingkat keluhan kesehatan tinggi, cluster tingkat keluhan kesehatan sedang dan cluster tingkat
keluhan kesehatan rendah. Cetroid data untuk cluster tingkat keluhan kesehatan tinggi 37.48, Cetroid data untuk
cluster tingkat keluhan kesehatan sedang 27.08 dan Cetroid data untuk cluster tingkat keluhan kesehatan rendah
14.89. Sehingga diperoleh penilaian berdasarkan indeks penduduk yang memiliki keluhan kesehatan dengan 7
provinsi tingkat keluhan kesehatan tinggi yaitu Jawa Tengah, Di Yogyakarta, Bali, Nusa Tenggara Barat, Nusa
Tenggara Timur, Kalimantan Selatan, Gorontalo, 18 provinsi tingkat keluhan kesehatan sedang, dan 9 provinsi
lainnya termasuk tingkat keluhan kesehatan rendah. Hasil yang didapat dari penelitian dapat menjadi masukan
kepada pemerintah, provinsi yang menjadi perhatian lebih pada penduduk yang memiliki keluhan kesehatan tinggi
berdasarkan cluster yang telah dilakukan.

5. REFERENSI
[1] P. Pdam and K. Kendal, “Analisis Perbandingan Algoritma ID3 Dan C4 . 5 Untuk Klasifikasi Penerima
Hibah Pemasangan Air Minum,” vol. 1, no. 3, pp. 234–244, 1978.
[2] D. Ispriyanti and A. Hoyyi, “ANALISIS KLASIFIKASI MASA STUDI MAHASISWA PRODI
STATISTIKA UNDIP dengan METODE SUPPORT VECTOR MACHINE (SVM) dan ID3 (ITERATIVE
DICHOTOMISER 3),” Media Stat., vol. 9, no. 1, pp. 15–29, 2016.
[3] P. Soepomo, “PENERAPAN DATA MINING UNTUK KLASIFIKASI PREDIKSI PENYAKIT ISPA (
Page | 222
http://ejurnal.stmik-budidarma.ac.id/index.php/komik
KOMIK (Konferensi Nasional Teknologi Informasi dan Komputer) ISSN 2597-4645 (media online)
Volume 2, Nomor 1, Oktober 2018 ISSN 2597-4610 (media cetak)

Infeksi Saluran Pernapasan Akut ) DENGAN ALGORITMA DECISION TREE ( ID3 ),” vol. 2, 2014.
[4] P. Algoritma, C. Untuk, K. Predikat, M. Fakultas, K. Dan, and I. Universitas, “Penerapan algoritma c4.5
untuk klasifikasi predikat kelulusan mahasiswa fakultas komunikasi dan informatika universitas
muhammadiyah surakarta,” no. February, 2016.
[5] R. H. Pambudi and B. D. Setiawan, “Penerapan Algoritma C4 . 5 Untuk Memprediksi Nilai Kelulusan
Siswa Sekolah Menengah Berdasarkan Faktor Eksternal,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol.
2, no. 7, pp. 2637–2643, 2018.
[6] S. Kasus and S. Pringsewu, “ANALISIS KEPUASAN MAHASISWA TERHADAP PELAYANAN
AKADEMIK MENGGUNAKAN METODE ALGORITMA C4 . 5,” vol. 2, no. 1, pp. 1–11, 2016.
[7] L. Swastina, “Penerapan Algoritma C4.5 Untuk Penentuan Jurusan Mahasiswa,” Gema Aktual., vol. 2, no.
1, p. 6, 2013.
[8] F. F. Harryanto, S. Hansun, U. M. Nusantara, G. Serpong, and C. Pegawai, “Penerapan Algoritma C4 . 5
untuk Memprediksi Penerimaan Calon Pegawai Baru di PT WISE,” vol. 3, no. 2, pp. 95–103, 2017.
[9] G. F. Mandias et al., “Penerapan Algoritma K-Means Untuk Analisis Prestasi Akademik Mahasiswa
Fakultas Ilmu Komputer Universitas Klabat Application of K-Means Algorithm for Academic
Achievement Analysis of Faculty of Computer Science Universitas Klabat,” pp. 230–239, 2017.
[10] I. Print, I. Online, H. Sulastri, and A. I. Gufroni, “Jurnal Teknologi dan Sistem Informasi PENERAPAN
DATA MINING DALAM PENGELOMPOKAN PENDERITA,” vol. 2, pp. 299–305, 2017.
[11] A. P. Windarto, “Penerapan Data Mining Pada Ekspor Buah-Buahan Menurut Negara Tujuan
Menggunakan K-Means Clustering,” Techno.COM, vol. 16, no. 4, pp. 348–357, 2017.
[12] A. P. Windarto, “Implementation of Data Mining on Rice Imports by Major Country of Origin Using
Algorithm Using K-Means Clustering Method,” Int. J. Artif. Intell. Res., vol. 1, no. 2, pp. 26–33, 2017.
[13] M. G. Sadewo, A. P. Windarto, and D. Hartama, “PENERAPAN DATAMINING PADA POPULASI
DAGING AYAM RAS PEDAGING DI INDONESIA BERDASARKAN PROVINSI MENGGUNAKAN
K-MEANS CLUSTERING,” InfoTekJar (Jurnal Nas. Inform. dan Teknol. Jaringan), vol. 2, no. 1, pp. 60–
67, 2017.
[14] H. Muhammad, R. Sudrajat, and R. Rosadi, “Penerapan Data Mining Dalam Menganalisis Kepribadian
Pengguna Media Sosial Dengan Naïve Bayes Classifier : Studi Kasus,” J. Inform. Univ. Padjadjaran, vol.
1, no. 1, p. 5258, 2016.
[15] M. Ridwan, H. Suyono, and M. Sarosa, “Penerapan Data Mining Untuk Evaluasi Kinerja Akademik
Mahasiswa Menggunakan Algoritma Naive Bayes Classifier,” Eeccis, vol. 7, no. 1, pp. 59–64, 2013.
[16] H. Kurniawan and J. S. Informasi, “Aplikasi datamining untuk memprediksi tingkat kelulusan mahasiswa
menggunakan algoritma apriori di ibi darmajaya bandar lampung,” vol. 2, no. 1, pp. 79–93, 2016.
[17] M. G. Sadewo, A. P. Windarto, and S. R. Andani, “Pemanfaatan Algoritma Clushtering Dalam
Mengelompokkan Jumlah Desa / Kelurahan Yang Memiliki Sarana Kesehatan,” vol. I, pp. 124–131, 2017.
[18] mohamad jajuli nurul rohmawati, sofi defiyanti, “Implementasi Algoritma K-Means Dalam Pengklasteran
Mahasiswa Pelamar Beasiswa,” Jitter 2015, vol. I, no. 2, pp. 62–68, 2015.
[19] J. O. Ong, “Implementasi Algotritma K-means clustering untuk menentukan strategi marketing president
university,” J. Ilm. Tek. Ind., vol. vol.12, no, no. juni, pp. 10–20, 2013.
[20] A. K. Wardhani, “Implementasi Algoritma K-Means untuk Pengelompokkan Penyakit Pasien pada
Puskesmas Kajen Pekalongan,” J. Transform., vol. 14, no. 1, pp. 30–37, 2016.
[21] B. Venkateswarlu and P. G. S. V. P. Raju, “Mine Blood Donors Information through Improved K- Means
Clustering.”
[22] E. Sugiharti and M. A. Muslim, “On-line clustering of lecturers performance of computer science
department of semarang state university using K-MeansAlgorithm,” J. Theor. Appl. Inf. Technol., vol. 83,
no. 1, pp. 64–71, 2016.

Page | 223
http://ejurnal.stmik-budidarma.ac.id/index.php/komik

Anda mungkin juga menyukai