Anda di halaman 1dari 7

PENERAPAN ALGORITMA K-MEANS CLUSTERING ANALYSIS PADA PENYAKIT

MENULAR MANUSIA (STUDI KASUS KABUPATEN MAJALENGKA)

Ade Bastian, Harun Sujadi, dan Gigin Febrianto

Program Studi Teknik Informatika, Universitas Majalengka, Jl. Universitas Majalengka No.1,
Majalengka, 45452, Indonesia

adb@ft.unma.ac.id, harunsujadi@gmail.com, gien_feb@gmail.com

Abstract

Health is a valuable thing for humans because anyone can experience health problems, as well as in
humans are very susceptible to various diseases but the cause we do not realize. The K-means algorithm
is not affected by the order of the objects used, it is proved when the author tries to randomly determine
the starting point of the cluster center of one of the objects at the beginning of the calculation. The
number of cluster members generated amounts to the same when using other objects as the starting
point of the cluster center. However, this only affects the number of iterations performed. Object
grouping (object clustering) is one of the processes of object mining that aims to partition an existing
object into one or more cluster objects based on its characteristics. This study examines how the use of
K-means Cluster Analysis method in the case study of human contagious diseases on an object. This
study examines the K-means Cluster Analysis method in infectious diseases in humans based on the set
of variables established per sub-district of each Puskesmas in which there are 32 Puskesmas offices in
Majalengka District.

Keywords: Algoritm, K-means, Clustering, Human Infectious Diseases,Puskesmas

Abstrak

Kesehatan merupakan hal yang berharga bagi manusia karena siapa saja dapat mengalami gangguan
kesehatan, begitu pula pada manusia yang sangat rentan terhadap berbagai macam penyakit namun
penyebabnya tidak kita sadari. Algoritma K-means tidak terpengaruh terhadap urutan objek yang
digunakan, hal ini dibuktikan ketika penulis mencoba menentukan secara acak titik awal pusat cluster
dari salah satu objek pada permulaan perhitungan. Jumlah keanggotaan cluster yang dihasilkan
berjumlah sama ketika menggunakan objek yang lain sebagai titik awal pusat cluster tersebut. Namun,
hal ini hanya berpengaruh pada jumlah iterasi yang dilakukan. Pengelompokan objek (objek clustering)
adalah salah satu proses dari objek mining yang bertujuan untuk mempartisi objek yang ada kedalam
satu atau lebih cluster objek berdasarkan karakteristiknya. Penelitian ini mengkaji bagaimana
penggunaan Algoritma K-means Cluster Analysis dalam studi kasus penyakit menular manusia pada
suatu objek. Penelitian ini mengkaji metode K-means Cluster Analysis dalam penyakit menular pada
manusia berdasarkan set variabel yang dibentuk per kecamatan tiap Puskesmas yang jumlahnya ada 32
Kantor Puskesmas di Kabupaten Majalengka.

Kata Kunci: Algoritma, K-means, Clustering, Penyakit Menular Manusia, Puskesmas

1. Pendahuluan sangat rentan terhadap berbagai macam penyakit


tetapi penyebabnya tidak kita sadari. Hambatan-
Kemajuan teknologi informasi sudah semakin ber- hambatan yang menyebabkan sulitnya melakukan
kembang pesat di segala bidang kehidupan. Ba- konsultasi penyakit oleh dokter sekarang ini dapat
nyak sekali data yang dihasilkan oleh teknologi in- diatasi dengan adanya program komputer. Dalam
formasi yang semakin canggih, mulai dari bidang hal ini, data informasi dapat membantu pemecahan
industri, ekonomi, ilmu dan teknologi serta berba- masalah terhadap penyakit-penyakit dengan diberi-
gai bidang kehidupan lainnya. Penerapan teknologi kan nasihat kepada pembaca dan menemukan so-
informasi dalam dunia kesehatan juga dapat meng- lusi terhadap berbagai permasalahan yang spesifik.
hasilkan data yang berlimpah mengenai penyakit Analisis cluster merupakan teknik multivariat
menular manusia [1]. yang mempunyai tujuan utama mengelompokan
Kesehatan merupakan hal yang berharga bagi penyakit menular manusia berdasarkan yang fre-
manusia karena siapa saja dapat mengalami gang- kuensi kejadian. Pada penelitian ini, analisis clus-
guan kesehatan, begitu pula pada manusia yang ter dilakukan di daerah Majalengka. Analisis Clus-

26
Ade Bastian, et al., Penerapan Algoritma K-Means Clustering Analysis 27

MULAI

OBJEK PENELITIAN

WAWANCARA
OBSERVASI ANALISIS
STUDY LITERATUR

DATA PENYAKIT
RUMUSAN MASALAH

TUJUAN

MENGHITUNG DATA
MENGGUNAKAN
ALGORITMA K-MEANS

MENENTUKAN
HITUNG DATA PENYAKIT
CENTROID

PERHITUNGAN DATA
PENYAKIT DENGAN
ALGORITMA K-MEANS

KESIMPULAN

SELESAI

Gambar 1. Kerangka Penelitian

ter penyakit menular pada manusia dilakukan se- Tujuan perancangan program ini bukan untuk
hingga setiap penyakit yang paling banyak kesa- menggantikan peran manusia, tetapi untuk men-
maannya dengan objek lain akan berada dalam clu- subtitusikan pengetahuan manusia kedalam bentuk
ster yang sama. Cluster-cluster yang terbentuk me- sistem agar dapat di gunakan oleh orang banyak.
miliki homogenitas internal dan heterogenitas eks- Penelitian ini mendiskusikan dan memperlihatkan
ternal yang tinggi. metode pengelompokkan pada data penyakit yang
Pada penelitian ini, diimplementasikan algo- dimulai dengan membangun data clustering meru-
ritma clustering K-means. Alasan penggunaan al- pakan salah satu metode data mining yang bersifat
goritma K-means di antaranya ialah karena algo- tanpa arahan (unsupervised). Ada dua jenis data
ritma ini memiliki ketelitian yang cukup tinggi ter- clustering yang sering digunakan dalam proses
hadap ukuran objek, sehingga algoritma ini relatif pengelompokan data yaitu hierarchical (hirarki)
lebih terukur dan efisien untuk pengolahan objek data clustering dan non-hierarchical (non hirarki)
dalam jumlah besar. Selain itu algoritma K-means data clustering. K-means merupakan salah satu
ini tidak terpengaruh oleh urutan objek. metode data clustering non hirarki yang berusaha
28 Jurnal Sistem Informasi (Journal of Information System), Volume 14, Issue 1, April 2018

MULAI TABEL 1.
TITIK PUSAT AWAL DARI TIAP CLASTER ITERASI KE-1

Tuberkulosi

Penyakit
BANYAKNYA

Malaria
Kusta
Diare

seks
CLASTER K

Ispa

s
TENTUKAN CENTROID C1 821 1679 235 310 159 31
C2 570 1575 285 969 97 27
C3 1057 2363 261 483 171 82
HITUNG DATA PENYAKIT C4 927 1547 307 469 480 36
C5 732 472 607 472 204 29
C6 843 8 334 162 63 24
KELOMPOKAN DENGAN
HASIL DATA MINIMUM
dilanjutkan dengan penelitian terhadap data penya-
kit manusia, kemudian menentukan penyakit mana
saja yang akan diambil sampelnya. Setelah itu,
YA
ADA DATA YANG HARUS
DI PINDAH ?
dilakukan study literature tentang teori-teori untuk
mengolah data tersebut. Analisis ini menghasilkan
data pe-nyakit menular manusia.
TIDAK Penelitian dilanjutkan dengan merumuskan
SELESAI masalah agar penelitian ini terarah dan mempunyai
masalah yang melahirkan sebuah tujuan. Tujuan-
Gambar 2. Flowchart Algoritma Metode K-Means nya yaitu proses pengelompokan data mining yang
menerapkan algoritma K-means clustering pada
mempartisi data yang ada ke dalam bentuk satu penyakit menular manusia di Kabupaten Maja-
atau lebih cluster/kelompok. Metode ini mempar- lengka untuk data tahun 2014. Selanjutnya, hasil
tisi data ke dalam cluster/kelompok sehingga data pengelompokan dengan algoritma K-means diana-
yang memiliki karakteristik yang sama dikelom- lisis untuk menentukan penyakit mana yang ba-
pokkan ke dalam satu cluster yang sama dan data nyak diderita.
yang mempunyai karakteristik yang berbeda dike-
lompokkan ke dalam kelompok yang lain. Adapun Data mining
tujuan dari data clustering ini adalah untuk memi-
nimalisasi objective function yang ditentukan pada Istilah data mining memiliki beberapa pandangan,
saat proses clustering, yang pada umumnya beru- seperti knowledge discover ataupun pattern recog-
saha meminimalisasikan variasi di dalam suatu clu- nition. Kedua istilah tersebut sebenernya memiliki
ster dan memaksimalisasikan variasi antar cluster ketepatannya masing-masing, istilah knowledge
[2]. discovery atau penemuan pengetahuan tepat karna
Permasalahan yang dikaji dalam penelitian digunakan tujuan utama dari data mining memang
ini adalah bagaimana penggunaan metode K- untuk mendapat pengetahuan yang masih tersem-
means Cluster Analysis dalam penyakit menular bunyi di dalam bongkahan data [3,4]. Istilah pat-
manusia pada suatu objek. Tujuan yang ingin pe- tern recognition atau pengenalan pola pun tetap
nulis capai adalah mengkaji metode K-means Clus- untuk digunakan karena pengetahuan yang hendak
ter Analysis dalam penyakit menular pada manusia digali memang berbentuk pola-pola yang juga ma-
berdasarkan set variabel yang dibentuk per puskes- sih perlu digali dari dalam bongkahan data yang
mas di tiap kecamatan yang jumlahnya ada 32 kan- tengah dihadapi [4].
tor Puskesmas di Kabupaten Majalengka. Terdapat Banyak definisi bagi istilah ini dan belum ada
beberapa penyakit menular yang berjangkit di Ka- yang dibakukan atau disepakati semua pihak. Na-
bupaten Majalengka. Enam di antaranya adalah pe- mun demikian, istilah ini memiliki hakikat (notion)
nyakit Diare, ISPA, Kusta, Malaria, Tuberkulosa, sebagai disiplin ilmu yang tujuan utamanya adalah
Penyakit Menular Seks. Seluruh data diambil dari untuk menemukan, menggali, atau menambang pe-
sejumlah Puskesmas di Kabupaten Majalengka. ngetahuan dari data atau informasi yang kita miliki,
kegiatan inilah yang menjadi garapan atau perha-
2. Metode tian utama dari disiplin ilmu data mining [5].

Alur penelitian mengikuti kerangka penelitian pada Fungsi-Fungsi Dari Data mining
Gambar 1. Penelitian dilakukan di Dinas Kese-
hatan Kabupaten Majalengka. Penelitian diawali Dalam rangka menemukan, menggali, atau mena-
dengan analisis yang meliputi wawancara ke setiap mbang pengetahuan, terdapat enam fungsi dalam
karyawan atau pegawai di Dinas Kesehatan, lalu data mining, yaitu [2]: 1) Fungsi deskripsi (des-
cription), 2) Fungsi estimasi (estimation), 3) Fung-
Ade Bastian, et al., Penerapan Algoritma K-Means Clustering Analysis 29

Gambar 3. Grafik Puskesmas Tiap Cluster

si prediksi (prediction), 4) Fungsi klasifikasi (cla- untuk membantu memperjelas proses hierarki ter-
ssification), 5) Fungsi pengelompokan (classify- sebut [6].
cation), dan 6) Fungsi asosiasi (association). Berbeda dengan metode hierarchical cluster-
Mengacu kepada keenam fungsi data mining ing, metode non-hierarchical clustering justru di-
tersebut dapat dipilih menjadi [2]: 1) Fungsi minor mulai dengan menentukan terlebih dahulu jumlah
atau fungsi tambahan, yang meliputi ketiga fungsi cluster yang diinginkan (dua cluster, tiga cluster,
yang pertama, yaitu deskripsi. Estimasi, dan pre- atau lain sebagainya). Setelah jumlah cluster dike-
diksi; dan 2) Fungsi mayor atau fungsi utama, yang tahui, baru proses cluster dilakukan tanpa mengi-
meliputi ketiga fungsi berikut, yaitu klasifikasi, kuti proses hierarki. Metode ini biasa disebut de-
pengelompokan, dan asosiasi. ngan K-means Clustering [7].

Clustering Flowchart Algoritma Metode K-means

Pada dasarnya clustering merupakan suatu metode Metode K-means clustering merupakan metode
untuk mencari dan mengelompokkan data yang clustering yang dikenalkan oleh [8]. Metode K-
memiliki kemiripan karakteriktik (similarity) anta- means adalah metode yang terkenal cepat dan sim-
ra satu data dengan data yang lain. Clustering me- pel [9]. K-means clustering merupakan salah satu
rupakan salah satu metode data mining yang ber- metode data clustering non-hirarki yang menge-
sifat tanpa arahan (unsupervised), maksudnya me- lompokan data dalam bentuk satu atau lebih clus-
tode ini diterapkan tanpa adanya latihan (train- ter/kelompok. Data-data yang memiliki karakteris-
ing)dan tanpa ada guru serta tidak memerlukan tik yang sama dikelompokan dalam satu cluster/
target output. Dalam data mining ada dua jenis kelompok dan data yang memiliki karakteristik
metode clustering yang digunakan dalam penge- yang berbeda dikelompokan dengan cluster/kelo-
lompokan data, yaitu hierarchical clustering dan mpok yang lain sehingga data yang berada dalam
non-hierarchical clustering [6]. satu cluster/kelompok memiliki tingkat variasi
Hierarchical clustering adalah suatu metode yang kecil [7].
pengelompokan data yang dimulai dengan menge- Langkah-langkah melakukan clustering de-
lompokkan dua atau lebih objek yang memiliki ke- ngan metode K-means adalah sebagai berikut [7]:
samaan paling dekat. Kemudian proses diteruskan 1) Pilih jumlah cluster k; 2) Inisialisasi ke pusat
ke objek lain yang memiliki kedekatan kedua. De- cluster ini bisa dilakukan dengan berbagai cara.
mikian seterusnya sehingga cluster akan memben- Cara yang paling sering dilakukan adalah dengan
tuk semacam pohon dimana ada hierarki (tingkat- random atau acak. Pusat-pusat cluster diberiduberi
an) yang jelas antar objek, dari yang paling mirip nilai awal dengan angka-angka random; 3) Aloka-
sampai yang paling tidak mirip. Secara logika se- sikan semua data/objek ke cluster terdekat. Kede-
mua objek pada akhirnya hanya akan membentuk katan dua objek ditentukan berdasarkan jarak ke-
sebuah cluster. Dendogram biasanya digunakan dua objek tersebut. Demikian juga kedekatan suatu
30 Jurnal Sistem Informasi (Journal of Information System), Volume 14, Issue 1, April 2018

5000 9000
4500 8000
4000 7000
Jumlah kasus

Jumlah kasus
3500 DIARE 6000
3000 5000
2500 ISPA
2000 4000
1500 KUSTA 3000
1000 2000
500 TUBERKULOSIS 1000
0 0
MALARIA
PENYAKIT SEX
Jumlah

Penyakit per puskesmas Penyakit per puskesmas

Gambar 4. Cluster 2 Gambar 5. Cluster 3

data ke cluster tertentu ditentukan jarak antara data tung pusat cluster baru. Pusat cluster yang baru di-
dengan pusat cluster. Dalam tahap ini perlu dihi- tentukan berdasarkan pengelompokan anggota ma-
tung jarak tiap data ke tiap pusat cluster. Jarak pali- sing-masing cluster baru. Pusat cluster baru untuk
ng antara satu data dengan satu cluster tertentu ak- cluster yang pertama dihitung berdasarkan rata-
an menentukan suatu data masuk dalam cluster ma- rata koordinat. Pengulangan dihentikan sampai ha-
na. Untuk menghiutng jarak semua data ke setiap sil perhitungan menunjukkan adanya angka pusat
titik pusat cluster dapat menggunakan teori jarak cluster yang sama; 7) Selesai.
Euclidean yang dirumuskan sebagai persamaan(1)
berikut. 3. Hasil dan Analisis

𝐷(𝑖, 𝑗) Setelah semua data penyakit menular dari Dinas


= (𝑋 − 𝑋 ) + (𝑋 − 𝑋 ) + … + (𝑋 − 𝑋 )
(1) Kesehatan pada tahun 2014 terkumpul, maka data-
data tersebut telah dapat dikelompokan dengan
menggunakan algoritma K-means Clustering. Cara
dimana:
penghitungannya dengan mengukur Euclidean dis-
𝐷(𝑖, 𝑗) = Jarak data keike pusat cluster j
tance-nya. Pengukuran dilakukan terhadap dua ti-
𝑋 = Data ke i pada atribut data ke k
tik dalam satu, dua dan tiga dimensi secara beruru-
𝑋 = Titik pusat ke j pada atribut ke k
tan. Untuk dapat melakukan pengelompokan data-
Jarak pusat cluster dihitung kembali dengan data tersebut menjadi beberapa cluster perlu dila-
keanggotaan cluster yang sekarang. Pusat cluster kukan beberapa langkah, yaitu: 1) Menentukan ju-
adalah rata-rata dari semua data/objek dalam clus- mlah cluster, dalam penelitian ini data-data yang
ter tertentu. Jika dikehendaki bisa juga mengguna- ada akan dikelompokkan mejadi 6 cluster (Gambar
kan median dari cluster tersebut. Jadi rata-rata (me- 3); serta 2) Menentukan titik pusat awal dari setiap
an) bukan satu-satunya ukuran yang bisa dipakai. cluster. Dalam penelitian ini, titik pusat awal
Setiap objek kemudian ditugaskan kembali mema- ditentukan dengan menghitung dari rata-rata data
kai pusat cluster yang baru. Jika pusat cluster tidak terkecil dan terbanyak dan didapat titik pusat dari
berubah lagi maka proses clustering selesai. Atau, setiap cluster dapat dilihat pada Tabel 1.
kembali ke langkah nomor 3 sampai pusat cluster Pada tahap ini perlu dihitung jarak tiap data
tidak berubah lagi. ke tiap pusat cluster. Jarak paling dekat antara satu
Berdasarkan gambar 2, langkah-langkah yang data dengan satu cluster tertentu akan menentukan
dilakukan oleh algoritma metode K-means adalah suatu data masuk dalam cluster mana. Untuk me-
sebagai berikut [6]: 1) Mulai; 2) Menentukan ba- nghitung jarak semua data ke setiap titik pusat clus-
nyaknya cluster yaitu dari data penyakit menular; ter dapat menggunakan teori jarak Euclidean yang
3) Pengesetan nilai awal titik tengah/centoid. Lang- dirumuskan sebagai persamaan(2) berikut:
kah ketiga, menentukan pusat cluster secara acak
pada data awal; 4) Menghitung data penyakit ke 𝐷(𝑖, 𝑗)
centroid dengan menggunakan rumus jarak Euclid; (2)
= (𝑋 − 𝑋 ) + (𝑋 − 𝑋 ) + … + (𝑋 − 𝑋 )
5) Melakukan clustering data dengan memasukkan
setiap obyek ke dalam cluster (grup) berdasarkan
jarak minimumnya; 6) Jika ada data yang harus di- dimana:
pindah, maka langkah selanjutnya adalah menghi- 𝐷(𝑖, 𝑗) = jarak data ke i ke pusat cluster j
Ade Bastian, et al., Penerapan Algoritma K-Means Clustering Analysis 31

6000 3500
5000 3000

Jumlah kasus

Jumlah kasus
4000 2500
DIARE
2000
3000
ISPA 1500
2000 1000
1000 KUSTA
500
0 TUBERKULOSIS 0
MALARIA
PENYAKIT SEX
Jumlah

Penyakit per Puskesmas Penyakit per puskesmas

Gambar 6. Cluster 4 Gambar 7. Cluster 5

𝑋 = data ke i pada atribut data ke k haji, Sindangwangi, Loji, Sukamulya dan Panong-
𝑋 = titik pusat ke j pada atribut ke k an, terlihat bahwa penyakit menular pada cluster 5
didominasi oleh penyakit Tuberkulosis dan Diare.
Pengulangan dihentikan karena hasil perhitu- Sedangkan, berdasarkan Puskesmas didominasi ol-
ngan menunjukkan adanya angka pusat cluster ya- eh penyakit yang berasal dari Puskesmas Panongan
ng sama pada iterasi ke-5 dan ke-6. dan Maja.
Seperti yang ditunjukkan oleh grafik pada Cluster 6, terdiri dari 13143 jiwa penderita
Gambar 4, dari hasil cluster 1, terdiri dari 9416 ji- penyakit menular yang berasal dari Puskesmas
wa penderita penyakit menular yang berasal dari Margajaya, Cikijing, Salagedang, Rajagaluh, Wari-
Puskesmas Cigasong dan Talaga, terlihat bahwa ngin, Kertajati dan Sumberjaya. Pada Gambar 9
penyakit menular pada cluster 1 didominasi oleh terlihat bahwa penyakit menular pada cluster 6 di-
penyakit ISPA dan Diare. dominasi oleh penyakit Diare dan Tuberkulosis.
Sementara itu, dari hasil cluster 2 (ditunjuk- Sedangkan, berdasarkan Puskesmas didominasi ol-
kan pada Gambar 5), terdiri dari 23245 jiwa pen- eh penyakit yang berasal dari Puskesmas Kertajati
derita penyakit menular yang berasal dari Puskes- dan Sumberjaya.
mas Cingambul, Banjaran, Argapura, Sindang, Ba-
lida, Kasokandel dan Jatitujuh terlihat bahwa pe- 4. Kesimpulan
nyakit menular pada cluster 2 didominasi oleh pe-
nyakit ISPA dan Diare. Sedangkan, berdasarkan Dari hasil penelitian yang telah dilakukan dapat
Puskesmas didominasi oleh penyakit yang berasal disimpulkan bahwa K-means merupakan salah satu
dari Puskesmas Argapura dan Balida. metode data clustering non hirarki yang berusaha
Gambar 6 menunjukkan hasil cluster 3. Clus- mempartisi data yang ada ke dalam bentuk satu
ter ini terdiri dari 23415 jiwa penderita penya-kit atau lebih cluster atau kelompok. Kelebihan Algo-
menular yang berasal dari Puskesmas Majalengka, ritma K-means diantaranya adalah mampu menge-
Munjul dan Jatiwangi, dapat dilihat bahwa penya- lompokkan objek besar dan pencilan obyek dengan
kit menular pada cluster 3 didominasi oleh penya- sangat cepat sehingga mempercepat proses penge-
kit ISPA dan Diare. Sedangkan, berdasarkan Pus- lompokan.
kesmas didominasi oleh penyakit yang berasal dari Kekurangan Algoritma K-means yaitu. sangat
Puskesmas Majalengka dan Jatiwangi. sensitive pada pembangkitan titik pusat awal seca-
Hasil cluster 4 seperti diberikan pada Gambar ra random, hasil pengelompokan bersifat tidak unik
7, terdiri dari 20334 jiwa penderita penyakit menu- (selalu berubah-ubah) dan proses pengerjaannya
lar yang berasal dari Puskesmas Malausma, Leuwi- cepat tetapi keakuratannya tidak dijamin.
munding, Panyingkiran, Kadipaten dan Ligung, Dari hasil penelitian dapat ditarik kesimpulan
terlihat bahwa penyakit menular pada cluster 4 bahwa hasil dari metode Algoritma K-means clus-
didominasi oleh penyakit ISPA dan Diare. Dan se- tering data mining dapat digunakan untuk metode
dangkan, berdasarkan Puskesmas didominasi oleh pengendalian persediaan pada Puskesmas Panda-
penyakit yang berasal dari puskesmas Kadipaten naran, sehingga apabila akan dilakukan pengadaan
dan Malausma. persediaan obat pada tahun 2014, petugas dapat
Hasil cluster 5 (Gambar 8), terdiri dari 16384 melihat daftar Puskesmas terbanyak yang mende-
jiwa penderita penyakit menular yang berasal dari rita penyakit menular.
Puskesmas Lemahsugih, Bantarujeg, Maja, Suka- Dari data yang diolah berdasarkan jenis ba-
32 Jurnal Sistem Informasi (Journal of Information System), Volume 14, Issue 1, April 2018

ng (pp. 1-26). John Wiley & Sons, Inc..


3000 DIARE
[3] Berry, M.W. and Browne, M., 2006. Lecture

Jumlah kasis
2000
ISPA notes in data mining. World Scientific.
1000
0
[4] Susanto, S. and Suryadi, D., 2010. Pengantar
KUSTA
data mining: mengagali pengetahuan dari bo-
TUBERKULO ngkahan data.
SIS [5] Luthfi, K. and Taufiq, E., 2009. Algoritma
Data Mining. Yogyakarta: Andi.
Penyakit per puskesmas
[6] Santosa, B., Conway, T. and Trafalis, T.,
2007. A hybrid knowledge based-clustering
multi-class SVM approach for genes express-
Gambar 8. Cluster 6
ion analysis. In Data Mining in Biomedicine
rang, diinputkan sampel data sebanyak 32 data de- (pp. 261-274). Springer, Boston, MA.
ngan. Jumlah yang diperoleh 6 kelompok data telah [7] Agusta, Y., 2007. K-Means Penerapan, Per-
tercluster. masalahan dan Metode Terkait. Jurnal Sistem
dan Informatika, 3(1), pp.47-60.
Referensi [8] Lloyd, S., 1982. Least squares quantization in
PCM. IEEE transactions on information the-
[1] Cushing, B.E., Graham Jr, L.E., Palmrose, ory, 28(2), pp.129-137.
Z.V., Roussey, R.S. and Solomon, I., 1995. [9] Arthur, D. and Vassilvitskii, S., 2006, June.
Risk orientation. Auditing, Practice, Researc- How slow is the k-means method?. In Procee-
h, and Education A Productive Collaboration. dings of the twenty-second annual sympo-
[2] Larose, D.T., 2005. Introduction to data mini- sium on Computational geometry (pp. 144-
153). ACM..

Anda mungkin juga menyukai