Anda di halaman 1dari 14

IMPLEMENTASI ALGORITMA K-MEANS UNTUK PENYAKIT

PASIEN PADA RUMAH SAKIT BUAH HATI CIPUTAT DENGAN


METODE CLUSTERING

Disusun oleh :
Adhy Rachmat Sudaryanto (11170384)
Arie Pongai (11170836)
Budi Setiawan (11171092)
M. Rivai (11170582)
Rafhael Stevanus (11170800)

SEKOLAH TINGGI MANAJEMEN INFORMATIKA & KOMPUTER NUSA


MANDIRI JURUSAN SISTEM INFORMASI
JAKARTA
2017
BAB 1
PENDAHULUAN

1.1 Latar Belakang

Perkembangan teknologi di hampir semua bidang pada era ini sangat melaju
dengan pesat, begitu juga pada bidang kesehatan. Saat ini kita dapat mengantisipasi
ataupun meminimalisir angka kematian pada kasus demam berdarah dengan cara
penanganan pada setiap diagnose penyakit sesuai dengan kebutuhannya.
Salah satu penyakit yang menghasilkan angka kematian yang cukup besar
adalah Demam Berdarah. Penyakit ini mirip seperti demam tinggi biasa yang
mengakibatkan banyak orang tidak cepat tanggap dan mengakibatkan efek yang fatal.
Oleh karena itu penulis akan mengkaji kasus demam berdarah ini dalam data mining.
Oleh karena itu, penulis ingin menerapkan metode k-means untuk
menghasilkan informasi mengenai pengelompokkan untuk mengetahui pasien
mengidap “Demam Berdarah” atau “Tidak Demam Berdarah” di Rumah Sakit Buah
Hati Ciputat.

1.2 Rumusan Masalah


Berdasarkan latar belakang yang telah disampaikan di atas, maka penulis
merumuskan masalah yang dihadapi adalah “Bagaimana menerapkan Teknik Data
Mining yang menggunakan Metode Clustering K-Means untuk mengetahui jumlah
pasien yang terkena demam berdarah pada Rumah Sakit Buah Hati Ciputat”.
1.3 Batasan Masalah
Batasan masalah di penilitian ini adalah :
1. Objek yang dikelompokkan berdasarkan Umur, Suhu tubuh (C°) dan
Timbul atau Tidak Timbul Bercak
2. Data pasien yang diambil berdasarkan periode bulan Agustus – September
2017.
3. Algoritma yang digunakan dalam melakukan clustering adalah algoritma
K-Means
BAB 2
LANDASAN TEORI

2.1 Data Mining


Data mining adalah serangkaian proses untuk menggali nilai tambah dari suatu
kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual
(Moertini, 2002). Secara umum data mining memiliki beberapa kajian. Data mining
merupakan pusat dari beberapa kajian. Diantaranya adalah estimasi, seleksi variabel,
clustering, visualisasi, market basket analysis dan klasifikasi. Semua kajian tersebut
termasuk ke dalam data mining.

2.2 Clustering
Clustering adalah metode penganalisaan data, yang sering dimasukkan sebagai
salah satu metode Data Mining, yang tujuannya adalah untuk mengelompokkan data
dengan karakteristik yang sama ke suatu ‘wilayah’ yang sama dan data dengan
karakteristik yang berbeda ke ‘wilayah’ yang lain. Ada beberapa pendekatan yang
digunakan dalam mengembangkan metode clustering. Dua pendekatan utama adalah
clustering dengan pendekatan partisi dan clustering dengan pendekatan hirarki.
Clustering dengan pendekatan partisi atau sering disebut dengan partition-based
clustering mengelompokkan data dengan memilah-milah data yang dianalisa ke dalam
cluster-cluster yang ada.

2.3 K-means
K-Means (MacQueen, 1967) adalah salah satu dari algoritma unsupervised
learning yang paling sederhana untuk menyelesaikan masalah clustering yang telah
dikenal. Prosedur ini mengikuti cara sederhana dan mudah untuk mengklasifikasikan
kumpulan data tertentu melalui jumlah cluster tertentu (menganggap k cluster) yang
telah ditetapkan sebelumnya. Dari beberapa teknik clustering yang paling sederhana
dan umum dikenal adalah clustering k-means (Santosa, 2007).
BAB 3
METODE PENELITIAN

3.1 Lokasi Penelitian


Di penelitian ini peniliti memilih lokasi pada Rumah Sakit Buah Hati Ciputat,
yaitu Rumah Sakit khusus untuk Ibu dan Anak.

3.2 Prosedur Pengumpulan Data


Dalam penyusunan tugas ini perlu adanya suatu metode tertentu yang akan
digunakan dalam pengumpulan data yang diperoleh dengan cara sebagai berikut:

a. Studi Lapangan
Yaitu data yang secara langsung dapat diperoleh dengan meninjau dan
mengamati secara langsung terhadap obyek yang diteliti melalui:
1. Wawancara (Interview) Yaitu metode pengumpulan data yang mengadakan
tanya jawab langsung dengan atau lisan kepada pegawai rumah sakit Buah
Hati Ciputat
2. Survey (Observasi) Penulis mengamati atau melihat secara langsung pada
Rumah Sakit Buah Hati Ciputat yang menjadi objek penelitian, sehingga
penulis mendapatkan gambaran secara lengkap
b. Studi Pustaka
Yaitu penelitian dengan menggunakan dan mempelajari buku-buku maupun
literatur-literatur yang berhubungan dengan masalah yang diteliti sebagai landasan
teori bagi penulis.

3.3 Metode Analisis Data


Metode analisis data untuk teknik pembobotan dan perhitungan yang
dipergunakan dalam tugas akhir ini adalah metode Clustering K Means.

Metode Clustering K Means digunakan karena metode ini dapat memecahkan


masalah yang kompleks dimana kriteria yang diambil cukup banyak dalam memilih
status mahasiswa. Derajat kepentingan pengguna dilakukan dengan pendekatan
perbandingan berpasangan (Pairwise Comparisons).
BAB 4
PEMBAHASAN

4.1 Perhitungan Mawar


Proses perhitungan Teknik Clustering K-Means adalah sebagai berikut :
1. Menentukan jumlah cluster
2. Menentukan Centroid tiap Cluster menggunakan random (Pemilihan
Acak) untuk menentukan centroid awal
3. Lakukan proses Iterasi I dengan menggunakan perhitungan dari data
dan hasil centroid awal
4. Lakukan proses Iterasi ke II menggunakan perhitungan data dan hasil
centroid baru
5. Cocokkan hasil iterasi I dan II apabila hasilnya telah sama maka iterasi
berhenti dan lakukan pengclusteran, apabila hasil masih beda lakukan
iterasi berikutnya hingga menghasilkan hasi yang sama
6. Hasil perhitungan yang paling dekat (minimum) dengan Centroid
merupakan anggota dari kluster tersebut.

4.2 Rapid Miner


Berikut langkah-langkah meggunakan rapid miner:
1. Jalankan Rapid Miner
2. Buat Proses Baru

3. Tampilan Proses Baru

Ketik di kolom operator : “Read Excel” lalu Drag ke dalam “main


Process”.
Pilih Excel File lalu Pilih Data

Pilih Data Pasien


Step 1
Step 2

Step 3

1
Step 4

Step 5

1
4. Memilih Operator Clustering K-Means

1 2

 Ketik di kolom operator: “K-Means” lalu di drag di “Main Process” maka


akan muncul operator clustering
 Lalu hubungkan operator “Excel File” dengan “Clustering”
 Ganti angka di kolom ”K” menjadi 2 sesuai dengan data yang ingin di
clustering kan

5. Membuat Operator Performance


5
1

2
3 4

 Ketik di operator “Distance”


 Pilih “% Cluster Distance Performance” Drag di “Main Process”
 Hubungkan Operator “Clustering” dengan operator “Performance” secara
menyilang
 Lalu Klik Run
6. Hasil Running K-Means Clustering
a) Text View

b) Folder View

c) Centroid Table

4.3 Penentuan Anggota Cluster

Berdasarkan nilai yang di tampilkan pada gambar di atas, maka :


 C0 merupakan cluster yang anggotanya adalah data pasien yang berpotensi
tidak menderita demam berdarah
 C1 merupakan cluster yang anggotanya adalah data pasien berpotensi
menderita demam berdarah
BAB 5
KESIMPULAN

5.1 Kesimpulan
Berdasarkan hasil analisis dan pengujian yang dilakukan pada bab sebelumnya,
maka kesimpulan yang dapat diambil adalah sebagai berikut:

1. Pengujian yang dilakukan oleh peneliti melalui dua kali iterasi.


2. Dari hasil pengujian menggunakan rapid miner, menghasilkan 2 Cluster yaitu
Cluster 0 adalah data pasien yang tidak berpotensi demam berdarah dan
Cluster 1 adalah data pasien yang berpotensi demam berdarah
3. Cluster 0 berjumlah 39 pasien dan Cluster 1 berjumlah 11 pasien

Anda mungkin juga menyukai