Sop Pendidikan Dan Penyuluhan Pasien
Sop Pendidikan Dan Penyuluhan Pasien
Abstrak: Penclusteran Data curah hujan Kota Bengkulu dengan Fuzzy Clustering menggunakan
Algoritma Mixture dan mengevaluasi performasi Algoritma Mixture dalam menghasilkan tingkat
keakuratan lokasi prakiraan curah hujan bulanan di Stasiun Klimatologi Pulau Baai Bengkulu. Data curah
hujan Kota Bengkulu di analisis menggunakan algoritma Mixture dimana pengujian dilakukan
menggunakan software matlab dan software SOCR. Dalam mengelompokkan data curah hujan Kota
Bengkulu, Algoritma Gaussian Mixture Modelling berdasarkan dengan distribusi statistik yang dapat
mengetahui overlapping data dalam sebuah cluster. Dari hasil pengujian Algoritma Mixtures untuk
mendapatkan alternatif yang terbaik, dapat digunakan untuk memecahkan masalah dalam
mengelompokkan data yang memiliki kesamaan jumlah data curah hujan yang sama atau mendekati,
sehingga dapat digunakan sebagai pendukung pengambilan keputusan dalam mengelompokkan
data.Mixture Modelling dalam mengelompokkan data curah hujan Kota Bengkulu mempunyai
kemampuan untuk mendeteksi keberadaan suatu cluster yang overlap dengan cluster yang lain.
Kata Kunci: Fuzzy Clustering, Algoritma Mixture.
Abstract: Grouping rainfall data Bengkulu penerbangan, diberikan layanan jasa meteorologi
City Clustering using Fuzzy Algorithm and
untuk meningkatkan keamanan dan keselamatan
evaluate performasi Mixture Mixture algorithm
to generate the level of location accuracy in penerbangan. Indonesia juga telah menerapkan hal
forecasting monthly rainfall Climatological
ini diantaranya dalam peraturan Pemerintah No. 3
Station Island Baai Bengkulu. Bengkulu city
rainfall data were analyzed using Mixture tahun 2001 tentang keselamatan penerbangan.
algorithm where the testing is done using matlab
Berdasarkan data prakiraan curah hujan tahun
software and software SOCR. In classifying
rainfall data Bengkulu, Gaussian Mixture 2009 pada Kota Bengkulu yang dilakukan pada
Modeling Algorithms based on the statistical
empat pos pengamatan yang digunakan dalam
distribution that can determine overlapping data
in a cluster. Mixtures of the results of the testing proses prakiraan curah hujan yang terjadi dari
algorithm to get the best alternative, it can be
masing-masing pos pengamatan didapat prakiraan
used to solve problems in classifying the data that
have the same amount of rainfall data are the curah hujan dengan rata-rata 200mm – 400 mm
same or close, so it can be used as decision
masuk dalam pengelompokan sifat prakiraan curah
support in classifying data.Mixture Modelling the
rainfall data grouping City Bengkulu has the hujan normal.
ability to detect the presence of a cluster overlap
Stasiun Klimatologi Pulau Baai Bengkulu
with other clusters.
Keywords: Fuzzy Clustering, Algoritma Mixture. adalah salah satu Unit Pelaksana Teknis Badan
Meteorologi Klimatologi dan Geofisika yang
I. PENDAHULUAN
mempunyai tugas pokok untuk melaksanakan
Konvensi Internasional di seluruh dunia
pengamatan, pengolahan, dan penyebaran data
menyatakan bahwa curah hujan mempunyai peran
unsur-unsur cuaca/Iklim (angin, hujan, suhu,
yang sangat penting, untuk mendukung sektor
60 www.jurnal.unib.ac.id
Jurnal Pseudocode, Volume 1 Nomor 1, Februari 2014, ISSN 2355 – 5920
tekanan udara, visibility dan lainnya) sehingga data Hujan Kota Bengkulu Menggunakan Fuzzy
curah hujan dapat dikelompokkan disesuaikan Clustering Algoritma Mixture” yang diharapkan
dengan kebutuhan masyarakat. dapat menyelesaikan permasalahan dalam
Metode fuzzy clustering, telah banyak pengelompokkan atau penclusteran berdasarkan
diaplikasikan untuk mengelompokkan suatu data dengan data hujan dan sifat hujan.
berdasarkan kesamaan/kemiripan yang dimiliki
II. LANDASAN TEORI
oleh suatu wilayah. Terdapat berbagai macam
teknik fuzzy clustering misalnya Fuzzy Mixture A. Prakiraan Curah Hujan
Modelling. Fuzzy Mixture Modelling merupakan Prakiraan adalah suatu proses yang
salah satu jenis data clustering dimana dalam memperkirakan sesuatu secara sistematik tentang
pemodelannya, data dalam suatu kelompok sesuatu yang paling mungkin terjadi di masa depan
diasumsikan terdistribusi sesuai dengan salah satu berdasarkan informasi di masa lalu dan sekarang
jenis distribusi statistik yang ada. yang dimilikinya agar kesalahan (selisih antara
Beberapa contoh pemanfaatan Algoritma hasil pendugaan dengan kenyataannya) dapat
Clustering diantaranya dalam peranan diperkecil [3].
pengelompokan samar dalam prediksi kekeringan Curah Hujan (mm) merupakan ketinggian air
di Indonesia [2], memanfaatkan klustering tingkat hujan yang jatuh pada tempat yang datar dengan
pemakaian pompa air tanah menggunakan model asumsi tidak menguap, tidak meresap dan tidak
fuzzy clustering [7] juga memanfaatkan mengalir. Curah hujan 1 (satu) mm adalah air
pembagian kelas peserta kuliah berdasarkan fuzzy hujan setinggi 1 (satu) mm yang jatuh (tertampung)
clustering dan fuzzy C-Means untuk clustering pada tempat yang datar seluas 1 m² dengan asumsi
data (Studi kasus : data performance mengajar tidak ada yang menguap, mengalir dan meresap
dosen). [3]. Curah hujan kumulatif 1 (satu) bulan adalah
Tujuan penggunaan algoritma Mixture adalah jumlah curah hujan yang terkumpul selama 28 atau
untuk langkah awal mengelompokkan record- 29 hari untuk bulan februari dan 30 atau 31 hari
record data yang dianalisis sehingga terkelompok untuk bulan-bulan lainnya. Sifat hujan merupakan
ke dalam interval-interval kelas yang lebih sedikit perbandingan antara jumlah curah hujan selama
yang diharapkan dapat mempertinggi tingkat rentang waktu yang ditetapkan (satu periode
akurasi yang dihasilkan [1]. Dari data yang musim kemarau) dengan jumlah curah hujan
dihasilkan dari kedua algoritma ini nantinya akan normalnya (rata-rata selama 30 tahun (1971-2000)
dibandingkan sehingga dapat disimpulkan dari pada bulan dan tempat yang sama. Sifat hujan
kedua algoritma ini akan dapat satu algoritma dibagi menjadi 3 (tiga) kategori, yaitu:
dimana hasilnya nantinya mendekati akurasi data. 1. Atas Normal (AN): jika nilai curah hujan lebih
Oleh karenanya akan sangat menarik dari 115% terhadap rata-ratanya.
bagaimana menggunakan algoritma Mixture 2. Normal (N): jika nilai curah hujan antara 85%-
sehingga nantinya dapat dijadikan sebagai salah 115% terhadap rata-ratanya.
satu teknik dalam pengclusteran data curah hujan, 3. Bawah Normal (BN): jika nilai curah hujan
sehingga penulis berniat untuk mengangkat topik kurang dari 85% terhadap rata-ratanya.
ini dalam judul “Pengclusteran Data Curah
www.jurnal.unib.ac.id 61
Jurnal Pseudocode, Volume 1 Nomor 1, Februari 2014, ISSN 2355 – 5920
membuat komputasi menjadi berat dan juga tersebut berisi nilai keanggotaan μi pada himpunan
optimasi parameter-parameter rule menjadi lebih bagian Ai . Berdasarkan persamaan (1) maka
sulit [6]. elemen-elemen pada matriks U harus memenuhi
Dengan fuzzy clustering, suatu data input kondisi sebagai berikut :
output akan dikelompokkan dalam beberapa grup µ ik ∈ {0,1}; 1 ≤ i ≤ c ; 1 ≤ k ≤ n .....................(4)
atau cluster. Informasi cluster ini akan membantu
c
dalam FIS tipe Sugeno terbaik yang bisa ∑µ
i =1
ik = 1 ; 1 ≤ k ≤ n .....................................(5)
memodelkan kelakuan hubungan data input-output
n
0 < ∑ µ ik < n ; 1 ≤ i ≤ c ................................(6)
dengan jumlah rule minimum. Definisi sebuah rule
diasosiasikan dengan suatu cluster data. k =1
Pembangunan FIS demikian bisa secara otomatis Semua kemungkinan partisi matriks X disebut
dilakukan menggunakan fungsi genfis2. Fuzzy dengan hard partition space, yang definisikan
clustering adalah salah satu teknik untuk berikut :
62 www.jurnal.unib.ac.id
Jurnal Pseudocode, Volume 1 Nomor 1, Februari 2014, ISSN 2355 – 5920
i =1 k =1 µ ik = ∈ [0,1] ; 1 ≤ i ≤ c ; 1 ≤ k ≤ n ...............(12)
demikian halnya dengan partisi fuzzy. Pada partisi Semua kemungkinan partisi matriksX disebut
fuzzy, nilai keanggotaan suatu data pada suatu dengan Possibilistic partitioning space, yang
cluster µik terletak pada interval [0,1]. Matrikx didefinisikan sebagai :
partisi pada partisi fuzzy memenuhi kondisi M pc =
(15)
sebagai berikut : n
U ∈ ℜ µik ∈ {0,1}, ∀i, k ; ∃i, µik > 0; ∀k ;0 < ∑ µik < n, ∀i
cxn
µ ik = ∈ [0,1] ; 1 ≤ i ≤ c ; 1 ≤ k ≤ n ..................(8) k =1
c
∑µ
i =1
ik = 1 ; 1 ≤ k ≤ n .........................................(9) C. Algoritma Mixture
Algoritma Mixture merupakan salah satu jenis
n data clustering dimana dalam pemodelannya, data
0 < ∑ µ ik < n ; 1 ≤ i ≤ c ..............................(10)
k =1
dalam satu kelompok diasumsikan terdistribusi
sesuai dengan salah satu jenis distribusi sesuai
Baris ke-i pada matriks partisi U berisi nilai dengan salah satu jenis distribusi statistik yang
keanggotaan data pada himpunan bagian fuzzy Ai . ada. Algoritma mixture merupakan metode yang
Jumlah derajat keanggotaan setiap data pada semua mempunyai optimasi yang sama dengan algoritma
cluster (jumlah setiap kolom) bernilai 1 C-Means melalui proses optimization dan
(persamaan 8). Semua kemungkinan partisi dari Maximization. Berbeda dengan algoritma Hard C-
matriks X disebut dengan fuzzy partitioning space, Means dan Fuzzy C-Means, perbandingan jumlah
yang didefinisikan sebagai : data yang tercakup didalam masing-masing cluster
M hc = juga memperngaruhi hasil akhir dari suatu proses
c n
data clustering. Perbandingan jumlah data yang
U ∈ ℜ µik ∈ {0,1}, ∀i, k ; ∑ µik = 1, ∀k ; 0 < ∑ µik < n, ∀i
cxn
www.jurnal.unib.ac.id 63
Jurnal Pseudocode, Volume 1 Nomor 1, Februari 2014, ISSN 2355 – 5920
space yang digunakan didalam mixture berbasis b. Alokasikan data secara random ke masing-
distribusi Gaussian/Normal adalah Mahalanobis masing cluster yang telah ditentukan
distance space yang sering dikaitkan dengan 1. Hitung means (sama dengan centroid
distribusi multivariate Gaussian menghitung jarak pada K-Means) dari masing-masing
dengan rumus sebagai berikut : cluster
DMahalanobis ( x2 , x1 ) = 2. Hitung standar deviasi/variance
(16)
= ( x2 − x1 )T ∑ ( x2 − x1 )
−1 covariance dari masing-masing cluster
x2 − x1 mahalanobis
3. Hitung nilai probabilitas masing-masing
dimana:
data ke masing-masing cluster
(x2 – x1)T : Transpose dari sebuah matriks 4. Kembali ke Step b.1, apabila perubahan
(∑)-1 : Inverse dari sebuah matriks
nilai probabilitas masih di atas nilai
Σ : Variance Covariance matriks
threshold yang ditentukan, atau apabila
Proses pengalokasian kembali data ke masing- perubahan pada nilai centroid masih di
masing cluster menggunakan Algoritma mixture atas nilai threshold yang ditentukan, atau
modeling. Perbedaannya terletak pada cara apabila perubahan pada nilai objective
penghitungan nilai keanggotaan (Fuzzy C-Means) function masih di atas nilai threshold yang
dan nilai probabilitas data (Mixture Modelling) ditentukan.
untuk menjadi anggota suatu cluster. Penghitungan
c. Kembali ke Step a. apabila masih ada jumlah
nilai pada suatu cluster dikalikan dengan relative
cluster yang ingin dianalisa.
abundance dari cluster yang bersangkutan seperti
Dengan asumsi bahwa data terdistribusi secara
berikut ini
normal, means cluster ke-i, μ i, dihitung dengan
Pik = π i × f i (x k θ i ) ....................................(17)
menggunakan rumus sama dengan metode Fuzzy
dimana: K-Means dengan u ik merupakan nilai probabilitas
p ik : Probabilitas data ke-k menjadi data tersebut termasuk di dalam cluster ke-i.
anggota cluster ke-i Sedangkan standar deviasi/variance covariance
πi : Relative abundances cluster ke-i cluster ke-i, σ i Σ i , dihitung dengan menggunakan
θi
N
: Parameter yang tercakup di dalam
∑ (x k − µi ) 2
distribusi yang diasumsikan untuk σi = k −1 ....................(18)
N −1
cluster ke-i N
∑ (x k − µ i ) ( xk − µ i )T (19)
∑i= k =1
N −1
Berbagai algoritma memungkinkan untuk
digunakan dalam memecahkan proses optimasi dimana:
Carlo (MCMC) maupun algoritma genetika.. sedangkan untuk menghitung nilai probabilitas
Algoritma yang digunakan adalah sebagai berikut : data ke-k ke cluster ke-i digunakan rumus
64 www.jurnal.unib.ac.id
Jurnal Pseudocode, Volume 1 Nomor 1, Februari 2014, ISSN 2355 – 5920
www.jurnal.unib.ac.id 65
Jurnal Pseudocode, Volume 1 Nomor 1, Februari 2014, ISSN 2355 – 5920
Bagian ini merupakan perancangan aplikasi hambatan-hambatan yang terjadi dan kebutuhan-
fuzzy clustering dimana dalam penelitian ini kebutuhan yang diharapkan sehingga dapat
terdapat dua algoritma yang digunakan untuk diusulkan suatu perbaikan. Data yang digunakan
mengujikan data curah hujan menggunakan adalah data curah hujan bulanan Kota Bengkulu
algoritma mixture.. selama lima tahun dimana data berasal dari alat
Dimana untuk algoritma Mixture melakukan pengukur curah hujan Ambrometer atau Type
urutan algoritma yaitu rumus (17),(18) dan Hellman.Program bantu yang digunakan dalam
(19). pengclusteran data curah hujan Kota Bengkulu
8. Mengumpulkan data untuk pelatihan menggunakan Algoritma Mixture adalah Matlab
Langkah ini dilakukan sebelum melakukan 6.5 yang mana dalam program Matlab versi 6.5
pelatihan agar dalam melakukan pelatihan data terdapat Toolbox Fuzzy Cluster yang mempunyai
yang di gunakan lengkap. kemampuan dalam mengelompokkan data sesuai
9. Pelatihan dengan kelompok data yang telah ditentukan.
Langkah ini dilakukan untuk melatih
B. Langkah Komputasi Dalam Pengclusteran
algoritma Mixture untuk menemukan akurasi
Data Curah Hujan Kota Bengkulu
data sehingga terjadi pengelompokan atau
Menggunakan Algoritma Mixture.
pengklusteran data curah hujan.
Langkah-langkah komputasi dalam
10. Pengujian / Testing
pengclusteran data curah hujan ini membandingkan
Bagian ini dilakukan untuk menguji dari kedua
dua algoritma dimana masing-masing algoritma
metode algoritma yang digunakan manakah
memiliki langkah-langkah yang harus ditelusuri
yang menghasilkan cluster yang akurasi data
sehingga dapat dibandingkan, yaitu :
menjadi cluster sesuai dengan cluster yang
ditentukan.
1) Langkah-langkah Komputasi dalam
11. Mengimplementasikan Fuzzy Clustering
Algoritma Mixture: Langkah-langkah dalam
Setelah fuzzy clustering dengan algoritma
pengclusteran data curah hujan dengan algoritma
fuzzy c-means dan mixture diuji maka
Mixture ini terdiri dari beberapa langkah yaitu:
selanjutnya Fuzzy clusetring dengan kedua
algoritma tersebut diimplementasikan sebagai
sebuah sistem yang siap untuk menyelesaikan
masalah menggunakan software Matlab 6.5.
66 www.jurnal.unib.ac.id
Jurnal Pseudocode, Volume 1 Nomor 1, Februari 2014, ISSN 2355 – 5920
Langkah 2 :
a. Hitung Means (sama dengan centroid pada
FCM) dari masing-masing cluster.
Inisialisasi matriks partisi acak dari data
www.jurnal.unib.ac.id 67
Jurnal Pseudocode, Volume 1 Nomor 1, Februari 2014, ISSN 2355 – 5920
ditentukan, atau apabila perubahan pada nilai dilakukan dalam pengujian data tersebut dengan
objective function masih diatas nilai threshold menggunakan Matlab 6.5, dalam tahap proses ini
yang ditentukan. sebagai berikut :
a. Aktifkan Software Matlab, tampilan windows
Dari hasil percobaan, parameter yang akan
utama Matlab akan muncul seperti gambar
dihitung dalam metode itu adalah matriks partisi,
5.10. Untuk menuliskan skrip program yang
pusat cluster (centroid), standar deviasi, dan nilai
telah dibuat, harus dipanggil terlebih dahulu
probabilitas.
Matlab Editor dengan cara; ketik ”Edit” pada
Dalam percobaan yang dilakukan dalam
Prompt Matlab yang ada pada Command
pengujian sistem ini dengan menggunakan data
Windows. Tampilan Matlab Editor dapat dilihat
yang tersimpan dalam Microsoft Excel dengan
pada gambar 4.
nama DATA CURAH HUJAN.xls. Dimana data
yang digunakan terdapat 12 sample data (dimana
untuk data selama satu tahun/12 bulan), dalam dua
variabel yaitu X1 : tempat pemeriksaan Diperta
Padang Harapan dan X2: Stasiun Klomatologi
Pulau Baii. Dimana data yang tabel ini nantinya
yang akan diimplementasikan ke dalam Algoritma
Mixture.
68 www.jurnal.unib.ac.id
Jurnal Pseudocode, Volume 1 Nomor 1, Februari 2014, ISSN 2355 – 5920
www.jurnal.unib.ac.id 69
Jurnal Pseudocode, Volume 1 Nomor 1, Februari 2014, ISSN 2355 – 5920
tampilan ini akan menampilkan semua chart 4 Pusat Cluster Hasil dari Proses Matriks
Partisi
dengan tabel yang ada. 5 Standar Deviasi Ada
6 Nilai Ada
Probabilitas
7 Pembobot Weight = 2
8 Maksimum Iterasi berjalan apabila di
Iterasi run dan iterasi berhenti
apabila distop
9 Kriteria
Penghentian
Pik =π i × f i ( x k θ i ) ,
apabila Pik < ε(
toleransi )
10 Interface Cluster Software SOCR
Demo
Gambar 11. Tampilan Show All pada Software SOCR
VI. KESIMPULAN DAN SARAN
Dari hasil tampilan Show All terdapat result
Berdasarkan analisis, pembahasan dan
tabel for series dimana menampilkan informasi
pengujian sistem mengenai Fuzzy Clustering
nilai means dari sumbu x dan y, nilai standar
Algoritma Mixture dalam mengelompokkan data
deviasi, bobot/weight, count/iterasi yang dilakukan
curah hujan Kota Bengkulu yang telah dibangun,
berdasarkan dengan proses run yang dijalankan
maka terdapat beberapa hal yang dapat
dan epsilon.
disimpulkan yaitu :
a. Dari hasil pengujian Algoritma Mixtures
B. Hasil Analisa Algoritma Mixture (Gaussian
untuk mendapatkan alternatif yang terbaik,
Mixture Modeling/GMM)
dapat digunakan untuk memecahkan masalah
Data yang digunakan adalah data curah hujan
dalam mengelompokkan data yang memiliki
tahun 2008 dengan dua pos pengamatan yaitu
kesamaan jumlah data curah hujan yang sama
X1=Stasiun Klimatologi Pulau Baii dan
atau mendekati, sehingga dapat digunakan
X2=Diperta Padang Harapan. Dimana data diambil
sebagai pendukung pengambilan keputusan
dari bulan januari sampai dengan desember 2008.
dalam mengelompokkan data.
Berdasarkan dengan penelusuran algoritma Fuzzy
b. Mixture Modelling dalam mengelompokkan
Clustering Means (FCM) dan Gaussian Mixture
data curah hujan Kota Bengkulu mempunyai
Modelling (GMM) dilakukan proses penginputan
kemampuan untuk mendeteksi keberadaan
dan perhitungan data dengan menggunakan
suatu cluster yang overlap dengan cluster yang
program Matlab 7.1 dengan jumlah cluster, matriks
lain.
X , matriks partisi, centroid/means, standar deviasi,
nilai probabilitas, pembobot/pangkat (w),
Berdasarkan dengan kesimpulan dan hasil
maksimum iterasi dan kriteria penghentian. Hasil
pengujian sistem dalam penclusteran data curah
perhitungan dapat disajikan pada tabel berikut:
hujan Kota Bengkulu menggunakan Algoritma
Tabel 3 Hasil Analisa perhitungan algoritma GMM Mixtures / Gaussian Mixture Modelling (GMM)
No Unit Input Gaussian Mixture dapat membantu Badan Meteorologi, Klimatologi
Modelling (GMM)
1 Jumlah Cluster Kernel = 3 dan Geofisika Stasiun Klimatologi Pulau Baii
2 Matriks X (mxn) 12 x 2
Bengkulu dalam mengelompokkan atau
3 Matriks Partisi Hasil dari proses
Matriks X
70 www.jurnal.unib.ac.id
Jurnal Pseudocode, Volume 1 Nomor 1, Februari 2014, ISSN 2355 – 5920
menclusterkan data berdasarkan dengan sifat hujan [3] Jaya,2005,” Prediksi Curah Hujan dengan Logika Fuzzy”
Jurnal BMKG Jakarta
dan distribusi statistik memungkinkan untuk
[4] Kusumadewi S, (2002), ”Analisis Desain Sistem Fuzzy
ditambahkan dalam mengakomodasi pendeteksian
Menggunakan Toolbox Matlab”, Yogyakartam Graha Ilmu.
outliers ataupun menangani bentuk-bentuk cluster [5] Kusumadewi S dan Purnomo H, (2004), ”Aplikasi Logika
yang tidak normal. Fuzzy Untuk Pengambilan Keputusan”, Yogyakarta, Graha
Ilmu.
www.jurnal.unib.ac.id 71