Anda di halaman 1dari 9

Perbandingan Algoritma Fuzzy C-Means (FCM) Dan Algoritma

Mixture Dalam Penclusteran Data Curah Hujan


Kota Bengkulu
Herlina Latipa Sari Dewi Suranti
Dosen Tetap Program Studi Teknik Infromatika Dosen Tetap Program Studi Teknik Infromatika
Universitas Dehasen Bengkulu Universitas Dehasen Bengkulu
Email : herlinalatipasari@ymail.com Email : Mrs.Dewisuranti@gmail.com

Abstrak—Penelitian ini dilakukan untuk mendesain Fuzzy berdasarkan sifat hujan, dimana sifat hujan dibagi menjadi 3
Clustering menggunakan algoritma C-Means dan algoritma (tiga) kategori yaitu Atas Normal (AN) jika nilai curah
Mixture dalam penclusteran data curah hujan Kota Bengkulu, hujan lebih dari 115% terhadap rata-ratanya, Normal (N)
membandingkan algoritma C-Means dan Algoritma Mixture jika nilai curah hujan antara 85%-115% terhadap rata-
dalam emnghasilkan performasi algoritma C-Means dan ratanya dan Bawah Normal (BN) jika nilai curah hujan
lagoritma Mixture dalam menghasilkan tingkat keakuratan kurang dari 85% terhadap rata-ratanya. Sehingga curah
lokasi perkiraan curah hujan bulanan stasiun Klimatologi hujan yang terekam pada empat pos pengamatan kota
Pulau Baii Bengkulu. Data curah hujan Kota Bengkulu
Bengkulu akan dikelompok berdasarkan sifat hujan dengan
dianalisis menggunakan algoritma software matlab. Dari hasil
pengujian menggunakan software matlab dibantu menggunakan Algoritma Fuzzy C-Means dan Algoritma
menggunakan software SOCR diperoleh hasil pengujian Mixture.
dengan menggunakan Fuzzy C-Means karena Metode fuzzy clustering, telah banyak diaplikasikan
pengelompokkan datanya berdasarkan dengan derajat untuk mengelompokkan suatu data berdasarkan
keanggotaan sehingga pusat cluster yang diahsilkan dalam kesamaan/kemiripan yang dimiliki oleh suatu wilayah.
mencapai fungsi sasaran mencari solusi terbaik untuk cluster- Terdapat berbagai macam teknik fuzzy clustering misalnya
cluster dapat dilakukan lebih cepat ditunjukkan dengan proses Fuzzy Cluster-Means (FCM) dan Mixture Modelling. Untuk
pengehentian iterasi. Output dari fuzzy C-means bukan Fuzzy C-Means (FCM) ini adalah untuk meminimalisasikan
merupakan Fuzzy Inference System, namun merupakan
objective function yang diset dalam proses clustering, yang
deretan cluster dan beebrapa derajat keanggotaan untuk tiap
tiap titik data. Informasi ini dapat digunakan untuk ada pada umumnya berusaha meminimalisasikan variasi di
membangun suatu fuzzy inference system. dalam suatu cluster dan memaksimalkan variasi antar
cluster. Mixture Modelling merupakan salah satu jenis data
Kata Kunci—Algoritma Fuzzy C-Means; Algoritma Mixture. clustering dimana dalam pemodelannya, data dalam suatu
kelompok diasumsikan terdistribusi sesuai dengan salah satu
I. PENDAHULUAN jenis distribusi statistik yang ada.
Konvensi Internasional di seluruh dunia menyatakan Beberapa contoh pemanfaatan Algoritma Clustering
bahwa curah hujan mempunyai peran yang sangat penting, diantaranya oleh The Houw Liong dan PM Siregar (2003)
untuk mendukung sektor penerbangan, diberikan layanan dalam peranan pengelompokan samar dalam prediksi
jasa meteorologi untuk meningkatkan keamanan dan kekeringan di Indonesia, oleh Muhamad Aqil, Firmansyah,
keselamatan penerbangan. Indonesia juga telah menerapkan Abi Prabowo dan Moses (2000) memanfaatkan klustering
hal ini diantaranya dalam peraturan Pemerintah No. 3 tahun tingkat pemakaian pompa air tanah menggunakan model
2001 tentang keselamatan penerbangan. fuzzy clustering, Susanto dan Ernawati (2006) juga
Berdasarkan data prakiraan curah hujan tahun 2014 pada memanfaatkan pembagian kelas peserta kuliah berdasarkan
Kota Bengkulu yang dilakukan pada empat pos pengamatan fuzzy clustering dan [9] fuzzy C-Means untuk clustering
yang digunakan dalam proses prakiraan curah hujan yang data (Studi kasus : data performance mengajar dosen).
terjadi dari masing-masing pos pengamatan didapat Menurut [1], Tujuan penggunaan algoritma C-Means
prakiraan curah hujan dengan rata-rata 200mm - 400mm dan algoritma Mixture adalah untuk langkah awal
masuk dalam pengelompokan sifat prakiraan curah hujan mengelompokkan record-record data yang dianalisis
normal. sehingga terkelompok ke dalam interval-interval kelas yang
Stasiun Klimatologi Pulau Baai Bengkulu adalah salah lebih sedikit yang diharapkan dapat mempertinggi tingkat
satu Unit Pelaksana Teknis Badan Meteorologi Klimatologi akurasi yang dihasilkan.. Dari data yang dihasilkan dari
dan Geofisika yang mempunyai tugas pokok untuk kedua algoritma ini nantinya akan dibandingkan sehingga
melaksanakan pengamatan, pengolahan, dan penyebaran dapat disimpulkan dari kedua algoritma ini akan dapat satu
data unsur-unsur cuaca / Iklim (angin, hujan, suhu, tekanan algoritma dimana hasilnya nantinya mendekati akurasi data.
udara, visibility dan lainnya) sehingga data curah hujan Oleh karenanya akan sangat menarik bagaimana
dapat dikelompokkan disesuaikan dengan kebutuhan menggunakan algoritma C-Means dan algoritma Mixture
masyarakat. sehingga nantinya dapat dijadikan sebagai salah satu teknik
Dari Pengelompokan data curah hujan dalam satu tahun dalam pengclusteran data curah hujan.
atau 12 bulan sesuai dengan kebutuhan pengelompokan data
Seminar Nasional Aplikasi Teknologi Informasi (SNATi) 2016 ISSN: 1907 – 5022
Yogyakarta, 6 Agustus 2016 A-7
Perumusan masalah dari penelitian ini adalah sebagai Ukuran kedekatan menunjukkan seberapa dekat kedekatan
berikut : fitur antara dua data; sedangkan kriteria pengclusteran
1. Bagaimana menerapkan algoritma C-Means dalam biasanya diekspresikan dengan menggunakan fungsi biaya
pengclusteran data curah hujan ? atau tipe aturan yang lainnya.
2. Bagaimana menerapkan algoritma algoritma Mixture a. Partisi Klasik (hard partition)
dalam pengclusteran curah hujan ? Konsep partisi menjadi bagian yang sangat penting bagi
3. Membandingkan cluster data curah hujan dengan proses pengclusteran. Tujuan proses pengclusteran pada
Algoritma C-Means dan Algoritma Mixture ? partisi klasik adalah membagi himpunan data ke x ke dalam
4. Bagaimana menentukan algoritma yang sesuai c kelompok (grup atau kelas) dengan asumsi bahwa c
digunakan untuk pengclusteran berdasarkan data curah diketahui (Babuska, 2005). Dengan menggunakan teori
hujan? himpunan klasik, partisi klasik x dapat didefinisikan sebagai
suatu keluarga dari himpunan bagian- himpunan bagian (Ai
II. FUZZY CLUSTERING │1 ≤≤} Ai 1 1 C } P( X ), P( X ) adalah power set
Kemunculan fuzzy clustering dilatarbelakangi adanya dari X, dengan properti sebagai berikut (Bezdek,1981):
C
masalah curse of dimensionality, yaitu jumlah rule yang
begitu cepat membesar dengan bertambahnya jumlah ! Ai = X ............................................................ (1)
i =1
variabel input FIS. Jumlah rule yang terlalu besar jelas akan
membuat komputasi menjadi berat dan juga optimasi Ai Aj = ; 1 i j c ................................. (2)
parameter-parameter rule menjadi lebih sulit.
Dengan fuzzy clustering, suatu data input output akan
Aj X ; 1 i c ........................................ (3)
dikelompokkan dalam beberapa grup atau cluster. Informasi Persamaan menunjukkan bahwa union himpunan bagian
cluster ini akan membantu dalam FIS tipe Sugeno terbaik Ai berisi semua data. Himpunan bagian – himpunan bagian
yang bisa memodelkan kelakuan hubungan data input- harus bersifat disjoin (persamaan 2), dan tidak boleh ada
output dengan jumlah rule minimum. Definisi sebuah rule yang berupa himpunan kosong (persamaan 3). Dalam
diasosiasikan dengan suatu cluster data. Pembangunan FIS bentuk fungsi keanggotaan, suatu partisi dapat
demikian bisa secara otomatis dilakukan menggunakan dipresentasikan sebagai matriks partisi U= ik cxn . Baris
fungsi genfis2[7].
ke-i pada matriks tersebut berisi nilai keanggotaan µi pada
Fuzzy clustering adalah salah satu teknik untuk
himpunan bagian Ai . Berdasarkan persamaan 1 maka
menentukan cluster optimal dalam suatu ruang vektor yang
elemen-elemen pada matriks U harus memenuhi kondisi
didasarkan pada bentuk normal Euclidian untuk jarak antar
sebagai berikut :
vektor. Fuzzy clustering sangat berguna bagi pemodelan
fuzzy terutama dalam mengidentifikasi aturan-aturan fuzzy. ik { }
0,1 ; 1 i c ; 1 k n ....................... (4)
Untuk pengelompokkan para pengambil keputusan c
menjadi kelompok-kelompok kecil, berdasarkan persamaan ik = 1;1 k n ........................................ (5)
karakteristik, dibutuhkan suatu mekanisme tertentu. Pada i =1
proses pengclusteran (clustering) secara klasik, n
pembentukan partisi dilakukan sedemikian rupa sehingga 0< ik < n ; 1 i c .................................. (6)
setiap objek berada tepat pada satu partisi. Namun, k =1
adakalanya kita tidak dapat menempatkan suatu objek tepat Semua kemungkinan partisi matriks X disebut dengan
suatu partisi, karena sebenarnya objek tersebut terletak hard partition space (Bezdek, 1981) Partisi Fuzzy (fuzzy
diantara dua atau lebih partisi yang lain. Pada logika fuzzy, partition)
ada beberapa metode yang dapat digunakan untuk Jika pada partisi klasik, suatu data secara eksklusif
melakukan pengelompokkan sejumlah data yang sering menjadi anggota hanya pada satu cluster saja, tidak
dikenal dengan nama fuzzy clustering. Pada kebanyakan demikian halnya dengan partisi fuzzy. Pada partisi fuzzy,
situasi, fuzzy clustering, lebih alami jika dibandingkan nilai keanggotaan suatu data pada suatu cluster µik terletak
dengan pengclusteran secara klasik. Suatu algoritma pada interval [0,1]. Matrikx partisi pada partisi fuzzy
clustering dikatakan sebagai algoritma fuzzy clustering jika memenuhi kondisi sebagai berikut :
dan hanya jika algoritma tersebut menggunakan parameter
strategi adaptasi secara soft competitive (Baraldi, 1998). ik = [ ]
0,1 ; 1 i c ; 1 k n ................... (7)
c
Sebagian besar algoritma fuzzy clustering didasarkan atas
optimasi fungsi obyektif atau midifikasi dari fungsi obyektif ik = 1 ; 1 k n ...................................... (8)
i =1
tersebut.
n
Pemilihan algoritma clustering yang tepat, sangatlah
penting demi suksesnya proses clustering. Secara umum, 0< ik < n ; 1 i c ................................. (9)
algoritma pengclusteran dicirikan berdasarkan ukuran k =1

kedekatan dan kriteria pengclusteran (Vazirgiannis,2003). Baris ke-i pada matriks partisi U berisi nilai
keanggotaan data pada himpunan bagian fuzzy Ai . Jumlah

Seminar Nasional Aplikasi Teknologi Informasi (SNATi) 2016 ISSN: 1907 – 5022
Yogyakarta, 6 Agustus 2016 A-8
derajat keanggotaan setiap data pada semua cluster a. Matrik X berukuran n x m, dengan n = jumlah data
(jumlah setiap kolom) bernilai 1 (persamaan 8). Semua yang akan dicluster; dan m = jumlah variable
kemungkinan partisi dari matriks X disebut dengan fuzzy (kriteria).
partitioning space, yang didefinisikan sebagai : b. Jumlah cluster yang akan dibentuk = C(≥2)
c n c. Pangkat (pembobot) = w (>1).
M hc = U cxn
ik {0,1}, i, k ; ik = 1, k ; 0 < ik < n, i d. Maksimum iterasi
i =1 k =1 e. Criteria penghentian = ξ (nilai positif yang sangat
b. Partisi Posibilistik (possibilistic partition) kecil)
Tidak seperti halnya kedua partisi diatas, pada partisi f. Iterasi awal, t=1, dan ∆ =1;
posibilistic jumlah nilai keanggotaan suatu data pada 2.
0
Bentuk Matriks partisi awal, U , sebagai berikut :
semua cluster tidak harus 1, namun untuk menjamin suatu
data menjadi anggota dari (paling tidak) suatu cluster, 11 ( x1 ) 12 ( x2 ) ! 1n ( xn )
maka diharuskan ada nilai keanggotaan yang bernilai lebih
21 ( x1 ) 22 ( x 2) ! 2 n ( xn )
dari 0. Matriks partisi pada partisi fuzzy memenuhi kondisi U = ..
sebagai berikut (Krishnapuram, 1993): " " ! "
ik = [ ]
0,1 ; 1 i c ; 1 k n ......... (10)
C1 ( x1 ) C 2 ( x2 ) ! Cn ( xn )
i, ik > 0; k ........................................ (11) 3. Hitung Pusat Cluster, V, untuk setiap cluster :
n n
0< ik < n; 1 i c ......................... (12) ( ik ) w .xkj
k =1
Vij = k =1
n
................................ (14)
Semua kemungkinan partisi matriksX disebut dengan w
Possibilistic partitioning space, yang didefinisikan sebagai ( ik )
: k =1
n 4. Perbaiki derajat keanggotaan setiap data pada setiap
M pc = U cxn
ik {0,1}, i, k ; i, ik > 0; k ;0 < ik < n, i
cluster (perbaiki matriks partisi), sebagai berikut:
1
k =1 2 /( w 1)
C
d ik
A. Algoritma C-Means ik = ................... (15)
j =1 d jk
Fuzzy C-Means (FCM) adalah suatu teknik
pengklusteran data yang mana keberadaan tiap-tiap titik data dengan :
dalam suatu cluster ditentukan oleh derajat keanggotaan. 1/ 2
m
FCM bukan merupakan keanggotaan fuzzy inference
system, namun merupakan deretan pusat cluster dan d ik = d ( xk vi ) = ( xkj vij )
j =1
beberapa derajat keanggotaan untuk tiap-tiap titik data.
Informasi ini dapat digunakan untuk membangun suatu Tentukan criteria berhenti, yaitu perubahan matriks partisi
fuzzy inference system [3]. pada iterasi sekarang dengan iterasi sebelumnya, sebagai
Membership function untuk suatu data ke suatu cluster berikut :
tertentu dihitung menggunakan rumus sebagai berikut :
2
= Ut Ut 1
.................................. (16)
c
D ( X k , Vi ) m 1 Apabila ≤ ξ, maka iterasi dihentikan, namun apabila
ik = .................... (13) > ξ, maka naikkan iterasi (t=t+1) dan kembali ke langkah 3.
j 1 D( X k , V j ) Pencarian nilai D dapat dilakukan dengan mengambil
dimana: elemen terbesar dari nilai mutlak selisih antara ik (t)
u ik : Membership function data ke-k ke cluster ke-i
dengan ik (t-1).
v i : Nilai centroid cluster ke-i
m : Weighting Exponent
Membership function, u ik , mempunyai wilayah nilai B. Algoritma Mixture
0≤ u ik ≤1. Data item yang mempunyai tingkat kemungkinan Algoritma Mixture merupakan salah satu jenis data
yang lebih tinggi ke suatu kelompok akan mempunyai nilai clustering dimana dalam pemodelannya, data dalam satu
membership function ke kelompok tersebut yang kelompok diasumsikan terdistribusi sesuai dengan salah satu
jenis distribusi sesuai dengan salah satu jenis distribusi
mendekati angka 1 dan ke kelompok yang lain mendekati
statistik yang ada. Algoritma mixture merupakan metode
angka 0.
yang mempunyai optimasi yang sama dengan algoritma C-
1. Tentukan : Means melalui proses optimization dan Maximization [1].
Distribusi statistik yang paling sering digunakan dalam
data clustering menggunakan metode mixture adalah

Seminar Nasional Aplikasi Teknologi Informasi (SNATi) 2016 ISSN: 1907 – 5022
Yogyakarta, 6 Agustus 2016 A-9
distribusi Gaussian/Normal. Disamping karena kemudahan N
penurunan berbagai rumus yang diperlukan dengan ( xk i )2
distribusi multivariate Gaussian menghitung jarak dengan
rumus sebagai berikut : i = k 1
...................... (18)
N 1
1 N
DMahalanobi s ( x 2 , x1 ) = x 2 x1 mahalanobi s
= ( x 2 x1 ) T ( x 2 x1 ) ( xk ) ( xk )T
i i
dimana: = k =1
........... (19)
T
(x2 – x1) : Transpose dari sebuah matriks
i
N 1
-1
(∑) : Inverse dari sebuah matriks
Σ : Variance Covariance matriks dimana:
dengan relative abundance dari cluster yang bersangkutan N : Jumlah data
seperti berikut ini ì i : Means cluster ke-i
Pik = i × f i (xk i )……....................... (17)
sedangkan untuk menghitung nilai probabilitas data ke-k ke
cluster ke-i digunakan rumus penghitungan probabilitas

dimana: C. Prakiraan Curah Hujan
p ik : Probabilitas data ke-k menjadi anggota Prakiraan adalah suatu proses yang memperkirakan
cluster ke-i sesuatu secara sistematik tentang sesuatu yang paling
: Relative abundances cluster ke-i mungkin terjadi di masa depan berdasarkan informasi di
i
masa lalu dan sekarang yang dimilikinya agar kesalahan
f i (x k | q i) : Distribusi probabilitas cluster ke-i (selisih antara hasil pendugaan dengan kenyataannya) dapat
q i : Parameter yang tercakup di dalam diperkecil [10].
distribusi yang diasumsikan untuk Curah Hujan (mm) merupakan ketinggian air hujan yang
cluster ke-i jatuh pada tempat yang datar dengan asumsi tidak menguap,
Untuk penelitian ini, dipaparkan metode random search tidak meresap dan tidak mengalir. Curah hujan 1 (satu) mm
yang memberikan nilai jumlah cluster secara random di adalah air hujan setinggi 1 (satu) mm yang jatuh
awal setiap proses optimasi. Algoritma yang digunakan (tertampung) pada tempat yang datar seluas 1 m² dengan
adalah sebagai berikut : asumsi tidak ada yang menguap, mengalir dan meresap [10].
a. Tentukan jumlah cluster Curah hujan kumulatif 1 (satu) bulan adalah jumlah
b. Alokasikan data secara random ke masing-masing curah hujan yang terkumpul selama 28 atau 29 hari untuk
cluster yang telah ditentukan bulan februari dan 30 atau 31 hari untuk bulan-bulan
1. Hitung means (sama dengan centroid pada K- lainnya.
Means) dari masing-masing cluster Sifat hujan merupakan perbandingan antara jumlah
curah hujan selama rentang waktu yang ditetapkan (satu
2. Hitung standar deviasi/variance covariance dari
periode musim kemarau) dengan jumlah curah hujan
masing-masing cluster
normalnya (rata-rata selama 30 tahun (1971-2000) pada
3. Hitung nilai probabilitas masing-masing data ke bulan dan tempat yang sama. Sifat hujan dibagi menjadi 3
masing-masing cluster (tiga) kategori, yaitu :
4. Kembali ke Step b.1, apabila perubahan nilai a. Atas Normal (AN) : jika nilai curah hujan lebih dari
probabilitas masih di atas nilai threshold yang 115% terhadap rata-ratanya.
ditentukan, atau apabila perubahan pada nilai b. Normal (N) : jika nilai curah hujan antara 85%-115%
centroid masih di atas nilai threshold yang terhadap rata-ratanya.
ditentukan, atau apabila perubahan pada nilai c. Bawah Normal (BN) : jika nilai curah hujan kurang dari
objective function masih di atas nilai threshold 85% terhadap rata-ratanya.
yang ditentukan.
c. Kembali ke Step a. apabila masih ada jumlah cluster III. METODOLOGI PENELITIAN
yang ingin dianalisa. Kerangka kerja (frame work) merupakan langkah-
Dengan asumsi bahwa data terdistribusi secara langkah yang dilakukan dalam penulisan. Adapun kerangka
normal, means cluster ke-i, ì i,dihitung dengan kerja yang digunakan dalam penulisan ini adalah seperti
menggunakan rumus sama dengan metode Fuzzy K-Means gambar 1.
dengan u ik merupakan nilai probabilitas data tersebut
termasuk di dalam cluster ke-i. Sedangkan standar
deviasi/variance covariance cluster ke-i, ó i Ó i , dihitung
dengan menggunakan rumus sebagai berikut:

Seminar Nasional Aplikasi Teknologi Informasi (SNATi) 2016 ISSN: 1907 – 5022
Yogyakarta, 6 Agustus 2016 A-10
bertujuan untuk mendapatkan informasi atau data yang
Mendefinisikan Ruang Lingkup Masalah dibutuhkan. Selain itu, juga dilakukan studi
kepustakaan yaitu dengan membaca buku-buku yang
menunjang dalam melakukan penganalisaan terhadap
Menganalisa Masalah
data dan informasi yang didapat.
6. Memisahkan Data untuk pelatihan dan pengujian
Menemukan Tujuan Setelah dilakukan pengumpulan data, maka selanjutnya
data yang diperoleh dipisahkan menjadi dua bagian.
Mempelajari Literatur Bagian pertama dipergunakan untuk melatih Fuzzy
Clustering dan bagian kedua digunakan untuk menguji
Mengumpulkan Data
algoritma Fuzzy C-Means dan Mixture.
7. Perancangan Aplikasi Fuzzy Clustering
Bagian ini merupakan perancangan aplikasi fuzzy
Memisahkan Data untuk Pengujian clustering dimana dalam penelitian ini terdapat dua
algoritma yang digunakan untuk mengujikan data curah
hujan menggunakan algoritma fuzzy C-Means dan
Algoritma Fuzzy C-Means Mixture Modelling algoritma mixture berdasarkan dengan Algoritma yang
dimiliki oleh masing-masing.
Menginputkan Data Pelatihan dan Pelatihan Dimana untuk algoritma C-Means melakukan urutan
proses yang terdapat dalam algoritma dengan
Testing/pengujian menggunkana rumus 14, 15, 16, 17 dan 18. sedangkan
untuk algoritma Mixture melakukan urutan algoritma
Mengimplementasikan Fuzzy Clustering C- sama dengan algoritma C-Means menentukan jumlah
Means dan Mixture cluster kemudian menjalankan rumus berdasarkan
urutan algoritma
Gambar 1. Kerangka kerja penelitian Mengumpulkan data untuk pelatihan Langkah ini
dilakukan sebelum melakukan pelatihan agar dalam
Berdasarkan kerangka kerja pada gambar 1 maka melakukan pelatihan data yang di gunakan lengkap.
masing-masing langkahnya diuraikan sebagai berikut : 8. Pelatihan
1. Definisi Ruang lingkup masalah Langkah ini dilakukan untuk melatih kedua algoritma
Ruang lingkup masalah yang akan diteliti harus yaitu Fuzzy C-Means dan Mixture untuk menemukan
ditentukan terlebih dahulu karena tanpa mampu akurasi data sehingga terjadi pengelompokan atau
menentukan serta mendefinisikan rumusan dan batasan pengklusteran data curah hujan.
masalah yang akan diteliti, maka tidak akan pernah 9. Pengujian / Testing
didapat solusi yang terbaik dari masalah tersebut. Jadi Bagian ini dilakukan untuk menguji dari kedua metode
langkah ini adalah langkah awal yang terpenting dalam algoritma yang digunakan manakah yang menghasilkan
penulisan ini. cluster yang akurasi data menjadi cluster sesuai dengan
2. Analisa Masalah cluster yang ditentukan.
Analisa masalah adalah langkah yang dilakukan untuk 10. Mengimplementasikan Fuzzy Clustering
memahami masalah yang telah ditentukan ruang Setelah fuzzy clustering dengan algoritma fuzzy c-
lingkup atau batasannya. Dengan menganalisa masalah means dan mixture diuji maka selanjutnya Fuzzy
yang telah ditentukan tersebut, maka diharapkan clusetring dengan kedua algoritma tersebut
masalah dapat dipahami dengan baik. diimplementasikan.
3. Menentukan Tujuan Analisa sistem adalah penguraian dari suatu sistem utuh
Berdasarkan pemahaman dari masala, maka ditentukan ke dalam bagian komponen-komponen dengan maksud
tujuan yang akan dicapai dari penelitian ini. Pada tujuan untuk mengidentifikasi dan mengevaluasi permasalahan-
ini ditentukan target yang akan dicapai, terutama yang permasalahan, hambatan-hambatan yang terjadi dan
dapat mengatasi masalah-masalah yang ada. kebutuhan-kebutuhan yang diharapkan sehingga dapat
4. Mempelajari Literatur diusulkan suatu perbaikan. Data yang digunakan adalah data
Untuk mencapai tujuan maka dipelajari beberapa curah hujan bulanan Kota Bengkulu selama lima tahun
literature-;iteratur yang dapat dijadikan dasar atau dimana data berasal dari alat pengukur curah hujan
rujukan dalam penelitian ini. Ambrometer atau Type Hellman. Program bantu yang
5. Mengumpulkan Data digunakan dalam pengclusteran data curah hujan Kota
Dalam pengumpulan data dilakukan observasi yaitu Bengkulu menggunakan Algoritma C-Means dan Algoritma
pengamatan secara lansung ditempat penelitian Mixture adalah Matlab 6.5 yang mana dalam program
sehingga permasalahan yang ada dapat diketahui Matlab versi 6.5 terdapat Toolbox Fuzzy Cluster yang
dengan jelas. Kemudian dilakukan wawancara yang

Seminar Nasional Aplikasi Teknologi Informasi (SNATi) 2016 ISSN: 1907 – 5022
Yogyakarta, 6 Agustus 2016 A-11
mempunyai kemampuan dalam mengelompokkan data Kriteria yang digunakan untuk menghentikan proses iterasi
sesuai dengan kelompok data yang telah ditentukan. dari algoritma Mixture adalah Pik = × f i ( xk ),
i i
Kriteria yang digunakan untuk menghentikan proses
iterasi dari algoritma C-Means adalah =Ut Ut 1
, apabila Pik < ( toleransi ) maka iterasi dihentikan.
Proses Pengujian yang dilakukan adalah penerapan
apabila ∆ < ( toleransi ) maka iterasi dihentikan. Namun
algoritma Mixture untuk pengclusteran dengan data curah
apabila ∆ > ( toleransi ) maka naikkan iterasi (t=t+1) dan hujan, jumlah cluster, banyaknya iterasi, toleransi(ξ), dan
proses kembali ke menghitung nilai centroid. pangkat/pembobot telah ditentukan. Titik awal , banyaknya
Proses Pengujian yang dilakukan adalah penerapan iterasi, toleransi(ξ), dan pangkat/pembobot di input pada
algoritma C-Means untuk pengclusteran dengan data curah saat running program. Dalam proses ini akan dihitung
hujan, jumlah cluster, banyaknya iterasi, toleransi(ξ), dan Centroid dan Membership Function dengan menggunakan
pangkat/pembobot telah ditentukan. Data curah hujan, algoritma Mixture. Berikut ini akan dijabarkan langkah-
jumlah cluster, banyaknya iterasi, toleransi(ξ), dan langkah pengclusteran dalam model algoritma Mixture,
pangkat/pembobot di input pada saat running program. diberikan data pada tabel 1.
Dalam proses ini akan dihitung Centroid dan Membership
TABEL I. DATA ALGORITMA MIXTURE
Function dengan menggunakan algoritma C-Means. Berikut
ini akan dijabarkan langkah-langkah pengclusteran dalam X1 X2 Y1 Y2
model algoritma C-Means. Diberikan data sebagai berikut : 10.0 10.0 10.0 50.0
14 8 18 5 8 9 5 10 3 10 20.0 40.0 20.0 70.0
Z =
19 12 20 14 12 19 2 8 3 8 30.0 30.0 30.0 60.0
40.0 50.0 40.0 80.0
Akan dilakukan Fuzzy Clustering dengan FCM. Langkah 1 50.0 50.0 50.0 40.0
a. Jumlah cluster yang diharapkan c=3 60.0 70.0 60.0 40.0
b. Nilai pembobot m=3 70.0 70.0 70.0 20.0
c. Toleransi penghentian ξ = 1.10-6 80.0 80.0 80.0 10.0
d. Maksimum iterasi = 100
Langkah 2 : Inisialisasi matriks partisi awal secara acak Akan dilakukan Fuzzy Clustering Dengan Gaussian Mixture
Modelling (GMM).
Langkah 1 :
Tentukan jumlah cluster dimana Kernel/C = 2

Iterasi 1 : Langkah 2 :
Langkah 3 hitung cluster center (means) a. Hitung Means (sama dengan centroid pada FCM) dari
8.890 8.457 9.129 masing-masing cluster.
V = Inisialisasi matriks partisi acak dari data
9.533 11.762 13.985
Langkah 4 dan 5 hitung jarak dan perbaharui matriks partisi.
Didapatkan matriks partisi sebagai berikut :

Maka didapat means :


0.5980 0.6407 0.3637 0.2759
V =
U i
U i 1
= 31.154 (> ) 0.5615 0.6613 0.7555 0.3431
b. Hitung Standar Deviasi/variance covariance dari
Iterasi 2 :
masing-masing cluster
Langkah 3 : Hitung cluster center (means)
9.986 9.529 4.099 S XX = 21.97402830259
V =
9.674 14.799 3.127 S XY = 83.81626342614
Langkah 4 dan 5 hitung jarak dan perbaharui matriks partisi. SYX = 83.81628342614
Didapatkan matriks partisi baru sebagai berikut :
SYY = 8.133669424448
Ui Ui 1
= 0.05 (> )
Dan seterusnya, perhitungan akan dilaksanakan hingga IV. SIMULASI DAN PENGUJIAN SISTEM
U i
U i 1
< terpenuhi atau maksimum iterasi
Percobaan dilakukan dengan menggunakan Bahasa
tercapai. Pemrograman Matlab 6.5, data yang digunakan

Seminar Nasional Aplikasi Teknologi Informasi (SNATi) 2016 ISSN: 1907 – 5022
Yogyakarta, 6 Agustus 2016 A-12
direpresentasikan dalam bentuk proses pengujian yang
dilakukan dalam penerapan algoritma Fuzzy Clustering
Means (FCM) dan Mixture. Dari hasil percobaan, parameter
yang akan dihitung dalam kedua metode itu adalah matriks
partisi, pusat cluster (centroid), standar deviasi, dan nilai
probabilitas.
Dalam percobaan yang dilakukan dalam pengujian
sistem ini dengan menggunakan data yang tersimapan dalam
Microsoft Excel dengan nama DATA CURAH HUJAN.xls.
Dimana data yang digunakan terdapat 12 sample data
(dimana untuk data selama satu tahun/12 bulan), dalam dua
variabel yaitu X1 : tempat pemeriksaan Diperta Padang
Harapan dan X2: Stasiun Klomatologi Pulau Bali.

TABEL II. DATA CURAH HUJAN

DATA VARIABEL
KE : X1 X2
1 225 174
2 163 205
3 407 475
4 310 226
5 129 84
6 34 79
7 61 72 Gambar 2. Command Windows hasil running program
8 189 227
9 129 190 Setelah starnya dijalankan maka akan memulai dengan
10 164 295 iterasi pertama, dan star kedua dijalankan maka akan
11 580 757
12 717 794
meneruskan proses iterasinya dimana akan terlihat di
command windows proses iterasi yang dilakukan.
Dimana data yang tabel ini nantinya yang akan
diimplementasikan ke dalam algoritma Fuzzy Clustering
Means (FCM) dan Algoritma Mixture.
A. Pengujian Hasil Pengclusteran dalam Algoritma
Fuzzy Clustering Means (FCM)
Pengujian hasil pengclusteran dalam algoritma Fuzzy
clustering means (FCM) dimana dengan mengikuti
algoritma yang sudah dibahas dibab empat. Dalam algoritma
FCM terdapat Pengujian hasil matriks partisi dengan
menginisialisasi matriks partisi awal secara acak dari data
yang digunakan. Berikut langkah-langkah yang dilakukan
dalam pengujian data tersebut dengan menggunakan Matlab
6.5 yang terdapat pada Matlab editor terdapat tiga pilihan,
kita mengklik pilihan change MATLAB current directory.
Maka muncul tampilan hasil running program.

Gambar 3. Command Windows untuk proses iterasi 2D


FCM

Dengan tampilan pada interface 2D FCM nya sebagai


berikut :

Seminar Nasional Aplikasi Teknologi Informasi (SNATi) 2016 ISSN: 1907 – 5022
Yogyakarta, 6 Agustus 2016 A-13
Gambar 6. Tampilan Show All pada Software SOCR

Dari hasil tampilan Show All terdapat result tabel for


series dimana menampilkan informasi nilai means dari
sumbu x dan y, nilai standar deviasi, bobot/weight,
Gambar 4. Hasil 2D FCM setelah dilakukan proses iterasi count/iterasi yang dilakukan berdasarkan dengan proses run
yang dijalankan dan epsilon.
B. Pengujian Hasil Pengclusteran dalam Algoritma Hasil pengelompokkan data Gaussian Mixture
Mixture Modelling (GMM) menunjukkan pengelompokkan data
Pengujian hasil pengclusteran dalam algoritma berdasarkan dengan distribusi statistik dengan Gaussian,
Mixture dimana dengan mengikuti algoritma yang sudah pada algoritma ini langkah awal yang dilakukan berdasarkan
dibahas dibab sebelumnya. Dalam algoritma Mixture dengan nilai centroid titik-titik data yang didapat mean baru
sebenarnya untuk input data sama dengan algoritma yang dan probabilitas cluster tiap iterasi sehingga terjadi
dibahas pada FCM, tetapi pada algoritma mixture ini pergeseran data sehingga proses run yang dilakukan
terdapat nilai standar deviasi dan nilai probabilitas yang mendeteksi terjadinya overlap data dalam sebuah cluster.
masuk dalam proses algoritma ini .
C. Perbandingan Algoritma Fuzzy Clustering Means
(FCM) dan Algoritma Mixture (Gaussian Mixture
Modeling/GMM)
Data yang digunakan adalah data curah hujan tahun
2008 dengan dua pos pengamatan yaitu X1=Stasiun
Klimatologi Pulau Baii dan X2=Diperta Padang Harapan.
Dimana data diambil dari bulan januari sampai dengan
desember 2008. Berdasarkan dengan penelusuran algoritma
Fuzzy Clustering Means (FCM) dan Gaussian Mixture
Modelling (GMM) dilakukan proses penginputan dan
perhitungan data dengan menggunakan program Matlab 7.1
dengan jumlah cluster, matriks X , matriks partisi,
centroid/means, standar deviasi, nilai probabilitas,
pembobot/pangkat (w), maksimum iterasi dan kriteria
penghentian. Hasil perhitungan dapat disajikan pada tabel 3.

Gambar 5. Tampilan Graph dari Software SOCR

Chart Graph yang dihasilkan dari proses input data dan


proses mapping yang sudah dilakukan dan juga dapat
dengan fasilitas Show All karena karena pada tampilan ini
akan menampilkan semua chart dengan tabel yang ada.

Seminar Nasional Aplikasi Teknologi Informasi (SNATi) 2016 ISSN: 1907 – 5022
Yogyakarta, 6 Agustus 2016 A-14
TABEL III. HASIL PERHITUNGAN FCM DAN GMM V. KESIMPULAN DAN SARAN
No Fuzzy Clustering Means Gaussian Mixture
(FCM) Modelling (GMM) Perbadingan algoritma Fuzzy Clustering Means (FCM)
1 Pengelompokkan data Pengelompokkan data dan Gaussian Mixture Modelling (GMM) untuk
berdasarkan dengan derajat berdasarkan dengan mendapatkan alternatif yang terbaik, dapat digunakan untuk
keanggotaan distribusi statistik (Gausian
Mixture Modelling) memecahkan masalah dalam mengelompokkan data yang
2 Pada hasil perhitungan nilai Pada hasil perhitungna nilai memiliki kesamaan jumlah data curah hujan yang sama atau
center/ pusat cluster : centroid pada 10 iterasi untuk mendekati, sehingga dapat digunakan sebagai pendukung
a. Untuk iterasi 1 : pada masing-masing cluster pengambilan keputusan dalam mengelompokkan data.
cluster 1 terdapat didapat nilai means dari
peningkatan pergeseran masing-masing cluster yang Hasil analisa perbandingan antara algoritma Fuzzy C-
sebesar 0,07% mengandung perubahan data Means (FCM) dan Gaussian Mixture Modelling (GMM)
b. Untuk iterasi 1 : pada 0% nilai probabilitas 0.5000 maka algoritma Fuzzy C-Means dapat dikembangkan dalam
cluster 2 terdapat untuk cluster 2, dan variences pengelompokkan data curah hujan Kota Bengkulu yang
peningkatan pergeseran untuk cluster 1 dan 2 terdapat
0,05% trend data naik turun. Dari berdasarkan sifat hujan karena algoritma fuzzy C-Means
c. Untuk iterasi 2 : pada koordinat yang terdpaat dapat menentukan lokasi terbaik dalam cluster berdasarkan
cluster 1 terdapat dalam cluster 1 dan 2 dengan proses iterasinya. Hasil penelitian ini Algoritma
penurunan sebesar 0.02% semakin tinggi nilai standar FCM dapat membantu Badan Metereologi, Klimatologi dan
d. Untuk iterasi 2 : pada deviasi penyimpangan yang
cluster 2 terdapat terjadis emakin besar dengan Geofisika Stasiun Klimatologi Pulau Baii Bengkulu dalam
penurunan sebesar kondisi buruk. Standar mengelompokkan atau mengclusterkan data berdasarkan
0,008% deviasi dari hasil kriteria dengan sifat hujan.
Dari pergeseran yang terjadi yang pertama dan kedua
pada proses dua iterasi sudah yang dihasilkan matrik
mencapai titik pusat cluster deviasi yang trendnya naik DAFTAR PUSTAKA
yang mencapai fungsi turun.
sasaran (object fungtion) [1] Agusta Yudi, (2007), “K-Means-Penerapan, Permasalahan dan
pada koordinat Metode Terkait”, Journal Sistem dan Informatika Vol.3 hal 47-60.
C1:716.25554 dan 716.8897 [2] Aqil M, Firmansyah, Prabowo A, Macalinao M, 2007, “Klastering
dan C2:793.1132 dan Tingkat Pemakaian Pompa Air Tanah Menggunakan Model
793.9201 Fuzzy”Jurnal Informatika Pertanian Volume 16 No.1
3 Iterasi akan terhenti apabila Hasil iterasi berhenti sampai [3] Kusumadewi S, 2002,”Analisis Desai Sistem Fuzzy menggunakan
mencapai fungsi sasaran overlap data dan cluster yang Toolbox Matlab”, Yogyakarta, Graha Ilmu.
(object function) ditentukan [4] Kusumadewi S dan Purnomo H, 2004,”Aplikasi Logika Fuzzy Untuk
4 Pada Fuzzy C-Means dalam Pada Gaussian Mixture Pengambilan Keputusan”, Yogyakarta, Graha Ilmu.
penclusteran data membagi Modelling pembagian data [5] Kusrini dan Luthfi Taufik Emha, 2009, “Algoritma Data Mining”,
data dibagian tengah tanpa dengan menyesuaikan pada Yogyakarta, Penerbit Andi.
memikirkan komposisi dan keadaan data yang melihat [6] Kusumadewi S, Hartati, S, Harjoko A, Wardoyo R, 2006,”Fuzzy
keadaan data yang dimodel. sebaran dan distribusi data Multi Atribut Decision Making (Fuzzy MADM)” Yogyakarta, Graha
yang dianalisa. Ilmu.
5 Dalam Fuzzy C-Means Gaussian Mixture Modelling [7] Naba Agus, 2009, “Belajar Cepat Fuzzy Logic Meggunakan
mempunyai kemampuan (GMM) mempunyai Matlab”,“Belajar Cepat Fuzzy Logic Meggunakan
pengalokasian ulang data ke kemampuan untuk Matlab”Yogyakarta, Andi
cluster dan objective function mendeteksi keberadaan suatu [8] Susanto dan Ernawati, 2005, “Pembagian Kelas Peserta kuliah
yang digunakan. cluster yang overlap dengan ebrdasarkan dengan Fuzzy Clustering dan Partition Coefficient and
cluster yang lain. Exponential Separation (PCAES) Index”.
6 Pengalokasian data dalam Pengalokasian data [9] Luthfi Taufik E, 2007, “Fuzzy C-Means untuk Clustering data (Studi
setiap cluster tergantung pada berdasarkan dengan means Kasus : Data Performance Mengajar Dosen)”, Seminar National
pusat cluster. masing-maisng cluster. Technologi Tahun 2007, Yogyakarta.
[10] Warsito B dan Sumiyati S, 2003,”Prediksi Curah Hujan Kota
Semarang dengan Feedward Neural Network Menggunakan
Dari tabel 3 dapat disimpulkan bahwa kedua algoritma Algoritma Quasi Newton BFGS dan Levenberg-Marquardt”, Jurnal
Fuzzy Clustering Means (FCM) dan Gaussian Mixture Program Studi Teknik Lingkungan FT Undip.
Modelling (GMM) pada data curah hujan Kota Bengkulu
maka algoritma dapat dikembangkan dengan kasus ini
adalah Fuzzy C-Means karena pengelompokkan datanya
berdasarkan dengan derajat keanggotaan sehingga
memperbaiki pusat cluster yang dihasilkan dalam mencapai
minimisasi fungsi sasaran yang menggambarkan jarak dari
titik-titik data yang diberikan ke pusat cluster untuk mencari
lokasi terbaik untuk cluster-clusterdapat dilakukan lebih
cepat yang ditunjukkan dengan proses penghentian iterasi.

Seminar Nasional Aplikasi Teknologi Informasi (SNATi) 2016 ISSN: 1907 – 5022
Yogyakarta, 6 Agustus 2016 A-15

Anda mungkin juga menyukai