Anda di halaman 1dari 5

2.

Tinjauan Pustaka
2.1 Data Mining
Data mining adalah proses mengekstraksi/menggali/ mencari informasi yang tersembunyi
dari dalam database yang besar serta bermanfaat bagi pihak yang berkepentingan. Data
mining dapat membantu pemegang data untuk menganalisis dan menemukan hubungan yang
tidak terduga antar data, pada akhirnya akan membantu pengambilan keputusan. Data mining atau
penambangan data dapat didefinisikan sebagai proses eksplorasi, seleksi, dan pemodelan dari
sejumlah data besar untuk menemukan pola atau kecendrungan yang biasanya tidak disadari
keberadaannya(24). Tujuan dari data mining ini adalah untuk menemukan pola yang
sebelumnya tidak diketahui. Apabila pola sudah ditemukan, selanjutnya digunakan untuk
membuat suatu keputusan untuk keperluan tertentu bagi yang berkepentingan. Data mining
adalah suatu proses menemukan hubungan yang berarti, pola dan kecenderungan dengan
memeriksa dalam sekumpulan besar data yang tersimpan dalam penyimpanan, dengan
menggunakan Teknik pengenalan pola seperti teknik statistik dan matematika(24).
2.2 Clustering
Clustering merupakan proses pengelompokan sekumpulan objek ke dalam kelas/pola objek yang
serupa. Claster merupakan teknik yang sangat penting dalam analisis data. Cluster merupakan
membagi data menjadi kelompok-kelompok atau cluster berdasarkan suatu kemiripan atribut-atribut
diantara sekumpulan data, atribut-atribut yang mirip tersebut dipresentasikan sebagai titik-titik dalam
ruang multidimensi().
2.3 Logika Fuzzy
Logika Fuzzy merupakan salah satu komponen pembentuk soft computing.Logika Fuzzy pertama kali
diperkenalkan oleh Prof.Lotfi A. zadeh pada tahun 1965. Dasar logika fuzzy adalah teori himpunan
fuzzy.Pada teori himpunan fuzzy, peranan derajat keanggotaan sebagai penentu keberadaan elemen
dalam suatu himpunan sangatlah penting. Nilai keanggotaan atau derajat keanggotaan atau
membership function menjadi ciri utama dari penalaran dengan logika fuzzy tersebut. Tidak seperti
logika boolean yang memiliki 2 nilai, logika fuzzy terdiri dari banyak nilai. Logika fuzzy menangani
derajat keanggotaan dan derajat kebenaran. Logika fuzzy menggunakan nilai berkelanjutan nilai
berkelanjutan antara 0 (sepenuhnya salah) dan 1 (sepenuhnya benar). Tidak hanya hitam dan putih,
logika fuzzy mencakup sprektum warna, menandakan bahwa elemen-elemen bisa sebagian benar dan
sebagian salah pada waktu yang sama. Menurut cox (1994), ada beberapa alasan mengapa orang
menggunakan Logika fuzzy, antara lain:
1. Konsep logia fuzzy mudah dimengerti. Karena logika fuzzy menggunakan dasar teori himpunan,
maka konsep matematis yang mendasari penalaran fuzzy tersebut cukup mudah untuk dimengerti.
2. Logika fuzzy sangat fleksibel, artinya mampu beradaptasi dengan perubahan – perubahan, dan
ketidakpastian yang menyertai permasalahan.
3. Logika fuzzy memiliki toleransi terhadap data yang tidak tepat. Jika diberikan sekelompok data
yang cukup homogeny, dan kemudian ada beberapa data yang “eksklusif”, maka logika fuzzy
memiliki kemampuan untuk menangani data eksklusif tersebut.
4. Logika fuzzy dapat membangun dan mengaplikasikan pengalaman – pengalaman para pakar secara
langsung tanpa harus melalui proses pelatihan. Dalam hal ini, serimng dikenal dengan nama fuzzy
expert systems menjadi bagian terpenting.
5. Logika fuzzy dapat bekerjasama dengan teknik-teknik kendali secara konvensional. Hal ini
umumnya terjadi pada aplikasi dibidang teknik mesin maupun teknik elektro.
6. Logika fuzzy didasarkan pada Bahasa alami. Logika fuzzy menggunakan Bahasa sehari-hari
sehingga mudah dimengerti
2.4 Fuzzy Clustering
Menurut Bezdek ( dalam Afiyah, 2014), Fuzzy Clustering merupakan salah satu metode analisis
cluster dengan mempertimbangkan tingkat keanggotaan yang mencakup himpunan fuzzy sebagai
dasar pembobot bagi pengelompokan. Metode ini merupakan pengembangan dari metode partitioning
data dengan pembobotan fuzzy. Keunggulan utama fuzzy clustering adalah dapat memberikan hasil
pengelompokan bagi objek-objek yang tersebar tidak teratur, karena jika terdapat suatu data yang
penyebaranya tidak teratur maka terdapat kemungkinan suatu titik data mempunyai sifat atau
karakteristik dari cluster lain. Sehingga perlu adanya pembobotan kecenderungan titik data terhadap
suatu cluster. Secara matematis, masalah fuzzy clustering telah dirumuskan oleh Bezdek (1981) dalam
bentuk optimasi kendala (Efiyah, 2014).
Terdapat beberapa hal yang perlu diketahui sebelum melakukan fuzzy clustering (Kusumadewi dkk.,
2006) :
1. Ukuran Fuzzy Ukuran fuzzy menunjukkan derajat kekaburan dari himpunan fuzzy. Secara
umum ukuran kekaburan dapat dituliskan sebagai berikut:
𝑓: 𝑃(𝑋) → 𝑅
Dengan P(X) adalah himpunan semua subset dari X dan f(A) adalah suatu fungsi yang
memetakan subset A ke karakteristik derajat kekaburannya. Dalam mengukur nilai kekaburan,
fungsi f harus mengikuti hal-hal sebagai berikut:
a) f(A) = 0 jika dan hanya jika A adalah himpunan crisp.
b) Jika A< f(B), dimana A
c) 𝜇𝐴[𝑥] ≤ 𝜇𝐵[𝑥], jika 𝜇𝐵[𝑥] ≤ 0,5; dan
d) 𝜇𝐴[𝑥] ≥ 𝜇𝐵[𝑥], jika 𝜇𝐵[𝑥] ≥ 0,5
e) f(A) akan mencapai maksimum jika dan hanya jika A benar-benar kabur secara
maksimum. Tergantung pada interpretasi derajat kekaburan, nilai fuzzy maksimal
biasanya terjadi pada saat 𝜇𝐴[𝑥] = 0,5 untuk setiap x.
2. Indeks Kekaburan Indeks kekaburan adalah jarak antara suatu himpunan fuzzy A dengan
himpunan crisp C yang terdekat. Himpunan crisp C terdekat dari himpunan fuzzy A
dinotasikan sebagai:
𝜇𝐶 [𝑥] = 0, jika 𝜇𝐴[𝑥] ≤ 0,5; dan
𝜇𝐶 [𝑥] = 1, jika 𝜇𝐴[𝑥] ≥ 0,5
2.5 Fuzzy C-Means
Fuzzy C-Means (FCM) adalah salah satu teknik peng-cluster-an data yang mana keberadaan tiap-tiap
titik data dalam suatu cluster ditentukan oleh derajat keanggotaannya. Teknik ini pertama kali
diperkenalkan oleh Jim Bezdek pada tahun 1981 (Kusumadewi, 2006). Fuzzy Cluster Means (FCM)
merupakan algoritma yang digunakan untuk melakukan clustering data sesuai berdasarkan keberadaan
tiap-tiap titik data sesuai dengan derajat keanggotaannya (Ahmadi dan Hartati, 2013). Berikut adalah
algoritma clustering FCM:
1. Input data yang akan di-cluster X, berupa matriks berukuran n x p (n=jumlah sampel data,
p=atribut setiap data). Xkj = data sampel ke-k (𝑘 = 1,2, … , 𝑛), atribut ke-j (𝑗 = 1,2,3, . . , 𝑚).
2. Menentukan:
a) Jumlah cluster = c;
b) Pangkat pembobot = m;
c) Maksimum iterasi = MaxIter;
d) Error terkecil yang diharapkan = ε;
e) Fungsi Objektif awal = P0 = 0;
f) Iterasi awal =t=1
3. Bangkitkan bilangan random (𝜇𝑖𝑘, 𝑖 = 1,2, . . , 𝑐; 𝑘 = 1,2, … , 𝑛), sebagai elemen-elemen
matriks partisi awal U
[ ]
μ11 ( x 1 ) μ 12 ( x 2 ) … μ1 c ( x c )
U0= ⋮ ⋮ ⋮
μ11 ( x 1 ) μ 12 ( x 2 ) … μnc ( x c )
Matriks partisi pada fuzzy clustering harus memenuhi kondisi sebagai berikut:
μik =[0 , 1]; ¿
n

∑ μ ik=1 ; 1 ≤i ≤ c
i=1
c
0< ∑ μ ik =1; 1 ≤i ≤ c
i=1
Keterangan :
k =¿ jumlah cluster
n=¿ jumlah data
i=¿ jumlah data
μik =¿ derajat keanggotaan
Hitung jumlah setiap kolom (atribut):
c
Q j=∑ (μ ¿¿ ik)¿
i=1
dengan 𝑗 = 1,2,3, . . , 𝑚
kemudian hitung:
μ ik
μik =
Qj
4. Hitunglah pusat cluster ke-k: Vij, dimana 𝑖 = 1,2,3, . . , 𝑐 dan 𝑗 = 1,2,3, . . ,m
n

∑ (( μ ik )m X kj )
V ij = k=1 n
∑ ( μik )m
k=1

[ ]
v 11 … v 1 m
V= ⋮ ⋱ ⋮
v c 1 … v cm
Keterangan :
V =¿ matriks pusat cluster
5. Hitung fungsi objektif pada iterasi ke-t, Pt dengan menggunakan persamaan sebagai berikut:
n c
Pt =∑ ∑ ¿ ¿ ¿
k=1 i=1
6. Hitung perubahan matriks partisi:

[∑ ( ]
p −1
2 p−1
X kj −V ij )
j=1
μik =
∑ [∑ ( ]
c p −1
2 p −1
X kj−V ij )
i=1 j=1
7. Cek kondisi berhenti:
a. Jika (|𝑃𝑡 − 𝑃𝑡−1 | < ε ) atau (t < MaxIter) maka berhenti;
b. Jika tidak: maka 𝑡 = 𝑡 + 1 kemudian ulang langkah ke-4.
Gambar 1. Flowchart Fuzzy C-Means
3. METODOLOGI PENELITIAN
3.1 Sumber Data
Penelitian ini menggunakan data kualitatif. Data tersebut merupakan data primer yang didapatkan dari
melakukan survey dengan cara mengirim kuisioner pada mahasiswa dan dosen Fakultas Sains dan
Teknologi UIN Sunan Ampel Surabaya. Penelitian ini akan diolah guna mengelompokkan populasi
seluruh mahasiswa dan dosen FST dengan sampel 200 orang dengan rentang 1 (sangat tidak puas)
sampai dengan 5 (sangat puas) yang memiliki tingkat keanggotaan tertinggi berdasarkan variable
yang digunakan. Variabel yang digunakan merupakan evaluasi demi kemajuan Gedung sains dan
teknologi yang disertai dengan faktor kualitas fasilitas, kenyamanan, dan pelayanan dalam Gedung
FST.
3.2 Metode Analisis Data
Metode yang digunakan merupakan metode clustering dengan metode analisis Fuzzy C-Means yang
bertujuan untuk mengelompokkan mengelompokkan kepuasan mahasiswa dan dosen menjadi
kelompok-kelompok berdasarkan variabel-variabel yang sudah saya tentukan sebelumnya. Pertama
kali dilakukan, yaitu menentukan pusat cluster, yang nantinya akan menandai … untuk tiap cluster.
Dengan melakukan iterasi untuk memperbaiki pusat cluster dan derajat keanggotaan tiap-tiap titik
data, maka akan dilihat bahwa pusat cluster dan derajat keanggotaan akan menuju lokasi titik yang
tepat. Pada penelitian ini dilakukan perhitungan manual berdasarkan algoritma Fuzzy C-Means dan
kemudian dibandingkan perhitungannya dengan menggunakan software MATLAB R2013a.
3.3 Desain Penelitian
Adapun desain penelitiannya adalah sebagai berikut:
Gambar 2. Alur Penelitian

Anda mungkin juga menyukai