Anda di halaman 1dari 6

CLUSTERING KINERJA AKADEMIS MAHASISWA PASCASARJANA UIN KHAS

JEMBER MENGGUNAKAN FUZZY C- MEANS


CLUSTERING ACADEMIC PERFORMANCE OF POSTGRADUATE STUDENTS OF
UIN KHAS JEMBER USING FUZZY C- MEANS

Elok Rahmawati1, Deni Arifianto2, Amalina Maryam Zakiyyah3


1
Mahasiswa Program Studi Teknik Informatika, Fakultas Teknik, Universitas Muhammadiyah Jember
email: elokrahmawati894@gmail.com
2
Dosen Program Studi Teknik Informatika, Fakultas Teknik, Universitas Muhammadiyah Jember
email: deniarifianto@unmuhjember.ac.id
3
Dosen Program Studi Teknik Informatika, Fakultas Teknik, Universitas Muhammadiyah Jember
email: @unmuhjember.ac.id

Abstrak
Clustering mahasiswa program pascasarjana dilakukan untuk mengelompokkan mahassiwa ke
dalam cluster tertentu yang memiliki kemiripan data menggunakan algoritma Fuzzy C-means. Data
yang diambil yaitu data umur dan ips (index prestasi mahasiswa). Metode validitas cluster dari hasil
algoritma Fuzzy C-Means menggunakan DBI (Davies Bouldin Index) untuk mengukur seberapa
bagus cluster yang dihasilkan oleh algoritma Fuzzy C-Means. Dari penelitian yang telah dibuat
peneliti berikut hasil DBI cluster 2 adalah cluster yang menghasilkan nilai DBI terkecil yaitu 2,1541
dengan cluster 1 yang memiliki data mahasiswa dengan rentang umur 21 sampai 30 dan cluster 2
memiliki data mahassiwa dengan rentang umur 31 sampai 45.
Kata kunci: Fuzzy C-Means, DBI (Davies Bouldin Index)

Abstract
Clustering of postgraduate students is carried out to group students into certain clusters that
have similar data using the Fuzzy C-means algorithm. The data taken are age data and IPS (student
achievement index). The cluster validity method of the results of the Fuzzy C-Means algorithm uses
the DBI (Davies Bouldin Index) to measure how good the clusters produced by the Fuzzy C-Means
algorithm are. From the research that has been done by the researchers, the results of DBI cluster 2
are the clusters that produce the smallest DBI value, namely 2.1541, with cluster 1 having student
data ranging from 21 to 30 and cluster 2 having student data ranging from 31 to 45.

Keyword : Fuzzy C-Means, DBI (Davies Bouldin Index)


1. PENDAHULUAN Peneliti di sini berkeinginan untuk
mengelompokkan data mahasiswa melalui
proses metode clustering.
Salah satu indikator kemajuan suatu negara
adalah meningkatnya kualitas pendidikan yang Dalam proses pengelompokan data
dimilikinya. Dalam hal ini, bidang pendidikan mahasiswa peneliti menggunakan metode
memiliki peran penting untuk meningkatkan clustering dikarenakan metode tersebut mampu
kualitas kualitas diri. Tergantung pada kualitas memperoleh output kelompok-kelompok
tenaga kerja akan dipengaruhi oleh beberapa data. Menurut Clustering adalah metode
hal diantaranya pendidikan dan kesehatan. pengelompokan berdasarkan ukuran
Dengan mengenyam pendidikan tinggi, kedekatan. Metode clustering memiliki
manusia dapat meningkatkan kualitasnya. bermacam-macam algoritma pada proses
Salah satu perguruan tinggi dapat memperoleh pengolahannya. Fuzzy C-means merupakan
pelatihan tambahan selain dari pendidikan salah satu dari macam-macam algoritma
yang diwajibkan pemerintah, yaitu dengan metode clustering. 1 yang disusun oleh Fitria
mengikuti kuliah. dkk, dengan judul Perbandingan Pengclusteran
Data Iris Menggunakan Metode K-Means dan
Di Indonesia banyak sekali tempat Fuzzy C-Means. Menyimpulkan bahwa hasil
menuntut ilmu dan jurusan yang berbeda-beda, dari pengclusteran data user knowledge
salah satunya adalah di kota Jember yang modeling dengan menggunakan metode K-
merupakan kota yang memiliki tempat belajar Means dan Fuzzy C-Means ternyata metode
yang cukup banyak dan berbagai jurusan yang Fuzzy C-Means yang menghasilkan nilai
bisa dipelajari untuk menimba ilmu. .bangun. validitasnya yang mendekati 1 yaitu 0,2854
Untuk mencapai efek pembelajaran yang sedangkan menggunakan metode K-Means
berkualitas, UIN KHAS Jember telah menghasilkan nilai 0,1866 yang artinya metode
menerapkan berbagai cara untuk Fuzzy C-Means lebih baik dari pada metode K-
pengembangan yang telah dilakukan seperti Means untuk melakukan clustering.
dengan merumuskan kurikulum, membangun
gedung dengan fasilitas yang sesuai dan Oleh karenanya peneliti ingin
melengkapi dan melengkapi fasilitas khusus menggunakan metode Fuzzy C-Means
untuk siswa penyandang cacat, mengevaluasi untuk penelitian peneliti, dikarenakan
kinerja fakultas dan mengubah pengajaran metode Fuzzy C-means menghasilkan
metode. output yang lebih baik untuk proses
pengclusteran data. Maka peneliti
Rasio mahasiswa pascasarjana mengajukan judul penelitian
merupakan salah satu ukuran kualitas kampus "Clustering Kinerja Akademis
UIN KHAS Jember karena rasio mahasiswa Mahasiswa Pascasarjana UIN KHAS
pascasarjana dapat mempengaruhi nilai Jember Menggunakan Fuzzy C-
akreditasi kampus. Sebagai contoh, studi kasus Means".
pada program Pascasarjana yang masa studi
normalnya adalah 2 tahun studi atau 4 semester 2. KAJIAN PUSTAKA
menunjukkan bahwa masih banyak mahasiswa
yang tidak dapat mengikuti perkuliahan dalam Penelitian ini tidak terlepas dari
batas studi normal. Di bawah ini adalah literatur yang digunakan sebagai landasan,
persentase total data untuk mahasiswa dasar serta pedoman dalam menyelesaikan
pascasarjana lembaga agama Islam Jember penelitian ini.
2015-2018.
2.1 Data Mining
Berdasarkan banyaknya mahasiswa Data mining adalah proses
program Pascasarjana UIN KHAS Jember pengumpulan data yang mengandung sejumlah
terdapat berbagai macam karakter serta kondisi besar informasi yang akan digunakan untuk
mahasiswa yang berbeda-beda. Sering kali tujuan tertentu.
mengakibatkan mahasiswa tersebut mengulang
mata kuliah yang terjadi karena mendapat nilai 2.2 Clustering
yang tidak sesuai dengan ketentuan ke lulusan.

2|
Clustering adalah metode dalam mencakup semua jenis penelitian berdasarkan
pengolahan data mining yang menghasilkan persentase, rata-rata, atau kalkulasi statistik
output dari proses pengolahan data nya adalah lainnya. Alat yang digunakan misalnya tabel
sebuah kelompok atau kelas-kelas yang dan diagram.
berkarakteristik sama atau mirip.
3.2. Jenis Penelitian
2.3. Fuzzy C-Means Riset terapan menekankan pada
Output dari Fuzzy C-Means adalah manfaat praktis dari hasil riset dalam
deretan pusat cluster, dan setiap titik data memecahkan masalah spesifik dan menemukan
memiliki beberapa derajat keanggotaan. produk baru yang bermanfaat bagi kehidupan.
Informasi ini dapat digunakan untuk
membangun sistem inferensi fuzzy. Berikut 3.3 Langkah-langkah Penelitian
rumus perhitungan fuzzy c-means. Langkah-langkah penelitian peneliti
ditunjukkan pada Gambar 3.1.Metode
(1) Penelitian, serta penjelasan nya sebagai
berikut:
(2)
Perencanaan

Studi Literatur
(3)

Pengumpulan Data
(4)
Implementasi Program

Analisa Hasil
(5)

2.4. Normalisasi Min-Max 3.4. Perencanaan


Normalisasi Min-Max adalah
proses yang digunakan untuk Pada tahap perencanaan terdapat 3
menormalkan semua variabel data uraian yang akan dilakukan untuk tahap ini
menjadi data dengan bobot yang sama yaitu merumuskan masalah, survey, observasi.
(Shofiani, 2017: 51).
3.5. Studi Literatur
(6) Adapun buku dan jurnal yang diambil
referensi dalam studi literatur ini adalah Buku
2.5. Davies Bouldin Index ciptaan Kusuma, S., & Purnomo, H. (2010).
Tujuan dari DBI adalah Aplikasi Logika Fuzzy.
menentukan nilai atau value dari beberapa
cluster yang diperoleh untuk menjadikan 3.6. Pengumpulan Data
salah satu nilai cluster yang paling valid Pada proses penumpula data terdapat 4
untuk di ambil atau digunakan. hal yang diperhatikan yaitu :
1. Seleksi data Bertujuan untuk
menyeleksi data parameter yang diperlukan
(7) dalam proses data mining.
2. Cleaning Bertujuan untuk menjamin
kualitas data yang dipilih, pada titik ini
3. METODE PENELITIAN masalah yang akan diselesaikan adalah
duplikasi data.
3.1. Pedekatan Penelitian 3. Integrasi data bertujuan
Metode penelitian kuantitatif mengacu mengintegrasikan data ke dalam database,
pada observasi yang mengukur skala nilai karena datanya lebih dari satu tabel, maka
sampai batas tertentu. Penelitian kuantitatif

3|
perlu dilakukan tahapan penggabungan data
dari berbagai tabel yang berbeda. (10)
4. Normisasi parameter yang bertujuan Menghitung perubahan Matriks Partisi
untuk menyeimbangkan data nilai parameter
dan menyederhanakan data nilai parameter
dengan skala value 0 sampai 1 menggunakan (11)
persamaan sebagai berikut:
3.9 Validitas Cluster dengan Metode
(8) Davies Bouldin Index (DBI)
Pada tabel 3.1 adalah hasil nilai
3.7. Implementasi Program anggota cluster
Pada gambar diagram alur dibawah ini Tabel 3. 1. Hasil nilai anggota cluster
akan dijelaskan bagaimana langkah
perancangan sistem. Data cenderung masuk ke cluster
ke-
Mulai
1 2 3
0,6992 0,4984 0,9991
Data Parameter
0,9085 0,9991

Normalisasi Data Tabel 3.2. Hasil Pusat Cluster

cluster Pusat cluster


Clustering menggunakan metode Fuzzy C-Means
1 0,6738 0,7323
2 0,4638 0,9105
Olah hasil Fuzzy C-Means Menggunakan DBI
3 0,2509 0,0185

Selesai
Setelah memperoleh nilai anggota
cluster dan nilai pusat cluser maka dapat
dihitung SSW, SSB, dan Ratio.
3.8. Clustering data menggunakan
1. Sum of Square Within-cluster
metode Fuzzy C-Means
(SSW)
Menentukan nilai parameter awal
Rumus yang digunakan untuk
berdasarkan data dari tabel 3.1 ditentukan
mendapatkan nilai SSW adalah sebagai
beberapa komponen perhitungan sebagai
berikut:
berikut:
a.Banyaknya cluster yang diinginkanc 3 (12)
b.Pangkat (pembobot) w 2
c.Maksimun Iterasi T 100 2. Sum of Square Between-cluster
(SSB)
d.Error Terkecil ξ 10 -5
Persamaan yang digunakan untuk
e.Fungsi Objetif awal P0 0 memperoleh nilai SSB sebagai berikut:
f. Iterasi awal t 1 (13)

Untuk menentukan pusat cluster 3. Ratio


menggunakan persamaan : Persamaan yang digunakan untuk
memperoleh nilai Ratio sebagai berikut:
(9)
Fungsi objektif pada iterasi pertama P1 (14)
dihitung dengan menggunakan persamaan :

4|
4. DBI Gambar 4.1 Grafik Nilai DBI
Langkah terakhir adalah menghitung
nilai DBI, yaitu dengan mencari nilai ratio Berdasarkan pada Grafik nilai DBI
terbesar yang diperoleh hasil masing masing menunjukkan bahwa pada di titik 2,1541
ratio kemudian dibagi jumlah banyak nya adalah nilai DBI terkecil dari 10 titik nilai DBI,
cluster. Berikut persamaan DBI : dimana titik 2,1541 adalah 2 cluster. Maka 2
cluster adalah cluster yang paling optimal dari
pengelompokkan cluster yang lain. Dimana,
(15) evaluasi hasil DBI yang bernilai paling kecil
menunjukkan bahwa nilai DBI yang paling
Tabel 3.14 Nilai Rmax dan DBI baik karena semua anggota cluster relatif dekat
Data Cluster ke-i
R Rmax DBI satu dengan yang lain. Dan hasil profil 2
1 2 3 Cluster dengan cluster 1 sebanyak 549
1 0 1,5998 1,5284 1,5998 mahasiswa dan cluster 2 sebanyak 178 dosen.
Data 1,599
2 0 1,7741 1,7741
Cluster 8 1,7160
ke- 1,528
3 1,7741 0 1,7741
4

3.10 Analisa Hasil


Analisa hasil adalah tahapan terakhir
dari penelitian ini. Dengan di ujinya data yang
didapatkan kemudian data tersebut diolah
dengan algoritma fuzzy c-means dan DBI
(Davies Boildin Index). Gambar 4.2. grafik rata-rata kedekatan
Dalam analisa hasil ini berikut
lingkungan uji coba dan jadwal proyek
penelitian: 5. PENUTUP
1. Lingkungan Uji Coba Pascasarjana Berdasarkan penelitian yang dilakukan
UIN KHAS Jember oleh peneliti dalam pengelompokkan seleksi
2. Alat dan bahan yang digunakan kinerja akademis mahasiswa progam
pada penelitian ini adalah : pascasarjanaUIN KHAS Jember menggunakan
a. Laptop core i5 algoritma fuzzy c-means, menghasilkan cluster
b. Aplikasi text editor vs code optimum 2 cluster dengan nilai DBI 0,4922.
c. Xampp Diperoleh hasil perhitungan DBI dari hasil
d. Data parameter masing-masing DBI maka dapat disimpulkan
bahwa cluster 2 merupakan cluster paling baik
karena nilai DBI cluster 2 menunjukkan nilai
4. HASIL PENELITIAN DAN yang paling mendekati 0. Dan mengidentifikasi
PEMBAHASAN profil di masing-masing cluster. Pada gambar
423. adalah hasil identifikasi dari profil 2
cluster. Berdasarkan grafik identifikasi 2
cluster didapatkan bahwa cluster 1 memiliki
data mahasiswa dengan umur 21 sampai 30
dan nilai ips 1,00 sampai 4,00 dan pada cluster
2 memiliki data mahasiswa dengan umur 31
sampai 45 dan nilai ips 1,00 sampai 4,00.

6. REFERENSI
A. Buku
[1] Kusumadewi, S., dan Hari Purnomo. 2010.
Aplikasi Logika Fuzzy. Yogyakarta: Graha
Ilmu.

5|
B. Artikel Jurnal [14] Satriyanto, E. (2011). Clustering.
[2] Fenny, D. Analisis perbandingan cosine Surabaya: Institut Teknologi Surabaya.
normalization dan min-max normalization [15] Shofiani, N. (2017). Segmentasi Supplier
pada pengelompokan terjemahan ayat Al Menggunakan Metode K-Means Clustering
Quran menggunakan algoritma k-means (Studi Kasus: PTPN X PG Meritjan) (Doctoral
clustering (Bachelor's thesis, Fakultas Sains dissertation, Institut Teknologi Sepuluh
dan Teknologi Universitas Islam Negeri Syarif Nopember).
Hidayatullah Jakarta).
[3] Guney, Y. (2009). Exogenous and
endogenous factors influencing students'
performance in undergraduate accounting
modules. Accounting Education, 18(1), 51- 73
[4] Haryati, D. F., Abdillah, G., & Hadiana, A.
I. (2016, March). Klasifikasi Jenis Batubara
Menggunakan Jaringan Syaraf Tiruan Dengan
Algoritma Backpropagation. In Seminar
Nasional Teknologi Informasi dan Komunikasi
(SENTIKA) (pp. 18-19).
[5] Jaedun, A. (2011). Metodologi penelitian
eksperimen. Fakultas Teknik UNY, 12.
[6] Mardi, Y. (2017). Data Mining: Klasifikasi
Menggunakan Algoritma C4. 5. Edik
Informatika, 2(2), 213-219.
[7] Metisen, B. M., & Sari, H. L. (2015).
Analisis clustering menggunakan metode K-
Means dalam pengelompokkan penjualan
produk pada Swalayan Fadhila. Jurnal media
infotama, 11(2).
[8] Muhammad, A. F. (2018). Clusterisasi
Proses Seleksi Pemain Menggunakan
Algoritma K-Means (Study Kasus: Tim
Hockey Kabupaten Kendal). Jurnal Sistem
Komputer, 7(2).
[9] Nugroho, S. B. M. (2016). Pengaruh
Pendidikan Terhadap Pertumbuhan Ekonomi.
Media Ekonomi dan Manajemen, 29(2).
[10] Rianto, A. (2017). Implementasi Metode
K-Means Clustering Dalam Mengelompokkan
Emosi Senang, Marah, Dan Netral Berdasarkan
Vokal Manusia (Doctoral dissertation,
Universitas Multimedia Nusantara).
[11] Ridwan, M., Suyono, H., & Sarosa, M.
(2013). Penerapan Data Mining Untuk
Evaluasi Kinerja Akademik Mahasiswa
Menggunakan Algoritma Naive Bayes
Classifier. jurnal EECCIS, 7(1), 59-64.
[12] Rohmah, R. L. (2019). Zonasi daerah
terdampak bencana angin Puting Beliung
menggunakan K-Means Clustering dengan
analisis Silhouette Coefficient, Davies Bouldin
Index dan Purity (Doctoral dissertation, UIN
Sunan Ampel Surabaya).
[13] Santosa, P. (2015). Metode Penelitian
Sastra. Yogyakarta: azzagrafika.

6|

Anda mungkin juga menyukai