JURNAL

PENERAPAN METODE CLUSTERING DENGAN ALGORITMA K-MEANS UNTUK
PREDIKSI KELULUSAN MAHASISWA JURUSAN TEKNIK INFORMATIKA DI

UNIVERSITAS MUHAMMADIYAH JEMBER
1
Alfiyani Rindyyatul Jannah(1210651237),2Deni Arifianto,M.Kom
Jurusan Teknik Informatika Fakultas TeknikUnivertas Muhammadiyah Jember
Email : alfiyanirindi11@gmail.com
Abstrak
Kelulusan mahasiswa yang tepat waktu akan menguntungkan pihak mahasiswa dan
perguruan tinggi. Ada beberapa faktor yang mempangaruhi prediksi kelulusan mahasiswa
yang sesuai dengan waktu studi, diantaranya : rata-rata IPK terakhir, jumlah SKS, keaktifan
di organisasi, beasiswa, dan asal daerah.(Kondo, Ferry.2015)
Clustering merupakan suatu metode untuk pengelompokan dokumen dimana dokumen
dikelompokan dengan konten untuk mengurangi ruang pencarian yang diperlukan dalam
merespon suatu query (Natalius, 2010). Dalam penelitian ini menggunakan tiga kategori
kelulusan yaitu lulus cepat, tepat , dan lambat.
Hasil perhitungan dataset dengan metode K-Means didapatkan hasil Accuracy 60%,
hal ini menunjukkan bahwa sistem dapat mengklasifikasikan data secara benar, namun dalam
pengelompokkannya belum optimal, karena terdapat data yang terklasifikasi benar masuk ke
klasifikasi salah dan data terklasifikasi salah masuk ke klasifikasi benar.
Kata Kunci : Kelulusan, Clustering, K-Means
1. PENDAHULUAN menemukan pola kelulusan mahasiswa

1.1 Latar Belakang yang sudah lulus, kemudian dijadikan dasar
Perguruan tinggi merupakan lembaga untuk memprediksi kelulusan mahasiswa
pendidikan tertinggi yang semakin banyak pada tahun berikutnya.
peminatnya di Indonesia. Menurut Data mining adalah proses menemukan
Kementrian Pendidikan Dan Kebudayaan hubungan dalam data yang tidak diketahui
(2015), perkembangan data statistik oleh pengguna dan menyajikannya dengan
Perguruan Tinggi menunjukkan bahwa cara yang dapat dipahami sehingga
jumlah lembaga Perguruan Tinggi, hubungan tersebut dapat menjadi dasar
mahasiswa baru, mahasiswa lulusan, dan klasifikasi data. Untuk mengetahui tingkat
dosen menunjukkan perkembangan kelulusan mahasiswa dalam satu tahun
meningkat tiap tahunnya. ajaran dapat dilakukan suatu prediksi
Kelulusan mahasiswa yang tepat waktu berdasarkan data-data mahasiswa pada
akan menguntungkan pihak mahasiswa dan tingkat atau tahun ajaran pertama. Ada
perguruan tinggi. Untuk mahasiswa, beberapa faktor yang mempangaruhi
semakin cepat lulus maka kesempatan prediksi kelulusan mahasiswa yang sesuai
untuk mengikuti berbagai seleksi dalam dengan waktu studi, diantaranya : rata-rata
mencari pekerjaan semakin banyak. IPK terakhir, jumlah SKS.(Kondo,
Sedangkan bagi perguruan tinggi, kelulusan Ferry.2015) Dalam menentukan prediksi
mahasiswa dengan tepat waktu dapat kinerja mahasiswa dengan akurasi yang
memajukan kualitas, meningkatkan tinggi bermanfaat untuk mengidentifikasi
reputasi, dan juga berpengaruh pada siswa dengan prestasi akademik
akreditasi perguruan tinggi tersebut. (Suhartinah dan Emastuti, 2010).
(Premashanti, Gita. 2015) Pada penelitian Untuk menyelesaikan permasalahan
ini, digunakan teknik data mining untuk pada penjelasan diatas adalah dengan
1
pemanfatan algoritma K-Means Clustering. Informatika di Universitas
Algoritma K-Means adalah algoritma Muhammadiyah Jember, apakah bernilai
klastering yang paling sederhana dibanding lulus cepat, lulus tepat dan lulus
algoritma klastering yang lain. Algoritma terlambat.
ini mempunyai kelebihan mudah diterapkan 2. Mengetahui tingkat akurasi algoritma K-
dan dijalankan, relatif cepat, mudah untuk Means dalam memprediksi ketepatan
diadaptasi, dan paling banyak dipraktekkan kelulusan mahasiswa di Universitas
dalam tugas data mining. Muhammadiyah Jember.
Clustering merupakan suatu metode
untuk pengelompokan dokumen dimana
dokumen dikelompokan dengan konten 2. TINJAUAN PUSTAKA
untuk mengurangi ruang pencarian yang 2.1 Data Mining
diperlukan dalam merespon suatu query Data mining adalah suatu istilah
(Natalius, 2010). yang digunakan untuk menguraikan
Algoritma K-Means merupakan penemuan pengetahuan di dalam
algoritma yang membutuhkan parameter database. Data mining adalah proses
input sebanyak k dan membagi sekumpulan yang menggunakan teknik statistik,
n objek kedalam cluster sehingga tingkat matematika, kecerdasan buatan, dan
kemiripan antar anggota dalam satu cluster machine learning untuk mengekstraksi dan
tinggi sedangkan tingkat kemiripan dengan mengidentifikasi informasi yang
anggota pada cluster lain sangat rendah. bermanfaat dan pengetahuan yang terkait
Kemiripan anggota terhadap cluster diukur dari berbagai database besar (Turban et al,
dengan kedekatan objek terhadap nilai 2005).
mean pada cluster atau disebut sebagai Data mining merupakan bidang dari
centroid cluster (Rismawan dan beberapa bidang keilmuan yang
Kusumadewi, 2008). Data nilai mahasiswa menyatukan teknik dari pembelajaran
hanya akan menjadi sekumpulan data yang mesin, pengenalan pola, statistik, database,
tidak berguna jika tidak dilakukan dan visualisasi untuk penanganan
penggalian data terhadapnya. Banyak permasalahan pengambilan informasi dari
informasi terpendam yang dapat diambil database yang besar (Larose, 2005). Tan
dari sekumpulan data tersebut sehingga et al, (2006) mendefinisikan data mining
dapat memberikan suatu pengetahuan untuk sebagai proses untuk medapatkan informasi
penentuan kebijakan. Penggalian data dapat yang berguna dari gudang basis data yang
dilakukan dengan cara pengelompokan data besar. Data mining juga dapat diartikan
nilai mahasiswa menjadi beberapa sebagai pengekstrakan informasi baru
kelompok, kelompok nilai baik dan nilai yang diambil dari bongkahan data besar
buruk. yang membantu dalam pengambilan
Karena itu, pada penelitian ini akan keputusan. Istilah data mining kadang
dikembangkan suatu sistem yang dapat disebut juga knowledge discovery.
mengklastering kelulusan mahasiswa
menggunakan algoritma K-Means dengan 2.2 Clustering
melihat pola kelulusan mahasiswa beberapa Clustering adalah suatu metode
periode sebelumnya. pengelompokan berdasarkan ukuran
kedekatan. Perbedaan Clustering dengan
1.2 Tujuan grup, kalau grup berarti kelompok yang
Adapaun manfaat dalam penelitian sama kondisinya kalau tidak ya pasti bukan
yaitu : kelompoknya. Tetapi kalau cluster tidak
1. Mampu memprediksi sistem mengenai harus sama akan tetapi pengelompokannya
kelulusan mahasiswa Jurusan Teknik berdasarkan kedekatan dari suatu
2
karaktteristik sample yang ada,salah 3. Tidak pernah mengetahui real
satunya dengan menggunakan rumuh jarak cluster dengan menggunakan data
euclidean. Aplikasi cluster ini sangat yang sama, namun jika dimasukkan
banyak,karena hampir banyak dalam dengan cara yang berbeda mungkin
mengidentifikasi permasalahan atau dapat memproduksi cluster yang
pengambilan keputusan selalu tidak sama berbeda jika jumlah datanya sedikit.
persis akan tetapi cenderung memiliki 4. Tidak tahu kontribusi dari atribut
kemiripan saja. dalam proses pengelompokan
karena dianggap bahwa setiap
2.3 K-Means atribut memiliki bobot yang sama.
K-Means merupakan algoritma untuk Langkah-langkah dalam Algoritma
cluster objek berdasarkan atribut menjadi k K-Means Clustering :
partisi, dimana k < n. Secara Umum K- 1. Menentukan jumlah cluster .
Means Clustering merupakan salah satu 2. Menentukan nilai centroid. Dalam
metode data Clustering non-hirarki yang menentukan nilai centroid untuk
mengelompokan data dalam bentuk satu awal iterasi, nilai awal centroid
atau lebih cluster atau kelompok. dilakukan secara acak. Sedangkan
Metode ini mempartisi data ke dalam jika menentukan nilai centroid yang
cluster sehingga data yang memiliki merupakan tahap dari iterasi, maka
karakteristik yang sama dikelompokkan ke digunakan rumus sebagai berikut :
dalam satu cluster yang sama dan data yang a. Menghitung jarak antara titik
mempunyai karateristik yang berbeda di centroid dengan titik tiap objek
kelompokan ke dalam cluster yang lain. b. Pengelompokan objek untuk
Istilah-istilah dalam K-Means : menentukan anggota cluster adalah
1. N data : data set yang akan diolah dengan memperhitungkan jarak
sebanyak N data dimana N data minimum objek.
tersebut terdiri dari atribut- c. Kembali ke tahap 2, lakukan
atributnya perulangan hingga nilai centroid
2. K centroid : Inisialisasi dari pusat yang dihasilkan tetap dan anggota
cluster data adalah sebanyak K cluster tidak berpindah ke cluster
dimana pusat-pusat awal tersebut lain.
digunakan sebagai banyaknya kelas
yang akan tercipta. Centroid 3. METODOLOGI PENELITIAN
didapatkan secara random dari N 3.1 Studi Kasus
data set yang ada. Berikut ini merupakan simulasi dari
3. Euclidian Distance: merupakan proses perhitungan K-Means terhadap data.
jarak yang didapat dari perhitungan Dalam perhitungan yang dilakukan,
antara semua N data dengan K menggunakan data testing dan training,
centroid dimana akan memperoleh penggunaan data testing dan trainning
tingkat kedekatan dengan kelas bertujuan agar model yang diperoleh
yang terdekat dengan populasi data nantinya memiliki kemampuan generalisasi
tersebut. yang baik dalam melakukan klasifikasi
Kelemahan K-Means : data. Data trainning sebagai data sampel
1. Bila jumlah data tidak terlalu sedangkan data testing dipergunakan
banyak, mudah untuk menentukan sebagai pembanding dalam menghitung
cluster awal. data traning.
2. Jumlah cluster, sebanyak K, harus Diketahui dari 10 (sepuluh) data
ditentukan sebelum dilakukan berikut terdapat 7(tujuh) data testing dan 3
perhitungan. (tiga) data trainning yang terdiri dari Lulus
3
Cepat (L.Cepat), Lulus Tepat (L.Tepat),
dan Lulus Terlambat (L.Terlambat). Berikut
ini adalah kesepuluh data tersebut :
Tabel 3.1 Data

Observasi
NAMA
IPK SKS Keterangan Ketegori Data
Person 1 3.4 144 L.CEPAT Data Testing
Person 2 3.23 139 L.CEPAT Data Training
Person 3 3.1 130 L.TEPAT Data Training
Person 5 3.45 132 L.TEPAT Data Testing
Person 6 2.71 120 L.LAMBAT Data Training
Person 7 2.9 128 L.LAMBAT Data Training
Person 8 3 110 L.LAMBAT Data Testing
1. Langkah pertama : Pilih Centroid

secara acak
Dari data yang ada sebelumnya,
akan dipilih 2 ceteroid acak.
Tabel 3.2 Centroid
Person Centroid
IPK SKS
1 3.4 144
5 3.45 132
8 3 110
2. Langkah kedua :
Lakukan perhitungan jarak dengan
euclidean distance dari masing-
Dari ketiga cluster tersebut
masing item dari Centroid (pusat)
kemudian dibandingkan untuk memperoleh
cluster dan tandai kembali setiap
ceteroid baru,
item berdasarkan kedekatan group.
Tabel 3.4 Perhitungan Tahap 2
Jika item bergerak dari initial
configuration, Centroid
(pusat/means) cluster harus diupdate
sebelum diproses. Kita hitung
kwadrat jarak (squared distance)
sbb:
Dari perbandingan diatas didapat

Keterangan : pusat cluster baru yaitu :
a. Rumus Euclidian distance : d = | Tabel 3.5 Pusat Cluster Baru
x–y|= Centroid 1 3.44 142.25
b. x = pusat cluster Centroid 2 3.14 130.25
c. y = data Centroid 3 2.86 115.00
Maka koordinat dari pusat cluster
Tabel 3.3 Perhitungan Tahap 1
ter-update sebagai berikut :
Tabel 3.6 Hasil cluster
4
Sehingga dapat dikelompokkan
sebagai berikut berdasarkan data training
yang telah ada adalah sebagai berikut :
Tabel 3.9 Hasil Klasifikasi

Berdasarkan Data Training
Dari tael 3.9 diatas, dapat

dikelompokkan sebagai berikut, sesuai
dengan data training yang ada. Dimana
nilai 1 adalah hasil dari klasifikasi yang
telah dihasilkan, sehingga didapat data
training yang termasuk pada lulus cepat
terdapat 4 data (1 diantaranya adalah data
testing), lulus tepat terdapat 4 data (1
diantaranya adalah data testing), dan lulus
terlambat terdapat 2 data (1 diantaranya
Dari ketiga cluster tersebut kemudian
adalah data testing). Berikut ini adalah hasil
dibandingkan untuk memperoleh ceteroid
klasifikasi tersebut :
baru,
Tabel 3.10 Hasil Perhitungan Data
Tabel 3.7 Hasil Cluster
Testing
Tabel 3.11 Hasil Perhitungan Data

Training
Karena ceteroid pada iterasi 2

memiliki nilai yang sama dengan threshold,
maka proses tidak dilanjut (proses
berhenti). Pada penelitian ini, threshold
(batasan/tolak ukur) yang digunakan adalah
sebagai berikut : 3.1 Akurasi
Tabel 3.8 Centeroid Akurasi menunjukkan kedekatan nilai
IPK SKS hasil pengukuran dengan nilai sebenarnya.
Cetroid 1 3.44 142.25 Threshold Untuk menentukan tingkat akurasi perlu
Cetroid 2 3.14 130.25 Ceteroid diketahui nilai sebenarnya dari besaran
Cetroid 3 2.86 115.00 yang diukur dan kemudian dapat diketahui
seberapa besar tingkat akurasinya. Tingkat
akurasi berikut ini, diukur berdasarkan
5
pengelompokkan data testing yang ada telah dihasilkan tidak menuntut
dengan data yang sudah ada(data sebelum kemungkinan bahwa mahasiswa dengan
dilakukan perhitungan), sehingga didapat kategori lulus terlambat dapat menjadi
berikut : mahasiswa lulus cepat, dan lulus tepat dapat
menjadi mahasiswa lulus cepat. Sehingga
keputusan akhir dari system ini hanyalah
untuk membantu dalam pemilihan laternatif
keputusan, sehingga dapat memberikan
Tabel 3.12 Perbandingan Hasil Data keputusan secara tepat. Dan keputusan
akhir tetaplah berdasarkan pertimbangan
pihak akademik jurusan Teknik Informatika
Universitas Muhammadiyah Jember.
4.1 Data Pengujian

Data yang diolah pada tugas akhir ini
adalah berupa data mahasiswa Jurusan
Teknik Informatika angkatan 2011 dengan
jumlah data 266 data.
Tabel 3.12 Perhitungan Nilai Accuracy
TP (True Positif) FP (False Tabel 4.1 Data Mahasiswa
Positif)
5 2
FN (False Negatif) TN (True
Negatif)
0 0
=
= 0,71428 * 100 %
= 71.428 %.
Dari perhitungan akurasi di dapatkan
nilai TP yaitu data benar yang
terklasifikasikan menjadi data benar sebesar
5, nilai FP yaitu data benar terklasifikasi
salah sebesar 2, nilai FN data salah tidak di
klasifikasikan salah sebesar 0 dan nilai TN
adalah data yang tidak di klasifikasikan
benar sebesar 0, sehingga menghasilkan
nilai Accuracy sebesar 71.428 %.
3.2 Analisa
Berdasarkan hasil pembahasan
tentang penerapan algoritma K-Means dapat
mengelompokkan mahasiswa yang 4.2 Proses K-Means pada Aplikasi
mendapat nilai rata-rata yang bagus dan Aplikasi dibuat berdasarkan kasus
yang kurang bagus. Namun, dari nilai yang yang ada, sehingga untuk setiap data yang
6
diinputkan akan dilakukan proses kriteria. Kriteria tersebut terdiri dari
perhitungan untuk mengetahui klasifikasi IPK, SKS, Beasiswa, dan
kelulusan. Berikut ini dalah penerapan K- Organisasi. Kriteria yang digunakan
Means pada aplikasi : penulis adalah IPK dan SKS. Pada
1. Inputan Data Mahasiswa menu kriteria, penulis menyediakan
Inputan data mahasiswa berisikan sebuah mekanisme on dan off
tentang data mahasiswa seperti nim, dimana keempat kriteria dapat
nama, dan prediksi kelulusan yang diaktifkan ataupun dapat di non
ditunjukkan pada gambar 4.7 aktifkan. Berikut adalah tampilan
sebagai berikut : dari kriteria :
Gambar 4.9 Tampilan Kriteria
Gambar 4.7 Inputan Mahasiswa

2. Inputan Nilai
Inputan nilai merupakan sebuah Gambar 4.10 Tampilan On/Off
menu yang disediakan untuk Kriteria
mengisi nilai kriteria masing-masing 4. Menentukan Pusat Cluster
mahasiswa, yaitu jumlah sks Penentuan pusat cluster dilakukan
mahasiswa yang telah ditempuh setelah data telah terinput secara
selama 6 semester dan ipk terakhir keseluruhan. Data akan dipilih
pada semester ke-6, berikut ini secara acak sesuai dengan
adalah inputan nilai mahasiswa kategorinya yang ditunjukkan pada
berdasarkan kriteria : gambar 4.11 sebagai berikut :
Gambar 4.11 Pusat Cluster

5. Jarak Cluster
Jarak cluster merupakan sebuah
jarak terdekat iterasi dengan cluster,
berikut ini implimentasi pada
aplikasi yang ditunjukkan pada
Gambar 4.8 Inputan Nilai gambar 4.12 sebagai berikut :
Mahasiswa
3. Kriteria
Beriskan tentang kriteria yang
digunakan, penulis memiliki 4
kriteria utama dengan penggunaan
kriteria pada pengujian adalah 2
7
Gambar 4.12 Jarak Pusat Cluster
6. Hasil Klasifikasi
Berikut ini adalah hasil klasifikasi
dari implementasi metode K-Means :
Gambar 4.13 Hasil Klasifikasi
4.3 Hasil Akurasi Sistem

Hasil dari analisa menggunakan hasil
keputusan dari 266 dataset yang
terklasifikasikan ke dalam masing-masing Tabel 4.5 Tabel Hasil Klasifikasi
cluster kemudian dilakukan kinerja rata-rata Keanggotaan C1 (Klasifikasi Lulus Cepat)
Accuracy sebagai tingkat kedekatan antara
nilai prediksi dengan nilai actual.
1. Akurasi Keanggotaan C1
Klasifikasi yang dihasilkan oleh
sistem dengan menerapkan metode
K-Means pada keanggotaan C1
sejumlah 108 mahasiswa,
sedangkan klasifikasi yang
dihasilkan oleh perhitungan K-
Means sejumlah 33 mahasiswa.
Sehingga diperoleh hasil akurasi
sebagai berikut :
Tabel 4.5 Tabel Hasil Klasifikasi
Keanggotaan C1 (Klasifikasi Lulus Cepat)
Tabel 4.6 Perhitungan Nilai Accuracy

TP (True Positif) FP (False Positif)
8
156 110 5.2 Saran
FN (False Negatif) TN (True Dengan segala kelebihan yang terdapat
Negatif) pada proyek akhir ini, tidak terlepas dari
0 0 kekurangan yang tentunya sangat
diharapkan adanya saran-saran yang
mendukung proses penyempurnaannya.
Penulis ingin memberikan beberapa saran
yang mungkin dapat membantu dalam
pengembangan Tugas Akhir ini adalah
= 59 % sebagai berikut :
Hasil dari perhitungan Accuracy 1. Untuk pengembangan selanjutnya,
didapat nilai akurasi sebesar 59%. Hal ini penulis menyarankan penggunaan
menunjukkan bahwa sistem dapat metode lain seperti Fuzzy, Topsis,
mengklasifikan data dengan benar namun K-means, ataupun
masih terdapat beberapa data yang membandingkannya metode lainnya.
terklasifikasikan pada kategori lain. 2. Menambah variable baru yang
ditambah dalam. Semakin banyak
5. Kesimpulan variable yang digunakan, maka akan
menghasilkan hasil keputusan yang
Dari uji coba dan analisa yang telah lebih valid.
dijelaskan dalam bab sebelumnya, maka
dapat diambil beberapa kesimpulan sebagai
berikut : DAFTAR PUSTAKA
1. Hasil prediksi kelulusan dengan
menerapkan metode K-Means dapat A. A. Mahdi, A. M. Razali and A. A. Salih,
berjalan sesuai dengan harapan. “The Diagnosis of Chicken Pox and
Dengan sampling data pada Measles Using Fuzzy Relations,”
pembahasan didapat 108 mahasiswa Journal of Basic and Applied
dengan kelulusan cepat, 107 Scientific Research, pp. 679-686,
mahasiswa dengan kelulusan tepat, 2011.
dan 50 mahasiswa dengan kelulusan Abidin, Taufik Fuadi.2009. “Naive
lambat. Bayesian Classifier”, Jurusan
2. Hasil perhitungan dataset dengan Informatika Unsyiah.bahan kuliah
Data Mining program study
metode K-Means didapatkan hasil Informatika FMIPA-Unsyiah
Accuracy 59%, hal ini dikarenakan Angga, Asfan Candra. 2014. Diagnosa
Penyakit Sinusitis Menggunakan
tidak memfilter data ,dimana data Metode Algoritma Genetika Dan
set yang digunkan data yang belum Bayesian Berbasis Jsp. Surabaaya :
ITS Surabaya
diolah dengan data yang diolah oleh Basuki,Ahmad. 2006, “Metode Bayes”,
sistem (telah melalui proses PENSITS, Surabaya.
Gershon AA. Meas'es. Dalam : Mandell ed.
perhitungan K-Means terhitung Principles and practice of infectious
kembali) sehingga menghasilkan diseases; 5th ed. London : Churchill
Livingstone, 2000; 132-4.
pengelompokkan (klasifikasi) yang Handayani, L dan Sutikno, T. 2008. Sistem
kurang benar dan berakibat Pakar untuk Diagnosis Penyakit THT
Berbasis Web dengan “e2gLite
memiliki nilai accuracy rendah. Expert System Shell”. Jurnal
9
Teknologi Industri, Volume 12, Semarang : Universitas Dian
Nomor 1. Nuswantoro .
Hariyanto, B, 2004, Sistem Manajemen Rahayu,Sri.2013.Sistem Pakar Untuk
Basis Data, Bandung : Penerbit Mendiagnosa Penyakit Gagal Ginjal
Informatika. Dengan Menggunakan Metode Bayes.
Haryanto.2012. Penerapan Naïve Bayes Semarang: Universitas Dian
Classifier Pada Sistem Pakar Untuk Nuswantoro.
Klasifikasi Bakteri Escherichis Coli. Setiawan, I Made. Penyakit Campak.
Medan : Universitas Sumatera Utara. Jakarta : PT Sagung Seto; 2008.
J.Klein,“Rubella (German Measles),” 2012 Whitten. 2004. Decision Support Systems
http://kidshealth.org/parent/infections and Intelligent Systems. 6th edition.
/skin/germanmeasles. Diakses 23 Prentice Hall: Upper Saddle River,
Maret 2016. NJ.
Kondo, Ferry.2015. Klasifikasi Variabel WHO, “Rubella Vaccines: WHO Position
Penentu Kelulusan Mahasiswa Paper,” Weekly Epidemiological
FMIPA Unpati Menggunakan Metode Record, pp. 349-360, 15 July 2008.
CHAID. Ambon : Universitas WHO. World health Statistics 2011
Pattimura Ambon. (http://www.who.int/csr/don/2011_04
Krugman S, Katz SL, Gershon AA, Wilfert _21/en/) Diakses 23 Maret 2016.
CIV!, eds. Measles (Rubeola). Yakub,Suardin.2008. Sistem Pakar Deteksi
Infectious Disease of Children. St Penyakit Diabetes Mellitus dengan
Louis: The Mosby Co, 1992; 223-45 . Menggunakan Pendekatan Naïve
Krugman S, Katz SL, Gershon AA, Wilfert Bayesian berbasis Web. Medan :
CIVI, eds. Measles (Rubeola). Universitas Sumatera Utara.
Infectious Disease of Children. St
Louis: The Mosby Co, 1992; 223-45.
Kusrini & Emha Taufiq Luthfi.2009.
Algoritma Data Mining, Penerbit
Andi Yogyakarta.
Maryuni,Bekti.2015. Aplikasi Android
Untuk Mendeteksi Penyakit Saluran
Kemih Menggunakan Algoritma
Naive Bayes. Jember : Politeknik
Negeri Jember.
Perdana, Yudi.2009. Klasifikasi berita
berbahasa Indonesia menggunakan
naïve bayes classifier. Jurnal
Nasional FPMIPA UPI.
Prasetyo, Eko.2014. Perbandingan K-
Support Vector Nearest Neighbor
Terhadap Decision Tree Dan Naive
Bayes. Surabaya : Universitas
Bayangkhara Surabaya.
Premashanti, Gita.2015. Penerapan Metode
Klastering Dengan Algoritma K-
Means Untuk Prediksi Kelulusan
Mahasiswa Pada Program Studi
Teknik Informatika Strata Satu.
10

JURNAL

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

JURNAL

Diunggah oleh

Hak Cipta:

Format Tersedia

PENERAPAN METODE CLUSTERING DENGAN ALGORITMA K-MEANS UNTUK

PREDIKSI KELULUSAN MAHASISWA JURUSAN TEKNIK INFORMATIKA DI

1. PENDAHULUAN menemukan pola kelulusan mahasiswa

Tabel 3.1 Data

1. Langkah pertama : Pilih Centroid

Dari perbandingan diatas didapat

Tabel 3.9 Hasil Klasifikasi

Dari tael 3.9 diatas, dapat

Tabel 3.11 Hasil Perhitungan Data

Karena ceteroid pada iterasi 2

4.1 Data Pengujian

Gambar 4.9 Tampilan Kriteria

Gambar 4.7 Inputan Mahasiswa

Gambar 4.11 Pusat Cluster

Gambar 4.13 Hasil Klasifikasi

4.3 Hasil Akurasi Sistem

Tabel 4.6 Perhitungan Nilai Accuracy

Anda mungkin juga menyukai