Uts dataMIning

TUGAS RESUME ARTIKEL/JURNAL TENTANG ALGORITMA K-MEANS
MATA KULIAH DATA MINING
Oleh :
ABDUR ROUF
18.230.0102
 Artikel 1 : Pemetaan Siswa Berprestasi Menggunakan Metode K-Means
Clustering.
1) Pendahuluan
Tingginya tingkat keberhasilan siswa dan rendahnya tingkat kegagalan

siswa merupakan cermin kualitas dunia pendidikan. Dunia pendidikan saat ini
dituntut untuk memiliki kemampuan bersaing dengan memanfaatkan semua
sumber daya yang dimiliki. Selain sumber daya sarana, prasarana dan manusia.
Sistem informasi dapat digunakan untuk meningkatkan kemampuan bersaing.
Sistem informasi dapat digunakan untuk menunjang kegiatan opersional sehari-hari
sekaligus menunjang kegiatan pengambilan keputusan strategis.
Secara umum penilaian prestasi siswa yaitu mata pelajaran baik teori dan
dan ketidakhadiran siswa dan pada saat mengikuti ekstrakulikuler, yang
dikategorikan dalam nilai pengetahuan, nilai keterampilan dan penilaan sikap.
Evaluasi dan penilaian terhadap prestasi siswa dilakukan dengan memberi nilai oleh
pengajar kepada semua siswa yang mengikuti pelajaran yang diajarkan dan
ekstrakurikuler yang diikutinya.
Seiring dengan terus bertambahnya jumlah data siswa setiap tahun, maka
jumlah data yang siswa yang terus meningkat sehingga penumpukan data yang
belum diolah dengan optimal untuk menggali imformasi dan pengetahuan baru
melalui pola-pola yang terbentuk dari penumpukan data tersebut. Jumlah data yang
terus meningkat ini merupakan bebrapa teknik ataupun metode untuk mengolah
nya menjadi sebuah informasi dan pengetahuan yang dapat digunakan sebagai
bahan pertimbangan pendidik dalam proses pengambilan kebijakan dan keputusan
juga sebagai peringatan dini (early warning) bagi siswa tertentu yang berdasarkan
hasil pengelompokan prestasi rendah yang berpotensi terhadap ketidaklulusan
siswa.
K-Means merupakan suatu algoritma pengklasteran yang cukup sederhana
yang mempartisi database kedalam beberapa clasteran k.Algoritma cukup mudah
untuk diimplementasikan dan dijalankan, relative , mudah disesuaikan dan banyak
digunakan (Wu & Kumar, 2009). Prinsip utama dari teknik ini adalah menyusun K
buah partisi/pusat massa (centroid)/rata-rata (mean) dari sekupulan data.
Algoritma K-Means dimulai dengan pembentukan partisi klaster diawal kemudian
secara iteraktif partisi claster ini diperbaiki hingga tidak terjadi perubahan yang
signifikan pada partisi claster (Written, 2011).
2) Pembahasan
Data yang diolah dalam penelitian ini merupakan sampel yang diambil dari data
rapot peserta didik SMK Yapim Simpang Kawat kelas X AK2 tahun ajaran
2016/2017. Dataset siswa terdiri dari atribut data induk dan data rapot. Atribut
yang dijadikan variable dalam algoritma ini di sederhanakan menjadi atribut yang
terdiri dari NIS, Nama, Ekstrakulikuler, Nilai Tugas, Uts , Uas dan Jumlah
ketidakhadiran. Data sampel yang akan diuji cobakan terdiri dari 10
peserta didik. Selanjutnya dicoba mengelompokkan data diatas menjadi 3 kelompok.
Dengan menggunakan algoritma Kmeans, berikut langkah-langkah penyelesaiannya:
1. Menentukan Jumlah cluster, jumlah cluster merupakan jumlah kelompok yang
akan dihasilakan. Dalam penelitian ini jumlah cluster yang akan digunakan adalah
sebanyak 3 cluster.
2. Menentukan centroid awal, centroid awal diperoleh secara acak. Centroid awal
merupakan titik pusat cluster pertama. Centroid awal dari penelitian ini adalah :
C1 = (4, 83.00, 80.08, 87.67, 2, 75)
C5 = (1, 86.67, 84.33, 93.67, 2, 65)
C10= (3, 83.67, 90.07, 70.97, 1, 78)
3. Menghitung jarak setiap data yang ada terhadap setiap pusat cluster.
Berikut perhitungannya dengan menggunakan persamaan Euclidean Distance
Space:
a. Jarak antara data siswa pertama dengan pusat cluster pertama.
b. Jarak antara data siswa pertama dengan pusat cluster ke dua
c. Jarak antara data siswa pertama dengan pusat cluster ke tiga
Adapun hasil dari perhitungan dari keseluruhan data terhadap tiap pusat cluster
awal disajikan sebagai berikut :
4. Pengelompokan data cluster, setelah perhitungan jarak data pada centroid,

langkah selanjutnya adalah pengelompokkan data. Berikut adalah hasil
pengelompokannya. Perhitungan dapat dilakukan secara manual dengan
menggunakan microsoft excel maksud dari angka 2 adalah menunjukan daerah
yang paling sedikit mendapatkan prestasi, angka 1 menunjukan daerah yang
sedang, dan angka 0 menunjukan daerah yang paling sering mendapatkan
prestasi.
5. Setelah semua data ditempatkan kedalam cluster yang terdekat, kemudian hitung
kembali pusat cluster yang baru berdasarkan ratarata anggota ada pada cluster
tersebut.
Setelah didapat titik pusat baru dari tiap cluster, hitung kembali data dengan
pusat cluster yang baru ulangi sampai didapat pola terakhir yang sudah tidak
berpindah, dalam penelitian ini. Data dihitung ulang sampai iterasi ke 3 , dimana
satiap cluster tidak berubah lagi dan tidak ada lagi data yang berpindah dari
satu cluster ke cluster lainnya.
6. Menghitung jarak data ke centroid yang baru untuk iterasi berikutnya. Dengan
menggunakan nilai centroid yang baru, jarak ke masing-masing centroid dihitung
sampai group baru sama dengan group lama atau group sebelumnya.
7. Menghitung jarak data ke centroid yang baru untuk iterasi berikutnya. Dengan
menggunakan nilai centroid yang baru, jarak ke masing-masing centroid dihitung
sampai group baru sama dengan group lama atau group sebelumnya.
Berikut hasil dan pola terakhir jarak antara centroid dan pusat cluster :
Data yang dikelompokan pada cluster 1 berjumlah 6 orang, di cluster 2 berjumlah 2

orang, dan di cluster 3 berjumlah 2 orang.Jika hasil antara iterasi sudah sama
dengan iterasi sebelumnya, maka dapat dikatakan hasil penelitian telah selesai.
3) Kesimpulan
1. Dengan menggunakan Metode Algoritma K-Means Clustering, dapat menentukan

pengelompokan prestasi siswa tinggi, menengah dan cukup.
2. Dengan menginput data yang digunakan dalam penelitian ini yaitu berapa
kegiatan ekstrakulikuler yang diikuti, Nilai dari Tugas, UTS, UAS, Absensi dan
Nilai sikap. Output ditampilkan dari data yang digunakan yaitu berupa
pengelompokkan data berdasarkan algoritma K-Means.
4) Saran
Untuk pengembangan penelitian selanjutnya dapat dikembangkan menggunakan

perbandingan alogoritma / metode lainnya.
 Artikel 2 : Implementasi Metode K-Means Dalam Pemetaan Kelompok Mahasiswa
Melalui Data Aktivitas Kuliah.
1) Pendahuluan
Suatu perguruan tinggi yang berkualitas apabila telah memenuhi standar

nasional pendidikan tinggi (akreditasi) yaitu dapat dilihat dari rata-rata lama studi
mahasiswanya dan tingkat kelulusan. Berdasarkan peraturan di dalam buku II
standard dan prosedur tentang akreditasi institusi perguruan tinggi oleh BAN-PT
(Badan Akreditasi Nasional Perguruan Tinggi), menyatakan bahwa salah satu aspek
atau standar penilaian akreditasi adalah mahasiswa dan lulusan. Standar penilaian
yaitu penerimaan mahasiswa baru dan kelulusan (masa studi, IPK). Maka, jumlah
mahasiswa dan kelulusan sangat penting dalam proses akreditasi untuk
meningkatkan kualitas suatu perguruan tinggi.
Pada penelitian ini dibangun sebuah sistem untuk mengelompokan
mahasiswa berdasarkan aktivitas kuliah menggunakan metode K-Means. Manfaat
penelitian ini adalah memprediksi waktu masa studi mahasiswa dengan
mengelompokannya agar dapat melakukan tindakan pencegahan terhadap
mahasiswa yang memiliki kecenderungan menyelesaikan studi tidak tepat waktu
dan diharapkan memudahkan program studi dalam mengawasi dan mengevaluasi
perkembangan studi mahasiswa.
2) Pembahasan
Tahap pertama yang akan dilakukan pada penelitian ini yaitu menentukan domain
bagi masing-masing kriteria, yang bertujuan untuk mengelompokkan data nilai dari
masing-masing mahasiswa.
Penentuan awal cluster secara acak :
1. Data ke- 1 sebagai pusat Cluster Ke-A
Qolbiah Fitri [5,5,5,1,2,2] (Tepat Waktu)
2. Data ke- 10 sebagai pusat Cluster Ke-B
Abdul Malik [3,3,5,2,1,1] (Tidak Tepat Waktu)
Setelah dilakukan pengelompokan berdasarkan masing-masing cluster kemudian
hitung jarak masing-masing.
Misalnya menghitung jarak (distance) A, B untuk data pertama menggunakan
Eulidean Distance :
Selanjutnya pada tiap cluster yang menjadi centroid awal pada iterasi 1
menggunakan persamaan 01, dapat dilihat pada Tabel 10.
Setelah proses perhitungan dan pembagian kelompok cluster dilakukan, maka pusat
cluster baru dapat dibentuk dengan cara menghitung rata-rata kriteria dari masing-
masing kelompok cluster yang sama. Misalnya menghitung pusat cluster baru
(cendroid) menggunakan rumus sebagai berikut :
Rata-rata dari kelompok data cluster 1 masuk sebagai nilai A, begitu pula dengan
data cluster 2 masuk sebagai nilai B. Maka diperoleh pusat cluster baru/centroid
baru seperti pada Tabel 12.
Setelah pusat cluster baru terbentuk, maka perhitungan dilanjutkan untuk

menghitung jarak data ke pusat cluster yang baru sekaligus penentuan kelompok
cluster. Apabila masih ada perubuhan kelompok cluster maka perhitungan terus
dilanjutkan. Pada penulisan ini, perhitungan berhenti pada iterasi ke-3 karena
sudah tidak mengalami perubahan kelompok cluster. Data akhir yang didapatkan
dapat dilihat pada Tabel 13.
3) Kesimpulan
1. Cluster A adalah mahasiswa yang lulus tepat waktu sedangkan cluster B adalah
mahasiswa yang lulusnya tidak tepat waktu.
2. Data pengelompokan mahasiswa ini merupakan masukan bagi dosen wali dalam
membimbing dan mengawasi proses belajar mahasiswa agar bisa lulus tepat
waktu.
4) Saran
1. Pada penelitian ini dapat dikembangkan menjadi sebuah aplikasi menggunakan

bahasa pemrograman.
2. Untuk pengembangan penelitian selanjutnya dapat dikembangkan menggunakan
perbandingan alogritma / metode lainnya.
 Artikel 3 : Pemanfaatan Metode K-Means dalam Penentuan Persediaan Barang
1) Pendahuluan
Berbagai usaha kuliner yang ada saat ini selalu memerlukan persediaan
dalam mengantisipasi permintaan [Nurhasanah et al., 2012]. Tanpa adanya
persediaan, para pengusaha akan dihadapkan pada resiko yaitu perusahaan tidak
dapat memenuhi permintaan para pelanggannya [Fazzry and Nugroho, 2016].
Untuk menangani masalah tersebut maka dibutuhkan suatu manajemen
persediaan barang yang baik untuk pengolahan data historis transaksi besar yaitu
menggunakan teknik data mining [Defit et al., 2015]. Data mining merupakan proses
knowledge discovery in database, meliputi dugaan algoritma yang mengeksplorasi
data, membangun model, dan menemukan pola yang belum diketahui [Widodo et al.,
2013]. Metode K-mean merupakan salah satu metode dalam fungsi pengelompokan
(clustering), sehingga data yang memiliki karakteristik yang sama dikelompokkan
dalam cluster yang sama [Rahman, 2017].
Tujuan diadakannya penelitan ini adalah menghasilkan sebuah sistem
pendukung keputusan dalam menentukan persediaan stok barang bagi perusahaan.
Melalui sistem pendukung keputusan ini diharapkan dapat membantu perusahaan
menghindari kekurangan maupun kelebihan persediaan barang [Zefriyenni and
Santoso, 2015], sehingga perusahaan dapat melakukan efisiensi secara cermat
dalam hal pengadaaan barang.
2) Pembahasan
Data–data yang digunakan pada penelitian ini adalah data transaksi penjualan
produk pasta pada Gia Restaurant Jakarta, dari bulan Januari 2017 sampai
Desember 2017. Penelitian ini memfokuskan hanya pada produk pasta saja. Untuk
memudahkan pemprosesan data maka nama produk diubah menjadi kode produk
dan menambakan atribut rata-rata perbulan yang di ambil dari data jumlah
transaksi selama satu tahun dibagi 12 bulan. Inisialisasi data transaksi penjualan
bisa dilihat pada tabel 1.
Agar tabel 1 dapat di kelompokan menjadi beberapa cluster, perlu dilakukan
beberapa langkah sebagai berikut:
Langkah pertama, yaitu menentukan jumlah cluster (k). Dalam penelitian ini data
yang ada akan dikelompokan menjadi dua cluster, yaitu cluster pertama untuk
jumlah sedikit, dan cluster kedua untuk jumlah banyak.
Langkah kedua, menentukan titik pusat awal (centroid) dari setiap cluster. Dalam
penelitian ini centroid awal ditentukan secara acak dan didapat centroid dari setiap
cluster seperti pada tabel 2:
Langkah ketiga, mengalokasikan setiap data ke dalam suatu cluster, sehingga data
akan dimasukan dalam suatu cluster yang memiliki jarak paling dekat dengan
centroid dari setiap cluster. Untuk mengetahui cluster mana yang paling dekat
dengan data, maka perlu dihitung jarak setiap data dengan centroid setiap cluster.
Sebagai contoh, akan dihitung jarak data ke-1 pada cluster 1 adalah:
Keterangan:
d = Jarak
j = Banyaknya data
c = Centroid
x = Data
Dari hasil perhitungan di atas didapatkan hasil bahwa jarak data ke-1 dengan pusat
cluster kedua adalah 3497,08.
Jarak data ke-1 pada cluster 2 adalah:
Dari hasil perhitungan di atas didapatkan hasil bahwa jarak data ke-1 dengan pusat
cluster kedua adalah 2597,97.
Berdasarkan hasil kedua perhitungan di atas dapat disimpulkan bahwa jarak data
kedua yang paling dekat dengan cluster 1, sehingga data kedua di masukan ke dalam
cluster dua.
Langkah keempat, menghitung kembali centroid yang baru berdasarkan rata-rata

angggota yang ada pada cluster tersebut.
Langkah kelima, setelah didapatkan centroid yang baru dari setiap cluster, lakukan
kembali dari langkah ketiga hingga centroid dari setiap cluster tidak berubah lagi
dan tidak ada lagi data yang berpindah dari satu cluster ke cluster yang lain.
Dalam penelitian ini, iterasi clustering data produk terjadi sebanyak empat kali
iterasi. Pada iterasi keempat ini, centroid dari setiap cluster sudah tidak berubah dan
tidak ada lagi data yang berpindah dari satu cluster ke cluster yang lain.
Dilihat dari tabel 4 didapatkan hasil sebagai berikut: Cluster pertama memiliki 15
data dan pusat centroid (443,87, 36,99) yang dapat diartikan sebagai kelompok
produk untuk jumlah sedikit sehingga jumlah stok yang ada harus sedikit. Produk
yang termasuk dalam kelompok ini adalah produk 4, 5, 6, 7, 8, 9, 13, 14, 15, 16, 17,
18, 19, 20, dan 21.
Cluster kedua memiliki 6 data dan pusat centroid (1.787,67, 148,97) yang dapat
diartikan sebagai kelompok produk untuk jumlah banyak sehingga jumlah stok
harus banyak. Produk yang termasuk dalam kelompok ini adalah produk 1, 2, 3, 10,
11, dan 12
Dengan diketahuinya produk pada setiap cluster, maka perusahaan dapat menyusun
strategi pemesanan untuk persediaan stok barang dan strategi pemasaran untuk
memasarkan produk yang paling banyak terjual.
3) Kesimpulan
Penjualan produk yang paling banyak terjual dapat diketahui dengan menggunakan
K-Means, dengan mengelompokan data produk, jumlah transaksi, dan rata-rata
perbulan. Untuk rata-rata diambil dari data jumlah transaksi salama 1 tahun dibagi
12 bulan, lalu pilih 2 data secara acak untuk menentukan centroid awal pada setiap
cluster, setelah data pada setiap cluster tidak berubah-ubah,maka dapat diketahui
data yang paling banyak membutuhkan stok, yaitu data produk ke 1, 2, 3, 10, 11 dan
12. Dari hasil penelitian yang telah di dilakukan di dapat data yang paling sedikit
terjual dimana untuk produk ke 4, 5, 6, 7, 8, 9, 13, 14, 15, 16, 17, 18, 19, 20, dan 21.
Sebagai pilihan produk yang dapat dibuatkan promosi oleh pihak perusahaan untuk
meningkatkan penjualan.
4) Saran

 Artikel 4 : Pemanfaatan Metode K-Means Pemetaan Calon Penerima Jamkesda
1) Pendahuluan
Pada Kelurahan Kemuning salah satunya Seksi Kesejahteraan Sosial (KESSOS)

terdapat pelayanan masyarakat miskin untuk menerima bantuan Jaminan
Kesehatan Daerah (JAMKESDA). Selama ini bagian Seksi KESSOS pada Kelurahan
Kemuning belum ada metode yang dapat mengelompokkan tingkat kemiskinan agar
penerima bantuan tepat sasaran, sehingga pihak Kelurahan tidak dapat mencegah
ketidaktepatsasaran tersebut. Oleh sebab itu, pengelompokan kemisikinan dapat
membantu pihak Kelurahan dalam mengambil keputusan yang tepat untuk
mencegah ketidaktepatsasaran penerima JAMKESDA. Pada penelitian ini, penerapan
metode K-Means diimplementasikan pada aplikasi yang dibuat dengan 2 klaster.
Penelitian ini menggunakan sebanyak 440 sampel data. Dari hasil perhitungan
Davies Bouldin Index diperoleh nilai penentuan jumlah cluster dengan nilai 2 klaster
(0.243), 3 klaster (0.256), 4 klaster (0.275). Nilai yang digunakan adalah 2 klaster
karena nilai tersebut mendekati 0.
2) Pembahasan
Cluster Model yang dihasilkan dari pengelompokan data penduduk dengan algoritma
K-Means ditampilkan dalam Tabel 1, Tabel 2 dan Tabel 3. Pada Tabel 1 tampak
bahwa jumlah cluster yang digunakan sebanyak 2 dengan keanggotaan Cluster 0
terdiri dari 334 item, Cluster 1 terdiri dari 106 item dengan jumlah keseluruhan
adalah sebanyak 440 item . Pada Tabel 2 tampak bahwa jumlah cluster yang
digunakan sebanyak 3 dengan keanggotaan Cluster 0 terdiri dari 43 item, Cluster 1
terdiri dari 87 item, dan Cluster 2 terdiri dari 310 item dengan jumlah keseluruhan
adalah sebanyak 440 item. Pada Tabel 3 tampak bahwa jumlah cluster yang
digunakan sebanyak 4 dengan keanggotaan Cluster 0 terdiri dari 60 item, Cluster 1
terdiri dari 52 item, Cluster 2 terdiri dari 302, dan Cluster 3 terdiri dari 26 item
dengan jumlah keseluruhan adalah sebanyak 440 item. Percobaan pertama dengan 2
cluster yang lebih optimal dikarenakan nilai Performance Vektor (Davies Bouldin
Index) mendekati nilai 0 dengan nilai 0.243.
Pada Tabel 4 menampilkan nilai centroid pada masing-masing cluster dengan atribut
yang digunakan adalah jumlah penghasilan dan jumlah anggota keluarga. Pada nilai
cluster yang berjumlah 2 cluster dengan cluster 0 dengan nilai centroid Jumlah
Penghasilan adalah 570794.83889 dan Jumlah Anggota Keluarga adalah 1.15269
dan sedangkan cluster 1 dengan nilai centroid Jumlah Penghasilan adalah
2405188.67925 dan Jumlah Anggota Keluarga adalah 3.424528.
Penghasilan adalah 3290697.67442 dan Jumlah Anggota Keluarga adalah 3.83721,
cluster 1 dengan nilai centroid Jumlah Penghasilan adalah 1651915.70881 dan
Jumlah Anggota Keluarga adalah 2.88506, dan cluster 2 dengan nilai centroid Jumlah
Penghasilan adalah 517350.99846 dan Jumlah Anggota Keluarga adalah 1.07097.
cluster 1 dengan nilai centroid Jumlah Penghasilan adalah 2183012.82051 dan
Jumlah Anggota Keluarga adalah 3.44231, cluster 2 dengan nilai centroid Jumlah
dan cluster 3 dengan nilai centroid Jumlah Penghasilan adalah 3750000.0 dan
Jumlah Anggota Keluarga adalah 4.15385.
Keanggotaan cluster dikelompokkan berdasarkan kemiripannya percobaan yang

digunakan hanya dengan nilai 2 cluster. Dari pengamatan hasil clustering diperoleh
bahwa data penduduk yang menempati cluster 0 memiliki jumlah penghasilan
rendah dan jumlah anggota keluarga sedikit sedangkan yang menempati cluster 1
memiliki jumlah penghasilan tinggi dan jumlah anggota keluarga sedikit. Dapat
disimpulkan bahwa cluster 0 bisa disebut dengan cluster “tidak mampu” dan cluster
1 bisa disebut dengan cluster “mampu”.
3) Kesimpulan
Dari hasil penelitian dapat diambil kesimpulan bahwa :

a. Penerapan Metode K-Means untuk pemetaan masyarakat berdasarkan tingkat
kemisikinan kelurahan Kemuning berhasil diterapkan ke dalam aplikasi sehingga
penerima bantuan JAMKESDA tepat sasaran.
b. Masih ada faktor-faktor selain jumlah penghasilan dan jumlah anggota keluarga
yang dapat menyebabkan seseorang termasuk golongan tidak mampu atau
mampu, untuk mengetahuinya dapat dilakukan penelitian lebih lanjut lagi.
c. Pada proses pengelompokan dengan aplikasi yang telah dibuat, pengelompokan
tingkat kemiskinan dengan menggunakan 440 sampel data yang di dapat dari
hasil penerima tahun 2015 didapatkan jumlah cluster menggunakan Uji Validitas
Davies Bouldin Index (DBI) sebanyak 2 cluster dengan nilai 0.243 dan nilai
tersebut paling optimal digunakan karena mendekati 0 (nol).
d. Hasil Pengelompokan terdapat 2 kelompok, Mampu dan Tidak Mampu dengan
keanggotaan kelompok tidak mampu sebanyak 334 anggota dan kelompok
mampu sebanyak 106 anggota.
4) Saran

 Artikel 5 : Penerapan Algoritma K-Means untuk Clustering Penilaian Dosen
Berdasarkan Indeks Kepuasan Mahasiswa
1) Pendahuluan
Dalam lingkup perguruan tinggi, aktivitas penilaian kinerja juga diterapkan untuk
menilai kinerja dosen. Dasar yang digunakan dalam penilaian tersebut
menggunakan dasar tri dhrama perguruan tinggi. Dalam penilaian kinerjanya,
diperlukan data terkait kepuasan mahasiswa terhadap dosen. Data yang digunakan
dalam penelitian ini adalah data kepuasan mahasiswa jurusan Ilmu Pengetahuan
Alam, FMIPA, UNNES, berjumlah 146 untuk semua dosen di prodi yang berjumlah
12 dosen. Dalam pengambilan data menggunakan kuesioner dari Badan Penjaminan
Mutu Unnes. Varibale yang digunakan (1) kehandalan dosen (reliability); (2) sikap
tanggap (responsiveness); (3) jaminan (assurance); dan (4) empati (empathy). Data
akan diolah dengan melakukan clustering kinerja dosen dalam cluster baik, atau
kurang. Metode clustering yang digunakan dalam penelitian ini adalah metode K-
Means. Cetroid data untuk cluster_baik 17.099 dan cluster_kurang 15.874. Sehingga
diperoleh penilaian dosen berdasarkan indeks kepuasan mahasiswa dengan 5 dosen
cluster_baik dan 7 dosen_cluster kurang. Hasil yang dari penelitian dapat digunakan
untuk meningkatkan kinerja dosen dalam mengajar untuk meningkatkan indeks
kepuasan mahasiswa.
2) Pembahasan
Dalam melakukan clustering, data yang diperoleh akan dihitung terlebih dahulu
berdasarkan bobot yang telah ditentukan. Data akan dihitung sehingga didapatkan
data yang siap dicluster. Data penilaian dosen diberikan kepada 146 responden
yakni mahasiswa jurusan Ilmu Pengetahuan Alam terhadap 12 dosen. Berikut data
setiap Aspek untuk penilian satu dosen disajikan dalam tabel 1 sampai tabel 4:
Data tersebut kemudian diakumulasikan dari reponden 1 sampai responden 146
kemudian dilakukan perhitungan untuk setiap sub 1 sampai 5 di setiap aspek.
Kemudian dari hasil tersebut, dihitung rata-rata untuk setiap aspek untuk
mendapatkan nilai dari satu dosen tersebut. Berikut tabel akumulasi data hasil
disajikan pada tabel 5 berikut:
Setelah diakumulasikan maka akan didapatkan nilai dari seleuruh data dosen.
Kemudian data tersebut akan masuk ke tahaoan clustering dengan menerapkan
algoritma K-Means menggunakan rapid minner untuk mengcluster data menjadi dua
cluster. Penerapan algoritma K-Means dapat digunakan untuk mengcluster penilaian
kinerja dosen.
Dalam penelitian ini, data yang telah dihitung dicluster ke dalam dua cluster, yakin
cluster_baik dan cluster_kurang.
Data yang telah diakumulasikan akan dimasukan ke dalam tool Rapid Minner.
Sehingga dapat diclustering menjadi dua. Setelah dimasukan ke dalam Rapid Minner.
Hasil akumulais data dapat disajikan dalam tabel 6 berikut:
Data tersebut dimasukan ke dalam tool, kemudian dilakukan pemetaan data 12

dosen tersebut, input data tersebut dapat disajikan dalam gambar 2.
Dalam penerapan algoritma K-means dihasilkan nilai titik tengah atau centroid dari
data yang didapat dengan ketentuan bahwa clusterisasi yang diinginkan adalah 2,
maka nilai titik tengah atau centroid juga terdapat 2 titik. Nilai titik tengah atau
centroid dapat diketahui pada Tabel 7 berikut:
Dengan menggunakan centroid tersebut maka dapat dicluster data yang telah
didapat menjadi 2 cluster. Dari data dosen berdasarakan indeks kepuasaan
mahasiswa didapatakan 7 dosen dalam cluster_kurang dan 5 dosen dalam
cluster_baik. Clustering data dapat digambarkan pada gambar 3 berikut:
Sehingga telah didapatkan hasil clustering data. Clustering tersebut dapat dilihat
lebih jelas
dengan menerapkan centorid yang didapatkan pada hasil yang sebelumnya.
Dari 12 data dosen dapat dikertahui, 5 dosen masuk dalam cluster_baik dan 7 dosen
masuk dalam cluster_kurang. Data tersebut dapat digunkan untuk varibel penilai
dosen berdasarkan indeks kepuasan mahasiswa dalam kenaikan jabatan.
3) Kesimpulan
Untuk melakukan penilaian kinerja dosen berdasarakan indeks kepuasan

mahasiswa dapat
menerapkan metode clustering K-Means. Data diperoleh dari mahasiswa melalui
kuisioner sesuai aspek Reliability, Responsiveness, Assurance, dan Empathy. Data
diolah untuk memperolah nilai dari setiap dosen. Data kemudian diolah
menggunakan Rapidminner untuk ditentukan nilai centroid dalam cluster_baik dan
cluster_kurang dengan algoritma K-Means. Cetroid data untuk cluster_baik 17.099
dan cluster_kurang 15.874. Sehingga diperoleh penilaian dosen berdasarakan
indeks kepuasan mahasiswa dengan 5 dosen cluster_baik dan 7 dosen_cluster
kurang.
4) Saran
Dalam pengolahan data untuk clustering bisa memberikan pembobotan kriteria agar
data yang dihasilkan lebih akurat. Selain itu, juga perlu meningkatan akurasi
clustering pada data.

Uts dataMIning

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Uts dataMIning

Diunggah oleh

Hak Cipta:

Format Tersedia

TUGAS RESUME ARTIKEL/JURNAL TENTANG ALGORITMA K-MEANS

MATA KULIAH DATA MINING

Tingginya tingkat keberhasilan siswa dan rendahnya tingkat kegagalan

b. Jarak antara data siswa pertama dengan pusat cluster ke dua

c. Jarak antara data siswa pertama dengan pusat cluster ke tiga

4. Pengelompokan data cluster, setelah perhitungan jarak data pada centroid,

Data yang dikelompokan pada cluster 1 berjumlah 6 orang, di cluster 2 berjumlah 2

1. Dengan menggunakan Metode Algoritma K-Means Clustering, dapat menentukan

Untuk pengembangan penelitian selanjutnya dapat dikembangkan menggunakan

Suatu perguruan tinggi yang berkualitas apabila telah memenuhi standar

Setelah pusat cluster baru terbentuk, maka perhitungan dilanjutkan untuk

1. Pada penelitian ini dapat dikembangkan menjadi sebuah aplikasi menggunakan

Jarak data ke-1 pada cluster 2 adalah:

Langkah keempat, menghitung kembali centroid yang baru berdasarkan rata-rata

Untuk pengembangan penelitian selanjutnya dapat dikembangkan menggunakan

Pada Kelurahan Kemuning salah satunya Seksi Kesejahteraan Sosial (KESSOS)

Keanggotaan cluster dikelompokkan berdasarkan kemiripannya percobaan yang

Dari hasil penelitian dapat diambil kesimpulan bahwa :

Untuk pengembangan penelitian selanjutnya dapat dikembangkan menggunakan

Data tersebut dimasukan ke dalam tool, kemudian dilakukan pemetaan data 12

Untuk melakukan penilaian kinerja dosen berdasarakan indeks kepuasan

Anda mungkin juga menyukai