Oleh :
ABDUR ROUF
18.230.0102
Artikel 1 : Pemetaan Siswa Berprestasi Menggunakan Metode K-Means
Clustering.
1) Pendahuluan
2) Pembahasan
Data yang diolah dalam penelitian ini merupakan sampel yang diambil dari data
rapot peserta didik SMK Yapim Simpang Kawat kelas X AK2 tahun ajaran
2016/2017. Dataset siswa terdiri dari atribut data induk dan data rapot. Atribut
yang dijadikan variable dalam algoritma ini di sederhanakan menjadi atribut yang
terdiri dari NIS, Nama, Ekstrakulikuler, Nilai Tugas, Uts , Uas dan Jumlah
ketidakhadiran. Data sampel yang akan diuji cobakan terdiri dari 10
peserta didik. Selanjutnya dicoba mengelompokkan data diatas menjadi 3 kelompok.
Dengan menggunakan algoritma Kmeans, berikut langkah-langkah penyelesaiannya:
1. Menentukan Jumlah cluster, jumlah cluster merupakan jumlah kelompok yang
akan dihasilakan. Dalam penelitian ini jumlah cluster yang akan digunakan adalah
sebanyak 3 cluster.
2. Menentukan centroid awal, centroid awal diperoleh secara acak. Centroid awal
merupakan titik pusat cluster pertama. Centroid awal dari penelitian ini adalah :
C1 = (4, 83.00, 80.08, 87.67, 2, 75)
C5 = (1, 86.67, 84.33, 93.67, 2, 65)
C10= (3, 83.67, 90.07, 70.97, 1, 78)
3. Menghitung jarak setiap data yang ada terhadap setiap pusat cluster.
Berikut perhitungannya dengan menggunakan persamaan Euclidean Distance
Space:
a. Jarak antara data siswa pertama dengan pusat cluster pertama.
Adapun hasil dari perhitungan dari keseluruhan data terhadap tiap pusat cluster
awal disajikan sebagai berikut :
6. Menghitung jarak data ke centroid yang baru untuk iterasi berikutnya. Dengan
menggunakan nilai centroid yang baru, jarak ke masing-masing centroid dihitung
sampai group baru sama dengan group lama atau group sebelumnya.
7. Menghitung jarak data ke centroid yang baru untuk iterasi berikutnya. Dengan
menggunakan nilai centroid yang baru, jarak ke masing-masing centroid dihitung
sampai group baru sama dengan group lama atau group sebelumnya.
Berikut hasil dan pola terakhir jarak antara centroid dan pusat cluster :
3) Kesimpulan
4) Saran
1) Pendahuluan
2) Pembahasan
Tahap pertama yang akan dilakukan pada penelitian ini yaitu menentukan domain
bagi masing-masing kriteria, yang bertujuan untuk mengelompokkan data nilai dari
masing-masing mahasiswa.
Penentuan awal cluster secara acak :
1. Data ke- 1 sebagai pusat Cluster Ke-A
Qolbiah Fitri [5,5,5,1,2,2] (Tepat Waktu)
2. Data ke- 10 sebagai pusat Cluster Ke-B
Abdul Malik [3,3,5,2,1,1] (Tidak Tepat Waktu)
Setelah dilakukan pengelompokan berdasarkan masing-masing cluster kemudian
hitung jarak masing-masing.
Misalnya menghitung jarak (distance) A, B untuk data pertama menggunakan
Eulidean Distance :
Selanjutnya pada tiap cluster yang menjadi centroid awal pada iterasi 1
menggunakan persamaan 01, dapat dilihat pada Tabel 10.
Setelah proses perhitungan dan pembagian kelompok cluster dilakukan, maka pusat
cluster baru dapat dibentuk dengan cara menghitung rata-rata kriteria dari masing-
masing kelompok cluster yang sama. Misalnya menghitung pusat cluster baru
(cendroid) menggunakan rumus sebagai berikut :
Rata-rata dari kelompok data cluster 1 masuk sebagai nilai A, begitu pula dengan
data cluster 2 masuk sebagai nilai B. Maka diperoleh pusat cluster baru/centroid
baru seperti pada Tabel 12.
1. Cluster A adalah mahasiswa yang lulus tepat waktu sedangkan cluster B adalah
mahasiswa yang lulusnya tidak tepat waktu.
2. Data pengelompokan mahasiswa ini merupakan masukan bagi dosen wali dalam
membimbing dan mengawasi proses belajar mahasiswa agar bisa lulus tepat
waktu.
4) Saran
1) Pendahuluan
Berbagai usaha kuliner yang ada saat ini selalu memerlukan persediaan
dalam mengantisipasi permintaan [Nurhasanah et al., 2012]. Tanpa adanya
persediaan, para pengusaha akan dihadapkan pada resiko yaitu perusahaan tidak
dapat memenuhi permintaan para pelanggannya [Fazzry and Nugroho, 2016].
Untuk menangani masalah tersebut maka dibutuhkan suatu manajemen
persediaan barang yang baik untuk pengolahan data historis transaksi besar yaitu
menggunakan teknik data mining [Defit et al., 2015]. Data mining merupakan proses
knowledge discovery in database, meliputi dugaan algoritma yang mengeksplorasi
data, membangun model, dan menemukan pola yang belum diketahui [Widodo et al.,
2013]. Metode K-mean merupakan salah satu metode dalam fungsi pengelompokan
(clustering), sehingga data yang memiliki karakteristik yang sama dikelompokkan
dalam cluster yang sama [Rahman, 2017].
Tujuan diadakannya penelitan ini adalah menghasilkan sebuah sistem
pendukung keputusan dalam menentukan persediaan stok barang bagi perusahaan.
Melalui sistem pendukung keputusan ini diharapkan dapat membantu perusahaan
menghindari kekurangan maupun kelebihan persediaan barang [Zefriyenni and
Santoso, 2015], sehingga perusahaan dapat melakukan efisiensi secara cermat
dalam hal pengadaaan barang.
2) Pembahasan
Data–data yang digunakan pada penelitian ini adalah data transaksi penjualan
produk pasta pada Gia Restaurant Jakarta, dari bulan Januari 2017 sampai
Desember 2017. Penelitian ini memfokuskan hanya pada produk pasta saja. Untuk
memudahkan pemprosesan data maka nama produk diubah menjadi kode produk
dan menambakan atribut rata-rata perbulan yang di ambil dari data jumlah
transaksi selama satu tahun dibagi 12 bulan. Inisialisasi data transaksi penjualan
bisa dilihat pada tabel 1.
Agar tabel 1 dapat di kelompokan menjadi beberapa cluster, perlu dilakukan
beberapa langkah sebagai berikut:
Langkah pertama, yaitu menentukan jumlah cluster (k). Dalam penelitian ini data
yang ada akan dikelompokan menjadi dua cluster, yaitu cluster pertama untuk
jumlah sedikit, dan cluster kedua untuk jumlah banyak.
Langkah kedua, menentukan titik pusat awal (centroid) dari setiap cluster. Dalam
penelitian ini centroid awal ditentukan secara acak dan didapat centroid dari setiap
cluster seperti pada tabel 2:
Langkah ketiga, mengalokasikan setiap data ke dalam suatu cluster, sehingga data
akan dimasukan dalam suatu cluster yang memiliki jarak paling dekat dengan
centroid dari setiap cluster. Untuk mengetahui cluster mana yang paling dekat
dengan data, maka perlu dihitung jarak setiap data dengan centroid setiap cluster.
Sebagai contoh, akan dihitung jarak data ke-1 pada cluster 1 adalah:
Keterangan:
d = Jarak
j = Banyaknya data
c = Centroid
x = Data
Dari hasil perhitungan di atas didapatkan hasil bahwa jarak data ke-1 dengan pusat
cluster kedua adalah 3497,08.
Dari hasil perhitungan di atas didapatkan hasil bahwa jarak data ke-1 dengan pusat
cluster kedua adalah 2597,97.
Berdasarkan hasil kedua perhitungan di atas dapat disimpulkan bahwa jarak data
kedua yang paling dekat dengan cluster 1, sehingga data kedua di masukan ke dalam
cluster dua.
3) Kesimpulan
Penjualan produk yang paling banyak terjual dapat diketahui dengan menggunakan
K-Means, dengan mengelompokan data produk, jumlah transaksi, dan rata-rata
perbulan. Untuk rata-rata diambil dari data jumlah transaksi salama 1 tahun dibagi
12 bulan, lalu pilih 2 data secara acak untuk menentukan centroid awal pada setiap
cluster, setelah data pada setiap cluster tidak berubah-ubah,maka dapat diketahui
data yang paling banyak membutuhkan stok, yaitu data produk ke 1, 2, 3, 10, 11 dan
12. Dari hasil penelitian yang telah di dilakukan di dapat data yang paling sedikit
terjual dimana untuk produk ke 4, 5, 6, 7, 8, 9, 13, 14, 15, 16, 17, 18, 19, 20, dan 21.
Sebagai pilihan produk yang dapat dibuatkan promosi oleh pihak perusahaan untuk
meningkatkan penjualan.
4) Saran
1) Pendahuluan
2) Pembahasan
Cluster Model yang dihasilkan dari pengelompokan data penduduk dengan algoritma
K-Means ditampilkan dalam Tabel 1, Tabel 2 dan Tabel 3. Pada Tabel 1 tampak
bahwa jumlah cluster yang digunakan sebanyak 2 dengan keanggotaan Cluster 0
terdiri dari 334 item, Cluster 1 terdiri dari 106 item dengan jumlah keseluruhan
adalah sebanyak 440 item . Pada Tabel 2 tampak bahwa jumlah cluster yang
digunakan sebanyak 3 dengan keanggotaan Cluster 0 terdiri dari 43 item, Cluster 1
terdiri dari 87 item, dan Cluster 2 terdiri dari 310 item dengan jumlah keseluruhan
adalah sebanyak 440 item. Pada Tabel 3 tampak bahwa jumlah cluster yang
digunakan sebanyak 4 dengan keanggotaan Cluster 0 terdiri dari 60 item, Cluster 1
terdiri dari 52 item, Cluster 2 terdiri dari 302, dan Cluster 3 terdiri dari 26 item
dengan jumlah keseluruhan adalah sebanyak 440 item. Percobaan pertama dengan 2
cluster yang lebih optimal dikarenakan nilai Performance Vektor (Davies Bouldin
Index) mendekati nilai 0 dengan nilai 0.243.
Pada Tabel 4 menampilkan nilai centroid pada masing-masing cluster dengan atribut
yang digunakan adalah jumlah penghasilan dan jumlah anggota keluarga. Pada nilai
cluster yang berjumlah 2 cluster dengan cluster 0 dengan nilai centroid Jumlah
Penghasilan adalah 570794.83889 dan Jumlah Anggota Keluarga adalah 1.15269
dan sedangkan cluster 1 dengan nilai centroid Jumlah Penghasilan adalah
2405188.67925 dan Jumlah Anggota Keluarga adalah 3.424528.
Pada Tabel 5 menampilkan nilai centroid pada masing-masing cluster dengan atribut
yang digunakan adalah jumlah penghasilan dan jumlah anggota keluarga. Pada nilai
cluster yang berjumlah 3 cluster dengan cluster 0 dengan nilai centroid Jumlah
Penghasilan adalah 3290697.67442 dan Jumlah Anggota Keluarga adalah 3.83721,
cluster 1 dengan nilai centroid Jumlah Penghasilan adalah 1651915.70881 dan
Jumlah Anggota Keluarga adalah 2.88506, dan cluster 2 dengan nilai centroid Jumlah
Penghasilan adalah 517350.99846 dan Jumlah Anggota Keluarga adalah 1.07097.
Pada Tabel 6 menampilkan nilai centroid pada masing-masing cluster dengan atribut
yang digunakan adalah jumlah penghasilan dan jumlah anggota keluarga. Pada nilai
cluster yang berjumlah 4 cluster dengan cluster 0 dengan nilai centroid Jumlah
Penghasilan adalah 1369999.99999 dan Jumlah Anggota Keluarga adalah 2.43333,
cluster 1 dengan nilai centroid Jumlah Penghasilan adalah 2183012.82051 dan
Jumlah Anggota Keluarga adalah 3.44231, cluster 2 dengan nilai centroid Jumlah
Penghasilan adalah 504565.59445 dan Jumlah Anggota Keluarga adalah 1.04305,
dan cluster 3 dengan nilai centroid Jumlah Penghasilan adalah 3750000.0 dan
Jumlah Anggota Keluarga adalah 4.15385.
3) Kesimpulan
4) Saran
1) Pendahuluan
Dalam lingkup perguruan tinggi, aktivitas penilaian kinerja juga diterapkan untuk
menilai kinerja dosen. Dasar yang digunakan dalam penilaian tersebut
menggunakan dasar tri dhrama perguruan tinggi. Dalam penilaian kinerjanya,
diperlukan data terkait kepuasan mahasiswa terhadap dosen. Data yang digunakan
dalam penelitian ini adalah data kepuasan mahasiswa jurusan Ilmu Pengetahuan
Alam, FMIPA, UNNES, berjumlah 146 untuk semua dosen di prodi yang berjumlah
12 dosen. Dalam pengambilan data menggunakan kuesioner dari Badan Penjaminan
Mutu Unnes. Varibale yang digunakan (1) kehandalan dosen (reliability); (2) sikap
tanggap (responsiveness); (3) jaminan (assurance); dan (4) empati (empathy). Data
akan diolah dengan melakukan clustering kinerja dosen dalam cluster baik, atau
kurang. Metode clustering yang digunakan dalam penelitian ini adalah metode K-
Means. Cetroid data untuk cluster_baik 17.099 dan cluster_kurang 15.874. Sehingga
diperoleh penilaian dosen berdasarkan indeks kepuasan mahasiswa dengan 5 dosen
cluster_baik dan 7 dosen_cluster kurang. Hasil yang dari penelitian dapat digunakan
untuk meningkatkan kinerja dosen dalam mengajar untuk meningkatkan indeks
kepuasan mahasiswa.
2) Pembahasan
Dalam melakukan clustering, data yang diperoleh akan dihitung terlebih dahulu
berdasarkan bobot yang telah ditentukan. Data akan dihitung sehingga didapatkan
data yang siap dicluster. Data penilaian dosen diberikan kepada 146 responden
yakni mahasiswa jurusan Ilmu Pengetahuan Alam terhadap 12 dosen. Berikut data
setiap Aspek untuk penilian satu dosen disajikan dalam tabel 1 sampai tabel 4:
Data tersebut kemudian diakumulasikan dari reponden 1 sampai responden 146
kemudian dilakukan perhitungan untuk setiap sub 1 sampai 5 di setiap aspek.
Kemudian dari hasil tersebut, dihitung rata-rata untuk setiap aspek untuk
mendapatkan nilai dari satu dosen tersebut. Berikut tabel akumulasi data hasil
disajikan pada tabel 5 berikut:
Setelah diakumulasikan maka akan didapatkan nilai dari seleuruh data dosen.
Kemudian data tersebut akan masuk ke tahaoan clustering dengan menerapkan
algoritma K-Means menggunakan rapid minner untuk mengcluster data menjadi dua
cluster. Penerapan algoritma K-Means dapat digunakan untuk mengcluster penilaian
kinerja dosen.
Dalam penelitian ini, data yang telah dihitung dicluster ke dalam dua cluster, yakin
cluster_baik dan cluster_kurang.
Data yang telah diakumulasikan akan dimasukan ke dalam tool Rapid Minner.
Sehingga dapat diclustering menjadi dua. Setelah dimasukan ke dalam Rapid Minner.
Hasil akumulais data dapat disajikan dalam tabel 6 berikut:
Dengan menggunakan centroid tersebut maka dapat dicluster data yang telah
didapat menjadi 2 cluster. Dari data dosen berdasarakan indeks kepuasaan
mahasiswa didapatakan 7 dosen dalam cluster_kurang dan 5 dosen dalam
cluster_baik. Clustering data dapat digambarkan pada gambar 3 berikut:
Sehingga telah didapatkan hasil clustering data. Clustering tersebut dapat dilihat
lebih jelas
dengan menerapkan centorid yang didapatkan pada hasil yang sebelumnya.
Dari 12 data dosen dapat dikertahui, 5 dosen masuk dalam cluster_baik dan 7 dosen
masuk dalam cluster_kurang. Data tersebut dapat digunkan untuk varibel penilai
dosen berdasarkan indeks kepuasan mahasiswa dalam kenaikan jabatan.
3) Kesimpulan
4) Saran
Dalam pengolahan data untuk clustering bisa memberikan pembobotan kriteria agar
data yang dihasilkan lebih akurat. Selain itu, juga perlu meningkatan akurasi
clustering pada data.