Tugas K-Means - Data Mining 211
Tugas K-Means - Data Mining 211
MK DATA MINING
6 DESEMBER 2021 10:00 WIB – 23:59 WIB
UNIVERSITAS DINAMIKA
Petunjuk:
1) Silakan berdoa sebelum mengerjakan soal tugas
2) Soal tugas dapat dikerjakan secara berkelompok. 1 kelompok terdiri atas 2 orang. Jika ada mahasiswa yang
tidak mendapat kelompok, maka mahasiswa tersebut dapat bergabung ke salah satu kelompok sehingga hanya
1 kelompok yang diizinkan terdiri atas 3 orang.
3) Silakan unggah file jawaban di MyBrilian dengan tipe file yaitu .doc. Format penamaan file:
KMeans_DM_211_NIM1_NIM2.doc, contoh: KMeans_DM_211_18410100001_18410100002.doc
4) Penaman file yang tidak sesuai ketentuan, maka nilai tugas akan dikurangi 20 poin
5) Keterlambatan pengumpulan jawaban akan diberikan sanksi berupa pemotongan 2 poin per menit.
6) Kesamaan jawaban antar kelompok menyebabkan nilai tugas hanya mendapat 10 poin.
Soal:
1) Setiap tahun, “Dinamika University” memberikan promosi berupa potongan uang gedung kepada siswa-siswi
SMA yang ingin mendaftar sebagai calon mahasiswa baru (Camaba). Potongan uang gedung dibagi menjadi 3
kategori, yaitu: kategori I (unggul) mendapat potongan uang gedung 75%, kategori II (baik) mendapat
potongan uang gedung 50%, kategori III (menengah) mendapat potongan uang Gedung 25%. Untuk
mendapatkan promosi tersebut, Camaba akan memberikan nilai rapor SMA kelas XI kepada petugas
penerimaan mahasiswa baru (penmaru). Pada akhir periode pendaftaran, petugas akan melakukan rekap
seluruh data Camaba, terutama nama Camaba, nilai mata pelajaran matematika (Mat), nilai bahasa Indonesia
(Bind), dan nilai bahasa inggris (Bing) pada rapor kelas XI, sebagai bahan pertimbangan dalam menentukan
kategori potongan uang gedung. Selama ini, petugas penmaru merasa kesulitan dan membutuhkan waktu lama
dalam mengelompokkan data Camaba ke dalam kategori I (unggul), II (baik), atau III (menengah). Berikut ini
adalah sebagian rekap data Camaba yang masuk pada pendaftaran tahun ajaran 2020/2021 beserta kategori
yang sudah ditentukan petugas penmaru:
Nama Camaba Nilai Mat Nilai Bind Nilai Bing Kategori
Arifin 90 80 85 I
Tony 70 65 70 II
Sony 65 50 55 III
Endra 75 80 70 II
Alit 60 60 65 II
Anjik 85 90 95 I
Soal:
[Kerjakan studi kasus tersebut dengan metode K-Means]
a) Asumsikan kolom kategori pada data Camaba tidak ada, lalu lakukan penentuan kategori sendiri dari 6 data
yang ada! Hint: untuk penentuan centroid awal dalam perhitungan manual K-Means, gunakan random yang
sama dengan aplikasi Weka!
b) Apakah sama kategori yang dilakukan oleh petugas penmaru dengan hasil kategori dari K-Means? Jika tidak
sama, data camaba mana yang berbeda kategorinya?
c) Buktikan bahwa hasil perhitungan manual pada poin 2a sudah sesuai dengan aplikasi Weka dan Rapid Miner!
Beri capture yang membuktikan kesesuaian antara jawaban manual dengan hasil pada aplikasi Weka dan
RapidMiner!