Anda di halaman 1dari 2

TUGAS K-MEANS 211

MK DATA MINING
6 DESEMBER 2021 10:00 WIB – 23:59 WIB
UNIVERSITAS DINAMIKA

Petunjuk:
1) Silakan berdoa sebelum mengerjakan soal tugas
2) Soal tugas dapat dikerjakan secara berkelompok. 1 kelompok terdiri atas 2 orang. Jika ada mahasiswa yang
tidak mendapat kelompok, maka mahasiswa tersebut dapat bergabung ke salah satu kelompok sehingga hanya
1 kelompok yang diizinkan terdiri atas 3 orang.
3) Silakan unggah file jawaban di MyBrilian dengan tipe file yaitu .doc. Format penamaan file:
KMeans_DM_211_NIM1_NIM2.doc, contoh: KMeans_DM_211_18410100001_18410100002.doc
4) Penaman file yang tidak sesuai ketentuan, maka nilai tugas akan dikurangi 20 poin
5) Keterlambatan pengumpulan jawaban akan diberikan sanksi berupa pemotongan 2 poin per menit.
6) Kesamaan jawaban antar kelompok menyebabkan nilai tugas hanya mendapat 10 poin.

Soal:
1) Setiap tahun, “Dinamika University” memberikan promosi berupa potongan uang gedung kepada siswa-siswi
SMA yang ingin mendaftar sebagai calon mahasiswa baru (Camaba). Potongan uang gedung dibagi menjadi 3
kategori, yaitu: kategori I (unggul) mendapat potongan uang gedung 75%, kategori II (baik) mendapat
potongan uang gedung 50%, kategori III (menengah) mendapat potongan uang Gedung 25%. Untuk
mendapatkan promosi tersebut, Camaba akan memberikan nilai rapor SMA kelas XI kepada petugas
penerimaan mahasiswa baru (penmaru). Pada akhir periode pendaftaran, petugas akan melakukan rekap
seluruh data Camaba, terutama nama Camaba, nilai mata pelajaran matematika (Mat), nilai bahasa Indonesia
(Bind), dan nilai bahasa inggris (Bing) pada rapor kelas XI, sebagai bahan pertimbangan dalam menentukan
kategori potongan uang gedung. Selama ini, petugas penmaru merasa kesulitan dan membutuhkan waktu lama
dalam mengelompokkan data Camaba ke dalam kategori I (unggul), II (baik), atau III (menengah). Berikut ini
adalah sebagian rekap data Camaba yang masuk pada pendaftaran tahun ajaran 2020/2021 beserta kategori
yang sudah ditentukan petugas penmaru:
Nama Camaba Nilai Mat Nilai Bind Nilai Bing Kategori

Arifin 90 80 85 I

Tony 70 65 70 II

Sony 65 50 55 III

Endra 75 80 70 II

Alit 60 60 65 II

Anjik 85 90 95 I

Soal:
[Kerjakan studi kasus tersebut dengan metode K-Means]
a) Asumsikan kolom kategori pada data Camaba tidak ada, lalu lakukan penentuan kategori sendiri dari 6 data
yang ada! Hint: untuk penentuan centroid awal dalam perhitungan manual K-Means, gunakan random yang
sama dengan aplikasi Weka!
b) Apakah sama kategori yang dilakukan oleh petugas penmaru dengan hasil kategori dari K-Means? Jika tidak
sama, data camaba mana yang berbeda kategorinya?
c) Buktikan bahwa hasil perhitungan manual pada poin 2a sudah sesuai dengan aplikasi Weka dan Rapid Miner!
Beri capture yang membuktikan kesesuaian antara jawaban manual dengan hasil pada aplikasi Weka dan
RapidMiner!

Desember 6, 2021 Page 2

Anda mungkin juga menyukai