Anda di halaman 1dari 9

Link sumber : https://www.youtube.com/watch?

v=bdpSCtYyTJ4&t=55s&ab_channel=Dr.AchmadSolichin

Mengukur Performace K-Means Clustering dengan Rapidminer


1. Buka aplikasi Rapidminer dan pilih menu file – new process – blank process
2. Import dataset yang akan digunakan. Pada pengujian kali ini saya menggunakan dataset iris
dengan format .csv
3. Tarik dataset tersebut ke dalam bagian process

4. Ketikkan select attribute pada search operators kemudian letakkan ke bagian process. Hal
ini bertujuan untuk melakukan setting atribut label pada dataset yang digunakan.
5. Hubungkan retrieve iris dengan select attribute. Kemudian setting pada bagian attribute
filter type dengan subset.
6. Tekan tombol select attributes. Pindahkan attribute a1 sampai a4 ke kolom selected
attributes dengan menekan tombol panah ke kanan. Selanjutnya tekan tombol apply.
7. Cari operator k-means, letakkan ke bagian process dan hubungkan “exa” select attributes
dengan “exa” clustering.
8. Lakukan setting parameter untuk clustering seperti berikut :
- measure types : numerical measures
- numerical measure : euclidean distance
9. Kemudian hubungkan “clu” clustering ke res untuk menampilkan hasilnya. Lakukan seperti
pada gambar di bawah ini.
10. Untuk menilai performance dari clustering, gunakan operator cluster distance performance.
Pada search operators, ketikkan cluster distance performance dan letakkan pada bagian
process.
11. Selanjutnya hubungkan “clu” clustering dengan “clu” performance dan hubungkan “per”
performance dengan “res”.
12. Lakukan setting main criterion parameter pada perfromance seperti gambar berikut.
- Avg within centroid distance : performansi clustering akan semakin baik jika nilai rata-
rata mendekati jarak centroid

13. Selanjutnya tekan tombol untuk melakukan eksekusi.


Dari hasil yang ditampilkan kita bisa melihat berapa nilai perfomance untuk masing-masing
cluster. Nilai rata-rata mendekati angka 0 maka performansi semakin baik.
14. Langkah berikutnya kita akan menilai nilai k mana yang paling baik dari performansi
tersebut. Gunakan operator loop parameters.
15. Sebelumnya lakukan disable atau delete untuk operator clustering dan performance yang
telah dibuat di bagian process.
16. letakkan operator loop parameters pada bagian process. Loop parameters berguna untuk
mengulang opsi dari parameter dengan opsi tertentu.
17. Hubungkan “exa” select attributes ke “inp” loop parameters dan hubungkan “out” loop
parameters dengan “res”

18. Double click pada loop parameters sehingga tampil seperti gambar berikut.
19. Ketikkan k-means pada search operator kemudian drag ke bagian process. Lalu klik kanan
pada clustering dan lakukan rename pada clustering tersebut dan beri nama k-means.

20. Selanjutnya hubungkan “inp” dengan “exa” k-means.


21. Pada search operator, ketikkan cluster distance performance dan drag ke bagian process.
22. Selanjutnya hubungkan k-means dan performance dan hubungkan “per” performance ke
“per”.
23. Lakukan setting pada performance seperti gambar berikut.
24. Tekan tombol untuk kembali ke halaman process.
25. Pada loop parameters, tekan tombol edit parameters setting
26. Lakukan setting loop parameters seperti pada gambar berikut.
27. Pindahkan k (parameter) ke kolom selected parameters dan lakukan setting lainnya seperti
gambar di bawah ini dan tekan tombol ok.

28. Langkah terakhir tekan tombol untuk melakukan eksekusi.


29. Berikut tampilan hasil parameter
30. Lakukan setting seperti gambar di bawah ini untuk menampilkan chart.

Dari gambar chart di atas, semakin kecil nilai k nya maka semakin baik.

Anda mungkin juga menyukai