Dataset : iris
- Single linkage : yang mewakili antara jarak cluster a dan cluster b dapat ditrntukan oleh objek
yang paling dekat
- Complete linkage : yang mewakili antara jarak cluster a dan cluster b dapat ditrntukan oleh
objek yang paling jauh
- Average linkage : yang mewakili antara jarak cluster a dan cluster b dapat ditrntukan oleh objek
yang di rata’’
- Centroid linkage : yang mewakili antara jarak cluster a dan cluster b dapat ditrntukan oleh objek
yang tengah
Gunakan linkage yang bisa dikelompokkan menjadi 3
2. Silhouette Coefficient :
Kesimpulan : memprediksi 2 cluster tersebut berpengaruh atau tidak pada harga bangunan, boleh
memakai groupby ataupun yang lainnya.
Hierarchical clustering dipakai untuk data yang sedikit, jika datanya banyak memakai k-meas.
Jika memakai silluete harus dicoba semua dan dibuat grafik, pilih cluster yang nilainya sederhana.
Jika datanya lama dibaca oleh knime, maka memakai sampling aja biar cepat.