Tentukan titik pusat (centroid) awal dari tiap cluster. Pusat- pusat
cluster diberi nilai awal dengan nilai random.
Keterangan:
1. Langkah pertama yaitu upload file data ritel cola ke dalam Jupyter Notebook
3. Membaca data ritel cola yang sudah di upload serta menghapus kolom-kolom yang
tidak perlu dalam data.
ritel = pd.read_csv("ritel_cola.csv")
ritel = ritel.drop(["Unnamed: 4", "Unnamed: 5", "Unnamed: 6", "Unnamed: 7"], axis = 1)
ritel.head()import pandas as pd
Hasilnya
4. Setelah itu membuat plot data asli ritel cola untuk melihat sebaran aslinya
menggunakan sintaks berikut :
7. Setelah itu menampilkan pusat cluster dan hasil cluster menggunakan perintah “
cluster_centers_” dan “ labels_”.
8. Untuk mempermudah melihat data kluster maka menambah kolom kluster dalam data
frame ritel.
ritel["kluster"] = kmeans.labels_
ritel.head()
9. Jika sudah dilakukan clustering maka lakukan visualisasi pada plot untuk melihat
sebaran kluster berdasarkan warna dan ukuran plot.
plt.figsct = plt.scatter(x_scaled[:,1], x_scaled[:,0], s = 100, c = ritel.kluster, marker = "o", alpha
= 0.5)
centers = kmeans.cluster_centers_
plt.scatter(centers[:,1], centers[:,0], c='blue', s=200, alpha=0.5);
plt.title("Hasil Klustering K-Means")
plt.xlabel("Scaled Longitude")
plt.ylabel("Scaled Latitude")
plt.show()
plt.figure(figsize=[10,10])
sns.scatterplot(x_scaled[:,1], x_scaled[:,0], hue = ritel.kluster, palette="Set1", s = 100,
alpha = 0.7)
sns.scatterplot(centers[:,1], centers[:,0], color = "k", s = 200, alpha = 0.8);