Anda di halaman 1dari 16

K=2

K=3

K=7

K=9

K=10

K=11

K=12

Preface:

Seorang manager pada salah satu Mall diKota Bandung memiliki data survey
pengunjung. Data tersebut berisi:
V1: Shooping itu menyenangkan (skala 1-7).
V2: Shooping itu buruk untuk keuangan anda (skala 1-7).
V3: Saya suka belanja dan makan (skala 1-7).
V4: Saya suka mencari untuk mendapatkan harga terbaik ketika berbelanja
(skala 1-7).
V5: Saya tidak peduli dengan shopping (skala 1-7).
V6: Saya bisa sangat menghemat ketika berbelanja (skala 1-7).
Pendapatan: Pemasukan pengunjung mall (skala 1-7).
Mall.Visits : Seberapa sering anda mengunjungi mall (skala 1-7).
Manager tersebut ingin mengetahui segmentasi pengunjung mall
berdasarkan pendapatan pengunjung, sehingga manager dapat mengambil
keputusan untuk membuat marketing yang tepat sesuai dengan
segmentasinya. Disini, posisi anda adalah seorang data analytic handal dan
terpercaya di Kota Bandung, anda akan memberikan rekomendasi yang tepat
kepada manager untuk memberikan gambaran segmentasi yang tepat.
Persiapan Metric/Measurement:
1. K-Medoids (PAMK).
2. K-Medoids (PAM).
3. Hierarchial Clustering.
Analisa yang harus anda kerjakan:
1. K-Medoids (PAMK).
Berapa jumlah kluster yang direkomendasikan oleh machine?
Berapa nilai Average Silhouette widthnya?
K-Medoids (PAM). Anda harus menguji kluster 3, 7, 9, 10, 11, dan 12.
Laporkan hasil visualisasi dan Average Silhouette width 3, 7, 9, 10, 11, dan
12.
Dengan jumlah kluster berapa agar model clustering anda dikatakan sangat
baik?
Hierarchial Clustering (HC). Anda harus membuat HC dengan hasil K-Medoids
(PAM) yang memiliki nilai validitas(Average Silhouette width) paling tinggi.
Laporkan hasil visualisasinya.

Script
setwd("C:\\Users\\ardia\\Google Drive\\Bigdata")
Segmentasi <- read.csv("Segmentasi_Pengujung_Mall.csv")
library(fpc)
kluster_Segmentasi <- Segmentasi
pamk.hasilprediksi <- pamk(kluster_Segmentasi)
table(pamk.hasilprediksi$pamobject$clustering, Segmentasi$Income)
layout(matrix(c(1, 2), 1,2))
plot(pamk.hasilprediksi$pamobject)
library(cluster)
pam.result <- pam(kluster_Segmentasi, 12) #ganti angka untuk ngecek
nilai kluster 2,3,7,9,10,11,12
table(pam.result$clustering, Segmentasi$Income)
layout(matrix(c(1,2), 1, 2))
plot(pam.result)
set.seed(1234)
Segmentasi.Sample <- Segmentasi
hc <- hclust(dist(Segmentasi.Sample), method = "ave")
plot(hc, hang = -1, labels = Segmentasi$Income)
rect.hclust(hc, k = 7)
group <- cutree(hc, k = 7)

Anda mungkin juga menyukai