KELOMPOK 1
INTRODUCTION
Metodologi Kesimpulan
PENDAHULUAN
NOER RESKY JULIARTY - H5401211003
METODOLOGI
SALMA DARAPUSPITA - H5401211011
ANALISIS CLUSTER
1. Dapat mengelompokan data observasi dalam
PROSES MEMBUAT PENGELOMPOKAN jumlah besar dan variabel yang relatif banyak.
SEHINGGA SEMUA ANGGOTA DARI SETIAP Data yang di reduksi dengan kelompok akan
PARTISI MEMPUNYAI PERSAMAAN mudah dianalisis.
BERDASARKAN MATRIKS TERTENTU 2. Dapat dipakai dalam skala data ordinal,
interval dan rasio.
Tujuan
1. Dapat mengelompokan data observasi dalam
Untuk mengelompokan individu atau objek ke
jumlah besar dan variabel yang relatif banyak.
dalam beberapa kelompok dengan sifat Data yang di reduksi dengan kelompok akan
berbeda antar kelompok, sehingga individu / mudah dianalisis.
objek yang terletak dalam satu kelompok akan 2. Dapat dipakai dalam skala data ordinal,
bersifat relatif homogen. interval dan rasio.
SALMA DARAPUSPITA - H5401211011
3
Melakukan pengklasteran (Clustering)
Metode Hierarki
Pengelompokan dua / lebih objek dengan kesaman paling dekat lalu diteruskan ke objek lain dengan
kedekatan kedua dan seteresnya sampai membuat semacam pohon (tingkatan antar objek jelas-
hierarki). Dendrogram, alat bantu untuk memperjelas proses hierarki.
Metode Non Hierarki
Di mulai dengan menentukan terlebih dahulu jumlah cluster yang diinginkan, lalu proses cluster
dilakukan tanpa mengikuti proses hierarki. Metode ini juga disebut K-Means cluster.
SALMA DARAPUSPITA - H5401211011
CLUSTER
Distances between cluster centers, yaitu jarak yang
menunjukan bagaimana terpisahnya pasangan individu
cluster.
Keanggotaan cluster (cluster membership), ialah
keanggotaan yang menunjukan cluster untuk setiap objek
HOOGENITAS (kesamaan) yang menjadi anngotanya
Pusat cluster (cluster centers), ialah titik awal di mulai
yang tinggi antara anggota
pengelompokan dalam cluster nonhierarki.
dalam satu cluster (within
Rata-rata lama cluster (cluster centroid), ialah nilai rata-rata
cluster) variabel dari semua objek atau observasi dalam cluster
HETEROGENITAS tertentu.
(perbedaan) yang tinggi Skedul aglomerasi (agglomeration schedule), ialah jadwal
antara cluster yang satu yang memberikan informasi tentang objek atau kasus yang
dengan cluster lain dikelompokan pada setiap tahap pada suatu proses analisis
cluster yang hierarki.
(between-cluster)
SALMA DARAPUSPITA - H5401211011
PROSES C-MEANS
1 2 3
Hitung pusat kelompok dari data yang
ada di masing-masing kelompok
Lokasi centroid setiap kelompok diambil dari
Tentukan
Tentukan Alokasikan
rata-rata semua nilai data dari setiap fiturnya.
jumlah
jumlah data ke Persamaan untuk menghitung centroid fitur ke-
kelompok
kelompok dalam i:
kelompok M = jumlah data suatu kelompok
secara acak (1) i = fitur ke-i suatu kelompok
p = dimensi data
PROSES C-MEANS
4
Alokasikan masing-masing data ke centroid / rata-rata terdekat
Cara untuk mengukur jarak data ke pusat kelompok:
Euclidean, pengukuran jarak pada ruang jarak (distance Fungsi objektif menurut MacQueen (1967) dapat
space). ditentukan menggunakan persamaan:
(2)
(4)
K-Means, perbandingan jarak antara data dengan
centroid setiap kelompok yang ada. Data dialokasikan
n = jumlah data
ulang secara tegas ke kelompok yang mempunyai
k = jumlah kelompok
cetroid dengan jarak terdekat dari data tersebut. Fungsi 𝑎𝑖1 = nilai keanggotaan titik data 𝑥𝑖 ke kelompok 𝑐1
objektif menurut MacQueen (1967): yang diikuti
𝑎 mempunyai nilai 0 atau 1
𝑎𝑖1 = nilai keanggotaan titik 𝑥𝑖 ke pusat
kelompok 𝐶𝑙
Apabila data merupakan anggota suatu kelompok, nilai 𝑎𝑖1 = 1. Jika tidak,
(3) 𝑑 adalah jarak terpendek dari data 𝑥𝑖 ke 𝐾
kelompok setelah dibandingkan nilai 𝑎𝑖1 = 0
𝐶𝑙 adalah centroid ke-1
Kembali ke langkah 3, apabila masih ada data yang berpindah kelompok
Fungsi objektif K-Means ditentukan oleh jarak dan nilai atau apabila ada perubahan nilai centroid di atas nilai ambang yang
keanggotaan data dalam kelompok. ditentukan, atau apabila perubahan nilai pada fungsi objektif yang
digunakan masih di atas nilai ambang yang ditentukan.
SALMA DARAPUSPITA - H5401211011
Tujuan
Empat indikator Indeks Pembangunan Manusia
HASIL DAN
PEMBAHASAN
Ajeng Firyal - H5401211065
DATA PENELITIAN
Data Indikator IPM Provinsi Maluku Tahun 2014
Ajeng Firyal - H5401211065
STATISTIK DESKRIPTIF
Proses Pengelompokkan dengan Metode Non Hierarki
PROSES ITERASI
Proses iterasi dilakukan
sebanyak 2 kali
Jarak minimum antar
pusat cluster yang terjadi
adalah 3.460
Ajeng Firyal - H5401211065
PROSES ITERASI
Final Cluster Center
ANOVA
Kolom cluster menunjukan besaran
between Cluster means, sedangkan
kolom error menunjukan besaran
within Cluster means sehingga nilai F
diperoleh dari:
𝐹 = 𝑏𝑒𝑡𝑤𝑒𝑒𝑛 𝑚𝑒𝑎𝑛𝑠 / 𝑤𝑖𝑡ℎ𝑖𝑛 𝑚𝑒𝑎𝑛s
Interprestasi angka F adalah semakin besar angka F suatu variabel dan angka
signifikansinya adalah 0,05, maka semakin besar pula perbedaan variabel tersebut pada
ketiga variabel.
Ajeng Firyal - H5401211065
Cluster 1: Kota Ambon mempunyai angka IPM dan AHH sangat maksimal
(sangat banyak sedangkan jumlah AMH, angka RLS dan PPK berbanding
terbalik dengan angka IPM yaitu terjadi pada tahun 2014.
Cluster 2: MTB, Kepulaan Aru, SBB, SBT, MBD, dan Buru Selatan mempunyai
angka IPM, AHH, AMH, RLS, dan angka PPK sangat rendah terjadi pada tahun
2014.
Cluster 3: Maluku Tenggara, Maluku Tengah, Buru, Tual mempunyai angka
IPM, AHH, AMH, RLS, dan angka PPK sangat banyak terjadi pada tahun 2014.
KESIMPULAN
NOER RESKY JULIARTY - H5401211003
Angka IPM, AHH, AMH, RLS, dan PPK kurang terjadi di kab/kota Maluku pada tahun 2014.
Berdasarkan pengelompokkannya, terdapat 3 (tiga) cluster yang terbentuk, yakni:
Cluster 1 yaitu Kota Ambon dengan angka IPM sangat maksimal. Sedangkan jumlah AHH,
AMH, RLS, dan angka PPK sangat banyak terjadi.
Cluster 2 meliputi MTB, Kepulauan Aru, SBB, SBT, MBD, dan Buru Selatan mempunyai angka
IPM, AHH, AMH, RLS, dan PPK kurang terjadi.
Cluster 3 meliputi Maltra, Malteng, Buru, Tual, mempunyai angka IPM, AHH, AMH, RLS dan
angka PPK banyak terjadi.
THANK
YOU