Anda di halaman 1dari 25

METODE KUANTITATIF

ANALISIS CLUSTER DENGAN MENGGUNAKAN METODE


K-MEANS UNTUK PENGELOMPOKKAN
KABUPATEN/KOTA DI PROVINSI MALUKU
BERDAASARKAN INDIKATOR INDEKS PEMBANGUNAN
MANUSIA TAHUN 2014

KELOMPOK 1
INTRODUCTION

NOER RESKY JULIARTY SALMA DARAPUSPITA AJENG FIRYAL


H5401211003 H5401211011 H5401211065
DAFTAR ISI
Pendahuluan Hasil dan Pembahasan

Metodologi Kesimpulan
PENDAHULUAN
NOER RESKY JULIARTY - H5401211003

Pembangunan nasional Indonesia menempatkan rakyat sebagai titik sentral pembangunan.


Indeks Pembangunan Manusia (IPM) sebagai pengukur perbandingan keberhasilan
pembangunan manusia yang mencakup tiga dimensi kehidupan manusia.
Indeks Kemiskinan Manusia sebagai alternatif pengukuran lain yang berfokus pada
kemiskinan.
Dilakukan pengelompokan wilayah kab/kota di Maluku sebagai bahan perencanaan dan
evaluasi untuk meningkatkan angka pembangunan manusia berdasarkan indikator IPM.
Ukuran indikator yang digunakan meliputi Angka Harapan Hidup (AHH), Angka Melek Huruf
(AHM), Rata-rata Lama Sekolah (RLS), dan Pengeluaran Per Kapita (PPK).
SALMA DARAPUSPITA - H5401211011

METODOLOGI
SALMA DARAPUSPITA - H5401211011

Analisis Multivariat MATRIKS

Menurut Fadhli (2011), data dalam

KEY POINT analisis multivariat dapat dinyatakan


dalam bentuk matriks dengan n
Digunakan untuk menganalisa data
baris (objek) dan p kolom (variabel).
dengan banyak peubah bebas dan peubah
terikat.
Metode independen (independent
method)
Menjelaskan seperangkat variabel
untuk pengelompokan berdasarkan
Misalnya dalam suatu pengamatan
variabe-variabel tertentu.
terdapat p variabel, dari banyaknya n
Analisis cluster
objek.
SALMA DARAPUSPITA - H5401211011

ANALISIS CLUSTER
1. Dapat mengelompokan data observasi dalam
PROSES MEMBUAT PENGELOMPOKAN jumlah besar dan variabel yang relatif banyak.
SEHINGGA SEMUA ANGGOTA DARI SETIAP Data yang di reduksi dengan kelompok akan
PARTISI MEMPUNYAI PERSAMAAN mudah dianalisis.
BERDASARKAN MATRIKS TERTENTU 2. Dapat dipakai dalam skala data ordinal,
interval dan rasio.

Tujuan
1. Dapat mengelompokan data observasi dalam
Untuk mengelompokan individu atau objek ke
jumlah besar dan variabel yang relatif banyak.
dalam beberapa kelompok dengan sifat Data yang di reduksi dengan kelompok akan
berbeda antar kelompok, sehingga individu / mudah dianalisis.
objek yang terletak dalam satu kelompok akan 2. Dapat dipakai dalam skala data ordinal,
bersifat relatif homogen. interval dan rasio.
SALMA DARAPUSPITA - H5401211011

PROSES ANALISIS CLUSTER

Menetapkan ukuran jarak antar data


Mengukur seberapa jauh ada kesamaan objek.
Melakukan penanaman cluster-cluster
Pengukuran jarak yang populer adalah metode Euclidean
distance.
1 4 yang terbentuk
Memasukan sebuah data ke dalam cluster tertentu dengan
mengukur jarak data tersebut ke pusat cluster.

Melakukan validasi dan profiling


Melakukan proses standarisasi data jika
2 5 cluster
diperlukan

3
Melakukan pengklasteran (Clustering)
Metode Hierarki
Pengelompokan dua / lebih objek dengan kesaman paling dekat lalu diteruskan ke objek lain dengan
kedekatan kedua dan seteresnya sampai membuat semacam pohon (tingkatan antar objek jelas-
hierarki). Dendrogram, alat bantu untuk memperjelas proses hierarki.
Metode Non Hierarki
Di mulai dengan menentukan terlebih dahulu jumlah cluster yang diinginkan, lalu proses cluster
dilakukan tanpa mengikuti proses hierarki. Metode ini juga disebut K-Means cluster.
SALMA DARAPUSPITA - H5401211011

CIRI-CIRI ISTILAH PENTING

CLUSTER
Distances between cluster centers, yaitu jarak yang
menunjukan bagaimana terpisahnya pasangan individu
cluster.
Keanggotaan cluster (cluster membership), ialah
keanggotaan yang menunjukan cluster untuk setiap objek
HOOGENITAS (kesamaan) yang menjadi anngotanya
Pusat cluster (cluster centers), ialah titik awal di mulai
yang tinggi antara anggota
pengelompokan dalam cluster nonhierarki.
dalam satu cluster (within
Rata-rata lama cluster (cluster centroid), ialah nilai rata-rata
cluster) variabel dari semua objek atau observasi dalam cluster
HETEROGENITAS tertentu.
(perbedaan) yang tinggi Skedul aglomerasi (agglomeration schedule), ialah jadwal
antara cluster yang satu yang memberikan informasi tentang objek atau kasus yang
dengan cluster lain dikelompokan pada setiap tahap pada suatu proses analisis
cluster yang hierarki.
(between-cluster)
SALMA DARAPUSPITA - H5401211011

Metode C-Means Pendekatan Clustering

KEY POINT Membuat aturan yang mendikte


keanggotaan dalam kelompok
Metode data clustering non hierarki yang yang sama berdasarkan tingkat
mempartisi data dalam bentuk satu / lebih cluster, persamaan di antara anggota-
sehingga data dengan karakteristik yang sama anggotanya.
dikelompokan dalam satu cluster yang sama pula.
Termasuk dalam algoritma clustering berbasis Membuat sekumpulan fungsi
jarak yang membagi data kedalam sejumlah yang mengukur beberapa
cluster dan algoritma ini hanya bekerja pada properti dari pengelompokan
atribut numerik. tersebut sebagai fungsi dari
beberapa parameter dari sebuah
clustering.
SALMA DARAPUSPITA - H5401211011

PROSES C-MEANS

1 2 3
Hitung pusat kelompok dari data yang
ada di masing-masing kelompok
Lokasi centroid setiap kelompok diambil dari
Tentukan
Tentukan Alokasikan
rata-rata semua nilai data dari setiap fiturnya.
jumlah
jumlah data ke Persamaan untuk menghitung centroid fitur ke-
kelompok
kelompok dalam i:
kelompok M = jumlah data suatu kelompok
secara acak (1) i = fitur ke-i suatu kelompok
p = dimensi data

Dilakukan sebanyak p dimensi dari 𝑖 = 1 sampai


dengan 𝑖 = 𝑝
SALMA DARAPUSPITA - H5401211011

PROSES C-MEANS

4
Alokasikan masing-masing data ke centroid / rata-rata terdekat
Cara untuk mengukur jarak data ke pusat kelompok:
Euclidean, pengukuran jarak pada ruang jarak (distance Fungsi objektif menurut MacQueen (1967) dapat
space). ditentukan menggunakan persamaan:

(2)
(4)
K-Means, perbandingan jarak antara data dengan
centroid setiap kelompok yang ada. Data dialokasikan
n = jumlah data
ulang secara tegas ke kelompok yang mempunyai
k = jumlah kelompok
cetroid dengan jarak terdekat dari data tersebut. Fungsi 𝑎𝑖1 = nilai keanggotaan titik data 𝑥𝑖 ke kelompok 𝑐1
objektif menurut MacQueen (1967): yang diikuti
𝑎 mempunyai nilai 0 atau 1
𝑎𝑖1 = nilai keanggotaan titik 𝑥𝑖 ke pusat
kelompok 𝐶𝑙
Apabila data merupakan anggota suatu kelompok, nilai 𝑎𝑖1 = 1. Jika tidak,
(3) 𝑑 adalah jarak terpendek dari data 𝑥𝑖 ke 𝐾
kelompok setelah dibandingkan nilai 𝑎𝑖1 = 0
𝐶𝑙 adalah centroid ke-1
Kembali ke langkah 3, apabila masih ada data yang berpindah kelompok
Fungsi objektif K-Means ditentukan oleh jarak dan nilai atau apabila ada perubahan nilai centroid di atas nilai ambang yang
keanggotaan data dalam kelompok. ditentukan, atau apabila perubahan nilai pada fungsi objektif yang
digunakan masih di atas nilai ambang yang ditentukan.
SALMA DARAPUSPITA - H5401211011

PEMBANGUNAN MORE DETAILS


MANUSIA
Pembangunan manusia adalah suatu
proses untuk memperbanyak pilihan

KEY POINT pilihan yang dimiliki manusia.


Manusia adalah kekayaan bangsa yang untuk berumur panjang dan sehat
sesungguhnya untuk berilmu pengetahuan
Tujuan utama dari pembangunan adalah untuk mempunyai akses terhadap
menciptakan lingkungan memungkinkan sumber daya yang di butuhkan
bagi rakyatnya untuk menikmati umur agar dapat hidup layak
panjang, sehat dan menjalankan Pembangunan yang berpusat pada
kehidupan yang produktif manusia, yang menempatkan
Konsep pembangunan manusia (UNDP): manusia sebagai tujuan akhir dan
yaitu kesejahteraan, produktifitas bukan hanya sebagai alat
pemberdayaan, dan berkelanjutan pembangunan.
SALMA DARAPUSPITA - H5401211011

INDEKS PEMBANGUNAN Tiga dimensi dasar pembangunan manusia


MANUSIA 1. Hidup yang sehat dan panjang umur yang diukur dengan
harapan hidup saat kelahiran.
PENGUKURAN PERBANDINGAN DARI 2. Pengetahuan yang diukur dengan angka tingkat baca tulis dan
HARAPAN HIDUP, PENDIDIKAN
rata-rata lama sekolah.
DAN STANDAR HIDUP UNTUK SEMUA
3. Standar kehidupan yang layak diukur dengan logaritma natural
NEGARA DISELURUH DUNIA
dari produk domestik bruto per kapita dalam paritasi daya beli.

Tujuan
Empat indikator Indeks Pembangunan Manusia

Untuk mengklasifikasikan apakah 1. Angka Harapan Hidup (AHH)


sebuah negara adalah negara maju, 2. Angka Melek Huruf (AMH)
negara berkembang atau negara 3. Rata-rata Lama Sekolah (RLS)
terbelakang
4. Kemampuan daya beli penduduk yaitu
Untuk mengukur pengaruh dari
kebijakan ekonomi terhadap kualitas
kemampuan masyarakat secara ekonomi
hidup dalam memenuhi kebutuhan konsumsinya
Ajeng Firyal - H5401211065

HASIL DAN
PEMBAHASAN
Ajeng Firyal - H5401211065

DATA PENELITIAN
Data Indikator IPM Provinsi Maluku Tahun 2014
Ajeng Firyal - H5401211065

STATISTIK DESKRIPTIF
Proses Pengelompokkan dengan Metode Non Hierarki

Pada statistik deskriptif ini


menunjukan bahwa semua
data lengkap yaitu angka IPM,
AHH, AMH, angka RLS, dan
angka PPK pada 11
kabupaten/kota di Provinsi
Maluku.
Ajeng Firyal - H5401211065

DATA QUICK CLUSTER


Hasil Output Data Quick Cluster

Output ini adalah tampilan


pertama proses clustering
data sebelum melakukan
iterasi. Output ini tidak akan
dianalisis karena nanti akan
dihasilkan proses clustering
sesudah iterasi yang justru
adalah hasil akhir cluster.
Ajeng Firyal - H5401211065

PROSES ITERASI
Proses iterasi dilakukan
sebanyak 2 kali
Jarak minimum antar
pusat cluster yang terjadi
adalah 3.460
Ajeng Firyal - H5401211065

PROSES ITERASI
Final Cluster Center

Berdasarkan output dapat diketahui


bahwa data tersebut masih terkait
dengan proses standarisasi yang
mengacu pada z-score dengan ketentuan
sebagai berikut:
1) Angka negatif (−) berarti data di bawah
rata-rata total.
2) Angka positif (+) berati di atas rata-rata
total.
Ajeng Firyal - H5401211065

ANOVA
Kolom cluster menunjukan besaran
between Cluster means, sedangkan
kolom error menunjukan besaran
within Cluster means sehingga nilai F
diperoleh dari:
𝐹 = 𝑏𝑒𝑡𝑤𝑒𝑒𝑛 𝑚𝑒𝑎𝑛𝑠 / 𝑤𝑖𝑡ℎ𝑖𝑛 𝑚𝑒𝑎𝑛s

Interprestasi angka F adalah semakin besar angka F suatu variabel dan angka
signifikansinya adalah 0,05, maka semakin besar pula perbedaan variabel tersebut pada
ketiga variabel.
Ajeng Firyal - H5401211065

JUMLAH ANGGOTA SETIAP CLUSTER


Data terbanyak ada pada cluster 2,
yaitu 6 kabupaten/kota.
Data sedang ada pada cluster 3, yaitu
4 kabupaten/kota.
Data paling sedikit ada pada cluster 1
yaitu 1 kabupaten/kota.
Ajeng Firyal - H5401211065

ANALISIS KOMPOSISI CLUSTER


Nilai distance adalah jarak terdekat antara data dengan pusat cluster, semakin
kecil berarti semakin mirip dengan cluster terkait.
Cluster 1 : Kota Ambon memiliki jarak ke pusat cluster 1 yaitu 0
Cluster 2 : Maluku Tenggara Barat, kep. Aru, Seram Bagian Barat, Seram
Bagian Timur, MBD, Buru Selatan memiliki jarak 1.095; 0.517; 1.092; 1.418; 0.624;
dan 1.486. Jarak Maluku Tenggara Barat dan Seram Barat ke pusat cluster 2
tidak berbeda jauh sehingga dapat disimpulkan memiliki karakteristik yang
mirip.
Cluster 3 : Maluku Tenggara, Maluku Tengah, Buru, Tual memiliki jarak 0.995;
1.036; 1.312; dan 1.237.

Cluster 1: Kota Ambon mempunyai angka IPM dan AHH sangat maksimal
(sangat banyak sedangkan jumlah AMH, angka RLS dan PPK berbanding
terbalik dengan angka IPM yaitu terjadi pada tahun 2014.
Cluster 2: MTB, Kepulaan Aru, SBB, SBT, MBD, dan Buru Selatan mempunyai
angka IPM, AHH, AMH, RLS, dan angka PPK sangat rendah terjadi pada tahun
2014.
Cluster 3: Maluku Tenggara, Maluku Tengah, Buru, Tual mempunyai angka
IPM, AHH, AMH, RLS, dan angka PPK sangat banyak terjadi pada tahun 2014.
KESIMPULAN
NOER RESKY JULIARTY - H5401211003

Angka IPM, AHH, AMH, RLS, dan PPK kurang terjadi di kab/kota Maluku pada tahun 2014.
Berdasarkan pengelompokkannya, terdapat 3 (tiga) cluster yang terbentuk, yakni:
Cluster 1 yaitu Kota Ambon dengan angka IPM sangat maksimal. Sedangkan jumlah AHH,
AMH, RLS, dan angka PPK sangat banyak terjadi.
Cluster 2 meliputi MTB, Kepulauan Aru, SBB, SBT, MBD, dan Buru Selatan mempunyai angka
IPM, AHH, AMH, RLS, dan PPK kurang terjadi.
Cluster 3 meliputi Maltra, Malteng, Buru, Tual, mempunyai angka IPM, AHH, AMH, RLS dan
angka PPK banyak terjadi.
THANK
YOU

Anda mungkin juga menyukai