Replikasi Jurnal Metode K Means

METODE KUANTITATIF
ANALISIS CLUSTER DENGAN MENGGUNAKAN METODE

K-MEANS UNTUK PENGELOMPOKKAN
KABUPATEN/KOTA DI PROVINSI MALUKU
BERDAASARKAN INDIKATOR INDEKS PEMBANGUNAN
MANUSIA TAHUN 2014
KELOMPOK 1
INTRODUCTION
NOER RESKY JULIARTY SALMA DARAPUSPITA AJENG FIRYAL

H5401211003 H5401211011 H5401211065
DAFTAR ISI
Pendahuluan Hasil dan Pembahasan
Metodologi Kesimpulan
PENDAHULUAN
NOER RESKY JULIARTY - H5401211003
Pembangunan nasional Indonesia menempatkan rakyat sebagai titik sentral pembangunan.

Indeks Pembangunan Manusia (IPM) sebagai pengukur perbandingan keberhasilan
pembangunan manusia yang mencakup tiga dimensi kehidupan manusia.
Indeks Kemiskinan Manusia sebagai alternatif pengukuran lain yang berfokus pada
kemiskinan.
Dilakukan pengelompokan wilayah kab/kota di Maluku sebagai bahan perencanaan dan
evaluasi untuk meningkatkan angka pembangunan manusia berdasarkan indikator IPM.
Ukuran indikator yang digunakan meliputi Angka Harapan Hidup (AHH), Angka Melek Huruf
(AHM), Rata-rata Lama Sekolah (RLS), dan Pengeluaran Per Kapita (PPK).
SALMA DARAPUSPITA - H5401211011
METODOLOGI
Analisis Multivariat MATRIKS
Menurut Fadhli (2011), data dalam
KEY POINT analisis multivariat dapat dinyatakan

dalam bentuk matriks dengan n
Digunakan untuk menganalisa data
baris (objek) dan p kolom (variabel).
dengan banyak peubah bebas dan peubah
terikat.
Metode independen (independent
method)
Menjelaskan seperangkat variabel
untuk pengelompokan berdasarkan
Misalnya dalam suatu pengamatan
variabe-variabel tertentu.
terdapat p variabel, dari banyaknya n
Analisis cluster
objek.
ANALISIS CLUSTER
1. Dapat mengelompokan data observasi dalam
PROSES MEMBUAT PENGELOMPOKAN jumlah besar dan variabel yang relatif banyak.
SEHINGGA SEMUA ANGGOTA DARI SETIAP Data yang di reduksi dengan kelompok akan
PARTISI MEMPUNYAI PERSAMAAN mudah dianalisis.
BERDASARKAN MATRIKS TERTENTU 2. Dapat dipakai dalam skala data ordinal,
interval dan rasio.
Tujuan
1. Dapat mengelompokan data observasi dalam
Untuk mengelompokan individu atau objek ke
jumlah besar dan variabel yang relatif banyak.
dalam beberapa kelompok dengan sifat Data yang di reduksi dengan kelompok akan
berbeda antar kelompok, sehingga individu / mudah dianalisis.
objek yang terletak dalam satu kelompok akan 2. Dapat dipakai dalam skala data ordinal,
bersifat relatif homogen. interval dan rasio.
PROSES ANALISIS CLUSTER
Menetapkan ukuran jarak antar data

Mengukur seberapa jauh ada kesamaan objek.
Melakukan penanaman cluster-cluster
Pengukuran jarak yang populer adalah metode Euclidean
distance.
1 4 yang terbentuk
Memasukan sebuah data ke dalam cluster tertentu dengan
mengukur jarak data tersebut ke pusat cluster.
Melakukan validasi dan profiling

Melakukan proses standarisasi data jika
2 5 cluster
diperlukan
3
Melakukan pengklasteran (Clustering)
Metode Hierarki
Pengelompokan dua / lebih objek dengan kesaman paling dekat lalu diteruskan ke objek lain dengan
kedekatan kedua dan seteresnya sampai membuat semacam pohon (tingkatan antar objek jelas-
hierarki). Dendrogram, alat bantu untuk memperjelas proses hierarki.
Metode Non Hierarki
Di mulai dengan menentukan terlebih dahulu jumlah cluster yang diinginkan, lalu proses cluster
dilakukan tanpa mengikuti proses hierarki. Metode ini juga disebut K-Means cluster.
CIRI-CIRI ISTILAH PENTING
CLUSTER
Distances between cluster centers, yaitu jarak yang
menunjukan bagaimana terpisahnya pasangan individu
cluster.
Keanggotaan cluster (cluster membership), ialah
keanggotaan yang menunjukan cluster untuk setiap objek
HOOGENITAS (kesamaan) yang menjadi anngotanya
Pusat cluster (cluster centers), ialah titik awal di mulai
yang tinggi antara anggota
pengelompokan dalam cluster nonhierarki.
dalam satu cluster (within
Rata-rata lama cluster (cluster centroid), ialah nilai rata-rata
cluster) variabel dari semua objek atau observasi dalam cluster
HETEROGENITAS tertentu.
(perbedaan) yang tinggi Skedul aglomerasi (agglomeration schedule), ialah jadwal
antara cluster yang satu yang memberikan informasi tentang objek atau kasus yang
dengan cluster lain dikelompokan pada setiap tahap pada suatu proses analisis
cluster yang hierarki.
(between-cluster)
Metode C-Means Pendekatan Clustering
KEY POINT Membuat aturan yang mendikte

keanggotaan dalam kelompok
Metode data clustering non hierarki yang yang sama berdasarkan tingkat
mempartisi data dalam bentuk satu / lebih cluster, persamaan di antara anggota-
sehingga data dengan karakteristik yang sama anggotanya.
dikelompokan dalam satu cluster yang sama pula.
Termasuk dalam algoritma clustering berbasis Membuat sekumpulan fungsi
jarak yang membagi data kedalam sejumlah yang mengukur beberapa
cluster dan algoritma ini hanya bekerja pada properti dari pengelompokan
atribut numerik. tersebut sebagai fungsi dari
beberapa parameter dari sebuah
clustering.
PROSES C-MEANS
1 2 3
Hitung pusat kelompok dari data yang
ada di masing-masing kelompok
Lokasi centroid setiap kelompok diambil dari
Tentukan
Tentukan Alokasikan
rata-rata semua nilai data dari setiap fiturnya.
jumlah
jumlah data ke Persamaan untuk menghitung centroid fitur ke-
kelompok
kelompok dalam i:
kelompok M = jumlah data suatu kelompok
secara acak (1) i = fitur ke-i suatu kelompok
p = dimensi data
Dilakukan sebanyak p dimensi dari 𝑖 = 1 sampai

dengan 𝑖 = 𝑝
PROSES C-MEANS
4
Alokasikan masing-masing data ke centroid / rata-rata terdekat
Cara untuk mengukur jarak data ke pusat kelompok:
Euclidean, pengukuran jarak pada ruang jarak (distance Fungsi objektif menurut MacQueen (1967) dapat
space). ditentukan menggunakan persamaan:
(2)
(4)
K-Means, perbandingan jarak antara data dengan
centroid setiap kelompok yang ada. Data dialokasikan
n = jumlah data
ulang secara tegas ke kelompok yang mempunyai
k = jumlah kelompok
cetroid dengan jarak terdekat dari data tersebut. Fungsi 𝑎𝑖1 = nilai keanggotaan titik data 𝑥𝑖 ke kelompok 𝑐1
objektif menurut MacQueen (1967): yang diikuti
𝑎 mempunyai nilai 0 atau 1
𝑎𝑖1 = nilai keanggotaan titik 𝑥𝑖 ke pusat
kelompok 𝐶𝑙
Apabila data merupakan anggota suatu kelompok, nilai 𝑎𝑖1 = 1. Jika tidak,
(3) 𝑑 adalah jarak terpendek dari data 𝑥𝑖 ke 𝐾
kelompok setelah dibandingkan nilai 𝑎𝑖1 = 0
𝐶𝑙 adalah centroid ke-1
Kembali ke langkah 3, apabila masih ada data yang berpindah kelompok
Fungsi objektif K-Means ditentukan oleh jarak dan nilai atau apabila ada perubahan nilai centroid di atas nilai ambang yang
keanggotaan data dalam kelompok. ditentukan, atau apabila perubahan nilai pada fungsi objektif yang
digunakan masih di atas nilai ambang yang ditentukan.
PEMBANGUNAN MORE DETAILS

MANUSIA
Pembangunan manusia adalah suatu
proses untuk memperbanyak pilihan
KEY POINT pilihan yang dimiliki manusia.

Manusia adalah kekayaan bangsa yang untuk berumur panjang dan sehat
sesungguhnya untuk berilmu pengetahuan
Tujuan utama dari pembangunan adalah untuk mempunyai akses terhadap
menciptakan lingkungan memungkinkan sumber daya yang di butuhkan
bagi rakyatnya untuk menikmati umur agar dapat hidup layak
panjang, sehat dan menjalankan Pembangunan yang berpusat pada
kehidupan yang produktif manusia, yang menempatkan
Konsep pembangunan manusia (UNDP): manusia sebagai tujuan akhir dan
yaitu kesejahteraan, produktifitas bukan hanya sebagai alat
pemberdayaan, dan berkelanjutan pembangunan.
INDEKS PEMBANGUNAN Tiga dimensi dasar pembangunan manusia

MANUSIA 1. Hidup yang sehat dan panjang umur yang diukur dengan
harapan hidup saat kelahiran.
PENGUKURAN PERBANDINGAN DARI 2. Pengetahuan yang diukur dengan angka tingkat baca tulis dan
HARAPAN HIDUP, PENDIDIKAN
rata-rata lama sekolah.
DAN STANDAR HIDUP UNTUK SEMUA
3. Standar kehidupan yang layak diukur dengan logaritma natural
NEGARA DISELURUH DUNIA
dari produk domestik bruto per kapita dalam paritasi daya beli.
Tujuan
Empat indikator Indeks Pembangunan Manusia
Untuk mengklasifikasikan apakah 1. Angka Harapan Hidup (AHH)

sebuah negara adalah negara maju, 2. Angka Melek Huruf (AMH)
negara berkembang atau negara 3. Rata-rata Lama Sekolah (RLS)
terbelakang
4. Kemampuan daya beli penduduk yaitu
Untuk mengukur pengaruh dari
kebijakan ekonomi terhadap kualitas
kemampuan masyarakat secara ekonomi
hidup dalam memenuhi kebutuhan konsumsinya
Ajeng Firyal - H5401211065
HASIL DAN
PEMBAHASAN
DATA PENELITIAN
Data Indikator IPM Provinsi Maluku Tahun 2014
STATISTIK DESKRIPTIF
Proses Pengelompokkan dengan Metode Non Hierarki
Pada statistik deskriptif ini

menunjukan bahwa semua
data lengkap yaitu angka IPM,
AHH, AMH, angka RLS, dan
angka PPK pada 11
kabupaten/kota di Provinsi
Maluku.
DATA QUICK CLUSTER

Hasil Output Data Quick Cluster
Output ini adalah tampilan

pertama proses clustering
data sebelum melakukan
iterasi. Output ini tidak akan
dianalisis karena nanti akan
dihasilkan proses clustering
sesudah iterasi yang justru
adalah hasil akhir cluster.
PROSES ITERASI
Proses iterasi dilakukan
sebanyak 2 kali
Jarak minimum antar
pusat cluster yang terjadi
adalah 3.460
PROSES ITERASI
Final Cluster Center
Berdasarkan output dapat diketahui

bahwa data tersebut masih terkait
dengan proses standarisasi yang
mengacu pada z-score dengan ketentuan
sebagai berikut:
1) Angka negatif (−) berarti data di bawah
rata-rata total.
2) Angka positif (+) berati di atas rata-rata
total.
ANOVA
Kolom cluster menunjukan besaran
between Cluster means, sedangkan
kolom error menunjukan besaran
within Cluster means sehingga nilai F
diperoleh dari:
𝐹 = 𝑏𝑒𝑡𝑤𝑒𝑒𝑛 𝑚𝑒𝑎𝑛𝑠 / 𝑤𝑖𝑡ℎ𝑖𝑛 𝑚𝑒𝑎𝑛s
Interprestasi angka F adalah semakin besar angka F suatu variabel dan angka
signifikansinya adalah 0,05, maka semakin besar pula perbedaan variabel tersebut pada
ketiga variabel.
JUMLAH ANGGOTA SETIAP CLUSTER

Data terbanyak ada pada cluster 2,
yaitu 6 kabupaten/kota.
Data sedang ada pada cluster 3, yaitu
4 kabupaten/kota.
Data paling sedikit ada pada cluster 1
yaitu 1 kabupaten/kota.
ANALISIS KOMPOSISI CLUSTER

Nilai distance adalah jarak terdekat antara data dengan pusat cluster, semakin
kecil berarti semakin mirip dengan cluster terkait.
Cluster 1 : Kota Ambon memiliki jarak ke pusat cluster 1 yaitu 0
Cluster 2 : Maluku Tenggara Barat, kep. Aru, Seram Bagian Barat, Seram
Bagian Timur, MBD, Buru Selatan memiliki jarak 1.095; 0.517; 1.092; 1.418; 0.624;
dan 1.486. Jarak Maluku Tenggara Barat dan Seram Barat ke pusat cluster 2
tidak berbeda jauh sehingga dapat disimpulkan memiliki karakteristik yang
mirip.
Cluster 3 : Maluku Tenggara, Maluku Tengah, Buru, Tual memiliki jarak 0.995;
1.036; 1.312; dan 1.237.
Cluster 1: Kota Ambon mempunyai angka IPM dan AHH sangat maksimal
(sangat banyak sedangkan jumlah AMH, angka RLS dan PPK berbanding
terbalik dengan angka IPM yaitu terjadi pada tahun 2014.
Cluster 2: MTB, Kepulaan Aru, SBB, SBT, MBD, dan Buru Selatan mempunyai
angka IPM, AHH, AMH, RLS, dan angka PPK sangat rendah terjadi pada tahun
2014.
Cluster 3: Maluku Tenggara, Maluku Tengah, Buru, Tual mempunyai angka
IPM, AHH, AMH, RLS, dan angka PPK sangat banyak terjadi pada tahun 2014.
KESIMPULAN
NOER RESKY JULIARTY - H5401211003
Angka IPM, AHH, AMH, RLS, dan PPK kurang terjadi di kab/kota Maluku pada tahun 2014.
Berdasarkan pengelompokkannya, terdapat 3 (tiga) cluster yang terbentuk, yakni:
Cluster 1 yaitu Kota Ambon dengan angka IPM sangat maksimal. Sedangkan jumlah AHH,
AMH, RLS, dan angka PPK sangat banyak terjadi.
Cluster 2 meliputi MTB, Kepulauan Aru, SBB, SBT, MBD, dan Buru Selatan mempunyai angka
IPM, AHH, AMH, RLS, dan PPK kurang terjadi.
Cluster 3 meliputi Maltra, Malteng, Buru, Tual, mempunyai angka IPM, AHH, AMH, RLS dan
angka PPK banyak terjadi.
THANK
YOU

Replikasi Jurnal Metode K Means

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Replikasi Jurnal Metode K Means

Diunggah oleh

Hak Cipta:

Format Tersedia

METODE KUANTITATIF

ANALISIS CLUSTER DENGAN MENGGUNAKAN METODE

NOER RESKY JULIARTY SALMA DARAPUSPITA AJENG FIRYAL

Pembangunan nasional Indonesia menempatkan rakyat sebagai titik sentral pembangunan.

Analisis Multivariat MATRIKS

Menurut Fadhli (2011), data dalam

KEY POINT analisis multivariat dapat dinyatakan

PROSES ANALISIS CLUSTER

Menetapkan ukuran jarak antar data

Melakukan validasi dan profiling

CIRI-CIRI ISTILAH PENTING

Metode C-Means Pendekatan Clustering

KEY POINT Membuat aturan yang mendikte

Dilakukan sebanyak p dimensi dari 𝑖 = 1 sampai

PEMBANGUNAN MORE DETAILS

KEY POINT pilihan yang dimiliki manusia.

INDEKS PEMBANGUNAN Tiga dimensi dasar pembangunan manusia

Untuk mengklasifikasikan apakah 1. Angka Harapan Hidup (AHH)

Pada statistik deskriptif ini

DATA QUICK CLUSTER

Output ini adalah tampilan

Berdasarkan output dapat diketahui

JUMLAH ANGGOTA SETIAP CLUSTER

ANALISIS KOMPOSISI CLUSTER

Anda mungkin juga menyukai