Muhammad Mustaghfirin - 24050117130058

PENERAPAN K-MEANS CLUSTER UNTUK PENGELOMPOKAN
KABUPATEN/KOTA DI JAWA TENGAH BERDASARKAN NILAI

STANDAR NASIONAL PENDIDIKAN (SNP)
Oleh :
Muhammad Mustaghfirin
(24050117130058)
1.1 Latar Belakang
Analisis Multivariat merupakan salah satu metode statistika yang tepat untuk
meringkas data dengan dengan peubah banyak dengan berbagai tujuan penelitian
yang beragam (Sitepu, 2011). Salah satu metode analisis multivariat yaitu
clustering. Menurut Webb (2002), Analisis Cluster digunakan untuk eksplorasi
data dan untuk menyediakan data untuk digunakan dalam pengclusteran. Analisis
Cluster adalah pengelompokan individu dalam suatu populasi untuk menemukan
struktur dalam data. K-means cluster merupakan salah satu algoritma dalam
analisis kluster yang dapat digunakan untuk mengelompokan data menjadi suatu
kelompok yang relative homogen.
Dalam mewujudkan pemerataan Pendidikan di Indonesia, pemerintah

khusunya kementerian Pendidikan dan kebudayaan menetapkan suatu standar
Pendidikan yang di sebut dengan Standar Nasional Pendidikan (SNP). Dalam PP
no. 32 tahun 2013 pasal 1 ayat 1, yang disebut SNP yaitu kriteria minimal tentang
sistem Pendidikan diseluruh wilayah hukum Negara Kesatuan Republik
Indonesia. Dimana pada pasal 2 ayat 1 dijelaskan bahwa SNP meliputi 8 lingkup
yaitu standar isi, standar proses, standar kompetensi lulusan, standar pendidik dan
tenaga kependidikan, standar sarana dan prasarana, standar pengelolaan, standar
pembiayaan dan standar penilaian Pendidikan.
Berdasarkan Undang Undang Nomor 20 tahun 2003 tentang Sistem

Pendidikan Nasional. Kementerian Pendidikan dan Kebudayaan menerapkan
penjaminan mutu pendidikan di satuan pendidikan dasar dan menengah. Dalam
Peraturan Menteri Pendidikan Nasional No. 63 tahun 2009 pasal 1 ayat 2
Penjaminan Mutu Pendidikan (PMP) adalah kegiatan sistemik, dan terpadu oleh
satuan atau program Pendidikan, penyelenggara satuan atau program pendidikan,
pemerintah daerah, pemerintah, dan masyarakat untuk menaikkan tingkat
kecerdasan kehidupan bangsa melalui Pendidikan. Dimana tujuan akhir
penjaminan mutu pendidikan adalah tingginya kecerdasan kehidupan manusia dan
bangsa sebagaimana dicita-citakan oleh pembukaan Undang-undang Dasar
Negara Republik Indonesia tahun 1945 yang dicapai melalui penerapan Sistem
Penjaminan Mutu Pendidikan(SPMP).
Dalam mengkategorikan sekolah atau kabupaten/kota berdaarkan hasil nilai

SNP, Lembaga Penjaminan Mutu Pendidikan menggunakan hasil rata-rata
keseluruhan. Dimana hasil tersebut dikategorikan ke dalam 5 kelompok yaitu
Belum SNP = Tahap 1, Belum SNP = Tahap 2, Belum SNP = Tahap 3, Belum
SNP = Tahap 4 dan SNP.
Berdasarkan uraian diatas, dalam penelitian ini akan dilakukan analisis

cluster pada nilai Standar Nasional Pendidikan (SNP) SMK di Provinsi Jawa
Tengah menggunakan analisis k-means cluster.
1.2 Rumusan Masalah
Dalam penelitian ini yang menjadi rumusan masalah yaitu

mengklasifikasikan kabupaten/kota berdasarkan nilai Standar Nasional
Pendidikan (SNP) jenjang SMK di Jawa Tengah menjadi 5 kelompok
pengkategorian oleh Lembaga Penjaminan Mutu Pendidikan (LPMP). K-means
cluster dapat digunakan untuk mengkelompokan suatu data menjadi beberapa
kelompok-kelompok yang relative sama atau homogen.
1.3 Batasan Masalah
Batasan masalah dalam penelitian ini yaitu :
1. Data yang digunakan adalah Nilai Standar Nasional Pendidikan (SNP)

pada Tahun 2020 pada jenjang SMK
1.4 Tujuan Penelitian
Tujuan dalam penelitian ini adalah menerapkan K-means cluster untuk

analisis klister kabupaten/kota dijawa tengah berdasarkan nilai Standar Nasional
Pendidikan (SNP) jenjang SMK di Jawa Tengah.
1.5 Manfaat Penelitian
Manfaat penelitian ini yaitu k-means cluster dapat mengelompokan nilai

Standar Nasional Pendidikan (SNP) jenjang SMK di jawa tengah menjadi 5
kelompok berdasarkan pengkategorian Lembaga penjaminan mutu Pendidikan
1.6 Tinjauan Pustaka
A. Standar Nasional Pendidikan
Standar Nasional Pendidikan (SNP) dalam PP no. 32 tahun 2013 pasal 1 ayat
1, yang disebut SNP yaitu kriteria minimal tentang sistem Pendidikan diseluruh
wilayah hukum Negara Kesatuan Republik Indonesia. Dimana pada pasal 2 ayat 1
dijelaskan bahwa SNP meliputi 8 lingkup yaitu standar isi, standar proses, standar
kompetensi lulusan, standar pendidik dan tenaga kependidikan, standar sarana dan
prasarana, standar pengelolaan, standar pembiayaan dan standar penilaian
Pendidikan.
Nilai Standar Nasional Pendidikan (SNP) didapat atas penilaian terhadap

sekolah-sekolah binaan yang dinilai oleh pengawas sekolah dimasing-masing
kabupaten/kota. Dimana pada masing-masing kabupaten/kota memiliki jumlah
sekolah binaan yang berbeda-beda. Dimana nilai tersebut didapat berdasarkan 8
sandar nasional Pendidikan dimana pada masing-masing standar terdiri dari
beberapa indikator-indikator dan setiap indikator terdiri dari beberapa sub-
indikator. Penilaian terhadap Standar Nasional Pendidikan (SNP) didapatkan
berdasarkan penilaian berdasarkan indikator dan sub-indikator pada masing-
masing standar yaitu :
Tabel 1. Standar/Indikator Nasional Pendidikan

Nomo Standar/Indikator
r
1 Standar Kompetensi Lulusan
2 Standar Isi
3 Standar Proses
4 Standar Penilaian Pendidikan
5 Standar Pendidik dan Tenaga Kependidikan
6 Standar Sarana dan Prasarana Pendidikan
7 Standar Pengelolaan Pendidikan
8 Standar Pembiayaan
Dari penilaian 8 standar indicator diatas, nantinya akan dirata-ratakan

menjadi 5 kategori yaitu :
Tabel 2. Pengkategorian SNP

NO CAPAIAN KATEGORI
1 0.000-0.2499 Belum SNP = Tahap 1
2 0.250-0.4999 Belum SNP = Tahap 2
3 0.500-0.7499 Belum SNP = Tahap 3
4 0.750-0.9999 Belum SNP = Tahap 4
5 1 SNP
B. Clustering
Clustering adalah metode penganalisaan data, yang sering dimasukkan

sebagai salah satu metode Data Mining, yang tujuannya adalah untuk
mengelompokkan data dengan karakteristik yang sama ke suatu ‘wilayah’ yang
sama dan data dengan karakteristik yang berbeda ke ‘wilayah’ yang lain.
Clustering memiliki dua pendekatan, Dua pendekatan utama adalah clustering

dengan pendekatan partisi dan clustering dengan pendekatan hirarki (Oliveira et
al, 2007). Clustering dengan pendekatan partisi atau sering disebut dengan
partition-based clustering mengelompokkan data dengan memilah-milah data
yang dianalisa ke dalam cluster-cluster yang ada. Clustering dengan pendekatan
hirarki atau sering disebut dengan hierarchical clustering adalah mengelompokkan
data dengan membuat suatu hirarki berupa dendogram dimana data yang mirip
akan ditempatkan pada hirarki yang berdekatan dan yang tidak pada hirarki yang
berjauhan. Di samping kedua pendekatan tersebut, ada juga clustering dengan
pendekatan automatic mapping (Self-Organising Map/SOM)
C. K-means Cluster
K-Means merupakan salah satu metode data clustering non hirarki yang
berusaha mempartisi data yang ada ke dalam bentuk satu atau lebih
cluster/kelompok. Metode ini mempartisi data ke dalam cluster/kelompok
sehingga data yang memiliki karakteristik yang sama dikelompokkan ke dalam
satu cluster yang sama dan data yang mempunyai karakteristik yang berbeda
dikelompokkan ke dalam kelompok yang lain. Adapun tujuan dari data clustering
ini adalah untuk meminimalisasikan objective function yang diset dalam proses
clustering, yang pada umumnya berusaha meminimalisasikan variasi di dalam
suatu cluster dan memaksimalisasikan variasi antar cluster.
1. Asumsi-asumsi K-means Cluster
Di dalam analisis cluster ada dua asumsi yang harus dipenuhi. Menurut Hair
et al. (2006) yaitu sampel yang representatif dan tidak terjadi multikolinearitas.
a. Sampel Mencerminkan Populasi (Representatif)
Untuk mengetahui apakah sampel yang diambil dapat mewakili populasi

yang ada dibutuhkan nilai Kaiser-Mayer-Olkin (KMO). Nilai KMO juga dapat
diperoleh dengan membandingkan besarnya koefisien korelasi terobservasi
dengan besarnya koefisien korelasi parsial. Sampel yang diambil tidak dapat
mewakili populasi yang ada jika nilai KMO kurang dari 0,5 (KMO<0,5) Berikut
ini adalah rumus KMO yang dirumuskan sebagai berikut (Widarjono,2010).
p p
∑ ∑ r ij 2
i=1 j=1
KMO= p p p p (2.1)
2 2
∑ ∑ r ij +∑ ∑ aij
i=1 j=1 i=1 j=1
dengan :
rij : koefisien korelasi terobservasi antara variabel i dan j
aij : koefisien korelasi parsial antara variabel i dan j
b. Asumsi Multikolinearitas
Menurut Hair, et al. (2006), multikolinearitas merupakan adanya hubungan
yang linier di antara variabel penelitian. Apabila terdapat variabel-variabel yang
mengalami multikolinearitas secara eksplisit dapat dipertimbangkan dengan lebih
seksama apakah sebaiknya dibuang atau diganti dengan variabel lain.
Untuk mendapatkan nilai VIF dapat dihitung dengan rumus sebagai berikut
1
VIF= (2.2)
1−R2
Dimana : VIF = Variance Inflation Factor
R2 = koefisien determinasi dari variabel bebas ke-i.
Dalam menentukan apakah terdapat multikolinieritas yaitu apabila Nilai

VIF dari suatu variabel memiliki nilai lebih dari 10, maka variabel tersebut
mengindikasikan terjadinya multikolinearitas. Apabila nilai VIF dibawah 10 maka
tidak terjadi multikolinieritas. Selain menggunakan nilai VIF, untuk mendeteksi
adanya multikolinieritas dapat menggunakan nilai korelasi. Menurut Gujarati
(2006) dengan melihat korelasi antar variabel bebas (Correlation Matrix), Suatu
data dapat dikatakan bebas dari multikolinieritas jika korelasi antarvariabel
independent atau berada pada interval -0,8≤correlation≤0,8. Korelasi Pearson
yaitu salah satu teknik yang dikembangkan oleh Karl Pearson untuk menghitung
koefisien korelasi. Rumus yang dikemukakan adalah sebagai berikut.
n n n
r xy =
N ∑ XiY i
i=1
( )(∑ )∑ Xi
i=1 i=1
Yi
2 2
(2.3)
√{
n n n n
N∑X
i=1
2
(∑ ) }{ ∑ (∑ ) }
i=1
X N
i=1
Y
2
i=1
Y
dengan:
r : koefisien korelasi r
Xi : nilai dalam distribusi variabel X ke-i
Yi : nilai dalam distribusi variabel Y ke-i
2. Tahapan analisis K-means cluster

a. Standarisasi Data
Proses standarisasi terhadap variabel penelitian perlu dilakukan sebelum

proses clustering, jika objek yang diteliti memiliki varian yang sangat berbeda
(Simamora,2005). Rumus standarisasi data adalah sebagai berikut.
xij  X j
Z ij 
sj
(2.4)
Dimana :
Zscore : harga yang dihitung dan menunjukkan nilai standar deviasi pada
distribusi normal
xij : nilai observasi populasi
Xj
: nilai rata-rata populasi
Sj : simpangan baku populasi (standar deviasi)
b. Proses Clustering
MacQueen menyarankan K-Means untuk menguraikan algoritma yang

menetapkan suatu obyek ke dalam suatu cluster yang mempunyai centroid
(mean) terdekat. Dalam prosedur pembentukan K-Means Cluster terdapat
langkah-langkah yang dapat dilakukan, antara lain:
1. Tentukan banyaknya klaster (k) yang akan dibentuk.
2. Bangkitkan k centroid awal (rata-rata setiap klaster).
3. Hitung jarak antara setiap objek dengan setiap centroid dan masukan
objek tersebut ke dalam klaster yang sesuai berdasarkan jarak terdekat.
4. Tentukan centroid dari klaster yang baru.
5. Ulangi langkah 3 dan 4 sampai tidak ada lagi pemindahan objek

antarklaster.
c. Pembuatan Profil dan Kesimpulan Tiap Cluster

Profiling merupakan langkah untuk menginterpretasikan karakterisitik
hasil analisis final cluster yang sudah terbentuk, meliputi pengkajian mengenai
centroid. Dimana nilai centroid memungkinkan untuk dilakukan penguraian
setiap kluster dan memberikan gambaran pada masing-masing kluster. Setelah
profil dibuat maka langkah selanjutnya adalah mengambil kesimpulan dan saran.
1.7 Hipotesis
Analisis menggunakan k-means cluster akan membrikan pengelompokan

yang baik untuk pengelompokan kabupaten/kota di Jawa Tengah berdasarkan nilai
standar nasional Pendidikan.
1.8 Metode Penelitian
1. Jenis dan Sumber Data
Jenis data yang digunakan untuk penelitian yaitu data Peta Mutu
Pendidikan (PMP) berdasarkan 8 nilai Standar Nasional Pendidikan (SNP)(SNP)
Provinsi Jawa Tengah tahun 2018 untuk Sekolah Menengah Kejuruan (SMK).
Data tersebut diperoleh dari rapor mutu pendidikan dasar dan menengah yang
dikeluarkan oleh bagian Seksi Pemetaaan Lembaga Penjaminan Mutu Pendidikan
Jawa Tengah
2. Variabel Penelitian
Variabel yang terdapat dalam penulisan laporan Praktik Kerja Lapangan

ini meliputi variabel respon dan variabel prediktor. Kabupaten/kota bertindak
sebagai variabel respon. Sedangkan variabel prediktornya meliputi Standar
Kompetensi Lulusan (X1), Standar Isi (X2), Standar Proses (X3), Standar Penilaian
Pendidikan (X4), Standar Pendidik dan Tenaga Kependidikan (X5), Standar Sarana
dan Prasarana Pendidikan (X6), Standar Pengelolaan Pendidikan (X7), dan Standar
Pembiayaan (X8).
3. Metode Analisis
Metode analisis data yang digunakan dalam penelitian untuk

mengelompokkan niali SNP yaitu clustering dengan metode K-means cluster.
Pengolahan data dilakukan dengan software SPSS 16 for Windows. Langkah-
langkah dalam analisis data adalah sebagai berikut.
1. Memilih variabel indikator;
1. Melakukan standarisasi terhadap variabel indikator;
2. Uji asumsi sampel mewakili populasi dengan menggunakan uji KMO;
3. Uji Multikolinearitas dengan menggunakan uji Variance Inflation Factor (VIF)
4. Melakukan analisis cluster dengan metode K-Means Clustering; dan
5. Melakukan profiling cluster
6. Mengambil kesimpulan masing-masing cluster.
4. Diagram Alir (Flowchart)
Berikut ini adalah diagram alir dari prosedur analisis K-Means Cluster.
Gambar 3.1 Flowchart ( Diagram Alir )
1.9 Daftar Pustaka
Fathia, N. A., Rahmawati. R., Tarno. 2016. Analisis Klaster Kecamatan di

Kabupaten Semarang Berdasarkan Potensi Desa Menggunakan Metode
Ward dan Singel Linkage. Jurnal Gaussian vol.5 No 4 : hal. 801-810.
Safitri, D., Widiharih. T., Wilandari. Y., Saputra. A. H. 2020. Analisis Cluster
pada Kabupaten/Kota di Jawa Tengah Berdasarkan Produksi Palawija.
Media
Gujarati, D. 1978. Ekonometrika Dasar. Terjemahan oleh Sumarno Zein. Jakarta.

Erlangga.
Peraturan Pemerintah Republik Indonesia Nomor 32 Tahun 2013 Tentang

Perubahan Atas Peraturan Pemerintah Nomor 19 Tahun 2005 Tentang
Standar Nasional Pendidikan.
Widarjono, A. 2010. Analisis Statistika Multivariat Terapan. Edisi pertama.

Yogyakarta : UPP STIM YKPN.

Muhammad Mustaghfirin - 24050117130058

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Muhammad Mustaghfirin - 24050117130058

Diunggah oleh

Hak Cipta:

Format Tersedia

PENERAPAN K-MEANS CLUSTER UNTUK PENGELOMPOKAN

KABUPATEN/KOTA DI JAWA TENGAH BERDASARKAN NILAI

Dalam mewujudkan pemerataan Pendidikan di Indonesia, pemerintah

Berdasarkan Undang Undang Nomor 20 tahun 2003 tentang Sistem

Dalam mengkategorikan sekolah atau kabupaten/kota berdaarkan hasil nilai

Berdasarkan uraian diatas, dalam penelitian ini akan dilakukan analisis

1.2 Rumusan Masalah

Dalam penelitian ini yang menjadi rumusan masalah yaitu

1.3 Batasan Masalah

Batasan masalah dalam penelitian ini yaitu :

1. Data yang digunakan adalah Nilai Standar Nasional Pendidikan (SNP)

Tujuan dalam penelitian ini adalah menerapkan K-means cluster untuk

Manfaat penelitian ini yaitu k-means cluster dapat mengelompokan nilai

1.6 Tinjauan Pustaka

A. Standar Nasional Pendidikan

Nilai Standar Nasional Pendidikan (SNP) didapat atas penilaian terhadap

Tabel 1. Standar/Indikator Nasional Pendidikan

Dari penilaian 8 standar indicator diatas, nantinya akan dirata-ratakan

Tabel 2. Pengkategorian SNP

Clustering adalah metode penganalisaan data, yang sering dimasukkan

Clustering memiliki dua pendekatan, Dua pendekatan utama adalah clustering

1. Asumsi-asumsi K-means Cluster

a. Sampel Mencerminkan Populasi (Representatif)

Untuk mengetahui apakah sampel yang diambil dapat mewakili populasi

rij : koefisien korelasi terobservasi antara variabel i dan j

aij : koefisien korelasi parsial antara variabel i dan j

Dimana : VIF = Variance Inflation Factor

R2 = koefisien determinasi dari variabel bebas ke-i.

Dalam menentukan apakah terdapat multikolinieritas yaitu apabila Nilai

Xi : nilai dalam distribusi variabel X ke-i

Yi : nilai dalam distribusi variabel Y ke-i

2. Tahapan analisis K-means cluster

Proses standarisasi terhadap variabel penelitian perlu dilakukan sebelum

xij : nilai observasi populasi

Sj : simpangan baku populasi (standar deviasi)

MacQueen menyarankan K-Means untuk menguraikan algoritma yang

1. Tentukan banyaknya klaster (k) yang akan dibentuk.

2. Bangkitkan k centroid awal (rata-rata setiap klaster).

4. Tentukan centroid dari klaster yang baru.

5. Ulangi langkah 3 dan 4 sampai tidak ada lagi pemindahan objek

c. Pembuatan Profil dan Kesimpulan Tiap Cluster

Analisis menggunakan k-means cluster akan membrikan pengelompokan

1.8 Metode Penelitian

1. Jenis dan Sumber Data

Variabel yang terdapat dalam penulisan laporan Praktik Kerja Lapangan

Metode analisis data yang digunakan dalam penelitian untuk

1. Memilih variabel indikator;

1. Melakukan standarisasi terhadap variabel indikator;

2. Uji asumsi sampel mewakili populasi dengan menggunakan uji KMO;

3. Uji Multikolinearitas dengan menggunakan uji Variance Inflation Factor (VIF)

4. Melakukan analisis cluster dengan metode K-Means Clustering; dan

5. Melakukan profiling cluster

6. Mengambil kesimpulan masing-masing cluster.

4. Diagram Alir (Flowchart)

1.9 Daftar Pustaka

Fathia, N. A., Rahmawati. R., Tarno. 2016. Analisis Klaster Kecamatan di

Gujarati, D. 1978. Ekonometrika Dasar. Terjemahan oleh Sumarno Zein. Jakarta.

Peraturan Pemerintah Republik Indonesia Nomor 32 Tahun 2013 Tentang

Widarjono, A. 2010. Analisis Statistika Multivariat Terapan. Edisi pertama.

Anda mungkin juga menyukai