Anda di halaman 1dari 10

PENERAPAN K-MEANS CLUSTER UNTUK PENGELOMPOKAN

KABUPATEN/KOTA DI JAWA TENGAH BERDASARKAN NILAI


STANDAR NASIONAL PENDIDIKAN (SNP)

Oleh :
Muhammad Mustaghfirin
(24050117130058)
1.1 Latar Belakang

Analisis Multivariat merupakan salah satu metode statistika yang tepat untuk
meringkas data dengan dengan peubah banyak dengan berbagai tujuan penelitian
yang beragam (Sitepu, 2011). Salah satu metode analisis multivariat yaitu
clustering. Menurut Webb (2002), Analisis Cluster digunakan untuk eksplorasi
data dan untuk menyediakan data untuk digunakan dalam pengclusteran. Analisis
Cluster adalah pengelompokan individu dalam suatu populasi untuk menemukan
struktur dalam data. K-means cluster merupakan salah satu algoritma dalam
analisis kluster yang dapat digunakan untuk mengelompokan data menjadi suatu
kelompok yang relative homogen.

Dalam mewujudkan pemerataan Pendidikan di Indonesia, pemerintah


khusunya kementerian Pendidikan dan kebudayaan menetapkan suatu standar
Pendidikan yang di sebut dengan Standar Nasional Pendidikan (SNP). Dalam PP
no. 32 tahun 2013 pasal 1 ayat 1, yang disebut SNP yaitu kriteria minimal tentang
sistem Pendidikan diseluruh wilayah hukum Negara Kesatuan Republik
Indonesia. Dimana pada pasal 2 ayat 1 dijelaskan bahwa SNP meliputi 8 lingkup
yaitu standar isi, standar proses, standar kompetensi lulusan, standar pendidik dan
tenaga kependidikan, standar sarana dan prasarana, standar pengelolaan, standar
pembiayaan dan standar penilaian Pendidikan.

Berdasarkan Undang Undang Nomor 20 tahun 2003 tentang Sistem


Pendidikan Nasional. Kementerian Pendidikan dan Kebudayaan menerapkan
penjaminan mutu pendidikan di satuan pendidikan dasar dan menengah. Dalam
Peraturan Menteri Pendidikan Nasional No. 63 tahun 2009 pasal 1 ayat 2
Penjaminan Mutu Pendidikan (PMP) adalah kegiatan sistemik, dan terpadu oleh
satuan atau program Pendidikan, penyelenggara satuan atau program pendidikan,
pemerintah daerah, pemerintah, dan masyarakat untuk menaikkan tingkat
kecerdasan kehidupan bangsa melalui Pendidikan. Dimana tujuan akhir
penjaminan mutu pendidikan adalah tingginya kecerdasan kehidupan manusia dan
bangsa sebagaimana dicita-citakan oleh pembukaan Undang-undang Dasar
Negara Republik Indonesia tahun 1945 yang dicapai melalui penerapan Sistem
Penjaminan Mutu Pendidikan(SPMP).

Dalam mengkategorikan sekolah atau kabupaten/kota berdaarkan hasil nilai


SNP, Lembaga Penjaminan Mutu Pendidikan menggunakan hasil rata-rata
keseluruhan. Dimana hasil tersebut dikategorikan ke dalam 5 kelompok yaitu
Belum SNP = Tahap 1, Belum SNP = Tahap 2, Belum SNP = Tahap 3, Belum
SNP = Tahap 4 dan SNP.

Berdasarkan uraian diatas, dalam penelitian ini akan dilakukan analisis


cluster pada nilai Standar Nasional Pendidikan (SNP) SMK di Provinsi Jawa
Tengah menggunakan analisis k-means cluster.

1.2 Rumusan Masalah

Dalam penelitian ini yang menjadi rumusan masalah yaitu


mengklasifikasikan kabupaten/kota berdasarkan nilai Standar Nasional
Pendidikan (SNP) jenjang SMK di Jawa Tengah menjadi 5 kelompok
pengkategorian oleh Lembaga Penjaminan Mutu Pendidikan (LPMP). K-means
cluster dapat digunakan untuk mengkelompokan suatu data menjadi beberapa
kelompok-kelompok yang relative sama atau homogen.

1.3 Batasan Masalah

Batasan masalah dalam penelitian ini yaitu :

1. Data yang digunakan adalah Nilai Standar Nasional Pendidikan (SNP)


pada Tahun 2020 pada jenjang SMK
1.4 Tujuan Penelitian

Tujuan dalam penelitian ini adalah menerapkan K-means cluster untuk


analisis klister kabupaten/kota dijawa tengah berdasarkan nilai Standar Nasional
Pendidikan (SNP) jenjang SMK di Jawa Tengah.
1.5 Manfaat Penelitian

Manfaat penelitian ini yaitu k-means cluster dapat mengelompokan nilai


Standar Nasional Pendidikan (SNP) jenjang SMK di jawa tengah menjadi 5
kelompok berdasarkan pengkategorian Lembaga penjaminan mutu Pendidikan

1.6 Tinjauan Pustaka

A. Standar Nasional Pendidikan

Standar Nasional Pendidikan (SNP) dalam PP no. 32 tahun 2013 pasal 1 ayat
1, yang disebut SNP yaitu kriteria minimal tentang sistem Pendidikan diseluruh
wilayah hukum Negara Kesatuan Republik Indonesia. Dimana pada pasal 2 ayat 1
dijelaskan bahwa SNP meliputi 8 lingkup yaitu standar isi, standar proses, standar
kompetensi lulusan, standar pendidik dan tenaga kependidikan, standar sarana dan
prasarana, standar pengelolaan, standar pembiayaan dan standar penilaian
Pendidikan.

Nilai Standar Nasional Pendidikan (SNP) didapat atas penilaian terhadap


sekolah-sekolah binaan yang dinilai oleh pengawas sekolah dimasing-masing
kabupaten/kota. Dimana pada masing-masing kabupaten/kota memiliki jumlah
sekolah binaan yang berbeda-beda. Dimana nilai tersebut didapat berdasarkan 8
sandar nasional Pendidikan dimana pada masing-masing standar terdiri dari
beberapa indikator-indikator dan setiap indikator terdiri dari beberapa sub-
indikator. Penilaian terhadap Standar Nasional Pendidikan (SNP) didapatkan
berdasarkan penilaian berdasarkan indikator dan sub-indikator pada masing-
masing standar yaitu :

Tabel 1. Standar/Indikator Nasional Pendidikan


Nomo Standar/Indikator
r
1 Standar Kompetensi Lulusan
2 Standar Isi
3 Standar Proses
4 Standar Penilaian Pendidikan
5 Standar Pendidik dan Tenaga Kependidikan
6 Standar Sarana dan Prasarana Pendidikan
7 Standar Pengelolaan Pendidikan
8 Standar Pembiayaan

Dari penilaian 8 standar indicator diatas, nantinya akan dirata-ratakan


menjadi 5 kategori yaitu :

Tabel 2. Pengkategorian SNP


NO CAPAIAN KATEGORI
1 0.000-0.2499 Belum SNP = Tahap 1
2 0.250-0.4999 Belum SNP = Tahap 2
3 0.500-0.7499 Belum SNP = Tahap 3
4 0.750-0.9999 Belum SNP = Tahap 4
5 1 SNP

B. Clustering

Clustering adalah metode penganalisaan data, yang sering dimasukkan


sebagai salah satu metode Data Mining, yang tujuannya adalah untuk
mengelompokkan data dengan karakteristik yang sama ke suatu ‘wilayah’ yang
sama dan data dengan karakteristik yang berbeda ke ‘wilayah’ yang lain.

Clustering memiliki dua pendekatan, Dua pendekatan utama adalah clustering


dengan pendekatan partisi dan clustering dengan pendekatan hirarki (Oliveira et
al, 2007). Clustering dengan pendekatan partisi atau sering disebut dengan
partition-based clustering mengelompokkan data dengan memilah-milah data
yang dianalisa ke dalam cluster-cluster yang ada. Clustering dengan pendekatan
hirarki atau sering disebut dengan hierarchical clustering adalah mengelompokkan
data dengan membuat suatu hirarki berupa dendogram dimana data yang mirip
akan ditempatkan pada hirarki yang berdekatan dan yang tidak pada hirarki yang
berjauhan. Di samping kedua pendekatan tersebut, ada juga clustering dengan
pendekatan automatic mapping (Self-Organising Map/SOM)
C. K-means Cluster

K-Means merupakan salah satu metode data clustering non hirarki yang
berusaha mempartisi data yang ada ke dalam bentuk satu atau lebih
cluster/kelompok. Metode ini mempartisi data ke dalam cluster/kelompok
sehingga data yang memiliki karakteristik yang sama dikelompokkan ke dalam
satu cluster yang sama dan data yang mempunyai karakteristik yang berbeda
dikelompokkan ke dalam kelompok yang lain. Adapun tujuan dari data clustering
ini adalah untuk meminimalisasikan objective function yang diset dalam proses
clustering, yang pada umumnya berusaha meminimalisasikan variasi di dalam
suatu cluster dan memaksimalisasikan variasi antar cluster.

1. Asumsi-asumsi K-means Cluster

Di dalam analisis cluster ada dua asumsi yang harus dipenuhi. Menurut Hair
et al. (2006) yaitu sampel yang representatif dan tidak terjadi multikolinearitas.

a. Sampel Mencerminkan Populasi (Representatif)

Untuk mengetahui apakah sampel yang diambil dapat mewakili populasi


yang ada dibutuhkan nilai Kaiser-Mayer-Olkin (KMO). Nilai KMO juga dapat
diperoleh dengan membandingkan besarnya koefisien korelasi terobservasi
dengan besarnya koefisien korelasi parsial. Sampel yang diambil tidak dapat
mewakili populasi yang ada jika nilai KMO kurang dari 0,5 (KMO<0,5) Berikut
ini adalah rumus KMO yang dirumuskan sebagai berikut (Widarjono,2010).

p p

∑ ∑ r ij 2
i=1 j=1
KMO= p p p p (2.1)
2 2
∑ ∑ r ij +∑ ∑ aij
i=1 j=1 i=1 j=1

dengan :

rij : koefisien korelasi terobservasi antara variabel i dan j

aij : koefisien korelasi parsial antara variabel i dan j

b. Asumsi Multikolinearitas
Menurut Hair, et al. (2006), multikolinearitas merupakan adanya hubungan
yang linier di antara variabel penelitian. Apabila terdapat variabel-variabel yang
mengalami multikolinearitas secara eksplisit dapat dipertimbangkan dengan lebih
seksama apakah sebaiknya dibuang atau diganti dengan variabel lain.

Untuk mendapatkan nilai VIF dapat dihitung dengan rumus sebagai berikut

1
VIF= (2.2)
1−R2

Dimana : VIF = Variance Inflation Factor

R2 = koefisien determinasi dari variabel bebas ke-i.

Dalam menentukan apakah terdapat multikolinieritas yaitu apabila Nilai


VIF dari suatu variabel memiliki nilai lebih dari 10, maka variabel tersebut
mengindikasikan terjadinya multikolinearitas. Apabila nilai VIF dibawah 10 maka
tidak terjadi multikolinieritas. Selain menggunakan nilai VIF, untuk mendeteksi
adanya multikolinieritas dapat menggunakan nilai korelasi. Menurut Gujarati
(2006) dengan melihat korelasi antar variabel bebas (Correlation Matrix), Suatu
data dapat dikatakan bebas dari multikolinieritas jika korelasi antarvariabel
independent atau berada pada interval -0,8≤correlation≤0,8. Korelasi Pearson
yaitu salah satu teknik yang dikembangkan oleh Karl Pearson untuk menghitung
koefisien korelasi. Rumus yang dikemukakan adalah sebagai berikut.

n n n

r xy =
N ∑ XiY i
i=1
( )(∑ )∑ Xi
i=1 i=1
Yi

2 2
(2.3)

√{
n n n n
N∑X
i=1
2
(∑ ) }{ ∑ (∑ ) }
i=1
X N
i=1
Y
2

i=1
Y

dengan:

r : koefisien korelasi r

Xi : nilai dalam distribusi variabel X ke-i

Yi : nilai dalam distribusi variabel Y ke-i

2. Tahapan analisis K-means cluster


a. Standarisasi Data

Proses standarisasi terhadap variabel penelitian perlu dilakukan sebelum


proses clustering, jika objek yang diteliti memiliki varian yang sangat berbeda
(Simamora,2005). Rumus standarisasi data adalah sebagai berikut.

xij  X j
Z ij 
sj
(2.4)

Dimana :

Zscore : harga yang dihitung dan menunjukkan nilai standar deviasi pada
distribusi normal

xij : nilai observasi populasi

Xj
: nilai rata-rata populasi

Sj : simpangan baku populasi (standar deviasi)

b. Proses Clustering

MacQueen menyarankan K-Means untuk menguraikan algoritma yang


menetapkan suatu obyek ke dalam suatu cluster yang mempunyai centroid
(mean) terdekat. Dalam prosedur pembentukan K-Means Cluster terdapat
langkah-langkah yang dapat dilakukan, antara lain:

1. Tentukan banyaknya klaster (k) yang akan dibentuk.

2. Bangkitkan k centroid awal (rata-rata setiap klaster).

3. Hitung jarak antara setiap objek dengan setiap centroid dan masukan
objek tersebut ke dalam klaster yang sesuai berdasarkan jarak terdekat.

4. Tentukan centroid dari klaster yang baru.

5. Ulangi langkah 3 dan 4 sampai tidak ada lagi pemindahan objek


antarklaster.

c. Pembuatan Profil dan Kesimpulan Tiap Cluster


Profiling merupakan langkah untuk menginterpretasikan karakterisitik
hasil analisis final cluster yang sudah terbentuk, meliputi pengkajian mengenai
centroid. Dimana nilai centroid memungkinkan untuk dilakukan penguraian
setiap kluster dan memberikan gambaran pada masing-masing kluster. Setelah
profil dibuat maka langkah selanjutnya adalah mengambil kesimpulan dan saran.

1.7 Hipotesis

Analisis menggunakan k-means cluster akan membrikan pengelompokan


yang baik untuk pengelompokan kabupaten/kota di Jawa Tengah berdasarkan nilai
standar nasional Pendidikan.

1.8 Metode Penelitian

1. Jenis dan Sumber Data

Jenis data yang digunakan untuk penelitian yaitu data Peta Mutu
Pendidikan (PMP) berdasarkan 8 nilai Standar Nasional Pendidikan (SNP)(SNP)
Provinsi Jawa Tengah tahun 2018 untuk Sekolah Menengah Kejuruan (SMK).
Data tersebut diperoleh dari rapor mutu pendidikan dasar dan menengah yang
dikeluarkan oleh bagian Seksi Pemetaaan Lembaga Penjaminan Mutu Pendidikan
Jawa Tengah

2. Variabel Penelitian

Variabel yang terdapat dalam penulisan laporan Praktik Kerja Lapangan


ini meliputi variabel respon dan variabel prediktor. Kabupaten/kota bertindak
sebagai variabel respon. Sedangkan variabel prediktornya meliputi Standar
Kompetensi Lulusan (X1), Standar Isi (X2), Standar Proses (X3), Standar Penilaian
Pendidikan (X4), Standar Pendidik dan Tenaga Kependidikan (X5), Standar Sarana
dan Prasarana Pendidikan (X6), Standar Pengelolaan Pendidikan (X7), dan Standar
Pembiayaan (X8).

3. Metode Analisis

Metode analisis data yang digunakan dalam penelitian untuk


mengelompokkan niali SNP yaitu clustering dengan metode K-means cluster.
Pengolahan data dilakukan dengan software SPSS 16 for Windows. Langkah-
langkah dalam analisis data adalah sebagai berikut.

1. Memilih variabel indikator;

1. Melakukan standarisasi terhadap variabel indikator;

2. Uji asumsi sampel mewakili populasi dengan menggunakan uji KMO;

3. Uji Multikolinearitas dengan menggunakan uji Variance Inflation Factor (VIF)

4. Melakukan analisis cluster dengan metode K-Means Clustering; dan

5. Melakukan profiling cluster

6. Mengambil kesimpulan masing-masing cluster.

4. Diagram Alir (Flowchart)

Berikut ini adalah diagram alir dari prosedur analisis K-Means Cluster.
Gambar 3.1 Flowchart ( Diagram Alir )

1.9 Daftar Pustaka

Fathia, N. A., Rahmawati. R., Tarno. 2016. Analisis Klaster Kecamatan di


Kabupaten Semarang Berdasarkan Potensi Desa Menggunakan Metode
Ward dan Singel Linkage. Jurnal Gaussian vol.5 No 4 : hal. 801-810.

Safitri, D., Widiharih. T., Wilandari. Y., Saputra. A. H. 2020. Analisis Cluster
pada Kabupaten/Kota di Jawa Tengah Berdasarkan Produksi Palawija.
Media

Gujarati, D. 1978. Ekonometrika Dasar. Terjemahan oleh Sumarno Zein. Jakarta.


Erlangga.

Peraturan Pemerintah Republik Indonesia Nomor 32 Tahun 2013 Tentang


Perubahan Atas Peraturan Pemerintah Nomor 19 Tahun 2005 Tentang
Standar Nasional Pendidikan.

Widarjono, A. 2010. Analisis Statistika Multivariat Terapan. Edisi pertama.


Yogyakarta : UPP STIM YKPN.

Anda mungkin juga menyukai