Oleh :
Muhammad Mustaghfirin
(24050117130058)
1.1 Latar Belakang
Analisis Multivariat merupakan salah satu metode statistika yang tepat untuk
meringkas data dengan dengan peubah banyak dengan berbagai tujuan penelitian
yang beragam (Sitepu, 2011). Salah satu metode analisis multivariat yaitu
clustering. Menurut Webb (2002), Analisis Cluster digunakan untuk eksplorasi
data dan untuk menyediakan data untuk digunakan dalam pengclusteran. Analisis
Cluster adalah pengelompokan individu dalam suatu populasi untuk menemukan
struktur dalam data. K-means cluster merupakan salah satu algoritma dalam
analisis kluster yang dapat digunakan untuk mengelompokan data menjadi suatu
kelompok yang relative homogen.
Standar Nasional Pendidikan (SNP) dalam PP no. 32 tahun 2013 pasal 1 ayat
1, yang disebut SNP yaitu kriteria minimal tentang sistem Pendidikan diseluruh
wilayah hukum Negara Kesatuan Republik Indonesia. Dimana pada pasal 2 ayat 1
dijelaskan bahwa SNP meliputi 8 lingkup yaitu standar isi, standar proses, standar
kompetensi lulusan, standar pendidik dan tenaga kependidikan, standar sarana dan
prasarana, standar pengelolaan, standar pembiayaan dan standar penilaian
Pendidikan.
B. Clustering
K-Means merupakan salah satu metode data clustering non hirarki yang
berusaha mempartisi data yang ada ke dalam bentuk satu atau lebih
cluster/kelompok. Metode ini mempartisi data ke dalam cluster/kelompok
sehingga data yang memiliki karakteristik yang sama dikelompokkan ke dalam
satu cluster yang sama dan data yang mempunyai karakteristik yang berbeda
dikelompokkan ke dalam kelompok yang lain. Adapun tujuan dari data clustering
ini adalah untuk meminimalisasikan objective function yang diset dalam proses
clustering, yang pada umumnya berusaha meminimalisasikan variasi di dalam
suatu cluster dan memaksimalisasikan variasi antar cluster.
Di dalam analisis cluster ada dua asumsi yang harus dipenuhi. Menurut Hair
et al. (2006) yaitu sampel yang representatif dan tidak terjadi multikolinearitas.
p p
∑ ∑ r ij 2
i=1 j=1
KMO= p p p p (2.1)
2 2
∑ ∑ r ij +∑ ∑ aij
i=1 j=1 i=1 j=1
dengan :
b. Asumsi Multikolinearitas
Menurut Hair, et al. (2006), multikolinearitas merupakan adanya hubungan
yang linier di antara variabel penelitian. Apabila terdapat variabel-variabel yang
mengalami multikolinearitas secara eksplisit dapat dipertimbangkan dengan lebih
seksama apakah sebaiknya dibuang atau diganti dengan variabel lain.
Untuk mendapatkan nilai VIF dapat dihitung dengan rumus sebagai berikut
1
VIF= (2.2)
1−R2
n n n
r xy =
N ∑ XiY i
i=1
( )(∑ )∑ Xi
i=1 i=1
Yi
2 2
(2.3)
√{
n n n n
N∑X
i=1
2
(∑ ) }{ ∑ (∑ ) }
i=1
X N
i=1
Y
2
i=1
Y
dengan:
r : koefisien korelasi r
xij X j
Z ij
sj
(2.4)
Dimana :
Zscore : harga yang dihitung dan menunjukkan nilai standar deviasi pada
distribusi normal
Xj
: nilai rata-rata populasi
b. Proses Clustering
3. Hitung jarak antara setiap objek dengan setiap centroid dan masukan
objek tersebut ke dalam klaster yang sesuai berdasarkan jarak terdekat.
1.7 Hipotesis
Jenis data yang digunakan untuk penelitian yaitu data Peta Mutu
Pendidikan (PMP) berdasarkan 8 nilai Standar Nasional Pendidikan (SNP)(SNP)
Provinsi Jawa Tengah tahun 2018 untuk Sekolah Menengah Kejuruan (SMK).
Data tersebut diperoleh dari rapor mutu pendidikan dasar dan menengah yang
dikeluarkan oleh bagian Seksi Pemetaaan Lembaga Penjaminan Mutu Pendidikan
Jawa Tengah
2. Variabel Penelitian
3. Metode Analisis
Berikut ini adalah diagram alir dari prosedur analisis K-Means Cluster.
Gambar 3.1 Flowchart ( Diagram Alir )
Safitri, D., Widiharih. T., Wilandari. Y., Saputra. A. H. 2020. Analisis Cluster
pada Kabupaten/Kota di Jawa Tengah Berdasarkan Produksi Palawija.
Media