Anda di halaman 1dari 13

1

HIERARCHICAL CLUSTERING VIA MINIMAX LINKAGE PADA


PENGELOMPOKKAN KECAMATAN DI PULAU MADURA
BERDASARKAN INDIKATOR PEMERATAAN PENDIDIKAN
Padmi Ganifandari
1
, Dwiatmono Agus W.
2
1
Mahasiswa Jurusan Statistika FMIPA-ITS,
2
Dosen Jurusan Statistika FMIPA-ITS,
Abstrak
Pulau Madura secara geografis sangat strategis berada di antara Laut Jawa dan Selat
Madura yang menyimpan banyak potensi. Madura terdiri dari empat kabupaten, yaitu
Bangkalan, Sampang, Pamekasan dan Sumenep. Pendidikan sangat berpengaruh terhadap
kemajuan suatu daerah dan pemerataan pendidikan sangat diperlukan karena dapat
meningkatkan kesejahteraan masyarakat secara merata. Hal ini mendorong penelitian-
penelitian mengenai pemerataan pendidikan semakin dikembangkan, salah satunya dalam hal
pengelompokkan kecamatan berdasarkan indikator pemerataan pendidikan. Pengelompokkan
kecamatan penting dilakukan dalam rangka membantu pihak terkait membuat perencanaan dan
kebijakan yang sesuai, Pada penelitian ini digunakan metode single, complete, average, dan
minimax linkage, kemudian dilakukan perbandingan antara keempat metode tersebut. Hasil
analisis data indikator pemerataan pendidikan di kecamatan-kecamatan pulau Madura
menunjukkan bahwa metode minimax linkage merupakan metode pengelompokkan terbaik
dengan jumlah kelompok optimum sebanyak 3.
Kata kunci : minimax linkage, pemerataan pendidikan, Madura
1. Pendahuluan
Jembatan Suramadu adalah jembatan yang melintasi Selat Madura, menghubungkan Pulau
Jawa (di Surabaya) dan Pulau Madura (di Bangkalan, tepatnya timur Kamal). Menurut Keputusan
Presiden Nomor 79 Tahun 2003 tentang tujuan dibangunnya jembatan Suramadu adalah untuk lebih
meningkatkan pembangunan di Pulau Madura, sebagai upaya dalam memacu perluasan kawasan
industri, perumahan, dan sektor lainnya, serta mendorong pertumbuhan ekonomi masyarakat dengan
menghubungkan Pulau Jawa dan Madura. Tujuan tersebut dapat tercapai jika terdapat sumber daya
manusia (SDM) yang kreatif dan memiliki tingkat pendidikan yang optimal. Tingkat pendidikan warga
Madura selama kurun waktu sampai sekarang ini, merupakan salah satu indikator penting akan
ketersediaan sumber daya manusia (SDM) lokal yang handal. Oleh karena itu, pemerataan pendidikan
sangat diperlukan karena dapat meningkatkan kesejahteraan masyarakat secara merata. Hal ini
mendorong penelitian-penelitian mengenai pemerataan pendidikan semakin dikembangkan, salah
satunya dalam hal pengelompokkan kecamatan berdasarkan indikator pemerataan pendidikan.
Pengelompokkan kecamatan penting dilakukan dalam rangka membantu pihak terkait membuat
perencanaan dan kebijakan yang sesuai, khususnya untuk kecamatan di pulau Madura. Upaya
pengelompokkan ini diharapkan mampu menggabungkan kecamatan yang memiliki kesamaan pada
beberapa indikator pemerataan pendidikan.
Metode pengelompokkan yang biasa digunakan pada hierarchical clustering yaitu single
linkage, complete linkage, average linkage, dan sebagainya. Namun pada tahun 2011, Jacob Bien dan
Robert Tibshirani memperkenalkan metode hierarchical clustering via minimax linkage. Minimax
linkage memiliki beberapa kelebihan, salah satunya yaitu robust terhadap gangguan berupa outlier.
Untuk mendapatkan hasil pengelompokkan yang baik, penelitian ini melakukannya pada beberapa
metode hierarchical clustering, kemudian dipilih hasil yang terbaik. Dengan adanya penelitian ini
diharapkan mampu menunjukkan kelompok-kelompok kecamatan dan permasalahan-
permasalahannya yang perlu mendapatkan perhatian dalam upaya pemerataan pendidikan dan
diharapkan dapat membantu pemerintah dalam mengambil suatu kebijakan tentang pendidikan. Tujuan
pada penelitian ini antara lain, mendapatkan karakteristik kecamatan dengan analisis statistika
deskriptif, membandingkan hasil pengelompokkan kecamatan dengan metode hierarchical clustering
dengan single linkage, complete linkage, average linkage, dan minimax linkage dan mendapatkan
2
kecamatan yang berkelompok dan menganalisis kaerakteristik kecamatan berdasarkan hasil
pengelompokkan terbaik, dan mengelompokkan kecamatan di tiap kabupaten dengan metode minimax
linkage.
2. Tinjauan Pustaka
Untuk menyelesaikan permasalahan dalam penelitian ini, perlu adanya pendalaman teori yang
akan diuraikan sebagai berikut.
2.1 Analisis Faktor
Uji asumsi yang digunakan sebelum melakukan analisis faktor yaitu pengujian kecukupan data
dan uji korelasi antar variabel. Secara statistik pengujian kecukupan data atau sampel dapat
diidentifikasi melalui nilai Kaiser-Meyer-Olkin (KMO) dan Measure of Sampling Adequency (MSA).
Hipotesis dari KMO adalah sebagai berikut :
H
0
: Jumlah data cukup untuk difaktorkan
H
1
: Jumlah data tidak cukup untuk difaktorkan
Statistik uji :
KMO =

p
1 i
p
1 i
p
1 j
2
ij
p
1 j
2
ij
p
1 i
p
1 j
2
ij
a r
r
MSA =


= =
=
+
p
j
ij
p
j
ij
p
j
ij
a r
r
1
2
1
2
1
2
(1)
Dimana :
i = 1, 2, 3, ..., p dan j = 1, 2, ..., p serta i j
r
ij
= Koefisien korelasi antara variabel i dan j
a
ij
= Koefisien korelasi parsial antara variabel i dan j
Jika nilai KMO dan MSA > 0,5 maka data cukup untuk difaktorkan. Secara umum data yang
dapat digunakan untuk analisis faktor yaitu sampel data pengamatan yang digunakan harus melebihi
jumlah variabel (Hair, Black, Babin, dan Anderson, 2010).
Pengujian korelasi antar variabel dilakukan dengan uji Bartlet, hipotesis yang digunakan
sebagai berikut (Morrison, 2005).
H
0
: Matriks korelasi merupakan matriks identitas
H
1
: Matriks korelasi bukan matriks identitas
Statistik uji : R
p
n
hitung
ln
6
5 2
) 1 (
2
)
`

+
= (2)
Daerah Penolakan :
2
) 1 (
2
1
, p p

Keputusan : Tolak hipotesis H


0
jika
2
) 1 (
2
1
,
2

>
p p
hitung


Dimana, n = Jumlah observasi
p = Jumlah variabel
|| = Determinan dari matriks korelasi
Analisis faktor pada prinsipnya digunakan untuk mereduksi data, yaitu proses untuk
meringkas sejumlah variabel menjadi sedikit dan menamakannya sebagai faktor. Apabila terdapat
vektor acak x= (x
1
, x
2
, ..., x
p
) mempunyai matrik korelasi R dan memiliki nilai mean maka model
analisis faktor adalah :
1 1 2 12 1 11 1 1
+ + + + =
m m
F F F X
(3)

p m pm p p p p
F F F X + + + + =
2 2 1 1
Dimana :
F
j
= Common factor ke-j
L
ij
= Loading factor ke-j dari variabel ke-i

j
= specific factor ke-i
3
i = 1, 2, . . . , p dan j = 1, 2, . . . , m
Nilai eigenvalue yang dijadikan acuan untuk menentukan banyaknya faktor yang terbentuk
adalah nilai eigenvalue yang lebih besar dari satu. Rotasi faktor memiliki tujuan untuk
menyederhanakan struktur dengan mentransformasi faktor untuk mendapatkan faktor baru yang lebih
mudah untuk diinterpretasikan.
Metode rotasi ada dua macam yaitu rotasi orthogonal, dan rotasi oblique. Rotasi orthogonal
ada 3 macam yaitu varimax, quartimax dan equamax. (Dillon dan Goldstein, 1981 diacu dalam
Purwaningsih, 2004). Prosedur dari metode varimax dengan meminimalkan jumlah variabel yang
mempunyai loading tinggi pada suatu faktor (Norusis, 1986 diacu dalam Purwaningsih, 2004).
2.2 Analisis Cluster
Analisis cluster atau biasa disebut analisis kelompok digunakan untuk mengelompokkan objek
pengamatan berdasarkan karakteristik-karakteristik yang dimiliki. Pengelompokkan dilakukan dengan
memaksimalkan kehomogenan objek pengamatan dalam satu cluster sekaligus memaksimalkan
keheterogenan antar cluster. Analisis kelompok terdiri atas prosedur hirarki dan non-hirarki.
Prosedur cluster hirarki terdiri atas dua metode yaitu agglomerative dan divisive. Adapun
beberapa algoritma metode agglomerative yang digunakan untuk membentuk kelompok (cluster)
adalah single linkage, complete linkage, dan average linkage (Johnson dan Winchern, 2007).
Untuk menghitung jarak antar kelompok digunakan suatu fungsi yang disebut jarak (distance).
Salah satu distance adalah dengan menggunakan fiungsi jarak Euclidean dimana formulanya sebagai
berikut (Johnson dan Winchern, 2007) :
{ }

=
=
p
k
jk ik ij
x x d
1
2
(4)
a. Single Linkage
Metode pautan tunggal (single linkage) prosedurnya berdasarkan jarak minimum, dengan
rumus sebagai berikut (Johnson dan Winchern, 2007) :
) , min(
) , ( jk ik k j i
d d d = (5)
dimana : - d
ik
= jarak antara kelompok i dan k
- d
jk
= jarak antara kelompok j dan k
b. Complete Linkage
Complete linkage adalah proses clustering yang didasarkan pada jarak terjauh antar
obyeknya ( maksimum distance).
) , max(
) , ( jk ik k j i
d d d = (6)
c. Average Linkage
Average linkage adalah proses clustering yang didasarkan pada jarak rata-rata antar
obyeknya (average distance).
) , (
) , ( jk ik k j i
d d average d = (7)
d. Minimax Linkage
Bien dan Thibshirani (2011), minimax linkage merupakan metode hierarchical clustering yang
dikembangkan dari metode single, complete, dan average linkage serta centroid linkage. Minimax
linkage adalah pengelompokkan berdasarkan nilai minimum dari jarak yang maksimum. Definisi
minimax linkage antar dua cluster G dan H yaitu :
{ } ) ' , ( max min ) , (
'
x x d H G d
H G x H G x e e
= (8)
Sifat-sifat minimax linkage yaitu :
1. Dendrogram dari minimax linkage tidak memiliki inversions.
2. Minimax linkage menghasilkan k-group yang terstruktur dengan baik.
Sebuah linkage dapat menghasilkan k-group yang terstruktur dengan baik jika pada cluster
C
1
,,C
k
jarak antar semua anggota cluster lebih kecil daripada jarak antar cluster (homogenitas
dalam cluster lebih besar daripada heterogenitas antar cluster). Hierarchical clustering akan
terbentuk setelah proses penggabungan sebanyak n k.
3. Adanya jarak antar anggota cluster yang sama tidak mempengaruhi bentuk cluster dan memiliki
sifat transformasi monoton. Transformasi monoton akan memelihara jarak antar anggota cluster,
4
paling tidak mendekati jarak awalnya.
Single dan complete linkage juga memiliki kedua sifat tersebut, sedangkan average linkage
tidak memilikinya. Kedua sifat ini menunjukkan bahwa minimax linkage robust terhadap
gangguan, misalnya gangguan berupa outlier. Fisher dan Van Ness (1971) menyatakan bahwa
aspek pengukuran jarak pada cluster lebih penting daripada kepadatan (jumlah) point dalam
cluster.
4. Minimax linkage memenuhi sifat reducibility.
Gordon (1987), clustering yang menggunakan linkage juga membutuhkan sifat reducibility,
dimana untuk setiap cluster G
1
, G
2
, H,
d(G
1
G
2
, H) min{ d(G
1
, H), d(G
2
, H)} (9)
Reducibility menunjukkan bahwa cluster baru yang terbentuk yaitu G
1
G
2
memiliki jarak
sejauh mungkin dengan H, daripada jarak antara G
1
atau G
2
terhadap H. Misalkan, jika J dan H
memilki jarak yang dekat sebelum penggabungan G
1
dan G
2
maka J dan H akan tetap tetap dekat
setelah G
1
dan G
2
digabung (Murtagh, 1983).
Algoritma :
- Mulai dengan C
0
= {{x
1
},,{x
n
}} dan d({x
i
},{x
j
}) = d(x
i
,x
j
) untuk semua i j
- Untuk l =1,,n 1 :
1.Temukan sebuah pasangan (G
1
, G
2
) yang memiliki jarak terdekat (RNN / reciprocal nearest
neighbor)
2.Hitung d(G
1
G
2
, H) untuk semua HeC
l
3. Ulangi langkah (1), dengan G
1
dan G
2
awal telah berkelompok
Dimana l adalah jumlah pengamatan.
Pemilihan metode cluster yang terbaik dapat dilakukan dengan analisa cluster. Analisa cluster
bisa diperoleh dari kepadatan cluster yang terbentuk (cluster density). Kepadatan suatu cluster bisa
ditentukan dengan variance within cluster (Vw
2
) dan variance between cluster (Vb
2
) (Man, Lim, Jian,
Yue, 2009 diacu dalam Martiana, Rosyid, Agusetia, 2010). Varian tiap tahap pembentukan cluster
bisa dihitung dengan rumus :
( )

=
n
i
c i
c
y y
n
Vc
1
2 2
1
1
(10)
Dimana :
V
c
2
= varian pada cluster c
c = 1k, dimana k = jumlah cluster
n
c
= jumlah data pada cluster c
y
i
= data ke-i pada suatu cluster
y
c
= rata-rata dari data pada suatu cluster
Selanjutnya dari nilai varian diatas, kita bisa menghitung nilai variance within cluster (Vw
2
)
dan nilai variance between cluster (Vb
2
) dengan rumus :
( )

=
c
i
i i
V n
c N
Vw
1
2 2
1
1

( )

=
c
i
i i
y y n
c
Vb
1
2 2
1
1
(11)
Dimana :
N = jumlah semua data
n
i
= jumlah data cluster i
V
i
2
= varian pada cluster i
y = rata-rata dari
i
y
Salah satu metode yang digunakan untuk menentukan cluster yang ideal adalah batasan
variance, yaitu dengan menghitung kepadatan cluster berupa variance within cluster (Vw
2
) dan
variance between cluster (Vb
2
). Cluster yang ideal mempunyai Vw
2
minimum yang mempresentasikan
internal homogeneity dan maksimum Vb
2
yang menyatakan external homogeneity.
2
2
Vb
Vw
V =
(12)
5
Penentuan jumlah cluster optimum dapat ditentukan dengan pola pergerakan varian. Identikasi
pola pergerakan varian merupakan metode untuk memperoleh cluster yang mencapai global optimum
(Arai, Barakbah, 2007). Posisi yang mungkin untuk menemukan global optimum pada pergerakan
varian, dikelompokkan menjadi 2 yaitu hill-climbing dan valley-tracing (Noor dan Hariadi, 2009).
Pada valley-tracing didefinisikan bahwa kemungkinan mencapai global optimum terletak pada tahap
ke-i, jika memenuhi persamaan berikut :
( ) ( )
i i i i
v v v v > >
+ 1 1
(13)
Dimana V
i
= varian pada cluster ke-i hasil perbandingan Vw
2
dengan Vb
2
, i = 1..k, dan k tahap
terakhir pembentukan cluster. Selanjutnya, baik dengan pendekatan metode valley-tracing maupun
hill-climbing dilakukan identifikasi perbedaan nilai tinggi () pada tiap tahap, yang didefinisikan
dengan :
( ) ( )
i i i
xv v v 2
1 1
+ = c
+
(14)
Nilai digunakan untuk menghindari local optima, dimana persamaan ini diperoleh dari
maksimum yang dipenuhi pada persamaan 14. Untuk mengetahui keakuratan dari suatu metode
pembentukan cluster pada hierarchical method, baik menggunakan valley-tracing maupun hill-
climbing, digunakan persamaan berikut.
( )
( ) c
c
=
max _ _ _
max
ke terdekat nilai

(15)
Dimana :
Nilai terdekat ke max () adalah nilai kandidat max () sebelumnya.
Nilai yang lebih besar dari 2, menunjukkan cluster yang terbentuk merupakan cluster yang well-
separated / terpisah dengan baik. Jika nilai bertanda negatif berarti global optimum yang ditentukan
telah benar dan cluster yang terbentuk terpisah dengan baik (Arai, Barakbah, 2007).
2.3 Definisi Operasional Indikator Pemerataan Pendidikan
Puspowati (2009), menurut UU no 20 tahun 2003, pendidikan adalah suatu usaha sadar untuk
menyiapkan peserta didik melalui kegiatan bimbingan, pengajaran dan atau latihan bagi peranannya di
masa yang akan datang. Definisi operasional enam variable tersebut dapat dijelaskan sebagai berikut :
1. APK (Angka Partisipasi Kasar)
Hasil perhitungan APK digunakan untuk mengetahui banyaknya anak yang bersekolah di
suatu jenjang pendidikan tertentu pada wilayah tertentu.
APK =
jumlah murid jenjang tertentu
jumlah penduduk usia sekolah
(16)
2. APM (Angka Partisipasi Murni)
Indikator APM digunakan untuk mengetahui banyaknya anak usia sekolah yang
bersekolah pada suatu jenjang pendidikan yang sesuai. Kelompok umur untuk usia SD 7-12 tahun,
SMP 13-15 tahun, SMA 16-18 tahun. Besarnya APM di suatu daerah dapat dihitung dengan rumus
berikut :
APM =
jumlah murid usia jenjang tertentu
jumlah penduduk usia sekolah
(17)
3. Rasio Murid-Guru
Indikator rasio murid dengan guru digunakan untuk menggambarkan beban kerja guru
dalam mengajar. Indikator ini juga dapat digunakan untuk melihat mutu pengajaran di kelas karena
semakin tinggi nilai rasio ini berarti semakin berkurang tingkat pengawasan atau perhatian guru
terhadap murid sehingga mutu pengajaran cenderung semakin rendah.
Rasio Murid_Guru =
jumlah murid
jumlah guru
(18)
4. Rasio Murid-Kelas
Indikator rasio murid dengan kelas digunakan untuk menggambarkan kepadatan kelas
pada suatu jenjang pendidikan.
Rasio Murid_Kelas =
jumlah murid
jumlah ruang kelas
(19)
6
5. Rasio Murid-Sekolah
Indikator rasio murid dengan sekolah digunakan untuk menggam-barkan rata-rata daya
tampung per sekolah.
Rasio Murid_Sekolah =
jumlah murid
jumlah sekolah
(20)
6. Angka Shift
Angka yang diperoleh memberikan gambaran tentang waktu penyelenggaraan proses
belajar mengajar.
Angka Shift =
jumlah rombongan belajar
jumlah ruang kelas
(21)
Apabila angka shift > 1, maka waktu penyeleng-garaan proses belajar mengajar tidak
dilakukan pada waktu yang bersamaan (lebih dari satu kali).
2.4 Penelitian Sebelumnya
Terdapat beberapa penelitian yang telah dilakukan yang berkaitan dengan pengelompokkan
kecamatan berdasarkan indikator pemerataan pendidikan, di antaranya adalah penelitian Puspowati
(2009) yang meneliti pengelompokkan kecamatan di kabupaten Malang berdasarkan indikator
pemerataan pendidikan. Dalam peneitiannya, Puspowati menggunakan data kecamatan di kabupaten
Malang dan menggunakan metode self organizing maps (SOM). Pada penelitian saat ini akan
digunakan data kecamatan di pulau Madura dan menggunakan metode hierarchical clustering via
minimax linkage. Penelitian tentang metode hierarchical clustering via minimax linkage telah
dilakukan oleh Jacob dan Tibshirani (2011). Minimax linkage memiliki beberapa kelebihan, antara lain
dendrogram dari minimax linkage tidak mempunyai susunan yang terbalik dan robust terhadap
beberapa gangguan pada dataset. Dengan demikian, pengelompokkan kecamatan di pulau Madura
dengan metode hierarchical clustering via minimax linkage dapat menghasilkan kelompok-kelompok
kecamatan yang memiliki homogenitas tinggi.
3. Metodologi Penelitian
Data yang digunakan dalam penelitian ini adalah data sekunder mnegenai indikator
pemerataan pendidikan 2010/2011 yang didapat dari Dinas Pendidikan Jawa Timur. Variabel
penelitian yang digunakan yaitu APK (Angka Partisipasi Kasar), APM (Angka Partisipasi Murni),
rasio murid dengan guru, rasio murid dengan kelas, rasio murid dengan sekolah, dan angka shift untuk
jenjang SD, SMP, dan SMA. Variabel-variabel tersebut dihitung untuk masing-masing kecamatan di
pulau Madura. Kabupaten Bangkalan memiliki 18 kecamatan, Sampang memilki 14 kecamatan,
Pamekasan memiliki 13 kecamatan, dan Sumenep memiliki 27 kecamatan. Jadi, terdapat 72 kecamatan
di pulau Madura.
Setelah data terkumpul dan variabel penelitian ditentukan maka langkah-langkah dalam
menganalisis data adalah sebagai berikut.
1. Melakukan analisis statistika deskriptif yaitu rata-rata, varians, nilai minimum, nilai maksimum,
dan boxplot dari masing-masing variabel.
2. Membandingkan hasil pengelompokkan kecamatan di pulau Madura berdasarkan indikator
pemerataan pendidikan dengan metode hierarchical clustering dengan single linkage, complete
linkage, average linkage, dan minimax linkage dan mendapatkan kecamatan di pulau Madura yang
berkelompok berdasarkan hasil pengelompokkan terbaik dengan langkah- langkah sebagai berikut.
a. Mereduksi dimensi data dengan menggunakan analisis faktor. Analisis faktor juga berguna
untuk menghilangkan korelasi jika antar variabel pada data terdapat korelasi. Sebelum
melakukan analisis faktor, terlebih dahulu melakukan uji KMO dan MSA serta uji Bartlett
pada data.
b. Melakukan pengelompokkan kecamatan-kecamatan di pulau Madura berdasarkan indikator
pemerataan pendidikan dengan menggunakan metode hierarchical clustering dengan single
linkage, complete linkage, average linkage, dan minimax linkage.
c. Membandingkan hasil pengelompokkan dengan semua metode menggunakan nilai variance
within cluster dan variance between cluster.
d. Menentukan jumlah cluter optimum pada metode terbaik dengan valley-tracing.
7
3. Melakukan analisis terhadap karakteristik kecamatan hasil pengelompokkan terbaik dalam upaya
pemerataan pendidikan di Pulau Madura.
4. Melakukan pengelompokkan kecamatan-kecamatan di tiap kabupaten pulau Madura dengan
metode minimax linkage.
4. Analisis dan Pembahasan
Hasil analisis statistika deskriptif kecamatan-kecamatan di pulau Madura pada Tabel 1
menunjukkan bahwa nilai rata-rata tertinggi merupakan rata-rata dari variabel rasio murid dan sekolah
tingkat SMA dengan nilai varians yang sangat tinggi pula yaitu 51313,60, nilai minimumnya adalah 0
dan nilai maksimumnya adalah 1263. Nilai minimum menunjukkan bahwa terdapat kecamatan di
pulau Madura yang belum memiliki sekolah tingkat SMA dan nilai maksimum menunjukkan bahwa
terdapat kecamatan yang memiliki jumlah murid sebanyak 1263 pada satu sekolah tingkat SMA.
Nilai minimum yang bernilai nol menunjukkan terdapat kecamatan di pulau Madura yang
belum memiliki sekolah tingkat SMA dan semua kecamatan-kecamatan di pulau Madura telah
memiliki sekolah tingkat SD dan SMP karena nilai minimum tidak menunjukkan angka nol.
Tabel 1 Nilai Rata-Rata, Varians, Minimum (Min), dan Maksimum (Maks) Variabel-Variabel Indikator
Pemerataan Pendidikan
Variabel
Rata-
Rata
Varians Min Maks Variabel
Rata-
Rata
Varians Min Maks
APK SD 76,46 505,99 33,32 123,59 Murid/Kelas SMP 30,62 256,71 6,16 75,52
APM SD 66,29 393,69 27,78 109,39 Murid/Sekolah SMP 174,1 17090 42 720
Murid/Guru SD 17,99 171,37 5,8 88,7 Angka shift SMP 1,25 0,24 0,46 3,5
Murid/Kelas SD 24,9 65,69 11,09 54,07 APK SMA 22,41 947,86 0 186,39
Murid/Sekolah SD 146,41 2419,12 67,21 291,13 APM SMA 14,43 467,9 0 145,69
Angka shift SD 1,15 0,14 0,8 3,6 Murid/Guru SMA 7,93 41,29 0 24,29
APK SMP 37,67 665,34 6,74 156,68 Murid/Kelas SMA 35,7 4216,31 0 532
APM SMP 25,59 419,08 2,76 121,63 Murid/Sekolah SMA 208,8 51313,6 0 1263
Murid/Guru SMP 8,33 11,6 3,07 16,09 Angka shift SMA 0,93 1,77 0 11
Keragaman data terutama adanya outlier pada setiap variabel indikator pemerataan pendidikan
dapat diketahui melalui boxplot. Agar keragaman dapat dilihat secara serentak, maka keragaman
masing-masing variabel perlu disajikan secara bersama dalam satu diagram yaitu pada Gambar
4.1.
A
n
g
k
a
s
h
i
ft
S
M
A
M
u
r
id
/
S
e
k
o
l a
h
S
M
A
M
u
r
i
d
/
K
e
la
s
S
M
A
M
u
r
i d
/
G
u
r
u
S
M
A
A
P
M
S
M
A
A
P
K
S
M
A
A
n
g
k
a
s
h
if
t
S
M
P
M
u
r
id
/
S
e
k
o
la
h
S
M
P
M
u
r
id
/
K
e
la
s
S
M
P
M
u
r
id
/
G
u
r
u
S
M
P
A
P
M
S
M
P
A
P
K
S
M
P
A
n
g
k
a
s
h
if
t
S
D
M
u
r
id
/
S
e
k
o
la
h
S
D
M
u
r
id
/
K
e
la
s
S
D
M
u
r
id
/
G
u
r
u
S
D
A
P
M
S
D
A
P
K
S
D
8
6
4
2
0
-2
D
a
t
a
Gambar 1 Boxplot Variabel-Variabel Indikator Pemerataan Pendidikan di Kecamatan-Kecamatan Pulau Madura
Outlier yang paling banyak terdapat pada variabel APM dan angka shift tingkat SMP. Pada
variabel APK tingkat SMP, APK, dan APM tingkat SMA serta beberapa variabel lainnya juga terdapat
8
pengamatan yang outlier, akan tetapi jumlahnya tidak sebanyak pada variabel APM dan angka shift
tingkat SMP.
4.1 Analisis Faktor pada Variabel-Variabel Indikator Pemerataan Pendidikan
Uji kecukupan data secara keseluruhan yang digunakan adalah Kaiser-Meyer-Olkin (KMO).
Hipotesis dari KMO adalah sebagai berikut :
H
0
: Jumlah data indikator pemerataan pendidikan cukup untuk difaktorkan
H
1
: Jumlah data indikator pemerataan pendidikan tidak cukup untuk difaktorkan
Pengujian kecukupan data keseluruhan dapat dilakukan dengan menggunakan persamaan 1
sehingga diperoleh nilai KMO sebesar 0,670, jadi dapat disimpulkan bahwa asumsi kecukupan data
indikator pemerataan pendidikan keseluruhan telah terpenuhi dan data indikator pemerataan
pendidikan pada kecamatan-kecamatan di pulau Madura cukup untuk difaktorkan.
Pengujian kecukupan data pada masing-masing variabel indikator pemerataan pendidikan
dapat dilakukan dengan menggunakan persamaan 1. Hasil perhitungan nilai MSA (Tabel 2) yang telah
dilakukan menghasilkan nilai MSA yang lebih besar dari 0,5 untuk semua variabel indikator
pemerataan pendidikan, maka hasil uji MSA terpenuhi oleh masing-masing variabel.
Tabel 2 Uji Kecukupan Data pada Masing-Masing Variabel Indikator Pemerataan Pendidikan
No Variabel MSA No Variabel MSA
1 APK SD 0,656 10 Murid/Kelas SMP 0,682
2 APM SD 0,67 11 Murid/Sekolah SMP 0,756
3 Murid/Guru SD 0,781 12 Angka shift SMP 0,469
4 Murid/Kelas SD 0,75 13 APK SMA 0,586
5 Murid/Sekolah SD 0,731 14 APM SMA 0,589
6 Angka shift SD 0,653 15 Murid/Guru SMA 0,725
7 APK SMP 0,64 16 Murid/Kelas SMA 0,598
8 APM SMP 0,609 17 Murid/Sekolah SMA 0,694
9 Murid/Guru SMP 0,839 18 Angka shift SMA 0,522
Uji korelasi yang digunakan adalah uji Bartlett dengan hipotesis :
H
0
: Matriks korelasi data indikator pemerataan pendidikan merupakan matriks identitas
H
1
: Matriks korelasi data indikator pemerataan pendidikan bukan matriks identitas
Uji korelasi data indikator pemerataan pendidikan yang telah dilakukan menghasilkan nilai P-
value sebesar 0,000. Maka dapat dikatakan bahwa antar variabel pada data indikator pemerataan
pendidikan di kecamatan-kecamatan pulau Madura saling berkorelasi.
Cara untuk menentukan jumlah faktor yang tepat untuk mewakili variabilitas data indikator
pemerataan pendidikan yaitu dengan mengidentifikasi nilai eigenvalue pada gambar scree plot.
Gambar scree plot yang dihasilkan dapat dilihat pada Gambar 2.
18 16 14 12 10 8 6 4 2
6
5
4
3
2
1
0
Fact or Number
E
i
g
e
n
v
a
l
u
e
1
0 .0 0 2 9 8
0 .0 0 9 9 4
0 .0 3 2 4 3
0 .0 4 6 3 9
0 .0 5 7 9 5
0 .0 8 9 9 9
0 .1 3 0 0 2
0 .2 0 9 5 0
0 .2 6 5 0 6
0 .4 0 4 6 2
0 .6 3 1 3 4
0 .8 3 2 5 4
0 .8 9 8 6 3
1 .0 6 5 4 1
1 .2 6 6 4 9
2 .2 6 1 0 3
3 .9 6 6 7 2
5 .8 2 8 9 5
Gambar 2 Scree Plot Variabel-Variabel Indikator Pemerataan Pendidikan di Kecamatan-Kecamatan Pulau
Madura
9
Pada Gambar 2 dapat diketahui bahwa jumlah faktor yang tepat untuk mewakili variabel
indikator pemerataan pendidikan di kecamatan-kecamatan pulau Madura yaitu sebanyak lima faktor.
Penggunaan lima faktor akan mewakili 79,9 % variabilitas data.
Pembagian variabel-variabel ke dalam kelompok faktor tertentu dilakukan dengan memilih
nilai loading faktor terbesar antara loading faktor 1, 2, 3, 4, dan 5. Loading faktor yang digunakan
adalah loading faktor yang telah dirotasi varimax. Nilai loading faktor yang telah dirotasi varimax dan
yang telah diurutkan berdasarkan nilai loading faktor terbesar dapat dilihat pada Tabel 3.
Tabel 3 Nilai Loading Faktor dengan Rotasi Varimax
Variabel Faktor 1 Faktor 2 Faktor 3 Faktor 4 Faktor 5
APK SD 0,928 -0,077 -0,078 -0,023 -0,077
APM SD 0,926 0,001 -0,011 -0,101 -0,052
Murid/Guru SD 0,882 0,069 0,171 0,054 0,167
Murid/Kelas SD 0,881 0,08 0,216 0,032 0,146
Murid/Sekolah SD 0,81 -0,184 -0,291 0,095 -0,013
Angka shift SD 0,005 0,916 0,191 0,032 0,002
APK SMP -0,015 0,916 0,214 0,01 0,002
APM SMP -0,028 0,691 0,246 -0,3 -0,038
Murid/Guru SMP -0,077 0,573 0,234 -0,571 -0,244
Murid/Kelas SMP 0,018 0,417 0,794 -0,056 -0,118
Murid/Sekolah SMP -0,003 0,415 0,791 -0,066 -0,086
Angka shift SMP -0,174 0,345 0,737 -0,191 -0,273
APK SMA -0,059 0,426 0,72 -0,071 0,038
APM SMA -0,184 0,173 -0,492 0,082 -0,057
Murid/Guru SMA 0,001 0,048 0,118 -0,946 -0,167
Murid/Kelas SMA 0,014 0,064 0,082 -0,944 -0,092
Murid/Sekolah SMA 0,011 -0,029 -0,067 -0,13 -0,898
Angka shift SMA -0,149 0,138 0,399 -0,244 -0,773
Keterangan : angka yang dicetak tebal merupakan nilai tertinggi dari masing-masing loading faktor
Penentuan variabel akan dikelompokkan pada faktor 1, 2, 3, 4 atau 5 berdasarkan nilai mutlak
loading faktor terbesar dari masing-masing variabel. Faktor 1 dapat disebut sebagai faktor murid SD,
sedangkan faktor 2 dapat diberi nama faktor murid SMP. Faktor 3 disebut faktor fasilitas SMP dan
faktor 4 disebut faktor murid SMA, serta faktor 5 disebut faktor fasilitas SMA.
4.2 Analisis Cluster pada Kecamatan-Kecamatan di Pulau Madura
Hasil dendrogram pada pengelompokkan kecamatan-kecamatan di pulau Madura menjadi satu
kelompok dengan metode single linkage, complete linkage, average linkage, dan minimax linkage
yaitu sebagai berikut.
(a) (b)
10
(c) (d)
Gambar 3 Dendrogram Single Linkage (a), Complete Linkage (b), Average Linkage (c), Minimax Linkage (d)
Kecamatan-Kecamatan Pulau Madura
Pada Gambar 3 dapat dilihat bahwa kecamatan yang bergabung terakhir adalah kecamatan
Camplong (22) kabupaten Sampang. Minimax linkage adalah pengelompokkan berdasarkan nilai
minimum dari jarak yang maksimum. Dendrogram dari metode minimax linkage memiliki susunan
yang lebih teratur jika dibandingkan dengan dendrogram dari metode single, complete, dan average
linkage.
Cluster yang ideal mempunyai Vw
2
minimum yang mempresentasikan internal homogeneity
dan maksimum Vb
2
yang menyatakan external homogeneity. Perbandingan nilai Vw
2
yang minimum
dan nilai Vb
2
yang maksimum menghasilkan suatu nilai variance yang minimum. Pemilihan metode
cluster terbaik dilakukan dengan menentukan peringkat pada setiap jumlah cluster yang terbentuk
pada keempat metode berdasarkan nilai variance yang terkecil. Jumlah peringkat pada metode single,
complete, average, dan minimax linkage dapat dilihat pada Tabel 4.
Tabel 4 Jumlah Peringkat Atas dan Bawah pada Metode Single, Complete, Average, dan Minimax Linkage
Peringkat
Metode Pengelompokkan
Single Complete Average Minimax
Atas 36,62% 60,56% 74,65% 77,46%
a
Bawah 63,38% 39,44% 25,35% 22,54%
Keterangan :
a
merupakan jumlah peringkat atas terbanyak
Metode minimax linkage merupakan metode terbaik daripada metode single, complete, dan
average linkage karena memiliki jumlah peringkat atas terbanyak yaitu sebanyak 77,46% dan jumlah
peringkat bawah sebanyak 22,54%. Setelah itu, dilakukan penentuan jumlah cluster optimum dengan
pergerakan variance pola valley-tracing. Nilai variance yang digunakan merupakan hasil
perbandingan variance within cluster (Vw
2
) dan variance between cluster (Vb
2
). Perbedaan nilai tinggi
() pada tiap jumlah cluster dengan metode minimax linkage ditampilkan pada Gambar 4.
11
80 70 60 50 40 30 20 10 0
0.050
0.025
0.000
-0.025
-0.050
-0.075
-0.100
jumlah cluster
b
e
d
a
t
i
n
g
g
i
3
0.037
Gambar 4 Perbedaan Nilai Tinggi pada Tiap Jumlah Cluster dengan Metode Minimax Linkage
Perbedaan nilai tinggi yang maksimum yaitu ketika jumlah cluster sebanyak 3 dengan
perbedaan nilai tinggi sebesar 0,037. Hal ini berarti bahwa jumlah cluster yang optimum pada
pengelompokkan kecamatan-kecamatan berdasarkan indikator pemerataan pendidikan dengan metode
minimax linkage yaitu sebanyak 3 cluster. Keakuratan dari suatu metode pembentukan cluster pada
hierarchical method menggunakan valley-tracing dapat diketahui dengan menggunakan persamaan 15,
didapatkan nilai yaitu -0,378. Nilai yang bertanda negatif berarti global optimum yang ditentukan
telah benar dan clusteryang terbentuk terpisah dengan baik.
4.3 Analisis Karakteristik Tiap Kelompok Kecamatan-Kecamatan di Pulau Madura
Hasil pengelompokkan dengan metode minimax linkage menghasilkan jumlah kelompok yang
optimum yaitu sebanyak 3 kelompok .Tiap kelompok memiliki karakteristik yang berbeda-beda.
Kelompok 1 terdiri dari kecamatan Camplong kabupaten Sampang. Kecamatan Camplong memiliki
nilai angka shift > 1. Hal ini berarti bahwa waktu penyelenggaraan proses belajar mengajar tidak
dilakukan pada waktu yang bersamaan (lebih dari satu kali). Kebijakan yang sesuai untuk kecamatan
Camplong yaitu penambahan ruang kelas untuk pendidikan tingkat SMA. Kelompok 2 terdiri dari
kecamatan Kota Sumenep kabupaten Sumenep. Kota Sumenep merupakan kecamatan yang memiliki
nilai-nilai tinggi untuk tiap variabel indikator pemerataan pendidikan sehingga dapat dijadikan contoh.
Kelompok 3 terdiri dari kecamatan-kecamatan di pulau Madura selain kecamatan Camplong dan Kota
Sumenep. Secara umum, kelompok 3 memiliki karakteristik yaitu variabel-variabel indikator
pemerataan pendidikan tingkat SMA memiliki nilai varians yang cukup tinggi sehingga fasilitas untuk
jenjang pendidikan SMA perlu ditingkatkan dalam upaya pemerataan pendidikan tingkat kecamatan.
4.4 Pengelompokkan Kecamatan-Kecamatan Tiap Kabupaten di Pulau Madura
Pengelompokkan kecamatan-kecamatan tiap kabupaten di pulau Madura menggunakan
metode minimax linkage. Penentuan jumlah kelompok yang optimum pada masing-masing kebupaten
menggunakan valley-tracing. Perbedaan nilai tinggi () pada tiap jumlah cluster dengan metode
minimax linkage ditampilkan pada Gambar 5.
14 12 10 8 6 4 2
0.10
0.05
0.00
-0.05
-0.10
-0.15
jumlah cluster
b
e
d
a
t
in
g
g
i
4
0.1009
(a) (b)
18 16 14 12 10 8 6 4 2 0
0.10
0.05
0.00
-0.05
-0.10
-0.15
-0.20
-0.25
jumlah clust er
b
e
d
a
t
i
n
g
g
i
3
0.1098
12
25 20 15 10 5 0
0.02
0.01
0.00
-0.01
-0.02
-0.03
-0.04
-0.05
-0.06
jumlah cluster
b
e
d
a
t
i
n
g
g
i
4
0.0172
(c) (d)
Gambar 5 Perbedaan Nilai Tinggi pada Tiap Jumlah Cluster pada Pengelompokkan di Bangkalan (a), Sampang
(b), Pamekasan (c), dan Sumenep (d)
Pada Gambar 5 dapat dilihat bahwa jumlah cluster yang optimum pada kabupaten Bangkalan
yaitu sebanyak 3 kelompok dengan nilai keakuratan yaitu sebesar -0,4482, pada kabupaten Sampang
sebanyak 4 kelompok dengan nilai keakuratan -1,3212, pada kabupaten Pamekasan sebanyak 3
kelompok dengan nilai keakuratan -0,5116, dan pada kabupaten Sumenep sebanyak 4 kelompok
dengan nilai keakuratan 8,887. Hal ini berarti bahwa cluster yang terbentuk pada tiap kabupaten di
pulau Madura telah terpisah dengan baik.
5. Kesimpulan
Hasil analisis dan pembahasan yang telah dilakukan pada penelitian ini memperoleh
kesimpulan yaitu varians tertinggi terdapat pada variabel rasio murid dengan sekolah tingkat SMA dan
SMP yang berarti bahwa terdapat kesenjangan yang cukup tinggi antar kecamatan dan metode
minimax linkage merupakan metode pengelompokkan terbaik dengan jumlah kelompok optimum
sebanyak 3 dan hasil pengelompokkan kecamatan di pulau Madura sebagai berikut.
Kelompok 1 : kecamatan Camplong kabupaten Sampang.
Kelompok 2 : kecamatan Kota Sumenep kabupaten Sumenep.
Kelompok 3 : kecamatan-kecamatan di pulau Madura selain kecamatan Camplong dan Kota
Sumenep.
Karakteristik kecamatan-kecamatan di pulau Madura berdasarkan kelompok yaitu : kelompok
1 memiliki nilai angka shift untuk pendidikan jenjang SMA yang cukup tinggi sehingga perlu adanya
penambahan ruang kelas untuk pendidikan tingkat SMA, kelompok 2 memiliki nilai-nilai tinggi untuk
tiap variabel indikator pemerataan pendidikan sehingga dapat dijadikan contoh oleh kecamatan lain,
dan kelompok 3 memiliki nilai varians yang cukup tinggi untuk variabel-variabel indikator pemerataan
pendidikan tingkat SMA sehingga fasilitas untuk jenjang pendidikan SMA perlu ditingkatkan. Hasil
pengelompokkan kecamatan di kabupaten Bangkalan dengan metode minimax linkage dan valley-
tracing menghasilkan jumlah kelompok yang optimum sebanyak 3 kelompok, kabupaten Sampang
sebanyak 4 kelompok, kabupaten Pamekasan sebanyak 3 kelompok, dan kabupaten Sumenep sebanyak
4 kelompok.
6. Saran
Agar mendapatkan karakteristik pendidkan yang lebih lengkap, disarankan untuk melakukan
survei langsung mengenai kualitas pendidikan untuk tiap kecamatan. Penggunaan berbagai cara untuk
membandingkan metode pengelompokkan perlu dilakukan agar hasil yang didapat lebih optimal.
7. Daftar Pustaka
Arai, K., Barakbah, A.R. 2007. Cluster Construction Method Based on Global Optimum Cluster
Determination with The Newly Defined Moving Variance. Reports of the Faculty of Science
and Engineering, Saga University. 36(1) : 9-15
Bien, J. dan Tibshirani, R. 2011. Hierarchical Clustering With Prototype via Minimax Linkage.
Journal of the American Statistical Association
12 10 8 6 4 2
0.050
0.025
0.000
-0.025
-0.050
-0.075
-0.100
jumlah cluster
b
e
d
a
t
in
g
g
i
3
0.0482
13
Dillon, W., Goldstein, M. 1981. Multivariate Analysis Methods and Application. Canada : John Wiley
and Sons, Inc
Fisher, L., Van Ness, J. 1971. Admissible Clustering Procedures. Biometrica 58(1) : 91-104
Gordon, A.D. 1987. A Review of Hierarchical Classification. Journal of Royal Statistical Society, Ser.
A 150(2) : 119-137
Hair, J. F., Black, W.C., Babin, B.J., Anderson, R.E. 2010. Multivariate Data Analysis. New Jersey :
Upper saddle river
Johnson, R.A., Winchern, D.W. 2007. Applied Multivariate Statistical Analysis. USA : Pearson
Education International
Man L, Chew Lim T, Jian S, Yue L. 2009. Supervised and Traditional Term Weighting Methods for
Automatic Text Categorization. Pattern Analysis and Machine Intelligence, IEEE
Transactions on. 31(4) : 721-735
Martiana, E., Rosyid, N., Agusetia, U. 2010. Mesin Pencari Dokumen dengan Pengklasteran secara
Otomatis. TELKOMNIKA 8(1) : 41-48
Morrison, D.F. 2005. Multivariate Statistical Methods Fourth Edition. USA : Thomson Learning, Inc
Murtagh, F. 1983. A Survey of Recent advances in Hierarchical Clustering Algorithms. The Computer
Journal 26 : 354-359
Noor, M. H., Hariadi, M. 2009. Image Cluster Berdasarkan Warna untuk Identifikasi Kematangan
Buah Tomat dengan Metode Valley Tracing. Seminar Nasional Informatika 2009
Norusis, M.J. 1986. Advanced Statistics SPSS/PC+ for the IBM PC/XT/AT. Michigan Avenue
Chicago Illinois
Purwaningsih, A. 2004. Penentuan Rotasi yang Sesuai dalam Analisis Faktor dengan Analisis
Procrustes. Pusat Pengembangan Teknologi Informasi dan Komputasi, BATAN
Puspowati, T. 2009. Algoritma Self Organizing Maps (SOM) untuk Pengelompokkan Kecamatan di
Kabupaten Malang berdasarkan Indikator Pemerataan Pendidikan [tesis]. Surabaya : Jurusan
Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Teknologi Sepuluh
Nopember

Anda mungkin juga menyukai