ii
PENERAPAN METODE KLASIFIKASI SUPPORT VECTOR
MACHINE PADA DATA AKREDITASI SEKOLAH DASAR DI
KOTA SURABAYA
ABSTRAK
Akreditasi merupakan pengakuan terhadap lembaga pendidikan yang
diberikan oleh badan yang berwenang yaitu Badan Akreditasi Nasional
Sekolah/Madrasah (BAN-S/M) setelah dinilai bahwa lembaga pendidikan itu
memenuhi delapan komponen penilaian akreditasi. Sekolah Dasar (SD)
sebagai salah satu jenjang pendidikan wajib dasar harus memiliki status
akreditasi guna menjamin mutu penyelenggaraan pendidikan. Penelitian ini
bertujuan untuk menerapkan metode klasifikasi Support Vector Machine
(SVM) pada data akreditasi SD di Kota Surabaya. Support Vector Machine
(SVM) merupakan salah satu metode yang dapat digunakan sebagai
klasifikasi dengan konsep mencari hyperplane (fungsi pemisah) terbaik yang
dapat memisahkan data sesuai dengan kelasnya. SVM menggunakan kernel
trick untuk problem non linier yang dapat mentransformasikan data ke ruang
berdimensi tinggi menggunakan fungsi kernel, sehingga data dapat
diklasifikasikan secara linier.
Kata Kunci : Akreditasi SD, Akurasi, Hyperplanel, Support Vector
Machine (SVM) .
iii
APPLICATION OF THE SUPPORT VECTOR MACHINE
CLASSIFICATION METHOD IN BASIC SCHOOL
ACCREDITATION DATA IN SURABAYA CITY
ABSTRACT
Accreditation is the recognition of an educational institution given by a
competent authority, that is Badan Akreditasi Nasional Sekolah/Madrasah (BAN
- S/M) after it is assessed that the institution has met the eight components of
the accreditation assessment. An elementary school, as one of the compulsory
basic education, should have the status of accreditation to ensure the quality of
education. This study aimed to apply the classification method Support Vector
Machine (SVM) on the data accreditation SD in Surabaya. Support Vector
Machine (SVM) is a method that can be used as a predictive classification by
using the concept of searching hyperplane (separator functions) that can
separate the data according to the class. SVM using the kernel trick for non-
linear problems which can transform data into a high dimensional space using a
kernel function, so that the data can be classified linearly.
Keywords : Accreditation, Accuracy, Classification, Hyperplane, Support
Vector Machine (SVM).
iv
DAFTAR ISI
Halaman
HALAMAN JUDUL...............................................................................................i
LEMBAR PENGESAHAN...................................................................................ii
ABSTRAK.............................................................................................................iii
ABSTRACT............................................................................................................iv
DAFTAR ISI...........................................................................................................v
DAFTAR TABEL................................................................................................vii
DAFTAR GAMBAR..........................................................................................viii
BAB I.......................................................................................................................1
1.1 Latar Belakang..........................................................................................1
1.2 Rumusan Masalah.....................................................................................1
1.3 Tujuan Penelitian.......................................................................................2
1.4 Manfaat Penelitian.....................................................................................2
1.5 Batasan Masalah........................................................................................2
BAB II.....................................................................................................................3
2.1 Support Vector Machine............................................................................3
2.1.1 Definisi Support Vector Machine ...............................................3
2.1.2 Non-Linier Classification (Klasifikasi yang Tidak Linier).........6
2.2 Support Vector Machine (One-Against-All)..............................................8
2.3 Ukuran Performa Klasifikasi.....................................................................9
2.4 Standar Nasional Pendidikan...................................................................10
BAB III..................................................................................................................12
3.1 Sumber Data............................................................................................12
3.2 Variabel Penelitian..................................................................................12
3.3 Langkah-Langkah Penelitian...................................................................12
3.4 Diagram Alir............................................................................................14
DAFTAR PUSTAKA...........................................................................................15
v
DAFTAR TABEL
Halaman
Tabel 2.1 Ilustrasi One Against All..........................................................................9
Tabel 2.2 Confusion Matrix...................................................................................10
Tabel 3.1 Struktur Data Penelitian.........................................................................12
vi
DAFTAR GAMBAR
Halaman
Gambar 2.1 Fungsi Hyperplane Optimal dalam Kasus Klasifikasi.........................6
Gambar 2.2 Fungsi Φ Memetakan Data ke Ruang Vektor Berdimensi Tinggi. 7
Gambar 2.3 Ilustrasi One Against All......................................................................9
vii
BAB I
PENDAHULUAN
1
Berdasarkan Standar Nasional Pendidikan Dengan Metode Fuzzy C-Means dan
Imputasi Value Dengan Metode Regresi. Berdasarkan hasil penelitian, maka dapat
diketahui bahwa pada sub indikator standar sarana prasarana dengan metode
regresi dapat menaikkan rata-rata standar sarana prasarana dari 3,8463 menjadi
5,1220 sehinggal nilai standar sarana prasarana menjadi lebih baik.
Pada penelitian ini peneliti ingin menerapkan metode klasifikasi Support
Vector Machine (SVM) pada akreditasi Sekolah Dasar (SD) di Kota Surabaya.
Tujuan dari penelitian ini adalah menerapkan metode klasifikasi Support Vector
Machine pada data akreditasi Sekolah Dasar (SD) di Kota Surabaya.
1.2 Rumusan Masalah
Berdasarkan latar belakang yang telah dipaparkan, maka rumusan
permasalahan pada penelitian ini adalah bagaimana ketepatan klasifikasi pada data
akreditasi Sekolah Dasar di Kota Surabaya menggunakan Support Vector
Machine?
2
BAB II
TINJAUAN PUSTAKA
3
sampel negatif (-1) dapat dirumuskan sebagai pattern yang memenuhi
Pertidaksamaan (2.2) sebagai berikut.
→ →
'
h( x)=w x +b≤−1 (2.2)
Sedangkan pattern
xi yang termasuk kelas sampel positif (+1) dapat
dirumuskan sebagai pattern yang memenuhi Pertidaksamaan (2.3) sebagai
berikut.
→ →
h( x)=w' x +b≥+1 (2.3)
Margin terbesar dapat ditemukan dengan memaksimalkan nilai jarak antara
1
→
hyperplane dan titik terdekatnya, yaitu ‖w‖ . Hal ini dapat dirumuskan sebagai
Quadratic Programming (QP) Problem, yaitu mencari titik minimal yang dapat
ditulis pada Persamaan (2.4) dengan memperhatikan constraint pada Persamaan
(2.5) sebagai berikut.
1 →2
min τ (w )= ‖w‖
w 2 (2.4)
→→
y i (w x +b )−1≥0 , ∀i (2.5)
Problem ini dapat diselesaikan dengan berbagai teknik komputasi,
diantaranya dengan menggunakan Lagrange Multipiler yang dapat ditulis pada
Persamaan (2.6) sebagai berikut.
n
1 → → →
L(w , b , a )= ‖w‖2 −∑ ai ( y i (( wi x i +b )−1))
2 i=1 (2.6)
ai merupakan Lagrange Multipiler yang bernilai nol atau positif (
4
dengan memperhatikan sifat bahwa pada titik gradien optimal adalah L = 0.
Persamaan (2.6) dapat dimodifikasi sebagai maksimalisasi problem yang
mengandung
ai yang dapat ditulis pada Persamaan (2.7) sebagai berikut.
Maksimasi :
n n n
1 → →
LM =∑ a i− ∑ ∑ ai a j y i y j x iT x j
i =1 2 i=1 j=1 (2.7)
Dengan Constraint :
n
ai ≥0 ,(i=1,2 , .. . ,n ) ∑ ai y i=0
i=1 (2.8)
variable ξ (ξ>0) yang dapat ditulis pada Persamaan (2.9) sebagai berikut.
→→
y i ( x i w +b )−1≥1−ζ i ∀i (2.9)
Dengan demikian Persamaan (2.4) diubah menjadi Persamaan (2.10) yang
sudah ditulis sebagai berikut.
n
1 →
min τ (w , ζ )= ‖w‖2 +C ∑ ζ i
w 2 i=1 (2.10)
5
Dimana parameter C digunakan untuk mengontrol tradeoff antara margin
dan error ζ . Nilai C yang besar berarti akan memberikan penalty yang lebih
besar terhadap error klasifikasi tersebut [ CITATION Sem07 \l 1057 ].
Persamaan (2.3) yang berguna untuk melakukan klasifikasi menggunakan
support vector machine dimana pada simbol xij merupakan variabel ke-i pada
variabel ke-j. Kemudian dilanjutkan dengan Persamaan (2.5) untuk mendapatkan
→
nilai w dan b. Nilai tersebut dapat digunakan untuk menentukan persamaan
fungsi hyperplane. Sehingga fungsi hyperplane dapat dilihat pada Gambar 2.2
sebagai berikut.
→
dipetakan fungsi Φ( x i ) ke ruang vektor yang berdimensi lebih tinggi.
Hyperplane yang memisahkan kedua kelas tersebut dapat dikonstruksikan.
→
6
ruang vektor baru yang berdimensi lebih tinggi (dimensi 3), sehingga kedua kelas
dapat dipisahkan secara linier oleh sebuah hyperplane. Notasi matematika dari
mapping dapat dilihat pada Persamaan (2.11) dan ditunjukkan pada Gambar (2.3)
sebagai berikut.
d d
Φ ∈ ℜ →ℜ d <q (2.11)
yaitu
Φ( x i ).Φ( x j ) .
Karena umumnya transformasi Φ tidak diketahui dan sangat sulit untuk
dipahami secara mudah, maka perhitungan dot product dapat digunakan dengan
→ →
fungsi Kernel
KΦ( x i ,x j ) yang mendefinisikan secara implisit dari transformasi
Φ . Hal ini disebut dengan Kernel Trick yang dirumuskan pada Persamaan
(2.12), Persamaan (2.13), Persamaan (2.14) dan Persamaan (2.15) sebagai berikut.
→ → → →
KΦ( x i ,x j )=Φ( x i ).Φ( x j ) (2.12)
→ → →
f (Φ ( x i ))=w . Φ( x )+b (2.13)
→ n → →
f (Φ ( x i ))= ∑ ai y i Φ(x i ). Φ(x j )+b
i−1 , X , cSV (2.14)
7
→ n → →
f (Φ ( x i ))= ∑ ai y i K ( x i , x j )+b
i−1 , X , cSV (2.15)
Dimana pada Persamaan (2.13) terdapat SV merupakan subset dari data
→
training yang terpilih sebagai support vector, dengan kata lain x i merupakan
8
4. Kernel Tangent Hyperbolic merupakan kernel yang umum digunakan untuk
neural networks yang dapat ditulis pada Persamaan (2.19) sebagai berikut.
→ → → →
K( x i ,x j )=tanh ( γ x iT x j +r ) ,γ>0 (2.19)
2.2 Support Vector Machine Multiclass (One-Against-All)
Pada awalnya SVM dikembangkan untuk persoalan klasifikasi dua kelas,
kemudian dikembangkan kembali untuk klasifikasi multikelas. Dalam klasifikasi
kasus multikelas, hyperplane yang terbentuk adalah lebih dari satu. Salah satu
metode pendekatan yang digunakan adalah metode One-Against-All. Metode
One-Against-All membangun k buah model SVM biner dengan k adalah jumlah
kelas. Model SVM ke-m dilatih dengan semua contoh kelas dengan m label
positif dan yang lainnya label negatif. Berdasarkan hal tersebut data latih l (x1, y1),
d y i ∈ { 1,2 ,. . , k }
... ,(x1,y1) dimana ⃗x ∈ ℜ , i = 1,..., l dan merupakan kelas dari xi,
permasalahan tersebut dapat diselesaikan dengan Persamaan (2.20) :
l
1
min ( w) (w m )T wm +C ∑ ξ mi
m i i
w ,b ,ξ 2 i=1 (2.20)
m T m m
Dengan (w ) φ( x m )+b ≥1−ξ i → y i=m
(2.21)
m T m m
(w ) φ( x m )+b ≤−1+ξ i → y i =m
(2.21)
m
ξ i ≥0 , i = 1,..., l
Contohnya, terdapat permasalahan klasifikasi dengan 3 buah kelas. Tiga
buah model SVM biner digunakan untuk pelatihan seperti pada Tabel 2.1 dan
penggunaannya dalam memprediksi kelas data baru dapat dilihat pada Gambar 2.4
Tabel 2.1 Ilustrasi One Against All
Yi = 1 Yi = -1 Hipotesis
Kelas
Bukan Kelas 1 f 1 ( x )=(w1 ) x+b 1
1
Kelas
Bukan Kelas 2 f 2 ( x )=(w2 ) x+ b2
2
Kelas
Bukan Kelas 3 f 3 ( x )=(w3 ) x+b3
3
9
f 1(x)
Kelas 1 f 2(x)
Kelas 2 f 3(x)
Kelas 3 unknown
Gambar 2.3 Ilustrasi One Against All
10
2.4 Standar Nasional Pendidikan
Undang-undang Dasar Negara Republik Indonesia tahun 1945 Pasal 31 ayat
(3) mengamanatkan bahwa pemerintah mengusahakan dan menyelenggarakan
satu sistem pendidikan nasional yang meningkatkan keimanan dan ketakwaan
serta akhlak mulia dalam rangka mencerdaskan kehidupan bangsa yang diatur
dengan undang-undang. Atas dasar undang-undang tersebut pemerintah
memberikan rambu-rambu sebagai pedoman agar sekolah di Indonesia memiliki
kualitas yang baik, salah satunya adalah dengan menerbitkan Standar Nasional
Pendidikan (SNP). Menurut Peraturan Pemerintah nomor 19 tahun 2005 bab 1
pasal 1 ayat 1, yang dimaksud dengan standar nasional pendidikan adalah kriteria
minimal tentang sistem pendidikan di seluruh wilayah hukum Negara Kesatuan
Republik Indonesia. Standar nasional pendidikan merupakan bagian dari amanat
UU No. 20 tahun 2003, yang kemudian dijabarkan dalam PP No. 32 Tahun 2013
tentang Standar Nasional Pendidikan. Standar Nasional Pendidikan digunakan
sebagai acuan pengembangan kurikulum, tenaga kependidikan, sarana dan
prasarana, pengelolaan, dan pembiayaan dan pengembangan standar nasional
pendidikan serta pemantauan dan pelaporan pencapaiannya secara nasional
dilaksanakan oleh suatu badan standarisasi, penjaminan, dan pengendalian mutu
pendidikan.
11
BAB III
METODOLOGI PENELITIAN
12
a. Menggunakan data training untuk membangun model klasifikasi
Support Vector Machine (SVM).
b. Menggunakan data testing untuk menentukan prediksi dari model
klasifikasi Support Vector Machine (SVM).
c. Menggunakan confusion matrix untuk mengetahui persentase nilai
akurasi dari klasifikasi Support Vector Machine (SVM) dengan
membandingkan model klasifikasi Support Vector Machine (SVM)
dan nilai prediksi dari model klasifikasi Support Vector Machine
(SVM).
13
3.4 Diagram Alir
Berikut adalah diagram flowchart yang ditunjukkan pada Gambar 3.1.
Mulai
Mengumpulkan Data
Statistika Deskriptif
Kesimpulan
Selesai
14
DAFTAR PUSTAKA
15