Hananto Yudha N - 192409022 (SEMPRO)

PROPOSAL SKRIPSI
PENERAPAN METODE KLASIFIKASI SUPPORT

VECTOR MACHINE PADA DATA AKREDITASI
SEKOLAH DASAR DI KOTA SURABAYA
HANANTO YUDHA NUGROHO

NIM. 192409022
PROGRAM STUDI STATISTIKA

FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS PGRI ADI BUANA
SURABAYA
2020
LEMBAR PENGESAHAN
Yang bertanda tangan di bawah ini menyatakan bahwa :
Nama : Hananto Yudha Nugroho
NIM : 192409022
Pembimbing : Elvira Mustikawati P. H., S.Si., M.Si.
Judul Proposal : Penerapan Metode Klasifikasi Support Vector Machine

Pada Data Akreditasi Sekolah Dasar di Kota Surabaya
Disetujui untuk diseminarkan pada seminar proposal skripsi di Program Studi
Statistika Universitas PGRI Adi Buana Surabaya.
Surabaya, 31 Januari 2021

Pembimbing,
Elvira Mustikawati P. H., S.Si., M.Si.

NPP. 1610820/DY
ii
PENERAPAN METODE KLASIFIKASI SUPPORT VECTOR
MACHINE PADA DATA AKREDITASI SEKOLAH DASAR DI
KOTA SURABAYA
Nama Peneliti : Hananto Yudha Nugroho

NRP : 192409022
Dosen Pembimbing : Elvira Mustikawati P. H., S.Si., M.Si.
ABSTRAK
Akreditasi merupakan pengakuan terhadap lembaga pendidikan yang
diberikan oleh badan yang berwenang yaitu Badan Akreditasi Nasional
Sekolah/Madrasah (BAN-S/M) setelah dinilai bahwa lembaga pendidikan itu
memenuhi delapan komponen penilaian akreditasi. Sekolah Dasar (SD)
sebagai salah satu jenjang pendidikan wajib dasar harus memiliki status
akreditasi guna menjamin mutu penyelenggaraan pendidikan. Penelitian ini
bertujuan untuk menerapkan metode klasifikasi Support Vector Machine
(SVM) pada data akreditasi SD di Kota Surabaya. Support Vector Machine
(SVM) merupakan salah satu metode yang dapat digunakan sebagai
klasifikasi dengan konsep mencari hyperplane (fungsi pemisah) terbaik yang
dapat memisahkan data sesuai dengan kelasnya. SVM menggunakan kernel
trick untuk problem non linier yang dapat mentransformasikan data ke ruang
berdimensi tinggi menggunakan fungsi kernel, sehingga data dapat
diklasifikasikan secara linier.
Kata Kunci : Akreditasi SD, Akurasi, Hyperplanel, Support Vector
Machine (SVM) .
iii
APPLICATION OF THE SUPPORT VECTOR MACHINE
CLASSIFICATION METHOD IN BASIC SCHOOL
ACCREDITATION DATA IN SURABAYA CITY
Nama Peneliti : HanantoYudha Nugroho

NRP : 192409022
Supervisor : Elvira Mustikawati P. H., S.Si., M.Si.
ABSTRACT
Accreditation is the recognition of an educational institution given by a
competent authority, that is Badan Akreditasi Nasional Sekolah/Madrasah (BAN
- S/M) after it is assessed that the institution has met the eight components of
the accreditation assessment. An elementary school, as one of the compulsory
basic education, should have the status of accreditation to ensure the quality of
education. This study aimed to apply the classification method Support Vector
Machine (SVM) on the data accreditation SD in Surabaya. Support Vector
Machine (SVM) is a method that can be used as a predictive classification by
using the concept of searching hyperplane (separator functions) that can
separate the data according to the class. SVM using the kernel trick for non-
linear problems which can transform data into a high dimensional space using a
kernel function, so that the data can be classified linearly.
Keywords : Accreditation, Accuracy, Classification, Hyperplane, Support
Vector Machine (SVM).
iv
DAFTAR ISI
Halaman
HALAMAN JUDUL...............................................................................................i
LEMBAR PENGESAHAN...................................................................................ii
ABSTRAK.............................................................................................................iii
ABSTRACT............................................................................................................iv
DAFTAR ISI...........................................................................................................v
DAFTAR TABEL................................................................................................vii
DAFTAR GAMBAR..........................................................................................viii
BAB I.......................................................................................................................1
1.1 Latar Belakang..........................................................................................1
1.2 Rumusan Masalah.....................................................................................1
1.3 Tujuan Penelitian.......................................................................................2
1.4 Manfaat Penelitian.....................................................................................2
1.5 Batasan Masalah........................................................................................2
BAB II.....................................................................................................................3
2.1 Support Vector Machine............................................................................3
2.1.1 Definisi Support Vector Machine ...............................................3
2.1.2 Non-Linier Classification (Klasifikasi yang Tidak Linier).........6
2.2 Support Vector Machine (One-Against-All)..............................................8
2.3 Ukuran Performa Klasifikasi.....................................................................9
2.4 Standar Nasional Pendidikan...................................................................10
BAB III..................................................................................................................12
3.1 Sumber Data............................................................................................12
3.2 Variabel Penelitian..................................................................................12
3.3 Langkah-Langkah Penelitian...................................................................12
3.4 Diagram Alir............................................................................................14
DAFTAR PUSTAKA...........................................................................................15
v
DAFTAR TABEL
Halaman
Tabel 2.1 Ilustrasi One Against All..........................................................................9
Tabel 2.2 Confusion Matrix...................................................................................10
Tabel 3.1 Struktur Data Penelitian.........................................................................12
vi
DAFTAR GAMBAR
Halaman
Gambar 2.1 Fungsi Hyperplane Optimal dalam Kasus Klasifikasi.........................6
Gambar 2.2 Fungsi Φ Memetakan Data ke Ruang Vektor Berdimensi Tinggi. 7
Gambar 2.3 Ilustrasi One Against All......................................................................9
vii
BAB I
PENDAHULUAN
1.1 Latar Belakang

Pemerintah melakukan akreditasi untuk menilai kelayakan program
dan/atau satuan pendidikan. Dalam rangka penjaminan dan peningkatan mutu
pendidikan nasional secara bertahap, terencana dan terukur sesuai amanat
Undang-undang Nomor 20 Tahun 2003 tentang Sistem Pendidikan Nasional.
Berkaitan dengan hal tersebut, Pemerintah telah menetapkan Badan Akreditasi
Nasional Sekolah/Madrasah (BAN-S/M) dengan Peraturan Mendiknas Nomor 29
Tahun 2005. Standar Nasional Pendidikan di Indonesia diatur dalam Peraturan
Pemerintah (PP) No. 19 Tahun 2005. Di dalam PP tersebut, disebutkan bahwa
lingkup Standar Nasional Pendidikan meliputi (1) Standar Isi, (2) Standar Proses,
(3) Standar Kompetensi Lulusan, (4) Standar Pendidik dan Tenaga Kependidikan,
(5) Standar Sarana dan Pra Sarana, (6) Standar Pengelolaan, (7) Standar
Pembiayaan, dan (8) Standar Penilaian Pendidikan
Akreditasi menurut Kamus Besar Bahasa Indonesia adalah pengakuan
terhadap lembaga pendidikan yang diberikan oleh badan yang berwenang setelah
dinilai bahwa lembaga itu memenuhi syarat kebakuan atau kriteria tertentu
(KBBI, 2016). BAN- S/M sesuai dengan kewenangannya menerbitkan sertifikat
akreditasi yang memuat nilai hasil akreditasi sebagai status akreditasi sekolah
yang dinyatakan dalam huruf A (Amat baik), B (Baik), dan C (Cukup baik).
Status akreditasi ini berlaku untuk kurun waktu 5 tahun sejak tanggal ditetapkan.
Setelah kurun waktu 5 tahun sekolah harus diakreditasi ulang.
Salah satu metode statistik yang dapat diterapkan untuk melakukan klasifikasi
adalah Support Vector Machine (SVM). SVM merupakan suatu teknik untuk
menemukan hyperplane yang bisa memisahkan dua set data dari dua kelas yang
berbeda (Vapnik, 1995). SVM memiliki kelebihan diantaranya adalah dalam
menentukan jarak menggunakan support vector sehingga proses komputasi
menjadi cepat (Vapnik, 1995). Penelitian yang terkait telah dilakukan oleh
Harwati (2020) yaitu Pengelompokkan Mutu Sekolah Dasar di Indonesia
1
Berdasarkan Standar Nasional Pendidikan Dengan Metode Fuzzy C-Means dan
Imputasi Value Dengan Metode Regresi. Berdasarkan hasil penelitian, maka dapat
diketahui bahwa pada sub indikator standar sarana prasarana dengan metode
regresi dapat menaikkan rata-rata standar sarana prasarana dari 3,8463 menjadi
5,1220 sehinggal nilai standar sarana prasarana menjadi lebih baik.
Pada penelitian ini peneliti ingin menerapkan metode klasifikasi Support
Vector Machine (SVM) pada akreditasi Sekolah Dasar (SD) di Kota Surabaya.
Tujuan dari penelitian ini adalah menerapkan metode klasifikasi Support Vector
Machine pada data akreditasi Sekolah Dasar (SD) di Kota Surabaya.
1.2 Rumusan Masalah
Berdasarkan latar belakang yang telah dipaparkan, maka rumusan
permasalahan pada penelitian ini adalah bagaimana ketepatan klasifikasi pada data
akreditasi Sekolah Dasar di Kota Surabaya menggunakan Support Vector
Machine?
1.3 Tujuan Penelitian

Tujuan pada penelitian ini adalah untuk mengetahui ketepatan klasifikasi
pada data akreditasi Sekolah Dasar di Kota Surabaya menggunakan Support
Vector Machine.
1.4 Manfaat Penelitian
Manfaat dari penelitian ini adalah untuk memberikan informasi kepada
publik terhadap akreditasi Sekolah Dasar di Kota Surabaya melalui hasil
klasifikasi menggunakan Support Vector Machine.
1.5 Batasan Masalah

Batasan masalah pada penelitian ini adalah nilai Standar Nasional dan nilai
akreditasi Sekolah Dasar di Kota Surabaya dengan status akreditasi A, B, dan C
yang didapatkan dari website resmi BAN-S/M.
2
BAB II
TINJAUAN PUSTAKA
2.1 Support Vector Machine

Support Vector Machine (SVM) dikembangkan oleh Boser, Guyon dan
Vapnik pada tahun 1992 di Annual Workshop on Coputational Learning Theory.
Konsep dasar Support Vector Machine (SVM) merupakan kombinasi harmonis
dari teori-teori komputasi yang telah ada puluhan tahun sebelumnya, seperti
margin hyperplane. Kernel diperkenalkan oleh Aronszajn tahun 1950, dan
demikian juga dengan konsep-konsep pendukung lainnya. Akan tetapi hingga
tahun 1992, belum pernah ada upaya merangkai komponen-komponen tersebut.
2.1.1 Definisi Support Vector Machine (SVM)
Konsep Support Vector Machine (SVM) dijelaskan secara sederhana
sebagai usaha mencari hyperplane terbaik yang berfunngsi sebagai pemisah dua
buah kelas pada input space. Pattern merupakan anggota dari dua buah kelas (+1)
dan (-1) dan berbagai alternatif garis pemisah (discrimination boundaries).
Margin merupakan jarak antara hyperplane tersebut dengan pattern terdekat dari
masing-masing kelas. Pattern yang paling dekat ini disebut dengan support
vector. Usaha untuk mencari lokasi hyperplane ini merupakan inti dari proses
pembelajaran pada Support Vector Machine (SVM) [ CITATION Chr00 \l 1057 ].
d
Data yang tersedia dinotasikan sebagai xi∈ ℜ sedangkan label masing-
masing dinotasikan y i ∈ {−1 ,+1 } untuk i = 1,2,...,n dimana n merupakan

banyaknya data. Diasumsikan kedua kelas (-1) dan (+1) dapat terpisah secara
sempurna oleh hyperplane yang berdimensi d yang dapat ditulis seperti
Persamaan (2.1) dan Persamaan (2.2) sebagai berikut.
→ →
'
h( x)=w x +b=0 (2.1)
Dimana w adalah vektor bobot untuk dimensi ke d dan b adalah suatu
konstanta yang biasa disebut bias (skalar). Pattern

xi yang termasuk kelas
3
sampel negatif (-1) dapat dirumuskan sebagai pattern yang memenuhi
Pertidaksamaan (2.2) sebagai berikut.
→ →
'
h( x)=w x +b≤−1 (2.2)
Sedangkan pattern
xi yang termasuk kelas sampel positif (+1) dapat
dirumuskan sebagai pattern yang memenuhi Pertidaksamaan (2.3) sebagai
berikut.
→ →
h( x)=w' x +b≥+1 (2.3)
Margin terbesar dapat ditemukan dengan memaksimalkan nilai jarak antara
1
→
hyperplane dan titik terdekatnya, yaitu ‖w‖ . Hal ini dapat dirumuskan sebagai
Quadratic Programming (QP) Problem, yaitu mencari titik minimal yang dapat
ditulis pada Persamaan (2.4) dengan memperhatikan constraint pada Persamaan
(2.5) sebagai berikut.
1 →2
min τ (w )= ‖w‖
w 2 (2.4)
→→
y i (w x +b )−1≥0 , ∀i (2.5)
Problem ini dapat diselesaikan dengan berbagai teknik komputasi,
diantaranya dengan menggunakan Lagrange Multipiler yang dapat ditulis pada
Persamaan (2.6) sebagai berikut.
n
1 → → →
L(w , b , a )= ‖w‖2 −∑ ai ( y i (( wi x i +b )−1))
2 i=1 (2.6)
ai merupakan Lagrange Multipiler yang bernilai nol atau positif (
ai ≥0 ), sedangkan i = 1,2,...,n. Nilai optimal dari Persamaan (2.6) dapat

→
meminimalkan L terhadap w dan b, dan memaksimalkan L terhadap ai
4
dengan memperhatikan sifat bahwa pada titik gradien optimal adalah L = 0.
Persamaan (2.6) dapat dimodifikasi sebagai maksimalisasi problem yang
mengandung
ai yang dapat ditulis pada Persamaan (2.7) sebagai berikut.
Maksimasi :
n n n
1 → →
LM =∑ a i− ∑ ∑ ai a j y i y j x iT x j
i =1 2 i=1 j=1 (2.7)
Dengan Constraint :
n
ai ≥0 ,(i=1,2 , .. . ,n ) ∑ ai y i=0
i=1 (2.8)
Dari hasil perhitungan ini diperoleh

ai yang bernilai positif sehingga data
yang berkorelasi dengan

ai yang positif disebut dengan support vector
[ CITATION Vap95 \l 1057 ].
Penjelasan di atas berdasarkan asumsi bahwa kedua belah kelas terpisah
secara sempurna oleh hyperplane (linear separable). Akan tetapi, pada umumnya
dua belah kelas pada input space tidak dapat terpisah secara sempurna (non
linear separable). Hal ini yang menyebabkan constraint pada Persamaan (2.5)
tidak dapat terpenuhi, sehingga optimasi tidak dapat dilakukan. Untuk mengatasi
masalah ini, Support Vector Machine (SVM) dirumuskan ulang dengan
memperkenalkan teknik softmargin.
Dalam softmargin, Persamaan (2.5) dimodifikasi dengan memasukkan slack
variable ξ (ξ>0) yang dapat ditulis pada Persamaan (2.9) sebagai berikut.
→→
y i ( x i w +b )−1≥1−ζ i ∀i (2.9)
Dengan demikian Persamaan (2.4) diubah menjadi Persamaan (2.10) yang
sudah ditulis sebagai berikut.
n
1 →
min τ (w , ζ )= ‖w‖2 +C ∑ ζ i
w 2 i=1 (2.10)
5
Dimana parameter C digunakan untuk mengontrol tradeoff antara margin
dan error ζ . Nilai C yang besar berarti akan memberikan penalty yang lebih
besar terhadap error klasifikasi tersebut [ CITATION Sem07 \l 1057 ].
Persamaan (2.3) yang berguna untuk melakukan klasifikasi menggunakan
support vector machine dimana pada simbol xij merupakan variabel ke-i pada
variabel ke-j. Kemudian dilanjutkan dengan Persamaan (2.5) untuk mendapatkan
→
nilai w dan b. Nilai tersebut dapat digunakan untuk menentukan persamaan
fungsi hyperplane. Sehingga fungsi hyperplane dapat dilihat pada Gambar 2.2
sebagai berikut.
Gambar 2.1 Fungsi Hyperplane Optimal dalam Kasus Klasifikasi
2.1.2 Non-Linier Classification (Klasifikasi yang Tidak Linier)

Pada umumnya masalah dalam domain dunia nyata (real world problem)
jarang yang bersifat linear separable (tidak terpisahkan secara linier), tetapi
bersifat non-linier. Untuk menyelesaikan problem non-linier, Support Vector
Machine (SVM) dimodifikasikan dengan memasukkan fungsi fungsi kernel.
→
Dalam non-linier Support Vector Machine (SVM), pertama kali data xi
→
dipetakan fungsi Φ( x i ) ke ruang vektor yang berdimensi lebih tinggi.
Hyperplane yang memisahkan kedua kelas tersebut dapat dikonstruksikan.
→
Selanjutnya fungsi Φ( x i ) memetakan tiap data pada input space tersebut ke
6
ruang vektor baru yang berdimensi lebih tinggi (dimensi 3), sehingga kedua kelas
dapat dipisahkan secara linier oleh sebuah hyperplane. Notasi matematika dari
mapping dapat dilihat pada Persamaan (2.11) dan ditunjukkan pada Gambar (2.3)
sebagai berikut.
d d
Φ ∈ ℜ →ℜ d <q (2.11)
Gambar 2.2 Fungsi Φ Memetakan Data ke Ruang Vektor Berdimensi Tinggi
Selanjutnya proses pembelajaran pada Support Vector Machine (SVM)

dalam menemukan titik-titik support vector hanya bergantung pada dot product
dari data yang sudah ditransformasikan pada ruang baru yang berdimensi tinggi,
→ →
yaitu
Φ( x i ).Φ( x j ) .
Karena umumnya transformasi Φ tidak diketahui dan sangat sulit untuk
dipahami secara mudah, maka perhitungan dot product dapat digunakan dengan
→ →
fungsi Kernel
KΦ( x i ,x j ) yang mendefinisikan secara implisit dari transformasi
Φ . Hal ini disebut dengan Kernel Trick yang dirumuskan pada Persamaan
(2.12), Persamaan (2.13), Persamaan (2.14) dan Persamaan (2.15) sebagai berikut.
→ → → →
KΦ( x i ,x j )=Φ( x i ).Φ( x j ) (2.12)
→ → →
f (Φ ( x i ))=w . Φ( x )+b (2.13)
→ n → →
f (Φ ( x i ))= ∑ ai y i Φ(x i ). Φ(x j )+b
i−1 , X , cSV (2.14)
7
→ n → →
f (Φ ( x i ))= ∑ ai y i K ( x i , x j )+b
i−1 , X , cSV (2.15)
Dimana pada Persamaan (2.13) terdapat SV merupakan subset dari data
→
training yang terpilih sebagai support vector, dengan kata lain x i merupakan
data yang berkorespondensi pada

ai ≥0 .
2.1.3 Fungsi Kernel pada Support Vector Machine (SVM)
Pada mulanya klasifikasi dikembangkan dengan asumsi kelinieran.
Sehingga klasifikasi yang dihasilkan terbatas untuk kasus-kasus linier saja. Akan
tetapi untuk menghadapi kasus yanng tidak linier maka didapatkan menggunakan
bantuan berbagai macam fungsi kernel. Kernel Trick memberikan berbagai
kemudahan karena dalam proses pembelajaran Support Vector Machine (SVM).
Untuk menentukan support vector, maka cukup dengan mengetahui fungsi Kernel
yang dipakai dan tidak perlu mengetahui wujud dari fungsi non-linier, sehingga
diperoleh beberapa fungsi yang sering digunakan dalam literatur Support Vector
Machine (SVM) antara lain sebagai berikut [ CITATION Kar04 \l 1057 ].
1. Kernel Linear merupakan kernel yang paling sederhana dari semua fungsi
kernel pada Persamaan (2.16) sebagai berikut.
→ → → →
K ( x i , x j )=xi T x j (2.16)
2. Kernel Polynomial merupakan kernel yang paling sering digunakan dapat
ditulis pada Persamaan (2.17) sebagai berikut.
→ → → → p
K( x i ,x j )= ( T
)
γ x i x j +r ,γ>0
(2.17)
3. Kernel Radial Basis Gaussian merupakan kernel yang umum digunakan
untuk data yang sudah available (valid) dan merupakan default dalam tools
Support Vector Machine (SVM) yang dapat ditulis pada Persamaan (2.18)
sebagai berikut.
→ → → →
(
K(x i ,x j )=exp −γ‖xi −x j‖2 ,γ>0 ) (2.18)
8
4. Kernel Tangent Hyperbolic merupakan kernel yang umum digunakan untuk
neural networks yang dapat ditulis pada Persamaan (2.19) sebagai berikut.
→ → → →
K( x i ,x j )=tanh ( γ x iT x j +r ) ,γ>0 (2.19)
2.2 Support Vector Machine Multiclass (One-Against-All)
Pada awalnya SVM dikembangkan untuk persoalan klasifikasi dua kelas,
kemudian dikembangkan kembali untuk klasifikasi multikelas. Dalam klasifikasi
kasus multikelas, hyperplane yang terbentuk adalah lebih dari satu. Salah satu
metode pendekatan yang digunakan adalah metode One-Against-All. Metode
One-Against-All membangun k buah model SVM biner dengan k adalah jumlah
kelas. Model SVM ke-m dilatih dengan semua contoh kelas dengan m label
positif dan yang lainnya label negatif. Berdasarkan hal tersebut data latih l (x1, y1),
d y i ∈ { 1,2 ,. . , k }
... ,(x1,y1) dimana ⃗x ∈ ℜ , i = 1,..., l dan merupakan kelas dari xi,
permasalahan tersebut dapat diselesaikan dengan Persamaan (2.20) :
l
1
min ( w) (w m )T wm +C ∑ ξ mi
m i i
w ,b ,ξ 2 i=1 (2.20)
m T m m
Dengan (w ) φ( x m )+b ≥1−ξ i → y i=m
(2.21)
m T m m
(w ) φ( x m )+b ≤−1+ξ i → y i =m
(2.21)
m
ξ i ≥0 , i = 1,..., l
Contohnya, terdapat permasalahan klasifikasi dengan 3 buah kelas. Tiga
buah model SVM biner digunakan untuk pelatihan seperti pada Tabel 2.1 dan
penggunaannya dalam memprediksi kelas data baru dapat dilihat pada Gambar 2.4
Tabel 2.1 Ilustrasi One Against All
Yi = 1 Yi = -1 Hipotesis
Kelas
Bukan Kelas 1 f 1 ( x )=(w1 ) x+b 1
1
Kelas
Bukan Kelas 2 f 2 ( x )=(w2 ) x+ b2
2
Kelas
Bukan Kelas 3 f 3 ( x )=(w3 ) x+b3
3
9
f 1(x)
Kelas 1 f 2(x)
Kelas 2 f 3(x)
Kelas 3 unknown
Gambar 2.3 Ilustrasi One Against All
2.3 Ukuran Performa Klasifikasi

Ketepatan klasifikasi merupakan salah satu ukuran untuk mengetahui
seberapa akuratnya dari performa klasifikasi/algoritma tersebut. Untuk melakukan
pengukuran ketepatan klasifikasi, maka dilakukan pembagian kelas menjadi dua
macam yaitu kelas prediksi (predict class) dan kelas aktual (actual class). Berikut
adalah struktur confusion matrix yang dapat dilihat pada Tabel 2.2.
Tabel 2.2 Confusion Matrix

Kelas Prediksi
Kelas 1 Kelas 2 Kelas 3
Kelas 1 F11 F12 F13
Kelas
Kelas 2 F21 F22 F23
Aktual
Kelas 3 F31 F32 F33
Ketepatan klasifikasi dapat diukur menggunakan akurasi, sensitivitas,
spesifisitas (Sokolova dan Lapalme, 2009). Akurasi klasifikasi menunjukkan
efektivitas classifier secara keseluruhan. Semakin tinggi nilai akurasi, maka
semakin baik pula kinerja classifier dalam mengklasifikasikan data. Sensitivitas
mengukur efektivitas sebuah classifier untuk mengidentifikasi kelas positif,
sedangkan spesifisitas mengukur efektivitas classifier untuk mengidentifikasi
kelas negatif.
F 11 + F22 + F 33
Akurasi=
F 12+ F 13 + F21 + F 23 + F 31+ F 32 + F11 + F 22 + F33 (2.20)
F 12 + F 13+ F 21 + F23 + F 31+ F 32
Error=
F 12 + F 13 + F21 + F 23 + F 31+ F 32 + F11 + F 22 + F33 (2.21)
10
2.4 Standar Nasional Pendidikan
Undang-undang Dasar Negara Republik Indonesia tahun 1945 Pasal 31 ayat
(3) mengamanatkan bahwa pemerintah mengusahakan dan menyelenggarakan
satu sistem pendidikan nasional yang meningkatkan keimanan dan ketakwaan
serta akhlak mulia dalam rangka mencerdaskan kehidupan bangsa yang diatur
dengan undang-undang. Atas dasar undang-undang tersebut pemerintah
memberikan rambu-rambu sebagai pedoman agar sekolah di Indonesia memiliki
kualitas yang baik, salah satunya adalah dengan menerbitkan Standar Nasional
Pendidikan (SNP). Menurut Peraturan Pemerintah nomor 19 tahun 2005 bab 1
pasal 1 ayat 1, yang dimaksud dengan standar nasional pendidikan adalah kriteria
minimal tentang sistem pendidikan di seluruh wilayah hukum Negara Kesatuan
Republik Indonesia. Standar nasional pendidikan merupakan bagian dari amanat
UU No. 20 tahun 2003, yang kemudian dijabarkan dalam PP No. 32 Tahun 2013
tentang Standar Nasional Pendidikan. Standar Nasional Pendidikan digunakan
sebagai acuan pengembangan kurikulum, tenaga kependidikan, sarana dan
prasarana, pengelolaan, dan pembiayaan dan pengembangan standar nasional
pendidikan serta pemantauan dan pelaporan pencapaiannya secara nasional
dilaksanakan oleh suatu badan standarisasi, penjaminan, dan pengendalian mutu
pendidikan.
11
BAB III
METODOLOGI PENELITIAN
3.1 Sumber Data

Sumber data yang digunakan dalam penelitian ini adalah data sekunder yang
didapatkan dari website resmi BAN-S/M. Variabel yang digunakan dalam
penelitian ini adalah nilai Standar Nasional dan nilai akreditasi Sekolah Dasar di
Kota Surabaya dengan status akreditasi A, B, dan C.
3.2 Variabel Penelitian

Pada penelitian ini variabel-variabel yang digunakan untuk melakukan
pengelompokkan dijelaskan pada Tabel 3.1.
Tabel 3.1 Variabel Penelitian
No
Variabel Keterangan Skala
.
0 : Nilai Akreditasi A Ordinal
1 Y 1 : Nilai Akreditasi B Ordinal
2 : Nilai Akreditasi C Ordinal
2 X1 Standar Kompetisi Lulusan Interval
3 X2 Standar Isi Interval
4 X3 Standar Proses Interval
5 X4 Standar Penilaian Interval
6 X5 Standar Pendidik dan Tenaga Kependidikan Interval
7 X6 Standar Sarana Prasarana Interval
8 X7 Standar Pengelolaan Interval
9 X8 Standar Pembiayaan Interval
3.3 Langkah-Langkah Penelitian

Langkah awal yang dilakukan sebelum menganalisis dengan metode yang
digunakan adalah sebagai berikut.
1. Melakukan partisi dataset yang diperoleh dibagi menjadi 2 bagian yaitu
data training (60%) dan data testing (40%). Seperti yang telah dijelaskan
pada metode penelitian dalam bab sebelumnya, akan digunakan metode
klasifikasi yang terdapat dalam data mining yaitu Support Vector Machine
(SVM) untuk mencari nilai akurasi terbaik
2. Klasifikasi data menggunakan Support Vector Machine (SVM) untuk
masing-masing akreditasi Sekolah Dasar di Kota Surabaya.
12
a. Menggunakan data training untuk membangun model klasifikasi
Support Vector Machine (SVM).
b. Menggunakan data testing untuk menentukan prediksi dari model
klasifikasi Support Vector Machine (SVM).
c. Menggunakan confusion matrix untuk mengetahui persentase nilai
akurasi dari klasifikasi Support Vector Machine (SVM) dengan
membandingkan model klasifikasi Support Vector Machine (SVM)
dan nilai prediksi dari model klasifikasi Support Vector Machine
(SVM).
3. Menarik Kesimpulan dan Saran.
13
3.4 Diagram Alir
Berikut adalah diagram flowchart yang ditunjukkan pada Gambar 3.1.
Mulai
Mengumpulkan Data
Statistika Deskriptif
Partisi data menjadi data training dan

testing
Klasifikasi Data dengan Support

Vector Machine
Membangun Model Support Vector

Machine dengan data training
Menentukan Prediksi dari Model

Support Vector Machine dengan data
testing
Menggunakan confusion matrix untuk

mengukur persentasi akurasi dari
Model Support Vector Machine
Kesimpulan
Selesai
Gambar 3.1 Flowchart
14
DAFTAR PUSTAKA
Christianini, & Taylor, S. (2000). An Introduction to Support Vector Machines.

London: Cambridge University Press.
Harwati, Nur Achmey. (2020). Pengelompokkan Mutu Sekolah Dasar Di
Indonesia
Berdasarkan Standar Nasional Pendidikan Dengan Metode Fuzzy C-Means
Dan Imputasi Missing Value Dengan Metode Regeresi. Surabaya: Institut
Teknologi Sepuluh Nopember.
Hsu, C.W. dan Lin, C.J. 2002. A Comparison of Methods for Multi-class Support
Vector Machines. IEEE Transaction on Neural Network, 13(2) : 415- 425.
Karatzouglou, A., Smola, A., Hornik, K., & Zeieis, A. (2004). kernlab - An S4
Package for Kernel Methods in R. Journal of Statistical Software Vol. 11,
No. 9 , 1-20.
Pemerintah Republik Indonesia (2013). Peraturan Pemerintah Republik Indonesia
Nomor 32 Tahun 2013 tentang Standar nasional pendidikan. Jakarta.
Sembiring, K. (2007). Tutorial SVM Bahsa Indonesia. Skripsi S1 Teknik
Informatika ITB. Bandung: Institut Teknologi Bandung.
Sokolova, M,, dan Lapalme, G., (2009), A Systematic Analysis of Performance
Measures for Classification Tasks, Information Processing and Management
45, 427-437.
Vapnik, V. (1995). The Nature of Statistical Learning Theory. Verlag: Springer.
15

Hananto Yudha N - 192409022 (SEMPRO)

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Hananto Yudha N - 192409022 (SEMPRO)

Diunggah oleh

Hak Cipta:

Format Tersedia

PROPOSAL SKRIPSI

PENERAPAN METODE KLASIFIKASI SUPPORT

HANANTO YUDHA NUGROHO

PROGRAM STUDI STATISTIKA

Judul Proposal : Penerapan Metode Klasifikasi Support Vector Machine

Surabaya, 31 Januari 2021

Elvira Mustikawati P. H., S.Si., M.Si.

Nama Peneliti : Hananto Yudha Nugroho

Nama Peneliti : HanantoYudha Nugroho

1.1 Latar Belakang

1.3 Tujuan Penelitian

1.5 Batasan Masalah

2.1 Support Vector Machine

masing dinotasikan y i ∈ {−1 ,+1 } untuk i = 1,2,...,n dimana n merupakan

Dimana w adalah vektor bobot untuk dimensi ke d dan b adalah suatu

konstanta yang biasa disebut bias (skalar). Pattern

ai ≥0 ), sedangkan i = 1,2,...,n. Nilai optimal dari Persamaan (2.6) dapat

Dari hasil perhitungan ini diperoleh

yang berkorelasi dengan

Gambar 2.1 Fungsi Hyperplane Optimal dalam Kasus Klasifikasi

2.1.2 Non-Linier Classification (Klasifikasi yang Tidak Linier)

Selanjutnya fungsi Φ( x i ) memetakan tiap data pada input space tersebut ke

Gambar 2.2 Fungsi Φ Memetakan Data ke Ruang Vektor Berdimensi Tinggi

Selanjutnya proses pembelajaran pada Support Vector Machine (SVM)

data yang berkorespondensi pada

2.3 Ukuran Performa Klasifikasi

Tabel 2.2 Confusion Matrix

3.1 Sumber Data

3.2 Variabel Penelitian

3.3 Langkah-Langkah Penelitian

3. Menarik Kesimpulan dan Saran.

Partisi data menjadi data training dan

Klasifikasi Data dengan Support

Membangun Model Support Vector

Menentukan Prediksi dari Model

Menggunakan confusion matrix untuk

Gambar 3.1 Flowchart

Christianini, & Taylor, S. (2000). An Introduction to Support Vector Machines.

Anda mungkin juga menyukai