Tugas Damin - Muhammad Rifqi A'la - Ilham Melzi - Kelas B

PROJECT DATA MINING
Komparasi Akurasi Artificial Neural Network (ANN) dan Support Vector

Machine (SVM) Dalam Klasifikasi Pada Kasus Job Classification
Menggunakan Optimization Grid
Diajukan sebagai Salah Satu Syarat untuk Memenuhi

Nilai Mata Kuliah Analisis Data Mining
Dosen Pengampu :
Dr. Jadi Suprijadi , DEA.
19571219 198403 1 001
Disusun Oleh :
Ilham Melzi 140610160044
Muhammad Rifqi A 140610160067
Kelas B
PROGRAM STUDI S-1 STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS PADJAJARAN
JATINANGOR
2019
BAB I
METODE PENELITIAN
1.1 Data Penelitian

Data yang digunakan adalah data sekunder yang berasal dari https://data.mendeley.com/
datasets/pd6gsm2m9r/1. Data tersebut merupakan dataset yang terdiri atas satu atribut special,
yaitu atribut system yang terbagi atas dua kategori atau dua kelas, yaitu technical skills yang diberi
symbol angka 1 dan management strategies yang diberi symbol angka 2, serta memiliki enam
atribut reguler, yaitu baseline definition (BD), communication management (CM), human
resources (HR), project control (PC) methodology, risk management (RM), dan stakeholder
management (SM) yang masing-masing berskala ukur interval atau rasio.
1.2 Rumusan Masalah dan Tujuan Penelitian

Rumusan masalah dan tujuan dari penelitian ini adalah sebagai berikut :
a. Rumusan Masalah Penelitian
1. Bagaimana melakukan klasifikasi menggunakan ANN dan SVM ?
2. Berapa tingkat akurasi dan AUC yang diperoleh baik menggunakan ANN maupun
SVM ?
3. Dalam hal klasifikasi, apakah ANN lebih baik dari SVM atau sebaliknya ?
b. Tujuan Penelitian
1. Mengetahui tingkat akurasi dan AUC yang diperoleh baik menggunakan ANN maupun
SVM
2. Memperoleh model klasifikasi terbaik berdasarkan ukuran akurasi dan AUC
1.3 Artificial Neural Network (ANN)

Neural Network merupakan kategori ilmu Soft Computing. Neural Network sebenarnya
mengadopsi dari kemampuan otak manusia yang mampu memberikan stimulasi/rangsangan,
melakukan proses, dan memberikan output. Output diperoleh dari variasi stimulasi dan proses
yang terjadi di dalam otak manusia. Kemampuan manusia dalam memproses informasi merupakan
hasil kompleksitas proses di dalam otak. Misalnya, yang terjadi pada anak-anak, mereka mampu
belajar untuk melakukan pengenalan meskipun mereka tidak mengetahui algoritma apa yang
digunakan. Kekuatan komputasi yang luar biasa dari otak manusia ini merupakan sebuah
keunggulan di dalam kajian ilmu pengetahuan.
Fungsi dari Neural Network diantaranya adalah:
1. Pengklasifikasian pola
2. Memetakan pola yang didapat dari input ke dalam pola baru pada output
3. Penyimpan pola yang akan dipanggil kembali
4. Memetakan pola-pola yang sejenis
5. Pengoptimasi Permasalahan
6. Prediksi
Ide dasar Neural Network dimulai dari otak manusia, dimana otak memuat sekitar 1011 neuron.
Neuron ini berfungsi memproses setiap informasi yang masuk. Satu neuron memiliki 1 akson, dan
minimal 1 dendrit.
Setiap sel syaraf terhubung dengan syaraf lain yang jumlahnya mencapai sekitar 104 sinapsis.
Masing-masing sel itu saling berinteraksi satu sama lain yang menghasilkan kemampuan tertentu
pada kerja otak manusia.
Gambar 3.1 Neuron

Dari gambar 3.1, bisa dilihat ada beberapa bagian dari neuron manusia, yaitu:
1. Dendrit (Dendrites) berfungsi untuk mengirimkan impuls yang diterima ke badan sel
syaraf.
2. Akson (Axon) berfungsi untuk mengirimkan impuls dari badan sel ke jaringan lain
3. Sinapsis berfungsi sebagai unit fungsional di antara dua sel syaraf
Gambar 3.2 Pola Hubungan Antar Neuron
Karakteristik dari ANN dilihat dari pola hubungan antar neuron pada gambar 3.2, metode
penentuan bobot dari tiap koneksi, dan fungsi aktivasinya. Gambar di atas menjelaskan struktur
ANN secara mendasar, yang dalam kenyataannya tidak hanya sederhana seperti itu.
1. Input, berfungsi seperti dendrite
2. Output, berfungsi seperti akson
3. Fungsi aktivasi, berfungsi seperti sinapsis
Neural network dibangun dari banyak node/unit yang dihubungkan oleh link secara langsung.
Link dari unit yang satu ke unit yang lainnya digunakan untuk melakukan propagasi aktivasi dari
unit pertama ke unit selanjutnya. Setiap link memiliki bobot numerik. Bobot ini menentukan
kekuatan serta penanda dari sebuah konektivitas.
Proses pada ANN dimulai dari input yang diterima oleh neuron beserta dengan nilai bobot dari
tiap-tiap input yang ada. Setelah masuk ke dalam neuron, nilai input yang ada akan dijumlahkan
oleh suatu fungsi perambatan (summing function), yang bisa dilihat seperti pada di gambar dengan
lambang sigma (∑). Hasil penjumlahan akan diproses oleh fungsi aktivasi setiap neuron, disini
akan dibandingkan hasil penjumlahan dengan threshold (nilai ambang) tertentu. Jika nilai melebihi
threshold, maka aktivasi neuron akan dibatalkan, sebaliknya, jika masih dibawah nilai threshold,
neuron akan diaktifkan. Setelah aktif, neuron akan mengirimkan nilai output melalui bobot-bobot
outputnya ke semua neuron yang berhubungan dengannya. Proses ini akan terus berulang pada
input-input selanjutnya.
ANN terdiri dari banyak neuron di dalamnya. Neuron-neuron ini akan dikelompokkan ke
dalam beberapa layer. Neuron yang terdapat pada tiap layer dihubungkan dengan neuron pada
layer lainnya. Hal ini tentunya tidak berlaku pada layer input dan output, tapi hanya layer yang
berada di antaranya. Informasi yang diterima di layer input dilanjutkan ke layer-layer dalam ANN
secara satu persatu hingga mencapai layer terakhir/layer output.
Layer yang terletak di antara input dan output disebut sebagai hidden layer. Namun, tidak
semua ANN memiliki hidden layer, ada juga yang hanya terdapat layer input dan output saja.
Beberapa keuntungan yang dapat diperoleh dari penggunaan Neural Network adalah sebagai
berikut :
1. Pembelajaran adaptif: Kemampuan untuk belajar dalam melakukan tugas-tugas
berdasarkan data yang diberikan
2. Self-Organization: Sebuah Neural Network dapat membangun representasi dari informasi
yang diterimanya selama proses pembelajaran secara mandiri
3. Operasi Real-Time: Penghitungan Neural Network dapat dilakukan secara paralel,
sehingga proses komputasi menjadi lebih cepat.
1.4 Support Vector Machine (SVM)

SVM (support vector machine) dalam mechine learning dikenal juga dengan support vector
network yang merupakan metode supervised terkait dengan learning algorithm untuk analisa pola
data yang digunakan untuk klasifikasi dan regresi (Mohammed, 2017). Beberapa kelebihan yang
dapat diperoleh dari penggunaan SVM adalah sebagai berikut (Kurniawan, 2016):
1. Generalisasi
Generalisasi didefinisikan sebagai kemampuan suatu metode untuk mengklasifikasikan
suatu pattern, yang tidak termasuk data yang dipakai dalam fase pembelajaran metode tersebut.
2. Curse of Dimensionality
Curse of Dimensionality didefinisikan sebagai masalah yang dihadapi suatu metode pattern
recognition dalam mengestimasikan parameter (misal jumlah hidden neuron pada neural
network, stopping criteria dalam proses pembelajaran, dsb) dikarenakan jumlah sampel data
yang relatif sedikit dibandingkan dimensional ruang vektor data tersebut. Semakin tinggi
dimensi dari ruang vector informasi yang diolah, membawa konsekuensi dibutuhkannya
jumlah data dalam proses pembelajaran.
3. Feasibility
SVM dapat diimplementasikan realtif mudah, karena proses penentuan support vector
dapat dirumuskan dalam QP problem (Quadratic Progamming). Dengan demikian, jika kita
memiliki library untuk menyelesaikan QP problem, dengan sendirinya SVM dapat
diimplementasikan dengan mudah.
Sedangkan beberapa kekurangan yang dapat diperoleh dari penggunaan SVM adalah sebagai
berikut (Kurniawan, 2016):
1. Sulit dipakai dalam problem berskala besar. Skala besar dalam hal ini dimaksudkan dengan
jumlah sample yang diolah.
2. SVM secara teorik dikembangkan untuk problem klasifikasi dengan dua class atau lebih.
Namun demikian, masing-masing strategi ini memiliki kelemahan, sehingga dapat
dikatakan penelitian dan pengembangan SVM pada multiclass problem masih merupakan
tema penelitian yang masih terbuka.
1.4.1. Support Vector Machine linear
Metode SVM menggunakan fungsi dot produk. SVM merupakan usaha mencari
hyperplane terbaik yang berfungsi sebagai pemisah dua buah class pada input space
(Nugroho,2003).
Gambar 3.3 Penentuan Hyperplane Terbaik

Gambar 3.3a memperlihatkan beberapa pattern yang merupakan anggota dari dua
buah class: +1 dan -1. Pattern yang tergabung pada class -1 disimbolkan dengan warna
merah (kotak), sedangkan pattern pada class +1, disimbolkan dengan warna
kuning(lingkaran).
Permasalahan klasifikasi dapat diterjemahkan dengan usaha menemukan garis
(hyperplane) yang memisahkan antara kedua kelompok tersebut. Berbagai alternatif
garis pemisah (discrimination boundaries) ditunjukkan pada gambar 3.3a.
Hyperplane pemisah terbaik antara kedua class dapat ditemukan dengan mengukur
margin hyperplane dan mencari titik optimum hyperplane tersebut. Margin adalah jarak
antara hyperplane dengan pattern terdekat dari masing-masing class. Pattern yang paling
dekat disebut sebagai support vector. Garis solid pada gambar 3.1b menunjukkan
hyperplane yang terbaik, yaitu yang terletak tepat pada tengah-tengah kedua class,
sedangkan titik merah dan kuning yang berada dalam lingkaran hitam adalah support
vector. Usaha untuk mencari lokasi hyperplane ini merupakan inti dari proses
pembelajaran pada SVM.
1.4.2 Support Vector Machine Nonlinear
Dalam SVM ada SVM linear dan nonlinear (trik kernel). SVM adalah hypeplane
linear yang hanya bekerja pada data yang dapat dipisahkan secara linear. Untuk data
yang distribusi kelasnya tidak linear, dapat digunakan pendekatan kernel pada fitur data
awal set data.
Kernel dapat didefinisikan sebagai suatu fungsi yang memetakan fitur data dari
dimensi awal ke fitur lain yang berdimensi lebih tinggi. Pendekatan ini berbeda dengan
metode klasifikasi pada umumnya yang justru mengurangi dimensi awal untuk
menyederhanakan proses komputasi dan memberikan akurasi prediksi yang lebih baik.
Ilustrasi kernel yang digunakan untuk memetakan dimensi awal yang lebih rendah set
data ke dimensi baru yang relatif lebih tinggi adalah sebagai berikut:
Beberapa fungsi kernel yang digunakan dalam penelitian ini adalah sebagai berikut :
Linear :
𝐾 (𝑥, 𝑦) = 𝑥. 𝑦
Polynomial :
𝐾(𝑥, 𝑦) = (𝑥. 𝑦 + 𝑐 )𝑑
RBF :
−‖𝑥 − 𝑦‖2
𝐾 (𝑥, 𝑦) = exp⁡( )
2. 𝛾 2
Sigmoid :
𝐾(𝑥, 𝑦) = 𝑡𝑎𝑛ℎ(𝛾 [𝑥. 𝑦] + 𝑐 )
dengan x dan y adalah pasangan dua data dari semua bagian data latih. Parameter 𝛾, 𝑐,
dan 𝑑 merupakan sebuah konstanta
1.5 ROC (Receiver Operating Characteristic) dan AUC (Area Under Curve)
Kurva ROC dibagi menjadi dua dimensi, yaitu tingkat True Positive pada sumbu y dan tingkat
False Positif pada sumbu x. Sedangkan untuk menentukan klasifikasi mana yang terbaik, dapat
direpresentasikan dengan metode menghitung luas daerah di bawah kurva atau disebut dengan
AUC (Area Under Curve) yang diartikan sebagai probabilitas. Luas daerah di bawah kurva
mengukur kinerja diskriminatif dengan memperkirakan kemungkinan output dari sampel yang
dipilih secara acak dari populasi negatif atau positif. Semakin besar nilai daerah bidang di bawah
kurva maka semakin kuat klasifikasi yang digunakan. Nilai AUC akan berada pada rentang antara
0 sampai dengan 1. Tabel berikut merupakan klasifikasi AUC:
Tabel Klasifikasi AUC
Performansi Klasifikasi
0.9-1.0 Sangat Baik
0.8-0.9 Baik
0.7-0.8 Cukup
0.6-0.7 Rendah
0.5-0.6 Buruk
1.6 Ukuran Akurasi
Berikut adalah beberapa ukuran akurasi yang akan digunakan, yaitu :
1. Accuracy adalah presentase dari jumlah tuple dalam data uji yang diklasifikasikan dengan
benar oleh classifier. Rumus untuk Accuracy adalah sebagai berikut :
𝑇𝑃 + 𝑇𝑁
𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 =
𝑃+𝑁
2. Sensitivity atau Recall adalah persentase tuple positif yang dilabeli sebagai positif.
Rumusnya adalah sebagai berikut :
𝑇𝑃
𝑅𝑒𝑐𝑎𝑙𝑙 =
𝑃
3. Spesificity adalah porsi tuple negatif yang diklasifikasikan dengan benar. Rumus untuk
specivity adalah sebagai berikut :
𝑇𝑁
𝑆𝑝𝑒𝑠𝑖𝑓𝑖𝑐𝑖𝑡𝑦 =
𝑁
4. Precision adalah ukuran kepastian, yaitu berapa persentase tuple yang dilabeli sebagai
postif adalah benar pada kenyataannya. Rumus untuk precision adalah sebagai berikut :
𝑇𝑃
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 =
𝑇𝑃 + 𝐹𝑃
1.7 Langkah-langkah Pengerjaan ANN

Berikut adalah langkah-langkah pengerjaan ANN :
1. Mengimport data excel ke dalam software rapidminer, kemudian menentukan atribut
spesial dan atribut regulernya
2. Membuat kotak program Optimize Parameters (Grid)
3. Membuat kotak program Cross Validation
4. Membuat kotak program Neural Net pada process Training dan kotak program Apply
Model serta kotak program Performance pada process Testing
5. Mengatur parameter yang akan digunakan pada Neural Net, dalam hal ini parameter Neural
Net.learning_rate dan Neural Net.momentum.
1.8 Langkah-langkah Pengerjaan SVM
Berikut adalah langkah-langkah pengerjaan SVM :
4. Membuat kotak program SVM pada process Training dan kotak program Apply Model
serta kotak program Performance pada process Testing
5. Mengatur parameter yang akan digunakan pada SVM, dalam hal ini parameter kernel type,
gamma, dan C.
BAB II
HASIL DAN PEMBAHASAN
2.1 Langkah – Langkah Pengerjaan ANN

Berikut akan dijelaskan langkah-langkah pengerjaan ANN menggunakan software rapidminer
Pada bagian Operators, tuliskan Read Excel. Setelah itu drag and drop ke dalam
process. Kemudian pada menu Import Configuration Wizard, pilih file excel yang akan
dianalisis, setelah itu tentukan yang akan menjadi atribut spesial dan atribut regular. Dalam
hal ini, yang menjadi atribut spesial adalah atribut system yang diberi symbol s. Atribut ini
memiliki dua kategori, yaitu technical skills yang diberi nilai 1 dan management strategies
yang diberi nilai 2, sehingga output datanya adalah sebagai berikut :

Pada bagian Operators, tuliskan Optimize Parameters (Grid), kemudian drag and drop
ke dalam process. Setelah itu, sambungkan titik output pada kotak read excel kepada input
dalam kotak Optimize Parameters (Grid), kemudian sambungkan titik per kepada res, titik
mod kepada res, dan titik par kepada res. Ilustrasinya adalah sebagai berikut:
Klik dua kali pada kotak program Optimize Parameters (Grid), kemudian pada bagian
Operators tuliskan Cross Validation, drag and drop ke dalam process. Setelah itu,
hubungkan titik input kepada titik exa pada kotak Cross Validation, hubungkan titik yang
ada pada Cross Validation, yaitu titik mod kepada mod, titik exa kepada out, dan titik per
kepada per. Ilustrasinya adalah sebagai berikut:
4. Membuat kotak program Neural Net pada process Training dan kotak program Apply
Model serta kotak program Performance pada process Testing
Klik dua kali pada kotak program Cross Validation, kemudian pada bagian Operators
tuliskan Neural Net, setelah itu drag and drop ke dalam process Training. Setelah itu
hubungkan titik tra kepada titik tra pada kotak program SVM, dan hubungkan titik mod
pada kotak program Neural Net kepada mod. Setelah itu, pada bagian Operators tuliskan
Apply Model, kemudian lakukan drag and drop ke dalam process Testing, tuliskan
Performance (Binomial Classification) pada bagian Operators, kemudian drag and drop
ke dalam process Testing. Kemudian menghubungkan titik mod kepada titik mod pada
kotak program Apply Model dan titik tes kepada titik unl pada kotak program Apply Model.
Setelah itu, hubungkan titik lab pada kotak program Apply Model kepada titik lab pada
kotak program Performance. Kemudian menghubungkan titik per pada kotak program
Performance kepada per. Ilustrasinya adalah sebagai berikut :
5. Mengatur parameter yang akan digunakan pada Neural Net, dalam hal ini parameter Neural
Net.learning_rate dan Neural Net.momentum.
Klik satu kali pada kotak program Optimize Parameters (Grid), kemudian klik menu
Edit Parameters Setting. Setelah itu pilih Neural Net dan pilih parameter Neural
Net.learning_rate dan Neural Net.momentum. Untuk Neural Net.learning_rate, Setting
Grid minimumnya dengan angka 0.01 dan maksimumnya dengan angka 0.9. Untuk Neural
Net.momentum, Setting Grid minimumnya dengan angka 0.0 dan maksimumnya dengan
angka 1. Kemudian klik OK, dan jalankan Program tersebut. Setelah itu akan diperoleh
informasi sebagai berikut:
iteration Neural Net.learning_rate Neural Net.momentum accuracy
6 0.455 0 0.92
12 0.01 0.1 0.92
20 0.722 0.1 0.92
23 0.01 0.2 0.92
34 0.01 0.3 0.92
41 0.633 0.3 0.92
45 0.01 0.4 0.92
. . . .
. . . .
. . . .
120 0.811 1 0.64
114 0.277 1 0.64
117 0.544 1 0.62
121 0.9 1 0.54
115 0.366 1 0.52
118 0.633 1 0.5
Dari output di atas, dapat disimpulkan bahwa akurasi terbesar yang digunakan Neural
Net adalah 92% yang diperoleh pada iterasi ke-6 dengan menggunakan learning_rate
sebesar 0.455 dan momentum sebesar 0. Sedangkan akurasi terkecilnya adalah 50% yang
diperoleh pada iterasi ke-118 dengan menggunakan learning_rate sebesar 0.633 dan
momentum sebesar 1.
Kemudian untuk gambar di atas, dapat disimpulkan bahwa terdapat 23 tuple positif
yang dilabeli dengan benar oleh classifier, terdapat 23 tuple negatif yang dilabeli benar
oleh classifier, terdapat 2 tuple negatif yang dilabeli salah oleh classifier, dan terdapat 2
tuple positif yang dilabeli salah oleh classifier.
Nilai 92% menyatakan presisi yang menunjukkan bahwa 92% tuple yang dilabeli
sebagai positif adalah benar pada kenyataannya. Kemudian nilai 92% menyatakan recall
yang menunjukkan bahwa 92% tuple positif yang dilabeli sebagai positif. Nilai 92%
menyatakan spesificity yang merupakan porsi tuple negatif yang diklarifikasikan dengan
benar. Nilai 92% +/- 9.8% menyatakan akurasi yang menunjukkan bahwa 92% +/- 9.8%
jumlah tuple dalam data uji yang diklasifikasikan dengan benar oleh classifier.
Sedangkan untuk gambar di atas, diperoleh bahwa nilai AUCnya adalah 0.933 +/-
0.153, sehingga dapat disimpulkan bahwa pengklasifikasian menggunakan metode ANN
adalah sangat baik.
2.2 Langkah – Langkah Pengerjaan SVM

Berikut akan dijelaskan langkah-langkah pengerjaan SVM menggunakan software rapidminer
Pada bagian Operators, tuliskan Read Excel. Setelah itu drag and drop ke dalam
process. Kemudian pada menu Import Configuration Wizard, pilih file excel yang akan
dianalisis, setelah itu tentukan yang akan menjadi atribut spesial dan atribut regular. Dalam
hal ini, yang menjadi atribut spesial adalah atribut system yang diberi symbol s. Atribut ini
memiliki dua kategori, yaitu technical skills yang diberi nilai 1 dan management strategies
yang diberi nilai 2, sehingga output datanya adalah sebagai berikut :
Pada bagian Operators, tuliskan Optimize Parameters (Grid), kemudian drag and drop
ke dalam process. Setelah itu, sambungkan titik output pada kotak read excel kepada input
dalam kotak Optimize Parameters (Grid), kemudian sambungkan titik per kepada res, titik
mod kepada res, dan titik par kepada res. Ilustrasinya adalah sebagai berikut:

Klik dua kali pada kotak program Optimize Parameters (Grid), kemudian pada bagian
Operators tuliskan Cross Validation, drag and drop ke dalam process.
Setelah itu, hubungkan titik input kepada titik exa pada kotak Cross Validation,
hubungkan titik yang ada pada Cross Validation, yaitu titik mod kepada mod, titik exa
kepada out, dan titik per kepada per. Ilustrasinya adalah sebagai berikut:
4. Membuat kotak program SVM pada process Training dan kotak program Apply Model
serta kotak program Performance pada process Testing
Klik dua kali pada kotak program Cross Validation, kemudian pada bagian Operators
tuliskan LibSVM, setelah itu drag and drop ke dalam process Training. Setelah itu
hubungkan titik tra kepada titik tra pada kotak program SVM, dan hubungkan titik mod
pada kotak program SVM kepada mod. Setelah itu, pada bagian Operators tuliskan Apply
Model, kemudian lakukan drag and drop ke dalam process Testing, tuliskan Performance
(Binomial Classification) pada bagian Operators, kemudian drag and drop ke dalam
process Testing. Kemudian menghubungkan titik mod kepada titik mod pada kotak
program Apply Model dan titik tes kepada titik unl pada kotak program Apply Model.
Setelah itu, hubungkan titik lab pada kotak program Apply Model kepada titik lab pada
kotak program Performance. Kemudian menghubungkan titik per pada kotak program
Performance kepada per. Ilustrasinya adalah sebagai berikut:
5. Mengatur parameter yang akan digunakan pada SVM, dalam hal ini parameter kernel type,
gamma, dan C.
Klik satu kali pada kotak program Optimize Parameters (Grid), kemudian klik menu
Edit Parameters Setting. Setelah itu pilih LibSVM dan pilih parameter SVM.kernel_type,
SVM.gamma, dan SVM.C. Untuk SVM.kernel_type, fungsi yang digunakan adalah linear,
poly, rbf, dan sigmoid. Untuk SVM.gamma, Setting Grid minimumnya dengan angka
0.125 dan maksimumnya dengan angka 8. Untuk SVM.C, Setting Grid minimumnya
dengan angka 0.1 dan maksimumnya dengan angka 100. Kemudian klik OK, dan jalankan
Program tersebut. Setelah itu akan diperoleh informasi sebagai berikut:
iteration SVM.kernel_type SVM.gamma SVM.C accuracy
41 linear 8 0.1 0.94
57 linear 2.4875 10.09 0.94
101 linear 2.4875 20.08 0.94
233 linear 2.4875 50.05 0.94
437 linear 8 90.01 0.94
441 linear 0.125 100 0.94
473 linear 6.425 100 0.94
. . . . .
. . . . .
. . . . .
475 rbf 6.425 100 0.4
476 sigmoid 6.425 100 0.4
479 rbf 7.2125 100 0.4
480 sigmoid 7.2125 100 0.4
483 rbf 8 100 0.4
484 sigmoid 8 100 0.4
Dari output di atas, dapat disimpulkan bahwa akurasi terbesar yang digunakan LibSVM
adalah 94% yang diperoleh pada iterasi ke-41 dengan menggunakan tipe kernel linear,
gamma sebesar 8, dan koefisien C sebesar 0.1. Sedangkan akurasi terkecilnya adalah 40%
yang diperoleh pada iterasi ke-483 dengan menggunakan tipe kernel rbf, gamma sebesar
8, dan koefisien C sebesar 100.
Kemudian untuk gambar di atas, dapat disimpulkan bahwa terdapat 23 tuple positif
yang dilabeli dengan benar oleh classifier, terdapat 24 tuple negatif yang dilabeli benar
oleh classifier, terdapat 2 tuple negatif yang dilabeli salah oleh classifier, dan terdapat 1
tuple positif yang dilabeli salah oleh classifier.
Nilai 92% menyatakan presisi yang menunjukkan bahwa 92% tuple yang dilabeli
sebagai positif adalah benar pada kenyataannya. Kemudian nilai 95.83% menyatakan
recall yang menunjukkan bahwa 95.83% tuple positif yang dilabeli sebagai positif. Nilai
92.31% menyatakan spesificity yang merupakan porsi tuple negatif yang diklarifikasikan
dengan benar. Nilai 94% +/- 9.66% menyatakan akurasi yang menunjukkan bahwa 94%
+/- 9.17% jumlah tuple dalam data uji yang diklasifikasikan dengan benar oleh classifier.
Sedangkan untuk gambar di atas, diperoleh bahwa nilai AUCnya adalah 0.983 +/- 0.05,
sehingga dapat disimpulkan bahwa pengklasifikasian menggunakan metode SVM adalah
sangat baik.
2.3 Kesimpulan
Dari hasil analisis yang sudah dilakukan, dapat disimpulkan bahwa :
1. SVM menghasilkan nilai akurasi yang lebih besar dibanding menggunakan ANN. Nilai
akurasi yang diperoleh dengan menggunakan SVM adalah sebesar 94% +/- 9.17%,
sedangkan nilai akurasi yang diperoleh dengan menggunakan ANN adalah sebesar 92%
+/- 9.8%.
2. Dalam hal presisi, SVM menghasilkan nilai presisi yang sama dengan ANN, yaitu sebesar
92%.
3. Dalam hal recall, SVM menghasilkan nilai recall yang lebih besar dibanding ANN. Nilai
recall yang diperoleh dengan menggunakan SVM adalah sebesar 95.83%, sedangkan nilai
recall yang diperoleh dengan menggunakan ANN adalah sebesar 92%.
4. Dalam hal spesificity, SVM menghasilkan nilai recall yang lebih besar dibanding ANN.
Nilai spesificity yang diperoleh dengan menggunakan SVM adalah sebesar 92.31%,
sedangkan nilai spesificity yang diperoleh dengan menggunakan ANN adalah sebesar 92%.
5. Sedangkan dalam hal AUC, SVM menghasilkan nilai AUC yang lebih besar dibanding
ANN. Nilai AUC yang diperoleh dengan menggunakan SVM adalah sebesar 0.983 +/-
0.05%, sedangkan nilai AUC yang diperoleh dengan menggunakan ANN adalah sebesar
0.933 +/- 0.153%. Walaupun klasifikasi baik menggunakan SNN maupun SVM tergolong
sangat baik, tetapi SVM unggul dalam hal akurasi, recall, dan spesificity, sehingga
pengklasifikasian menggunakan SVM lebih baik dibanding menggunakan ANN.
DAFTAR PUSTAKA
1. Kurniawan, N.Z. 2016. IDENTIFIKASI JENIS PENYAKIT DAUN TEMBAKAU

MENGGUNAKAN METODE GRAY LEVEL CO-OCCURRENCE MATRIX (GLCM)
DAN SUPPORT VECTOR MACHINE (SVM). Surabaya: Stikom Surabaya.
2. Suryadi, U. T. 2015. KOMPARASI SUPPORT VECTOR MACHINE DAN NEURAL
NETWORK UNTUK PREDIKSI KELULUSAN SERTIFIKASI BENIH KENTANG.
Seminar Nasional Informatika 2015 (semnasIF 2015). ISSN: 1979-2328. Komputer
Akuntansi STMIK SUBANG, UPN Veteran Yogyakarta.
3. https://dosen.perbanas.id/artificial-neural-network/ (diakses tanggal 19 November).
4. https://dspace.uii.ac.id/bitstream/handle/123456789/5558/GABUNGAN.pdf?sequence=1
&isAllowed=y (diakses tanggal 17 November).
5. https://socs.binus.ac.id/2012/07/26/konsep-neural-network/ (diakses tanggal 17
November).
LAMPIRAN
dataset yang diperoleh dari https://data.mendeley.com/datasets/pd6gsm2m9r/1

s S_BD S_CM S_HR S_PC S_RM S_SM
1 33 12 21 23 22 28
1 35 13 19 13 22 27
1 47 17 15 24 22 31
1 27 18 18 17 21 28
1 43 18 20 24 26 30
1 35 16 22 20 23 24
1 35 19 22 20 23 24
1 44 20 13 21 20 26
1 39 15 17 24 28 29
1 34 18 21 13 19 25
1 42 16 12 20 23 27
1 43 17 19 14 23 31
1 44 17 13 17 23 27
1 44 16 22 21 27 31
1 41 20 20 24 28 29
1 36 20 18 18 22 24
1 30 18 13 13 26 23
1 48 19 21 19 22 30
1 48 19 24 20 27 31
1 37 15 20 20 24 30
1 31 15 19 9 15 25
1 32 19 22 18 26 28
1 40 17 16 20 26 27
1 38 19 20 7 19 28
1 43 16 23 24 28 31
2 31 16 18 23 22 16
2 39 13 19 20 22 21
2 31 20 13 21 16 15
2 21 16 12 20 17 14
2 14 10 8 5 1 21
2 23 0 21 5 1 1
2 26 16 18 18 19 19
2 30 15 12 21 19 25
2 23 17 13 23 22 23
2 23 16 16 15 17 26
2 14 10 6 5 15 14
2 41 20 20 14 23 31
2 26 15 8 16 20 24
2 14 9 16 8 1 19
2 29 20 16 24 27 16
2 15 13 11 5 2 8
2 14 16 14 12 26 21
2 22 10 15 8 19 7
2 36 17 9 19 19 16
2 13 8 9 6 3 12
2 14 12 18 8 10 24
2 24 12 15 17 20 19
2 37 12 14 9 18 23
2 35 16 16 6 17 13
2 12 6 11 18 13 14
dengan :
1 menyatakan technical skills
2 menyatakan management strategies

Tugas Damin - Muhammad Rifqi A'la - Ilham Melzi - Kelas B

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Tugas Damin - Muhammad Rifqi A'la - Ilham Melzi - Kelas B

Diunggah oleh

Hak Cipta:

Format Tersedia

PROJECT DATA MINING

Komparasi Akurasi Artificial Neural Network (ANN) dan Support Vector

Diajukan sebagai Salah Satu Syarat untuk Memenuhi

PROGRAM STUDI S-1 STATISTIKA

1.1 Data Penelitian

1.2 Rumusan Masalah dan Tujuan Penelitian

1.3 Artificial Neural Network (ANN)

Gambar 3.1 Neuron

1.4 Support Vector Machine (SVM)

Gambar 3.3 Penentuan Hyperplane Terbaik

1.7 Langkah-langkah Pengerjaan ANN

2.1 Langkah – Langkah Pengerjaan ANN

2. Membuat kotak program Optimize Parameters (Grid)

2.2 Langkah – Langkah Pengerjaan SVM

3. Membuat kotak program Cross Validation

Dari hasil analisis yang sudah dilakukan, dapat disimpulkan bahwa :

1. Kurniawan, N.Z. 2016. IDENTIFIKASI JENIS PENYAKIT DAUN TEMBAKAU

dataset yang diperoleh dari https://data.mendeley.com/datasets/pd6gsm2m9r/1

Anda mungkin juga menyukai