Anda di halaman 1dari 66

KLASIFIKASI WILAYAH EPIDEMIS DEMAM BERDARAH MENGGUNAKAN

METODE SUPPORT VECTOR MACHINE


DI KOTA MEDAN

TESIS

HAROLD SITUMORANG

137038015

PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

UNIVERSITAS SUMATERA UTARA


MEDAN
2015

Universitas sumatera Utara


KLASIFIKASI WILAYAH EPIDEMIS DEMAM BERDARAH MENGGUNAKAN
METODE SUPPORT VECTOR MACHINE
DI KOTA MEDAN

TESIS

Diajukan Untuk Melengkapi Tugas Dan Memenuhi Syarat Memperoleh Ijazah

Magister Teknik Informatika

HAROLD SITUMORANG

137038015

PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

UNIVERSITAS SUMATERA UTARA

MEDAN

2015

Universitas sumatera Utara


PERSETUJUAN

JUDUL : KLASIFIKASI WILAYAH DEMAM BERDARAH

DENGAN METODE SVM DI KOTA MEDAN

KATEGORI : TESIS

NAMA : HAROLD SITUMORANG

NOMOR INDUK MAHASISWA : 137038015

PROGRAM STUDI : MAGISTER (S2) TEKNIK INFORMATIKA

FAKULTAS : ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

UNIVERSITAS SUMATERA UTARA.

Komisi Pembimbing :

Pembimbing 2 Pembimbing 1

Dr.Marwan Ramli, M.Si Dr.Syahril Efendi.S.Si, M.IT

Diketahui/disetujui oleh
Program Studi
Magister (S2) Teknik Informatika
Ketua,

Prof. Dr. Muhammad Zarlis


NIP. 19570701 198601 1 003

Universitas sumatera Utara


PERNYATAAN

KLASIFIKASI WILAYAH EPIDEMIS DEMAM BERDARAH MENGGUNAKAN


METODE SUPPORT VECTOR MACHINE
DI KOTA MEDAN

TESIS

Saya mengakui bahwa tesis ini adalah hasil karya saya sendiri, kecuali beberapa kutipan
dan ringkasan yang masing-masing telah disebutkan sumbernya.

Medan, Nopember 2015

Harold Situmorang
137038015

Universitas sumatera Utara


PERNYATAAN PERSETUJUAN PUBLIKASI
KARYA ILMIAH UNTUK KEPENTINGAN
AKADEMIS

Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertanda tangan di
bawah ini:
Nama : Harold Situmorang
NIM : 137038015
Program Studi : Magister (S2) Teknik Informatika
Jenis Karya Ilmiah : Tesis
Dengan pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada
Universitas Sumatera Utara Hak Bebas Royalti Non-Eksklusif (non-Exlusive Royalty Free
Right) atas tesis saya yang berjudul:

KLASIFIKASI WILAYAH EPIDEMIS DEMAM BERDARAH MENGGUNAKAN


METODE SUPPORT VECTOR MACHINE
DI KOTA MEDAN

Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti Non-Eksklusif
ini, Universitas Sumatera Utara berhak menyimpan, mengalih media, memformat,
mengelola dalam bentuk data-base, merawat dan mempublikasikan tesis saya tanpa
meminta izin dari saya selama tetap mencantumkan nama saya sebagai penulis dan sebagai
pemegang dan/atau sebagai pemilik hak cipta.

Demikian pernyataan ini dibuat dengan sebenarnya,

Medan, Desember 2015

Harold Situmorang
NIM. 137038015

Universitas sumatera Utara


Telah diuji pada : Tanggal : 22 Desember 2015

PENGUJI PANITIA TESIS

Ketua : Dr.Syahril Efendi.S.Si, M.IT

Anggota : 1. Dr.Marwan Ramli, M.Si

2. Prof. Dr. Muhammad Zarlis

3. Prof. Dr. Opim Salim Sitompul

Universitas sumatera Utara


RIWAYAT HIDUP

DATA PRIBADI

Nama Lengkap : Harold Situmorang

Tempat/tanggal lahir : Medan, 07 Agustus 1972

Alamat Rumah : Komplek Perumahaan Mutiara Biru Blok. E No. 07

Kecamatan Percut Sei Tuan

Kabupaten Deliserdang.

Telepon /Fax/HP : - / - / 0813 7670 7550

E-mail : haroldsitumorang@yahoo.co.id

Instansi Tempat Bekerja : Universitas Sari Mutiara Indonesia Medan.

DATA PENDIDIKAN

SD : SD Negeri Medan TAMAT : 1982

SLTP : SLTP Negeri 29 Medan TAMAT : 1990

SLTA : SMA Swasta Kenangan Medan TAMAT : 1993

S1 : Teknik Elektro Universitas Medan Area TAMAT : 2004

Universitas sumatera Utara


i

UCAPAN TERIMA KASIH

Puji syukur kepada Tuhan Yang Maha Esa, atas segala limpahan berkat dan
penyertaan-Nya sehingga tesis ini dapat diselesaikan tepat pada waktunya. Dengan
selesainya tesis ini, perkenankanlah penulis mengucapkan terima kasih yang
sebesar- besarnya kepada :
1. Pj Rektor Universitas Sumatera Utara, Bapak Prof. Subhilhar atas kesempatan
yang telah diberikan kepada penulis untuk dapat mengikuti dan menyelesaikan
pendidikan Program Magister.
2. Dekan Fasilkom-TI (Fakultas Ilmu Komputer dan Teknologi Informasi)
Universitas Sumatera Utara Prof. Dr. Muhammad Zarlis, atas kesempatan
yang diberikan kepada penulis menjadi mahasiswa Program Magister pada
Program Pascasarjana Fasilkom-TI Universitas Sumatera Utara.
3. Ketua Program Studi Magister (S2) Teknik Informatika,
Prof. Dr. Muhammad Zarlis dan Sekretaris Program Studi Magister (S2)
Teknik Informatika M. Andri Budiman, S.T, M.Comp, M.E.M beserta
seluruh staff pengajar pada Program Studi Magister (S2) Teknik Informatika
Program Pascasarjana Fasilkom-TI Universitas Sumatera Utara, yang telah
bersedia membimbing penulis sehingga dapat menyelesaikan pendidikan
tepat pada waktunya.
4. Dr. Syahril Efendi, S.Si, M.IT selaku pembimbing utama dan kepada Dr.
Marwan Ramli, M.Si selaku pembimbing lapangan yang dengan penuh
kesabaran menuntun serta membimbing penulis hingga selesainya tesis ini
dengan baik.
5. Prof. Dr. Muhammad Zarlis dan Prof. Dr. Opim Salim Sitompul sebagai
pembanding yang telah memberikan saran dan motivasi serta arahan yang
baik demi penyelesaian tesis ini.
6. Universitas Sumatera Utara, Staf Pegawai dan Administrasi pada Program
Studi Magister (S2) Teknik Informatika Program Pascasarjana Fasilkom-TI
Universitas Sumatera Utara yang telah memberikan bantuan dan pelayanan
terbaik kepada penulis selama mengikuti perkuliahan.

Universitas sumatera Utara


ii

7. Orang tua penulis. Ayahanda T. Situmorang , Ibunda D. Br. Marpaung, Istri


Tercinta R. Br. Nainggolan, yang telah mendukung penulis dan terima kasih atas
segala pengorbanannya, baik moril maupun materil.
8. Teman-teman seperjuangan angkatan 2013 Kom-B, untuk kebersamaan dan
semangat menjalani perkuliahan dan dalam penyelesaian tesis ini.
9. Semua pihak yang tidak dapat penulis sebutkan satu persatu, terimakasih atas
segala bantuan dan doa yang diberikan. Semoga karya ilmiah ini dapat bermanfaat
bagi kemajuan ilmu pengetahuan dan pendidikan.

Medan, Desember 2015


Penulis

HAROLD SITUMORANG
NIM :137038015

Universitas sumatera Utara


iii

ABSTRAK

Penyakit Demam Berdarah merupakan salah satu permasalahan kesehatan utama dan
endemik di beberapa Negara termasuk di Indonesia. Indonesia termasuk dalam
kategori “A” dalam stratifikasi Demam Berdarah oleh WHO tahun 2001 yang
mengindikasikan tingginya angka perawatan pada rumah sakit dan kematian akibat
Demam Berdarah. Salah satu faktor yang menyebabkan adalah masalah klasifikasi
wilayah, karena data yang berkaitan dengan karakteristik suatu wilayah (letak
geografis) belum banyak didefenisikan secara jelas dan tegas, sehingga masih
diperlukan suatu pendekatan dalam menyelesaikan permasalahan klasifikasi wilayah
agar diperoleh hasil yang akurat. Dalam penelitian ini permasalahan klasifikasi
wilayah epidemic tempat berkembang bahaya nyamuk Demam Berdarah Dengue
(DBD) dengan Metode Klasifikasi Support Vector Machine (SVM) di Kota Medan.
Penelitian ini menggunakan lima variabel input yang merupakan faktor lingkungan
yang mempengaruhi penyakit Demam Berdarah, meliputi kepadatan penduduk, tinggi
wilayah, kelembapan udara, curah hujan, dan Jumlah kasus Demam Berdarah dalam
Wilayah kota Medan yang datanya bersumber dari BMKG, BPS dan Dinas Kesehatan
Kota Medan Tahun 2010-2013. Dari hasil penelitian diperoleh Metode support vector
machine ( SVM ) dapat mengklasifikasi wilayah untuk kategori wilayah sarang
nyamuk Demam berdarah dengan akurasi yang cukup tinggi. Proses klasifikasi
wilayah sarang nyamuk berdarah terbilang cukup akurat yang dapat membedakan
wilayah sebagai sarang nyamuk demam berdarah dan bukan sarang. Proses
identifikasi jenis penyakit Demam berdarah memperoleh akurasi pengujian sebanyak
75 %.

Kata Kunci : Support Vector Machine, Klasifikasi, Demam berdarah

Universitas sumatera Utara


iv

ABSTRACT

Dengue Fever is one of the major health problems and endemic in several countries,
including Indonesia. Indonesia is included in category "A" in the stratification of
Dengue by the WHO in 2001 that indicate high rates of treatment in hospital and
deaths from Dengue Fever. One of the factors that cause is the problem of
classification of the area, because the data relating to the characteristics of an area
(geographic location) has not been defined clearly and firmly, so that it still required
an approach in solving the problems of classification of the area in order to obtain
accurate results. In this study classification problems growing regions where the
danger of mosquito epidemic of Dengue Hemorrhagic Fever (DHF) Classification
Method with Support Vector Machine (SVM) in Medan. This study uses five input
variables are environmental factors that influence disease dengue fever, including
overcrowding, high territory, humidity, rainfall, and the number of cases of dengue
fever in the region of Medan which data sourced from BMKG, BPS and City Health
Office Medan 2010-2013. The results were obtained Method of support vector
machine (SVM) can classify the area for category Dengue mosquito breeding region
with high accuracy. The classification process dengue mosquito breeding territory is
quite accurate that can distinguish the area as dengue mosquito breeding and not nest.
The process of identification of the type of illness Dengue obtain test accuracy of 65%
.

Keywords: Support Vector Machine, Classification, Dengue fever

Universitas sumatera Utara


v

DAFTAR ISI

Ucapan Terima Kasih..................................................................................... i


Abstrak ..................................................................................................... ii
Abstract ..................................................................................................... iii
Daftar Isi ..................................................................................................... v
Daftar Tabel ................................................................................................... viii
Daftar Gambar................................................................................................ ix
Daftar Lampiran............................................................................................. x

BAB 1 PENDAHULUAN...................................................................... 1
1.1. Latar Belakang................................................................... 1
1.2. Rumusan Masalah.............................................................. 2
1.3. Tujuan Penelitian ............................................................... 3
1.4. Manfaat Penelitian ............................................................. 3
1.5. Batasan Masalah ................................................................ 3

BAB 2 TINJAUAN PUSTAKA ............................................................ 4


2.1. Pengertian Klasifikasi........................................................ 4
2.2. Metode Algoritma Klasifikasi ........................................... 5
2.3. Support Vektor Machine ................................................... 6
2.4. Karakteristik Suport Vector Machine................................ 7
2.5. Multiclass Suport Vektor Machine.................................... 8
2.6. Kelebihan Support Vector Machine .................................. 8
2.7. Kekurangan Support Vector Machine ............................... 9
2.8. Demam Berdarah Degue(DBD) ........................................ 9
2.8.1 Epidemologi.............................................................. 10
2.9. Evaluasi Kinerja Classifier ................................................ 11
2.9.1 Cross Validation ....................................................... 11
2.9.10 Pra pengolahan data................................................ 12
2.9.10.1 Normalisasi .......................................................... 13

Universitas sumatera Utara


vi

BAB 3 METODOLOGI PENELITIAN .............................................. 14


3.1. Metodologi Penelitian........................................................ 14
3.2 Data dan Variabel Penelitian ............................................. 15
3.3. Kota Medan Secara Geografis ........................................... 16
3.4. Pra Pengolahan Data.......................................................... 17
3.5. Normalisasi Data ............................................................... 20
3.6. Pembagian Data Traning dan Data Testing ....................... 20
3.7. Klasifikasi Support Vecto Machine................................... 21

BAB 4 HASIL DAN PEMBAHASAN ................................................. 23


4.1. Hasil Implementasi Support Vector Machine (SVM)........ 24
4.2 Percobaan Pertama ............................................................. 25
4.3.1 Proses Traning........................................................ 25
4.3.2 Proses Testing ........................................................ 25
4.4 Percobaan Kedua............................................................. 26
4.4.1 Proses Traning........................................................ 26
4.4.2 Proses Testing ....................................................... 27
4.5 Percobaan Ketiga............................................................. 27
4.5.1 Proses Traning........................................................ 27
4.5.2 Proses Testing ........................................................ 28
4.6. Percobaan Keempat......................................................... 29
4.6.1 Proses Traning........................................................ 29
4.6.2 Proses Testing ........................................................ 29
4.7. Percobaan Kelima ........................................................... 30
4.7.1 Proses Traning........................................................ 30
4.7.2 Proses Testing ........................................................ 31
4.8. Percobaan Keenam .......................................................... 31
4.8.1 Proses Traning........................................................ 31
4.8.2 Proses Testing ........................................................ 32
4.9. Percobaan ketujuh ........................................................... 33
4.9.1 Proses Traning........................................................ 33
4.9.2 Proses Testing ........................................................ 33

Universitas sumatera Utara


vii

4.10. Percobaan kedelapan ....................................................... 34


4.10.1 Proses Traning...................................................... 34
4.10.2 Proses Testing ...................................................... 35
4.11. Percobaan kesembilan ..................................................... 35
4.11.1 Proses Training..................................................... 36
4.11.2 Proses Testing ...................................................... 36
4.12. Percobaan kesepuluh ....................................................... 37
4.12.1 Proses Traning...................................................... 37
4.12.2 Proses Testing ...................................................... 38
4.13 Hasil Pengujian ............................................................... 38

BAB 5 KESIMPULAN DAN SARAN ................................................ 40


5.1. Kesimpulan ........................................................................ 40
5.2. Saran .................................................................................. 40

Daftar Pustaka ........................................................................................... 41

Universitas sumatera Utara


viii

DAFTAR TABEL

Tabel 3.1 : Data Jumlah Kasus Tiap Wilayah .......................................... 17


Tabel 3.2 : Data Kriteria Kepadatan Penduduk........................................ 17
Tabel 3.3 : Data Kriteria Tinggi Wilayah................................................. 18
Tabel 3.4 : Data Kriteria Kelembapan Udara ........................................... 19
Tabel 3.5 : Data Kriteria Curah Hujan ..................................................... 19
Tabel 3.6 : Data Hasil Normalisasi........................................................... 20
Tabel 3.7 : Pengolahan Data dengan metode support vector machine ..... 21
Tabel 4.1 : Hasil Pengolahan Data Wilayah Kota Medan ........................ 23
Tabel 4.2 : Hasil Pengolahan Data Wilayah Deli Serdang....................... 24
Tabel 4.3 : Hasil Training Percobaan Pertama ......................................... 25
Tabel 4.4 : Proses Testing Pertama .......................................................... 26
Tabel 4.5 : Hasil Training Percobaan Kedua............................................ 26
Tabel 4.6 : Proses Testing Percobaan Kedua ........................................... 27
Tabel 4.7 : Hasil Training Percobaan Ketiga ........................................... 28
Tabel 4.8 : Proses Testing Percobaan Ketiga ........................................... 28
Tabel 4.9 : Hasil Training Percobaan Keempat........................................ 29
Tabel 4.10 : Proses Testing Percobaan Keempat ....................................... 30
Tabel 4.11 : Hasil Training Percobaan Kelima .......................................... 30
Tabel 4.12 : Proses Testing Percobaan Kelima .......................................... 31
Tabel 4.13 : Hasil Training Percobaan Keenam......................................... 32
Tabel 4.14 : Proses Testing Percobaan Keenam......................................... 32
Tabel 4.15 : Hasil Training Percobaan Ketujuh ......................................... 33
Tabel 4.16 : Proses Testing Percobaan Ketujuh ......................................... 34
Tabel 4.17 : Hasil Training Percobaan Kedelapan ..................................... 34
Tabel 4.18 : Proses Testing Percobaan Kedelapan..................................... 35
Tabel 4.19 : Hasil Training Percobaan Kesembilan ................................... 36
Tabel 4.20 : Proses Testing Percobaan Kesembilan................................... 36
Tabel 4.21 : Hasil Training Percobaan Kesepuluh ..................................... 37
Tabel 4.22 : Proses Testing Percobaan Kesepuluh..................................... 38
Tabel 4.23 : Persentase Hasil Training dan Testing Data Dalam 10 Kali
Percobaan ............................................................................... 39

Universitas sumatera Utara


ix

DAFTAR GAMBAR

Gambar 3.1 : Metodologi Penelitian ...................................................... 14


Gambar 3.2 : Peta Kota Medan ............................................................... 16

Universitas sumatera Utara


x

DAFTAR LAMPIRAN

Lampiran 1 : Daftar Publikasi Ilmiah


Lampiran 2 : Surat Pengantar Penelitian dari Prodi S2 Tekhnik Informatika
Universitas Sumatera Utara
Lampiran 3 : Surat Persetujuan Penelitian dari Dinas Kesehatan
Kotamadya Medan

Universitas sumatera Utara


BAB 1
PENDAHULUAN

1.1. Latar Belakang

Permasalahan klasifikasi merupakan permasalahan yang masih hangat


dibicarakan,khususnya dalam cabang Ilmu Kecerdasan buatan (Artificial Intelligence).
Walaupun berbagai metode dalam penyelesaian permasalahan klasifikasi sudah
banyak di usulkan oleh para peneliti didalam leteratur Neural Network (NN) dan
Machine Learning, akan tetapi belum ada metode yang dijadikan sebagai standar atau
teknik klasifikasi yang dapat menyelesaikan berbagai permasalahan klasifikasi
terutama pada aplikasi yang bersipat spesifik untuk tujuan prediksi atau pemeliharaan
(Forcasting) misalnya.Permasalahan klasifikasi wilayah, atau pada permasalahan
dengan data yang mengalami pertumbuhan seiring dengan waktu.

Support Vector Machine (SVM) merupakan salah satu metode klasifikasi yang
mengalami perubahan yang sangat pesat, karena kehandalanya dalam memproses data
dalam jumlah yang sangat besar dan akurasi hasil yang sangat baik. (Fathima, 2012)

Salah satu permasalahan klasifikasi adalah masalah klasifikasi wilayah,karena


data yang berkaitan dengan karaktrentik suatu wilayah (letak geografis)belum
banyak didefenisikan secara jelas dan tegas , sehingga masih diperlukan suatu
pendekatan dalam menyelesaikan permasalahan klasifikasi wilayah agar diperoleh
hasil yang akurat.Dalam penelitian ini permasalahan klasifikasi wilayah epidemic
tempat berkembang bahaya nyamuk Demam Berdarah Dengue (DBD)akan dicoba
Metode Klasifikasi Support Vector Machine (SVM). Karakteristik suatu wilayah
yang epidemik tempat berkembanya nyamuk Demam Berdarah Dengue (DBD)
berdasarkan hasil survey Dinas Kesehatan Kota Medan Tahun 2010-2013

Pembelajaran dengan cara ini disebut dengan pembelajaran terarah


(supervised learning). Dengan pembelajaran terarah ini akan diperoleh fungsi yang
menggambarkan bentuk ketergantungan input dan outputnya. Selanjutnya, diharapkan

Universitas sumatera Utara


2

fungsi yang diperoleh mempunyai kemampuan generalisasi yang baik, dalam


arti bahwa fungsi tersebut dapat digunakan untuk data input di luar data pembelajaran.
Sebelum digunakan teknik Support Vector Machine (SVM), teknik NN (khususnya
berdasarkan backpropagation neural network) telah berhasil digunakan pada masalah
pengenalan pola.

Pada beberapa tahun terakhir ini, Support Vector Machine (SVM) mulai
menjadi model yang favorit sebagai suatu pembelajaran mesin. Hal ini terutama
karena terhadap Support Vector Machine (SVM) dapat dilakukan secara analitis
(analisis secara matematis) dan disamping itu dapat memberikan kemampuan
generalisasi yang baik pada penerapannya dibanding model NN (Kohli & Verma,
2011). Pada penelitian ini akan dibahas tentang Support Vector Machine (SVM) serta
penggunaannya dalam pemecahan masalah klasifikasi wilayah epidemik nyamuk
Demam Berdarah Dengue(DBD).

Penyakit Demam Berdarah Dengue(DBD) sendiri merupakan penyakit yang


dipengaruhi oleh kondisi lingkungan. Kenyataan tersebut sangat relevan dengan
konsep spasial dalam bidang ilmu geografi. Analisis spasial dapat digunakan
untuk melihat bagaimana faktor-faktor lingkungan mempengaruhi tingkat
kerentanan suatu wilayah terhadap terjadinya penyakit Demam Berdarah
Dengue(DBD).

Salah satu cara yang logis dan mungkin dilakukan dalam merancang program
pemberantasan dan pencegahan Demam Berdarah Dengue(DBD) yang lebih baik
adalah dengan melakukan klasifikasi wilayah yang positif sebagai daerah epidemik
demam berdarah berdasarkan data pasien yang teridentifikasi terserang penyakit
demam berdarah yang memasuki suatu wilayah.

1.2. Rumusan Masalah


Berdasarkan latar belakang diatas, maka permasalahan dalam penelitian adalah
penentuan wilayah epidemik demam berdarah karena data tidak memadai (database
tidak lengkap), data karakteristik wilayah menjadi tempat berkembangnya nyamuk
demam berdarah belum diketahui.

Universitas sumatera Utara


3

1.3. Tujuan Penelitian


Tujuan yang ingin dicapai oleh peneliti adalah sebagai berikut :

1. Untuk menyelidiki klasifikasi wilayah epidemik demam berdarah dengan


menggunakan metode support vector machine (SVM).
2. Untuk menentukan wilayah Demam Berdarah Dengue(DBD),berdasarkan
karakteristik wilayah tempat ideal berkembangnya Demam Berdarah Dengue
(DBD).

1.4. Manfaat Penelitian


Manfaat yang diperoleh dari penelitian ini adalah sebagai berikut :

1. Membantu pemerintah dalam menemukan wilayah epidemik Demam Berdarah


Dengue.
2. Menambah variasi aplikasi metode untuk permasalahan klasifikasi yang sudah
ada
3. Menjadi referensi bagi peneliti selanjutnya dalam bidang machine learning
khusus penggunaan support vector machine (SVM).

1. 5. Batasan Masalah
1. Data yang digunakan dalam penelitian ini adalah kasus penyebaran Demam
Berdarah Dengue (DBD) berdasarkan wilayah kota Medan.
2. Variabel yang digunakan untuk proses analisis klasifikasi adalah tinggih
wilayah, curah hujan, kelembapan udara, kepadatan penduduk, jumlah kasus
Demam Berdarah Dengue (DBD).

Universitas sumatera Utara


BAB 2

TINJAUAN PUSTAKA

2.1. Pengertian Klasifikasi

Klasifikasi adalah proses untuk menemukan model atau fungsi yang menjelaskan atau
membedakan konsep atau kelas data dengan tujuan untuk memperkirakan kelas yang
tidak diketahui dari suatu objek. Dalam pengklasifikasian data terdapat dua proses
yang dilakukan yaitu:

1. Proses training
Pada proses training digunakan training set yang telah diketahui label-labelnya
untuk membangun model atau fungsi.
2. Proses testing
Untuk mengetahui keakuratan model atau fungsi yang akan dibangun pada
proses training, maka digunakan data yang disebut dengan testing set untuk
memprediksi label-labelnya.

Klasifikasi dokumen adalah pemberian kategori yang telah didefinisikan


kepada dokumen yang belum memiliki kategori (Goller, 2000). Mengklasifikasi
dokumen merupakan salah satu cara untuk mengorganisasikan dokumen. Dokumen-
dokumen yang memiliki isi yang sama akan dikelompokkan ke dalam kategori yang
sama. Dengan demikian, orang-orang yang melakukan pencarian informasi dapat
dengan mudah melewatkan kategori yang tidak relevan dengan informasi yang dicari
atau yang tidak menarik perhatian (Achua & Feldman, 2004).

Peningkatan jumlah dokumen yang begitu pesat telah mendorong


berkembangnya metode pengklasifikasian secara otomatis. Metode ini dapat
melakukan klasifikasi dengan cara belajar dari sekumpulan contoh dokumen yang
telah diklasifikasi sebelumnya. Keuntungan dari metode ini adalah dapat menghemat
waktu kerja dan memperoleh hasil yang lebih baik. Metode ini adalah metode Support
Vector Machine (SVM).

Universitas sumatera Utara


5

2.2 Metode Algoritma Klasifikasi

Penelitian ini menyebutkan 4 (empat) metode algoritma klasifikasi yang cenderung


digunakan dalampengembangan DM, yaitu:

1. C45, metode ini menjadi pilihan pertama yang sering digunakan dalam
pengembangan DM karena kecepatan dalam pengklasifikasian pohon
keputusan disamping dapat mengkonstruksi pengklasifikasian dengan aturan-
aturan yang lain (Wu, 2008).
2. k-NN, beberapa hal yang menjadi perhatian dalam penggunaan
algoritma ini adalah penggunaan pilihan k, jika k sangat kecil maka akan
mengakibatkan noise. Sebaliknya jika terlalu besar dapat meyebabkan N
dengan banyak kelas yang harus diklasifikasikan. Tetapi kesederhanaan
metode menjadi nilai lebih sehingga menjadi pilihanbanyak developer DM
selain itu, algoritma ini mudah untuk dipahami dan diimplementasikan dalam
tekniknya. Penelitian ini menyatakan bahwa banyak peneliti berpendapat
bahwa algoritma ini lebih baik dari Support Vector Machine (SVM).
berdasarkan skema pengklasifikasiannya (Wu, 2008).
3. Naive Bayes, penelitian tersebut menyimpulkan bahwa metode algoritma
Naïve Bayes memiliki keunggulan untuk pengembangan DM, yaitu
kemudahan konstruksinya dan tidak membutuhkan parameter skema
pengulangan yang kompleks sehingga mudah dalam membaca data dalam
jumlah yang besar. Hal ini terjadi karena desain rancangan penuntunan
klasifikasi terhadap data. Selain itu, metode ini dinyatakan sebagai
algoritma yang mempunyai sifat simplicity, elegance dan robustness
(Subiyakto, 2015).
4. CART, penerapan metode algoritma ini banyak digunakan dalam berbagai
bidang yang membutuhkan pengolahan data yang komprehensif. Hanya saja
mekanismenya terdiri dari beberapa tahap yang bertingkat meliputi
automatic class balancing, automatic missing, value handling dan allows
for cost-sensitive learning, dynamic feature construction dan probability
tree estimation sehingga tingkat kompleksitas menjadi pertimbangan para

Universitas sumatera Utara


6

peneliti pemula. Hasil akhirnya adalah gambaran atribut berdasarkan prioritas


kebutuhan proses (Subiyakto, 2015).

2.3. Support Vector Machine


Support Vector Machine (SVM) dikembangkan oleh Boser, Guyon, Vapnik,
dan pertama kali dipresentasikan pada tahun 1992 di Annual Workshop on
Computational Learning Theory. Konsep dasar Support Vector Machine (SVM)
sebenarnya merupakan kombinasi harmonis dari teori-teori komputasi yang telah ada
puluhan tahun sebelumnya, seperti margin hyperplane (Duda & Hart tahun 1973,
Cover tahun 1965, Vapnik 1964, dan lain-lainnya), kernel diperkenalkan oleh
Aronszajn tahun 1950, dan demikian juga dengan kosep-konsep pendukung yang lain.
Akan tetapi hingga tahun 1992, belum pernah ada upaya merangkaikan komponen-
komponen tersebut.

Konsep Support Vector Machine (SVM) dapat dijelaskan secara sederhana


sebagai usaha mencari hyperplane terbaik yang berfungsi sebagai pemisah dua buah
kelas pada input space. pattern yang merupakan anggota dari dua buah kelas : +1 dan -
1 dan berbagi alternative garis pemisah (discrimination boundaries). Margin adalah
jarak antara hyperplane tersebut dengan pattern terdekat dari masing-masing kelas.
Pattern yang paling dekat ini disebut sebagai support vector. Usaha untuk mencari
lokasi hyperplane ini merupakan inti dari proses pembelajaran pada SVM
(Christianini, 2000).

Inisialisasi data pelatihan yang digunakan, diberikan label dalam bentuk

yi , xi iN1 , dengan yi   1,1, xi  R n menggunakan formulasi C-SVM. Untuk


kasus linear, algoritma tersebut terbukti dapat menemukan hyperplane terbaik yang
dapat memisahkan data dengan meminimalkan fungsi berikut :

 w,   
1
w  C i 1  i
2 N
(2.1)
2
untuk yi w  xi  b   1   i dan  i  0 , dimana C > 0 adalah trade off pada constraint.
Fungsi kernel pada titik data K(x,z) : Rn x Rn  R merupakan hasil inner produk dari
  x     z  . Fungsi mapping data   x  dan   z  tersebut sangat sulit sekali untuk

ditemukan nilai-nilainya dari dimensi tinggi yang menghasilkan nilai inner produk

Universitas sumatera Utara


7

sama dengan K(x,z). Karena kesulitan tersebut, maka sistem mengendalikan secara
langsung dari fungsi kernel yang digunakan. Kemudian untuk mendapatkan
persamaan hyperplane yang optimal, dapat digunakan persamaan berikut :

W    i 1 i    i j yi y j K x, xi 
N 1
(2.2)
2 ij

untuk : 0   i  C dan 
N
i 1
 i yi  0 (2.3)

fungsi keputusannya adalah sign  f  x  , dimana :

f  x   i 1 i y i K  x, x i   b
m
(2.4)

Perhatikan bahwa Persamaan 3 hanya membutuhkan akses ke fungsi kernel


saja, tanpa harus melakukan mapping data dengan fungsi  . , m adalah banyaknya
support vector. Sehingga hal ini memungkinkan seseorang untuk memecahkan
formulasi dalam ruang fitur yang berdimensi tinggi dengan sangat efisien, langkah
inilah yang disebut sebagai kernel trik. Untuk kernel linear, kita dapat menggunakan
fungsi kernel K  x , z   x  z , dan fungsi hyperplane f  x   w  x  b , dimana vektor w

dapat dihitung dengan rumus w  i 1 i y i xi dan b  


m 1
2
 
w.x   w.x  . Jika pada

kasus non-linear vektor w dapat dihitung dengan rumus w   i 1  i y i  x i  dan


m

konstanta b dengan rumus b  


1
2
    
w. x   w   x  . Khusus untuk additive

selected kernel digunakan rumus K  x, z   i 1 K i ( x, z ) dan f  x  dapat ditulis


n

sebagai f  x   w    x   b .

2.4. Karakteristik Support Vector Machine (SVM)

Menurut (Nugroho,2003), karakteristik Support Vector Machine (SVM) secara umum


dirangkumkan sebagai berikut:

1. Secara prinsip Support Vector Machine (SVM) adalah linear classifier.


2. Pattern recognition dilakukan dengan mentransformasikan data pada input
space ke ruang yang berdimensi lebih tinggi, dan optimisasi dilakukan pada
ruang vector yang baru tersebut. Hal ini membedakan Support Vector Machine

Universitas sumatera Utara


8

(SVM) dari solusi pattern recognition pada umumnya, yang melakukan


optimisasi parameter pada ruang hasil transformasi yang berdimensi lebih
rendah daripada dimensi input space.
3. Menerapkan strategi Structural Risk Minimization (SRM).
4. Prinsip kerja Support Vector Machine (SVM) pada dasarnya hanya mampu
menangani klasifikasi dua kelas.

2.5. Multiclass Support Vector Machine (SVM)


Ada dua pilihan untuk mengimplementasikan multiclass Support Vector Machine
(SVM) yaitu dengan menggabungkan beberapa Support Vector Machine (SVM)
biner atau menggabungkan semua data yang terdiri dari beberapa kelas ke dalam
sebuah bentuk permasalahn optimal. Namun pada pendekatan yang kedua
permasalahn optimasi yang harus diselesaikan jauh lebih rumit. Berikut ini adalah
metode yang umum digunakan untuk mengimplementasikan multiclass Support
Vector Machine (SVM) dengan pendekatan yang pertama:

1. Metode one-against-all (satu lawan semua)


Dengan menggunakan metode ini, dibagun k buah model Support Vector
Machine (SVM) biner (k adalah jumlah kelas)
2. Metode one-against-one (satu lawan satu)
Dengan menggunakan metode ini, dibagun k(k-1)/2 buah model klasifikasi
biner (k adalah jumlah kelas). Terdapat beberapa metode untuk melakukan
pengujian setelah keseluruhan k(k-1)/2 model klasifikasi selesai dibagun.
Salah satunya adalah metode voting (Santosa, 2007).

2.6. Kelebihan Support Vector Machine (SVM)

Adapun beberapa keuntungan dari metode Support Vector Machine (SVM)


adalah sebagai berikut:

1. Generalisasi
Generalisasi didefinisikan sebagai kemampuan suatu metode untuk
mengklasifikasikan suatu pattern, yang tidak termasuk data yang dipakai
dalam fase pembelajaran metode itu.
2. Curse of dimensionality

Universitas sumatera Utara


9

Curse of dimensionality didefinisikan sebagai masalah yang dihadapi suatu metode


pettern recognition dalam mengestimasikan parameter dikarenakan jumlah sampel
data yang relative lebih sedikit dibandingkan dengan dimensional ruang vektor data
tersebut.

3. Feasibility

Support Vector Machine (SVM) dapat diimplementasikan relative mudah, karena


proses penentuan support vector dapat dirumuskan dalam QP problem (Nugroho,
2003)

2.7. Kekurangan Support Vector Machine (SVM)


Adapun beberapa kerugian dari metode Support Vector Machine (SVM) adalah
sebagai berikut :

1. Sulit dipakai problem berskala besar. Dalam hal ini dimaksudkan dengan
jumlah sampel yang diolah.
2. Support Vector Machine (SVM) secara teoritik dikembangkan untuk problem
klasifikasi dengan dua kelas. Dewasa ini Support Vector Machine (SVM) telah
dimodifikasi agar dapat menyelesaikan masalah dengan lebih dari dua kelas
(Nugroho, 2003).

2.8. Demam Berdarah Dengue (DBD)

Demam Berdarah Dengue (DBD) merupakan salah satu penyakit menular


yang berbahaya dapat menimbulkan kematian dalam waktu singkat dan sering
menimbulkan wabah yang disebabkan oleh virus dengue yang termasuk kelompok B
Arthropod Borne Virus (Arboviroses) yang sekarang dikenal sebagai genus Flavivirus,
famili Flaviviridae dan mempunyai 4 jenis serotipe, yaitu ; DEN-1, DEN2, DEN-3,
DEN-4.

Demam Berdarah Dengue (DBD) adalah penyakit infeksi dengan manifestasi


klinis demam, nyeri otot, dan atau nyeri sendi yang disertai penurunan dari sel darah
putih, adanya bercak kemerahan di kulit, pembesaran kelenjar getah bening,
penurunan jumlah trombosit dan kondisi terberat adalah perdarahan dari hampir

Universitas sumatera Utara


10

seluruh jaringan tubuh. Penyakit ini ditularkan melalui gigitan nyamuk Aedes aegypti
dan mungkin juga Albopictus. Kedua jenis nyamuk ini terdapat hampir di seluruh
pelosok Indonesia kecuali ketinggian lebih dari 1000 meter diatas permukaan laut
(Samsi, 2001). Masa inkubasi penyakit ini diperkirakan lebih kurang 7 hari. Penyakit
Demam Berdarah Dengue (DBD) dapat menyerang semua golongan umur. Sampai
saat ini penyakit Demam Berdarah Dengue (DBD) lebih banyak menyerang anak-anak
tetapi dalam dekade terakhir ini terlihat adanya kecenderungan kenaikan proporsi
penderita Demam Berdarah Dengue (DBD) pada orang dewasa.

Indonesia termasuk daerah endemik untuk penyakit Demam Berdarah Dengue


(DBD). Serangan wabah umumnya muncul sekali dalam 4 - 5 tahun. Faktor
lingkungan memainkan peranan bagi terjadinya wabah. Lingkungan dimana terdapat
banyak air tergenang dan barang - barang yang memungkinkan air tergenang
merupakan tempat ideal bagi penyakit tersebut (Suroso, 1999). Simptom dengue
terjadi secara mendadak dan ditandai dengan demam tinggi, sakit kepala, pusing,
tulang dan sendi terasa nyeri, lidahnya terasa tidak enak, dan wajahnya pucat. Pada
kulit penderita terdapat bercak merah yang diakibatkan oleh gigitan nyamuk
(Sumarmo, 1999).

2.8.1 Epidemiologi

Infeksi virus denguedapat menimbulkan penyakit demam yang dikenal juga


sebagai demam lima hari. Disebut demikian karena demam yang menyertai penyakit
ini terjadi selama lima hari yang disertaidengan nyeri pada sendi, nyeri otot dan nyeri
kepala. Faktor-faktor yang mempengaruhi peningkatan dan penyebaran kasus DBD
sangat kompleks, yaitu (1) Pertumbuhan penduduk yang tinggi, (2) Urbanisasi yang
tidak terencana & tidak terkendali, (3) Tidak adanya kontrol vektor nyamuk yang
efektif di daerah endemis, dan (4) Peningkatansarana transportasi. Perkembangan
infeksi virus denguedipengaruhi berbagai faktor antara lain status imunitas pejamu,
kepadatan vektor nyamuk, transmisi virus dengue, keganasan (virulensi) virus
dengue, dan kondisi geografis setempat.

Sampai saat ini DBD telah ditemukan di seluruh propinsi di Indonesia, dan
200 kota telah melaporkan adanya kejadian luar biasa. Incidence rate (IR) meningkat

Universitas sumatera Utara


11

dari 0,005 per 100.000 penduduk pada tahun 1968 menjadi berkisar antara 6-27 per
100.000 penduduk. Pola berjangkit infeksi virus dengue dipengaruhi oleh iklim dan
kelembaban udara. Pada suhu yang panas (28-32°C) dengan kelembaban yang tinggi,
nyamuk Aedes akan tetap bertahan hidup untuk jangka waktu lama. Di Indonesia,
karena suhu udara dan kelembaban tidak sama di setiap tempat, maka pola waktu
terjadinya penyakit agak berbeda untuk setiap tempat. Di Jawa pada umumnya infeksi
virus dengue terjadi mulai awal Januari, meningkat terus sehingga kasus terbanyak
terdapat pada sekitar bulan April-Mei setiap tahun.

2.9 Evaluasi Kinerja Classifier

Ukuran kinerja dari model pada test set sering kali berguna karena ukuran tersebut
memberikan estimasi yang tidak bias dari error generalisasinya. Akurasi dari tingkat
error yang dihitung dari test set dapat juga digunakan untuk membandingkan kinerja
relatif dari classifier-classifier pada domain yang sama. Untuk melakukan
perbandingkan ini, label kelas dari test record haruslah diketahui. Berikut adalah
metode yang umum digunakan untuk mengevaluasi kinerja classifier.

2.9.1 Cross-Validation

Dalam pendekatan cross-validation, setiap record digunakan beberapa kali


dalam jumlah yang sama untuk training dan tepat sekali untuk testing. Untuk
mengilustrasikan metode ini, anggaplah kita mempartisi data ke dalam dua subset
yang berukuran sama. Pertaman, kita pilih satu dari kedua subset tersebut untuk
training dan satu lagi untuk testing. Kemudian dilakukan pertukaran fungsi dari subset
sedemikian sehingga subset yang sebelumnya sebagai training set menjadi test set
demikian sebaliknya. Pendekatan ini dinamakan two-fold crossvalidation. Total error
diperoleh dengan menjumlahkan error-error untuk kedu proses tersebut.

Dalam contoh ini, setiap record digunakan tepat satu kali untuk training dan
satu kali untuk testing. Metode k-fold cross-validation mengeneralisasi pendekatan ini
dengan mensegmentasi data ke dalam k partisi berukuran sama. Selama proses, salah
satu dari partisi dipilih untuk testing, sedangkan sisanya digunakan untuk training.
Prosedur ini diulangi k kali sedemikian sehingga setiap partisi digunakan untuk testing
tepat satu kali. Total error ditentukan dengan menjumlahkan error untuk semua k

Universitas sumatera Utara


12

proses tersebut. Kasus khusus untuk metode k-fold cross-validation menetapkan k =


N, ukuran dari data set. Metode ini dinamakan pendekatan leave-one-out, setiap test
set hanya mengandung satu record.

Pendekatan ini memiliki keuntungan dalam pengunaan sebanyak mungkin data


untuk training. Test set bersifat mutually exclusive dan secara efektif mencakup
keseluruhan data set. Kekurangan dari pendekatan ini adalah banyaknya komputasi
untuk mengulangi prosedur sebanyak N kali. Pendekatan dilakukan untuk menguji
apakah klasifikasi yang dilakukan sudah sesuai atau belum. Pendekatan yang
dilakukan dalam penelitian ini adalah dengan menghitung keakurasian sistem yaitu
dengan menghitung hasil jumlah data yang sesuai dengan kenyataan dibagi dengan
jumlah seluruh data. Secara matematis dapat dinyatakan dengan formula (Nithya &
Santhi, 2011).

Akurasi (%) = x 100 % (2.5 )

2.10 Pra pengolahan data

Pra pengolahan data melibatkan dua tugas utama yaitu:

1. Deteksi dan pembuangan data asing (outlier)

Data asing merupakan data dengan nilai yang tidak dibutuhkan karena tidak
konsisten pada sebagian pengamatan. Biasanya data asing dihasilkan dari kesalahan
pengukuran, kesalahan pengkodean dan pencatatan dan beberapa nilai abnormal yang
wajar. Ada dua strategi untuk menangani data asing, yang pertama mendeteksi dan
berikutnya membuang data asing sebagai bagian dari fase pra pengolahan. Yang
kedua adalah mengembangkan metode pemodelan yang kuat yang tidak merespon
data asing.

2. Pemberian skala, pengkodean dan seleksi fitur

Pra pengolahan data menyangkut beberapa langkah seperti memberikan skala


variabel dan beberapa jenis pengkodean. Sebagai contoh, satu fitur dengan range [0,
1] dan yang lain dengan range [-100, 100] tidak akan memiliki bobot yang sama pada
teknik yang diaplikasikan dan akan berpengaruh pada hasil akhir data. Oleh karena

Universitas sumatera Utara


13

itu, disarankan untuk pemberian skala dan membawa fitur-fitur tersebut ke bobot yang
sama untuk analisis lebih lanjut.

2.10.1 Normalization

Normalization atau normalisasi adalah proses transformasi dimana sebuah


atribut numerik diskalakan dalam range yang lebih kecil seperti -1.0 sampai 1.0, atau
0.0 sampai 1.0. Ada beberapa metode/teknik yang diterapkan untuk normalisasi data,
diantaranya:

1. Min-max Normalization Min-max normalization memetakan sebuah value v


dari atribut A menjadi v' ke dalam range [new_minA, new_maxA] berdasarkan
rumus:

= ( _ − _ )+ _

2. Z-Score Normalization Disebut juga zero-mean normalization, dimana value
dari sebuah atribut A dinormalisasi berdasarkan nilai rata-rata dan standar
deviasi dari atribut A. Sebuah value v dari atribut A dinormalisasi menjadi v'
dengan rumus:
= dimana A dan σA adalah nilai rata-rata dan standar deviasi dari

atribut A.
3. Normalization by Decimal Scaling Normalisasi yang diperoleh dengan
melakukan penggeseran titik desimal dari value sebuah atribut A. Jumlah titik
desimal yang digeser tergantung dari nilai absolut maksimum dari atribut A.

Universitas sumatera Utara


BAB 3
METODOLOGI PENELITIAN

3.1. Metodologi Penelitian


Metodologi penelitian dapat dilihat seperti pada Gambar 3.1.

Identifikasi Masalah

Penentuan Variabel

(Karakteristik Epidemik)

Pra Pengolahan Data

Pengumpulan Data

Normalisasi Data

Data Training

Data Testing

Klasifikasi SVM

Gambar 3.1 Metodologi Penelitian

Masalah yang akan dibahas dalam penelitian ini adalah bagaimana mengklasifikasikan

wilayah epidemik Demam Berdarah di kota Medan.

Universitas sumatera Utara


15

3.2 Data dan Variabel Penelitian

Data yang digunakan dalam penelitian ini adalah data data jumlah kasus
Demam Berdarah di kota Medan mulai tahun 2010-2013 yang diperoleh dari dinas
kesehatan kota Medan. Pemilihan variabel penelitian dalam klasifikasi wilayah
epidemik Demam Berdarah didasarkan pada data spasial kerentanan penyakit Demam
Berdarah di Kota Medan. Variabel independen penelitian yang dilibatkan kepadatan
penduduk, tinggi wilayah, kelembapan udara, curah hujan dan data jumlah kasus
Demam Berdarah dimana :

X1 : Kepadatan Penduduk

X2 : Tinggi Wilayah

X3 : Kelembaban Udara

X4 : Curah Hujan

X5 : Jumlah kasus Demam Berdarah dalam Wilayah Kota Medan

Sedangkan Untuk variabel dependen (Y) terdiri dari dua kategori, yaitu :

Y = 1, untuk wilayah positip epidemik Demam Berdarah

Y = -1, untuk wilayah negatip epidemik Demam Berdarah

Universitas sumatera Utara


16

3.3. Kota Medan Secara Geografis

Gambar 3.2 Peta Kota Medan

Universitas sumatera Utara


17

3.4. Pra Pengolahan Data

Berdasarkan parameter yang akan diolah, pada penelitian ini dilakukan pengambilan
data diantaranya : kepadatan penduduk, tinggih wilayah, kelembaban udara, curah
hujan, dan data jumlah kasus Demam Berdarah dari Dinas Kesehatan Kota Medan.
Data yang telah dikumpulkan selanjutnya dilakukan normalisasi berdasarkan satuan
yang didapat.

Tabel 3.1 Data Jumlah Kasus Tiap Wilayah

NO KECAMATAN 2010 2011 2012 2013 RATA- RATA

1 Medan Tuntungan 180 133 79 69 110.25

2 Medan Johor 170 130 57 110 116.75

3 Medan Amplas 181 150 48 80 114.75

4 Medan Denai 204 228 109 141 170.5

5 Medan Area 121 71 16 33 60.25

6 Medan Kota 106 144 57 48 88.75

7 Medan Maimun 23 59 17 27 31.5

8 Medan Polonia 87 50 11 25 43.25

9 Medan Baru 145 106 36 56 85.75

10 Medan Selayang 114 82 95 105 99

11 Medan Sunggal 244 155 124 82 151.25

12 Medan Helvetia 272 159 108 101 160

13 Medan Petisah 108 70 29 85 73

14 Medan Barat 112 26 38 52 82

15 Medan Timur 98 101 46 52 74.25

16 Medan Perjuangan 96 74 49 36 63.75

17 Medan Tembung 182 154 50 48 108.5

Universitas sumatera Utara


18

18 Medan Deli 175 132 74 135 129

19 Medan Labuhan 151 75 38 31 73.75

20 Medan Marelan 179 128 44 27 94.5

21 Medan Belawan 63 77 24 7 42.75

Tabel 3.2 Data Kriteria Kepadatan Penduduk

RATA-
NO KECAMATAN 2010 2011 2012 2013
RATA

1 Medan Tuntungan 3914 3955 3967.21 3991.01 3956.805

2 Medan Johor 8495 8605 8636.01 8687.72 8605.9325

3 Medan Amplas 10111 10326 10386.68 10448.79 10318.1175

4 Medan Denai 15624 15676 25690.72 15784.53 18193.8125

5 Medan Area 17490 17059 17513.59 17618.48 17532.7675

6 Medan Kota 13772 13788 13792.22 13875.14 13806.84

7 Medan Maimun 13282 13304 13310.4 13390.27 13321.6675

8 Medan Polonia 5859 5925 5943.62 5979.25 5926.7175

9 Medan Baru 6766 6775 6776.88 6817.98 6783.965

10 Medan Selayang 7675 7805 7841.92 7888.91 7802.7075

11 Medan Sunggal 7302 7313 7316.52 7360.36 7322.97

12 Medan Helvetia 10962 11036 11057.67 11123.94 11044.9025

13 Medan Petisah 9054 9066 9069.65 9124.19 9078.46

14 Medan Barat 13278 13298 13304.32 13384.05 13316.0925

15 Medan Timur 13999 14015 14019.59 14103.74 14034.3325

16 Medan Perjuangan 22819 22856 22866.99 23004.4 22886.5975

17 Medan Tembung 16718 16744 16751.06 16851.44 16766.125

Universitas sumatera Utara


19

RATA-
NO KECAMATAN 2010 2011 2012 2013
RATA

18 Medan Deli 8004 8158 8202.06 8251.01 8153.7675

19 Medan Labuhan 3032 3063 3071.78 3090.1 3064.22

20 Medan Marelan 5895 6130 6184.63 6221.54 6107.7925

21 Medan Belawan 3638 3644 3646.06 3667.81 3648.9675

Tabel 3.3 Data Kriteria Tinggi Wilayah

NO KECAMATAN KETINGGIAN WILAYAH

1 Medan Tuntungan 27.5

2 Medan Johor 23.7

3 Medan Amplas 22.4

4 Medan Denai 20.5

5 Medan Area 22.7

6 Medan Kota 25.6

7 Medan Maimun 25.7

8 Medan Polonia 27.7

9 Medan Baru 26.5

10 Medan Selayang 26.7

11 Medan Sunggal 23.5

12 Medan Helvetia 7.7

13 Medan Petisah 25.4

14 Medan Barat 25.7

15 Medan Timur 4.7

16 Medan Perjuangan 24.5

17 Medan Tembung 6.7

Universitas sumatera Utara


20

18 Medan Deli 4.5

19 Medan Labuhan 3.5

20 Medan Marelan 4.6

21 Medan Belawan 3.7

Tabel 3.4 Data Kriteria Kelembapan Udara

NO KECAMATAN KELEMBABAN UDARA

1 Medan Tuntungan 82

2 Medan Johor 81.7

3 Medan Amplas 82

4 Medan Denai 83

5 Medan Area 82

6 Medan Kota 81

7 Medan Maimun 80

8 Medan Polonia 80

9 Medan Baru 80

10 Medan Selayang 80

11 Medan Sunggal 82

12 Medan Helvetia 82.5

13 Medan Petisah 80

14 Medan Barat 80

15 Medan Timur 81

16 Medan Perjuangan 83

17 Medan Tembung 82

Universitas sumatera Utara


21

NO KECAMATAN KELEMBABAN UDARA

18 Medan Deli 82

19 Medan Labuhan 80

20 Medan Marelan 80

21 Medan Belawan 80

Tabel 3.5 Data Kriteria Curah Hujan

NO KECAMATAN CURAH HUJAN

1 Medan Tuntungan 47.71

2 Medan Johor 46.45

3 Medan Amplas 46.25

4 Medan Denai 47.15

5 Medan Area 32.7

6 Medan Kota 34.5

7 Medan Maimun 32.7

8 Medan Polonia 32.4

9 Medan Baru 31.5

10 Medan Selayang 29.5

11 Medan Sunggal 46.71

12 Medan Helvetia 45.7

13 Medan Petisah 35.3

14 Medan Barat 30.25

15 Medan Timur 31.2

16 Medan Perjuangan 32.15

17 Medan Tembung 46.5

Universitas sumatera Utara


22

18 Medan Deli 45.8

19 Medan Labuhan 29.1

20 Medan Marelan 30.15

21 Medan Belawan 38.1

3.5 Normalisasi Data


Nilai data dari setiap variabel yang telah diperoleh berbeda-beda sehingga belum bisa
digunakan sebagai masukan standar untuk pengujian. Data tersebut haruslah
dinormalisasi terlebih dahulu yaitu dengan menggunakan Min-max normalization.
Contoh data hasil yang dinormalisasi dapat dilihat pada Tabel 3.6.

Tabel 3.6 Data Hasil Normalisasi

X1 X2 X3 X4 X5
71.00 65.00 55.00 76.00 71.00
55.00 51.00 32.00 56.00 67.00
43.00 43.00 31.00 34.00 72.00
61.00 62.00 54.00 31.00 54.00
41.00 32.00 32.00 53.00 43.00
52.00 54.00 43.00 41.00 65.00
57.00 57.00 42.00 53.00 52.00
58.00 58.00 53.00 55.00 66.00
54.00 54.00 43.00 60.00 31.00
68.00 69.00 45.00 71.00 68.00
71.00 71.00 47.00 32.00 73.00
61.00 61.00 32.00 57.00 65.00
69.00 70.00 43.00 61.00 63.00
34.00 62.00 41.00 69.00 67.00
43.00 43.00 32.00 35.00 45.00
36.00 31.00 34.00 42.00 61.00
51.00 67.00 30.00 55.00 55.00
68.00 68.00 36.00 68.00 48.00
62.00 43.00 32.00 62.00 53.00
65.00 37.00 31.00 65.00 52.00
55.00 53.00 30.00 65.00 42.00

3.6. Pembagian Data Training dan Data Testing

Universitas sumatera Utara


23

Dari data yang suda ternormalisasi, dibagi menjadi 80% untuk training dan
20% sisanya sebagai testing. Data training digunakan untuk membentuk model
klasifikasi menggunakan matriks konfusi. Sedangkan data testing digunakan untuk
menguji ketepatan klasifikasi dari model yang telah terbentuk. Ketepatan klasifikasi
kedua model nantinya akan dibandingkan, baik untuk data training maupun data
testing.

3.7. Klasifikasi Support Vector Machine


Apabila data tersebut cukup valid maka dilakukan proses training data wilayah
epidemik Demam Berdarah dan selanjutnya proses training data untuk menghasilkan
keluaran berupa support vector pada garis hyperplane untuk mendapatkan support
vector pada model wilayah epidemik Demam Berdarah dari proses training data.
Tahap untuk mengklasifikasi data wilayah epidemik Demam Berdarah dengan
menggunakan model dari training data wilayah epidemik Demam Berdarah yang
menghasilkan prediksi. Sedangkan langkah selanjutnya pada proses testing data akan
dilakukan untuk mendapatkan keakuratan data yang berdasarkan dari tampilan
keluaran pada program yang harus di atas 50 % guna untuk mendapatkan keakuratan
model testing data wilayah epidemik Demam Berdarah. Dengan telah dihasilkan
keluaran berupa support vector maka langkah pada diagram alir untuk proses
mengklasifikasi wilayah epidemik Demam Berdarah dengan menggunakan metode
support vector machine telah selesai dikerjakan. Contoh pengolahan data dengan
menggunkan metode support vector machine dapat dilihat seperti pada tabel 3.7

Tabel 3.7 Pengolahan Data dengan metode support vector machine

NO Kecamatan X1 X2 X3 X4 X5 Y
1 Mdn. Tuntungan 110.25 3956.805 27.5 82 47.71 -1
2 Mdn. Johor 116.75 8605.9325 23.7 81.7 46.45 -1
3 Mdn. Amplas 114.75 10318.1175 22.4 82 46.25 -1
4 Mdn. Denai 170.5 18193.8125 20.5 83 47.15 -1
5 Mdn. Area 60.25 17532.7675 22.7 82 32.7 -1
6 Mdn. Kota 88.75 13806.84 25.6 81 34.5 -1
7 Mdn. Maimun 31.5 13321.6675 25.7 80 32.7 -1
8 Mdn. Polonia 43.25 5926.7175 27.7 80 32.4 -1
9 Mdn. Baru 85.75 6783.965 26.5 80 31.5 -1
10 Mdn. Selayang 99 7802.7075 26.7 80 29.5 -1

Universitas sumatera Utara


24

11 Mdn. Sunggal 151.25 7322.97 23.5 82 46.71 -1


12 Mdn. Helvetia 160 11044.9025 7.7 82.5 45.7 -1
13 Mdn. Petisah 73 9078.46 25.4 80 35.3 -1
14 Mdn. Barat 82 13316.0925 25.7 80 30.25 -1

15 Mdn. Timur 74.25 14034.3325 4.7 81 31.2 -1


16 Mdn. Perjuangan 63.75 22886.5975 24.5 83 32.15 -1
17 Mdn. Tembung 108.5 16766.125 6.7 82 46.5 -1
18 Mdn. Deli 129 8153.7675 4.5 82 45.8 -1
19 Mdn. Labuhan 73.75 3064.22 3.5 80 29.1 -1
20 Mdn. Marelan 94.5 6107.7925 4.6 80 30.15 -1
21 Mdn. Belawan 42.75 3648.9675 3.7 80 38.1 -1

Universitas sumatera Utara


BAB IV
HASIL DAN PEMBAHASAN

Pengujian yang dilakukan penulis dalam melakukan pelatihan dan


pengklasifikasian wilayah yang berjumlah 21 kecamatan. Data tersebut akan dilatih
dan diuji dengan menggunkan metode Support Vector Machine (SVM). Hasil
pengolahan data dapat dilihat pada tabel 4.1

Tabel 4.1 Hasil Pengolahan Data Wilayah Kota Medan

X1 X2 X3 X4 X5 Y
71.00 65.00 55.00 76.00 71.00 1
55.00 51.00 32.00 56.00 67.00 1
43.00 43.00 31.00 34.00 72.00 1
61.00 62.00 54.00 31.00 54.00 1
41.00 32.00 32.00 53.00 43.00 -1
52.00 54.00 43.00 41.00 65.00 -1
57.00 57.00 42.00 53.00 52.00 -1
58.00 58.00 53.00 55.00 66.00 -1
54.00 54.00 43.00 60.00 31.00 -1
68.00 69.00 45.00 71.00 68.00 -1
71.00 71.00 47.00 32.00 73.00 1
61.00 61.00 32.00 57.00 65.00 1
69.00 70.00 43.00 61.00 63.00 -1
34.00 62.00 41.00 69.00 67.00 -1
43.00 43.00 32.00 35.00 45.00 -1
36.00 31.00 34.00 42.00 61.00 -1
51.00 67.00 30.00 55.00 55.00 1
68.00 68.00 36.00 68.00 48.00 1
62.00 43.00 32.00 62.00 53.00 -1
65.00 37.00 31.00 65.00 52.00 -1
55.00 53.00 30.00 65.00 42.00 -1

Pada Proses ini setiap nilai yang sudah diketahui dari masing – masing wilayah akan
diberi label yaitu nilai 1 atau -1, dimana 1 menunjukkan kondisi wilayah untuk
kategori sarang dan -1 menunjukkan wilayah bukan sarang demam berdarah.

Universitas sumatera Utara


26

Tabel 4.2 Hasil Pengolahan Data Wilayah Deli Serdang

X1 X2 X3 X4 X5 Y
63.00 32.00 66.00 65.00 3.00 1
46.00 46.00 58.00 62.00 1.00 1
25.00 51.00 72.00 71.00 1.00 1
63.00 28.00 56.00 58.00 1.00 -1
43.00 23.00 45.00 47.00 1.00 -1
63.00 31.00 43.00 42.00 1.00 -1
45.00 33.00 52.00 54.00 1.00 -1
65.00 37.00 54.00 55.00 1.00 -1
54.00 23.00 53.00 51.00 1.00 -1
64.00 26.00 46.00 43.00 1.00 -1
78.00 25.00 45.00 42.00 1.00 -1
67.00 32.00 69.00 67.00 1.00 1
65.00 32.00 72.00 71.00 1.00 1
55.00 39.00 57.00 55.00 3.00 1
53.00 34.00 63.00 35.00 1.00 -1
48.00 54.00 46.00 45.00 1.00 -1
25.00 21.00 25.00 23.00 1.00 -1
32.00 23.00 63.00 61.00 1.00 -1
43.00 43.00 43.00 45.00 1.00 -1
44.00 32.00 63.00 67.00 1.00 -1
46.00 43.00 61.00 33.00 1.00 1
31.00 29.00 29.00 29.00 1.00 -1

4.1 Hasil Implementasi Support Vector Machine (SVM)

Sebelum melakukan pengenalan, pada Support Vector Machine dilakukan

pelatihan dalam pengenalan pola wilayah dengan algoritma Support Vector Machine

(SVM) terhadap hasil pengolahan data. Data pelatihan (training) yang digunakan

adalah 80% dan 20% untuk data pengujian (testing). Pelatihan support vector machine

(SVM) ini berfungsi untuk mengajarkan kepada support vector machine (SVM)

pola – pola wilayah yang ada sehingga diharapkan support vector machine (SVM)

dapat mengenali pola-pola wilayah baru yang diberikan. Pada tahap implementasi ini

menggunakan 10 kali percobaan atau tenfold.

Universitas sumatera Utara


27

4.2 Percobaan Pertama

Percobaan pertama yaitu proses training hasil pengolahan data dengan ukuran 19 baris
dan 6 kolom.

4.3.1 Proses Training

Pertama-tama training dilakukan dengan metode Support Vector Machine seperti pada
tabel 4.3

Tabel 4.3 Hasil Training Percobaan Pertama

X1 X2 X3 X4 X5 Y

71 65. 55 76 71 1

55 51 32 56 67 1

43 43 31 34 72 1

61 62 54 31 54 1

41 32 32 53 43 -1

52 54 43 41 65 -1

57 57 42 53 52 -1

58 58 53 55 66 -1

54 54 43 60 31 -1

68 69 45 71 68 -1

71 71 47 32 73 1

61 61 32 57 65 1

69 70 43 61 63 -1

34 62 41 69 67 -1

55 53 30 65 42 -1

Universitas sumatera Utara


28

X1 X2 X3 X4 X5 Y

36 31 34 42 61 -1

51 67 30 55 55 1

65 37 31 65 52 -1

62 43 32 62 53 -1

4.3.2 Proses Testing

Pada tahap pengujian dilakukan pengujian terhadap hasil pengolahan data wilayah.
Proses pengujian dengan menggunakan 20% dari hasil pengolahan data yang
dilakukan dengan metode Support Vector Machine (SVM) seperti pada tabel 4.4.

Tabel 4.4 Proses Testing Pertama

X1 X2 X3 X4 X5 Y

63 32 66 65 3 1

46 46 58 62 1 1

Pada percobaan pertama proses training menggunakan 19 baris data seperti


pada tabel 4.2 dari hasil pengolahan data yang telah diberi label. Label yang ada pada
pada data latih adalah nilai 1 atau -1, dimana 1 menunjukkan kondisi wilayah untuk
kategori sarang demam berdarah dan -1 menunjukkan wilayah untuk kategori bukan
sarang. Proses testing data merupakan kegiatan membandingkan data uji dengan
struktur data latih yang dihasilkan dari proses pengenalan (training). Proses ini
menghasilkan keluaran sama seperti label yang diberikan pada data latih.

4.4 Percobaan Kedua

Percobaan pertama yaitu proses training hasil pengolahan data dengan ukuran 19 baris
dan 2 kolom.

4.4.1 Proses Training

Universitas sumatera Utara


29

Pertama-tama training dilakukan dengan metode Support Vector Machine (SVM)


seperti pada tabel 4.5

Tabel 4.5 Hasil Training Percobaan Kedua


X1 X2 X3 X4 X5 Y

71 65 55 76 71 1

55 51 32 56 67 1

43 43 31 34 72 1

61 62 54 31 54 1

41 32 32 53 43 -1

52 54 43 41 65 -1

57 57 42 53 52 -1

58 58 53 55 66 -1

54 54 43 60 31 -1

65 37 31 65 52 -1

71 71 47 32 73 1

61 61 32 57 65 1

69 70 43 61 63 -1

34 62 41 69 67 -1

55 53 30 65 42 -1

36 31 34 42 61 -1

62 43 32 62 53 -1

68 68 36 68 48 1

43 43 32 35 45 -1

4.4.2 Proses Testing

Universitas sumatera Utara


30

Pada tahap pengujian dilakukan pengujian terhadap hasil pengolahan data wilayah.
proses pengujian dengan menggunakan 20% dari hasil pengolahan data yang
dilakukan dengan metode Support Vector Machine (SVM) seperti pada tabel 4.6.

Tabel 4.6 Proses Testing Percobaan Kedua


X1 X2 X3 X4 X5 Y

25 51 72 71 1 1

25 21 25 23 1 -1

Pada percobaan kedua proses training menggunakan 19 baris seperti data pada
tabel 4.4 dari hasil pengolahan data yang telah diberi label. Label yang ada pada pada
data latih adalah nilai 1 atau -1, dimana 1 menunjukkan wilayah untuk kategori
sarang demam berdarah dan -1 menunjukkan wilayah untuk kategori bukan sarang.
Proses testing data merupakan kegiatan membandingkan data uji dengan struktur data
latih yang dihasilkan dari proses pengenalan (training). Proses ini menghasilkan
keluaran sama seperti label yang diberikan pada data latih.

4.5 Percobaan Ketiga

Percobaan pertama yaitu proses training hasil pengolahan data wilayah dengan ukuran
19 baris dan 2 kolom.

4.5.1 Proses Training

Pertama-tama training dilakukan dengan metode Support Vector Machine (SVM)


seperti pada tabel 4.7

Tabel 4.7 Hasil Training Percobaan Ketiga

X1 X2 X3 X4 X5 Y

71 65 55 76 71 1

55 51 32. 56 67 1

Universitas sumatera Utara


31

62 43 32. 62 53 -1

61 62 54 31 54 1

41 32 32 53 43 -1

52 54 43. 41 65 -1

57 57 42 53 52 -1

58 58 53 55 66 -1

54 54 43 60 31 -1

65 37 31 65 52 -1

71 71 47 32 73 1

61 61 32 57 65 1

69 70 43 61 63 -1

36 31 34 42 61 -1

55 53 30 65 42 -1

68 69 45 71 68 -1

51 67 30 55 55 1

68 68 36 68 48 1

43 43 32 35 45 -1

4.5.2 Proses Testing

Pada tahap pengujian dilakukan pengujian terhadap hasil pengolahan data wilayah.
proses pengujian dengan menggunakan 20% dari hasil pengolahan data yang
dilakukan dengan metode Support Vector Machine (SVM) seperti pada tabel 4.8.

Tabel 4.8 Proses Testing Percobaan Ketiga

X1 X2 X3 X4 X5 Y

Universitas sumatera Utara


32

65 32 72 71 1 1

44 32 63 67 1 -1

Pada percobaan ketiga proses training menggunakan 19 baris data seperti pada
tabel 4.6 dari hasil pengolahan data yang telah diberi label. Label yang ada pada pada
data latih adalah nilai 1 atau -1, dimana 1 menunjukkan kondisi wilayah sarang
demam berdarah dan -1 menunjukkan wilayah untuk kategori bukan sarang. Proses
testing data merupakan kegiatan membandingkan data uji dengan struktur data latih
yang dihasilkan dari proses pengenalan (training). Proses ini menghasilkan keluaran
sama seperti label yang diberikan pada data latih. Pada proses testing menggunakan 2
baris data seperti pada tabel 4.8 dari hasil pengolahan data.

4.6 Percobaan Keempat

Percobaan pertama yaitu proses training hasil pengolahan data wilayah dengan ukuran
19 baris dan 2 kolom.

4.6.1 Proses Training

Pertama-tama training dilakukan dengan metode Support Vector Machine (SVM)


seperti pada tabel 4.9

Tabel 4.9 Hasil Training Percobaan Keempat

X1 X2 X3 X4 X5 Y

71 65 55 76 71 1

55 51 32 56 67 1

62 43 32 62 53 -1

61 62 54 31 54 1

41 32 32 53 43 -1

52 54 43 41 65 -1

Universitas sumatera Utara


33

X1 X2 X3 X4 X5 Y

57 57 42 53 52 -1

58 58 53 55 66 -1

36 31 34 42 61 -1

65 37 31 65 52 -1

71 71 47 32 73 1

61 61 32 57 65 1

69. 70. 43. 61. 63. -1.

34 62 41 69 67 -1

43 43 31 34 72 1

68 69 45 71 68 -1

51 67 30 55 55 1

68 68 36 68 48 1

43 43 32 35 45 -1

4.6.2 Proses Testing

Pada tahap pengujian dilakukan pengujian terhadap hasil pengolahan data wilayah.
proses pengujian dengan menggunakan 20% dari hasil pengolahan data yang
dilakukan dengan metode Support Vector Machine (SVM) seperti pada tabel 4.10.

Tabel 4.10 Proses Testing Percobaan Keempat

X1 X2 X3 X4 X5 Y

63 31 43 42 1 -1

53 34 63 35 1 -1

Pada percobaan keempat proses training menggunakan 19 baris data seperti


pada tabel 4.8 dari hasil pengolahan data yang telah diberi label. Label yang ada pada

Universitas sumatera Utara


34

pada data latih adalah nilai 1 atau -1, dimana 1 menunjukkan kondisi wilayah untuk
kategori sarang demam berdarah dan -1 menunjukkan wilayah untuk kategori bukan
sarang. Proses testing data merupakan kegiatan membandingkan data uji dengan
struktur data latih yang dihasilkan dari proses pengenalan (training). Proses ini
menghasilkan keluaran sama seperti label yang diberikan pada data latih. Pada proses
testing menggunakan 2 baris data seperti pada tabel 4.10 dari hasil pengolahan data.

4.7 Percobaan Kelima

Percobaan pertama yaitu proses training hasil pengolahan data dengan ukuran 19 baris
dan 2 kolom.

4.7.1 Proses Training

Pertama-tama training dilakukan dengan metode Support Vector Machine (SVM)


seperti pada tabel 4.11

Tabel 4.11 Hasil Training Percobaan Kelima


X1 X2 X3 X4 X5 Y

61 61 32 57 65 1

55 51 32 56 67 1

62 43 32 62 53 -1

61 62 54 31 54 1

69 70 43 61 63 -1

52 54 43 41 65 -1

57 57 42 53 52 -1

58 58 53 55 66 -1

36 31 34 42 61 -1

65 37 31 65 52 -1

71 71 47 32 73 1

Universitas sumatera Utara


35

X1 X2 X3 X4 X5 Y

54 54 43 60 31 -1

55 53 30 65 42 -1

34 62 41 69 67 -1

43 43 31 34 72 1

68 69 45 71 68 -1

51 67 30 55 55 1

68 68 36 68 48 1

43 43 32 35 45 -1

4.7.2 Proses Testing

Pada tahap pengujian dilakukan pengujian terhadap hasil pengolahan data wilayah.
proses pengujian dengan menggunakan 20% dari hasil pengolahan data wilayah yang
dilakukan dengan metode Support Vector Machine (SVM) seperti pada tabel 4.12.

Tabel 4.12 Proses Testing Percobaan Kelima

X1 X2 X3 X4 X5 Y

54 23 53 51 1 -1

78 25 45 42 1 -1

Pada percobaan kelima proses training menggunakan 19 baris data seperti pada
tabel 4.10 dari hasil pengolahan data yang telah diberi label. Label yang ada pada pada
data latih adalah nilai 1 atau -1, dimana 1 menunjukkan kondisi wilayah untuk
kategori bukan sarang dan -1 menunjukkan wilayah untuk kategori sarang demam
berdarah. Proses testing data merupakan kegiatan membandingkan data uji dengan
struktur data latih yang dihasilkan dari proses pengenalan (training). Proses ini
menghasilkan keluaran sama seperti label yang diberikan pada data latih. Pada proses
testing menggunakan 2 baris data seperti pada tabel 4.12 dari hasil pengolahan data.

Universitas sumatera Utara


36

4.8 Percobaan Keenam

Percobaan pertama yaitu proses training hasil pengolahan data dengan ukuran 19 baris
dan 2 kolom.

4.8.1 Proses Training

Pertama-tama training dilakukan dengan metode Support Vector Machine (SVM)


seperti pada tabel 4.13

Tabel 4.13 Hasil Training Percobaan Keenam


X1 X2 X3 X4 X5 Y

65 37 31 65 52 -1

55 51 32 56 67 1

71 71 47 32 73 1

61 62 54 31 54 1

69 70 43 61 63 -1

52 54 43 41 65 -1

57 57 42 53 52 -1

58 58 53 55 66 -1

36 31 34 42 61 -1

71 65 55 76 71 1

41 32 32 53 43 -1

54 54 43 60 31 -1

55 53 30 65 42 -1

34 62 41 69 67 -1

43 43 31 34 72 1

68 69 45 71 68 -1

Universitas sumatera Utara


37

51 67 30 55 55 1

68 68 36 68 48 1

43 43 32 35 45 -1

4.8.2 Proses Testing

Pada tahap pengujian dilakukan pengujian terhadap hasil pengolahan data wilayah.
Proses pengujian dengan menggunakan 20% dari hasil pengolahan data yang
dilakukan dengan metode Support Vector Machine (SVM) seperti pada tabel 4.14.

Tabel 4.14 Proses Testing Percobaan Keenam

X1 X2 X3 X4 X5 Y

46 43 61 33 1 1

63 28 56 58 1 -1

Pada percobaan keenam proses training menggunakan 19 baris data seperti


pada tabel 4.13 dari hasil pengolahan data yang telah diberi label. Label yang ada pada
pada data latih adalah nilai 1 atau -1, dimana 1 menunjukkan kondisi wilayah untuk
kategori bukan sarang dan -1 menunjukkan wialayah untuk kategori sarang demam
berdarah. Proses testing data merupakan kegiatan membandingkan data uji dengan
struktur data latih yang dihasilkan dari proses pengenalan (training). Proses ini
menghasilkan keluaran sama seperti label yang diberikan pada data latih. Pada proses
testing menggunakan 2 baris data seperti pada tabel 4.14 dari hasil pengolahan data.

4.9 Percobaan Ketujuh

Percobaan pertama yaitu proses training hasil pengolahan data dengan ukuran 19 baris
dan 2 kolom.

4.9.1 Proses Training

Universitas sumatera Utara


38

Pertama-tama training dilakukan dengan metode Support Vector Machine (SVM)


seperti pada tabel 4.15

Tabel 4.15 Hasil Training Percobaan Ketujuh


X1 X2 X3 X4 X5 Y

65 37 31 65 52 -1

55 51 32 56 67 1

71 71 47 32 73 1

61 62 54 31 54 1

58 58 53 55 66 -1

52 54 43 41 65 -1

57 57 42 53 52 -1

61 61 32 57 65 1

62 43 32 62 53 -1

71 65 55 76 71 1

41 32 32 53 43 -1

54 54 43. 60 31 -1

55 53 30 65 42 -1

34 62 41 69 67 -1

43 43 31 34 72 1

68 69 45 71 68 -1

51 67 30 55 55 1

68 68 36 68 48 1

43 43 32 35 45 -1

4.9.2 Proses Testing

Universitas sumatera Utara


39

Pada tahap pengujian dilakukan pengujian terhadap hasil pengolahan data wilayah.
proses pengujian dengan menggunakan 20% dari hasil pengolahan data yang
dilakukan dengan metode Support Vector Machine (SVM) seperti pada tabel 4.16

Tabel 4.16 Proses Testing Percobaan Ketujuh

X1 X2 X3 X4 X5 Y

43 23 45 47 1 -1

67 32 69 67 1 1

Pada percobaan ketujuh proses training menggunakan 19 baris data seperti


pada tabel 4.14 dari hasil pengolahan data yang telah diberi label. Label yang ada pada
pada data latih adalah nilai 1 atau -1, dimana 1 menunjukkan kondisi wilayah untuk
kategori bukan sarang dan -1 menunjukkan wilayah untuk kategori sarang demam
berdarah. Proses testing data merupakan kegiatan membandingkan data uji dengan
struktur data latih yang dihasilkan dari proses pengenalan (training). Proses ini
menghasilkan keluaran sama seperti label yang diberikan pada data latih. Pada proses
testing menggunakan 2 baris data seperti pada tabel 4.16 dari hasil pengolahan data.

4.10 Percobaan Kedelapan

Percobaan pertama yaitu proses training hasil pengolahan data wilayah dengan ukuran
19 baris dan 2 kolom.

4.10.1 Proses Training

Pertama-tama training dilakukan dengan metode Support Vector Machine (SVM)


seperti pada tabel 4.17

Tabel 4.17 Hasil Training Percobaan Kedelapan


X1 X2 X3 X4 X5 Y

65 37 31 65 52 -1

55 51 32 56 67 1

Universitas sumatera Utara


40

X1 X2 X3 X4 X5 Y

57 57 42 53 52 -1

61 62 54 31 54 1

58 58 53 55 66 -1

36 31 34 42 61 -1

69 70 43 61 63 -1

61 61 32 57 65 1

62 43 32 62 53 -1

71 65 55 76 71 1

41 32 32 53 43 -1

54 54 43 60 31 -1

55 53 30 65 42 -1

34 62 41 69 67 -1

43 43 31 34 72 1

68 69 45 71 68 -1

51 67 30 55 55 1

68 68 36 68 48 1

43 43 32 35 45 -1

4.10.2 Proses Testing

Pada tahap pengujian dilakukan pengujian terhadap hasil pengolahan data wilayah.

Proses pengujian dengan menggunakan 20% dari hasil pengolahan data yang

dilakukan dengan metode Support Vector Machine (SVM) seperti pada tabel 4.18.

Tabel 4.18 Proses Testing Percobaan Kedelapan

Universitas sumatera Utara


41

X1 X2 X3 X4 X5 Y

48 54 46 45 1 -1

55 39 57 55 3 1

Pada percobaan kedelapan proses training menggunakan 19 baris data seperti


pada tabel 4.16 dari hasil pengolahan data wilayah yang telah diberi label. Label yang
ada pada pada data latih adalah nilai 1 atau -1, dimana 1 menunjukkan kondisi
wilayah untuk kategori bukan sarang dan -1 menunjukkan wilayah untuk kategori
sarang demam berdarah. Proses testing data merupakan kegiatan membandingkan data
uji dengan struktur data latih yang dihasilkan dari proses pengenalan (training). Proses
ini menghasilkan keluaran sama seperti label yang diberikan pada data latih. Pada
proses testing menggunakan 2 baris data seperti pada tabel 4.18 dari hasil pengolahan
data.

4.11 Percobaan Kesembilan

Percobaan pertama yaitu proses training hasil pengolahan data wilayah dengan ukuran
19 baris dan 2 kolom.

4.11.1 Proses Training

Pertama-tama training dilakukan dengan metode Support Vector Machine (SVM)


seperti pada tabel 4.19

Tabel 4.19 Hasil Training Percobaan Kesembilan


X1 X2 X3 X4 X5 Y

65 37 31 65 52 -1

61 62 54 31 54 1

57 57 42 53 52 -1

71 71 47 32 73 1

Universitas sumatera Utara


42

52 54 43 41 65 -1

36 31 34 42 61 -1

69 70 43 61 63 -1

61 61 32 57 65 1

62 43 32 62 53 -1

71 65 55 76 71 1

41 32 32 53 43 -1

54 54 43 60 31 -1

55 53 30 65 42 -1

34 62 41 69 67 -1

43 43 31 34 72 1

68 69 45 71 68 -1

51 67 30 55 55 1

68 68 36 68 48 1

43 43 32 35 45 -1

4.11.2 Proses Testing

Pada tahap pengujian dilakukan pengujian terhadap hasil pengolahan data wilayah.
proses pengujian dengan menggunakan 20% dari hasil pengolahan data yang
dilakukan dengan metode Support Vector Machine (SVM) seperti pada tabel 4.20.

Tabel 4.19 Proses Testing Percobaan Kesembilan


X1 X2 X3 X4 X5 Y

32 23 63 61 1 -1

43 43 43 45 1 -1

Pada percobaan kesembilan proses training menggunakan 19 baris data seperti

Universitas sumatera Utara


43

pada tabel 4.18 dari hasil pengolahan data wilayah yang telah diberi label. Label yang
ada pada pada data latih adalah nilai 1 atau -1, dimana 1 menunjukkan kondisi
wilayah untuk kategori bukan sarang dan -1 menunjukkan wilayah untuk kategori
sarang demam berdarah. Proses testing data merupakan kegiatan membandingkan data
uji dengan struktur data latih yang dihasilkan dari proses pengenalan (training). Proses
ini menghasilkan keluaran sama seperti label yang diberikan pada data latih. Pada
proses testing menggunakan 2 baris data seperti pada tabel 4.20 dari hasil pengolaha
data.

4.12 Percobaan Kesepuluh

Percobaan pertama yaitu proses training hasil pengolahan data dengan ukuran 19 baris
dan 2 kolom.

4.12.1 Proses Training

Pertama-tama training dilakukan dengan metode Support Vector Machine (SVM)


seperti pada tabel 4.21

Tabel 4.21 Hasil Training Percobaan Kesepuluh


X1 X2 X3 X4 X5 Y

61 62 54 31 54 1

55 51 32 56 67 1

58 58 53 55 66 -1

71 71 47 32 73 1

52 54 43 41 65 -1

36 31 34 42 61 -1

69 70 43 61 63 -1

61 61 32 57 65 1

62 43 32 62 53 -1

71 65 55 76 71 1

Universitas sumatera Utara


44

41 32 32 53 43 -1

54 54 43 60 31 -1

55 53 30 65 42 -1

34 62 41 69 67 -1

43 43 31 34 72 1

68 69 45 71 68 -1

51 67 30 55 55 1

68 68 36 68 48 1

43 43 32 35 45 -1

4.12.2 Proses Testing

Pada tahap pengujian dilakkan pengujian terhadap hasil pengolahan data wilayah.
proses pengujian dengan menggunakan 20% dari hasil pengolahan data yang
dilakukan dengan metode Support Vector Machine (SVM) seperti pada tabel 4.22.

Tabel 4.22 Proses Testing Percobaan Kesepuluh

X1 X2 X3 X4 X5 Y

45 33 52 54 1 -1

64 26 46 43 1 -1

Pada percobaan kesepuluh proses training menggunakan 19 baris data seperti


pada tabel 4.20 dari hasil pengolahan data wilayah yang telah diberi label. Label yang
ada pada pada data latih adalah nilai 1 atau -1, dimana 1 menunjukkan kondisi
wilayah untuk kategori bukan sarang dan -1 menunjukkan wilayah untuk kategori
sarang demam berdarah. Proses testing data merupakan kegiatan membandingkan data
uji dengan struktur data latih yang dihasilkan dari proses pengenalan (training). Proses
ini menghasilkan keluaran sama seperti label yang diberikan pada data latih. Pada

Universitas sumatera Utara


45

proses testing menggunakan 2 baris data seperti pada tabel 4.22 dari hasil pengolahan
data.
4.13 Hasil Pengujian

Hasil pengujian dari 10 kali percobaan di atas dapat ditampilkan pada tabel 4.23
berikut ini. Pada tabel tersebut ditampilkan persentase nilai akurasi untuk masing –
masing training dan testing. Nilai pengujian dan pelatihan didapat dari persamaan
(2.5) sebagai berikut :

Untuk pelatihan:

Tingkat akurasi (%) = x 100 %

Untuk pengujian :

Tingkat akurasi (%) = x 100 %

Tabel 4.23 Persentase Hasil Training dan Testing Data Dalam 10 Kali Percobaan

Percobaan X1 X2 Training Testing

Fold01 7 5 100.00% 100.00%

Fold02 3 8 100.00% 50.00%

Fold03 6 9 100.00% 100.00%

Fold04 11 17 100.00% 100.00%

Fold05 1 5 100.00% 50.00%

Fold06 18 4 100.00% 100.00%

Fold07 19 16 100.00% 100.00%

Fold08 13 22 100.00% 50.00%

Universitas sumatera Utara


46

Fold09 10 21 100.00% 50.00%

Fold10 15 12 100.00% 50.00%

Rata - Rata 100% 75%

Dari hasil implementasi menggunakan metode Support Vector Machine


(SVM) tingkat rata-rata pelatihan 100 % dan hasil pengujian data aplikasi klasifikasi
wilayah dengan menggunakan metode Support Vector Machine didapat hasil
ketepatan dalam klasifikasi wilayah dengan rata-rata nilai 75%

Universitas sumatera Utara


BAB V

KESIMPULAN DAN SARAN

5.1 Kesimpulan

Berdasarkan pengujian aplikasi klasifikasi wilayah sarang demam berdarah dengan


metode support vector machine terdapatlah kesimpulan sebagai berikut :

1. Dapat mengklasifikasi wilayah untuk kategori wilayah sarang nyamuk Demam


berdarah dengan akurasi yang cukup tinggi.
2. Proses klasifikasi wilayah sarang nyamuk berdarah terbilang cukup akurat yang
dapat membedakan wilayah sebagai sarang nyamuk demam berdarah dan bukan
sarang.
3. Proses klasifikasi wilayah Demam berdarah memperoleh akurasi pengujian
sebanyak 75 %.

5.2 Saran

Saran untuk penelitian selanjutnya :

1. Penggunaan Metode support vector machine ( SVM ) dapat diterapkan pada


penelitian selanjutnya dalam bidang kesehatan untuk mengidentifikasi jenis
penyakit .
2. Aplikasi klasifikasi wilayah sarang nyamuk demam berdarah ini dapat
dikembangkan dengan metode klasifikasi wilayah lainnya.

Universitas sumatera Utara


DAFTAR PUSTAKA

Achua, L.F.C., Feldman, D.C. 2004. Managing Individual Are Group. Behavioral in
Organization. New York: McGraw Hill.

Christianini, N. & Taylor, S.J. 2000. An Introduction to Support Vector Machine and
other Kernel Based Learning methods, Cambridge University Press.

Cortes, C. & Vapnik, V. 1995. Support vector networks, Machine Learning, 20, 273-
297.

Darmawansyah, D.S.N. 2007. Analisis Faktor yang berhubungan Dengan Kejadian


Demam Berdarah Dengue di Kecamatan Baruga Kota Kendari. Tesis.
Universitas Hasanudin.

Fathima, A.S. 2012. Predictive Analysis for the Arbovirus-Dengue using SVM
Classification, International Journal of Engineering and Technology , Volume
2 No. 3, 2012, 2049-3444

Goller, C. 2000. Automatic Document Classification : A Thorough Evaluation of


Various Methods.

Gunn, S. 1998. Support Vector Machines for Clasification and Regression, Technical
Report, ISIS.

Kohli, N., & Verma, N.K. 2011. Arrhythmia classification using SVM with selected
features, International Journal of Engineering, Science and Technology 3(8):
122-131.

Nugroho, Satrio, A. 2003. Support Vector Machine Teori dan Aplikasinya dalam
Bioinformatika.

Nithya, R., & Santhi, B. 2011. Classification of Normal and Abnormal Patterns in
Digital Mammograms for Diagnosis of Breast Cancer. International Journal of
Computer Applications 28(6): 0975 – 8887.

Octaviani,P.A., Wilandari, Y. & Ispriyanti, D. 2014. Penerapan Metode Klasifikasi


Support Vector Machine (SVM) Pada Data Akreditasi Sekolah Dasar (SD) di
kabupaten Magelang, Jurnal Gaussian 3(4): 811 – 820.

Universitas sumatera Utara


49

Rachman, F & Purnami, S.W. 2012. Klasifikasi Tingkat Keganasan Breast Cancer
dengan Menggunakan Regresi Logistik Ordinal dan Support Vector Machine
(SVM). Jurnal Sains dan Seni ITS, 1(1): 2301-928X.

Santoso, B. 2007. Data Mining Terapan Dengan Matlab. Graha Ilmu, Yogyakarta.

Samsi, T.K., 2001, Demam Berdarah Dengue. Pengamatan Klinik dan


Penatalaksanaan di Rumah Sakit Sumber Waras, Bagian Ilmu Kesehatan Anak
Rumah Sakit Sumber Waras, Universitas Tarumanegara, Jakarta.

Sayed. 2011, Penggunaan Metode Support Vector Machine (SVM) Untuk


Mengklasifikasi Dan Memprediksi Angkutan Udara Jenis Penerbangan
Domestik Dan Penerbangan Internasional Di Banda Aceh. Tesis, Universitas
Sumatera Utara

Suroso, T. 1999. Epidemiological Situation of Dengue Haemorrhagic Fever and It’s


Control in Indonesia, International Seminar on Dengue ever / Dengue
Haemorrhagic Fever, TDC Unair, Surabaya.

Sumarmo, P.S. 1999. Masalah Demam Berdarah Dengue di Indonesia. Pelatihan bagi
Pelatih Dokter spesialis Anak & Dokter Spesialis Penyakit Dalam dalam
Tatalaksana Kasus DBD, Balai Penerbit FK UI, Jakarta.

Subiyakto, A. 2015. Penggunaan Algoritma Klasifikasi Dalam Data Mining,


researchgate, Fakultas Sains dan Teknologi UIN Jakarta

Vapnik, V. 1995. The Nature of Statistical Learning Theory, Springer-Verlag.

Wibisono, B.H. 1995. Studi Epidemiologis Demam Berdarah Dengue pada Orang
Dewasa, Medika 10(21): 767.

Wu, X. 2008. Top 10 Algorithms in Data Mining, Knowledge Information


System. 14: 1-137

Xisheng, H., Wang, Z., Jin, C. Zhen, Y. & Xue,X. 2012. "A Simplified Multi-Class
Support Vector Machine with Reduced Dual Optimization," Elsevier on
Pattern Recognition Letters, 71-82.

Universitas sumatera Utara

Anda mungkin juga menyukai