TESIS
HAROLD SITUMORANG
137038015
TESIS
HAROLD SITUMORANG
137038015
MEDAN
2015
KATEGORI : TESIS
Komisi Pembimbing :
Pembimbing 2 Pembimbing 1
Diketahui/disetujui oleh
Program Studi
Magister (S2) Teknik Informatika
Ketua,
TESIS
Saya mengakui bahwa tesis ini adalah hasil karya saya sendiri, kecuali beberapa kutipan
dan ringkasan yang masing-masing telah disebutkan sumbernya.
Harold Situmorang
137038015
Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertanda tangan di
bawah ini:
Nama : Harold Situmorang
NIM : 137038015
Program Studi : Magister (S2) Teknik Informatika
Jenis Karya Ilmiah : Tesis
Dengan pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada
Universitas Sumatera Utara Hak Bebas Royalti Non-Eksklusif (non-Exlusive Royalty Free
Right) atas tesis saya yang berjudul:
Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti Non-Eksklusif
ini, Universitas Sumatera Utara berhak menyimpan, mengalih media, memformat,
mengelola dalam bentuk data-base, merawat dan mempublikasikan tesis saya tanpa
meminta izin dari saya selama tetap mencantumkan nama saya sebagai penulis dan sebagai
pemegang dan/atau sebagai pemilik hak cipta.
Harold Situmorang
NIM. 137038015
DATA PRIBADI
Kabupaten Deliserdang.
E-mail : haroldsitumorang@yahoo.co.id
DATA PENDIDIKAN
Puji syukur kepada Tuhan Yang Maha Esa, atas segala limpahan berkat dan
penyertaan-Nya sehingga tesis ini dapat diselesaikan tepat pada waktunya. Dengan
selesainya tesis ini, perkenankanlah penulis mengucapkan terima kasih yang
sebesar- besarnya kepada :
1. Pj Rektor Universitas Sumatera Utara, Bapak Prof. Subhilhar atas kesempatan
yang telah diberikan kepada penulis untuk dapat mengikuti dan menyelesaikan
pendidikan Program Magister.
2. Dekan Fasilkom-TI (Fakultas Ilmu Komputer dan Teknologi Informasi)
Universitas Sumatera Utara Prof. Dr. Muhammad Zarlis, atas kesempatan
yang diberikan kepada penulis menjadi mahasiswa Program Magister pada
Program Pascasarjana Fasilkom-TI Universitas Sumatera Utara.
3. Ketua Program Studi Magister (S2) Teknik Informatika,
Prof. Dr. Muhammad Zarlis dan Sekretaris Program Studi Magister (S2)
Teknik Informatika M. Andri Budiman, S.T, M.Comp, M.E.M beserta
seluruh staff pengajar pada Program Studi Magister (S2) Teknik Informatika
Program Pascasarjana Fasilkom-TI Universitas Sumatera Utara, yang telah
bersedia membimbing penulis sehingga dapat menyelesaikan pendidikan
tepat pada waktunya.
4. Dr. Syahril Efendi, S.Si, M.IT selaku pembimbing utama dan kepada Dr.
Marwan Ramli, M.Si selaku pembimbing lapangan yang dengan penuh
kesabaran menuntun serta membimbing penulis hingga selesainya tesis ini
dengan baik.
5. Prof. Dr. Muhammad Zarlis dan Prof. Dr. Opim Salim Sitompul sebagai
pembanding yang telah memberikan saran dan motivasi serta arahan yang
baik demi penyelesaian tesis ini.
6. Universitas Sumatera Utara, Staf Pegawai dan Administrasi pada Program
Studi Magister (S2) Teknik Informatika Program Pascasarjana Fasilkom-TI
Universitas Sumatera Utara yang telah memberikan bantuan dan pelayanan
terbaik kepada penulis selama mengikuti perkuliahan.
HAROLD SITUMORANG
NIM :137038015
ABSTRAK
Penyakit Demam Berdarah merupakan salah satu permasalahan kesehatan utama dan
endemik di beberapa Negara termasuk di Indonesia. Indonesia termasuk dalam
kategori “A” dalam stratifikasi Demam Berdarah oleh WHO tahun 2001 yang
mengindikasikan tingginya angka perawatan pada rumah sakit dan kematian akibat
Demam Berdarah. Salah satu faktor yang menyebabkan adalah masalah klasifikasi
wilayah, karena data yang berkaitan dengan karakteristik suatu wilayah (letak
geografis) belum banyak didefenisikan secara jelas dan tegas, sehingga masih
diperlukan suatu pendekatan dalam menyelesaikan permasalahan klasifikasi wilayah
agar diperoleh hasil yang akurat. Dalam penelitian ini permasalahan klasifikasi
wilayah epidemic tempat berkembang bahaya nyamuk Demam Berdarah Dengue
(DBD) dengan Metode Klasifikasi Support Vector Machine (SVM) di Kota Medan.
Penelitian ini menggunakan lima variabel input yang merupakan faktor lingkungan
yang mempengaruhi penyakit Demam Berdarah, meliputi kepadatan penduduk, tinggi
wilayah, kelembapan udara, curah hujan, dan Jumlah kasus Demam Berdarah dalam
Wilayah kota Medan yang datanya bersumber dari BMKG, BPS dan Dinas Kesehatan
Kota Medan Tahun 2010-2013. Dari hasil penelitian diperoleh Metode support vector
machine ( SVM ) dapat mengklasifikasi wilayah untuk kategori wilayah sarang
nyamuk Demam berdarah dengan akurasi yang cukup tinggi. Proses klasifikasi
wilayah sarang nyamuk berdarah terbilang cukup akurat yang dapat membedakan
wilayah sebagai sarang nyamuk demam berdarah dan bukan sarang. Proses
identifikasi jenis penyakit Demam berdarah memperoleh akurasi pengujian sebanyak
75 %.
ABSTRACT
Dengue Fever is one of the major health problems and endemic in several countries,
including Indonesia. Indonesia is included in category "A" in the stratification of
Dengue by the WHO in 2001 that indicate high rates of treatment in hospital and
deaths from Dengue Fever. One of the factors that cause is the problem of
classification of the area, because the data relating to the characteristics of an area
(geographic location) has not been defined clearly and firmly, so that it still required
an approach in solving the problems of classification of the area in order to obtain
accurate results. In this study classification problems growing regions where the
danger of mosquito epidemic of Dengue Hemorrhagic Fever (DHF) Classification
Method with Support Vector Machine (SVM) in Medan. This study uses five input
variables are environmental factors that influence disease dengue fever, including
overcrowding, high territory, humidity, rainfall, and the number of cases of dengue
fever in the region of Medan which data sourced from BMKG, BPS and City Health
Office Medan 2010-2013. The results were obtained Method of support vector
machine (SVM) can classify the area for category Dengue mosquito breeding region
with high accuracy. The classification process dengue mosquito breeding territory is
quite accurate that can distinguish the area as dengue mosquito breeding and not nest.
The process of identification of the type of illness Dengue obtain test accuracy of 65%
.
DAFTAR ISI
BAB 1 PENDAHULUAN...................................................................... 1
1.1. Latar Belakang................................................................... 1
1.2. Rumusan Masalah.............................................................. 2
1.3. Tujuan Penelitian ............................................................... 3
1.4. Manfaat Penelitian ............................................................. 3
1.5. Batasan Masalah ................................................................ 3
DAFTAR TABEL
DAFTAR GAMBAR
DAFTAR LAMPIRAN
Support Vector Machine (SVM) merupakan salah satu metode klasifikasi yang
mengalami perubahan yang sangat pesat, karena kehandalanya dalam memproses data
dalam jumlah yang sangat besar dan akurasi hasil yang sangat baik. (Fathima, 2012)
Pada beberapa tahun terakhir ini, Support Vector Machine (SVM) mulai
menjadi model yang favorit sebagai suatu pembelajaran mesin. Hal ini terutama
karena terhadap Support Vector Machine (SVM) dapat dilakukan secara analitis
(analisis secara matematis) dan disamping itu dapat memberikan kemampuan
generalisasi yang baik pada penerapannya dibanding model NN (Kohli & Verma,
2011). Pada penelitian ini akan dibahas tentang Support Vector Machine (SVM) serta
penggunaannya dalam pemecahan masalah klasifikasi wilayah epidemik nyamuk
Demam Berdarah Dengue(DBD).
Salah satu cara yang logis dan mungkin dilakukan dalam merancang program
pemberantasan dan pencegahan Demam Berdarah Dengue(DBD) yang lebih baik
adalah dengan melakukan klasifikasi wilayah yang positif sebagai daerah epidemik
demam berdarah berdasarkan data pasien yang teridentifikasi terserang penyakit
demam berdarah yang memasuki suatu wilayah.
1. 5. Batasan Masalah
1. Data yang digunakan dalam penelitian ini adalah kasus penyebaran Demam
Berdarah Dengue (DBD) berdasarkan wilayah kota Medan.
2. Variabel yang digunakan untuk proses analisis klasifikasi adalah tinggih
wilayah, curah hujan, kelembapan udara, kepadatan penduduk, jumlah kasus
Demam Berdarah Dengue (DBD).
TINJAUAN PUSTAKA
Klasifikasi adalah proses untuk menemukan model atau fungsi yang menjelaskan atau
membedakan konsep atau kelas data dengan tujuan untuk memperkirakan kelas yang
tidak diketahui dari suatu objek. Dalam pengklasifikasian data terdapat dua proses
yang dilakukan yaitu:
1. Proses training
Pada proses training digunakan training set yang telah diketahui label-labelnya
untuk membangun model atau fungsi.
2. Proses testing
Untuk mengetahui keakuratan model atau fungsi yang akan dibangun pada
proses training, maka digunakan data yang disebut dengan testing set untuk
memprediksi label-labelnya.
1. C45, metode ini menjadi pilihan pertama yang sering digunakan dalam
pengembangan DM karena kecepatan dalam pengklasifikasian pohon
keputusan disamping dapat mengkonstruksi pengklasifikasian dengan aturan-
aturan yang lain (Wu, 2008).
2. k-NN, beberapa hal yang menjadi perhatian dalam penggunaan
algoritma ini adalah penggunaan pilihan k, jika k sangat kecil maka akan
mengakibatkan noise. Sebaliknya jika terlalu besar dapat meyebabkan N
dengan banyak kelas yang harus diklasifikasikan. Tetapi kesederhanaan
metode menjadi nilai lebih sehingga menjadi pilihanbanyak developer DM
selain itu, algoritma ini mudah untuk dipahami dan diimplementasikan dalam
tekniknya. Penelitian ini menyatakan bahwa banyak peneliti berpendapat
bahwa algoritma ini lebih baik dari Support Vector Machine (SVM).
berdasarkan skema pengklasifikasiannya (Wu, 2008).
3. Naive Bayes, penelitian tersebut menyimpulkan bahwa metode algoritma
Naïve Bayes memiliki keunggulan untuk pengembangan DM, yaitu
kemudahan konstruksinya dan tidak membutuhkan parameter skema
pengulangan yang kompleks sehingga mudah dalam membaca data dalam
jumlah yang besar. Hal ini terjadi karena desain rancangan penuntunan
klasifikasi terhadap data. Selain itu, metode ini dinyatakan sebagai
algoritma yang mempunyai sifat simplicity, elegance dan robustness
(Subiyakto, 2015).
4. CART, penerapan metode algoritma ini banyak digunakan dalam berbagai
bidang yang membutuhkan pengolahan data yang komprehensif. Hanya saja
mekanismenya terdiri dari beberapa tahap yang bertingkat meliputi
automatic class balancing, automatic missing, value handling dan allows
for cost-sensitive learning, dynamic feature construction dan probability
tree estimation sehingga tingkat kompleksitas menjadi pertimbangan para
w,
1
w C i 1 i
2 N
(2.1)
2
untuk yi w xi b 1 i dan i 0 , dimana C > 0 adalah trade off pada constraint.
Fungsi kernel pada titik data K(x,z) : Rn x Rn R merupakan hasil inner produk dari
x z . Fungsi mapping data x dan z tersebut sangat sulit sekali untuk
ditemukan nilai-nilainya dari dimensi tinggi yang menghasilkan nilai inner produk
sama dengan K(x,z). Karena kesulitan tersebut, maka sistem mengendalikan secara
langsung dari fungsi kernel yang digunakan. Kemudian untuk mendapatkan
persamaan hyperplane yang optimal, dapat digunakan persamaan berikut :
W i 1 i i j yi y j K x, xi
N 1
(2.2)
2 ij
untuk : 0 i C dan
N
i 1
i yi 0 (2.3)
f x i 1 i y i K x, x i b
m
(2.4)
sebagai f x w x b .
1. Generalisasi
Generalisasi didefinisikan sebagai kemampuan suatu metode untuk
mengklasifikasikan suatu pattern, yang tidak termasuk data yang dipakai
dalam fase pembelajaran metode itu.
2. Curse of dimensionality
3. Feasibility
1. Sulit dipakai problem berskala besar. Dalam hal ini dimaksudkan dengan
jumlah sampel yang diolah.
2. Support Vector Machine (SVM) secara teoritik dikembangkan untuk problem
klasifikasi dengan dua kelas. Dewasa ini Support Vector Machine (SVM) telah
dimodifikasi agar dapat menyelesaikan masalah dengan lebih dari dua kelas
(Nugroho, 2003).
seluruh jaringan tubuh. Penyakit ini ditularkan melalui gigitan nyamuk Aedes aegypti
dan mungkin juga Albopictus. Kedua jenis nyamuk ini terdapat hampir di seluruh
pelosok Indonesia kecuali ketinggian lebih dari 1000 meter diatas permukaan laut
(Samsi, 2001). Masa inkubasi penyakit ini diperkirakan lebih kurang 7 hari. Penyakit
Demam Berdarah Dengue (DBD) dapat menyerang semua golongan umur. Sampai
saat ini penyakit Demam Berdarah Dengue (DBD) lebih banyak menyerang anak-anak
tetapi dalam dekade terakhir ini terlihat adanya kecenderungan kenaikan proporsi
penderita Demam Berdarah Dengue (DBD) pada orang dewasa.
2.8.1 Epidemiologi
Sampai saat ini DBD telah ditemukan di seluruh propinsi di Indonesia, dan
200 kota telah melaporkan adanya kejadian luar biasa. Incidence rate (IR) meningkat
dari 0,005 per 100.000 penduduk pada tahun 1968 menjadi berkisar antara 6-27 per
100.000 penduduk. Pola berjangkit infeksi virus dengue dipengaruhi oleh iklim dan
kelembaban udara. Pada suhu yang panas (28-32°C) dengan kelembaban yang tinggi,
nyamuk Aedes akan tetap bertahan hidup untuk jangka waktu lama. Di Indonesia,
karena suhu udara dan kelembaban tidak sama di setiap tempat, maka pola waktu
terjadinya penyakit agak berbeda untuk setiap tempat. Di Jawa pada umumnya infeksi
virus dengue terjadi mulai awal Januari, meningkat terus sehingga kasus terbanyak
terdapat pada sekitar bulan April-Mei setiap tahun.
Ukuran kinerja dari model pada test set sering kali berguna karena ukuran tersebut
memberikan estimasi yang tidak bias dari error generalisasinya. Akurasi dari tingkat
error yang dihitung dari test set dapat juga digunakan untuk membandingkan kinerja
relatif dari classifier-classifier pada domain yang sama. Untuk melakukan
perbandingkan ini, label kelas dari test record haruslah diketahui. Berikut adalah
metode yang umum digunakan untuk mengevaluasi kinerja classifier.
2.9.1 Cross-Validation
Dalam contoh ini, setiap record digunakan tepat satu kali untuk training dan
satu kali untuk testing. Metode k-fold cross-validation mengeneralisasi pendekatan ini
dengan mensegmentasi data ke dalam k partisi berukuran sama. Selama proses, salah
satu dari partisi dipilih untuk testing, sedangkan sisanya digunakan untuk training.
Prosedur ini diulangi k kali sedemikian sehingga setiap partisi digunakan untuk testing
tepat satu kali. Total error ditentukan dengan menjumlahkan error untuk semua k
Data asing merupakan data dengan nilai yang tidak dibutuhkan karena tidak
konsisten pada sebagian pengamatan. Biasanya data asing dihasilkan dari kesalahan
pengukuran, kesalahan pengkodean dan pencatatan dan beberapa nilai abnormal yang
wajar. Ada dua strategi untuk menangani data asing, yang pertama mendeteksi dan
berikutnya membuang data asing sebagai bagian dari fase pra pengolahan. Yang
kedua adalah mengembangkan metode pemodelan yang kuat yang tidak merespon
data asing.
itu, disarankan untuk pemberian skala dan membawa fitur-fitur tersebut ke bobot yang
sama untuk analisis lebih lanjut.
2.10.1 Normalization
atribut A.
3. Normalization by Decimal Scaling Normalisasi yang diperoleh dengan
melakukan penggeseran titik desimal dari value sebuah atribut A. Jumlah titik
desimal yang digeser tergantung dari nilai absolut maksimum dari atribut A.
Identifikasi Masalah
Penentuan Variabel
(Karakteristik Epidemik)
Pengumpulan Data
Normalisasi Data
Data Training
Data Testing
Klasifikasi SVM
Masalah yang akan dibahas dalam penelitian ini adalah bagaimana mengklasifikasikan
Data yang digunakan dalam penelitian ini adalah data data jumlah kasus
Demam Berdarah di kota Medan mulai tahun 2010-2013 yang diperoleh dari dinas
kesehatan kota Medan. Pemilihan variabel penelitian dalam klasifikasi wilayah
epidemik Demam Berdarah didasarkan pada data spasial kerentanan penyakit Demam
Berdarah di Kota Medan. Variabel independen penelitian yang dilibatkan kepadatan
penduduk, tinggi wilayah, kelembapan udara, curah hujan dan data jumlah kasus
Demam Berdarah dimana :
X1 : Kepadatan Penduduk
X2 : Tinggi Wilayah
X3 : Kelembaban Udara
X4 : Curah Hujan
Sedangkan Untuk variabel dependen (Y) terdiri dari dua kategori, yaitu :
Berdasarkan parameter yang akan diolah, pada penelitian ini dilakukan pengambilan
data diantaranya : kepadatan penduduk, tinggih wilayah, kelembaban udara, curah
hujan, dan data jumlah kasus Demam Berdarah dari Dinas Kesehatan Kota Medan.
Data yang telah dikumpulkan selanjutnya dilakukan normalisasi berdasarkan satuan
yang didapat.
RATA-
NO KECAMATAN 2010 2011 2012 2013
RATA
RATA-
NO KECAMATAN 2010 2011 2012 2013
RATA
1 Medan Tuntungan 82
3 Medan Amplas 82
4 Medan Denai 83
5 Medan Area 82
6 Medan Kota 81
7 Medan Maimun 80
8 Medan Polonia 80
9 Medan Baru 80
10 Medan Selayang 80
11 Medan Sunggal 82
13 Medan Petisah 80
14 Medan Barat 80
15 Medan Timur 81
16 Medan Perjuangan 83
17 Medan Tembung 82
18 Medan Deli 82
19 Medan Labuhan 80
20 Medan Marelan 80
21 Medan Belawan 80
X1 X2 X3 X4 X5
71.00 65.00 55.00 76.00 71.00
55.00 51.00 32.00 56.00 67.00
43.00 43.00 31.00 34.00 72.00
61.00 62.00 54.00 31.00 54.00
41.00 32.00 32.00 53.00 43.00
52.00 54.00 43.00 41.00 65.00
57.00 57.00 42.00 53.00 52.00
58.00 58.00 53.00 55.00 66.00
54.00 54.00 43.00 60.00 31.00
68.00 69.00 45.00 71.00 68.00
71.00 71.00 47.00 32.00 73.00
61.00 61.00 32.00 57.00 65.00
69.00 70.00 43.00 61.00 63.00
34.00 62.00 41.00 69.00 67.00
43.00 43.00 32.00 35.00 45.00
36.00 31.00 34.00 42.00 61.00
51.00 67.00 30.00 55.00 55.00
68.00 68.00 36.00 68.00 48.00
62.00 43.00 32.00 62.00 53.00
65.00 37.00 31.00 65.00 52.00
55.00 53.00 30.00 65.00 42.00
Dari data yang suda ternormalisasi, dibagi menjadi 80% untuk training dan
20% sisanya sebagai testing. Data training digunakan untuk membentuk model
klasifikasi menggunakan matriks konfusi. Sedangkan data testing digunakan untuk
menguji ketepatan klasifikasi dari model yang telah terbentuk. Ketepatan klasifikasi
kedua model nantinya akan dibandingkan, baik untuk data training maupun data
testing.
NO Kecamatan X1 X2 X3 X4 X5 Y
1 Mdn. Tuntungan 110.25 3956.805 27.5 82 47.71 -1
2 Mdn. Johor 116.75 8605.9325 23.7 81.7 46.45 -1
3 Mdn. Amplas 114.75 10318.1175 22.4 82 46.25 -1
4 Mdn. Denai 170.5 18193.8125 20.5 83 47.15 -1
5 Mdn. Area 60.25 17532.7675 22.7 82 32.7 -1
6 Mdn. Kota 88.75 13806.84 25.6 81 34.5 -1
7 Mdn. Maimun 31.5 13321.6675 25.7 80 32.7 -1
8 Mdn. Polonia 43.25 5926.7175 27.7 80 32.4 -1
9 Mdn. Baru 85.75 6783.965 26.5 80 31.5 -1
10 Mdn. Selayang 99 7802.7075 26.7 80 29.5 -1
X1 X2 X3 X4 X5 Y
71.00 65.00 55.00 76.00 71.00 1
55.00 51.00 32.00 56.00 67.00 1
43.00 43.00 31.00 34.00 72.00 1
61.00 62.00 54.00 31.00 54.00 1
41.00 32.00 32.00 53.00 43.00 -1
52.00 54.00 43.00 41.00 65.00 -1
57.00 57.00 42.00 53.00 52.00 -1
58.00 58.00 53.00 55.00 66.00 -1
54.00 54.00 43.00 60.00 31.00 -1
68.00 69.00 45.00 71.00 68.00 -1
71.00 71.00 47.00 32.00 73.00 1
61.00 61.00 32.00 57.00 65.00 1
69.00 70.00 43.00 61.00 63.00 -1
34.00 62.00 41.00 69.00 67.00 -1
43.00 43.00 32.00 35.00 45.00 -1
36.00 31.00 34.00 42.00 61.00 -1
51.00 67.00 30.00 55.00 55.00 1
68.00 68.00 36.00 68.00 48.00 1
62.00 43.00 32.00 62.00 53.00 -1
65.00 37.00 31.00 65.00 52.00 -1
55.00 53.00 30.00 65.00 42.00 -1
Pada Proses ini setiap nilai yang sudah diketahui dari masing – masing wilayah akan
diberi label yaitu nilai 1 atau -1, dimana 1 menunjukkan kondisi wilayah untuk
kategori sarang dan -1 menunjukkan wilayah bukan sarang demam berdarah.
X1 X2 X3 X4 X5 Y
63.00 32.00 66.00 65.00 3.00 1
46.00 46.00 58.00 62.00 1.00 1
25.00 51.00 72.00 71.00 1.00 1
63.00 28.00 56.00 58.00 1.00 -1
43.00 23.00 45.00 47.00 1.00 -1
63.00 31.00 43.00 42.00 1.00 -1
45.00 33.00 52.00 54.00 1.00 -1
65.00 37.00 54.00 55.00 1.00 -1
54.00 23.00 53.00 51.00 1.00 -1
64.00 26.00 46.00 43.00 1.00 -1
78.00 25.00 45.00 42.00 1.00 -1
67.00 32.00 69.00 67.00 1.00 1
65.00 32.00 72.00 71.00 1.00 1
55.00 39.00 57.00 55.00 3.00 1
53.00 34.00 63.00 35.00 1.00 -1
48.00 54.00 46.00 45.00 1.00 -1
25.00 21.00 25.00 23.00 1.00 -1
32.00 23.00 63.00 61.00 1.00 -1
43.00 43.00 43.00 45.00 1.00 -1
44.00 32.00 63.00 67.00 1.00 -1
46.00 43.00 61.00 33.00 1.00 1
31.00 29.00 29.00 29.00 1.00 -1
pelatihan dalam pengenalan pola wilayah dengan algoritma Support Vector Machine
(SVM) terhadap hasil pengolahan data. Data pelatihan (training) yang digunakan
adalah 80% dan 20% untuk data pengujian (testing). Pelatihan support vector machine
(SVM) ini berfungsi untuk mengajarkan kepada support vector machine (SVM)
pola – pola wilayah yang ada sehingga diharapkan support vector machine (SVM)
dapat mengenali pola-pola wilayah baru yang diberikan. Pada tahap implementasi ini
Percobaan pertama yaitu proses training hasil pengolahan data dengan ukuran 19 baris
dan 6 kolom.
Pertama-tama training dilakukan dengan metode Support Vector Machine seperti pada
tabel 4.3
X1 X2 X3 X4 X5 Y
71 65. 55 76 71 1
55 51 32 56 67 1
43 43 31 34 72 1
61 62 54 31 54 1
41 32 32 53 43 -1
52 54 43 41 65 -1
57 57 42 53 52 -1
58 58 53 55 66 -1
54 54 43 60 31 -1
68 69 45 71 68 -1
71 71 47 32 73 1
61 61 32 57 65 1
69 70 43 61 63 -1
34 62 41 69 67 -1
55 53 30 65 42 -1
X1 X2 X3 X4 X5 Y
36 31 34 42 61 -1
51 67 30 55 55 1
65 37 31 65 52 -1
62 43 32 62 53 -1
Pada tahap pengujian dilakukan pengujian terhadap hasil pengolahan data wilayah.
Proses pengujian dengan menggunakan 20% dari hasil pengolahan data yang
dilakukan dengan metode Support Vector Machine (SVM) seperti pada tabel 4.4.
X1 X2 X3 X4 X5 Y
63 32 66 65 3 1
46 46 58 62 1 1
Percobaan pertama yaitu proses training hasil pengolahan data dengan ukuran 19 baris
dan 2 kolom.
71 65 55 76 71 1
55 51 32 56 67 1
43 43 31 34 72 1
61 62 54 31 54 1
41 32 32 53 43 -1
52 54 43 41 65 -1
57 57 42 53 52 -1
58 58 53 55 66 -1
54 54 43 60 31 -1
65 37 31 65 52 -1
71 71 47 32 73 1
61 61 32 57 65 1
69 70 43 61 63 -1
34 62 41 69 67 -1
55 53 30 65 42 -1
36 31 34 42 61 -1
62 43 32 62 53 -1
68 68 36 68 48 1
43 43 32 35 45 -1
Pada tahap pengujian dilakukan pengujian terhadap hasil pengolahan data wilayah.
proses pengujian dengan menggunakan 20% dari hasil pengolahan data yang
dilakukan dengan metode Support Vector Machine (SVM) seperti pada tabel 4.6.
25 51 72 71 1 1
25 21 25 23 1 -1
Pada percobaan kedua proses training menggunakan 19 baris seperti data pada
tabel 4.4 dari hasil pengolahan data yang telah diberi label. Label yang ada pada pada
data latih adalah nilai 1 atau -1, dimana 1 menunjukkan wilayah untuk kategori
sarang demam berdarah dan -1 menunjukkan wilayah untuk kategori bukan sarang.
Proses testing data merupakan kegiatan membandingkan data uji dengan struktur data
latih yang dihasilkan dari proses pengenalan (training). Proses ini menghasilkan
keluaran sama seperti label yang diberikan pada data latih.
Percobaan pertama yaitu proses training hasil pengolahan data wilayah dengan ukuran
19 baris dan 2 kolom.
X1 X2 X3 X4 X5 Y
71 65 55 76 71 1
55 51 32. 56 67 1
62 43 32. 62 53 -1
61 62 54 31 54 1
41 32 32 53 43 -1
52 54 43. 41 65 -1
57 57 42 53 52 -1
58 58 53 55 66 -1
54 54 43 60 31 -1
65 37 31 65 52 -1
71 71 47 32 73 1
61 61 32 57 65 1
69 70 43 61 63 -1
36 31 34 42 61 -1
55 53 30 65 42 -1
68 69 45 71 68 -1
51 67 30 55 55 1
68 68 36 68 48 1
43 43 32 35 45 -1
Pada tahap pengujian dilakukan pengujian terhadap hasil pengolahan data wilayah.
proses pengujian dengan menggunakan 20% dari hasil pengolahan data yang
dilakukan dengan metode Support Vector Machine (SVM) seperti pada tabel 4.8.
X1 X2 X3 X4 X5 Y
65 32 72 71 1 1
44 32 63 67 1 -1
Pada percobaan ketiga proses training menggunakan 19 baris data seperti pada
tabel 4.6 dari hasil pengolahan data yang telah diberi label. Label yang ada pada pada
data latih adalah nilai 1 atau -1, dimana 1 menunjukkan kondisi wilayah sarang
demam berdarah dan -1 menunjukkan wilayah untuk kategori bukan sarang. Proses
testing data merupakan kegiatan membandingkan data uji dengan struktur data latih
yang dihasilkan dari proses pengenalan (training). Proses ini menghasilkan keluaran
sama seperti label yang diberikan pada data latih. Pada proses testing menggunakan 2
baris data seperti pada tabel 4.8 dari hasil pengolahan data.
Percobaan pertama yaitu proses training hasil pengolahan data wilayah dengan ukuran
19 baris dan 2 kolom.
X1 X2 X3 X4 X5 Y
71 65 55 76 71 1
55 51 32 56 67 1
62 43 32 62 53 -1
61 62 54 31 54 1
41 32 32 53 43 -1
52 54 43 41 65 -1
X1 X2 X3 X4 X5 Y
57 57 42 53 52 -1
58 58 53 55 66 -1
36 31 34 42 61 -1
65 37 31 65 52 -1
71 71 47 32 73 1
61 61 32 57 65 1
34 62 41 69 67 -1
43 43 31 34 72 1
68 69 45 71 68 -1
51 67 30 55 55 1
68 68 36 68 48 1
43 43 32 35 45 -1
Pada tahap pengujian dilakukan pengujian terhadap hasil pengolahan data wilayah.
proses pengujian dengan menggunakan 20% dari hasil pengolahan data yang
dilakukan dengan metode Support Vector Machine (SVM) seperti pada tabel 4.10.
X1 X2 X3 X4 X5 Y
63 31 43 42 1 -1
53 34 63 35 1 -1
pada data latih adalah nilai 1 atau -1, dimana 1 menunjukkan kondisi wilayah untuk
kategori sarang demam berdarah dan -1 menunjukkan wilayah untuk kategori bukan
sarang. Proses testing data merupakan kegiatan membandingkan data uji dengan
struktur data latih yang dihasilkan dari proses pengenalan (training). Proses ini
menghasilkan keluaran sama seperti label yang diberikan pada data latih. Pada proses
testing menggunakan 2 baris data seperti pada tabel 4.10 dari hasil pengolahan data.
Percobaan pertama yaitu proses training hasil pengolahan data dengan ukuran 19 baris
dan 2 kolom.
61 61 32 57 65 1
55 51 32 56 67 1
62 43 32 62 53 -1
61 62 54 31 54 1
69 70 43 61 63 -1
52 54 43 41 65 -1
57 57 42 53 52 -1
58 58 53 55 66 -1
36 31 34 42 61 -1
65 37 31 65 52 -1
71 71 47 32 73 1
X1 X2 X3 X4 X5 Y
54 54 43 60 31 -1
55 53 30 65 42 -1
34 62 41 69 67 -1
43 43 31 34 72 1
68 69 45 71 68 -1
51 67 30 55 55 1
68 68 36 68 48 1
43 43 32 35 45 -1
Pada tahap pengujian dilakukan pengujian terhadap hasil pengolahan data wilayah.
proses pengujian dengan menggunakan 20% dari hasil pengolahan data wilayah yang
dilakukan dengan metode Support Vector Machine (SVM) seperti pada tabel 4.12.
X1 X2 X3 X4 X5 Y
54 23 53 51 1 -1
78 25 45 42 1 -1
Pada percobaan kelima proses training menggunakan 19 baris data seperti pada
tabel 4.10 dari hasil pengolahan data yang telah diberi label. Label yang ada pada pada
data latih adalah nilai 1 atau -1, dimana 1 menunjukkan kondisi wilayah untuk
kategori bukan sarang dan -1 menunjukkan wilayah untuk kategori sarang demam
berdarah. Proses testing data merupakan kegiatan membandingkan data uji dengan
struktur data latih yang dihasilkan dari proses pengenalan (training). Proses ini
menghasilkan keluaran sama seperti label yang diberikan pada data latih. Pada proses
testing menggunakan 2 baris data seperti pada tabel 4.12 dari hasil pengolahan data.
Percobaan pertama yaitu proses training hasil pengolahan data dengan ukuran 19 baris
dan 2 kolom.
65 37 31 65 52 -1
55 51 32 56 67 1
71 71 47 32 73 1
61 62 54 31 54 1
69 70 43 61 63 -1
52 54 43 41 65 -1
57 57 42 53 52 -1
58 58 53 55 66 -1
36 31 34 42 61 -1
71 65 55 76 71 1
41 32 32 53 43 -1
54 54 43 60 31 -1
55 53 30 65 42 -1
34 62 41 69 67 -1
43 43 31 34 72 1
68 69 45 71 68 -1
51 67 30 55 55 1
68 68 36 68 48 1
43 43 32 35 45 -1
Pada tahap pengujian dilakukan pengujian terhadap hasil pengolahan data wilayah.
Proses pengujian dengan menggunakan 20% dari hasil pengolahan data yang
dilakukan dengan metode Support Vector Machine (SVM) seperti pada tabel 4.14.
X1 X2 X3 X4 X5 Y
46 43 61 33 1 1
63 28 56 58 1 -1
Percobaan pertama yaitu proses training hasil pengolahan data dengan ukuran 19 baris
dan 2 kolom.
65 37 31 65 52 -1
55 51 32 56 67 1
71 71 47 32 73 1
61 62 54 31 54 1
58 58 53 55 66 -1
52 54 43 41 65 -1
57 57 42 53 52 -1
61 61 32 57 65 1
62 43 32 62 53 -1
71 65 55 76 71 1
41 32 32 53 43 -1
54 54 43. 60 31 -1
55 53 30 65 42 -1
34 62 41 69 67 -1
43 43 31 34 72 1
68 69 45 71 68 -1
51 67 30 55 55 1
68 68 36 68 48 1
43 43 32 35 45 -1
Pada tahap pengujian dilakukan pengujian terhadap hasil pengolahan data wilayah.
proses pengujian dengan menggunakan 20% dari hasil pengolahan data yang
dilakukan dengan metode Support Vector Machine (SVM) seperti pada tabel 4.16
X1 X2 X3 X4 X5 Y
43 23 45 47 1 -1
67 32 69 67 1 1
Percobaan pertama yaitu proses training hasil pengolahan data wilayah dengan ukuran
19 baris dan 2 kolom.
65 37 31 65 52 -1
55 51 32 56 67 1
X1 X2 X3 X4 X5 Y
57 57 42 53 52 -1
61 62 54 31 54 1
58 58 53 55 66 -1
36 31 34 42 61 -1
69 70 43 61 63 -1
61 61 32 57 65 1
62 43 32 62 53 -1
71 65 55 76 71 1
41 32 32 53 43 -1
54 54 43 60 31 -1
55 53 30 65 42 -1
34 62 41 69 67 -1
43 43 31 34 72 1
68 69 45 71 68 -1
51 67 30 55 55 1
68 68 36 68 48 1
43 43 32 35 45 -1
Pada tahap pengujian dilakukan pengujian terhadap hasil pengolahan data wilayah.
Proses pengujian dengan menggunakan 20% dari hasil pengolahan data yang
dilakukan dengan metode Support Vector Machine (SVM) seperti pada tabel 4.18.
X1 X2 X3 X4 X5 Y
48 54 46 45 1 -1
55 39 57 55 3 1
Percobaan pertama yaitu proses training hasil pengolahan data wilayah dengan ukuran
19 baris dan 2 kolom.
65 37 31 65 52 -1
61 62 54 31 54 1
57 57 42 53 52 -1
71 71 47 32 73 1
52 54 43 41 65 -1
36 31 34 42 61 -1
69 70 43 61 63 -1
61 61 32 57 65 1
62 43 32 62 53 -1
71 65 55 76 71 1
41 32 32 53 43 -1
54 54 43 60 31 -1
55 53 30 65 42 -1
34 62 41 69 67 -1
43 43 31 34 72 1
68 69 45 71 68 -1
51 67 30 55 55 1
68 68 36 68 48 1
43 43 32 35 45 -1
Pada tahap pengujian dilakukan pengujian terhadap hasil pengolahan data wilayah.
proses pengujian dengan menggunakan 20% dari hasil pengolahan data yang
dilakukan dengan metode Support Vector Machine (SVM) seperti pada tabel 4.20.
32 23 63 61 1 -1
43 43 43 45 1 -1
pada tabel 4.18 dari hasil pengolahan data wilayah yang telah diberi label. Label yang
ada pada pada data latih adalah nilai 1 atau -1, dimana 1 menunjukkan kondisi
wilayah untuk kategori bukan sarang dan -1 menunjukkan wilayah untuk kategori
sarang demam berdarah. Proses testing data merupakan kegiatan membandingkan data
uji dengan struktur data latih yang dihasilkan dari proses pengenalan (training). Proses
ini menghasilkan keluaran sama seperti label yang diberikan pada data latih. Pada
proses testing menggunakan 2 baris data seperti pada tabel 4.20 dari hasil pengolaha
data.
Percobaan pertama yaitu proses training hasil pengolahan data dengan ukuran 19 baris
dan 2 kolom.
61 62 54 31 54 1
55 51 32 56 67 1
58 58 53 55 66 -1
71 71 47 32 73 1
52 54 43 41 65 -1
36 31 34 42 61 -1
69 70 43 61 63 -1
61 61 32 57 65 1
62 43 32 62 53 -1
71 65 55 76 71 1
41 32 32 53 43 -1
54 54 43 60 31 -1
55 53 30 65 42 -1
34 62 41 69 67 -1
43 43 31 34 72 1
68 69 45 71 68 -1
51 67 30 55 55 1
68 68 36 68 48 1
43 43 32 35 45 -1
Pada tahap pengujian dilakkan pengujian terhadap hasil pengolahan data wilayah.
proses pengujian dengan menggunakan 20% dari hasil pengolahan data yang
dilakukan dengan metode Support Vector Machine (SVM) seperti pada tabel 4.22.
X1 X2 X3 X4 X5 Y
45 33 52 54 1 -1
64 26 46 43 1 -1
proses testing menggunakan 2 baris data seperti pada tabel 4.22 dari hasil pengolahan
data.
4.13 Hasil Pengujian
Hasil pengujian dari 10 kali percobaan di atas dapat ditampilkan pada tabel 4.23
berikut ini. Pada tabel tersebut ditampilkan persentase nilai akurasi untuk masing –
masing training dan testing. Nilai pengujian dan pelatihan didapat dari persamaan
(2.5) sebagai berikut :
Untuk pelatihan:
Untuk pengujian :
Tabel 4.23 Persentase Hasil Training dan Testing Data Dalam 10 Kali Percobaan
5.1 Kesimpulan
5.2 Saran
Achua, L.F.C., Feldman, D.C. 2004. Managing Individual Are Group. Behavioral in
Organization. New York: McGraw Hill.
Christianini, N. & Taylor, S.J. 2000. An Introduction to Support Vector Machine and
other Kernel Based Learning methods, Cambridge University Press.
Cortes, C. & Vapnik, V. 1995. Support vector networks, Machine Learning, 20, 273-
297.
Fathima, A.S. 2012. Predictive Analysis for the Arbovirus-Dengue using SVM
Classification, International Journal of Engineering and Technology , Volume
2 No. 3, 2012, 2049-3444
Gunn, S. 1998. Support Vector Machines for Clasification and Regression, Technical
Report, ISIS.
Kohli, N., & Verma, N.K. 2011. Arrhythmia classification using SVM with selected
features, International Journal of Engineering, Science and Technology 3(8):
122-131.
Nugroho, Satrio, A. 2003. Support Vector Machine Teori dan Aplikasinya dalam
Bioinformatika.
Nithya, R., & Santhi, B. 2011. Classification of Normal and Abnormal Patterns in
Digital Mammograms for Diagnosis of Breast Cancer. International Journal of
Computer Applications 28(6): 0975 – 8887.
Rachman, F & Purnami, S.W. 2012. Klasifikasi Tingkat Keganasan Breast Cancer
dengan Menggunakan Regresi Logistik Ordinal dan Support Vector Machine
(SVM). Jurnal Sains dan Seni ITS, 1(1): 2301-928X.
Santoso, B. 2007. Data Mining Terapan Dengan Matlab. Graha Ilmu, Yogyakarta.
Sumarmo, P.S. 1999. Masalah Demam Berdarah Dengue di Indonesia. Pelatihan bagi
Pelatih Dokter spesialis Anak & Dokter Spesialis Penyakit Dalam dalam
Tatalaksana Kasus DBD, Balai Penerbit FK UI, Jakarta.
Wibisono, B.H. 1995. Studi Epidemiologis Demam Berdarah Dengue pada Orang
Dewasa, Medika 10(21): 767.
Xisheng, H., Wang, Z., Jin, C. Zhen, Y. & Xue,X. 2012. "A Simplified Multi-Class
Support Vector Machine with Reduced Dual Optimization," Elsevier on
Pattern Recognition Letters, 71-82.