Anda di halaman 1dari 10

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-ISSN: 2548-964X

Vol. 1, No. 10, Oktober 2017, hlm. 1210-1219 http://j-ptiik.ub.ac.id

Implementasi Algoritma Modified K-Nearest Neighbor (MKNN) untuk


Klasifikasi Penyakit Demam
Fakihatin Wafiyah1, Nurul Hidayat2, Rizal Setya Perdana3

Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya


Email: 1135150207111028@mail.ub.ac.id, 2ntayadih@ub.ac.id, 3rizalespe@ub.ac.id

Abstrak
Demam merupakan indikator awal untuk beberapa penyakit antara lain demam berdarah, tifoid dan
malaria disertai gejala yang mirip, antara lain nyeri otot, gangguan pencernaan, kondisi lidah serta
pembesaran pada hati dan limpa. Kemiripan gejala dari masing-masing penyakit sering menimbulkan
kesulitan dalam mendapatkan anamnese (diagnosa sementara) sehingga pasien mendapatkan
penanganan awal yang kurang tepat. Untuk menangani masalah tersebut diperlukan teknologi untuk
mendapatkan diagnosa sementara dengan menerapkan salah satu metode klasifikasi yaitu Modified K-
Nearest Neighbor (MKNN). Metode tersebut mempelajari pola dari data hasil pemeriksaan sebelumnya
berdasarkan 15 gejala penyakit dengan proses perhitungan jarak eucledian, perhitungan nilai validitas
dan perhitungan weighted voting yang hasil akhirnya digunakan untuk penetapan kelas klasifikasi
berdasarkan nilai K yang telah ditentukan. Berdasarkan hasil pengujian terhadap perubahan nilai K,
perubahan jumlah data latih dan perubahan komposisi data latih didapatkan rata-rata akurasi untuk
pengujian pengaruh nilai K terhadap akurasi sebesar 88.55%. Nilai rata-rata akurasi yang didapatkan
dari pengujian pengaruh variasi jumlah data latih adalah 92.42%. Pengujian pengaruh komposisi data
latih terhadap akurasi mendapatkan nilai rata-rata akurasi sebesar 87.89%. Pengujian pengaruh
komposisi data latih dan data uji terhadap akurasi mendapatkan nilai rata-rata akurasi sebesar 96.35%.
Kata Kunci: Modified K-Nearest Neighbor (MKNN), klasifikasi, demam, Malaria, Tifoid, Demam Berdarah
(DBD)
Abstract
Fever is an early indicator for some diseases such as dengue fever, typhoid and malaria accompanied
by similar symptoms, including muscle pain, indigestion, tongue condition and enlargement of the liver
and spleen. Similar symptoms of each disease cause difficulties in getting anamnese (temporary
diagnosis) so that patients get the inadequate initial treatment. Handling the problem, technology is
needed to obtain a temporary diagnosis by applying one of the classification method of Modified K-
Nearest Neighbor (MKNN). The method studied the pattern of previous examination data based on 15
symptoms of disease with eucledian distance calculation process, calculation of validity value and
weighted voting calculation that the end result is used for class classification determination based on
predetermined value of K. Testing of the value of K get the accuracy of 88.55%. The average value of
accuracy obtained from testing of variation in the amount of training data is 92.42%. Testing the
influence of the composition of train data get the average value of accuracy of 87.89%. Testing the
influence of the composition of train data and test data get the average value of accuracy of 96.35%.
Keyword: Modified K-Nearest Neighbor (MKNN), classification, fever, Malaria, Typhoid, Dengue Fever (DHF)

bahawa tubuh sedang melakukan perlawan


1. PENDAHULUAN terhadap zat-zat berbahaya. Beberapa penyakit
Demam adalah peningkatan suhu tubuh di selalu diawali dengan demam disertai gejala lain
atas 36o C yang disebabkan oleh faktor infeksi antara lain meningitis, infeksi saluran
atau faktor non infeksi (Dinarello dan Gelfand, pernapasan, infeksi saluran kandung kemih,
2005). Demam merupakan hal yang sering demam berdarah, demam tifoid dan malaria.
terjadi pada manusia dan merupakan indikator Ketiga jenis penyakit ini memiliki beberapa
indikator untuk diagnosa klinis antara lain,

Fakultas Ilmu Komputer


Universitas Brawijaya 1210
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 1211

Demam, nyeri otot, gangguan pencernaan, terjadinya perubahan pada pusat termoregulasi
kondisi lidah serta pembesaran pada hati dan yang terletak dalam hipotalamus anterior.
limpa (Annisa, 2016). Kemiripan gejala dari Demam berhubungan dengan peningkatan
masing-masing penyakit sering menimbulkan suhu tubuh disertai peningkatan produksi sitoken
kesulitan dalam mendapatkan anamnese pirogen yang berfugsi untuk mengatasi
(diagnosa sementara) sehingga pasien rangsang, antara lain peradangan, infeksi
mendapatkan penanganan awal yang kurang disebabkan bakteri dan virus serta rangasangan
tepat dan semakin memperburuk kondisi pasien pirogenik. Demam merupakan gejala awal untuk
(Hariman, 2014). penyakit-penyakit yang membutuhkan
Kemajuan teknologi telah membantu penanganan serius, antara lain demam berdarah,
menyelesaikan permasalahan di berbagai bidang tifoid dan malaria.
terutama bidang kesehatan, kesalahan dalam
melakukan diagnosa dapat dicegah dengan 2.2 Klasifikasi
mempelajari pola dari data hasil pemeriksaan Klasifikasi adalah teknik untuk merancang
pasien demam berdarah, demam tifoid dan fungsi berdasarkan hasil pengamatan dari data
malaria sehingga gejala-gejala tersebut dapat dan atribut dari data tersebut sehingga dapat
diklasifikasikan berdasarkan kedekatan antara dilakukan pemetaan terhadap data yang belum
data lama dengan data baru. Proses klasfikasi memiliki kelas kedalam data yang telah
menggunakan komputer dapat diterapkan terklasifikasi sesuai dengan aturan-aturan yang
dengan menggunakan beberapa algoritma, diberikan. Terdapat banyak algoritma yang
antara lain K-Nearest Neighbor, Modified K- digunakan untuk mengklasfikasi data, antara lain
Nearest Neighbor (MKNN), Naïve Bayes, Fuzzy fuzzy, artificial neural network, support vector
Tsukamoto atau gabungan antara dua metode- machine dan K-nearest neighbor.
metode tersebut seperti, Fuzzy K-Nearest Klasifikasi menggunakan algoritma-
Neighbor (FK-NN). algoritma tersebut secara umum dilakukan
Implementasi algoritma MKNN untuk berdasarkan 3 tahapan yaitu:
klasifikasi demam bertujuan untuk memudahkan
ahli medis dalam memperoleh anamnese a) Perancangan Model
(diagnosa sementara) dengan cara Proses membangun solusi untuk
mengklasfikasi gejala-gejala yang dialami oleh menyelesaikan masalah berdasarkan data
pasien dengan K data tetangga terdekat untuk yang telah terklasfikasi (Data latih).
mendapatkan nilai akurasi yang tinggi. b) Implementasi Model
MKNN merupakan algoritma yang Proses penentuan kelas untuk data uji
dikembangkan dari algoritma KNN, algoritma berdasarkan model fungsi dan parameter-
MKNN menambahkan proses baru untuk parameter data yang telah ditentukan pada
melakukan klasifikasi yaitu, perhitungan nilai tahap perancangan.
validitas untuk mempertimbangkan validitas
antar data latih dan pehitungan weighted voting c) Evaluasi Model
untuk menghitung bobot dari masing-masing Proses yang bertujuan untuk melakukan
terdekat. Penambahan 2 proses baru dalam evaluasi terhadap hasil implementasi model
MKNN diharapkan dapat memperbaiki setiap fungsi dalam mengklasifikasikan data uji
kesalahan pada proses K-NN. berdasarkan parameter-paramter yang telah
ditetapkan.
2. TINJAUAN PUSTAKA
2.3 Normalisasi Data
2.1 Demam Normalisasi data merupakan proses awal
Suhu tubuh merupakan gambaran yang dilakukan dalam tahap klasifikasi dengan
keseimbangan tubuh mengenai proses produksi melakukan pensklaan nilai atribut dari data
dan pelepasan panas yang diatur dalam otak sehingga berada pada range tertentu (Panjaitan,
(hipotalamus). Suhu tubuh dalam kondisi normal 2013). Proses normalisasi pada dataset
jika berada dalam suhu 36.50C – 37.20C dan dilakukan dengan tujuan agar persebaran data
dikatakan demam jika suhu di atas diatas 37.20C merata dan meningkatkan nilai akurasi sistem.
Demam terjadi sebagai bentuk rangsang Pada penelitian menggunakan neuro fuzzy untuk
klasifikasi inventori berdasarkan analisa ABC
dijelaskan bahwa hasil pengujian pada data

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 1212

masukan ternomalisasi dan tidak ternormalisasi setiap data training adalah seperti persamaan
menunjukkan hasil yang cukup berbeda hal ini dibawah ini Persamaan 3.
ditunjukkan dengan perbedaan hasil klasifikasi 1
𝑉𝑎𝑙𝑖𝑑𝑖𝑡𝑦(𝑥) = ∑𝑛𝑖=0 𝑆(𝑙𝑏𝑙(𝑥), 𝑙𝑏𝑙(𝑁𝑖(𝑥))) (3)
dan mempengaruhi derajat keanggotaan dari 𝐻
data dengan pusat kelasnya (Darmanto, 2012). Dimana:
Terdapat beberapa cara teknik normalisasi antara
min-max normalization, z-score normalization, 𝐻 : jumlah titik terdekat
decimal scaling dan sigmoidal normalization. 𝑙𝑏𝑙(𝑥) : kelas x
Berikut adalah persamaan 1 untuk teknik min- 𝑙𝑏𝑙(𝑁𝑖(𝑥)) : label kelas titik terdekat x
max normalization.
Fungsi S digunakan untuk menghitung
s−min(𝑆𝑘 ) kesamaan antara titik x dan data ke-i dari
𝑠′ = (1)
max(𝑆𝑘 )−min(𝑆𝑘 ) tetangga terdekat. Yang dituliskan dalam
Dimana: persamaan di bawah ini mendefinisikan fungsi S
pada persamaan 4.
s = nilai dari data masukan
min(𝑆𝑘 ) = nilai minimum seluruh data 1𝑎 =𝑏
𝑆(𝑎, 𝑏) = { (4)
max(𝑆𝑘 ) = Nilai maksimum seluruh data 0𝑎 ≠𝑏
Keterangan:
2.4 Algoritma Modified K-Nearest Neighbor a = kelas a pada data training.
(MKNN) b = kelas lain selain a pada data training.
Algoritma modified k-nearest neighbor 2.4.3 Perhitungan Weighted Voting
(MKNN) merupakan pengembangan dari
metode KNN dengan penambahan beberapa Dalam metode MKNN, pertama weight
masing-masing tetangga dihitung dengan
proses yaitu, perhitungan nilai validitas dan
menggunakan 1 / (de + 0.5). Kemudian,
perhitungan bobot. Algoritma k-nearest
neighbor (KNN) merupakan algoritma Validitas dari tiap data pada data training
dikalikan dengan weighted berdasarkan pada
clustering yang sangat sederhana dengan cara
mengelompokkan data baru dengan K tetangga jarak Euclidian. Dalam metode MKNN, weight
terdekat. voting tiap tetangga Persamaan 5.
1
2.4.1 Perhitungan Jarak Eucledian 𝑊(𝑖) = 𝑉𝑎𝑙𝑖𝑑𝑖𝑡𝑦(𝑖) 𝑥 (5)
𝑑𝑒+ 𝛼

Untuk mendefinisikan jarak antara dua titik Dimana:


yaitu titik pada data training (x) dan titik pada 𝑊(𝑖) : Perhitungan Weight Voting
data testing (y) maka digunakan rumus 𝑉𝑎𝑙𝑖𝑑𝑖𝑡𝑦(𝑖) : Nilai Validitas
Euclidean, seperti yang ditunjukkan pada 𝑑𝑒 : Jarak Euclidean
persamaan 2
Teknik weighted voting ini mempunyai
𝑑 (𝑥𝑖, 𝑦𝑖) = √∑𝑛𝑖=0(𝑥𝑖 − 𝑦𝑖 )2 (2) pengaruh yang lebih penting terhadap data yang
dengan d adalah jarak antara titik pada data mempunyai nilai validitas lebih tinggi dan paling
training x dan titik data testing y yang akan dekat dengan data. Selain itu, dengan
diklasifikasi, dimana x=x1,x2,…,xi dan mengalikan validitas dengan jarak dapat
y=y1,y2,…,yi dan I merepresentasikan nilai mengatasi kelemahan dari setiap data yang
atribut serta n merupakan dimensi atribut. mempunyai jarak dengan weight yang memiliki
banyak masalah dalam outlier. Jadi, algoritma
2.4.2 Perhitungan Nilai Validitas MKNN diusulkan secara signifikan lebih kuat
Dalam algoritma MKNN, setiap data pada daripada metode KNN tradisional yang
data training harus divalidasi terlebih dahulu didasarkan hanya pada jarak. (Parvin, 2008).
pada awalnya. Validitas setiap data tergantung
pada setiap tetangganya. Proses validasi 3. METODOLOGI
dilakukan untuk semua data pada data training. Tahapan yang dilakukan pada penelitian ini
Setelah dihitung validitas tiap data maka nilai ditunjukkan pada gambar 1 berupa Diagram Alir
validitas tersebut digunakan sebagai informasi Metodologi Penelitian.
lebih mengenai data tersebut. Persamaan yang
digunakan untuk menghitung nilai validitas pada

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 1213

Gambar 2 Alur Perancangan

Gambar 1 Diagram Alir Metodologi Penelitian 4.1 Analisa Kebutuhan Proses


Tahap awal sistem adalah melakukan
3.1 Data Penelitian normalisasi data latih dan data uji. Tahap Kedua
Data yang digunakan dalam penelitian sistem melakukan perhitungan jarak eucledian
merupakan jenis data sekunder berupa data yang antara data latih dari sistem dengan data uji
didapatkan dari pihak Rumah Sakit Umum untuk menentukan jenis demam yaitu, demam
Daerah Selasih, Kota Riau, Indonesia dan berdarah, demam tifoid dan demam malaria.
dijadikan sebagai data dalam pengujian Untuk mendukung hasil klasifikasi dilakukan
algoritma MKNN. Data yang digunakan adalah perhitungan validitas lalu mencari weighted
data yang telah diarsipkan sebelumnya oleh voting sehingga didapatkan nilai tertinggi setelah
RSUD Selasih Pangkalan Kerinci Riau dan perhitungan weighted voting untuk mengetahui
dapat dipergunakan untuk tujuan penelitian. hasil klasifikasi. Perancangan proses
Penelitian ini dilakukan menggunakan 15 gejala ditunjukkan oleh gambar 3
penyakit beserta bobot untuk masing-masing
START
gejala dalam beberapa tingkatan dengan total
data sebanyak 133 data pasien penderita
penyakit demam berdarah, tifoid dan malaria. Input Data Gejala
Demam

4. PERANCANGAN
Perancangan berisi penjelasan mengenai Normalisasi Data
kebutuhaan yang diperlukan untuk membangun
sebuah sistem yang memiliki fungsi dalam
klasfikasi penyakit demam menggunakan Proses Klasifikasi MKNN
algoritma MKNN. Pada gambar 2 ditunjukkan
dalam diagram perancangan.
Output Data
Klasifikasi Demam

END

Gambar 3 Alur Sistem

4.2 Perancangan Proses Normalisasi Data


Data yang digunakan dalam proses
klasifikasi demam merupakan data pasien
beserta bobot untuk setiap gejala demam. Data
tersebut diproses dalam tahap normalisasi untuk

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 1214

memperkecil jarak antar masing-masing data.


Proses normalisasi dilakukan pada setiap data uji
dan dan latih. Proses normalisasi dijelaskan
dalam diagram 4. Sistem melakukan pemrosesan
data latih dan data uji untuk gejala penyakit
demam yang dimasukkan oleh pengguna. Proses
perulangan dilakukan oleh sistem sampai
menghasilkan data-data yang ternormalisasi.
START
Normalisasi Data

Dataset_pasiendemam

For x=1 to jumlah dataset

For y=1 to jumlah gejala

NormalisasiDataset
=(dataset x, y-min
x)/ (max y – min y)

HasilNormalisasi
Gambar 5 Diagram Alir Proses Klasifikasi MKNN

Y
4.3.1 Menghitung Jarak Eucledian
X
Perhitungan jarak eucledian dilakukan
END
dilakukan dalam 2 tahapan yaitu menghitung
nilai jarak eucledian antar data latih serta
Gambar 4 Diagram Alir Proses Normalisasi menghitung nilai jarak eucledian antar data latih
dan data uji. Proses perhitungan jarak ditunjukan
4.3 Perancangan Sistem Klasifikasi pada gambar 6
Klasifikasi demam menggunakan metode Start

MKNN melalui beberapa tahap yaitu, Euclidean

memasukkan data set gejala demam yang telah Dataset_pasiendemam

dinormalisasi, menghitung jarak eucledian,


mengambil sejumlah K tetangga terdekat For x = 1 to datalatih

berdasarkan hasil perhitungan jarak eucledian,


menghitung nilai validitas data latih dan For y = 1 to dataLatih

menghitung weighted voting. Proses klasifikasi


ditunjukkan pada gambar 5 Inisialisasi Jumlah data
eucledianDataLatih=0

For z = 1 to Jumlah Parameter

JumlahDataEucledianDataLatih=
JumlahDataEucledianDataLatih+(normal
isasiDataLatih[x][y]-
normalisasiDataLatih[y][z]^2)

EucledianDataLatih=sqrt(jumla
heuclediandatalatih)

Return

Gambar 6 Diagram Alir Perhitungan Jarak


Eucledian

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 1215

4.3.2 Menghitung Nilai Validitas Weight Voting


Start

Proses perhitungan validitas bertujuan untuk


EuclideanDataUji[x]
melakukan validasi setiap data latih yang dan Validitas [x]
digunakan dalam sistem yang ditunjukkan pada
gambar 7. Tahap awal adalah melakukan
For x=1 to
perhitungan jarak eucledian antar data latih lalu dataLatih

mengambil sejumlah K tetangga terdekat


berdasarkan hasil jarak eucledian yang terkecil. For y = 1 to
Tahap selanjutnya adalah melakukan DataUji

perbandingan kelas untuk data latih tersebut.


Hasil perbandingan tersebut kemudian Weightvoting = validitas
dijumlahkan dan dibagi dengan nilai K yang [x][y]*(1/
eucledianDataUji[x][y]*0.5)
telah ditentukan.
START Weightvoting [x][y]

Hitung Validitas

EucledianDataLatih
dan nilai_K y

x
For x=1 to datalatih

Return
asort (euclediandatalatih)

Gambar 8 Diagram Alir Perhitungan Weighted


For y=1 to nilai_k-1
Voting

For z=y+1 to nilai_k


5. IMPLEMENTASI

5.1 Implementasi Halaman Data Latih


Datalatih[indexurutvaliditaslatih[y]][diagnosis]=
=datalatih[indexurutvaliditaslatih[z]][diagnosis]
Sistem menampilkan 100 data latih pasien
yang digunakan untuk menyusun fungsi
K[y]=1 klasifikasi. Data pasien terdiri atas ID pasien dan
K[z]=1
bobot 15 gejala berdasarkan hasil pemeriksaan
Z pada pasien seperti pada gambar 9.
Y

Menjumlahkan seluruh
nilai pada variabel K

Validitas[x]=sum/nilai k

Return

Gambar 7 Diagram Alir Perhitungan Validitas

4.3.3 Menghitung Weighted Voting


Proses perhitungan weighted voting
dijelaskan dalam diagram alir 8 dimulai dari Gambar 9 Halaman Data Latih Pasien
memasukkan nilai jarak eucledian antara data
latih dan data uji serta nilai validiatas untuk 5.2 Implementasi Halaman Data Uji
selanjutnya dilakukan perulangan sampai Halaman sistem yang menampilkan data uji
mendapatkan nilai dari perhitungan weighted pasien yang digunakan untuk proses pengujian
voting. metode MKNN dalam mengklasifikasikan
demam. Data uji memiliki data yang sama

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 1216

dengan tabel data latih terdiri atas ID pasien dan masing-masing penyakit seperti yang
15 gejala beserta bobot seperti pada gambar 10 ditunjukkan padahal gambar 12

Gambar 12 Halaman Pengujian


Gambar 10 Halaman Data Uji Pasien
6. PENGUJIAN
5.3 Implementasi Proses Perhitungan Pengujian dilakukan untuk mengetahui
MKNN pengaruh perubahan nilai K, pengaruh
Proses klasifikasi demam menggunakan perubahan total data latih dan pengaruh
metode MKNN terdiri atas beberapa tahap, perubahan komposisi data latih terhadap akurasi
antara normalisasi data latih, normalisasi data sistem.
uji, perhitungan jarak eucledian data latih, a) Hasil pengujian Akurasi berdasarkan
perhitungan nilai validitas, perhitungan jarak Nilai K
eucledian antara data latih dan data uji,
perhitungan weighted voting seperti pada Pengujian terhadap nilai K dilakukan
gambar 11. menggunakan nilai K yang bervariasi, yaitu nilai
K = 3, K = 5, K = 7, K = 10, K = 20 dan K = 30
dengan jumlah data latih yang berbeda, yaitu 50,
70 dan 100 data latih. Grafik hasil pengujian
ditunjukkan pada gambar 13

Pengujian Pengaruh Nilai K


terhadap Akurasi
100,00%

80,00%

60,00%

40,00%

20,00%
Gambar 11 Halaman Proses Perhitungan MKNN
0,00%
5.3 Implementasi Hasil Klasifikasi 3 5 7 10 20 30

Halaman pengujian pada sistem Gambar 13 Grafik Hasil Pengujian Pengaruh Nilai
K
menampilkan hasil klasifikasi demam untuk
semua data uji sesuai dengan nilai yang Grafik pada gambar 13 menunjukkan bahwa
didapatkan dari perhitungan weighted voting. pada pengujian ini nilai akurasi tertinggi dari
Hasil Klasifikasi dalam halaman pengujian nilai K = 3 dan K =7. Pengujian terhadap nilai K
ditampilkan sesuai dengan nilai K yang menunjukkan tingkat akurasi yang berbeda
ditentukan lalu ditampilkan banyak data dengan sehingga dapat diketahui bahwa perubahan nilai
sesuai nilai K dengan nilai tertinggi pada K dapat mempengaruhi akurasi sistem untuk

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 1217

mengklasifikasi demam. Nilai K yang semakin menggunakan 70 data latih dengan ketentuan
tinggi menyebabkan akurasi menurun hal ini beberapa, yaitu skenario pertama komposisi data
disebabkan oleh beberapa hal antara lain latih terdiri atas 30 Tifoid, 20 Malaria dan 20
mempengaruhi kesesuaian data, nilai K yang Demam Berdarah (DBD). Skenario kedua
tinggi menyebabkan nilai validitas data latih komposisi data latih terdiri atas 20 Tifoid, 30
rendah dan perbandingan data dari hasil Malaria dan 20 Demam Berdarah (DBD).
weighted voting semakin banyak sehingga Skenario ketiga komposisi data latih terdiri atas
menyebabkan kesalahan sistem dalam 20 Tifoid, 20 Malaria dan 30 Demam Berdarah
melakukan klasifikasi. Total rata-rata akurasi (DBD). Skenario terakhir menggunakan
untuk pengujian K adalah 88.55%. komposisi data latih seimbang terdiri atas 25
Tifoid, 25 Malaria dan 25 Demam Berdarah
b) Hasil pengujian Akurasi berdasarkan
(DBD). Pengujian dilakukan menggunakan nilai
Jumlah Data Latih
K =10 dan mendapatkan hasil akurasi sistem
Pengujian pengaruh jumlah data dengan 4 seperti yang ditunjukkan pada gambar 15
variasi data latih yaitu 30 data latih, 50 data latih,
70 data latih dan 100 data latih dengan
menggunakan nilai K = 3 dan 33 data uji. Grafik Pengaruh Pengujian
hasil pengujian ditunjukkan pada gambar 14. Komposisi Data Latih
100,00%
Pengaruh Pengujian 95,00%
Jumlah Data Latih 90,00%
98,00% 85,00%
97,00%
80,00%
96,00%
30 T, 20 20 T , 30 30 T, 20 25 T, 25
95,00% M, 20 D M , 20 D M, 20 D M, 25 D
94,00%
93,00% Gambar 15 Grafik Hasil Pengujian Pengaruh
92,00% Komposisi Data Latih
30 Data 50 Data 70 Data 100 Data
Latih Latih Latih Latih Hasil pengujian menunjukkan bahwa
komposisi data latih untuk memberikan
Gambar 14 Grafik Hasil Pengujian Pengaruh pengaruh terhadap proses klasifikasi demam.
Jumlah Data Latih Pada 3 skenario komposisi data latih cenderung
dominan pada satu kelas sehingga hasil akurasi
Hasil pengujian menunjukkan bahwa jumlah
sangat bervariasi. Skenario pertama dengan hasil
data latih mempengaruhi akurasi sistem dalam
akurasi 93.94%, skenario kedua menghasilkan
melakukan klasifikasi demam. Hal ini
akurasi 90.90% dan skenario ketiga
ditunjukkan dengan dengan hasil akurasi sebesar
menghasilkan akurasi 87.89%. Akurasi tertinggi
93.94% dari pengujian menggunakan 30 data
didapatkan dari skenario terakhir dengan
latih, 50 data latih dan 70 Data Latih. Pengujian
komposisi data seimbang yaitu 96.97%. Nilai
menggunakan 100 data latih mendapatkan
akurasi yang tinggi disebabkan karena
akurasi tertinggi sebesar 96.97%. Pengujian
komposisi data yang digunakan merata dan tidak
menggunakan skenario ini menunjukkan nilai
dominan pada kelas tertentu.
akurasi rendah jika data latih yang digunakan
tidak banyak. Proses klasifikasi menggunakan d) Hasil pengujian Akurasi berdasarkan
algoritma MKNN dilakukan dengan Komposisi Data Latih
mempelajari pola dari data latih sehingga jumlah Pengujian komposisi dilakukan
data latih yang rendah menyebabkan sistem menggunakan 133 data pasien namun dilakukan
kurang menemukan pola dari data latih untuk perubahan terhadap komposisi data latih dan
melakukan klasifikasi. data uji. Pengujian pertama dilakukan dengan
c) Hasil pengujian Akurasi berdasarkan komposisi 100 data latih dan 33 data uji.
Komposisi Data Latih Pengujian kedua dilakukan dengan komposisi 80
data latih dan 53 data uji serta pengujian ketiga
Pengujian komposisi dilakukan
dilakukan dengan komposisi data latih 70 dan 63

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 1218

data latih. Pengujian dilakukan menggunakan demam dapat memberikan anamnese


nilai K = 3, K = 5, K =7 dan K = 10 dan (diagnosa awal) terhadap 3 jenis demam,
mendapatkan hasil akurasi sistem seperti yang yaitu demam berdarah, tifoid dan malaria.
ditunjukkan pada gambar 16 2. Hasil klasifikasi kelas pada algoritma
MKNN diambil berdasarkan nilai tertinggi
Pengaruh Pengujian Komposisi setelah proses perhitungan weighted voting
Data Latih dan Data Uji dan nilai K yang telah ditentukan.
97,50%
3. Pengujian akurasi dilakukan dalam 3 tahap,
97,00% yaitu pengujian terhadap nilai K, pengujian
terhadap jumlah data latih dan pengujian
96,50%
terhadap kompoisi data latih untuk
96,00% mengetahui pengaruh perubahan nilai K
dan perubahan data latih terhadap akurasi
95,50%
sistem dengan penjelasan sebagai berikut:
95,00% a. Nilai rata-rata akurasi pengujian
perngaruh nilai K terhadap akurasi
94,50%
adalah 88.55% dengan akurasi
94,00% tertinggi pada pengujian nilai K = 3
dengan akurasi sebesar 94.95%.
93,50%
b. Nilai rata-rata akurasi pengujian
93,00% pengaruh jumlah data latih terhadap
100 Data 80 Data Latih70 Data Latih akurasi adalah 92.42%.
Latih dan 33 dan 53 Data dan 63 Data
Data Uji Uji Uji c. Nilai rata-rata akurasi pengujian
komposisi data latih terhadap akurasi
Gambar 16 Grafik Hasil Pengujian Pengaruh adalah 87.89% dengan nilai akurasi
Komposisi Data Latih dan Data Uji tertinggi sebesar 96.97% untuk
pengujian komposisi data seimbang 25
Hasil pengujian menunjukkan bahwa Tifoid, 25 Malaria dan 25 Demam
komposisi data latih untuk memberikan Berdarah.
pengaruh terhadap proses klasifikasi demam. d. Nilai rata-rata akurasi pengujian
Pada 3 skenario komposisi data latih dan data uji pengaruh jumlah data latih dan data uji
yang sangat bervariasi sehingga mempengaruhi terhadap akurasi adalah 96.35%. Nilai
tingkat akurasi. Skenario pertama dengan hasil akurasi tertinggi didapatkan dari
akurasi 94.69%, skenario kedua menghasilkan pengujian dengan komposisi 70 data
akurasi 97.16% dan skenario ketiga latih dan 63 data uji dengan nilai
menghasilkan akurasi 97.21%. Akurasi tertinggi akurasi 97.21%.
didapatkan dari skenario terakhir dengan Saran yang dapat diberikan untuk
komposisi data latih lebih banyak namun hampir pengembangan penelitian ini selanjutnya antara
seimbang dengan data uji yaitu 97.21%. Akurasi lain:
yang tinggi dengan komposisi data latih 70 data a. Menambahkan kategori penyakit dengan
dan dan data uji 63 data dapat disebabkan karena gejala demam disertai gejala lain.
jarak antar data yang dekat sehingga dengan b. Menambahkan data gejala yang lebih
pengujian menggunakan komposisi seimbang bervariasi baik dari pemeriksaan secara
mendapat akurasi yang lebih baik dalam fisik dan pemeriksaan non fisik.
penelitian menggunakan data ini. c. Mengembangkan metode serta
menggabungkan metode lain karena
7. KESIMPULAN dalam memecahkan permasalahan ini,
Berdasarkan penelitian untuk melakukan metode MKNN bukan satu-satunya
klasifikasi demam menggunakan metode pada metode yang dapat digunakan.
proses perancangan, implementasi dan d. Sistem juga dapat dikembangkan dengan
pengujian maka dapat diambil kesimpulan menentukan nilai K dan komposisi jumlah
sebagai berikut: data latih dan data uji yang optimal untuk
1. Implementasi algoritma MKNN untuk mendapatkan akurasi yang lebih baik.
klasifikasi demam berdasarkan 15 gejala

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 1219

DAFTAR PUSTAKA simple implementation. 2000 IEEE


International Symposium on Circuits
Annisa, C.D., Putri, R.R & Marji., 2016. Sistem
and Systems. Emerging Technologies
Pakar Diagnosa Awal Penyakit DBD,
for the 21st Century. Proceedings (IEEE
Malaria dan Tifoid menggunakan
Cat No.00CH36353), Geneva. pp. 568-
Metode Fuzzy K-Nearest Neighbor
565 vol.4.
(FKNN). S1. Universitas Brawijaya.
Tersedia di Hadisaputro, S., 1991. Tropical Disease Update.
<http://ptiik.ub.ac.id/skripsi> Laboratorium Ilmu Penyakit Dalam FK
[Diakses 2 Februari 2017] Undip. Semarang.
Arista, R.B.et al., n.d. Deteksi Penyakit Demam Hariman, I & Noviar, A., 2014. Sistem Pakar
Berdarah, Tifus dan Demam Biasa untuk Mendiagnosa Penyakit DBD
berdasarkan gejalanya. S1. Universitas (Demam Berdarah Dengue) dengan
Brawijaya. Metode Forward Chaining Berbasis
Web. Sekolah Tinggi Manajemen
B. G. H. Gorte., 2008. Improving spectral image
Informatika dan Ilmu Komputer LPKIA.
classifications by incorporating context
data using likelihood vectors. Fifth Hasan, H., 2007. Analisis Faktor Risiko
International Conference on Image Kejadian Malaria di Puskesmas
Processing and its Applications. Sukamerin di Kecamatan Sungai Serut
Edinburgh. pp. 251-255. Kota Bengkulu Propinsi Bengkulu. S2.
Universitas Diponogero.
Ao Li, Lirong Wang, Yunzhou Shi, Minghui
Wang, Zhaohui Jiang and Huanqing Panjaitan, A., Hidayat, B & Sujatmoko, K.,
Feng. 2005. Phosphorylation Site 2013. Analisis Diskriminan Linear
Prediction with A Modified k-Nearest dalam Klasifikasi Data pada Teori
Neighbor Algorithm and BLOSUM62 Informasi dengan Metode Cross
Matrix. IEEE Engineering in Medicine Validation. S1. Universitas Telkom.
and Biology 27th Annual Conference.
Parvin, H., Alizadeh, H & Bidgoli, B., 2008.
Shanghai.
MKNN: Modified K-Nearest Neighbor.
Darmanto, E & Hartati, S., 2012. Neuro Fuzzy Proceedings of the World Congress on
untuk Klasifikasi Inventori berdasarkan Engineering and Computer Science
analisa ABC. Seminar Nasional 2008. San Fransisco. USA
Informatika 2012. UPN Veteran
Zainuddin, S., Hidayat, N & Soebroto, A., 2014.
Yogyakarta. Yogyakarta.
Penerapan Algoritma Modified K-
Departemen Kesehatan Indonesia, 2013. Nearest Neighbor (M-KNN) pada
Penyakit Malaria dan TBC Pengklasifikasian Tanaman Kedelai.
menyebabkan 170.000 kematian setiap S1. Universitas Brawijaya. Tersedia di
tahun di Indonesia. Jakarta. http://ptiik.ub.ac.id/skripsi
[Diakses 2 Februari 2017]
Departemen Kesehatan Republik Indonesia,
2008a. Perkembangan Kejadian DBD di
Indonesia 2004-2007. Tersedia di
<http://www.penyakitmenular.info/detil
.asp?m=5&s=5&i=217 > (Diakses
tanggal 1 Januari 2017)
Fransisca, S & Gabriela, P., 2000. Demam
Berdarah Dengue (DBD). S1. Fakultas
Kedokteran. Universitas Wijaya
Kusuma.
Gillepsie, CJSH., 2009. Manson’s Tropical
Disease. China: Saunders Elsevier.
Gevorkian, D, Egiazarian, K & Astola, J., 2000.
Modified K-nearest neighbor filters for

Fakultas Ilmu Komputer, Universitas Brawijaya

Anda mungkin juga menyukai