Anda di halaman 1dari 9

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/324038430

Identifikasi Penyakit Gagal Ginjal Menggunakan Metode Neighbor Weighted


K-Nearest Neighbor (NWKNN)

Article · September 2018

CITATIONS READS

0 793

3 authors, including:

Dian Eka Ratnawati Candra Dewi


Brawijaya University Brawijaya University
45 PUBLICATIONS   11 CITATIONS    40 PUBLICATIONS   23 CITATIONS   

SEE PROFILE SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Identifying Quality of Patchouli Leaves through Its Leave Image Using Learning Vector Quantization View project

Image Processing and Computer Vision View project

All content following this page was uploaded by Dian Eka Ratnawati on 27 March 2018.

The user has requested enhancement of the downloaded file.


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-ISSN: 2548-964X
Vol. 2, No. 9, September 2018, hlm. 2562-2569 http://j-ptiik.ub.ac.id

Identifikasi Penyakit Gagal Ginjal Menggunakan Metode Neighbor


Weighted K-Nearest Neighbor (NWKNN)
Azizul Hanifah Hadi1, Dian Eka Ratnawati2, Candra Dewi3

Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya


Email: 1azizulhanifahhadi@gmail.com, 2dian_ilkom@ub.ac.id, 3dewi_candra@ub.ac.id

Abstrak
Penyakit gagal ginjal dapat disebabkan oleh beberapa faktor yakni hipertensi, kadar asam urat, kadar
kreatinin, diabetes, dan masih banyak yang lain. Dari beberapa faktor itu, kita bisa mengetahui tingkat
resiko terjadinya penyakit gagal ginjal. Tetapi banyak orang yang tidak menyadari, malas dan acuh
mengenai pemeriksaan kesehatan terutama pada ginjal karena proses yang lama dan rumit. Menurut
Indonesian Renal Registry, pada tahun 2014 pasien penyakit gagal ginjal di Indonesia mencapai 12.770
jiwa. Oleh karena itu maka dibutuhkan suatu sistem yang dapat melakukan deteksi atau identifikasi
mengenai penyakit gagal ginjal. Pada penelitian ini akan dilakukan identifikasi penyakit gagal ginjal
menggunakan metode Neighbor Weighted K-Nearest Neighbor (NWKNN). Metode ini hampir sama
dengan metode KNN tetapi yang membedakan terdapat pada proses pembobotan di setiap kelas
identifikasi. Kelas identifikasi pada penelitian ini ada 2 yakni ckd atau terkena gagal ginjal dan notckd
atau tidak terkena gagal ginjal. Hasil dari penelitian ini menunjukkan bahwa metode NWKNN dapat
melakukan identifikasi terhadap penyakit gagal ginjal pada saat data latih yang digunakan sebanyak 150
data dan data uji sebanyak 50 data dengan nilai K=2 dan nilai E=2 dengan hasil akurasi mencapai 88%.
Kata kunci: identifikasi, gagal ginjal, NWKNN
Abstract
Kidney disease can be caused by several factors such as hypertension, uric acid levels, creatinine levels,
diabetes, and many others. From that factors, we know about the level of kidney disease risk. Some
people are unaware, lazy and indifferent about health, especially on kidney disease because of the long
process and complicated. According to the Indonesian Renal Registry, in 2014 patients with kidney
disease in Indonesia reach 12,770 inhabitants. Therefore, we need a system that can detect or identify
the kidney disease. In this research, we will identify the kidney disease using Neighbor Weighted K-
Nearest Neighbor (NWKNN) method. This method is similar to the KNN method but the differentiates
are in the weighting process in each identification class. Identification class in this study decided in two
part, ckd or exposed to kidney disease and notckd or not affected kidney disease. The results of this study
indicate that the NWKNN method can identify kidney disease when the data are 150 data and the test
data are 50 data with K = 2 and E = 2 and accuracy level is 88%.
Keywords: identification, kidney disease, NWKNN

darah, dan lain sebagainya (Cahyaningsih,


1. PENDAHULUAN 2011). Pada intinya, ginjal merupakan organ
Ginjalxxmerupakan dua buah organ yang sangat vital dan penting untuk menjaga
berbentuk sepertiikacang yang berada di bawah kesehatan tubuh pada manusia dan jika terjadi
tulang rusuk dengan panjang sekitar 11 cm, lebar penurunan fungsi ginjal maka dapat beresiko
6cm, tebal 3 cm, dan berat sekitar 150 g (Waugh, terjadinya penyakit ginjal (Cahyaningsih, 2011).
et al., 2011). Ginjal mempunyai fungsi untuk Penyakit ginjal atau yang biasa disebut gagal
menyaring atau membersihkan darah, mengatur ginjal adalah kelainan organ ginjal yang
atau mengeluarkan kelebihan cairan tubuh, diakibatkan oleh berbagai faktor, misal infeksi,
sebagai penyeimbang kadar kimia darah, tumor, kelainan bawaan, dan lain-lain
mengeluarkan hormon yang mengatur tekanan (Kementrian Kesehatan RI, 2013). Gagal ginjal

Fakultas Ilmu Komputer


Universitas Brawijaya 2562
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 2563

tersebut dapat mempengaruhi fungsi serta menggunakanxmetode Neighbor Weighted K-


struktur ginjal yang memiliki tingkat keparahan Nearest Neighbor (NWKNN). Penelitian
berbeda. Menurut Indonesian Renal Registry, menggunakan metode Neighbor Weighted K-
pada tahun 2014 pasien penyakit gagal ginjal di Nearest Neighbor (NWKNN) dengan dataayang
Indonesia mencapai 12.770 jiwa, dan yang tidak seimbang yang dilakukan oleh Arissaputra
terbanyak disebabkan karena hipertensi. Jika et al. (2015) mengenai klasifikasi dokumen
pasien sudah terdiagnosis gagal ginjal, maka tanaman obat memiliki nilai rata-rata f-measure
penanganannya adalah dengan cara melakukan sebesar 86,37% (Arissaputra, et al., 2015).
hemodialisis atau cuci darah secara berkala serta Pengaruh data latih tidak seimbang pada
bisa juga melakukan transplantasi ginjal untuk penelitian ini dapat mempengaruhi nilai akurasi.
menggantikan ginjal sebelumnya yang telah Hasilnya metode NWKNN lebih baik 6,7%
rusak atau tidak berfungsi. Tetapi hemodialisis daripada metode KNN. Penelitian berikutnya
dan transplantasi ginjal membutuhkan biaya mengenai metode Neighbor Weighted K-Nearest
yang tidak sedikit, sehingga diperlukan deteksi Neighbor (NWKNN) dengan data kelas tidak
atau pemeriksaan secara dini agar resiko seimbang dilakukan oleh Fadila et al. (2016).
terjadinya penyakit gagal ginjal dapat segera Hasil dari penelitian ini yakni sistem mampu
diatasi. melakukan klasifikasi terhadap anak usia dini
Terjadinya penyakit gagal ginjal dapat yang terserang penyakit Attention Deficit
disebabkan beberapa faktor yang diantaranya Hyperactivity Disorder. Keakuratan pada sistem
adalah hipertensi, kadar asam urat, kadar ini dapat mencapai 95% dan lebih baik 2%
kreatinin, diabetes, dan masih banyak yang daripada menggunakan metode KNN (Fadila, et
lainnya. Dari beberapa faktor tersebut, kita dapat al., 2016). Padaaapenelitian ini penulis
mengetahui tingkat resiko terjadinya penyakit menggunakan data penyakit gagal ginjal yang
gagal ginjal. Tetapi banyak yang tidak beberapaaakelas datanya tidak merata atau
menyadari, malas serta acuh mengenai seimbang, sehingga penulis menggunakan
pemeriksaan kesehatan terutama pada ginjal metode Neighbor Weighted K-Nearest Neighbor
karena proses yang rumit dan lama. Proses (NWKNN).
pemeriksaan kesehatan biasanya dari cek
laboratorium dan selanjutnya konsultasi dokter. 2. TINJAUAN PUSTAKA
Tetapi jarak dari lokasi laboratorium menuju
dokter spesialis atau sebaliknya biasanya cukup 2.1 Penyakit Ginjal
jauh dan terkadang konsultasi ke dokterispesialis Penyakit ginjal atau yang biasa disebut
harus diperlukan antre jadwal periksa,,sehingga gagal ginjal adalah kelainan organ ginjal yang
berakibat beberapa orang malas melakukan diakibatkan oleh berbagai faktor, misal infeksi,
pemeriksaan kesehatan tersebut. Jika beberapa tumor, kelainan bawaan, dan lain-lain
orang mengetahui bahwa mereka belum atau (Kementrian Kesehatan RI, 2013). Gagal ginjal
tidak terkena gagal ginjal, maka hal tersebut adalah salah satu penyakit mematikan dan
dapat dihindari dan tidak perlu dilakukan cuci penyebab kematian utama di dunia (Indra,
darah atau transplantasi ginjal (Maghfirah, et al., 2006). Ginjal yang sakit ditandai dengan
2014). Berdasar penjelasan tersebut maka pengeluaran kotaran atau racun dan pengaturan
dibutuhkan suatu sistem yang dapat melakukan air, keseimbangan asam-basa yang terganggu,
deteksi atau identifikasi mengenai penyakit tekanan darah tinggi, anemia dan sakit tulang
gagal ginjal. Salah satu cara yang dapat (Budiyanto, 2002). Penyakit pada ginjal yang
digunakan adalah dengan menggunakan berat dibagi dua jenis atau kategori yakni gagal
klasifikasi (Maghfirah, et al., 2014). Pada ginjallakut dan gagallginjal kronis. Gagallginjal
penelitian ini terdapat dua kelas dalam akut dapat ditandai dengan fungsi ginjal berhenti
melakukan identifikasi yakni mengalami gagal secara mendadak yang dapat terjadi pemulihan
ginjal dan tidak mengalami gagal ginjal. secara berangsur-angsur (Indra, 2006).
Terkadang pada klasifikasi terdapat data Sedangkan gagal ginjal kronis ditandai dengan
yang tidak merata atau data yang tidak hilangnya proses dari fungsi nefron secara
seimbang. Seperti data pada penelitian yang progresif sehingga penurunan fungsi ginjal
penulis gunakan yakni terdapat 43 data menurun secara bertahap.
mengalami gagal ginjal dan 107 data tidak
mengalami gagal ginjal. Salah satu pemecahan
terkait data yang tidak seimbang adalah

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 2564

2.2 Data Tidak Seimbang Euclidean Distance atau Cosine


Similiraty/CosSim).
Pada suatu penelitian, adanya suatu data
▪ Untuk menghitung nilai kedekatan
pada suatu kelas tidak sama, ada yang memiliki
ketetanggaan menggunakan rumus
jumlah data yang banyak dibanding kelas
Euclidean Distance dapat menggunakan
lainnya. Kondisi tersebut dapat dikatakan
Persamaann1:
sebagai kondisi data tidak seimbang. Data tidak
seimbang adalah kondisi dimana persebaran data 𝑑(𝑥1 , 𝑥2 ) = √∑𝑛𝑖=1(𝑥2𝑖 − 𝑥1𝑖 )2 (2)
tidak merata di dalam kelas yang ada. Pada data Dimana::
yang tidakiseimbang akan ada istilah yakni kelas X1 = nilaiitiap data latih
mayoritas dan kelasiminoritas (Ridok & Latifah, X2 = nilaiitiap data uji
2015). n = banyak dataa
i = dataike-i
2.3 Neighbor Weighted K-Nearest Neighbor ▪ Untuk menghitung nilai kedekatan
(NWKNN) ketetanggaan menggunakan rumus Cosine
Similarity (CosSim) seperti berikut:
Variabel atau atribut adalah bagian dari data ⃗⃗⃗⃗
𝑑 • 𝑞⃗ ∑𝑚
𝑖=1(𝑤𝑖𝑗 • 𝑤𝑖𝑞 )
yang mewakili karakteristik dari objek data. 𝐶𝑜𝑠𝑆𝑖𝑚(𝑞, 𝑑𝑗 ) = ⃗⃗⃗⃗⃗⃗⃗𝑗 ⃗⃗⃗⃗⃗
=
|𝑑𝑗 | • |𝑞| √∑𝑚
2 𝑚 2
𝑖=1 𝑤𝑖𝑗 • ∑𝑖=1 𝑤𝑖𝑞
Nilai ini biasanya memilikiirentang yang hampir
(3)
sama dan ada pula yang bervariasi. Misal atribut
Dimana:
A memiliki nilai rentang besar yakni 1000-2000
Q = data ujii
sedangkan atribut B bernilai hanya 1 atau 0,
dj = data latih
sehingga selisih jarak kedua atribut tersebut ⃗⃗⃗
𝑑𝑗 • 𝑞 = hasilltotal perkalian vektorrantara
tidak seimbang. Maka diperlukan normalisasi
untuk menjaga keseimbangan data. Salah satu data latihidengan data ujii
⃗⃗⃗⃗⃗⃗⃗ ⃗⃗⃗⃗⃗ = hasil total perkalian vektor
|𝑑𝑗 | • |𝑞|
teknik normalisasi data yakni normalisasi min-
max. Berikut merupakan rumus penggunaan antara norm dataalatih dengan data ujii
teknik normalisasi min-max (Jain & Bhandare, wij = bobot nilaiii pada data latihij
2011): wiq = bobot nilaiii pada data ujii
𝑉−𝑚𝑖𝑛𝐴 m = banyak jumlah nilaii
𝑉′ = (1)
𝑚𝑎𝑥𝐴 −𝑚𝑖𝑛𝐴
3. Mengurutkan hasillperhitungan kedekatan
Dimana:: ketetanggaan berdasarijarak atau kedekatan
𝑉′ = hasil perhitungan normalisasi min- dalam kelompok/similarity.
max 4. Mengumpulkan kategoriiklasifikasi nearest
V = nilaiiatribut A yang akan dinormalisasi neighbor.
minA = nilaiiminimum dari suatu atribut A 5. Perhitunganibobot dapattdilakukan dengan
maxA = nilaiimaksimum dariisuatu atribut A persamaan (Tan, 2005):
1
𝑊𝑒𝑖𝑔ℎ𝑡𝑖 = 1 (4)
2.4 Neighbor Weighted K-Nearest Neighbor 𝑒𝑥𝑝
𝑁𝑢𝑚(𝑐𝑑
𝑖)
(NWKNN) ( )
𝑁𝑢𝑚(𝑐𝑗𝑑 )|𝑛 = 1, … , 𝐾 ∗}
𝑀𝑖𝑛{

Metode NWKNN merupakan Dimana::


pengembangan metode KNN, perbedaan 𝑁𝑢𝑚(𝐶𝑖𝑑 ) = banyak data latih d padaikelas i
terdapat pada pemberian bobot yang dilakukan 𝑁𝑢𝑚(𝐶𝑗𝑑 ) = banyak data latih d padaikelas
algoritma NWKNN (Feizar, et al., 2014). Pada j, dimana j terdapat dalam himpunan k
tetanggaiyang berasal dari kelas mayoritas maka tetanggaiterdekat
diberi bobot yang kecil, sedangkan pada Exp =inilai exponen lebih dari 1
tetangga yang berasalldari kelas minoritas maka Setelah mendapat nilai bobot, maka
diberi bobot yang besar (Ridok & Latifah, 2015). menghitung nilai skor dengan cara
Persamaan matematika harus diberi nomor mengalikan setiap jumlah skor dari tiap
urut dalam kurung biasa dan harus diacu dalam kelasidengan masing-masing bobot dari
tulisan. tiap kelas. Perhitungannskor padaametode
Langkah-langkah pada algoritma NWKNN NWKNN adalah sebagai berikut:
adalah sebagai berikut (Fadila, et al., 2016): 𝑆𝑘𝑜𝑟(𝑋, 𝐶𝑖 ) = 𝑊𝑒𝑖𝑔ℎ𝑡𝑖 ∗
1. Menentukan nilai K tetangga.
(∑𝑑𝑗𝑁𝑊𝐾𝑁𝑁(𝑋)((√∑𝑛𝑖=1(𝑥2𝑖 − 𝑥1𝑖 )2 ) ∗
2. Menghitung nilai kedekatan ketetanggaan
𝛿(𝑑𝑗 , 𝐶𝑖 ))) (5)
antara dataiuji dan data latih (menggunakan
atauu
Fakultas Ilmu Komputer, Universitas Brawijaya
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 2565

𝑆𝑘𝑜𝑟(𝑋, 𝐶𝑖 ) = 𝑊𝑒𝑖𝑔ℎ𝑡𝑖 ∗
(∑𝑑𝑗𝑁𝑊𝐾𝑁𝑁(𝑋)((𝑆𝑖𝑚(𝑞, 𝑑𝑗 ) ∗ 𝛿(𝑑𝑗 , 𝐶𝑖 ))) (6) Gambar 1 menunjukkan proses pada
Dimana: metode NWKNN yakni Melakukan perhitungan
Weighti = bobot kelas i nilai ketetanggaan menggunakan Cosine
djNWKNN(x) = data latih dj pada kumpulan Similarity (CosSim) dan didapatkan hasil nilai
tetangga terdekat dari data uji x kedekatan ketetanggaan, melakukan pengukuran
𝛿(𝑑𝑗 , 𝐶𝑖 ) = akan bernilai 1 jika jarak ∈ hasil kedekatan ketetanggan melakukan
Ci dan bernilai 0 jika nilai jarak ∉ Ci perhitungan pembobotan setiap kelas, dan
Sim(q,dj) = nilai CosSim antara data uji melakukan perhitungan nilai skor.
dan data latih. Proses yang pertama yakni menghitung
Ci = jenis atau kelas i tetangga terdekat menggunakan Cosine
Similarity untuk mengetahui data mana yang
3. METODOLOGI masuk klasifikasi kelas yang dicari. Kedua yakni
mengurutkan hasil Cosine Similarity sesuai dari
3.1 Data Penelitian yang terbesar ke terkecil. Ketiga yakni proses
pembobotan setiap kelas dari gagal ginjal, pada
Pada penelitian ini menggunakan data dari
proses ini berfungsi untuk memberikan bobot
UCI Machine Learning Repository: Chronic
pada setiap kelas dengan bobot besar diberikan
Kidney Disease. Pada data tersebut terdapat
pada kelas dengan jumlah sedikit dan bobot kecil
sebanyak 200 data dengan 24 atribut yakni
diberikan pada kelas dengan jumlah banyak.
meliputi age, blood pressure, specific gravity, Terakhir yakni proses perhitungan nilai skor
albumin, sugar, red blood cells, pus cell, pus cell
hasil identifikasi, proses ini berfungsi untuk
clumps, bacteria, blood glucose random, blood
mengetahui hasil identifikasi dari dari penyakit
urea, serum creatinine, sodium, potassium,
gagal ginjal.
hemoglobin, packed cell volume, white blood
cell count, red blood cell count, hypertension, 4. PENGUJIAN DAN ANALISIS
diabetes mellitus, coronary artery disease,
appetite, pedal edema, dan anemia. Pada data 4.1 Pengujian Nilai K dan Nilai E
yang akan di ujikan terdapat missing value yang
mana nilai dari data missing tersebut sudah dicari Pada pengujian ini dilakukan dengan
menggunakan perhitungan manual. mengubah nilai K mulai dari 2 hingga 28, nilai E
(eksponen) yang digunakan yakni 2, 4, 6 dan 8
3.2 Alur NWKNN serta data uji yang digunakan sebanyak 50 data.
Pada penelitian ini terdapat 2 macam kelas
Proses NWKNN identifikasi yakni CKD atau terkena gagal ginjal
dan NOTCKD atau tidak terkena gagal ginjal
yang mana jumlah datanya tidak seimbang atau
terdapat kelas mayoritas dan minoritas. Pada
pengujian ini komposisi data latih yang
digunakan sebanyak 3 kali dengan terdapat kelas
mayoritas dan minoritas untuk mendapatkan
data mana yang memiliki akurasi tertinggi.
Komposisi data latih yang digunakan adalah
sebagai berikut:
- 150 data latih (CKD sebanyak 43 dan
NOTCKD sebanyak 107),
- 125 data latih (CKD sebanyak 33 dan
NOTCKD sebanyak 92),
- 100 data latih (CKD sebanyak 23 dan kelas
NOTCKD sebanyak 77)
Pada pengujian nilai K dan nilai E ini
dilakukan 4 kali skenario dengan skenario
pertama yakni nilai K diubah dari 2 hingga 28,
nilai E=2 dan menggunakan semua komposisi
data latih yakni 150, 125 dan 100 data.
Gambar 1. Proses NWKNN Kemudian untuk skenario kedua, ketiga dan
Fakultas Ilmu Komputer, Universitas Brawijaya
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 2566

keempat yang berbeda adalah nilai E, skenario


kedua menggunakan nilai E=4, skenario ketiga Pengujian nilai K bervariasi dan
nilai E=6 dan skenario keempat nilai E=8. Hasil 100% nilai E=8
grafik pengujian nilai K dan nilai E ditunjukkan 80%
pada Gambar 2, Gambar 3, Gambar 4 dan

Akurasi
Gambar 5. 60%
40%

Pengujian nilai K bervariasi dan nilai 20%


100% E=2 0%
2 4 6 9 13 17 20 23 27
80%
K
150 data 125 data 100 data
Akurasi

60%

40%
Gambar 5. Grafik pengujian nilai K bervariasi dan
20% nilai E=8
0% Berdasar pada semua grafik, semakin besar
2 4 6 9 13 17 20 23 27 nilai K pada semua komposisi data latih maka
K nilai akurasi semakin menurun. Hal ini
150 data 125 data 100 data
dikarenakan hasil identifikasi kelas pada sistem
memiliki perbedaan dengan kelas awal. Hasil
Gambar 2. Grafik pengujian nilai K bervariasi dan
nilai E=2
identifikasi kelas yang berbeda ini terus
bertambah seiring bertambahnya nilai K yang
menjadikan tingkat akurasi semakin menurun.
Pengujian nilai K bervariasi dan nilai
Kemudian komposisi data latih dengan 150 data
100% E=4
memiliki nilai akurasi tertinggi dibandingkan
80% komposisi data latih yang lain dikarenakan
semakinnbanyak data latih yang digunakan,
Akurasi

60% maka semakinibanyak data yang dibandingkann


40% denganidata uji dan memungkinkanxuntuk
memperoleh hasil CosSimxyang mempunyai
20%
similarity terbaik.
0%
Dari semua skenario pengujian, maka
2 4 6 9 13 17 20 23 27
diperoleh hasil gabungan pengujian pengaruh
150 data K
125 data 100 data nilai E terhadap akurasi dengan menggunakan
kombinasi data latih terbaik yakni 150 data.
Gambar 3. Grafik pengujian nilai K bervariasi dan Hasil gabungan pengujian pengaruh nilai E
nilai E=4 terhadap akurasi dapat dilihat pada Gambar 6.

Pengujian nilai K bervariasi dan nilai Pengujian Nilai E


100%
E=6 100%

80% 80%
Akurasi
Akurasi

60% 60%

40% 40%

20% 20%

0% 0%
2 4 6 9 13 17 20 23 27 2 4 6 9 13 17 20 23 27
K E=2 E=4
Nilai KE=6 E=8
150 data 125 data 100 data

Gambar 4. Grafik pengujian nilai K bervariasi dan Gambar 6. Grafik pengujian nilai E
nilai E=6

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 2567

Grafik pengujian nilai E menunjukkan NWKNN dengan menggunakan CosSim


bahwa dengan semua nilai E pada nilai K=2, 3, memiliki rata-rata nilai akurasi lebih baik 8%
4 dan 6 memiliki nilai akurasi yang sama dibandingkan menggunakan Euclidean
bagusnya yakni 88% pada K=2, 86% pada K=3, Distance. Ketika nilai K<=4, nilai akurasi
4 dan 6, sedangkan untuk nilai K=5 dan K>6 Euclidean Distance dan CosSim sama dan
memiliki nilai akurasi yang bervariasi dengan terlihat bagus hasilnya ketika nilai K kecil.
nilai E=2 terlihat unggul nilai akurasinya dari Tetapi ketika nilai K>4 maka perbandingan nilai
pada nilai E yang lain. Pada pengujian yang akurasinya mulai terlihat. Meskipun nilai akurasi
menggunakan data penyakit ginjal ini terlihat sama-sama turun ketika nilai K>4, tetapi CosSim
bahwa adanya perbedaan nilai akurasi dari cukup baik dan konsisten dari pada Euclidean
perubahan nilai E. Nilai E tersebut terdapat pada Distance ketika nilai K semakin besar. Ini
perhitungan bobot setiap kelas, ketika nilai E menunjukkan bahwa perbandingan dari
diubah maka hasil dari bobot setiap kelas Euclidean Distance dan CosSim memiliki
tersebut juga berubah. Hal ini menunjukkan pengaruh terhadap hasil akurasi ketika nilai K
bahwa perubahan nilai E serta nilai K yang semakin besar pada identifikasi gagal ginjal pada
digunakan pada penelitian ini memberikan sistem.
pengaruh terhadap hasil akurasi pada sistem
identifikasi penyakit gagal ginjal. Semakin besar 4.3 Pengujian perbandingan akurasi metode
nilai K pada semua nilai E, maka semakin turun NWKNN dan KNN
pula tingkat akurasinya. Pengujian perbandingan akurasi metode
NWKNN dengan KNN dilakukan untuk
4.2 Pengujian perbandingan akurasi metode
mengetahui bagaimana nilai akurasi pada sistem
NWKNN berdasarkan metode
identifikasi penyakit gagal ginjal ketika
pengukuran jarak
menggunakan metode NWKNN dan KNN.
Pengujian perbandingan akurasi metode Pengujian ini dilakukan dengan menggunakan
NWKNN berdasarkan metode pengukuran jarak data latih sebanyak 150, data uji 50, nilai K yang
menggunakan Euclidean Distance atau CosSim bervariasi mulai dari 2 hingga 28 dan kedekatan
dilakukan untuk mengetahui bagaimana nilai ketetanggaan menggunakan CosSim. Hasil
akurasi pada sistem identifikasi penyakit gagal pengujian perbandingan akurasi metode
ginjal ketika perhitungan ketetanggaan terdekat NWKNN dan KNN ditunjukkan pada Gambar 8.
pada NWKNN menggunakan Euclidean
Distance atau CosSim. Pengujian ini dilakukan Perbandingan Akurasi NWKNN dan
dengan menggunakan data latih sebanyak 150, KNN
data uji 50, nilai K yang bervariasi mulai dari 2
hingga 28, dan nilai E yang digunakan adalah 100%
nilai terbaik pada pengujian nilai E yakni 80%
bernilai 2. Hasil pengujian perbandingan akurasi 60%
NWKNN berdasarkan metode pengukuran jarak
40%
ditunjukkan pada Gambar 7.
20%
0%
Perbandingan Akurasi NWKNN
2 4 6 9 13 17 20 23 27
berdasarkan metode pengukkuran
jarak NWKNN KNN
100%
Gambar 8. Grafik hasil perbandingan akurasi
50%
NWKNN dan KNN
Perbandingan antara metode NWKNN dan
0% KNN pada pengujian ini memberikan hasil
2 4 6 9 13 17 20 23 27 bahwa metode NWKNN di beberapa nilai K
lebih unggul dibandingkan metode KNN. Ketika
Euclidean Distance CosSim
nilai K 2, 3, 4, dan 6 nilai akurasi metode
NWKNN sama dengan metode KNN, tetapi
Gambar 7. Grafik pengujian perbandingan akurasi untuk nilai K yang lain metode NWKNN lebih
NWKNN berdasarkan metode pengukuran jarak

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 2568

unggul dibandingkan dengan metode KNN. Budiyanto, M. A. K., 2002. Gizi dan Kesehatan
Perbedaan nilai akurasi ini bisa saja terjadi (Relevensi Gizi dengan Obesitas,
karena metode NWKNN menggunakan bobot Penyakit Ginjal, Penyakit Jantung,
saat perhitungan skor, proses pembobotan ini Diabetes Mellitus, Hipertensi, Kanker,
dapat membantu identifikasi kelas yang berasal Osteoporosis, Penyakit Saluran
dari kelas minoritas pada data. Oleh karena itu, Cerna, Anemia, dan Penyakit pada
dapat dikatakan pada kasus identifikasi penyakit Bayi dan Anak). Malang: Bayu Media
gagal ginjal dengan data yang tidak seimbang ini dan UMM Press.
lebih baik menggunakan metode NWKNN
Cahyaningsih, N. D., 2011. Hemodialisis (Cuci
dibandingkan metode KNN dengan hasil metode
Darah). Yogyakarta: Mitra Cendikia
NWKNN lebih baik 5% rata-rata hasil
Press.
akurasinya.
Fadila, P. N., Indriati & Ratnawati, D. E., 2016.
5. KESIMPULAN Identifikasi Jenis Attention Deficit
Hyperactivity Disorder (ADHD) Pada
Cara mengidentifikasi gagal ginjal dengan
Anak Usia Dini Menggunakan Metode
menggunakan metode NWKNN adalah dengan
Neighbor Weighted K-Nearest
cara memasukkan data pasien yang meliputi 24
Neighbor (NWKNN). Malang: s.n.
gejala kemudian dilakukan normalisasi data
menggunakan min-max (karena data memiliki Feizar, F. H., Indriati & Yusdistira, N., 2014.
selisih nilai yang besar). Selanjutnya Analisis Sentimen Opini Film
menghitung nilai kedekatan ketetanggaan Berbahasa Indonesia Berbasis Kamus
dengan menggunakan Cosine Similarity Menggunakan Metode Neighbor
(CosSim) dengan menghitung nilai similarity Weighted K-Nearest Neighbor.
antara data pasien terhadap data latih. Kemudian Malang: s.n.
diurutkan berdasar nilai CosSim terbesar sesuai
Indra, M. R., 2006. Fisiologi Ginjal. Malang:
K tetangga terdekat. Selanjutnya dilakukan
Fakultas Kedokteran Universitas
pembobotan sesuai kelas identifikasinya dan
Brawijaya.
dihitung nilai skornya. Skor tertinggilah yang
masuk kedalam identifikasi. Jain, Y. K. & Bhandare, S. K., 2011. Min Max
Normalization Based Data
Pada pengujian parameter identifikasi
Perturbation Method for Privacy
penyakit gagal ginjal menggunakan metode
Protection. International Journal of
NWKNN ini, nilai K yang digunakan adalah
Computer & Communication
bernilai 2 hingga 28, nilai E yang digunakan
Technology, II(8), pp. 45-50.
bernilai 2, 4, 6 dan 8, serta data latih yang
digunakan adalah 150 data, 125 data dan 100 Kementrian Kesehatan RI, 2013. Riset
data. Nilai akurasi tertinggi yang didapatkan Kesehatan Dasar 2013. [Online]
yakni sebesar 88% pada nilai K=2, dengan Available at: http://www.depkes.go.id/
semua nilai E serta pada data latih sebanyak 150 resources/download/general/Hasil%20
data. Tetapi pada penelitian ini untuk nilai E Riskesdas%202013.pdf
yang terbaik adalah E dengan nilai 2. [Accessed 27 Januari 2017].
Diketahui bahwa tingkat akurasi yang Maghfirah, N., Dewi, C. & Hidayat, N., 2014.
dihasilkan metode NWKNN memiliki selisih Implementasi Algoritma Fuzzy K-
nilai sebesar 5% dibandingkan metode KNN. Nearest Neighbor (F-KNN) untuk
Metode NWKNN memiliki akurasi sebesar Mengetahui Tingkat Resiko Penyakit
70%, sedangkan metode KNN menghasilkan Gagal Ginjal. Doro: Repository Jurnal
akurasi sebesar 65%. Mahasiswa Ptiik Universitas
Brawijaya, Volume 9.
6. DAFTAR PUSTAKA
Ridok, A. & Latifah, R., 2015. Klasifikasi Teks
Arissaputra, V., Ridok, A. & Indriati, 2015. Bahasa Indonesia Pada Corpus Tak
Klasifikasi Dokumen Tanaman Obat Seimbang Menggunakan NWKNN.
Menggunakan Metode Neighbor Konfrensi Nasilnal Sistem &
Weighted K-Nearest Neighbor Informatika, pp. 222-227.
(NWKNN). Malang: s.n.

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 2569

Tan, S., 2005. Neighbor-weighted K-nearest Waugh, A., Grant, A., Nurachmah, E. &
neighbor for unbalanced text corpus. Angriani, R., 2011. Dasar-Dasar
Expert Systems with Applications, pp. Anatomi dan Fisiologi. Singapore:
667-671. Elsevier.

Fakultas Ilmu Komputer, Universitas Brawijaya

View publication stats

Anda mungkin juga menyukai