Anda di halaman 1dari 7

TEKNIK INTERPOLASI UNTUK MENINGKATKAN ALGORITMA C4.

5 GUNA
MEMPREDIKSI PENYAKIT HEPATITIS

Zahro Saleh Artasya1 , Maylina Shafira Putri2 , Zainal Abidin3


zainal.frsd@yahoo.co.id
Teknik Informatika, Sekolah Tinggi Teknik Pati
Jl. Raya Pati – Trangkil Km.4,5 Ngepungrojo, Kec. Pati, Kab.Pati, Jawa Tengah
59119, Indonesia. Telp.0295382470. Email : sttpati@yahoo.com

Abstrak
Hepatitis adalah suatu peradangan hati yang antara lain dapat disebabkan oleh virus
hepatitis B dan C. Infeksi virus ini dapat mengakibatkan penyakit infeksi pada hati
yang berpotensial fatal dan merupakan salah satu penyakit yang sering ditemukan dan
menular. Pada penelitian sebelumnya dilakukan pengoptimasian Algoritma C4.5 menggunakan
Algoritma Genetika dengan hasil tingkat akurasinya sebesar 89.71 %. Tujuan dari penelitian ini
adalah untuk meningkatkan tingkat akurasi Algoritma C4.5 dengan cara menambah data record
dari yang sebelumnya sebanyak 155 data menjadi 556 data. Hasil dari penelitian ini adalah
peningkatan nilai akurasi dari penelitian sebelumnya sebanyak 10.11 % dari 89.71 % menjadi
99.82 %.
Kata Kunci : Sistem Pendukung Keputusan, Hepatitis, Algoritma C4.5
Abstract
Hepatitis is an inflammation of the liver which, among other things, can be caused by the
hepatitis B and C viruses. This viral infection can cause an infectious disease of the liver which
is potentially fatal and is one of the most common and infectious diseases. In the previous
research, the optimization of the C4.5 Algorithm was carried out using a Genetic Algorithm with
an accuracy rate of 89.71%. The purpose of this study is to increase the accuracy of the C4.5
Algorithm by adding data records from the previous 155 data to 556 data. The result of this
study is an increase in the value of the previous research as much as 10.11% from 89.71% to
99.82%.
Keywords: Decision Support System, Hepatitis, C4.5 Algorithm
sebanyak 1,5 juta penduduk dunia
meninggal karena Hepatitis. Pada negara
I. Pendahuluan
South East Asian Region (SEAR) Indonesia
I.1. Latar Belakang
termasuk dalam kategori negara terbesar
Penyakit Hepatitis merupakan kedua setelah Myanmar dengan endemisitas
masalah kesehatan masyarakat di seluruh tinggi hepatitis B [1].
dunia termasuk Indonesia. Setiap tahunnya
Istilah “Hepatitis” dipakai untuk Tujuan penelitian ini adalah untuk
semua jenis peradangan pada sel-sel hati, menunjukan pemanfaatan Sistem Pendukung
yang bisa disebabkan oleh infeksi (virus, Keputusan dalam memprediksi Penyakit
bakteri, parasit), obat-obatan (termasuk obat Hepatitis menggunakan Algoritma C4.5.
tradisional), konsumsi alkohol, lemak yang
1.4. Manfaat Penelitian
berlebih dan penyakit autoimmune. Ada 5
jenis Hepatitis Virus yaitu Hepatitis A, B, C, Beberapa manfaat yang dapat di
D, dan E. Antara Hepatitis yang satu dengan peroleh dari penelitian ini antara lain:
yang lain tidak saling berhubungan.
Hepatitis virus merupakan sebuah fenomena 1. Untuk menginformasikan kepada
gunung es, dimana penderita yang tercatat masyarakat bahaya penyakit
atau yang datang ke layanan kesehatan lebih Hepatitis.
sedikit dari jumlah penderita sesungguhnya. 2. Untuk membantu para ahli kesehatan
Mengingat penyakit ini adalah penyakit dalam menentukan prediksi penyakit
kronis yang menahun, dimana pada saat Hepatitis dengan akurasi yang tepat.
orang tersebut telah terinfeksi, kondisi masih 3. Untuk membantu para dokter dalam
sehat dan belum menunjukkan gejala dan memberikan saran yang tepat bagi
tanda yang khas, tetapi penularannya terus para pasien.
berjalan [2].
Hepatitis adalah suatu peradangan II. Landasan Teori
hati yang antara lain dapat disebabkan
oleh virus hepatitis B (VHB). Infeksi 2.1 Definisi Algoritma C4.5
virus ini dapat mengakibatkan penyakit Algoritma C4.5 adalah program yang
infeksi pada hati yang berpotensial fatal memberi kontribusi satu set data berlabel
dan merupakan salah satu penyakit yang dan menghasilkan pohon
sering ditemukan dan menular [3]. keputusan sebagai keluaran. Pohon
Menurut Prasetyo (Septiani, 2014) saat ini keputusan tindak lanjut ini kemudian
dalam dunia kesehatan, rekam medis telah diverifikasi terhadap data uji berlabel
menyimpan gejala-gejala penyakit pasien yang tidak terlihat untuk menghitung
dan diagnosis penyakitnya. Hal seperti ini generalisasinya. C4.5 adalah program yang
tentu sangat berguna bagi para ahli digunakan untuk menghasilkan peraturan
kesehatan untuk dapat dijadikan sebagai taksonomi dengan menggunakan pohon
bantuan dalam mengambil keputusan keputusan dari sekumpulan data yang
terhadap diagnosis penyakit pasien [4]. diberikan. Algoritma C4.5 merupakan
perpanjangan dari algoritma ID3 dasar dan
I.2. Rumusan Masalah dirancang oleh Quinlan. C4.5 adalah salah
Sistem Pendukung Keputusan untuk prediksi satu algoritma pembelajaran yang banyak
penyakit Hepatitis menggunakan Algoritma digunakan. Algoritma C4.5 membangun
C4.5. pohon keputusan dari serangkaian data
pelatihan yang mirip dengan Algoritma ID3,
dengan menggunakan konsep entropi
I.3. Tujuan penelitian informasi. C4.5 juga dikenal sebagai
klasifikasi statistik [11].
2.2 Definisi Keputusan informasi yang lengkap sehingga masih
Keputusan merupakan proses memerlikan pertimbangan-pertimbangan
pemilihan alternatif tindakan untuk manusia [5].
mencapai tujuan atau sasaran tertentu.
Pengambilan keputusan dilakukan dengan
Sistem Pendukung Keputusan (SPK)
pendekatan sistematik terhadap
adalah untuk mengotomatisasikan
permasalahan melalui proses pengumpulan
pengambilan keputusan, tetapi memberikan
data informasi serta ditambah dengan
perangkat interaktif yang memungkinkan
faktorfaktor yang perlu dipertimbangkan
pengambilan keputusan untuk melakukan
dalam pengambilan keputusan[5].
berbagai analisis menggunakan modelmodel
yang tersedia [5].
Keputusan merupakan aktifitas
2.4. Definisi Hepatitis
utama manajemen yang sangat menentukan
keberadaan suatu organisasi. Kesalahan Hepatitis adalah keadaan radang atau
dalam pengambilan keputusan dapat cedera pada hati, sebagaireaksi terhadap
berakibat fatal terhadap suatu virus, obat atau alkohol [6].
organisasi. Karena aktifitas ini sangat
penting, maka para ahli manajemen Hepatitis adalah infeksi sistemik oleh
senantiasa mencari sistem, metode dan virus disertai nekrosis dan klinis, biokimia
teknologi yang dapat membantu dalam serta seluler yang khas. Hepatitis B adalah
pengambilan keputusan tersebut [5]. peradangan pada hati yang disebabkan oleh
virus B [6].
Sedangkan menurut Smeltzer dan
Bare (2002) Hepatitis B adalah radang atau
Keputusan merupakan proses cidera pada hati yang disebabkan oleh virus
kesadaran manusia terhadap fenomena B. Hepatitis B adalah suatu penyakit hati
individual maupun soial berdasarkan yang disebabkan oleh virus hepatitis B, yaitu
kejadian faktual dan nilai pemikiran, yang suatu virus yang dapat menyebabkan
mencakup aktivitas perilaku pemilihan satu peradangan hati akut atau menahun yang
atau beberapa alternatif, sebagai jalan keluar dapat berlanjut menjadi sirosis hati atau
untuk memecahkan masalah yang dihadapi kanker hati [6].
[5].
2.5. Definisi Interpolasi Data
2.3. Definisi Sistem Pendukung
Keputusan Interpolasi adalah proses “menebak”
Sistem Pendukung Keputusan (SPK) nilai data dengan memperhatikan data lain
adalah sebuah sistem informasi bebasis yang dimiliki. Interpolasi merupakan teknik
komputer yang berfungsi memandu pembuat untuk mencari nilai suatu variabel yang
keputusan para manajer pada sebuah entitas hilang pada rentang data yang diketahui.
(bias berupa perusahaan, organisasi dan Data lain yang dimiliki seringkali memiliki
instansi pemerintah). SPK membantu sejumlah pola. Pola yang terbentuk dapat
manajemen dalam mengambil keputusan berupa polinomial atau mengelompok. Tiap
yang tidak dapat dipecahkan dengan pola akan memiliki metode pendekatan yang
berbeda-beda. Terdapat kemungkinan tak
terbatas dari pola data tersebut [7].
2.6. Jurnal Sebelumnya
Pada jurnal sebelumnya yang
berjudul “Optimasi Algoritma C4.5
Menggunakan Algoritma Genetika untuk
Prediksi Penyakit Hepatitis” dalam jurnal ini Gambar 1 Rancangan Penelitian
menggunakan Algoritma genetika yang
bertujuan untuk meningkatkan tingat akurasi Penelitian dilakukan dengan cara
dengan data yang digunakan sebanyak 155 melakukan pengujian pada system
record dan 18 atribut. Hasil dari jurnal ini penunjang keputusan untuk prediksi pasien
adalah peningkatan jumalah akurasi sebesar penyakit hepatitis menggunakan metode
12.42 % dari 77.29 % menjadi 89.71 % [8]. klasifikasi yaitu Algoritma C4.5.
Algoritma C4.5 menggunakan
III. Bahan dan Metode konsep information gain atau entropy
reduction untuk memilih pembagian yang
Pada jurnal sebelumnya dilakukan optimal [9].
pengoptimasian algoritma C4.5
menggunakan algoritma genetika untuk 1. Pengumpulan Data
meningkatkan tingkat akurasi [8]. Data sekunder berupa data penyakit
Hepatitis yang didapat dari Machine
Untuk menyelesaikan penelitian perlu Learning Repository UCI
dibuat rancangan penelitian yang berguna (Universitas California Invene) .
sebagai pedoman atau acuan penelitian. 2. Pengolahan Data
Rancangan penelitian sebabai berikut: Pada tahap pengolahan data awal
dilakukan:
Start  Data Validation, yaitu data
diolah untuk memisahkan
data ganjil yang tidak
diperlukan.
Pengumpulan data
 Data integration and
transmormation, untuk
meningkatkan akurasi dan
Pengolahan Data
efisiensi algoritma.
 Memilah data untuk
memperoleh atribut yang
Teknik interpolasi
lebih ringkas namun
bersifat informative.
Metode Yang Digunakan
3. Teknik Interpolasi

Validasi

Hasil
End

PROT (protein urine) dan label (attribute


hasil prediksi).
4. Metode yang Digunakan
Metode yang digunaakan dalam
penelitian ini adalah metode klasifikasi
algoritma C4.5. Dilakukan perhitungan
Gambar 2 data hepatitis manual menggunakan Excel dan dilakukan
Pada gambar 2 diatas menunjukan pengujian model menggunakan tool agar
data yang masih memiliki missing value. dapat mengetahui tingkat akurasi nilai yang
Jumlah missing value dalam data ini didapatkan, apakah ada kenaikan nilai dari
sebanyak 10 data, untuk memperbaiki hasil penelitian sebelumnya atau sama.
missing value digunakan perhitungan
dengan teknik interpolasi data yaitu dengan Data
mencari nilai suatu variable dengan rentan
data yang diketahui dengan persamaan linear
Metode: Algoritma
[7]. C4.5
Perhitungan ini menggunakan rumus :
x− x 1 y− y 1 Pengujian Data
=
x 2−x 1 y 2− y 1
Ket:
Hasil: Peningkatan Nilai
x = data yang masih mengalami missing Akurasi
value
y = data yang telah diketahui IV. Hasil dan Pembahasan
x1 = data yang telah diketahui Dalam peneitian ini menggunakan
metode klasifikasi algoritma C4.5, untuk
x2 = data yang telah diketahui
pengujian pengolahan data mengguanakan
y1 = data yang telah diketahui bantuan tool. Data yang digunakan berupa
data Excel sebanyak 556 data dengan 12
y2 = data yang telah diketahui
atribut yang kemudian dimasukkan kedalam
Setelah melalui tahap penghitungan tool tersebut.
missing value kemudian data yang
Setelah data diproses maka akan
berjumlah 556 record pasien diproses dalam
mengeluarkan hasil berupa 2 buah label
pengolahan awal dengan jumlah attribute 12
yaitu blood donor dan hepatitis. Seperti yang
yaitu Age, Sex, ALB (Asam Lemak Bebas),
kita ketahui donor darah dapat
ALP ( Alkaline Phosphatase), ALT (Alanine
mendatangkan banyak manfaat, tak hanya
Transminase), AST(Aspartate Transminase),
bagi penerima donor, melainkan juga bagi
BIL (Bilirubin), CHE (Cholinesterase),
sang pendonor. Salah satu manfaat donor
CHOL (Cholelithiasis), CREA (Creatinin),
darah yang sayang untuk dilewatkan adalah
GGT (Gamma Glutamyl Transferase),
dapat mendeteksi penyakit serius, seperti
hepatitis C [10]. Yang dimaksud dengan mengalami peningkatan tingkat nilai akurasi
label pertama yaitu blood donor disini sebesar 10.11 % dari 89.71 % menjadi 99.82
adalah pasien yang mempunyai darah % dengan menambahkan jumlah data
normal yang tidak mengidap penyakit record.
sedangkan label yang kedua yaitu hepatitis
yang berarti pasien mengidap penyakit
hepatitis. DAFTAR PUSTAKA
Setelah mengetahui label kemudian data [1] Buani, D. C. P. (2018). Prediksi
dimasukkan kembali ke dalam tool untuk Penyakit Hepatitis Menggunakan
mengetahui tingkat nilai akurasi. Algoritma Naive Bayes Dengan Seleksi
Fitur Algoritma Genetika. Jurnal
Evolusi, 6(2),1–5.
Tabel 1 Tabel Akurasi Algoritma C4.5 [2] Kementrian Kesehatan RI : 2014.
(n.d.).Daftar Pustaka 1 infodatin-
TRUE TRUE CLASS
BLOOD HEPATITIS PRECISION
Berdasarkan data yang ada di Tabel 1 DONOR
dapat diambil kesimpulan bahwa dari 556 Pred blood donor 532 1 99.81%
Pred hepatitis 0 23 100.00%
data diperoleh prekdisi class YA “23” Class recall 100.00% 95.83%
kemudian class TIDAK “532” dan ada “1” Accuracy 99.82%
data yang terdeteksi pada dua class, jumlah hepatitis.pdf. https://doi.org/24427659
benar positif 0 = blood donor (TP) sebanyak [3] Kajian Pustaka. (n.d). Bab Kajian
532 data, hasil prediksi menggunakan Pustaka, 1-44.
algoritma C4.5 memperoleh tingkat akurasi [4] Septiani, W. D. (2014). Penerapan
99.82 %. Terjadi peningkatan nilai akurasi Algoritma C4.5Untuk Prediksi Penyakit
dari penelitian sebelumnya sebanyak 10.11 Hepatitis. Techno Nusa Mandiri, 11(1),
% dari 89.71 % menjadi 99.82 %. Dengan 69–78.
menggunakan algoritma C4.5 dan fitur https://doi.org/10.33480/techno.v11i1.1
seleksi teknik interpolasi. 72
Perhitungan tingkat akurasi [5] Puspitorini, S. dkk. (2020). Pohon
Keputusan Dengan Algoritma C.45
Untuk Penentuan Tingkat Resiko
Penyakit Gerd, 13 (1), 96 – 102.

V. Penutup [6] Fridayanthie, E. W. (2015). Analisa Data


Mining Untuk Prediksi Penyakit
A. Kesimpulan Hepatitis Dengan Menggunakan Metode
Naive Bayes Dan Support Vector
Pada penelitian sebelumnya diperoleh
Machine, 3 (1), 1 – 12.
jumlah peningkatan nilai akurasi sebesar
[7] Rosidi, M. (2019). “Metode Numerik
89.71 % karena dilakukan optimasi pada
Menggunakan R Untuk Teknik
algoritma C4.5 menggunakan algoritma
Lingkungan”,https://bookdown.org/m
genetika. Penelitian ini menggunakan
oh_rosidi2610/Metode_Numerik/,
algoritma C4.5 dengan metode klasifikasi
diakses pada 20 Mei 2021 pukul
10.00.
[8] Septiani, W. D. (2020). Optimasi
Algoritma C4.5 Menggunakan
Algoritma Genetika untuk Prediksi
Penyakit Hepatitis. PPPM Nusa Mandiri,
15 (1), 59–64.
https://doi.org/10.33480/inti.v15i1.1421
[9] Larose, D. T. (2005). Discovering
Knowledge in Databases. New Jersey:
John Willey & Sons Inc.
[10] halodoc.com: 2021.”dr. Fadli Rizal
Makarim.donor darah bisa mendeteksi
hepatitis C”,
https://www.halodoc.com/artikel/dono
r-darah-bisa-mendeteksi-hepatitis-c,
diakses pada 20 Mei 2021 pukul
10.00.
[11] Manikantan, V and S. Latha. 2013.
Predicting The Analysis of Heart
Disease Symptoms Using Medicinal
Data Mining Methods. International
Journal on Advanced Computer
Theory and Engineering (IJACTE).
Vol.2, Issue-2, ISSN: 2319-2526. 5-
10.

Anda mungkin juga menyukai