accepted on 29-06-2021
Abstract
Penyakit hepatitis adalah salah satu ancaman kesehatan utama di dunia. Hepatitis merupakan peradangan pada hati yang
biasanya disebabkan oleh virus hepatitis. Berdasarkan hasil riset kesehatan dasar kementerian RI tahun 2014, diperkirakan
10 dari 100 orang Indonesia terinfeksi hepatitis. Menurut Direktur Jenderal Badan Organisasi Kesehatan Dunia (WHO),
Tedros Adhanom Ghebreyesus hanya ada 1 dari 10 orang yang pernah melakukan tes hepatitis dan hanya 1 dari 5 orang
yang mendapatkan pengobatan hepatitis yang tepat dimana hepatitis A justru lebih sering menyerang anak-anak, terutama
yang tinggal di area dengan sanitasi rendah. Penelitian bertujuan untuk membangun sistem aplikasi berbasis komputer
dalam menentukan klasifikasi diagnosis penyakit hepatitis dengan metode CART. Data yang digunakan merupakan data
dua tahun terakhir dari RSUD Sei Bahar yaitu sebanyak 240 data. Prinsip dari metode CART adalah memilah seluruh
amatan menjadi dua gugus amatan dan memilah kembali gugus amatan tersebut menjadi dua gugus amatan berikutnya.
Hasil klasifikasi menggunakan metode CART sebagai pengetahuan menentukan penyakit hepatitis. Dengan menggunakan
35 data uji, dan analisis rekomendasi dari pakar, didapatkan bahwa metode CART dapat digunakan sebagai metode
pengklasifikasian pada penyakit hepatitis dengan tingkat akurasinya sebesar 94%.
Keywords: : CART, Data Mining, Diagnosis Penyakit, Penyakit Hepatitis, Sistem Pakar
I. PENDAHULUAN
P enyakit hepatitis adalah satu dari sekian banyak penyakit yang menjadi ancaman kesehatan utama di
dunia. Gaya hidup ternyata dapat memicu virus hepatitis, demikian yang dikemukakan oleh dr. Irsan Hasan
SpPD-KGEH, Ketua Perhimpunan Peneliti Hati Indonesia. Menurut hasil Riskesdas tahun 2013 sebagaimana
dalam data prevalensi hepatitis provinsi, Bahwa jumlah orang yang di diagnosis menderita penyakit hepatitis
oleh Tenaga Kesehatan pada tahun 2013 berdasarkan gejala-gejala yang ada, mengalami peningkatan 2 kali
lipat dibandingkan dengan tahun 2007. Hal ini dapat memberikan petunjuk awal tentang upaya pengendalian
dimasa lalu dan akan menjadi masalah dimasa yang akan datang apabila tidak segera dilakukan upaya-upaya
yang serius. Risiko kerusakan hati bahkan bisa berkembang menjadi kanker ketika dewasa.
Hepatitis merupakan peradangan pada hati yang biasanya disebabkan oleh virus. Hepatitis A, B dan C sama-
sama disebabkan oleh virus, yaitu Hepatitis Virus tipe A (HVA), Hepatitis Virus tipe B (HVB) dan Hepatitis
Virus tipe C (HVC)[4][10]. Menurut Direktur Jenderal Badan Organisasi Kesehatan Dunia (WHO), Tedros
Adhanom Ghebreyesus hanya ada 1 dari 10 orang yang pernah melakukan tes hepatitis dan hanya 1 dari 5
ANNA HENDRI SOLELIZA JONES ET. AL. / J. OF INISTA. 2021, 3 (2): 61-70
Implementasi Metode CART untuk Klasifikasi Diagnosis Penyakit Hepatitis Pada Anak 62
orang yang mendapatkan pengobatan hepatitis yang tepat. Secara global didapatkan sekitar 1,4 juta kasus
baru infeksi hepatitis pertahunnya. Menurut CDC (Centers for Disease Control and Prevention), Hepatitis
justru lebih sering menyerang anak-anak, terutama yang tinggal di area dengan sanitasi masi rendah.
Hasil observasi yang dilakukan di RSUD Sei Bahar didapat 240 data penderita penyakit hepatitis dari tahun
2017 sampai tahun 2018, sedangkan hasil observasi bahwa hampir 70% setiap pasien yang datang tidak
mengetahui mengenai gejala dan penyakit hepatitis, sehingga dapat meningkatkan prosentase penderita
penyakit hepatitis.
Penelitian ini menggunakan metode CART untuk melakukan klasifikasi menentukan penyakit hepatitis.
Metode CART (classification and Regression Tree) merupakan metode untuk melakukan analisis klasifikasi.
Prinsip dari klasifikasi adalah memilah seluruh amatan menjadi dua gugus amatan dan memilah kembali
gugus amatan tersebut menjadi dua gugus amatan berikutnya, sampai diperoleh jumlah amatan minimum pada
tiap-tiap gugus amatan berikutnya[14]. Metode CART belajar mempelajari data yang berasal dari masa
lampau atau disebut juga data latihan, sehingga sistem akan berlatih dengan data latihan untuk mendapatkan
pengetahuan [11].
Dalam membangun sebuah sistem pakar yang mampu mensimulasikan pengetahuan dan ketrampilan seorang
pakar dipilihlah metode CART (Classification and Regression Tree) dalam penentuan sistemnya karena
mampu untuk melakukan klasifikasi data kategorik[1][2]. Penelitian ini bertujuan membangun sistem aplikasi
berbasis komputer untuk menentukan klasifikasi diagnosis penyakit hepatitis dengan metode CART yang
memberikan rekomendasi cara penanganan penyakit hepatitis kepada pasien.[16].
II. METODOLOGI
2.1. Alur Penelitian
Alur penelitian yang dilakukan dimulai dengan pemilihan data yang digunakan dalam penelitian kemudian
dilakukan candidate split yaitu membagi data menjadi data training dan data uji. Tahapan berikutnya
mengimplementasikan metode CART kedalam data penelitian untuk menentukan pohon keputusan dan
tahapan terkahir adalah pengujian untuk mengetahui akurasi hasil implementasi metode CART terhadap data
dan kasus.Alur penelitian dapat dilihat pada gambar 1.
Start
Pengujian CART
End
Basis pengetahuan yang digunakan dalam penelitian ini berupa data gejala hepatitis dan data penyakit
penyakit hepatitis. Sedangkan mesin inferensi yang digunakan berupa penalaran maju atau forward chaining.
2. Menilai kinerja keseluruhan calon cabang yang terdapat pada daftar calon cabang mutakhir dengan jalan
menghitung nilai besaran kesesuaian Φ(s|t)
3. Menentukan calon cabang manakah yang akan benar-benar dijadikan cabang dengan memilih calon
cabang yang memiliki nilai kesesuaian Φ(s|t) terbesar. Jika tidak ada lagi noktah keputusan, pelaksanaan
CART akan dihentikan. Namun, jika ada terdapat noktah keputusan, dilanjutkan dengan kembali ke
langkah kedua, dengan terlebih dahulu membuang calon cabang yang sudah berhasil menjadi cabang
sehingga mendapatkan daftar calon cabang mutakhir yang baru[15].
Kinerja dari setiap calon cabang akan dikukur melalui ukuran kesesuain goodness dengan rumus 1.
Ǫ(s|t) (2)
PL = (3)
PR = (4)
Keterangan:
S= calon cabang
t = noktah keputusan
tL = cabang kiri dari noktah keputusan t
tR = cabang kanan dari noktah keputusan t
j = jumlah catatan
… … … … …
Didapat 23 calon cabang dari 35 data training. Ada dua kolom candidate split yaitu calon cabang kiri dan
calon cabang kanan.
Tabel 2. Candidate Split
No Calon Kiri Calon kanan
… ….. ….
Nilai PL merupakan candidate split kiri terhadap data training. Jumlah G01, yaitu sebanyak 11 data,
Kemudian dibagi 35 (data training).
PL = 11/35 = 0,314
Nilai PR merupakan candidate split kanan terhadap data training. Jumlah selain G01, yaitu sebanyak 24 data,
Kemudian dibagi 35 (data training).
PR = 24/35 = 0,685
P(j|tL) merupakan nilai probabilitas setiap penyakit pada data training yang bernilai calon cabang kiri. Jumlah
Hepatitis G01 pada data PL. Kemudian dibagi dengan jumlah data PL.
Hepatitis A 11/11 = 1
Hepatitis B 0/11 = 0
P(j|tR) merupakan nilai probabilitas setiap penyakit pada data training yang bernilai calon cabang kanan.
Jumlah Hepatitis selain G01 pada data PR. Kemudian dibagi dengan jumlah data PR.
Hepatitis A 6/24 = 0,25
Hepatitis B 18/24 = 0,75
Menentukan nilai 2PLPR yaitu dua dikali nilai PL dikali nilai PR.
2PLPR = 2 x 0,314 x 0,685 = 0,43102
Q(s|t) merupakan nilai consider jenis penyakit hepatitis.
Q(s|t) = |1-0,25| + |0-0,75| = 1,5
Φ (s|t) merupakan nilai goodness. Proses perhitungan dilakukan disemua candidate split.
Φ(s|t) = 0,43102 x 1,5 = 0,64662
Berikut merupakan nilai Φ (s|t) disemua candidate split iterasi pertama disajikian pada tabel 3.
… … … … … …
ANNA HENDRI SOLELIZA JONES ET. AL. / J. OF INISTA. 2021, 3 (2): 61-70
Implementasi Metode CART untuk Klasifikasi Diagnosis Penyakit Hepatitis Pada Anak 66
Pada iterasi 1 didapatkan nilai Φ(s|t) terbesar 0,666122 yaitu calon cabang urut dua. Maka diperoleh calon
cabang kiri G02 dan calon cabang kanan G01, G03, G04, G05, G06. Berikut pohon keputusan iterasi 1 pada
gambar 4.
… … … … … …
Iterasi 2 didapat nilai terbesar yaitu 0,6351606 pada split 4.. Maka diperoleh calon cabang kiri G04 dan
calon cabang kanan G01, G03, G05, G06. Berikut pohon keputusan iterasi 2 pada gambar 5.
ANNA HENDRI SOLELIZA JONES ET. AL. / J. OF INISTA. 2021, 3 (2): 61-70
Implementasi Metode CART untuk Klasifikasi Diagnosis Penyakit Hepatitis Pada Anak 67
Tabel 5 Iterasi 3
No Pl Pr 2PLPR Q (s|t) Φ (s|t)
… … ... … … …
Iterasi 3 didapat nilai terbesar yaitu 0,88888 pada split 8. Maka diperoleh calon cabang kiri G08 dan calon
cabang kanan G10, G12, G18. Berikut pohon keputusan iterasi 3 pada gambar 6.
Karena nilai variabel prediktor seluruhnya penyakit hepatitis B, maka dihasilkan noktah terminasi. Sesuai
namanya noktah terminasi tidak bisa bercabag lagi. Karena pada iterasi 3 tidak ada lagi noktah keputusan,
iterasi dihentikan.[8]
Hasil Klasifikasi
No Gejala Analisis Oleh
Pakar Sistem
Hasil klasifikasi yang dilakukan oleh sistem dihitung akurasinya dengan pengujian confusion matrix. Dapat
dilihat pada tabel 7.
Tabel 7. Confusion Matrix
True Values
A B
Preidiction A 15 1
B 1 18
Akurasi = = 0,94
precision A = = 0,93
precision B = = 0,94
Berdasarkan pengujian akurasi, didapat hasil akurasi data analisis pakar dengan sistem menggunakan metode
CART sebesar 94% dengan precision hepatitis A sebesar 93%, dan precision hepatitis B sebesar 94%.
Kesimpulan yang diperoleh dari pengujian akurasi adalah bahwa metode CART dapat digunakan sebagai
metode pengklasifikasian pada analisis penyakit hepatitis karena tingkat akurasinya yang tinggi.
V. KESIMPULAN
Dari penelitian yang telah dilakukan, dihasilkan sebuah software sistem pakar berbasis web untuk
klasifikasi diagnosis penyakit hepatitis pada anak. Dengan menggunakan 240 data dan 35 data uji hasil
klasifikasi menggunakan metode CART dan analisis rekomendasi dari pakar, didapatkan bahwa metode
CART dapat digunakan sebagai metode pengklasifikasian untuk diagnosis penyakit hepatitis dengan tingkat
akurasi hasil diagnosis sistem sebesar 94%.
ANNA HENDRI SOLELIZA JONES ET. AL. / J. OF INISTA. 2021, 3 (2): 61-70
Implementasi Metode CART untuk Klasifikasi Diagnosis Penyakit Hepatitis Pada Anak 70
REFERENSI
[1] Abdul Aziz and Aziz Ur Rehman, “Detection of Cardiac Disease using Data Mining Classification Techniques” International
Journal of Advanced Computer Science and Applications(IJACSA), 8(7), 2017.
[2] B. Perez, C. Castellanos, and D. Correal, “Applying Data Mining Techniques to Predict Student Dropout: A Case Study,” in
2018 IEEE 1st Colombian Conference on Applications in Computational Intelligence, ColCACI 2018 - Proceedings, 2018.
[3] D. V. Paul, C. Nayagam, and J. D. Pawar, “Modeling Academic Performance using Subspace Clustering Algorithm,” in
Proceedings - IEEE 8th International Conference on Technology for Education, T4E 2016, 2017.
[4] Fahad Ahmad, Kashaf Junaid and Ata ul Mustafa, “Relationship of Liver Enzymes with Viral Load of Hepatitis C in HCV
Infected Patients by Data Analytics” International Journal of Advanced Computer Science and Applications(IJACSA), 9(11),
2018.
[5] K. Kohli and S. Birla, “Data Mining on Student Database to Improve Future Performance,” Int. J. Comput. Appl., 2016.
[6] M. Anoopkumar and A. M. J. Md Zubair Rahman, “A Review on Data Mining techniques and factors used in Educational Data
Mining to predict student amelioration,” in Proceedings of 2016 International Conference on Data Mining and Advanced
Computing, SAPIENCE 2016, 2016.
[7] Manikandan .R, Ramesh R.“A Schematic Data Mining Approach for Web Page Recommendation Systems", Volume. 3 Issue.
10, October- 2018, International Journal of Innovative Science and Research Technology (IJISRT) ,www.ijisrt.com , ISSN -
2456-2165, PP:-489-492.
[8] Mukhtar, Ismail.“The use of Certainty Factor (CF) in Technostress Diagnation Expert System'', Volume. 4 Issue. 5, - 2019,
International Journal of Innovative Science and Research Technology (IJISRT), www.ijisrt.com. ISSN - 2456-2165, PP:-727-
732.
[9] Novarina, A. T., & Santoso, E. (2018). Sistem Pakar Diagnosis Penyakit Hepatitis Menggunakan Metode Dempster Shafer.
Jurnal Pengenmbanagan Teknologi Informasi Dan Ilmu Komputer, 2(6), 2252–2258.
[10] Ramdhani, A., Isnanto, R. R., & Windasari, I. P. (2015). Pengembangan Sistem Pakar Untuk Diagnosis Penyakit Hepatitis
Berbasis Web Menggunakan Metode Certainty Factor. Jurnal Teknologi Dan Sistem Komputer, 3(1), 58–64.
https://doi.org/10.14710/JTSISKOM.3.1.2015.58-64.
[11] R. Asif, A. Merceron, S. A. Ali, and N. G. Haider, “Analyzing undergraduate students’ performance using educational data
mining,” Comput. Educ., 2017.
[12] Sri Winiarti, Herman Yuliansyah and Aprial Andi Purnama, “Identification of Toddlers’ Nutritional Status using Data Mining
Approach” International Journal of Advanced Computer Science and Applications(IJACSA), 9(1),
2018. http://dx.doi.org/10.14569/IJACSA.2018.090122.
[13] Sahar F. Sabbeh, “Machine-Learning Techniques for Customer Retention: A Comparative Study” International Journal of
Advanced Computer Science and Applications(IJACSA), 9(2), 2018.
[14] Saranya.E, Maheswaran.T.“IOT Based Disease Prediction and Diagnosis System for Healthcare Using Data Mining
Techniques'', Volume. 3 Issue. 10, October- 2018, International Journal of Innovative Science and Research Technology
(IJISRT) ,www.ijisrt.com , ISSN - 2456-2165, PP:-718-721.
[15] Susanto, S., & Suryani, D. (2010). Pengantar Data Mining. (Nikodemus WK, Ed.) (1st ed.). YOGYAKARTA: CV ANDI
OFFSET.
[16] Suwardika, G. (2017). Pengelompokan Dan Klasifikasi Pada Data Hepatitis Dengan Menggunakan Support Vector Machine (
SVM ), Classification And Regression Tree ( Cart ) Dan Regresi Logistik Biner, 1, 183–191.