Anda di halaman 1dari 8

e-ISSN.

2476-9843 Jurnal MATRIK


p-ISSN. 1858-4144 Vol.19 No.2 (Mei) 2020, Hal 294-301
DOI https://doi.org/10.30812/matrik.v19i2.676

Penerapan Algoritma Klasifikasi Classification And Regression Trees (CART) untuk


Diagnosis Penyakit Diabetes Retinopathy

Pungkas Subarkah
Program Studi Informatika,Fakultas Ilmu Komputer, Universitas Amikom Purwokerto
E-Mail : subarkah@amikompurwokerto.ac.id

ABSTRAK

Penyakit diabetic retinopathy atau DR adalah salah satu komplikasi penyakit diabetes yang bisa menyebabkan
kematian bagi penderitanya. Komplikasi tersebut berupa kerusakan pada bagian retina mata.Tingginya kadar glukosa
dalam darah adalah penyebabpembuluh darah kapiler kecil menjadi pecah dan dapatmenyebabkan kebutaan.
Retinopati diabetes diawali dengan melemah atau hancurnya kapiler kecil di retina, darah bocor yang kemudian
menyebabkan penebalan jaringan, pembengkakan, dan pendarahan yang luas. Penelitian ini bertujuan untuk
menganalisis diagnosis penyakit diabetes retinopathy. Algoritma Classification And Regression Trees (CART)
merupakan salah satu algoritma klasifikasi dengan menggunakan dataset diambil dari UCI Repository Learning
diperoleh dariUniversitas Debrecen, Hongaria, yang terdiri dari data pasien terindikasi penyakit diabetes retinopathy
dan normal penyakit diabetes retinopathy. Metode yang digunakan dalam penelitian ini yaitu identifikasi masalah,
pengumpulan data, tahap pre-processing, metode klasifikasi, validasi dan evaluasi serta penarikan kesimpulan.
Adapun metode validasi dan evaluasi yang digunakan yaitu 10-cross validation dan confusion matrix.Dari hasil
perhitungan yang telah dilakukan, maka didapatkan hasil akurasi pada algoritma CART sebesar 63.4231%, dengan
nilai precision 0.64%, nilai Recall 0.634%, dan nilai F-Measure 0,634%.

Kata Kunci: Diabetes Retinopathy, Klasifikasi, CART.

ABSTRACT

Diabetic Retinopathy or DR is a complication of diabetes that can cause death for sufferers. These complications
are damage to the retina of the eye. High blood sugar levels cause small capillaries to rupture and can cause
blindness. Diabetic retinopathy begins with a decrease or destruction of small capillaries in the retina, blood leak
which then causes tissue thickening, swelling, and extensive bleeding. This study attempts to analyze the diagnosis
of diabetic retinopathy. Classification Algorithms And Regression Trees (CART) is one algorithm that uses a dataset
taken from the UCI Learning Repository obtained from Debrecen University, which consists of patient data
indicated by diabetic retinopathy and normal retinopathy diabetes. The method used in this research is problem
collection, data collection, pre-processing, collection methods, validation and evaluation as well as gathering
conclusions. The validation and evaluation methods used are 10-cross validation and confusion matrix. From the
results of calculations that have been done, the accuracy of the CART algorithm is obtained at 63.421%, with a
precision value of 0.64%, a Recall value of 0.634%, and a value of F- Measures 0.634%.

Keywords: Diabetes Retinopathy, Classification, CART.

Author Korespondensi (Pungkas Subarkah)


Email : subarkah@amikompurwokerto.ac.id

I. PENDAHULUAN menyebabkan penebalan jaringan, pem-


Penyakit diabetic retinopathy atau DR adalah bengkakan, dan pendarahan yang luas [1].
salah satu komplikasi penyakit diabetes yang bisa Penyakit ini pada umumnya akan berdampak
menyebabkan kematian bagi penderitanya. secara langsung pada terganggunya penglihatan
Komplikasi tersebut berupa kerusakan pada penderita dan apabila terlambat ditangani maka
bagian retina mata. Tingginya kadar glukosa akan menyebabkan penderita mengalami
dalam darah adalah penyebab pembuluh darah kebutaan secara permanen. DR hingga saat ini
kapiler kecil menjadi pecah dan masih sulit disembuhkan karena mayoritas
dapatmenyebabkan kebutaan. Retinopati diabetes penderita melakukan pemeriksaan di saat kondisi
diawali dengan melemah atau hancurnya kapiler penyakit telah memasuki tahap berbahaya. Hal
kecil di retina, darah bocor yang kemudian ini dikarenakan sifat dari penyakit DR ini yang

MATRIK : JURNAL MANAJEMEN,TEKNIK Terakreditasi SINTA 4, SK No. 3/E/KPT/2019


INFORMATIKA & REKAYASA KOMPUTER 294
e-ISSN. 2476-9843 Jurnal MATRIK
p-ISSN. 1858-4144 Vol.19 No.2 (Mei) 2020, Hal 294-301
DOI https://doi.org/10.30812/matrik.v19i2.676

tidak menunjukkan gejala yang terlihat bila serta banyak digunakan dalam bidang lain.
masih pada tahap awal [2]. Dalam dataset klasifikasi terdapat satu atribut
Penyakit ini merupakan salah satu komplikasi tujuan atau dapat pula disebut dengan atribut
mikrovaskular diabetes melitus dengan angka label. Atribut inilah yang akan dicari dari data
prevalensi yang cukup tinggi. Berdasarkan data baru dengan dasar atribut lain pada data lampau.
penelitian yang dilakukan di beberapa daerah di Banyaknya atribut dapat mempengaruhi
Indonesia, diperkirakan prevalensi retinopati performansi suatu algoritma [7].
diabetik sebesar 42,6%. Setidaknya akan Algoritma Classification And Regression
ditemukan 24.600 orang dengan retinopati Trees (CART) adalah satu metode atau algoritma
diabetik dan sekitar 10% dari jumlah tersebut dari salah satu teknik ekplorasi data yaitu teknik
mengalami kebutaan. Jumlah ini diperkirakan pohon keputusan [8]. Metode ini dikembangkan
akan meningkat pada tahun 2030 dengan estimasi oleh Leo Breiman, Jerome H.Friedman, Richard
98.400 orang menderita diabetes dan sekitar A. Olshen dan Charles J. Stone sekitar tahun
11.000 orang diantaranya mengalami kebutaan. 1980. CART merupakan metodologi statistik
Mengingat sebagian besar kebutaan akibat non-parametrik yang dikembangkan untuk topik
diabetik retinopati merupakan kondisi yang analisis klasifikasi, baik untuk variabel respon
permanen dan tidak dapat diobati, maka kategorik maupun kontinu. Metode ini
pencegahan dan pengobatan menjadi hal yang merupakan metode yang biasa diterapkan suatu
penting [3]. Efek visual dari kebocoran himpunan data yang mempunyai jumlah besar,
digambarkan dengan adanya perubahan pada variabel yang sangat banyak dan dengan skala
retina seperti perubahan venous, cotton wool variabel campuran melalui prosedur pemilahan
spots, mikroaneurisma, hard exedute dan biner [9]. Kelebihan dari algoritma CART adalah
pendarahan [4]. metode yang bersifat non-parametrik atau cocok
Menurut International Diabetes Mellitus digunakan untuk data yang berjenis numeric.
Federation (IDF) Atlas 2017: epidemi Diabetes CART tidak memerlukan variabel yang akan
Melitus di Indonesia masih menunjukkan dipilih terlebih dahulu dan menghasilkan
kecenderungan meningkat. Indonesia adalah invariant untuk transformasi variabel yang
negara peringkat ke-enam di dunia setelah independen [10]. Pada klasifikasi algoritma
Tiongkok, India, Amerika Serikat, Brazil dan CART, sebuah record akan diklasifikasikan ke
Meksiko dengan jumlah penderita Diabetes dalam salah satu dari sekian klasifikasi yang
Melitus usia 20–79 tahun sekitar 10,3 juta orang. tersedia pada variabel tujuan berdasarkan nilai–
Riset Kesehatan Dasar (Riskesdas) juga nilai variabel prediktornya [11]
memperlihatkan peningkatan angka prevalensi Penelitian ini bertujuan untuk menganalisis
Diabetes Melitus yang cukup signifikan, yaitu penyakit diabetes retinopathy menggunakan
dari 6,9 % di tahun 2013 menjadi 8,5 % di tahun dataset yang diperoleh dari UCI repository
2018; sehingga estimasi jumlah penderita machine learning dan dibuat oleh Universitas
Diabetes Melitus di Indonesia mencapai 22 juta Debrecen, Hongaria, untuk melakukan klasifikasi
orang[5]. Diagnosis dini pada penyakit diabetes diagnosis penyakit diabetes retinopathy. Peneliti
retinopathy dapat dilakukan dengan metode data menggunakan algoritma klasifikasi yaitu CART.
mining. Dimana proses pada metode data mining
bertujuan untuk menguraikan temuan baru di II. METODELOGI
dalam dataset dan menjelaskan suatu proses yang Tahapan penelitian dilakukan untuk
menggunakan teknik statistik, matematis, mempermudah dalam melakukan penelitian.
artificial intelligence, dan machine learning Desain penelitian analisis algoritma klasifikasi
untuk melakukan ekstrak dan identifikasi CART untuk diagnosis penyalit diabetes
informasi yang bermanfaat dan pengetahuan yang retinopathy dilihat pada gambar 1.
terkait dari database tersebut.
Salah satu fungsi utama data mining adalah
klasifikasi. Klasifikasi banyak digunakan untuk
menentukan keputusan sesuai pengetahuan baru
yang didapat dari pengolahan data lampau
menggunakan perhitungan suatu algoritma.
Teknik klasifikasi dapat diterapkan dalam semua
bidang misalnya dalam bidang kesehatan [6],
295
MATRIK: JURNAL MANAJEMEN, TEKNIK Terakreditasi SINTA 4, SK No. 3/E/KPT/2019
INFORMATIKA & REKAYASA KOMPUTER
e-ISSN. 2476-9843 Jurnal MATRIK
p-ISSN. 1858-4144 Vol.19 No.2 (Mei) 2020, Hal 294-301
DOI https://doi.org/10.30812/matrik.v19i2.676

Attribute 11 Hasil normalisasi pada eksudat


Attribute 12 Hasil normalisasi pada eksudat
Attribute 13 Hasil normalisasi pada eksudat
Attribute 14 Hasil normalisasi pada eksudat
Attribute 15 Hasil normalisasi pada eksudat
Attribute 16 Jarak Euclidean pada pusat manula dan
pusat cakram optic
Attribute 17 Diameter cakram optik
Attribute 18 Hasil biner pada klasifikasi berbasis
AM/FM
Target_Attrib Label kelas. 1 = mengandung tanda-tanda
ute19 DR (label akumulatif untuk kelas
Messidor 1, 2, 3), kelas. 0 = tidak ada
tanda-tanda DR.

Tabel 2. Jumlah Dataset Berdasarkan Class


No Jenis Klasifikasi Jumlah Record
Dataset
1 Contains Signs 611
2 No Signs 540
Jumlah 1151

2.3. Tahap Pre-Processing


Gambar 1. Tahapan Penelitian Pada tahapan ini dilakukan suatu proses
seleksi data dengan tujuan untuk mendapatkan
2.1. Identifikasi Masalah data yang bersih dan siap digunakan sebagai
Pada tahapan ini dilakukan untuk mengetahui bahan penelitian. Tahap pre-processing data
permasalahan serta metode yang sesuai sehingga meliputi identifikasi dan pemilihan atribut
dapat ditentukan poin-poin untuk target diagnosis (attribute identification and selection),
penyakit diabetes retinopathy. penanganan nilai atribut yang hilang atau atribut
yang tidak lengkap (handling missing values) dan
2.2. Pengumpulan Data proses diskretisasi nilai.
Dalam tahapan ini pengumpulan data
menggunakan data sekunder yang digunakan, 2.4. Penggunaan metode klasifikasi
diambil dari database UCI Repository. Dataset Metode yang peneliti gunakan yaitu algoritma
terdiri dari 1151 record, yang memiliki 19 CART, dari hasil confusionmatrix dapat dihitung
attribute (18 attribute dan 1 attribute target). nilai precision, recall dan F-Measure [13].
Attribute target terdiri dua output yaitu normal Rincian confusion matrix dapat dilihat pada tabel
diabetes retinopathy dan terindikasi diabetes 3.
retinopathy [12]. Kedua output pada class
attribute ini akan digunakan sebagai output data Tabel 3. Confusion Matrix
penyakit diabetes retinopathy. Penjelasan Correct Classification as
classification + -
mengenai atribut diabetes retinopathy, dapat
+ True positives False
dilihat pada tabel 1 dan tabel 2.
positives
- False positives True
Tabel 1. Attribut Pada DatasetDiabetes negatives
Retinopathy
Nama Informasi
Attribute 0 Hasil biner pada kualitas penilaian Adapun rumus perhitungan dari sebuah
Attribute 1 Hasil biner pada pra-skrining precision, recalll dan F-Measure dari sebuah
Attribute 2 Hasil deteksi MA accuracy [13], dapat dilihat pada persamaan
Attribute 3 Hasil deteksi MA
Attribute 4 Hasil deteksi MA
dibawah ini.
𝑇𝑃
Attribute 5 Hasil deteksi MA Precision = (1)
𝑇𝑃+𝐹𝑃
Attribute 6 Hasil deteksi MA
Attribute 7 Hasil deteksi MA 𝑇𝑃
Attribute 8 Hasil normalisasi pada eksudat Recall = (2)
𝑇𝑃+𝐹𝑁
Attribute 9 Hasil normalisasi pada eksudat
Attribute 10 Hasil normalisasi pada eksudat

MATRIK : JURNAL MANAJEMEN,TEKNIK Terakreditasi SINTA 4, SK No. 3/E/KPT/2019


INFORMATIKA & REKAYASA KOMPUTER 296
e-ISSN. 2476-9843 Jurnal MATRIK
p-ISSN. 1858-4144 Vol.19 No.2 (Mei) 2020, Hal 294-301
DOI https://doi.org/10.30812/matrik.v19i2.676

F-Measure =
2 ×𝑝𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 ×𝑟𝑒𝑐𝑎𝑙𝑙
(3) – atribut yang akan digunakan dalam mengolah
𝑝𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛+ 𝑟𝑒𝑐𝑎𝑙𝑙
dataset tersebut karena setiap atribut pada dataset
𝑇𝑃+𝑇𝑁 ini akan memberikan hasil yang berbeda – beda
Accuracy = (4)
𝑇𝑃+𝐹𝑃+𝐹𝑁+𝑇𝑁 pada hasil akurasi dalam mendiagnosa penyakit
diabetes retinopathy dan hal ini berkaitan ada
2.5.1. Validasi dan Evaluasi atau tidaknya kelengkapan nilai pada setiap
Dalam tahap ini dilakukan validasi dan atribut. Atribut-atribut yang dimaksud adalah :
evaluai serta pengukuran keakuratan hasil yang a. Attribute 0
dicapai oleh model menggunakan teknik yang Hasil biner dari penilaian yang berkualitas
terdapat dalam aplikasi Weka yaitu confusion b. Attribute 1
matrix dan cross-validation. Hasil biner dari pre-screening
c. Attibute 2-7
2.5. Penarikan Kesimpulan Hasil dari deteksi MA.
Pada tahapan ini yaitu menyimpulkan hasil d. Attribute 8-15
yang diperoleh dari penelitian dengan Eksudat yang diwakili oleh seperangkat,
menggunakan Algoritma CART yang yang menghasilkan jumlah piksel yang
memberikan hasil akurasi terbaik untuk membentuk lesi pada bola mata.
mendiagnosis penyakit diabetes mellitus e. Attribute 16
berdasarkan nilai precision, recall, F-Measure Jarak euclidean dari pusat makula dan pusat
dari tiap masing-masing algoritma dengan tingkat cakram optik untuk memberikan informasi
diagnosis sebagai berikut: penting mengenai kondisi pasien.
a. Excellent classification = 0.90 – 1.00 f. Attribute 17
b. Good classification = 0.80 – 0.90 Diameter cakram optik.
c. Fair classification = 0.70 – 0.80 g. Attribute 18
d. Poor classification = 0.60 – 0.70 Hasil biner dari klasifikasi berbasis AM /
e. Failure = 0.50 – 0.60 FM
h. Class_Attribute
III. HASIL DAN PEMBAHASAN Label kelas. 1 = mengandung tanda-tanda DR
(label akumulatif untuk kelas Messidor 1, 2, 3), 0
3.1. Identifikasi Masalah = tidak ada tanda-tanda DR.
Dalam tahapan ini penulis melakukan Atribut diatas yang digunakan peneliti untuk
beberapa studi pendahuluan dengan mempelajari bahan penelitian dan terlebih dahulu disesuaikan
literatur-literatur yang berkaitan dengan dengan tipe data yang dapat dibaca oleh aplikasi
penelitian penulis yaitu untuk mendiagnosis Weka.
penyakit diabetes retinopathy serta pemilihan
algoritma yang sesuai untuk penelitian penulis 3.3. Tahap Pre-Processing
ini. Dari hasil tersebut penulis melakukan Dalam tahapan ini, dilakukan identifikasi dan
penelitian dengan menggunakan algoritma CART penyesuaian atribut, serta penyeleksian dari
untuk menganalisa dataset. datasetdiabetes retinopathy agar data yang
diperoleh ialah data yang benar-benar siap untuk
3.2. Pengumpulan Data digunakan. Tabel 4, yang merupakan dataset
Dalam penelitian penulis ini data yang akan diabetes retinopathy yang telah dilakukan
digunakan dalam penelitian yaitu dengan penyesuaian atribut untuk aplikasi Weka.
mengambil dari repository diambil dari database
UCI repository. Dataset terdiri dari 1151 record,
yang memiliki 19 attribute (18 attribute dan 1
attribute target). Attribute target terdiri dua
output yaitu normal diabetes retinopathy dan
terindikasi diabetes retinopathy [12]. kedua
output pada class attribute ini akan digunakan
ssebagai output data penyakit diabetes
retinopathy. Data ini harus diolah terlebih dahulu
yaitu melalui tahap pre-processing, dimana
tahapan ini bertujuan untuk menyesuaikan atribut
297
MATRIK: JURNAL MANAJEMEN, TEKNIK Terakreditasi SINTA 4, SK No. 3/E/KPT/2019
INFORMATIKA & REKAYASA KOMPUTER
e-ISSN. 2476-9843 Jurnal MATRIK
p-ISSN. 1858-4144 Vol.19 No.2 (Mei) 2020, Hal 294-301
DOI https://doi.org/10.30812/matrik.v19i2.676

Tabel 4. Data Pre-Processing merupakan tabel sebelum dan sesudah melalui


Data Asli
Data Hasil
Keterangan
proses penanganan missing value, dapat dilihat
Pre-Processing pada tabel 5.
1 1 Hasil biner dari
penilaian yang Tabel 5. Perbandingan Tabel Dataset Sebelum
berkualitas dan Sesudah Melalui Proses Penanganan Missing
1 1 Hasil biner dari Value
pre-screening
Atribut dataset setelah
22 22 Hasil dari Atribut Dataset
melalui proses penanganan
19 19 deteksi MA asli
missing values
19 19 Attribute 0 Attribute 0
15 15 Attribute 1 Attribute 1
12 12 Attribute 2 Attribute 2
9 9 Attribute 3 Attribute 3
70.19232 70.192324 Eksudat yang Attribute 4 Attribute 4
4 diwakili oleh Attribute 5 Attribute 5
24.97133 24.971335 seperangkat,
Attribute 6 Attribute 6
5 yang
Attribute 7 Attribute 7
4.403699 4.403699 menghasilkan
Attribute 8 Attribute 8
0.713671 0.713671 jumlah piksel
yang Attribute 9 Attribute 9
0.394666 0.394666
membentuk lesi Attribute 10 Attribute 10
0.207558 0.207558
pada bola mata. Attribute 11 Attribute 11
0.089976 0.089976
Attribute 12 Attribute 12
0.039876 0.039876
Attribute 13 Attribute 13
0.518668 0.518668 Jarak euclidean
Attribute 14 Attribute 14
dari pusat
Attribute 15 Attribute 15
makula dan
Attribute 16 Attribute 16
pusat cakram
optik untuk Attribute 17 Attribute 17
memberikan Attribute 18 Attribute 18
informasi Target_Attribute Target_Attribute 19
penting 19
mengenai
kondisi pasien. 3.3. Penggunaan Metode Klasifikasi
Setelah melalui tahapan pre-processing,
0.098155 0.098155 Hasil biner dari selanjutnya dataset mulai diolah dengan
klasifikasi menggunakan aplikasi Weka. Tahapan ini
berbasis AM / bertujuan untuk menghasilkan confusion matrix
FM berdasarkan metode evaluasi 10-fold cross
1 1 Label kelas. 1 = validation, dimana dataset tersebut dibagi
mengandung
menjadi 10 subsets (9 subsets sebagai
tanda-tanda DR
(label trainingsets dan 1 subsets sebagai testingset )
akumulatif dengan jumlah 10 kali iterasi. Adapun classifier
untuk kelas yang digunakan untuk uji coba pada dataset
Messidor 1, 2, adalah SimpleCart (algoritma Classification And
3), 0 = tidak ada Regression Tress). Gambar 3 menunjukkan
tanda-tanda DR visualisasi data secara keseluruhan yang
Contains 0 Class, Contains dijabarkan sesuai dengan atribut setelah melewati
Signs Signs tahapan pre-processing. Selanjutnya data-data
Signs 1 Class, Signs tersebut diklasifikasi menggunakan algoritma
CART (SimpleCart dalam penggunaan pada
Dari hasil analisis tabel 4, tentang hasil data pre- aplikasi Weka) yang menghasilkan pola
processing dataset diabetes retinopathy yang klasifikasi. Berikur gambar 3 tentang visualisasi
telah dilakukan, bahwa semua atribut nilainya data keseluruhan, sebagai berikut :
lengkap atau tidak missing value. Berikut ini

MATRIK : JURNAL MANAJEMEN,TEKNIK Terakreditasi SINTA 4, SK No. 3/E/KPT/2019


INFORMATIKA & REKAYASA KOMPUTER 298
e-ISSN. 2476-9843 Jurnal MATRIK
p-ISSN. 1858-4144 Vol.19 No.2 (Mei) 2020, Hal 294-301
DOI https://doi.org/10.30812/matrik.v19i2.676

menghasilkan nilai akurasi sebesar 63, 4231%.


Nilai akurasi tersebut didapatkan dari hasil
perhitungan dari precision, recall dan F-
Measure. Proses perhitungannya dapat dilihat
pada tabel 6.
Tabel 6. Confusion Kelas “0”
368 (True positive) 172 (False Negative)
249 (False Positive) 362 (True Negative)
Gambar 3. Visualisasi data kesuluruhan

Keterangan dari gambar 3, diatas sebagai berikut: Pada tabel 6. Confusion Kelas “0”,merupakan
a. Gambar grafik dengan warna biru terindikasi penjabaran dari confusion matrix yang dapat
diabetes retinopathy. dilihat pada tabel 6.Confusion Kelas “0”.
b. Gambar grafik dengan warna merah normal
atau tidak terindikasi diabetes retinopathy. Kelas “0” :
TP 368
Hasil perhitungan dengan menggunakan Precision = TP+FP = 368+249
= 0,596
aplikasi Weka didapatkan rule pohon keputusan
dari dataset diabetes retinopathy yang dapat TP 368
Recall = TP+FN = 368+172 = 0,681
dilihat pada gambar 4. Pada pohon keputusan
tersebut, dapat diketahui bahwa atribut 14 2𝑥 𝑝𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛×𝑟𝑒𝑐𝑎𝑙𝑙 2𝑥0,596×0,681
merupakan akar dari rule pohon keputusan. Jika F-Measure= = =
𝑝𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 +𝑟𝑒𝑐𝑎𝑙𝑙 0,596 +0,681
pada atribut 14 nilainya kurang dari 0.0203705, 2𝑥0,596×0,681 2𝑥0,405876 0,811752
= = = 0,636
0,596 +0,681 1,277 1,277
pada atribut 2 kurang dari 55.5, selanjutnya pada
atribut 8 jika nilainya kurang dari 127.805703
Tabel 7. Confusion Kelas “1”
maka class atributnya tidak terindikasi diabetes
362 (True Positive) 249 (False Negaitve)
retinopathy.
172(False Positive) 368 (True Negative)

Kelas “1” :
TP 362
Precision = TP+FP = 362+272
= 0,678

TP 362
Recall = TP+FN = 362+172
= 0,592

2𝑥𝑝𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛×𝑟𝑒𝑐𝑎𝑙𝑙 2𝑥0,678×0,592
F-Measure= 𝑝𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 +𝑟𝑒𝑐𝑎𝑙𝑙 = 0,678+0,592
=
2𝑥0,401376 0,802752
= = 0,632
Gambar 4. Rule pohon keputusan dari dataset 1,27 1,27
Diabetes Retinopathy
Dari hasil perhitungan diatas antara lain
Kemudian jika nilai pada atribut 8 nilainya precision, recall dan F-Measure yang dihasilkan
lebih dari 127.805703, selanjutnya pada atribut 2 dari kelas 0 dan kelas 1 dapat dihitung nilai rata-
nilainya kurang dari 11.0 maka class atributnya rata dari kelas-kelas yang ada (Weighted Avg)
yatu tidak terindikasi diabetes retinopathy. dengan terlebih dahulu menjumlahkan nilai A =
Sedangkan jika pada atribut 2 nilainya lebih dari (368 + 172) = 540 dan nilai B = (249 + 362) =
sama dengan 11.0 maka class atributnya adalah 611. Rumus untuk menghitung Weighted Avg,
terindikasi diabetes retinopathy. Selanjutnya pada sebagai berikut :
atribut 2 nilainya 55.5 maka class atributtnya
0,596 𝑥𝐴+0,688 ×𝐵
adalah terindikasi diabetes retinopathy. Weighted Avg (precision) = =
1151
Kemudian jika pada atribut 14 nilainya lebih dari 0,596 𝑥 540 + 0,688 ×611 321,84+420,368
sama dengan 0,203705 maka class atributnya 1151
= 1151
=
742,208
terindikasi diabetes retinopathy. Pada algoritma = 0,64
1151
pohon keputusan yang dihasilkan menggunakan
algoritma CART yang terlihat pada gambar 5,
299
MATRIK: JURNAL MANAJEMEN, TEKNIK Terakreditasi SINTA 4, SK No. 3/E/KPT/2019
INFORMATIKA & REKAYASA KOMPUTER
e-ISSN. 2476-9843 Jurnal MATRIK
p-ISSN. 1858-4144 Vol.19 No.2 (Mei) 2020, Hal 294-301
DOI https://doi.org/10.30812/matrik.v19i2.676

0,681𝑥𝐴 + 0,592 ×𝐵 juga terkena diabetes retinopathy sebanyak 368.


Weighted Avg (recall) = 1151
=
0,681 𝑥 540 + 0,592 ×611 367,74 + 361,712 Kemudian, jumlah data hasil bentukan rule yang
1151
= 1151
= tidak terkena diabetes retinopathy dengan data
729,452 testing yang terkena diabetes retinopathy
1151
= 0,634
sebanyak 172. Selanjutnya, jumlah data hasil
0,636𝑥𝐴 + 0,632 ×𝐵 bentukan ruleyang terkena diabetes retinopathy
Weighted Avg (F-Measure) = 1151
= dan data testing yang tidak terkena diabetes
0,636 𝑥 540 + 0,632 ×611 343,44 + 386,152 retinopathy sebanyak 249. Terakhir, jumlah data
1151
= 1151
=
729,592 hasil bentukan rule yang tidak terkena diabetes
1151
= 0,634 retinopathy yang sama dengan data testingyang
juga tidak terkena diabetes retinopathy sebanyak
Hasil diatas merupakan perhitungan nilai 362.
akurasi berdasarkan confusion matrix yang
disajikan pada tabel 8. Nilai akurasi berdasarkan 3.5. Penarikan Kesimpulan
confusion matrix, sebagai berikut: Dari hasil perhitungan yang telah dilakukan pada
algoritma CART didapatkan nilai akurasi yaitu
Tabel 8. Nilai Akurasi Berdasarkan Confusion 63.4231%, dengan nilai precision 0.64%, nilai
Matrix Recall 0.634%, dan nilai F-Measure 0,634%.
Class Precision Recall F- Grafik hasil akurasi dari perhitungan pada
Measure algoritma CART disajikan pada gambar 6.
0 0,596 0,681 0,636
1 0,678 0,592 0,632
Weighted
Avg
0,64 0,634 0,634
Nilai Akurasi
0,645
Pengklasifikasian untuk menguji dataset 0,64 Akurasi
diabetes retinopathy dengan algoritma CART 0,635
Precision
menggunakan aplikasi Weka 3.6 membutuhkan 0,63
waktu 0,78 second. Recall
F-Measure
3.4. Validasi dan Evaluasi
Untuk mengukur tingkat akurasi dari
algoritma klasifikasi yang digunakan yaitu
menggunakan confusion matrix yang disajikan
IV. SIMPULAN DAN SARAN
pada tabel 9. Tabel tersebut merupakan tabel
4.1. Kesimpulan
yang dihasilkan oleh confusion matrix dari
Dari hasil penelitian ini, peneliti mengambil
pengujian dataset menggunakan algoritma CART
kesimpulan bahwa hasil analisis klasifikasi
dengan metode 10-fold cross validation.
algoritma Classification And Regression Trees
Tabel 9. Confusion Matrix (CART) pada dataset diabetes retinopathy,
Normal Terindikasi berdasarkan dari nilai confusion matrix
Diabetes Diabetes didapatkan hasil akurasi sebesar 63,4321%
Retinopathy Retinopathy dengan nilai precision 0.64%, nilai Recall
Normal 0.634%, dan nilai F-Measure 0,634%.
Diabetes 368 172 4.2. Saran
Retinopathy 1. Menambahkan algoritma klasifikasi untuk
Terindikasi mengetahui bagaimana hasil akurasi yang
Diabetes 249 362 lebih baik pada diagnosis penyakit diabetes
Retinopathy retinopathy.
1151 617 534 2. Melakukan seleksi fitur data mining pada
algoritma dalam klasifikasi penyakit diabetes
Dari tabel 9, terlihat bahwa jumlah data hasil retinopathy.
bentukan rule yang terkena penyakit diabetes
retinopathy yang sama dengan data testing yang

MATRIK : JURNAL MANAJEMEN,TEKNIK Terakreditasi SINTA 4, SK No. 3/E/KPT/2019


INFORMATIKA & REKAYASA KOMPUTER 300
e-ISSN. 2476-9843 Jurnal MATRIK
p-ISSN. 1858-4144 Vol.19 No.2 (Mei) 2020, Hal 294-301
DOI https://doi.org/10.30812/matrik.v19i2.676

3. Peneliti berharap untuk penelitian selanjutnya, Melitusatlas/download-book.Di akses Pada


hasil analisis ini dapat diimplementasikan ke Hari Selasa, 03 Maret 2020. Pukul 15.04 WIB.
sebuah sistem. [6] and D. . S. Christobel, Angeline, “‘An
Empirical Comparison of Data Mining
DAFTAR PUSTAKA Classification Methods,’” 201AD, pp. 24– 28.
[7] E. Prasetyo, Data Mining Konsep dan Aplikasi
[1] B. S. A. Ayu, Ratna Gitasari. Hidayat,
Menggunakan Matlab. Yogyakarta: Andi
“Klasifikasi Penyakit Diabetes Retinopati
Offset, 2012.
Berdasarkan Citra Digital dengan
menggunakan Metode Wavelet dan Support [8] W. B. Komalasari, “Metode Pohon Regresi
Vector Machine.,” Universitas Telkom, 2013. Untuk Eksplorasi Data Dengan Peubah Yang
Banyak Dan Kompleks,” J. Infomatika
[2] I. M. Dewi, “Mengenal Lebih Jauh
Pertan., vol. Volume 16, 2007.
Retinopathy Diabetik,” 2018. [Online].
Available: [9] Nuriyah, “Perbandingan Metode chi-square
https://www.columbiaasia.com/indonesia/heal automstic interaction detection (chaid) dan
th-articles/mengenal-lebih-jauhretinopathy- classification and regression tree (cart) Dalam
diabetik. Menentukan Klasifikasi Alumni UIN Sunan
Kalijaga Berdasarkan Masa Studi,”
[3] “Diabetik Retina : Pergeseran Paradigma
Universitas Islam Negeri Sunan Kalijaga,
Kebutaan pada Era Milenial.” [Online].
2013.
Available:
http://www.yankes.kemkes.go.id/read- [10] R. Timofeev, Classification and Regression
retinopati-diabetik-pergeseran-paradigma- Trees (CART) Theory and Aplications. Berlin:
kebutaan-pada-era-milenial-5984.html. Humboldt University, 2004.
Diakses Hari Selasa, 03 Maret 2020. Pukul [11] D. Susanto, S., dan Suryadi, Pengantar Data
14.57 WIB. Mining. Yogyakarta: Andi Offset, 2010.
[4] S. Faust, O., Acharya, R. U., Ng, E. Y. K., Ng, [12] “Machine Learning Repository,” 2018.
K. H. and J.S, “Algorithmsafor [Online]. Available:
theaAutomated Detection ofaDiabetic https://archive.ics.uci.edu/ml/datasets/Diabetic
Retinopathy Using Digital FundusaImage : A +Retinopathy+Debrecen+Data+Set#.
Review,” JaMed Syst, 2010. [13] M. Han, J., & Kamber, Data Mining
[5] IDF., “Diabetes Melitus Atlas,” Sixth Edition, Concepts, Model and Techniques 2nd Edition.
2013. [Online]. Available: San Fransisco: Elsevier, 2006.
http://www.idf.org/Diabetes

301
MATRIK: JURNAL MANAJEMEN, TEKNIK Terakreditasi SINTA 4, SK No. 3/E/KPT/2019
INFORMATIKA & REKAYASA KOMPUTER

Anda mungkin juga menyukai