Abstrak — Kanker serviks merupakan kanker yang menyediakan layanan kesehatan yang menyediakan fasilitas
menyerang area bawah rahim. Pengobatan kanker serviks terapi untuk pasien kanker serviks [6]. Poli Onkologi Satu
tergantung pada besarnya ukuran dan stadium kanker. Kasus Atap RSUD dr. Soetomo Surabaya tahun 2013 menunjuk-
rekurensi sering terjadi walaupun pengobatan awal telah kan bahwa kanker serviks menempati urutan kedua
dilakukan. Salah satu rumah sakit yang menyediakan fasilitas
terbanyak di RSUD dr. Soetomo Surabaya dan mempunyai
terapi untuk pasien kanker serviks adalah RSUD dr. Soetomo
Surabaya. Permasalahannya adalah bagaimana klasifikasi kecenderungan meningkat dari tahun ke tahun[7].
pasien kanker serviks di RSUD dr. Soetomo Surabaya yang Terdapat beberapa faktor resiko yang diduga
rekuren dan tidak rekuren berdasarkan faktor-faktor yang berpengaruh terhadap rekurensi kanker serviks, yaitu usia,
mempengaruhi rekurensi kanker serviks dan mengetahui status anemia, stadium, jenis pengobatan yang dijalani,
faktor-faktor yang berpengaruh terhadap rekurensi kanker status komplikasi dan status penyakit penyerta.
serviks. Rekurensi yang dimaksudkan di penelitian ini adalah Permasalahannya adalah bagaimana klasifikasi pasien
kembalinya pasien kanker serviks ke RSUD dr. Soetomo kanker serviks di RSUD dr. Soetomo Surabaya yang rekuren
karena penyakit yang sama. Data yang digunakan merupakan dan tidak rekuren berdasarkan faktor-faktor yang
data sekunder, yang diperoleh dari rekam medis pasien kanker
mempengaruhi rekurensi kanker serviks dan mengetahui
serviks di RSUD dr. Soetomo Surabaya pada tahun 2014
dengan jumlah data sebanyak 810 pasien. Berdasarkan analisis faktor-faktor yang berpengaruh terhadap rekurensi kanker
yang telah dilakukan, pasien yang rekuren lebih banyak serviks. Terdapat berbagai macam metode klasifikasi, yaitu
dibandingkan pasien yang tidak rekuren dengan persentase CART (Classification And Regression Trees), CHAID (Chi-
sebesar 57,78 persen untuk yang rekuren. Klasifikasi CART Square Automatic Interaction Detection), SVM dan metode
menghasilkan bahwa variabel yang paling berpengaruh klasifikasi lainnya. Dalam penelitian ini, metode yang
terhadap rekurensi kanker serviks adalah variabel jenis digunakan adalah klasifikasi CART karena dapat
pengobatan yang dijalani oleh pasien, selain itu variabel usia, mengklasifikasikan data baru secara efisien.
status anemia dan status penyakit penyerta juga berpengaruh Metode CART (Classification and Regression Trees)
terhadap rekurensi kanker serviks. Ketepatan klasifikasi yang
merupakan suatu metode statistika nonparametrik yang
diperoleh untuk data prediksi sebesar 69,14 persen.
dapat menggambarkan hubungan antara variabel respon
Kata Kunci —Klasifikasi, CART, kanker serviks, rekurensi (dependen) dengan satu atau lebih variabel prediktor
(variabel independen). Tujuan utama CART adalah untuk
I. PENDAHULUAN mendapatkan suatu kelompok data yang akurat sebagai
menggunakan algoritma penyekatan rekursif secara biner Pengembangan pohon akan berhenti apabila pada simpul
(binary recursive partitioning) [11]. terdapat pengamatan berjumlah kurang dari atau sama
Ilustrasi dari struktur pohon klasifikasi ditunjukkan pada dengan 5 (n ≤ 5) [5]. Selain itu, proses pembentukan
Gambar 1. Simpul awal disebut parent note dinotasikan t1, pohon juga akan berhenti apabila sudah mencapai
simpul dalam dinotasikan dengan t2, t3, t4, t7, t9 dan t10, serta batasan jumlah level yang telah ditentukan atau tingkat
simpul akhir (terminal nodes) dinotasikan dengan t5, t6, t8, kedalaman (depth) dalam pohon maksimal.
t11, t12, t13, t14, dan t15 dimana setelahnya tidak ada lagi c. Penandaan Label Kelas
pemilahan. Penentuan label kelas pada simpul terminal berdasarkan
CART akan menghasilkan pohon klasifikasi jika variabel aturan jumlah terbanyak, yaitu jika
respon mempunyai skala kategorik dan akan menghasilkan N j t (3)
p j0 | t max
pohon regresi jika variabel respon berupa data kontinu [6]. j
N t
Tujuan utama CART adalah untuk mendapatkan suatu Label kelas untuk simpul terminal t adalah j0 yang
kelompok data yang akurat sebagai penciri dari suatu memberikan nilai dugaan kesalahan pengklasifikasian
pengklasifikasian. pada simpul t yang paling kecil sebesar r(t) = 1 - maxj
p(j|t).
t1 2. Pemangkasan pohon klasifikasi
Pemilah 1 Pohon yang dibentuk dengan aturan pemilah dan kriteria
t2
goodness of split berukuran sangat besar karena penghentian
t3
pohon berdasarkan banyaknya amatan pada simpul terminal
Pemilah 2 Pemilah 3 atau besarnya tingkat kehomogenan. Ukuran pohon yang
t4 t5 t6 t7 besar dapat dapat memunculkan adanya overfitting, akan
Pemilah 5 Pemilah 6 tetapi apabila pengamatan pohon dibatasi dengan ketepatan
Pemilah 4
t8 t12 t13
batas tertentu, maka dapat terjadi kasus underfitting. ukuran
t9 t10 t11
pohon yang layak dapat dilakukan dengan pemangkasan
Pemilah 7 Pemilah 8
pohon dengan ukuran cost complexity minimum [5].
~
R T RT T
t14 t15
t16 t17 (4)
Sumber: Breiman L., Friedman J.H., Olshen R.A., & Stone C.J. (1993).
Clasification and Regression Trees (CART) merupakan kombinasi linear biaya dan kompleksitas
Gambar 1. Struktur Pohon Klasifikasi pohon yang dibentuk dengan menambahkan cost penalty
bagi kompleksitas terhadap biaya kesalahan klasifikasi
Algoritma CART melalui tiga tahapan, yaitu pembentu- pohon. Selanjutnya, dilakukan pencarian pohon bagian
kan pohon klasifikasi, pemangkasan pohon klasifikasi dan T(α)<Tmax yang meminimumkan yaitu
penentuan pohon klasifikasi optimum. R T min T T R T (5)
1. Pembentukan pohon klasifikasi max
Tahap inidiawali dengan menentukan variabel dan 3. Penentuan pohon klasifikasi optimum
threshold untuk dijadikan pemilah tiap simpul. Tahapan Penduga pengganti yang sering digunakan apabila
pembentukan pohon klasifikasi terdiri dari: pengamatan yang ada tidak cukup besar adalah Cross
a. Pemilahan Pemilah Validation Estimate. Pengamatan dalam L dibagi secara
Data yang digunakan merupakan sampel data learning. random menjadi V bagian yang saling lepas dengan ukuran
Himpunan bagian yang dihasilkan dari proses pemilahan kurang lebih sama besar untuk setiap kelas. Pohon T (v)
harus lebih homogen dibandingkan pemilahan sebelum- dibentuk dari sampel learning ke-v dengan v=1,2,…,V.
nya. Fungsi keheterogenan yang digunakan adalah dimisalkan d(v)(x) adalah hasil pengklasifikasian, maka
Indeks Gini karena akan selalu memisahkan kelas penduga sampel uji untuk R(Tt(v)) adalah sebagai berikut.
RTt ( v ) X d ( v ) xn j n
N
1
dengan anggota paling besar/kelas terpenting dalam
simpul terlebih dahulu. Fungsi Indeks Gini ditunjukkan
N 2 xn , jn Lv
(6)
pada persamaan (1).
Dengan N v N adalah jumlah pengamatan dalam Lv.
it p j | t pi | t , i j (1) V
i , j 1 B. Ukuran Ketepatan Klasifikasi
Dengan p(j|t) adalah proporsi kelas j pada simpul t dan Ketepatan klasifikasi digunakan untuk mengetahui
p(i|t) adalah proporsi kelas i pada simpul t. apakah data diklasifikasikan dengan benar atau tidak [12].
Pemilahan yang terpilih akan membentuk suatu Beberapa cara yang umum digunakan untuk mengukur
himpunan kelas yang disebut simpul. Simpul tersebut ketepatan klasifikasi adalah melalui perhitungan APER,
akan melakukan pemilahan secara rekursif sampai sensitivity, specivicity, dan akurasi. Tabel untuk menghitung
diperoleh terminal nodes. Tahapan berikutnya adalah ketepatan klasifikasi ditunjukkan pada Tabel 1.
menentukan kriteria goodness of split untuk
mengevaluasi pemilah dari pemilah s pada simpul t Tabel 1. Ketepatan Klasifikasi
dengan rumus: Observasi Prediksi Y
Total
s, t i s, t i t p L i t L p R i t R (2) Y
1
1
n11
2
n12 N1.
Pemilah yang menghasilkan ϕ(s,t) lebih tinggi 2 n21 n22 N2.
merupakan pemilah terbaik karena mampu mereduksi Total N.1 N.2 N
heterogenitas lebih tinggi.
b. Penentuan Simpul Terminal
JURNAL SAINS DAN SENI ITS Vol. 4, No.2, (2015) 2337-3520 (2301-928X Print)
D213
50,62 untuk pasien yang tidak rekuren dan 49,346 pada Gambar 7 menjelaskan bahwa mayoritas penyakit kanker
pasien rekuren, begitu juga dengan median dan usia serviks yang diderita oleh pasien bukan merupakan penyakit
minimumnya. Penjelasan lebih lengkap mengenai penyerta, melainkan sebagai penyakit utama, yang
karakteristik usia pasien dapat dilihat di Tabel 3. ditunjukkan oleh persentase sebesar 94,57 persen atau
Selanjutnya, deskripsi faktor status anemia, stadium sebanyak 766 pasien.
kanker serviks, jenis terapi yang dijalani pasien, status
komplikasi dan status penyakit penyerta disajikan dengan
pie chart berikut.
sensitivitas dan spesifisitas masing-masing sebesar 72,96 [2] Nurlaila, I dan Hadi, Miftachul. (2014). Kanker: Pertumbuhan
Terapi dan Nonmedis. Diperoleh dari:
persen dan 81,22 persen.
http://www.nano.lipi.go.id/utama.cgi?artikel&1187593839.
Sedangkan ketepatan klasifikasi untuk data prediksi Diakses tanggal 27 Maret 2015
ditunjukkan pada Tabel 7. [3] Almarogi, S. (2015). Gejala dan Penyebab Kanker Serviks.
Tabel 7. Ketepatan Klasifikasi Untuk Data Prediksi Diperoleh dari : http://www.infosehat.id/ gejala-penyebab-
Prediksi kanker-serviks/.Diakses tanggal 26 Maret 2015
Observasi Tidak Rekuren Total [4] Meilinda, T. (2014). Kanker serviks. Diperoleh dari:
http://mahasiswa.ung.ac.id/811412083/home/2014/12/9/makalah-
rekuren
kanker-serviks.html. Diakses tanggal: 27 Maret 2015
Tidak rekuren 222 120 342 Chamim. (2006). Buku Acuan Nasional Onkologi. In: M Farid
[5]
Rekuren 130 338 468 Aziz, Adrijojo, Abdul Bari Saifuddin, editors. Penentuan stadium
Total 352 458 810 klinik dan pembedahan kanker ginekologi. Jakarta : Yayasan
Perhitungan akurasi, sensitivity dan specificity untuk Bina Pustaka Sarwono Prawirohadjo. p. 173 - 181
[6] Mauliddah, N. F. (2014). Kualitas Hidup Berdasarkan
data testing adalah sebagai berikut. Karakteristik Pasien Kanker Serviks yang telah Melakukan
Akurasi 222 338 100% 69,14% Terapi di RSUD Dr. Soetomo Surabaya. Skripsi Fakultas
Kesehatan Masyarakat Universeitas Jember
810 Dewi, C. C. (2013). Pengaruh Terapi Menulis Terhadap
[7]
Sensitivity 222 100% 64,91% Penurunan Tingkat Kecemasan Pasien Kanker Serviks Stadium
Lanjut di POSA RSUD Dr. Soetomo Surabaya. Skripsi Program
342 Studi Pendidikan Bidan Universitas Airlangga
Specificity 338 100% 72,22% [8] Breiman L., Friedman J.H., Olshen R.A., & Stone C.J. (1993).
468 Classification And Regression Trees. New York: Chapman And
Hall
Dari perhitungan yang dilakukan, nilai akurasi untuk Nuriyah. (2013). Perbandingan Metode Chi-Square Automatic
[9]
data prediksi sebesar 69,14 persen, maka dapat dikatakan Interaction Detection (CHAID) dan Classification And
bahwa pohon optimal yang terbentuk sudah baik dan sesuai Regression Trees (CART) dalam Menentukan Klasifikasi Alumni
jika digunakan untuk mengklasifikasikan data baru. UIN Sunan Kalijaga Berdasarkan Masa Studi. Skripsi Program
Sarjana Fakultas Sains dan Teknologi Universitas Islam Negeri
Sedangkan nilai sensitivity dan specificity masing-masing Sunan Kalijaga
adalah sebesar 64,91 persen dan 72,22 persen. [10] Novitasari, D.A. (2014). Analisis Survival pada Data Rekurensi
dengan Menggunakan Counting Process Approach dan Model
V. KESIMPULAN / RINGKASAN PWP-GT Study Kasus: Data Kanker Serviks di Rumah Sakit Dr.
Soetomo Surabaya. Tesis Program Magister Jurusan Statistika
Karakteristik pasien kanker serviks berdasarkan status Institut Teknologi Sepuluh Nopember
rekurensi kanker serviks diperoleh bahwa mayoritas pasien [11] Lewis, M.D dan Roger, J. (2000). An Introducion to
mengalami rekuren kanker servik. Rata-rata usia pasien Classification and Regression Trees (CART) Analysis. Annual
yang tidak rekuren adalah 50,62 tahun dan pada pasien yang Meeting of Society For Academic Emergency. California, UCLA
Medical Center
rekuren sebesar 49,32 tahun. Selain itu, mayoritas pasien Agresti, A. (2002). Categorical Data Analysis. John Wiley and
[12]
menderita stadium III, menjalani pengobatan kemoterapi, Sons, Inc., New York
tidak ada komplikasi dan bukan merupakan penyakit [13] Schneider, J., 1997. Carnegie Mellon University : School of
penyerta. Klasifikasi CART menghasilkan rata-rata nilai Computer Science. [Online] Available at:
http://www.cs.cmu.edu/~schneide/tut5/node42.html
akurasi untuk data learning sebesar 77,75 persen dan 69,14 Yamato, K., Fen, J., Kobuchi, H., Nasu, Y., Yamada,T.,
[14]
persen untuk data prediksi. Jumlah terminal nodes yang Nishihara, T., et al. (2006). Induction of Cell Death in Human
terbentuk sebanyak 5, yaitu 4 terminal nodes Papillomavirus 18-Positive Cervical Cancer Cells by E6 SIRNA.
diklasifikasikan sebagai pasien yang tidak rekuren kanker Cancer Gene Therapy. 13: 234-241.
[15] Dunst, J., Kuhnt, T.,Strauss, H.,Krause, U., Pelz, T., Koelbl, H.,
serviks, dan 1 terminal nodes diklasifikasikan sebagai et al. (2003). Anemia in Cervical Cancers : Impact on Survival,
pasien yang rekuren kanker serviks.karakteristik pasien Pattern of Relapse, and Association with Hipoxia and
berdasarkan faktor-faktor yang mempengaruhi rekurensi Angiogenesis. International Journal of Radiation. 56. 778 – 787
kanker serviks adalah. [16] Loka, A., Tsukuma, H., Ajiki, W., Oshima, A. (2005). Influence
Of Age On Cervical Cancer Survival in Japan. Journal Oxford
- Karakteristik pasien yang tidak rekuren adalah pasien JJCO. 35. 464 – 469
yang menjalani pengobatan transfusi PRC, kemoterapi & [17] Lee, Y-Y., Kim, T-J., Kim, J-Y., Choi, C, H., Do, I-G., Song, S,
transfusi PRC dan operasi; pasien yang menjalani Y., et al (2013). Genetic Profiling to Predict Recurrence of Early
pengobatan kemoterapi yang berusia ≤ 72.5 tahun dan Cervical Cancer. Journal Gynecologic Oncology. 13. 650 – 654
[18] Matsuura, Y., Kawagoe, T., Toki, N., Tanaka, M., Kashimura,
ada anemia; pasien yang menjalani pengobatan M. (2006). Long-standing Complications after Treatment for
kemoterapi yang berusia ≤ 72.5 tahun, tidak ada anemia Cancer of the Uterine Cervix – Clinical Significance of Medical
dan kanker serviks yang dideritanya merupakan penyakit Examination at 5 years after Treatment. International Journal of
penyerta; dan pasien yang menjalani pengobatan Gynecological Cancer. 16. 294 – 297
[19] Choi, M., Fuller, C, D., Thomas, C. R., Wang, S, J. (2008).
kemoterapi dan berusia > 72.5 tahun Conditional Survival In Ovarian Cancer : Result From The SEER
- Karakteristik pasien yang rekuren adalah pasien yang Dataset 1988 – 2001. Journal Gynecologic Oncology. 109. 203 –
menjalani pengobatan kemoterapi yang berusia ≤ 72.5 209
tahun, tidak ada anemia dan kanker serviks yang [20] Novitasari, D.A. (2014). Analisis Survival pada Data Rekurensi
dengan Menggunakan Counting Process Approach dan Model
dideritanya bukan penyakit penyerta. PWP-GT Study Kasus: Data Kanker Serviks di Rumah Sakit DR.
Soetomo Surabaya. Tesis Program Magister Jurusan Statistika
Institut Teknologi Sepuluh Nopember
DAFTAR PUSTAKA