2,November2013
ABSTRAK
Kanker payudara merupakan kanker yang paling umum menyerang wanita dan menjadi
kanker penyebab kematian utama bagi wanita di seluruh dunia. Penyebab dari kanker
payudara masih belum dapat dipastikan sehingga metode preventif yang spesifik untuk
penyakit ini juga belum dapat ditentukan, oleh karena itu diagnosis terhadap kanker
payudara sedini mungkin menjadi sangat penting bagi para dokter dan tenaga medis
untuk menyelamatkan pasien maupun orang-orang yang memiliki faktor risiko kanker
payudara. Beberapa penelitian telah dikembangkan dengan ide dasar
mengklasifikasikan kanker payudara berdasarkan rekaman gambar radiologi dan usia
pasien terhadap hasil biopsi. Berdasarkan keunggulan smooth SVM (SSVM) serta
potensi MARS dalam menyelesaikan permasalahan diagnosis kanker payudara, tulisan
ini mengkaji dan memaparkan kedua metode tersebut digunakan untuk
mengklasifikasikan kanker payudara ke dalam dua kelompok yaitu kelompok
malignant dan kelompok benign. Secara umum baik SSVM maupun MARS mampu
menghasilkan tingkat akurasi yang sama-sama tinggi. Tingkat akurasi kedua metode
dalam mendiagnosis kanker payudara ke dalam kelompok benign dan malignant yang
cukup tinggi dipercaya dapat mendukung prosedur pemeriksaan dan diagnosis kanker
payudara.
37
Statistika,Vol.1,No.2,November2013
38
Statistika,Vol.1,No.2
2,Novemberr2013
C 1 (w, b) :=
min ' + (w'w + b 2 ) min
m
( w ,b )R p +1
(2.66)
w ,b , 2 2
C 1
denggan kendala w + eb) + e (1)
D(Aw min
m || p(e D( Aw eb), ) ||22 + ( w'w + b 2 ) (5)
(w, )R p +1
2 2
0
Solusi problem 2.1 adalah
Secara um
mum, probleem optimasii
= (e D( A
Aw + eb))+ a
(2) (2.7)
VM dapat ditulis
SSV d sebaggai berikut:
di mana meruppakan variaabel slack yang
y ( w , b ) :=
miin
menggukur k
kesalahan klasifikkasi. (u ,b )R p +1
min
m
Permmasalahan nonlinier ini daapat ( u ,b )R p +1
kerrnel .
39
Statistika,Vol.1,No.2,November2013
f ( x ) =
Km =3
fijk ( xi , x j , xk ) + ... (11)
Penjumlahan pertama adalah untuk
semua basis fungsi yang mengandung
satu variabel prediktor. Penjumlahan
kedua untuk semua basis fungsi yang
mengandung tepat dua variabel prediktor,
menunjukkan (jika ada) interaksi dua-
Gambar 3. UD dua tahap: 13-titik UD pada tahap variabel. Sama halnya dengan
pertama dan 9-titik UD pada tahap kedua penjumlahan ketiga yang menunjukkan
40
Statistika,Vol.1,No.2
2,Novemberr2013
posittive (sebbenarnya positif dan Gammbar 4. Kurvaa ROC dari dua pengujian diag gnosis
diklaasifikasikan positif), fp adalah false fa (A dan
d B), masing--masing uji paliing sedikit mem
miliki
AUCC seluas 0,50
posittive (sebeenarnya negatif n tettapi
diklaasifikasikan positif), tn t adalah true t Kanker
K payudara (Carcinoma
negaative (sebbenarnya negatif dan maammae) a
adalah suuatu pen
nyakit
diklaasifikasikan negatif) dan fn yaitu neo
oplasma yang berasal dari
falsee negative (sebenarnya
( a positif tettapi parrenchyma. Kanker paayudara dittandai
diklaasifikasikan negatif). den
ngan adanyya pertumbbuhan sel yang
abn
normal padda jaringan payudara. Pada
41
Statistika,Vol.1,No.2,November2013
42
Statistika,Vol.1,No.2,November2013
43
Statistika,Vol.1,No.2,November2013
Penentuan variabel yang berpengaruh posisi kelainan (X5) hanya muncul dalam
terhadap klasifikasi dilakukan dengan model untuk data training 90% (Tabel 6).
SVM 1-norm dengan menghitung w. Akurasi yang dihasilkan oleh model
Tabel 4.3 menunjukkan bahwa pada data MARS untuk data training berukuran 70,
dengan ukuran training 70, 80 dan 90% 80 dan 90% sama dengan akurasi yang
variabel prediktor yang menjelaskan dihasilkan oleh SSVM pada data training
letak kelainan pada payudara (X5) tidak berukuran sama secara berurutan.
berpengaruh dalam penentuan kelas
malignansi. Evaluasi Performansi Diagnosis
Kanker Payudara dengan SSVM dan
Tabel 5.Hasil perhitungan nilai w dengan SVM 1-norm MARS
Data 50:50 0:30 80:20 90:10
C 2,15 0,56 0,56 0,56 Evaluasi klasifikasi dapat dilihat dari
w 0,0396 0,0245 0,0177 0,0216
nilai sensitivity dan specificity yang
1
w
ditunjukkan pada Tabel 7. Tingkat
0,6980 0,4657 0,4645 0,4838
2
akurasi yang dihasilkan dari data 5-fold
w 0,3218 0,4559 0,4433 0,4536
3 cross validation adalah 99,63% untuk
w 0,8020 0,6128 0,6631 0,6436 SSVM dan 95,88% untuk MARS.
4
w 0,0495 0 0 0
5
Tabel 7. Sensitivity dan specificity dari hasil klasifikasi
SSVM dan MARS
Diagnosis Kanker Payudara dengan Sensitivity Specificity
Data Akurasi (%)
MARS (%) (%)
MAR MAR
Setiap data training memiliki model SSVM
S
SSVM
S
SSVM MARS
MARS yang berbeda. Data training 5-
99,63 95,88 - - - -
fold
dengan ukuran 50% dan 70%, sesuai
50:50 94,78 97,76 94,19 98,84 95,83 95,83
dengan perolehan GCV minimum,
memiliki derajat interaksi maksimum 70:30 96,25 96,25 97,96 97,96 93,55 93,55
dua, sedangkan data training berukuran 80:20 94,34 94,33 100,00 100,00 86,36 86,36
80% dan 90% memiliki derajat 90:10 96,15 96,15 100,00 100,00 88,89 88,89
maksimum interaksi sebanyak tiga.
Tabel 6. Akurasi dan variabel prediktor dalam model
MARS
Data Akurasi Variabel prediktor yang
terpartisi (%) ada dalam model
Sensitivity
5- fold cv 95,88 -
X1, X 2 , X 3 , dan X 5
90 96,15
Sensitivity
44
Statistika,Vol.1,No.2,November2013
Kurva ROC (receiver operating Secara umum untuk partisi data 50:50,
characteristics) juga disajikan pada 70:30, 80:20 maupun 90:10, SSVM tidak
Gambar 6. Area di bawah kurva (AUC) lebih baik dibandingkan MARS. Hal ini
dihitung, semakin luas area menunjukkan menunjukkan bahwa kedua metode sama
performansi klasifikasi yang semakin baiknya dalam menentukan kelas
baik. Secara umum berdasarkan kurva malignansi kanker payudara. Tingkat
ROC pada Gambar 6 (a sampai dengan akurasi kedua metode dalam
d), klasifikasi menggunakan metode mendiagnosis kanker payudara ke dalam
SSVM lebih baik performansinya sebab kelompok benign dan malignant yang
cukup tinggi dipercaya dapat mendukung
wilayah di bawah kurva lebih luas
prosedur pemeriksaan dan diagnosis
dibandingkaan MARS pada dua kurva
kanker payudara.
ROC terakhir.
Luas wilayah di bawah kurva secara
akurat diringkas dalam Tabel 8. DAFTAR PUSTAKA
Berdasarkan luasan-luasan tersebut dapat
ditarik kesimpulan bahwa pada ukuran [1]Ferlay J, Shin HR, Bray F, Forman D,
data training yang lebih besar, SSVM Mathers C, Parkin DM, (2008),
memiliki performansi lebih baik daripada GLOBOCAN 2008 v1.2, Cancer
MARS untuk mengklasifikasikan Incidence and Mortality Worldwide:
diagnosis kanker payudara pada IARC Cancer Base No. 10
penelitian ini. [Internet]. Lyon, France: International
Tabel 8 Luas area di bawah kurva ROC hasil Agency for Research on Cancer 2010.
klasifikasi SSVM dan MARS Tersedia pada http://globocan.
Data
AUC AUC iarc.fr. Diakses terakhir Juni 2012.
SSVM MARS
50:50 0,950 0,973 [2]World Health Ranking,
70:30 0,958 0,958 http://www.worldlifeexpectancy.com/
80:20 0,932 0,932 country-health-profile/indonesia,
90:10 0,944 0,944 Diakses terakhir pada Juli 2012.
[3]Gajdos C, Tartter PI, Bleiweiss IJ,
Hermann G, de Csepel J, Estabrook A,
KESIMPULAN Rademaker AW, (2002),
Mammography appearance of
Pencegahan terhadap tingginya angka
nonpalpable breast cancer reflects
penderita kanker payudara di Indonesia
pathologi characteristics, Annals of
dapat dilakukan dengan mengupayakan
Surgery, Vol. 235, No. 2, hal. 246
prosedur identifikasi dan diagnosis
251.
kelainan pada payudara secara efisien
dan akurat. Implementasi SSVM dan [4]Subashini TS, Ramalingam V,
MARS pada penelitian ini menunjukkan Palanivel S, (2009), Breast mass
bahwa metode machine learning dapat classification based on cytological
mengklasifikasikan diagnosis kanker patterns using RBFNN and SVM,
payudara dengan tingkat akurasi yang Expert Systems and Applications, 36,
cukup tinggi (lebih dari 90%). hal. 5284 5290.
Berdasarkan tingkat akurasi yang [5]Shi X, Cheng HD, Hu L, Ju W, Tian J,
dihasilkan melalui validasi silang (cross (2010), Detection and Classification of
validation) dengan 5-fold, SSVM masses in breast ultrasound images,
menghasilkan akurasi sebesar 99,63% Digital Signal Processing, 20, hal. 824
sedangkan MARS menghasilkan 95,88%. 836.
45
Statistika,Vol.1,No.2,November2013
[6]Chen HL, Yang B, Liu J, Liu DY, Berdasarkan Hasil Mamografi, Studi
(2011), A support vector machine Kasus: RS X Surabaya, Skripsi ITS.
classifier with rough set-based feature [13] Pertiwi YD, (2012), Klasifikasi
selection for breast cancer diagnosis,
Diagnosa Kanker Payudara (Patologi
Expert Systems with Applications, 38,
Anatomi) Pasien Kanker Payudara di
hal. 9014 9022.
RS X Surabaya dengan Pendekatan
[7]Addeh A dan Ebrahimzadeh A, CART, Skripsi ITS.
(2012), Breast Cancer Recognition [14] Huang CM, Lee YJ, Lin DKJ,
Using a Novel Hybrid Intelligent Huang SY, (2007), Model selection
Method, Journal of Medical Signal for support vector machie via uniform
and Sensors, Vol. 2, No. 2, hal. 22 design, Computational Statistics and
30. Data Analysis, Vol. 52, hal. 335
[8]Purnami SW dan Embong A, (2008), 346.
Feature selection and classification of [15] Hair Jr JF, Black WC, Babin BJ,
breast cancer diagnosis based on Anderson RE, (2010), Multivariate
SVM, The 3rd International Data Analysis 7th Ed, Prentice Hall.
Symposium of Information Technology
(ITSIM08) KLCC, Kuala Lumpur [16] Yuan Y, (2011), Multiple
Malaysia. Imputation Using SAS Software,
Journal of Statistics Software, Vol. 45,
[9]______, (2008) Smooth Support No. 6.
vector machine for breast cancer
classification, The 4th IMT-GT 2008 [17] Rubin DB, (1987), Multiple
Conference of Mathematics, Statistics Imputation for Nonresponse Surveys,
and Its Application (ICMSA 2008), John Wiley and Sons.
Banda Aceh, Indonesia. [18] Lee YJ dan Mangasarian OL,
[10] Purnami SW, Embong A, Zain (2001), A Smooth Support Vector
JM, (2009) Application of data mining Machine, Journal of Computational
technique using best polynomial Optimization and Applications, 20,
smoot support vector machine in hal. 5 22.
breast cancer diagnosis, International [19] Zhu J, Rosset S, Hastie T, Tibshirani
Conference in Robotics, Vision, Signal R,(2003), 1-norm support vector
Symposisum and Power Application machines, Neural Information
(Rovisp 2009) Langkawi Kedah, Proceeding Systems 16.
Malaysia.
[20] Friedman JH, (1991), Multivariate
[11] Chou SM, Lee TS, Shao YE, adaptive regression splines, Annals of
Chen IF, (2004), Mining the breast Statistics, 19, hal. 1 67.
cancer pattern using artificial neural
networks and multivariate adaptive [21] Breiman L, Friedman JH, Olshen
regression splines, Journal of Expert RA, Stone CJ, (1984), Classification
System with Application, 20, hal. 133 and Regression Trees, Wadsworth,
142. Pacific Grove, CA.
[12] Novianti FA, (2012), Analisis [22] Hastie T dan Tibshirani R,
Diagnosis Pasien Kanker Payudara (1990), Generalized Additive Models,
Menggunakan Regresi Logistik dan Chapman & Hall, London.
Support Vector Machine (SVM) [23] Agresti A, (2006), An
Introduction to Categorical Data
46
Statistika,Vol.1,No.2,November2013
47