Anda di halaman 1dari 6

Jurnal Sains, Teknologi dan Industri, Vol. 13, No. 2, Juni 2016, pp.

168 - 173
ISSN 1693-2390 print/ISSN 2407-0939 online

Pemodelan Pasien Kanker Payudara


Menggunakan Regresi Logistik Biner
(Studi Kasus : Pasien Kanker Payudara di Rumah Sakit Umum Daerah
Arifin Ahmad Pekanbaru)

Rahmadeni1, Eka Safitri2


1,2
Jurusan Matematika Fakultas Sains dan Teknologi UIN Suska Riau, UIN Sultan Syarif Kasim Riau
Jl. HR. Soebrantas No. 155 Simpang Baru, Panam, Pekanbaru, 28293
E-mail: r4dieni@gmail.com

(Received: 29 April 2016; Revised: 20 Juni 2016; Accepted: 20 Juni 2016)

ABSTRAK

Kanker Payudara merupakan salah satu jenis kanker yang tercatat sebagai tingkat tertinggi di dunia.
Pasien kanker payudara memiliki dua kemungkinan, yaitu kanker benign (jinak) dan malignant (ganas). Data
yang digunakan dalam penelitian ini adalah umur, berat badan, dan kadar hemoglobin pasien kanker
payudara yang diambil dari bagian Rekam Medis Rumah Sakit Umum Daerah (RSUD) Arifin Ahmad
Pekanbaru. Adapun parameter , , dan dari distribusi Logistik Biner dapat diestimasi dengan
menggunakan metode Maximum Likelihood Estimation (MLE) dan diperoleh , ,
, dan .

Kata Kunci: benign, kanker payudara, malignant, metode Maximum Likelihood Estimation.

ABSTRACT

Breast cancer is one type of cancer that is listed as the world’s highest level. Breast cancer patients
have two possibilities, namely benign dan malignant cancer. The data used in this research were age, body
weight, and hemoglobin levels o breast cancer patients who were taken from the Medical Record in the
General Hospital Arifin Ahmad Pekanbaru. The parameters , , and of Binary Logistic Distribution
can be estimated using Maximum Likeliood Estimation Method (MLE) and obtained ,
, , and .

Keywords: benign, breast cancer, malignant, Maximum Likelihood Estimation method.

Corresponding Author
Rahmadeni,
Program Studi Matematika, Fakultas Sains dan Teknologi,
Universitas Islam Negeri Sultan Syarfi Kasim Riau,
Email: r4dieni@gmail.com

Pendahuluan pasien kanker payudara meningkat secara drastis


dari tahun ke tahun (Kompas, 2015). Berdasarkan
Saat ini penyakit tidak menular, termasuk Estimasi Globocan, International Agency for
kanker menjadi masalah kesehatan utama baik di Research on Cancer (IARC) Tahun 2012, insiden
dunia maupun di Indonesia.Kanker yang tercatat kanker payudara tercatat sebesar 40,3% per 100.000
sebagai tingkat tertinggi di Indonesia adalah kanker perempuan atau kira-kira 48.998 orang.
yang sering ditemukan pada wanita, yaitu kanker Dari berbagai survei diatas menunjukkan
payudara.Kanker payudara sudah menjadi suatu hal bahwa angka penderita kanker payudara sangat
yang sangat menakutkan bagi kaum wanita baik di tinggi dan akan semakin meningkat untuk tahun-
Indonesia maupun di seluruh dunia.Terutama bagi tahun berikutnya, sehingga perlu adanya
wanita yang berumur antara 30-40 tahun, tingkat penanggulangan dari masalah ini. Diagnosis pasien
kanker payudara mempunyai dua kemungkinan

Journal homepage: http://ejournal.uin-suska.ac.id/index.php/sitekin 168


Jurnal Sains, Teknologi dan Industri, Vol. 13, No. 2, Juni 2016, pp.168 - 173
ISSN 1693-2390 print/ISSN 2407-0939 online

(dikotomi), yaitu benign (jinak) dan malignant ditubuh meningkatkan hormon estrogen dan insulin
(ganas). Dalam hal ini, untuk penelitian tidak hanya yang menjadi penyebab umum kanker payudara.
dapat digunakan dengan regresi linier biasa, tetapi c. Kadar Hemoglobin
dapat digunakan metode regresi logistik biner. Hemoglobin (Hb) adalah protein kompleks
Metode regresi logistik biner dapat digunakan untuk yang ada dalam sel darah merah (eritrosit)
meneliti hubungan antara beberapa variabel mengandung zat besi dan berwarna merah. Kadar
penjelas dengan variabel respon dikotomi. hemoglobin yang normal untuk wanita dalah 11,4
Penelitian tentang kanker payudara sampai 15,1 g/dl, sedangkan untuk pria adalah 3,4
berdasarkan faktor resiko dengan menggunakan sampai 17,7 g/dl. Jika kadar hemoglobin seseorang
regresi logistik pernah dilakukan oleh Purwantaka. yang mengidap kanker payudara terus menurun atau
Ketepatan klasifikasi yang didapatkan dari model rendah, maka akan berdampak kepada keganasan
regresi logistik pada kasus ini hanya sebesar 37%. kanker.
Selain itu telah dilakukan juga beberapa penelitian
tentang diagnosis kanker payudara berbasis Support Regresi Logistik Biner
Vector Machine (SVM) yang memberikan
ketepatan klasifikasi diatas 95%. Dan kemudian Regresi logistik biner merupakan suatu
juga dilakukan analisis perbandingan antara model metode yang digunakan untuk melihat suatu
regresi logistik dan SVM dengan data mamografi hubungan antara beberapa variabel penjelas dengan
pada pasien kanker payudara yang menghasilkan suatu variabel respon dikotomi.Variabel respon
ketepatan klasifikasi pada model regresi logistik biasanya disimbolkan dengan y dan variabel
sebesar 88,72%, sedangkan dengan SVM didapat penjelas/prediktor disimbolkan dengan x, dimana
ketepatan klasifikasi sebesar 94,34% (Novianti, variabel respon berskala biner atau
2012). dikotomus.Dikatakan biner atau dikotomus adalah
karena memiliki dua kategori yaitu 0 dan 1, sangat
Landasan Teori berbeda dengan regresi linier biasa yang variabel
responnya bisa bernilai < 0 atau > 1.
Kanker Payudara Variabel respon mengikuti distribusi
bernouli dengan fungsi probabilitas sebagai berikut:
Kanker payudara adalah suatu penyakit
dimana terjadi pertumbuhan berlebihan atau , (1)
perkembangan tidak terkontrol dari sel-sel jaringan
payudara.payudara wanita terdiri dari lobulus Kemudian Bentuk umum dari model peluang
(kelenjar susu), duktus (saluran susu), lemak dan regresi logistik biner adalah sebagai berikut :
jaringan ikat, pembuluh darah dan limfe. Sebagian
besar kanker payudara bermula pada sel-sel yang (2)
melapisi duktus (kanker duktal), beberapa bermula
di lobulus (kanker lobular), serta sebagian kecil
bermula dijaringan lain (Novianti, 2012).Tanda Maksimum Likelihood
awal dari kanker payudara biasanya dengan
terdapatnya benjolan pada payudara yang pada Maksimum likelihood adalah metode
mulanya hanya kecil kemudian semakin lama pendugaan yang digunakan untuk memaksimumkan
semakin membesar, dan ketika ditekan tidak terasa fungsi likelihood. Sedangkan fungsi likelihood itu
nyeri. sendiri adalah fungsi densitas bersama (joint density
Beberapa variabel yang penulis ambil dari function) dari variabel random dan
data pasien kanker payudara pada bagian Rekam dinyatakandalam bentuk . Jika
Medik di RSUD Arifin Ahmad Pekanbaru adalah tetap, maka fungsi likelihood adalah
sebagai berikut : fungsi dari parameter dan dinotasikan dengan
a. Umur dan likelihoodnya dapat ditulis sebagai
Faktor utama kanker payudara adalah berikut:
bertambahnya umur.Wanita dengan umur 50-69
tahun adalah ketegori umur yang paling beresiko
terkena kanker payudara, terutama yang mengalami
menopause terlambat. (3)
b. Berat badan
Wanita yang memiliki berat badan berlebih
atau biasa disebut obesitas juga memiliki resiko
terkena kanker payudara, karena kelebihan lemak

Copyright © 2016, SITEKIN, ISSN 2407-0939 169


Jurnal Sains, Teknologi dan Industri, Vol. 13, No. 2, Juni 2016, pp.168 - 173
ISSN 1693-2390 print/ISSN 2407-0939 online

Metode Newton Raphson (ada pengaruh variabel bebas ke-i

Metode iterasi Newton-Raphson, yaitu suatu terhadap variabel terikat.


proses iterasi yang digunakan untuk menyelesaikan 2. Statistik uji yang digunakan adalah uji Wald
persamaan-persamaan non-linier. Proses iterasi :
adalah suatu teknik penghampiran yang berulang-
ulang dimana setiap pengulangan disebut iterasi.
Jika hampiran tersebut menghasilkan suatu
pemecahan yang sangat dekat dengan pemecahan (5)
persamaan yang tidak linier tersebut, maka iterasi Keterangan:
telah mengalami proses konvergen. = nilai statistik uji wald

Uji Hipotesis = estimasi parameter ke-i


Uji hipotesis statistik dilakukan untuk = standar error estimasi ke-i
menentukan apakah variabel prediktor dalam model
signifikan atau berpengaruh nyata terhadap variabel
respon. Uji hipotesis dilakukan dengan cara sebagai
berikut : Metodologi Penelitian
a. Uji Serentak (simultan)
Uji serentak atau disebut juga uji model Chi- 1. Data
square digunakan untuk menguji parameter hasil Data yang digunakan adalah data pasien
estimasi secara bersama.Langkah-langkah penyakit kanker payudara Tahun 2014 pada bagian
pengujian adalah sebagai berikut: Rekam Medis di Rumah Sakit Umum Daerah
1. (secara (RSUD) Arifin Ahmad Pekanbaru. Kemudian
menentukan variabel-variabel yang akan digunakan,
simultan variabel bebas tidak berpengaruh yaitu :
terhadap variabel terikat) a. Variabel terikat adalah status pasien dengan
paling tidak ada satu , untuk dua kategori yaitu kanker payudara jinak
dengan kode 0 dan kanker payudara ganas
(secara simultan variabel bebas dengan kode 1.
b. Variabel bebas adalah umur , berat
berpengaruh terhadap variabel terikat)
2. Statistik uji yang digunakan adalah uji G badan , kadar hemoglobin .
atau Likelihood ratio test :
(4) 2. Metodologi Penelitian
Metodologi penelitian dalam penelitian ini
adalah sebagai berikut :
Keterangan :
1. Mengestimasi parameter dari regresi yang
= banyaknya observasi yang berkategori 1 digunakan dengan metode Maximum
Likelihood Estimation (MLE) dan iterasi
= banyaknya observasi yang berkategori 0 menggunakan metode Newton Raphson
dengan langkah-langkah sebagai berikut :
= banyaknya observasi a. Memasukkan nilai dugaan awal yang
sebelumnya diperoleh dari program SPSS 16.
b. Mencari turunan parsial terhadap parameter
b. Uji Parsial dan matriks jacobi.
Dalam uji parsial ini, akan dilakukan c. Mendapatkan invers dari matriks jacobi
pengujian terhadap setiap variabel bebas secara d. Selanjutnya melakukan iterasi dengan cara
individual sehingga dapat dilihat apakah suatu sebagai berikut:
variabel bebas layak untuk masuk kedalam model
atau tidak. Langkah-langkahnya adalah sebagai
berikut :
1. (tidak ada pengaruh variabel (6)
bebas ke-i terhadap variabel terikat.

\Journal homepage: http://ejournal.uin-suska.ac.id/index.php/sitekin 170


Jurnal Sains, Teknologi dan Industri, Vol. 13, No. 2, Juni 2016, pp.168 - 173
ISSN 1693-2390 print/ISSN 2407-0939 online

(7) jacobian yang diperoleh dengan mencari turunan


parsialnya dari persamaan yang homogen.
Kemudian,Penulis menyelesaikan proses
iterasi menggunakan software atau program maple
13. Proses hampiran iterasi telah selesai pada
(8) iterasi kelima dengan nilai parameter yaitu
Proses hampiran iterasi ini dapat diteruskan hingga , , , dan
setiap parameter memberikan selisih yang cukup . Selanjutnya untuk menentukan nilai
kecil terhadap parameter sebelumnya atau mencapai parameter yang mendekati nilai sebenarnya
konvergen. dilakukan dengan bantuan program SPSS 16, dapat
kita lihat pada tabel output SPSS 16 berikut :
2. Pengujian hipotesis terhadap variabel bebas
yaitu umur , berat badan , dan kadar Tabel 1. Nilai parameter
B
Step Umur .104
hemoglobin secara serentak (simultan)
1a Berat_badan .053
Kadar_Hb -.198
serta secara individual (parsial) seperti yang Constant -3.757
sudah dijelaskan pada landasan teori.
Uji Hipotesis
Hasil dan Pembahasan
Uji hipotesis statistik dilakukan untuk
Metode Maximum Likelihood Estimation (MLE) menentukan apakah variabel prediktor dalam model
signifikan atau berpengaruh nyata terhadap variabel
Metode Maximum Likelihood Estimation respon. Uji hipotesis dilakukan dengan cara sebagai
(MLE) digunakan untuk mengestimasi parameter berikut :
distribusi logistik dengan cara mengalikan fungsi c. Uji Serentak (simultan)
densitas peluangnya. Distribusi logistik mempunyai Uji serentak atau disebut juga uji model Chi-
satu parameter yaitu parameter bentuk dengan square digunakan untuk menguji parameter hasil
estimasi secara bersama. Langkah-langkah
fungsi densitasnya dinyatakan sebagai berikut : pengujian adalah sebagai berikut:
, dimana nilai 1. Hipotesis
(secara
0 ; 1.
simultan variabel bebas tidak berpengaruh
Dan akan didapat fungsi log-likelihood seperti terhadap variabel terikat)
berikut : paling tidak ada satu , untuk

(secara simultan variabel bebas

berpengaruh terhadap variabel terikat)


(9) maka,
Tidak adanya pengaruh umur, berat
Kemudian untuk memaksimumkan fungsi log like- badan, dan kadar hemoglobin terhadap
lihood di atas, yang harus dilakukan adalah dengan seseorang mengidap penyakit kanker
cara mencari turunan parsial pada persamaan diatas payudara ganas atau jinak.
terhadap 4 parameter yaitu , , dan . Adanya pengaruh umur, berat badan,
dan kadar hemoglobin terhadap seseorang
Selanjutnya, akan terbentuk empat persamaan yang mengidap penyakit kanker payudara ganas
homogen yaitu atau jinak
2. Uji serentak menggunakan uji Chi-Kuadrat
( ), berdasarkan pengujian yang dilakukan
(10) menggunakan program SPSS 16 maka
Selanjutnya dari persamaan-persamaan yang didapat nilai adalah sebagai
didapat, akan dicari matriks jacobian seperti
penjelasan berikutnya.Sebelum proses iterasi berikut :
dilakukan, terlebih dahulu akan didapatkan matriks

Copyright © 2016, SITEKIN, ISSN 2407-0939 171


Jurnal Sains, Teknologi dan Industri, Vol. 13, No. 2, Juni 2016, pp.168 - 173
ISSN 1693-2390 print/ISSN 2407-0939 online

Tabel 2. Hasil uji Chi-Kuadrat Adanya pengaruh umur, berat badan,


Chi-square Df Sig dan kadar hemoglobin terhadap seseorang
Step 1 13.434 3 .004 mengidap penyakit kanker payudara ganas
Step 13.434 3 .004 atau jinak
13.434 3 .004
Block
3. Uji serentak menggunakan uji Wald dengan
nilai α = 0,05, berdasarkan pengujian yang
dilakukan menggunakan program SPSS
16dan nilai signifikan masing-masing
variabel adalah :
Sig 1 = 0.003 < 0,05 terima
Maka, = 13,434 > = 7,815
Tolak Sig 2 = 0,339 > 0,05 tolak
Artinya, diketahui bahwa adanya pengaruh dari
umur, berat badan dan kadar hemoglobin terhadap Sig 3 = 0,299 > 0,05 tolak
seseorang mengidap penyakit kanker payudara
ganas atau jinak. Dilihat dari hasil uji diatas, dapat ditarik
3. Nilai determinan (R2) digunakan untuk kesimpulan sebagai berikut :
melihat seberapa besar pengaruh dari a. Untuk variabel (umur), tidak ada
variabel penjelas terhadap variabel respon.
Menggunakan program SPSS 16 didapat pengaruh yang signifikan terhadap
nilai dari R2 adalah sebagai berikut: seseorang mengidap penyakit kanker
payudara ganas atau jinak.
Tabel 3.Nilai determinan b.Untuk variabel (berat badan), adanya
Predicted
Pasien Percentage pengaruh yang signifikan terhadap
Observed 0 1 correct seseorang mengidap penyakit kanker
Step 0 pasien 0 payudara ganas atau jinak.
1 0 19 0
Overal 0 69 100.0 c. Untuk variabel (kadar hemoglobin),
Penrcentage 78.4
adanya pengaruh yang signifikan
terhadap seseorang mengidap penyakit
Berdasarkan tabel, dapat dilihat bahwa nilai
kanker payudara ganas atau jinak.
dari R2 adalah 78,4. Artinya terdapat
pengaruh sebesar 78,4% dari umur, berat
Selanjutnya berdasarkan hasil pengujian
badan, dan kadar hemoglobin terhadap
menggunakan SPSS 16 yang dapat kita lihat pada
seseorang yang mengidap penyakit kanker
Tabel 4.4, di dapat nilai dari model Regresi
payudara ganas atau jinak dan 21,6 %
Logistiknya sebagai berikut:
dipengaruhi oleh faktor-faktor lain.
= -3,757 + 0,104 + 0,053 - 0,198
d. Uji Parsial
Dalam uji parsial ini, akan dilakukan
Dan model umum dari regresi logistik nya adalah :
pengujian terhadap setiap variabel bebas secara
individual sehingga dapat dilihat apakah suatu
variabel bebas layak untuk masuk kedalam model . (11)
atau tidak. Langkah-langkahnya adalah sebagai
berikut : Kemudian jika dilihat nilai Exp(β) , Maka dapat di
1. Hipotesis interpretasikan sebagai berikut:
2. (tidak ada pengaruh variabel 1. Untuk setiap pertambahan Umur 1 tahun
mengakibatkan kenaikan resiko seseorang
bebas ke-i terhadap variabel terikat. mengidap penyakit kanker payudara sebesar
(ada pengaruh variabel bebas ke-i 11 %.
2. Untuk setiap pertambahan berat badan 1 kg
terhadap variabel terikat. mengakibatkan kenaikan resiko seseorang
maka, mengidap penyakit kanker payudara sebesar
Tidak adanya pengaruh umur, berat 54 %.
badan, dan kadar hemoglobin terhadap 3. Untuk setiap penurunan kadar hemoglobin 1
seseorang mengidap penyakit kanker g/dl mengakibatkan kenaikan resiko
payudara ganas atau jinak. seseorang mengidap penyakit kanker
payudara sebesar 8,21 %.

\Journal homepage: http://ejournal.uin-suska.ac.id/index.php/sitekin 172


Jurnal Sains, Teknologi dan Industri, Vol. 13, No. 2, Juni 2016, pp.168 - 173
ISSN 1693-2390 print/ISSN 2407-0939 online

Kesimpulan Payudara Menggunakan Regresi Logistik dan


Support Vector Machine (SVM) Berdasarkan
Parameter , , dan dari distribusi Hasil Mamografi. Jurnal Sains dan Seni ITS,
logistik biner dapat diestimasi dengan Vol.1, No. 1.
menggunakanmetode Maximum Likelihood [5] Nurlaila, Dwi. dkk. 2013. Perbandingan Metode
Estimation (MLE).Pencarian nilai parameter ini Maximum Likelihood Estimation (MLE) dan
dilakukan dengan memaksimalkan fungsi log- Metode Bayes dalam Pendugaan Parameter
likelihooddan dilakukan iterasi menggunakan Distribusi Eksponensial. Buletin Ilmiah Mat.
metode Newton Raphson yang dilakukan dengan Stat. dan Terapannya (Bimaster), Vol. 2, No.1.
menggunakan software atau program maple 13. [6] Sembiring, R.K. 2003. Analisis Regresi Edisi
Kemudian untuk menentukan nilai parameter Kedua. Penerbit ITB : Bandung.
yang mendekati nilai sebenarnya dilakukan dengan [7] Walpole, Ronald E. 1992. Pengantar Statistika
bantuan program SPSS 16, diperoleh model regresi Edisi Ketiga. PT Gramedia Pustaka Utama :
logistik untuk pasien kanker payudara adalah Jakarta.
[8] Yendra, Rado. Dkk. 2010. Analisis Survival dan
Program R. Yayasan Pusaka Riau : Pekanbaru.
(12)

Saran

Penelitian ini secara teoritis membahas


tentang mendapatkan model Regresi Logistk Biner
dari pasien pengidap kanker payudara. Dan
sebelumnya dilakukan estimasi parameter
menggunakan metode Maximum Likelihood
Estimation (MLE), kemudian proses iterasi dengan
metode Newton Raphson. Oleh sebab itu,
disarankan untuk penelitian lebih lanjut baik bagi
penulis sendiri ataupun pembaca lain yang berminat
dapat untuk menentukan metode atau teknik
statistik lain dan dapat mengembangkannya
menjadi lebih baik dari penelitian sebelumnya,
seperti menggunakan Regresi Logistik Polikotomus
dan lain-lain.

Daftar Pustaka

[1] Fa’rifah, Riska Y dan Purhadi. 2012.


AnalisisSurvival Faktor-Faktor yang
Mempengaruhi Laju Kesembuhan Pasien
Penderita Demam Berdarah Dengue (DBD) di
RSU Haji Surabaya dengan Regresi Cox. Jurnal
Sains dan Seni ITS, Vol.1, No. 1.
[2] Heldyani, dkk. 2013. Pemilihan Model Regresi
Logistik Terbaik Menggunakan Akaike’s
Information Criterion (Studi Kasus : Penyakit
Jantung Koroner di Rumah Sakit Umum Daerah
Abdul Wahab Sjahranie Samarinda). Journal
Science East Borneo, Vol.1, No.1.
[3] Nadhifah, Laily. dkk. 2012. Analisis Faktor-
Faktor yang Mempengaruhi Bayi Berat Lahir
Rendah dengan Model Regresi Logistik Biner
Menggunakan Metode Bayes(Studi Kasus di
rumah Sakit Umum Daerah Kota Semarang).
Universitas Diponegoro : Semarang.
[4] Novianti, Fourina Ayu dan Santi Wulan P.
2012. Analisis Diagnosis Pasien Kanker

Copyright © 2016, SITEKIN, ISSN 2407-0939 173

Anda mungkin juga menyukai