Model Regresi Cox Strati Kasi Untuk Mengatasi Variabel Non Proporsional Pada Data Survival
Model Regresi Cox Strati Kasi Untuk Mengatasi Variabel Non Proporsional Pada Data Survival
Abstrak Model regresi Cox hazard proporsional merupakan model matematika yang sangat populer untuk
menganalisis data survival tersensor. Model ini mengasumsikan rasio hazard dari dua individu yang konstan
terhadap waktu. Jika asumsi tersebut tidak terpenuhi, model regresi Cox stratifikasi dapat digunakan
untuk mengatasi masalah hazard non-proporsional dengan variabel yang tidak bergantung dengan waktu.
Koefisien regresi model regresi Cox stratifikasi diestimasi menggunakan metode maximum partial likelihood.
Terkadang, ties dapat terjadi dalam data survival. Untuk mengatasi hal tersebut, pendekatan fungsi
partial likelihood Breslow dan Efron dapat digunakan. Berdasarkan contoh data survival yang digunakan,
variabel penjelas los tidak memenuhi asumsi hazard proporsional dan akan dibentuk dua strata dari variabel
penjelas tersebut. Setelah menggunakan model regresi Cox stratifikasi dan membandingkan antara model
regresi Cox stratifikasi interaksi dengan model regresi Cox stratifikasi tanpa interaksi, diperoleh model
regresi Cox stratifikasi tanpa interaksi lebih tepat digunakan. Dari model tersebut, dapat disimpulkan bahwa
pasien yang lebih tua lebih beresiko, pasien perempuan lebih beresiko daripada pasien laki-laki, dan
pasien dengan kategori BMI (body mass index) underweight lebih beresiko.
Kata kunci: data survival, variabel tidak bergantung waktu, model regresi Cox stratifikasi, partial
likelihood, Breslow, Efron.
1 Pendahuluan
2 Landasan Teori
Suatu data survival dikatakan tersensor kanan apabila terdapat individu yang memiliki waktu
survival kurang dari waktu survival sesungguhnya. Hal ini disebabkan karena individu bertahan
sampai akhir pengamatan, menghilang dari pengamatan (lost to follow-up), atau mengalami kejadian
lain yang tidak berkaitan dengan pengamatan.
Data tersensor kiri terjadi ketika suatu individu mengalami suatu kejadian sebelum masuk ke dalam
pengamatan.
Data tersensor interval terjadi ketika kejadian terjadi di antara selang waktu a dan b.
2.2 Fungsi-Fungsi Survival
Pandang T sebagai variabel acak kontinu tak negatif yang mengindikasikan waktu
survival pada waktu t > 0.
Jika diketahui individu bertahan sampai waktu t, maka probabilitas individu tersebut bertahan sampai
waktu t + ∆t, yang disebut fungsi survival (S(t)) adalah:
( ) ∫ ( ) , (1)
dan bernilai
( ) ,
Jika diketahui suatu individu bertahan sampai waktu t, maka probabilitas individu akan gagal pada
interval waktu (t, t+∆t), disebut fungsi hazard atau hazard rate, adalah:
( ) . (2)
Hubungan antara fungsi survival dan fungsi hazard adalah:
( ) [ ∫ ( ) ]. (3)
Misal terdapat n sampel pada p variabel penjelas yang dinotasikan X1, X2, ..., Xp. Menurut
Cox, model umum fungsi hazard untuk individu ke-i adalah:
( ) ( ) [∑ ], (4)
h0(t) disebut fungsi hazard baseline atau fungsi baseline dasar dan β adalah koefisien parameter.
Model regersi Cox hazard proporsional dapat ditulis dalam bentuk persamaan fungsi survival
berikut:
(∑ )
( ) ( ) , (5)
S0(t) disebut fungsi survival baseline atau fungsi baseline dasar.
2.4 Menduga Parameter Model Regresi Cox Hazard Proporsional dengan Penduga
Partial Likelihood
2.4.1. Penduga Partial Likelihood untuk Model Regresi Cox Hazard Proporsional Tanpa Ties
Jika terdapat k individu gagal pada waktu t, dimana t(1) < ... < t(k). Fungsi partial likelihood untuk
model regresi Cox hazard proporsional adalah:
(∑ )
( ) ∏ . (6)
∑ (∑ )
( ( ))
(∑ )
( ) ∏ ()
, (7)
*∑ (∑ )+
( ( ))
sedangkan fungsi partial likelihood untuk model regresi Cox hazard proporsional menurut Efron
adalah:
(∑ )
( ) ∏ . (8)
()
∏ *∑ (∑ ) ( ∑ (∑ ))+
( ( )) () ( ( ))
Metode Newton-Raphson dapat digunakan untuk mendapatkan nilai β dari fungsi partial
likelihood. Berikut adalah prosedur dari metode Newton-Raphson:
1. Tentukan nilai taksiran awal β.
2. Hitung nilai taksiran β pada iterasi ke-(x+1) dengan rumus:
̂( ) ̂( ) ( ) ( ) (9)
Pengujian asumsi hazard proporsional dapat dilakukan dengan membandingkan kurva log(-log(S(t)))
antar kategori pada suatu variabel penjelas. Bentuk kurva yang paralel (tidak berpotongan)
menggambarkan asumsi hazard proporsional terpenuhi (Kleinbaum dan Klein, 2005). Fungsi survival
yang digunakan untuk menguji asumsi hazard proporsional adalah fungsi survival Kaplan-Meier yang
dirumuskan sebagai berikut:
( ) {∏ ( ) . (10)
( ( ))
t1 adalah waktu ketika pengamatan dimulai dan ri merupakan jumlah individu yang gagal.
Uji statistik yang digunakan untuk menguji asumsi hazard proporsional adalah Schoenfeld residuals
yang dirumuskan sebagai berikut:
( ̂̂ ) (11)
dimana
∑ (∑ )
( ( ))
̂ . (12)
∑ (∑ )
( ( ))
Asumsi hazard proporsional terpenuhi jika nilai Schoenfeld residuals tidak berkorelasi dengan rank
waktu survival. Uji korelasi yang digunakan adalah uji korelasi rank Pearson, yaitu:
∑ ( ̅̅̅̅̅̅)( ̅̅̅̅̅)
(13)
√∑ ( ̅̅̅̅̅̅) √∑ ( ̅̅̅̅̅)
PRij = nilai Schoenfeld residuals untuk variabel penjelas ke-j dari individu yang mengalami event
pada waktu t(i).
̅̅̅̅̅̅ = nilai rata-rata Schoenfeld residuals untuk variabel penjelas ke-j dari individu yang mengalami
event pada waktu t(i).
RTi = rank waktu survival untuk individu yang mengalami kejadian pada waktu ti.
= nilai rata-rata dari rank waktu survival untuk individu yang mengalami kejadian pada waktu ti.
3 Pembahasan
Misalkan dari p variabel penjelas, terdapat q variabel penjelas yang tidak memenuhi asumsi
hazard proposional. Variabel-variabel penjelas yang tidak memenuhi asumsi hazard proporsional
didefinisikan sebagai variabel baru kemudian distratifikasi. Stratifikasi dilakukan dengan membuat
kombinasi kategori dari variabel-variabel penjelas yang tidak proporsional.
Misal terdapat s variabel penjelas yang memenuhi asumsi hazard proporsional, maka model regresi
Cox stratifikasi tanpa interaksinya adalah:
( ) ( ) [∑ ] (14)
dimana g adalah banyak strata yang terbentuk.
Misal terdapat s variabel penjelas yang memenuhi asumsi hazard proporsional, maka model regresi
Cox stratifikasi dengan interaksinya adalah:
( ) ( ) [∑ ] (14)
Model regresi Cox stratifikasi dengan interaksi juga dapat ditulis dalam model alternatif berikut:
( ) ( ) [ ( ] (15)
Model regresi Cox stratifikasi dengan interaksi berekuivalen dengan model alternatifnya (Kleinbaum
dan Klein, 2004)
3.2 Menduga Parameter Model Regresi Cox Stratifikasi dengan Penduga Partial Likelihood
3.2.1. Menduga Parameter Model Regresi Cox Stratifikasi Tanpa Interaksi
Fungsi partial likelihood model regresi Cox stratifikasi tanpa interaksi diperoleh dengan mengkalikan
fungsi partial likelihood setiap strata. sehingga fungsi partial likelihood untuk model regresi Cox
stratifikasi tanpa interaksi menggunakan fungsi partial likelihood Breslow adalah:
(∑ )
( ) ∏ [∏ ()
], (16)
*∑ (∑ )+
( ( ))
sedangkan fungsi partial likelihood model regresi Cox stratifikasi tanpa interaksi menggunakan fungsi
partial likelihood Efron adalah:
(∑ )
( ) ∏ [∏ ]. (17)
()
∏ *∑ (∑ ) ( ∑ (∑ ))+
( ( )) () ( ( ))
Pada model regresi Cox stratifikasi interaksi, koefisien parameter setiap strata berbeda,
sehingga nilai β setiap strata diperoleh dari fungsi partial likelihood setiap strata. Fungsi
partial likelihood untuk model regresi Cox stratifikasi dengan interaksi menggunakan fungsi partial
likelihood Breslow adalah:
(∑ )
( ) [∏ ()
], (18)
*∑ ( ( ))
(∑ )+
sedangkan fungsi partial likelihood model regresi Cox stratifikasi dengan interaksi menggunakan
fungsi partial likelihood Efron adalah:
(∑ )
( ) ∏ . (19)
()
∏ *∑ (∑ ) ( ∑ (∑ ))+
( ( )) () ( ( ))
H1 : { (model interaksi)
Data yang akan digunakan adalah data pengamatan yang dilakukan oleh Dr. Robert
J. Goldberg. Data tersebut berisi rekam medis 100 pasien penderita penyakit jantung yang
mengalami serangan jantung atau acute myocardinal infarction yang dirawat di rumah sakit
daerah Worcester, Amerika Serikat, dan telah dikumpulkan sejak tahun 1975 sampai 2002.
Variabel yang digunakan dalam model ada 4, yaitu umur (age), jenis kelamin (gender), lama
pasien dirawat di rumah sakit (los), dan kategori body mass index (BMIcat).
3.5.1. Pembentukan Model Regresi Cox Stratifikasi dengan Fungsi Partial Likelihood
Breslow
Berdasarkan data yang digunakan, model Cox stratifikasi berdasarkan fungsi partial
likelihood Breslow adalah:
χ2hitung χ2(0,05;1).
29,32874 3,841
Tabel 3. 1 Uji simutlan model regresi Cox hazard proporsional berdasarkan fungsi partial likelihood
Breslow
Karena χ2hitung = 29,32874 > χ2(0,05;1, maka dapat disimpulkan bahwa keempat variabel penjelas
mempengaruhi model.
Berdasarkan uji asumsi hazard proporsional dengan metode grafik, disimpulkan bahwa
variabel penjelas los tidak memenuhi asumsi hazard proporsional.
2. Goodness of Fit
Hasil dari uji korelasi antara Schoenfeld residuals dan rank waktu survival adalah sebagai
berikut:
Variabel p - value
age 0,69856
gender 0,81077
los 0,00518
BMIcat 0,24559
Tabel 3. 2 Uji goodness of fit model regresi Cox berdasarkan fungsi partial likelihood Breslow
Tabel 3.2 menunjukkan bahwa variabel penjelas los tidak memenuhi asumsi hazard
proporsional.
Hasil dari uji asumsi hazard proporsional, baik dengan metode grafik atau goodness of fit,
menunjukkan bahwa variabel los tidak memenuhi asumsi hazard proporsional, sehingga
akan dibentuk strata berdasarkan variabel tersebut. Strata yang akan dibuat ada 2, yaitu
strata untuk los < 1 minggu dan strata untuk los ≥ 1 minggu.
Pembentukan Model Regresi Cox Stratifikasi
Model regresi Cox stratifikasi terbagi menjadi 2, yaitu model regresi Cox stratifikasi
tanpa interaksi dan model Cox stratifikasi dengan interaksi. Berdasarkan strata yang
terbentuk dari variabel los, model regresi Cox stratifikasi tanpa interaksi menggunakan
fungsi partial likelihood Breslow adalah:
sedangkan model regresi Cox stratifikasi dengan interaksi menggunakan fungsi partial
likelihood Breslow adalah:
Uji asumsi interaksi antara model regresi Cox stratifikasi tanpa interaksi dengan model
regresi Cox stratifikasi dengan interaksi menghasilkan nilai G = 2,858713. Karena G <
χ2(0,05:6), maka model regresi Cox stratifikasi menggunakan fungsi partial likelihood
Breslow yang tepat adalah model regresi Cox stratifikasi dengan asumsi tanpa interaksi.
3.5.2. Pembentukan Model Regresi Cox Stratifikasi dengan Fungsi Partial Likelihood
Efron
Berdasarkan data yang digunakan, model Cox stratifikasi berdasarkan fungsi partial
likelihood Efron adalah:
χ2hitung χ2(0,05;1).
29,33874 3,841
Tabel 3. 3 Uji simutlan model regresi Cox hazard proporsional berdasarkan fungsi partial likelihood
Efron
Karena χ2hitung = 29,32874 > χ2(0,05;1, maka dapat disimpulkan bahwa keempat variabel penjelas
mempengaruhi model.
Hasil dari uji korelasi antara Schoenfeld residuals dan rank waktu survival adalah sebagai
berikut:
Variabel p - value
age 0,70018
gender 0,81363
los 0,00511
BMIcat 0,24560
Tabel 3. 4 Uji goodness of fit model regresi Cox berdasarkan fungsi partial likelihood Efron
Tabel 3.4 menunjukkan bahwa variabel penjelas los tidak memenuhi asumsi hazard
proporsional.
Hasil dari uji asumsi hazard proporsional menunjukkan bahwa variabel los tidak
memenuhi asumsi hazard proporsional, sehingga akan dibentuk strata berdasarkan
variabel tersebut. Strata yang akan dibuat ada 2, yaitu strata untuk los < 1 minggu dan
strata untuk los ≥ 1 minggu.
Model regresi Cox stratifikasi terbagi menjadi 2, yaitu model regresi Cox stratifikasi
tanpa interaksi dan model Cox stratifikasi dengan interaksi. Berdasarkan strata yang
terbentuk dari variabel los, model regresi Cox stratifikasi tanpa interaksi menggunakan
fungsi partial likelihood Efron adalah:
sedangkan model regresi Cox stratifikasi dengan interaksi menggunakan fungsi partial
likelihood Breslow adalah:
4 Kesimpulan
Selain Breslow, fungsi partial likelihood Efron juga dapat digunakan jika ditemui ties pada
data survival. Fungsi partial likelihood Breslow untuk model regresi Cox stratifikasi tanpa
interaksi adalah
(∑ )
( ) ∏ [∏ ],
()
∏ *∑ (∑ ) ( ∑ (∑ ))+
( ( )) () ( ( ))
2. Berdasarkan data 100 pasien penderita penyakit jantung di daerah Worcester, model
regresi Cox stratifikasi berdasarkan fungsi partial likelihood Breslow adalah
Daftar Pustaka
Afifah, Arina Nur dan SantiWulan Purnami, "Uji Proportional Hazard pada Data
Penderita Kanker Serviks di RSUD dr. Soetomo Surabaya". JURNAL SAINS
DAN SENI ITS. Volume 5, 109-114. Tersedia di http://ejurnal.its.ac.id. Diakses
pada 20 Februari 2016 pukul 01:26.
Ata N, Sözer MT. 2007. "Cox Regression Models with Nonproportional Hazards Applied
to Lung Cancer Survival Data". Hacettepe Journal of Mathematics and Statistics.
Volume 36, 157-167. Tersedia di http://www.hjms.hacettepe.edu.tr. Diakses pada
17 Agustus 2015 pukul 00:37.
Collet, David. 2003. Modelling Survival Data in Medical Research, Second Edition.
London: Chapman & Hall
Hogg, Robert V. dan Allen T. Craig. 1978. Introduction to Mathematical Statistics,
Fourth Edtion. New York: Macmillan Publishing Co., Inc.
Hosmer, D. W dan Lemeshow S. 1999. Applied Survival Analysis Regression Modelling
of Time to Event Data, Second Edition. New York: John Wiley & Sons, Inc.
Kleinbaum, D.G dan M. Klein. 2005. Survival Analysis a Self-Learning Text, Second
Edition. New York: Springer.
Lee, E. T. 2003. Survival Methods for Survival Data Analysis. Third Edition. New York:
Wiley.
Kirana, Rr. Mudita Candra. 2014. Perluasan Model Regresi Cox Hazard Non-
Proporsional. Skripsi. Jakarta: Universitas Negeri Jakarta.
Xin, Xin. 2011. A Study of Ties and Time-Varying Covariates in Cox Proportional
Hazards Model. Tesis. Kanada: Universitas Guelph
Yohanes, R. T. 2012. Pengecekan Asumsi Proportional Hazard pada Model Cox
Proportional Hazard. Skripsi. Depok: Universitas Indonesia.