Anda di halaman 1dari 87

ANALISIS

SURVIVAL

Johan Harlan
Analisis Survival
Penulis : Johan Harlan

Cetakan Pertama, Desember 2017

Disain cover : Joko Slameto

Diterbitkan pertama kali oleh Gunadarma


Jl. Margonda Raya No. 100, Pondokcina, Depok 16424
Telp. +62-21-78881112, 7863819 Faks. +62-21-7872829
e-mail : sektor@gunadarma.ac.id

Hak Cipta dilindungi undang-undang. Dilarang mengutip atau


memperbanyak dalam bentuk apapun sebagian atau seluruh isi
buku tanpa ijin tertulis dari penerbit.
KATA PENGANTAR
Analisis survival, yang dikenal juga dengan nama Time-to-Event
Analysis atau Analysis of Failure Time Data, adalah studi tentang model dan
metode untuk menganalisis data tentang waktu kehidupan, waktu tunggu,
atau secara umum waktu sampai dengan terjadinya suatu peristiwa spesifik.
Data demikian yang disebut data survival, dapat bersumber dari berbagai
bidang ilmiah, terutama Kedokteran, Teknik, dan Demografi, namun dapat
pula berasal dari berbagai bidang ilmu lainnya.
Pembahasan dalam buku ini terutama ditekankan pada prinsip-prinsip
dasar serta pengertian tentang beberapa model dan metode terpenting dalam
analisis data survival. Sebagian besar metode analisis data survival harus
dikerjakan dengan bantuan program komputer. Program komputer yang
dipakai untuk pembahasan analisis data survival dalam buku ini adalah Stata
15.
Walaupun contoh-contoh yang dibahas di sini terutama menyangkut
kasus-kasus dari bidang Kedokteran, metode yang dibahas dapat saja
dimanfaatkan untuk menganalisis data survival dari berbagai bidang ilmu
pengetahuan lainnya.
Penulis sangat mengharapkan saran dan kritik tentang kekurangan
yang ada dalam buku ini.

Desember 2017

Johan Harlan

v
DAFTAR ISI

Kata Pengantar v

Daftar Isi vii

Bab 1 Fungsi Survival 1


Data Survival 1
Sensoring dan Trunkasi 4
Risiko dan Rate 6

Bab 2 Tabel Kehidupan 9


Nomenklatur Tabel Kehidupan 9
Estimasi Aktuaria 11
Estimasi Kaplan-Meier 13
Uji Log-Rank 14
Tabel Kehidupan dengan Stata 16

Bab 3 Model Regresi untuk Data Survival 23


Prinsip Dasar Model Hazard Proporsional 23
Interpretasi Hasil Analisis 25

Bab 4 Model Hazard Proporsional dengan Stata 27


Deklarasi Dataset menjadi Data Survival 27
Analisis Regresi untuk Model PH Cox 29
Grafik Kaplan-Meier untuk Model PH Cox 31
Uji Hipotesis untuk Fungsi Survival 34

vi
Bab 5 Evaluasi Kesesuaian Model 39
Residual 39
Evaluasi Asumsi Hazard Proporsional 40

Bab 6 Model Hazard Proporsional Extended 47


Pengertian Variabel Time-Dependent 47
Model Extended Cox untuk Variabel Time-Dependent 47
Formula Rasio Hazard untuk Model Extended Cox 48

Bab 7 Model Survival Parametrik 53


Asumsi Hazard Proporsional dan Asumsi Accelerated 53
Failure Time
Model Regresi Eksponensial 54
Model Regresi Weibull 58
Model Regresi Log-Logistik 61

Bab 8 Power dan Ukuran Sampel 65


Power dan Ukuran Sampel Uji Log-Rank 65
Power dan Ukuran Sampel Model PH Cox 70

Kepustakaan 75

vii
Bab 1 Fungsi Survival

BAB 1
FUNGSI SURVIVAL
 Data Survival
Analisis survival (analisis kesintasan) adalah prosedur statistika
untuk menganalisis data dengan waktu sampai terjadinya suatu peristiwa
tertentu (time until an event occurs) sebagai variabel respons.

‘Peristiwa tertentu’ tersebut dalam analisis survival lazimnya disebut


sebagai ‘kegagalan’ (failure), yang dapat berupa:

 Kematian pada penderita penyakit fatal


 Eksaserbasi ulang pada penderita penyakit kronis dengan remisi-
eksasebasi yang semula ada dalam fase remisi
 Tindak kriminal ulang oleh eks-narapidana yang sedang menjalani
periode hukuman percobaan
 Kekambuhan pada eks-pecandu narkotika sehabis menjalani rehabilitasi
 Dan sebagainya

Misalkan T adalah variabel random non-negatif yang menyatakan


waktu sampai dengan terjadinya kegagalan, maka f (t) menyatakan fungsi
densitas probabilitasnya dan F (t) = P (T < t) menyatakan fungsi distribusi
kumulatifnya.

Komplemen fungsi distribusi kumulatif F (t) adalah fungsi survival


S ( t ) , yaitu probabilitas bahwa subjek survive lebih lama daripada waktu t
atau probabilitas bahwa variabel random T melebihi waktu t:
S (t) = 1 – F (t)
= P (T > t)
Fungsi densitas f (t) adalah turunan pertama F (t) terhadap t, yaitu:

dF ( t )
f (t) =
dt

1
Bab 1 Fungsi Survival

d
=
dt
{1 − S ( t )} = −S’ (t)
Fungsi hazard h ( t ) yang juga dikenal sebagai ‘laju kegagalan
bersyarat’ (conditional failure rate) atau ‘kekuatan mortalitas’ (force of
mortality), adalah probabilitas terjadinya kegagalan pada suatu interval
waktu, dengan syarat subjek tersebut survive sampai dengan awal interval,
dibagi lebar interval, yaitu:

P ( t < T < t + ∆t T > t )


h (t) = lim
∆t →0 ∆t
f (t )
=
S (t )

Fungsi hazard bukan merupakan probabilitas, melainkan berupa rate


(kelajuan), sehingga fungsi hazard disebut juga sebagai rate hazard. Jika
kegagalan yang dipelajari adalah kematian, maka rate hazard sama dengan
rate mortalitas (mortality rate).
Fungsi hazard kumulatif H (t) adalah:
t
H (t ) = ∫0 h ( u ) du
t f (u )
= ∫0 S ( u ) du
t 1 d 
= ∫0 S ( u )  du S ( u ) du
= −ln {S (t)}
Interpretasi fungsi hazard kumulatif yaitu: (a) Ukuran risiko total
yang terakumulasi sampai dengan waktu t, dan (b) Risiko kumulatif dan
probabilitas survival berbanding terbalik.
Dengan demikian maka diperoleh:
S (t) = exp {−H (t)}
F (t) = 1 − exp {−H (t)}
2
Bab 1 Fungsi Survival

f (t) = h (t) exp {−H (t)}


Dalam praktik, karena pengamatan tidak dilakukan sejak awitan
pajanan terhadap risiko, melainkan sejak dimulainya penelitian, maka
seluruh besaran di atas adalah besaran bersyarat, yaitu syarat bahwa subjek
survive sampai dengan dimulainya pengamatan:

h (t ) = h (t T > t 0 )

H (t ) = H (t T > t 0 )

F (t ) = F (t T > t 0 )

f (t ) = f (t T > t 0 )

S (t ) = S (t T > t 0 )

Karena syarat T > t0 bersifat lazim, untuk penyerhanaan selanjutnya


S (t T > t0 ) hanya akan dituliskan sebagai S (t t0 ), demikian pula besaran

lainnya. Pengecualian yaitu untuk h ( t ) , karena rate (kelajuan sesaat) tidak


tergantung pada waktunya.

Karakteristik fungsi survival S ( t ) antara lain adalah:

- Tak membesar: Fungsi survival S (t ) mengecil sejalan dengan


bertambahnya nilai t.
- Pada waktu t = 0, S ( t ) = S ( 0 ) = 1, yaitu pada awal studi belum ada
subjek yang mengalami kegagalan atau P (T > 0) = 1.
- Pada waktu t = ∞, S ( t ) = S ( ∞ ) = 0, yaitu jika secara teoretis periode
studi diperpanjang tanpa batas, suatu saat tidak ada lagi subjek yang
survive.

Grafik fungsi survival S ( t ) terhadap waktu t secara teoretik


diperlihatkan pada gambar 1.1 berikut:

3
Bab 1 Fungsi Survival

Gambar 1.1 Grafik fungsi survival teoretik

Dalam praktik, karena sifat data sampel dan cara pengumpulan data,
estimasi fungsi survival Ŝ ( t ) merupakan fungsi bertingkat (gambar 1.2).

Gambar 1.2 Estimasi fungsi Ŝ ( t ) dalam praktik

 Sensoring dan Trunkasi


Salah satu karakteristik data survival ialah kemungkinan adanya
sensoring (censoring) dan trunkasi (truncation). Sensoring adalah kegagalan
yang terjadi pada saat subjek tidak sedang diamati. Pada sensoring nilai data
tidak lengkap karena faktor yang bersifat acak untuk tiap subjek.
Bentuk yang paling sering ditemukan adalah data tersensor-kanan
(right-censored), yang mungkin terjadi pada salah satu keadaan berikut:
4
Bab 1 Fungsi Survival

− Pada saat studi berakhir subjek belum mengalami kegagalan.


− Subjek mengundurkan diri dari penelitian dan tidak dapat diamati lebih
lanjut (lost to follow-up; withdrawal).
− Subjek mengalami kegagalan lain yang menyebabkan pengamatan tidak
dapat diteruskan (competing risk).
Subjek dikatakan tersensor-interval (interval-censored) jika
pengamatan tidak dilakukan secara kontinu, melainkan setiap akhir interval
tertentu. Kegagalan dapat terjadi di tengah suatu interval tanpa diketahui
secara tepat waktu survival-nya.
Subjek disebut tersensor-kiri (left-censored) jika kegagalan telah
terjadi sebelum subjek memasuki studi, tetapi tidak diketahui secara tepat
saat terjadinya.
Trunkasi (truncation) adalah keadaan bahwa hanya subjek yang
kegagalannya terjadi dalam suatu interval tertentu dimasukkan dalam
penelitian. Pada trunkasi nilai data tidak lengkap karena faktor seleksi yang
ada dalam desain studi.
Subjek dikatakan tertrunkasi-kiri (left-truncated) jika ia memasuki
studi setelah penelitian dimulai, sehingga trunkasi-kiri disebut juga sebagai
delayed entry.
Subjek dikatakan tertrunkasi-kanan (right-truncated) jika hanya
subjek yang mengalami kegagalan sebelum studi berakhir diikutsertakan
dalam penelitian (tidak ada yang tersensor-kanan).
Untuk selanjutnya, dalam pembahasan ini hanya akan diuraikan
mengenai sensoring-kanan, karena bentuk sensoring ini yang terbanyak
ditemukan dalam analisis survival.

Contoh 1.1:
Ketiga bentuk tersensor-kanan diperlihatkan pada gambar berikut,
yang menyajikan hasil pengamatan terhadap 12 subjek selama 6 tahun
penelitian:

5
Bab 1 Fungsi Survival

Pada awal pengamatan terhadap tiap subjek, seluruh terbebas dari


penyakit X. Kegagalan adalah peristiwa timbulnya penyakit X, yang
dinyatakan dengan lambang . Sensoring kanan terjadi pada:
- Subjek nomor 5 dan 10 yang tidak mengalami kegagalan sampai studi
berakhir.
- Subjek nomor 3 dan 4 yang mengalami kkematian (competing risk),
sehingga pengamatan tak dapat diteruskan
diteruskan. Kematian dinyatakan dengan
lambang .
- Subjek nomor 7, 8, 10, dan 12 hilang dari pengamatan (lost to follow-up)
atau mengundurkan diri dari penelitian (withdrawal).

 Risiko dan Rate


Secara teoretis, risiko
isiko dalam konteks data survival adalah:
Risk = P (t < T < t + ∆t | T > t)

6
Bab 1 Fungsi Survival

Risk merupakan probabilitas bersyarat, yaitu probabilitas subjek untuk


mengalami kegagalan dalam suatu interval waktu dengan syarat ia survive
sampai dengan awal interval tersebut. Estimasinya dari data sampel adalah:
Jumlah kegagalan dalam suatu interval waktu
Risk =
Jumlah subjek survive pada awal interval tersebut

Rate secara teoretis dalam konteks data survival adalah:

P ( t < T < t + ∆t T > t )


Rate = lim
∆t →0 ∆t
Estimasi rate dari data sampel adalah jumlah kegagalan dalam suatu interval
waktu dibagi jumlah waktu pengamatan terhadap seluruh subjek dalam
penelitian tersebut. Jumlah waktu pengamatan terhadap seluruh subjek ini
dinamakan sebagai ‘person-time’, sehingga estimasi rate adalah:
Jumlah kegagalan dalam suatu interval waktu
Rate =
Jumlah person-time

Contoh 1.2:
Lihat kembali gambar pada contoh 1.1. Subjek nomor 1
menyumbangkan 2.5 tahun pengamatan, subjek nomor 2 menyumbangkan
3.5 tahun pengamatan, dan seterusnya.
Penderita nomor 3 dan 4 mengalami kematian sehingga pengamatan
terhadap mereka tak dapat diteruskan, walaupun demikian mereka tetap
menyumbangkan person-time sebelum kematian. Subjek nomor 7, 8, 10, dan
12 hilang dari pengamatan (lost to follow-up) atau mengundurkan diri dari
penelitian (withdrawal), tetapi mereka pun tetap menyumbangkan person-
time-nya.
Jumlah kegagalan (lambang ) adalah 5, sedangkan jumlah person-
time adalah:
PT = (2.5 + 3.5 + 1.5 + . . . + 1.5) orang-tahun = 26 orang-tahun
Rate adalah:

7
Bab 1 Fungsi Survival

5
Rate = tahun −1 ≈ 0.19 tahun −1
26

8
Bab 2 Tabel Kehidupan

BAB 2
TABEL KEHIDUPAN
 Nomenklatur Tabel Kehidupan
Tabel kehidupan (life table) adalah tabel yang digunakan untuk
melakukan perhitungan probabilitas survive dan risiko kematian pada tiap
interval waktu tertentu. Tabel kehidupan dapat dibuat untuk keseluruhan
himpunan subjek penelitian dan dapat dirinci lagi menjadi tabel kehidupan
untuk masing-masing subkelompoknya.
Bentuk umum tabel kehidupan untuk data survival diperlihatkan pada
tabel 2.1 berikut:

Tabel 2.1 Layout tabel kehidupan

i ∆t PTi di ˆ i
Rate ˆ
Riski
ˆ
Risk kum Sˆ ( ti ) Sˆkum
1 (0, 1) .. .. .. .. .. ..
2 (1, 2) .. .. .. .. .. ..
... ... .. .. .. .. .. ..
n (n-1, n) .. .. .. .. .. ..
Total (0, n) .. .. .. .. .. ..

i : Satuan waktu pengamatan ke-i; i = 1, 2, . . . , n


∆t : Interval waktu ke-i: ( t0 , t1 ), ( t1 , t2 ), . . . , ( tn−1 , tn )
PTi : Person-time untuk interval waktu ke-i
di : Jumlah kegagalan pada interval waktu ke-i
ˆ i
Rate : Estimasi rate pada interval waktu ke-i
ˆ
Risk : Estimasi risiko pada interval waktu ke-i
i
ˆ
Risk : Estimasi risiko kumulatif pada interval waktu ( t0 , ti )
kum
Sˆ ( ti ) : Estimasi fungsi survival untuk interval waktu ke-i

9
Bab 2 Tabel Kehidupan

Sˆkum : Estimasi fungsi survival kumulatif pada interval waktu ( t0 , ti )

Perhatikan bahwa walaupun salah satu hasil utama dari analisis


survival adalah rate, estimasi akhir tetap diperlukan untuk risiko kegagalan.
Pada contoh 1.2 telah diperlihatkan contoh perhitungan rate untuk interval
waktu 6 tahun. Dalam praktik rate dan risiko dapat berubah dari tahun ke
tahun, dan untuk perhitungan risiko pada akhir interval waktu 6 tahun ini
harus diperhitungkan perubahan dari tahun ke tahun.

Contoh 2.1:
Lihat kembali data pada contoh 1.1. Dari data tersebut dapat disusun
tabel kehidupan berikut.

i ∆t PTi di ˆ i
Rate
1 (0, 1) 11 1 0.091
2 (1, 2) 8.5 1 0.118
3 (2, 3) 4.5 2 0.444
4 (3, 4) 1.5 1 0.667
5 (4, 5) 0.5 0 0.000
Total (0, n) 26 5 0.192

Walaupun penelitian berlangsung 6 tahun, tidak ada subjek yang


diamati lebih daripada 5 tahun, karena itu tabel dibuat hanya sampai tahun
ke-5. Subjek dengan waktu pengamatan terlama adalah subjek nomor 5, yang
waktu pengamatannya 4.5 tahun. Rate untuk tiap tahun dihitung sebagai
jumlah kegagalan dibagi person-time pada tahun itu.
Estimasi risiko dan fungsi survival dapat dilakukan dengan dua
metode, yaitu metode aktuaria dan metode Kaplan-Meier

10
Bab 2 Tabel Kehidupan

 Estimasi Aktuaria
Dua karakteristik metode aktuaria yaitu:
- Lebar interval waktu biasanya sama.
- Jika tidak ada withdrawal, maka estimasi risiko adalah jumlah kegagalan
dibagi jumlah subjek survive pada awal interval:
ˆ = di
Risk i
N i −1
Jika ada withdrawal, maka pembagi harus dikoreksi dulu, yaitu menjadi
jumlah subjek pada awal interval dikurangi setengah jumlah withdrawal
pada interval itu:
ˆ = di
Riski
Ni −1 − 0.5wi
wi : Jumlah withdrawal pada interval ke-i

Contoh 2.2:
Lihat kembali data pada contoh 2.1. Tabel kehidupan dengan estimasi
aktuaria untuk risiko adalah sebagai berikut:

i N i −1 N i′−1 wi di ˆ i
Rate ˆ
Risk ˆ
Risk
i kum
1 12 11.5 1 1 0.091 0.087 0.087
2 10 9 2 1 0.118 0.111 0.188
3 7 5.5 3 2 0.444 0.364 0.484
4 2 2 0 1 0.667 0.500 0.742
5 1 1 0 0 0.000 0.000 0.742
Total 12 9 6 5 0.192 0.556

Perhitungannya yaitu:
- Jumlah subjek terkoreksi:
Untuk i = 1 → N 0′ = 12 – (0.5)(1) = 11.5
i=2 N1′ = 10 – (0.5)(2) = 9
dan seterusnya
11
Bab 2 Tabel Kehidupan

- Risk kumulatif:
ˆ
Untuk i =0-1 → Risk t 0−t1 = 0.087
i =0-2 ˆ
Riskt 0−t 2 = 1 – (1 – 0.087)(1 – 0.111) = 0.188
i = 0-3 ˆ
Riskt 0−t 3 = 1 – (1 – 0.188)(1 – 0.364) = 0.484
dan seterusnya
Tampak bahwa jika tidak dilakukan penyesuaian per tahun diperoleh
ˆ
Risk kum = 0.556 yang berbeda dengan hasil penyesuaian per tahun menjadi
ˆ
Risk kum = 0.742.

Tabel kehidupan dengan estimasi aktuaria untuk fungsi survival


adalah sebagai berikut:

i N i −1 N i′−1 wi di ˆ
Riski Sˆ ( ti ) Sˆkum
1 12 11.5 1 1 0.087 0.913 0.913
2 10 9 2 1 0.111 0.889 0.812
3 7 5.5 3 2 0.364 0.636 0.516
4 2 2 0 1 0.500 0.500 0.258
5 1 1 0 0 0.000 1.000 0.258

Perhitungannya yaitu:
- Fungsi survival untuk interval waktu ke-i:
Untuk i = 1 → Ŝ ( t1 ) = 1 – 0.087 = 0.913
i=2 Ŝ ( t2 ) = 1 – 0.111 = 0.889
dan seterusnya
- Fungsi survival kumulatif:
Untuk i = 0-1 → Ŝ ( t0−1 ) = 0.913

i = 0-2 Ŝ ( t0 − 2 ) = (0.913)(0.889) = 0.812

i = 0-3 Ŝ ( t0 −3 ) = (0.913)(0.889)(0.636) = 0.516


dan seterusnya

12
Bab 2 Tabel Kehidupan

 Estimasi Kaplan-Meier
Estimasi Kaplan-Meier dikenal juga sebagai estimasi limit-produk
(product-limit). Karakteristik estimasi Kaplan-Meier yaitu:
- Interval waktu seringkali tidak sama, perhitungan dilakukan setiap ada
kegagalan.
- Fungsi survival untuk suatu interval waktu adalah proporsi jumlah subjek
survive pada awal interval dikurangi jumlah kegagalan dalam interval
tersebut:
N −d
Sˆ ( ti ) = i −1 i
N i −1
Jumlah sensoring ataupun withdrawal tidak diperhitungkan dalam
estimasi Kaplan-Meier. Estimasi Kaplan-Meier lazimnya digunakan
untuk langsung mengestimasi fungsi survival.

Contoh 2.3:
Lihat kembali data pada contoh 2.1. Tabel kehidupan dengan estimasi
Kaplan-Meier untuk fungsi survival adalah:

i N i −1 ci di Sˆ ( ti ) Sˆkum
1 12 1 1 0.917 0.917
2 10 2 1 0.900 0.825
3 7 3 2 0.714 0.589
4 2 0 1 0.500 0.295
5 1 0 0 1.000 0.295

Perhitungannya yaitu:
- Fungsi survival untuk interval waktu ke-i:
12 − 1
Untuk i = 1 → Ŝ ( t1 ) = = 0.917
12
10 − 1
i=2 Ŝ ( t2 ) = = 0.900
10
dan seterusnya

13
Bab 2 Tabel Kehidupan

- Fungsi survival kumulatif:


Untuk i = 0-1 → Ŝ ( t0−1 ) = 0.917

i = 0-2 Ŝ ( t0 − 2 ) = (0.917)(0.900) = 0.825

i = 0-3 Ŝ ( t0 −3 ) = (0.917)(0.900)(0.714) = 0.589


dan seterusnya

 Uji Log-Rank
Uji log-rank adalah uji statistik untuk memperbandingkan dua atau
lebih fungsi survival, baik dalam tabel kehidupan ataupun grafik kurvanya.
Uji log-rank adalah uji khi-kuadrat untuk sampel besar, yang
memperbandingkan frekuensi sel observed dengan expected untuk seluruh
kategori interval waktu.
Hipotesis nol yang diuji adalah H 0 : Tidak ada perbedaan antar
fungsi survival. Statistik pengujinya adalah:
2
2
# grup
( Oi − Ei )
χ = ∑i Ei
yang berdistribusi khi-kuadrat dengan derajat bebas G – 1; G menyatakan
jumlah grup perbandingan.

Contoh 2.4:
Dimiliki data remisi leukemia (satuan waktu dalam minggu) sebagai
berikut:
Grup pengobatan: 6*, 6, 6, 6, 7, 9*, 10*, 10, 11*, 13, 16, 17*, 19*, 20*, 22,
23, 25*, 32*, 32*, 34*, 35*
Grup kontrol: 1, 1, 2, 2, 3, 4, 4, 5, 5, 8, 8, 8, 8, 11, 11, 12, 12, 15, 17, 22, 23
Tanda ‘*’ menyatakan sensoring.

14
Bab 2 Tabel Kehidupan

Kegagalan Subjek Expected Obs − Exp


i d1i d 2i n1i n2i e1i e2i d1i − e1i d2i − e2i
1 0 2 21 21 (21/42)×2 (21/42)×2 -1.00 1.00
2 0 2 21 19 (21/40)×2 (19/40)×2 -1.05 1.05
3 0 1 21 17 (21/38)×1 (17/38)×1 -0.55 0.55
4 0 2 21 16 (21/37)×2 (16/37)×2 -1.14 1.14
5 0 2 21 14 (21/35)×2 (14/35)×2 -1.20 1.20
6 3 0 21 12 (21/33)×3 (12/33)×3 1.09 -1.09
7 1 0 17 12 (17/29)×1 (12/29)×1 0.41 -0.41
8 0 4 16 12 (16/28)×4 (12/28)×4 -2.29 2.29
10 1 0 15 8 (15/23)×1 (8/23)×1 0.35 -0.35
11 0 2 13 8 (13/21)×2 (8/21)×2 -1.24 1.24
12 0 2 12 6 (12/18)×2 (6/18)×2 -1.33 1.33
13 1 0 12 4 (12/16)×1 (4/16)×1 0.25 -0.25
15 0 1 11 4 (11/15)×1 (4/15)×1 -0.73 0.73
16 1 0 11 3 (11/14)×1 (3/14)×1 0.21 -0.21
17 0 1 10 3 (10/13)×1 (3/13)×1 -0.77 0.77
22 1 1 7 2 (7/9)×2 (2/9)×2 -0.56 0.56
23 1 1 6 1 (6/7)×2 (1/7)×2 -0.71 0.71
9 21 19.26 10.74 -10.26 10.26

d.i : Jumlah kegagalan observed pada minggu ke-i


n.i : Jumlah subjek survive sampai dengan awal minggu ke-i
e.i : Jumlah kegagalan expected pada minggu ke-i

Pada awal minggu pertama, di kedua kelompok masing-masing ada


21 subjek. Minggu pertama, kelompok pengobatan tidak ada kegagalan,
kelompok kontrol ada 2 kegagalan, sehingga jumlah subjek pada awal
minggu kedua menjadi 21 dan 19 subjek, dan seterusnya.

Pada awal minggu keenam, di kedua kelompok masing-masing


terdapat 21 dan 12 subjek. Minggu keenam, kelompok pengobatan ada 3
kegagalan dan 1 sensoring, kelompok kontrol tidak ada kegagalan, sehingga
pada awal minggu ketujuh jumlah subjek kedua kelompok adalah 17 dan 12
subjek, dan seterusnya.
15
Bab 2 Tabel Kehidupan

2
2
# grup
( Oi − Ei )
χ = ∑i Ei
2 2
=
( −10.26 ) +
(10.26 )
19.26 10.74
= 15.276 (p = 0.000)

 Tabel Kehidupan dengan Stata


Perintah Stata untuk menampilkan tabel kehidupan adalah:

Sintaks:
ltable timevar failvar [if] [in] [, options]
timevar : Interval waktu sampai terjadinya kegagalan atau sensoring
failvar : Kegagalan

Beberapa opsi:
survival : menampilkan tabel survival dengan estimasi aktuaria (default)
hazard : menampilkan tabel hazard (rate)
noadjust : menampilkan estimasi Kaplan-Meier

Untuk menampilkan grafik survival Kaplan-Meier, perintahnya


adalah sts graph, tetapi sebelum menggunakan perintah sts, dataset harus
terlebih dahulu dideklarasikan sebagai data survival dengan perintah stset.

Sintaks:
stset timevar [if] [, failure(failvar)]
sts graph [if] [in] [, options]

Beberapa opsi:
survival : Menampilkan grafik fungsi survival Kaplan-Meier
failure : Menampilkan grafik fungsi kegagalan Kaplan-Meier
cumhaz : Menampilkan grafik fungsi hazard kumulatif Nelson-Aalen

16
Bab 2 Tabel Kehidupan

Untuk melakukan uji log-rank:


Sintaks:
sts test varlist [if] [in] [, options]
Beberapa opsi:
logrank : Perintah untuk uji log-rank (default)
cox : Uji kesamaan Cox
wilcoxon : Uji kesamaan Wilcoxon-Breslow-Gehan
tware : Uji kesamaan Tarone-Ware
peto : Uji kesamaan Peto-Peto-Prentice

Contoh 2.5:
. use “D:\Analisis Survival\Data\data_hipotetis.dta”

Menampilkan tabel survival dengan estimasi aktuaria:


. ltable t fail, survival
Beg. Std.
Interval Total Deaths Lost Survival Error [95% Conf. Int.]
----------------------------------------------------------------------
0 1 12 1 1 0.9130 0.0831 0.5240 0.9873
1 2 10 1 2 0.8116 0.1208 0.4296 0.9497
2 3 7 2 3 0.5165 0.1834 0.1504 0.7942
3 4 2 1 0 0.2582 0.2043 0.0142 0.6501
4 5 1 0 1 0.2582 0.2043 0.0142 0.6501
----------------------------------------------------------------------

Menampilkan tabel kegagalan kumulatif:


. ltable t fail, failure
Beg. Cum. Std.
Interval Total Deaths Lost Failure Error [95% Conf. Int.]
----------------------------------------------------------------------
0 1 12 1 1 0.0870 0.0831 0.0127 0.4760
1 2 10 1 2 0.1884 0.1208 0.0503 0.5704
2 3 7 2 3 0.4835 0.1834 0.2058 0.8496
3 4 2 1 0 0.7418 0.2043 0.3499 0.9858

17
Bab 2 Tabel Kehidupan

4 5 1 0 1 0.7418 0.2043 0.3499 0.9858


----------------------------------------------------------------------

Menampilkan tabel hazard (rate):


. ltable t fail, hazard
Beg. Cum. Std. Std.
Interval Total Failure Error Hazard Error [95% Conf. Int.]
-----------------------------------------------------------------------
0 1 12 0.0870 0.0831 0.0909 0.0908 0.0000 0.2689
1 2 10 0.1884 0.1208 0.1176 0.1174 0.0000 0.3478
2 3 7 0.4835 0.1834 0.4444 0.3064 0.0000 1.0450
3 4 2 0.7418 0.2043 0.6667 0.6285 0.0000 1.8986
4 5 1 0.7418 0.2043 0.0000 . . .
-----------------------------------------------------------------------

Menampilkan tabel survival dengan estimasi Kaplan-Meier:


. ltable t fail, survival noadjust
Beg. Std.
Interval Total Deaths Lost Survival Error [95% Conf. Int.]
----------------------------------------------------------------------
0 1 12 1 1 0.9167 0.0798 0.5390 0.9878
1 2 10 1 2 0.8250 0.1128 0.4609 0.9533
2 3 7 2 3 0.5893 0.1623 0.2305 0.8265
3 4 2 1 0 0.2946 0.2236 0.0161 0.6964
4 5 1 0 1 0.2946 0.2236 0.0161 0.6964
----------------------------------------------------------------------

Contoh 2.6:
. use “D:\Analisis Survival\Data\data_hipotetis.dta”, clear
. stset t, failure(fail)

failure event: fail != 0 & fail < .


obs. time interval: (0, t]
exit on or before: failure

18
Bab 2 Tabel Kehidupan

--------------------------------------------------------------
12 total observations
0 exclusions
--------------------------------------------------------------
12 observations remaining, representing
5 failures in single-record/single-failure data
26 total analysis time at risk and under observation
at risk from t = 0
earliest observed entry t = 0
last observed exit t = 4.5

Menampilkan grafik fungsi survival Kaplan-Meier:


. sts graph, survival
failure _d: fail
analysis time _t: t
1.00
0.75
0.50
0.25
0.00

. sts graph, cumhaz

failure _d: fail


analysis time _t: t

19
Bab 2 Tabel Kehidupan

1.00
0.80
0.60
0.40
0.20
0.00

Contoh 2.7:
. use “D:\Analisis Survival\Data\leukemia.dta”, clear
(Leukemia Remission Study)

. stset weeks, failure(relapse)


failure event: relapse != 0 & relapse < .
obs. time interval: (0, weeks]
exit on or before: failure

---------------------------------------------------------------
42 total observations
0 exclusions
---------------------------------------------------------------
42 observations remaining, representing
30 failures in single-record/single-failure data
541 total analysis time at risk and under observation
at risk from t = 0
earliest observed entry t = 0
last observed exit t = 35
20
Bab 2 Tabel Kehidupan

. sts test treatment1, logrank


failure _d: relapse
analysis time _t: weeks

Log-rank test for equality of survivor functions

| Events Events
treatment1 | observed expected
-----------+-------------------------
Standard | 21 10.75
Drug A | 9 19.25
-----------+-------------------------
Total | 30 30.00

chi2(1) = 16.79
Pr>chi2 = 0.0000

. sts test treatment1, wilcoxon


failure _d: relapse
analysis time _t: weeks

Wilcoxon (Breslow) test for equality of survivor functions

| Events Events Sum of


treatment1 | observed expected ranks
-----------+--------------------------------------
Standard | 21 10.75 271
Drug A | 9 19.25 -271
-----------+--------------------------------------
Total | 30 30.00 0

chi2(1) = 13.46
Pr>chi2 = 0.0002

21
Bab 3 Model Regresi untuk Data Survival

BAB 3
MODEL REGRESI
UNTUK DATA SURVIVAL

 Prinsip Dasar Model Hazard Proporsional


Pada bab 1, telah dijelaskan mengenai hazard h (t) sebagai nilai rate.
Untuk selanjutnya, hazard baseline akan dinyatakan sebagai h 0 ( t ) . Sebagai
model regresi dengan kovariat X, hazard dapat dinyatakan sebagai:

h (t X ) = h0 (t ) r ( X , β )

Maka rasio hazard X 1 terhadap X 0 adalah:

HR (t, X 1 , X 0 ) =
( )
h t X1
h (t X 0 )

h 0 ( t ) r ( X1, β )
=
h 0 (t ) r ( X 0 , β )

r ( X1 , β )
=
r ( X0, β )

Tampak bahwa rasio hazard sama sekali tidak tergantung pada fungsi h 0 ( t ) ,
melainkan hanya tergantung pada fungsi r ( X , β ) . Cox (1972) pertama kali
mengusulkan penggunaan fungsi eksponensial untuk r ( X , β ) menjadi:

r ( X , β ) = exp (X β )

Penggunaan fungsi eksponensial ini pertama untuk meyakinkan bahwa rate


h ( t , X , β ) akan selalu bernilai positif, dan kedua untuk menyederhanakan
pembagian pada rumus HR. Selanjutnya model:

23
Bab 3 Model Regresi untuk Data Survival

p
h ( t X ) = h 0 ( t ) exp ∑ βi Xi
i =1

ini dikenal sebagai model hazard proporsional Cox, atau model hazard
proporsional (model PH Cox) saja.
Ruas kanan model PH Cox terdiri atas 2 bagian. Bagian pertama
yaitu h 0 ( t ) hanya memuat faktor t tanpa disertai faktor X, sedangkan bagian
p
kedua yaitu exp ∑
i =1
βi X i hanya memuat faktor X tanpa memuat faktor t,

sehingga faktor X disebut juga sebagai variabel time-independent.

Dengan menggunakan fungsi eksponensial untuk r ( X , β ) ini, maka


HR (t, X 1 , X 0 ) menjadi:

r ( X1 , β )
HR (t, X 1 , X 0 ) =
r ( X0, β )

exp ( X1β )
=
exp ( X 0 β )

= exp β ( X 1 − X 0 )

Jika kovariat X adalah variabel biner untuk perbandingan 2 grup


dengan X 1 menyatakan X = 1 (grup pengobatan) dan X 0 menyatakan X = 0
(grup kontrol), maka

HR (t, X 1 , X 0 ) = exp β ( X 1 − X 0 )

HR = exp β

atau: β = ln HR
Untuk model hazard proporsional ganda dengan kovariat lebih
daripada satu berlaku:
HR i = exp β i

24
Bab 3 Model Regresi untuk Data Survival

atau: β i = ln HR i
p
Karena hanya menyatakan fungsi exp ∑
i =1
βi X i tanpa menspesifikasi

fungsi hazard baseline h 0 ( t ) , model PH Cox dinyatakan sebagai model


semi-parametrik. Asumsi terpenting pada model PH Cox ini ialah bahwa
rasio hazard bersifat konstan untuk setiap nilai t.

 Interpretasi Hasil Analisis


Dari persamaan:

h ( t X ) = h 0 ( t ) exp β 1 X

diperoleh:

h (t X )
= HR = exp β 1 X
h 0 (t )

sehingga model PH Cox sederhana dapat dinyatakan sebagai:


ln HR = β 1 X

Model PH Cox ganda adalah:

ln HR = β 1 X 1 + β 2 X 2 + . . . + β p X p

Perhatikan bahwa sebagai salah satu model regresi, pada model PH


Cox tidak didapatkan suku konstante β 0 dan tidak ada suku residual,
walaupun dalam pembahasan lebih lanjut ada juga yang dinamakan residual
pada model PH Cox ini.
Untuk model PH Cox sederhana dan berlaku:
β = ln HR
dan untuk model PH Cox ganda berlaku:
β i = ln HR i

25
Bab 3 Model Regresi untuk Data Survival

Yang dimaksud dengan ‘rasio’ pada HR adalah rasio hazard untuk


suatu nilai kovariat X terhadap hazard baseline. Nilai rasio hazard berkisar
dari nol sampai dengan tak berhingga. Interpretasi nilai rasio hazard kurang
lebih adalah sama dengan interpretasi rasio odds, yaitu:
- HR < 1 mengindikasikan bahwa kovariat X merupakan faktor preventif
terhadap terjadinya kegagalan.
- HR = 1 mengindikasikan bahwa tidak ada asosiasi antara kovariat X
dengan kejadian kegagalan.
- HR > 1 mengindikasikan bahwa kovariat X merupakan faktor risiko
terhadap terjadinya kegagalan.
Estimasi untuk nilai-nilai β i ini harus dilakukan dengan program
komputer statistik dan tidak dapat dikerjakan secara manual karena
memerlukan proses iteratif dalam perhitungannya.
Estimasi dikerjakan dengan metode maximum likelihood. Estimasi
parameter pada model PH Cox menggunakan metode partial likelihood,
karena hanya memperhitungkan probabilitas kegagalan dan tidak
memperhitungkan probabilitas sensoring.
Seperti pada berbagai model regresi lainnya, uji hipotesis H 0 : β i =
0 dikerjakan dengan uji Wald, yang hasilnya secara otomatis akan
ditampilkan dalam keluaran komputer pada analisis regresi untuk model PH
Cox.

26
Bab 4 Model Hazard Proporsional dengan Stata

BAB 4
MODEL HAZARD PROPORSIONAL
DENGAN STATA

 Deklarasi Dataset menjadi Data Survival


Pada kebanyakan perintah Stata untuk analisis data survival, terlebih
dahulu dataset harus dideklarasikan sebagai data survival dengan perintah
stset. Pada perintah stset akan terjadi penambahan beberapa variabel pada
dataset yang akan berguna dalam berbagai pengerjaan perintah Stata untuk
data survival. Hasil deklarasi ini tidak bersifat permanen dan akan hilang
setelah file ditutup jika isi dataset yang telah terdeklarasi ini tidak disimpan
(di-saved).
Sintaks:
stset timevar [if] [, options]
timevar : Waktu sampai dengan terjadinya kegagalan
Opsi:
failure(failvar) : Variabel yang menyatakan kegagalan

Contoh 4.1:
. use “D:\Analisis Survival\Data\leukemia.dta”, clear
(Leukemia Remission Study)
. list in 1/10
+----------------------------------+
| no weeks relapse x1 x2 |
|----------------------------------|
1. | 1 6 1 1 2.31 |
2. | 2 6 1 1 4.06 |
3. | 3 6 1 1 3.28 |
27
Bab 4 Model Hazard Proporsional dengan Stata

4. | 4 7 1 1 4.43 |
5. | 5 10 1 1 2.96 |
|----------------------------------|
6. | 6 13 1 1 2.88 |
7. | 7 16 1 1 3.6 |
8. | 8 22 1 1 2.32 |
9. | 9 23 1 1 2.57 |
10. | 10 6 0 1 3.2 |
+----------------------------------+

. stset weeks, failure(relapse)

failure event: relapse != 0 & relapse < .


obs. time interval: (0, weeks]
exit on or before: failure

-----------------------------------------------------------------
42 total observations
0 exclusions
-----------------------------------------------------------------
42 observations remaining, representing
30 failures in single-record/single-failure data
541 total analysis time at risk and under observation
at risk from t = 0
earliest observed entry t = 0
last observed exit t = 35
. list in 1/10
+--------------------------------------------------------+
| no weeks relapse x1 x2 _st _d _t _t0 |
|--------------------------------------------------------|
1. | 1 6 1 1 2.31 1 1 6 0|
2. | 2 6 1 1 4.06 1 1 6 0|
3. | 3 6 1 1 3.28 1 1 6 0|
4. | 4 7 1 1 4.43 1 1 7 0|
5. | 5 10 1 1 2.96 1 1 10 0|
28
Bab 4 Model Hazard Proporsional dengan Stata

|--------------------------------------------------------|
6. | 6 13 1 1 2.88 1 1 13 0|
7. | 7 16 1 1 3.6 1 1 16 0|
8. | 8 22 1 1 2.32 1 1 22 0|
9. | 9 23 1 1 2.57 1 1 23 0|
10. | 10 6 0 1 3.2 1 0 6 0|
+--------------------------------------------------------+
Tampak adanya penambahan variabel _st, _d, _t, dan _t0.

 Analisis Regresi untuk Model PH Cox


Sintaks:
stcox [indepvars] [if] [in] [, options]
indepvars : Kovariat

Beberapa opsi:
estimate : Melakukan fit model tanpa kovariat
level(#) : Menentukan tingkat konfidensi, default-nya adalah level(95)
nohr : Tampilan HR diganti dengan koefisien regresi

Contoh 4.2:
. use “D:\Analisis Survival\Data\leukemia.dta”, clear
(Leukemia Remission Study)
. stcox x1 x2
failure _d: relapse
analysis time _t: weeks

Iteration 0: log likelihood = -93.98505


Iteration 1: log likelihood = -72.418226

29
Bab 4 Model Hazard Proporsional dengan Stata

Iteration 2: log likelihood = -72.279588


Iteration 3: log likelihood = -72.27926
Refining estimates:
Iteration 0: log likelihood = -72.27926

Cox regression -- Breslow method for ties

No. of subjects = 42 Number of obs = 42


No. of failures = 30
Time at risk = 541
LR chi2(2) = 43.41
Log likelihood = -72.27926 Prob > chi2 = 0.0000

------------------------------------------------------------
_t | Haz. Ratio Std. Err. z P>|z| [95% Conf. Interval]
---+--------------------------------------------------------
x1 | .2741535 .1157213 -3.07 0.002 .1198666 .6270315
x2 | 4.974592 1.638274 4.87 0.000 2.608751 9.48598
------------------------------------------------------------

. stcox x1 x2, nohr


failure _d: relapse
analysis time _t: weeks

Iteration 0: log likelihood = -93.98505


Iteration 1: log likelihood = -72.418226
Iteration 2: log likelihood = -72.279588
Iteration 3: log likelihood = -72.27926
Refining estimates:
Iteration 0: log likelihood = -72.27926

Cox regression -- Breslow method for ties

No. of subjects = 42 Number of obs = 42

30
Bab 4 Model Hazard Proporsional dengan Stata

No. of failures = 30
Time at risk = 541
LR chi2(2) = 43.41
Log likelihood = -72.27926 Prob > chi2 = 0.0000

-------------------------------------------------------------
_t | Coef. Std. Err. z P>|z| [95% Conf. Interval]
---+---------------------------------------------------------
x1 | -1.294067 .422104 -3.07 0.002 -2.121376 -.4667586
x2 | 1.604343 .3293283 4.87 0.000 .9588716 2.249815
-------------------------------------------------------------

 Grafik Kaplan-Meier untuk Model PH Cox


Sintaks:
stcoxkm [if], by[varname] [options]
by[varname] : Laporkan kovariat nominal atau ordinal

Opsi:
separate : Gambarkan grafik observed dan predicted secara terpisah
Perintah stcoxkm menghasilkan grafik Kaplan-Meier observed dan
predicted sekaligus yang ditampilkan dalam 1 grafik.
sts graph [if] [in] [, options]
Opsi:
survival : Grafik fungsi survival Kaplan-Meier, default
failure : Grafik fungsi kegagalan Kaplan-Meier
cumhaz : Grafik fungsi hazard kumulatif Nelson-Aalen
hazard : Grafik estimasi hazard licin
by(varlist) : Estimasi dan grafik fungsi terpisah untuk tiap grup varlist

31
Bab 4 Model Hazard Proporsional dengan Stata

Perintah sts graph menghasilkan grafik observed tanpa disertai


grafik predicted.

Contoh 4.3:
. use “D:\Analisis Survival\Data\leukemia.dta”, clear
(Leukemia Remission Study)
. stcoxkm, by(x1)
failure _d: relapse
analysis time _t: weeks
1.00 0.80
Survival Probability
0.40 0.60
0.20
0.00

. stcoxkm, by(x1) separate


failure _d: relapse
analysis time _t: weeks

32
Bab 4 Model Hazard Proporsional dengan Stata

1.00
Survival Probability
0.50
0.00

. sts graph, survival


failure _d: relapse
analysis time _t: weeks
1.00
0.75
0.50
0.25
0.00

33
Bab 4 Model Hazard Proporsional dengan Stata

. sts graph, survival by(x1)


failure _d: relapse
analysis time _t:
1.00
0.75
0.50
0.25
0.00
weeks

 Uji Hipotesis untuk Fungsi Survival


Sintaks
sts test varlist [if] [in] [, options]

Opsi
logrank : Uji kesamaan log-rank; default
cox : Uji kesamaan Cox
wilcoxon : Uji kesamaan Wilcoxon-Breslow-Gehan
tware : Uji kesamaan Tarone-Ware
peto : Uji kesamaan Peto-Peto-Prentice

34
Bab 4 Model Hazard Proporsional dengan Stata

Contoh 4.4:
. use “D:\Analisis Survival\Data\leukemia.dta”, clear
(Leukemia Remission Study)
. sts test weeks, logrank
failure _d: relapse
analysis time _t: weeks

Log-rank test for equality of survivor functions

| Events Events
weeks | observed expected
------+-------------------------
1 | 2 0.10
2 | 2 0.20
3 | 1 0.12
4 | 2 0.36
5 | 2 0.47
6 | 3 1.30
7 | 1 0.36
8 | 4 2.01
9 | 0 0.50
10 | 1 1.09
11 | 2 1.93
12 | 2 1.51
13 | 1 0.82
15 | 1 0.88
16 | 1 0.95
17 | 1 2.06
19 | 0 1.03
20 | 0 1.03
22 | 2 2.51
23 | 2 3.08
25 | 0 1.54

35
Bab 4 Model Hazard Proporsional dengan Stata

32 | 0 3.08
34 | 0 1.54
35 | 0 1.54
------+-------------------------
Total | 30 30.00

chi2(23) = 115.62
Pr>chi2 = 0.0000

. sts test weeks, cox


failure _d: relapse
analysis time _t: weeks

Cox regression-based test for equality of survival


curves

| Events Events Relative


weeks | observed expected hazard
------+--------------------------------------
1 | 2 0.10 1.214e+29
2 | 2 0.20 1.294e+27
3 | 1 0.12 2.701e+25
4 | 2 0.36 2.848e+23
5 | 2 0.47 3.004e+21
6 | 3 1.30 1.589e+19
7 | 1 0.36 4.423e+17
8 | 4 2.01 2.345e+15
9 | 0 0.50 0.0001
10 | 1 1.09 2.447e+13
11 | 2 1.93 3.441e+11
12 | 2 1.51 5.443e+09
13 | 1 0.82 1.136e+08
15 | 1 0.88 2.371e+06
16 | 1 0.95 49488.8499

36
Bab 4 Model Hazard Proporsional dengan Stata

17 | 1 2.06 516.4631
19 | 0 1.03 0.0000
20 | 0 1.03 0.0000
22 | 2 2.51 10.8978
23 | 2 3.08 0.1254
25 | 0 1.54 0.0000
32 | 0 3.08 0.0000
34 | 0 1.54 0.0000
35 | 0 1.54 0.0000
------+--------------------------------------
Total | 30 30.00 1.0000

LR chi2(21) = 141.50
Pr>chi2 = 0.0000

. sts test weeks, wilcoxon


failure _d: relapse
analysis time _t: weeks

Wilcoxon (Breslow) test for equality of survivor


functions

| Events Events Sum of


weeks | observed expected ranks
------+--------------------------------------
1 | 2 0.10 80
2 | 2 0.20 72
3 | 1 0.12 33
4 | 2 0.36 60
5 | 2 0.47 52
6 | 3 1.30 51
7 | 1 0.36 16
8 | 4 2.01 44
9 | 0 0.50 -17
10 | 1 1.09 -13
37
Bab 4 Model Hazard Proporsional dengan Stata

11 | 2 1.93 -18
12 | 2 1.51 -8
13 | 1 0.82 -7
15 | 1 0.88 -9
16 | 1 0.95 -11
17 | 1 2.06 -39
19 | 0 1.03 -26
20 | 0 1.03 -26
22 | 2 2.51 -38
23 | 2 3.08 -46
25 | 0 1.54 -30
32 | 0 3.08 -60
34 | 0 1.54 -30
35 | 0 1.54 -30
------+--------------------------------------
Total | 30 30.00 0

chi2(23) = 98.52
Pr>chi2 = 0.0000

38
Bab 5 Evaluasi Kesesuaian Model

BAB 5
EVALUASI KESESUAIAN MODEL

 Residual
Residual dalam model PH Cox tidak sama dengan residual dalam
model regresi lainnya. Dalam model regresi lain, residual adalah selisih
antara nilai respons observed dengan nilai respons predicted. Dalam data
survival, respons yaitu interval waktu sampai terjadinya kegagalan tidak
selalu diketahui, yaitu pada subjek tersensor.
Walaupun demikian, pada model PH Cox juga ada residual yang
dimanfaatkan antara lain untuk mengases asumsi hazard proporsional.
Dikenal berbagai residual pada model PH Cox, salah satu di antaranya yang
paling sering digunakan adalah residual Schoenfeld. Residual Schoenfeld
hanya memiliki nilai-nilai untuk subjek dengan kegagalan, dan bernilai nol
untuk subjek tersensor.
Dalam Stata, nilai residual diperoleh dengan perintah predict, yang
merupakan salah satu perintah dari stcox postestimation. Sebagai bagian
dari stcox postestimation, perintah predict hanya boleh diberikan
sesudah dan segera menyusul perintah pemodelan dengan stcox. Dengan
perintah predict juga dapat diprediksi nilai rasio hazard dan interval waktu
kegagalan. Sintaks-nya adalah
predict newvar [if] [in] [, options]
Opsi:
hr : rasio hazard predicted
xb : linear prediction x j β

mgale : residual martingale


csnell : residual Cox-Snell
deviance : residual deviance

39
Bab 5 Evaluasi Kesesuaian Model

scores : residual efficient score


schoenfeld : residual Schoenfeld
scaledsch : residual Schoenfeld terskala

 Evaluasi asumsi hazard proporsional


Asumsi model hazard proporsional adalah:
Rasio hazard bersifat konstan dalam perjalanan waktu, atau hazard bagi
seorang individu bersifat proporsional terhadap hazard bagi individu lain,
dengan konstante proporsionalitas bersifat independen terhadap waktu.
Evaluasi asumsi hazard proporsional dapat dilakukan dengan
beberapa metode berikut:
1. Grafik hazard
2. Grafik survival log-log
3. Grafik survival Kaplan-Meier observed dan predicted
4. Uji kebaikan-suai waktu survival dan residual Schoenfeld
5. Kovariat time-dependent

Grafik hazard
Jika kedua grafik hazard (hazard baseline dan hazard dengan fungsi
eksponensial) berpotongan (gambar 5.1), maka asumsi hazard proporsional
tidak terpenuhi. Jika kedua grafik hazard tidak berpotongan, maka asumsi
hazard proporsional terpenuhi.

40
Bab 5 Evaluasi Kesesuaian Model

Gambar 5.1 Kedua grafik hazard berpotongan

Grafik survival log-log

log adalah grafik –ln (−ln Ŝ ( t ) . Jika kedua grafik


Grafik survival log-log
survival log-log sejajar, maka asumsi hazard proporsional terpenuhi. Jika
keduanya tidak sejajar, asumsi hazard proporsional tidak terpenuhi.
Dengan Stata, sintaks untuk memperoleh grafik survival log
log-log
adalah:
varname)
stphplot [if], by(varname
Misalnya, untuk file leukemia.dta
dta perintahnya adalah:
. stphplot, by(x1)
Grafik yang diperoleh diperlihatkan pada gambar 5.2.

41
Bab 5 Evaluasi Kesesuaian Model

3
-ln[-ln(Survival Probability)]
0 1-1 2

Gambar 5.2 Grafik survival log-log

Grafik survival Kaplan-Meier observed dan predicted


Kedua grafik survival Kaplan-Meier observed dan expected untuk
tiap grup harus ‘berdekatan’ satu sama lain. Jika tiap pasangan ini
berdekatan, maka asumsi hazard proporsional terpenuhi. Jika tidak, maka
asumsi hazard proporsional tidak terpenuhi.
Untuk memudahkan evaluasi, biasanya kedua grafik observed dan
expected digambarkan bersama-sama dalam satu gambar. Sintaks Stata-nya
adalah:
stcoxkm [if], by(varname)
Untuk file leukemia.dta, perintahnya adalah:
. stcoxkm, by(x1)
Grafik yang diperoleh diperlihatkan pada gambar 5.3.

42
Bab 5 Evaluasi Kesesuaian Model

1.00 0.80
Survival Probability
0.40 0.60
0.20
0.00

Gambar 5.3 Grafik survival Kaplan-Meier observed dan expected

Uji kebaikan-suai waktu survival dan residual Schoenfeld


Jika tidak ada asosiasi antara waktu survival dengan residual
Schoenfeld, asumsi hazard proporsional terpenuhi. Jika asosiasi ini ada,
asumsi hazard proporsional tidak terpenuhi.
Secara kasar, ada tidaknya asosiasi dapat dilihat pada grafik waktu
survival dan residual Schoenfeld. Dengan Stata, sintaks untuk memperoleh
grafik ini adalah:
estat phtest, plot(varname)
Misalnya, untuk file leukemia.dta perintahnya adalah:
. quitely stcoxkm, by(x1)
. estat phtest, plot(x1)
Grafik yang diperoleh diperlihatkan pada gambar 5.4.

43
Bab 5 Evaluasi Kesesuaian Model

2
Scaled Schoenfeld - x1
-4 -2 -6 0

Gambar 5.4 Grafik waktu survival dan residual Schoenfeld

Secara lebih eksak, dapat dilakukan uji hipotesis, yaitu uji kebaikan-
suai dengan perintah estat phtest.
Untuk file leukemia.dta, diperoleh:
. estat phtest
Test of proportional-hazards assumption

Time: Time
------------------------------------------
| chi2 df Prob>chi2
------------+-----------------------------
global test | 0.07 2 0.9661
------------------------------------------

Evaluasi asumsi PH dengan kovariat time-dependent


Pada evaluasi asumsi PH dengan kovariat time-dependent ini, model
Cox diperluas dengan menambahkan suku perkalian (yaitu interaksi) antara
variabel time-independent yang dievaluasi dengan suatu fungsi waktu g (t).

44
Bab 5 Evaluasi Kesesuaian Model

Fungsi waktu g (t) yang dapat digunakan antara lain yaitu t atau ln t.
Jika suku interaksi ini ternyata bermakna pada uji hipotesis, maka asumsi PH
dinyatakan tidak terpenuhi.
Misalkan pada file leukemia.dta, variabel x3 (sex) yang bersifat
time-independent akan dievaluasi. Ditambahkan suku x3*t dan dilakukan uji
hipotesis.
. stset weeks, failure(relapse)
. gen x3_prod = x3*weeks
. stcox x3 x3_prod
----------------------------------------------------------------
_t | Haz. Ratio Std. Err. z P>|z| [95% Conf. Interval]
--------+-------------------------------------------------------
x3 | 177.5658 166.7587 5.51 0.000 28.18148 1118.806
x3_prod | .6809985 .0554517 -4.72 0.000 .5805442 .7988348
----------------------------------------------------------------
Didapatkan suku sex*weeks bermakna secara statistik (p = 0.000),
sehingga disimpulkan bahwa variabel sex tidak memenuhi asumsi hazard
proporsional.

45
Bab 6 Model Hazard Proporsional Extended

BAB 6
MODEL HAZARD PROPORSIONAL
EXTENDED

 Pengertian Variabel Time-Dependent


Variabel time-dependent (time-varying) adalah variabel yang nilai-
nilainya berbeda untuk subjek tertentu dalam perjalanan waktu t. Model PH
Cox adalah sebagai berikut:
p
h ( t X ) = h 0 ( t ) exp ∑
i =1
βi Xi

Bagian pertama dari ruas kanan persamaan tersebut, yaitu h 0 ( t ) adalah


hazard baseline yang memuat t tetapi tidak memuat X. Bagian kedua, yaitu
p
eksponensial exp ∑
i =1
βi X i memuat X tetapi tidak memuat t, karena itu X di

sini disebut time-independent. Jika suku eksponensial ini memuat t, maka X-


nya akan menjadi variabel time-dependent. Dengan variabel X yang time-
dependent, model di atas masih berbentuk model Cox, tetapi tidak lagi
memenuhi asumsi PH sehingga disebut model Cox extended.

 Model Extended Cox untuk Variabel Time-


Dependent
Model Cox extended untuk variabel time-independent dan variabel
time-dependent yaitu:

 p1 p
2 
(
h t X (t ) ) = h 0 ( t ) exp  ∑ β i X i + ∑ δ j X j ( t ) 
 i =1 j =1 

Ruas kanan persamaan mencakup variabel:

47
Bab 6 Model Hazard Proporsional Extended

(
X ( t ) = X 1, X 2 , . . . , X p , X 1 ( t ) , X 2 ( t ) , . . . , X p ( t )
1 2
)
( X , X , . . . , X ) adalah himpunan variabel time-independent, sedangkan
1 2 p
1

( X (t ) , X (t ) , . . . , X (t )) adalah himpunan variabel time-dependent.


1 2 p
2

Pada bab V telah diperkenalkan variabel time-dependent yang


digunakan untuk menguji apakah suatu prediktor time-independent
memenuhi asumsi PH, yaitu sex×t. Secara umum bentuk variabel time-
dependent dinyatakan sebagai Ei × gi ( t ) , dengan gi ( t ) disebut sebagai
pengali (multiplier) untuk variabel time-dependent. Salah satu contoh gi ( t )
yaitu gi ( t ) = 0 jika t < t0 dan gi ( t ) = 1 jika t > t0 . Fungsi gi ( t ) pada
contoh terakhir ini disebut sebagai fungsi heaviside. Bentuk lain yang juga
sering dipakai yaitu gi ( t ) = ln (t).

Inklusi variabel time-dependent ke dalam model HP Cox umumnya


tidak dianjurkan karena dapat menimbulkan berbagai masalah, dan inklusi
sebaiknya hanya dilakukan setelah melalui pengkajian model secara
mendalam dari segi substansi bidang ilmu bersangkutan.

 Formula Rasio Hazard untuk Model Extended


Cox
Jika dalam satu model terdapat variabel time-independent dan
variabel time-dependent sekaligus, maka dengan pemodelan HP Cox
extended akan diperoleh nilai rasio hazard untuk variabel time-independent,
tetapi untuk variabel time-dependent yang diperoleh adalah rerata nilai-nilai
rasio hazard dalam waktu t.
Fitting untuk model HP Cox extended ini dapat dilakukan dengan
Stata.
Sintaks
Sintaks untuk model HP Cox adalah:

48
Bab 6 Model Hazard Proporsional Extended

stcox [indepvars] [if] [in] [, options]


Tanpa pembatasan if dan in, serta tanpa opsi akan diperoleh:
ln HP = β 1 X 1 + β 2 X 2 + . . . + β p X p

Untuk model HP Cox extended sintaks-nya adalah:


stcox main_var, tvc(time_dep_var) texp(mult_func)
time_dep_var : kovariat time-dependent
mult_func : pengali (multiplier) bagi kovariat time-dependent

Contoh 6.1:
File data yang akan dianalisis adalah hip4.dta, yang memuat data
penelitian tentang fraktur panggul. Beberapa variabelnya yaitu:

id : Nomor identitas pasien


time0 : Awal pengamatan
time1 : Akhir pengamatan
fracture : Kejadian fraktur (kegagalan)
protect : Penggunaan alat pelindung
age : Usia pada saat pendaftaran studi
calcium : Kadar kalsium darah

. use “D:\Analisis Survival\Data\hip4.dta”, clear


(hip fracture study)
. list id _t0 _t _d init_drug_level in 1/10
+-------------------------------+
| id _t0 _t _d init_d~l |
|-------------------------------|
1. | 1 0 1 1 50 |
2. | 2 0 1 1 50 |
3. | 3 0 2 1 50 |
4. | 4 0 3 1 50 |
5. | 5 0 4 1 100 |
49
Bab 6 Model Hazard Proporsional Extended

|-------------------------------|
6. | 6 0 4 1 50 |
7. | 7 0 5 1 100 |
8. | 8 0 5 1 50 |
9. | 9 0 5 0 50 |
10. | 9 5 8 1 50 |
+-------------------------------+
Ada 2 macam dosis awal pemberian obat (init.drug_level), yaitu 50
dan 100. Kadar obat dalam darah akan mengalami peluruhan dengan laju
dengan skala eksponensial, sehingga kadar obat dalam darah pada waktu t
adalah init.drug_level × exp(−0.35t). Perintah Stata yaitu:
. stcox protect, tvc(init_drug_level) texp(exp(-0.35*_t))
failure _d: fracture
analysis time _t: time1
id: id

Iteration 0: log likelihood = -98.571254


Iteration 1: log likelihood = -83.895138
Iteration 2: log likelihood = -83.241951
Iteration 3: log likelihood = -83.214617
Iteration 4: log likelihood = -83.214437
Refining estimates:
Iteration 0: log likelihood = -83.214437

Cox regression -- Breslow method for ties

No. of subjects = 48 Number of obs = 106


No. of failures = 31
Time at risk = 714
LR chi2(2) = 30.71
Log likelihood = -83.214437 Prob > chi2 = 0.0000

50
Bab 6 Model Hazard Proporsional Extended

----------------------------------------------------------------------
_t | Haz. Ratio Std. Err. z P>|z| [95% Conf. Interval]
----------------+-----------------------------------------------------
main |
protect | .1183196 .0518521 -4.87 0.000 .050122 .2793091
----------------+-----------------------------------------------------
tvc |
init_drug_level | .8848298 .0601786 -1.80 0.072 .7744052 1.011
----------------------------------------------------------------------
Note: Variables in tvc equation interacted with exp(-0.35*_t).
Rasio hazard untuk init.drug_level sebesar 0.8848 adalah nilai
rerata rasio hazard antara kadar awal obat 100 dengan kadar awal obat 50
untuk mengalami kegagalan (fraktur panggul).

51
Bab 7 Model Survival Parametrik

BAB 7
MODEL SURVIVAL PARAMETRIK

 Asumsi Hazard Proporsional dan Asumsi


Accelerated Failure Time
Model survival parametrik adalah model dengan waktu survival
(respons) diasumsikan mengikuti suatu distribusi yang diketahui. Distribusi
yang sering digunakan untuk waktu survival adalah: Eksponensial, Weibull,
dan log-logistik.
Pada model survival parametrik didapatkan 2 tipe asumsi:
- Asumsi PH: Asumsi ini sama dengan asumsi PH pada model PH Cox.
Di sini efek kovariat bersifat multiplikatif terhadap hazard.

( )
h t X j = h 0 ( t ) exp ( β 1 X )
Misalnya pada model eksponensial, h 0 ( t ) diasumsikan sama dengan
exp ( β 0 ) , sehingga:

( )
h t X j = exp ( β 0 ) × exp ( β 1 X )
= exp ( β 0 + β 1 X )
- Asumsi AFT (accelerated failure time): Efek kovariat bersifat
multiplikatif terhadap waktu survival.

T = exp (α 0 + α 1 X + ε )
= exp (α 0 ) × exp (α 1 ) × exp ( ε )
Atau: ln (T) = α 0 + α 1 X + ε

Model AFT biasa dinyatakan dalam T atau ln (T).

53
Bab 7 Model Survival Parametrik

Model survival parametrik hampir semua merupakan model survival


AFT. Pada beberapa model survival parametrik, antara lain model
eksponensial dan Weibull didapatkan asumsi PH dan asumsi AFT secara
bersamaan sekaligus.

Pada model survival parametrik PH, jika h1 ( t ) menyatakan hazard


pada grup 1, h 2 ( t ) menyatakan hazard pada grup 2, maka rasio keduanya
yaitu rasio hazard h 2 ( t ) h1 ( t ) menyatakan ukuran asosiasi hazard.

Pada model AFT, jika T1 menyatakan waktu survival pada grup 1,


T 2 menyatakan waktu survival pada grup 2, maka rasio keduanya yaitu γ =
T 2 T1 dinamakan faktor akselerasi. Faktor akselerasi menyatakan ukuran
asosiasi waktu survival.
Faktor akselerasi yang lebih daripada 1 mengindikasikan bahwa
kovariat bersifat menguntungkan bagi waktu survival, sedangkan rasio
hazard yang lebih besar daripada 1 mengindikasikan kovariat bersifat
merugikan bagi hazard, begitu pula sebaliknya. Faktor akselerasi sama
dengan satu memiliki pengertian sama dengan rasio hazard sama dengan
satu, yaitu kovariat tidak berpengaruh terhadap responsnya.

 Model Regresi Eksponensial


Fungsi hazard untuk model eksponensial adalah h ( t ) = λ (hazard
bersifat konstan), sedangkan fungsi survivalnya adalah S ( t ) = exp ( −λt ) .
Model regresi untuk data survival adalah:
h ( t X ) = h 0 ( t ) exp ( β 1 X )

Misalkan h 0 ( t ) yang dinyatakan berdistribusi eksponensial asumsi hazard


proporsional, dan h 0 ( t ) = λ = exp ( β 0 ) , maka :

h ( t X ) = exp ( β 0 ) exp ( β 1 X )

= exp ( β 0 + β 1 X )
54
Bab 7 Model Survival Parametrik

Model regresi dengan asumsi AFT untuk data survival adalah:

τ j = exp − ( β 1 X ) t j

Pada model regresi eksponensial AFT diperoleh:

( )
ln t j = β 1 X + ln τ j( )
= β 1X + β 0 + uj

Fitting model regresi eksponensial dapat dilakukan dengan Stata.


Sintaks-nya untuk metrik hazard proporsional adalah:
. streg [indepvars] [if] [in], distribution(exponential)
Opsi:
nohr : Mengganti rasio hazard pada keluaran dengan koefisien regresi.
time : Fitting model dengan asumsi AFT
Perintah streg harus didahului dengan deklarasi data survival stset.

Contoh 7.1:
. use “D:\Analisis survival\Data\leukemia.dta”, clear
(Leukemia Remission Study)
. stset weeks, failure(relapse)
failure event: relapse != 0 & relapse < .
obs. time interval: (0, weeks]
exit on or before: failure

-----------------------------------------------------------------
42 total observations
0 exclusions
-----------------------------------------------------------------
42 observations remaining, representing
30 failures in single-record/single-failure data
541 total analysis time at risk and under observation
55
Bab 7 Model Survival Parametrik

at risk from t = 0
earliest observed entry t = 0
last observed exit t = 35

. streg x1 x2, dist(exponential)


failure _d: relapse
analysis time _t: weeks

Iteration 0: log likelihood = -57.251267


Iteration 1: log likelihood = -51.741837
Iteration 2: log likelihood = -41.34362
Iteration 3: log likelihood = -41.258417
Iteration 4: log likelihood = -41.258247
Iteration 5: log likelihood = -41.258247

Exponential PH regression

No. of subjects = 42 Number of obs = 42


No. of failures = 30
Time at risk = 541
LR chi2(2) = 31.99
Log likelihood = -41.258247 Prob > chi2 = 0.0000

----------------------------------------------------------------
_t | Haz. Ratio Std. Err. z P>|z| [95% Conf. Interval]
------+---------------------------------------------------------
x1 | .3351846 .138513 -2.65 0.008 .149118 .7534214
x2 | 2.421518 .5224968 4.10 0.000 1.586433 3.696183
_cons | .0077134 .0058345 -6.43 0.000 .0017514 .0339708
----------------------------------------------------------------
Note: _cons estimates baseline hazard.

56
Bab 7 Model Survival Parametrik

. streg x1 x2, dist(exponential) nohr


---------------------------------------------------------------
_t | Coef. Std. Err. z P>|z| [95% Conf. Interval]
------+--------------------------------------------------------
x1 | -1.093074 .413244 -2.65 0.008 -1.903017 -.2831306
x2 | .8843946 .2157724 4.10 0.000 .4614884 1.307301
_cons | -4.864799 .756414 -6.43 0.000 -6.347344 -3.382255
---------------------------------------------------------------

. streg x1 x2, dist(exponential) time


failure _d: relapse
analysis time _t: weeks

Iteration 0: log likelihood = -57.251267


Iteration 1: log likelihood = -51.741837
Iteration 2: log likelihood = -41.34362
Iteration 3: log likelihood = -41.258417
Iteration 4: log likelihood = -41.258247
Iteration 5: log likelihood = -41.258247

Exponential AFT regression

No. of subjects = 42 Number of obs = 42


No. of failures = 30
Time at risk = 541
LR chi2(2) =
31.99r
Log likelihood = -41.258247 Prob > chi2 = 0.0000

---------------------------------------------------------------
_t | Coef. Std. Err. z P>|z| [95% Conf. Interval]
------+--------------------------------------------------------
x1 | 1.093074 .413244 2.65 0.008 .2831306 1.903017
x2 | -.8843946 .2157724 -4.10 0.000 -1.307301 -.4614884
_cons | 4.864799 .756414 6.43 0.000 3.382255 6.347344

57
Bab 7 Model Survival Parametrik

---------------------------------------------------------------
Tampak bahwa model PH dan model AFT eksponensial memiliki
nilai-nilai estimasi yang sama besar, hanya berlawanan tanda.

 Model Regresi Weibull


Fungsi hazard pada model Weibull adalah λ pt p −1 , sedangkan fungsi
( )
survivalnya adalah S (t) = exp −λt p . Model Weibull merupakan bentuk
khusus model eksponensial, yaitu jika p = 1, maka model ini menjadi
kembali model eksponensial.

λ = exp ( β 0 + β 1 X )

Sintaks Stata untuk fitting model regresi Weibull yaitu:


. streg [indepvars] [if] [in], distribution(weibull)
Opsi:
nohr : Mengganti rasio hazard pada keluaran dengan koefisien regresi.
time : Fitting model dengan asumsi AFT

Contoh 7.2:
. use “D:\Analisis survival\Data\leukemia.dta”, clear
(Leukemia Remission Study)
. stset weeks, failure(relapse)
. streg x1 x2, dist(weibull)
failure _d: relapse
analysis time _t: weeks

Fitting constant-only model:

Iteration 0: log likelihood = -57.251267

58
Bab 7 Model Survival Parametrik

Iteration 1: log likelihood = -56.890587


Iteration 2: log likelihood = -56.890017
Iteration 3: log likelihood = -56.890017

Fitting full model:

Iteration 0: log likelihood = -56.890017


Iteration 1: log likelihood = -45.271492
Iteration 2: log likelihood = -30.621074
Iteration 3: log likelihood = -30.548147
Iteration 4: log likelihood = -30.548066
Iteration 5: log likelihood = -30.548066

Weibull PH regression

No. of subjects = 42 Number of obs = 42


No. of failures = 30
Time at risk = 541
LR chi2(2) = 52.68
Log likelihood = -30.548066 Prob > chi2 = 0.0000

------------------------------------------------------------------
_t | Haz. Ratio Std. Err. z P>|z| [95% Conf. Interval]
------+-----------------------------------------------------------
x1 | .2330768 .0965324 -3.52 0.000 .1035048 .5248528
x2 | 5.953789 2.010414 5.28 0.000 3.071627 11.54033
_cons | .0000282 .0000482 -6.14 0.000 9.95e-07 .0008015
------+-----------------------------------------------------------
/ln_p | .7930337 .1422085 5.58 0.000 .5143103 1.071757
------+-----------------------------------------------------------
p | 2.210091 .3142937 1.672485 2.920507
1/p | .45247 .0643451 .3424063 .5979129
------------------------------------------------------------------
Note: Estimates are transformed only in the first equation.

59
Bab 7 Model Survival Parametrik

Note: _cons estimates baseline hazard.

. streg x1 x2, dist(weibull) nohr


------------------------------------------------------------------------------
_t | Coef. Std. Err. z P>|z| [95% Conf. Interval]
------+--------------------------------------------------------
x1 | -1.456387 .4141656 -3.52 0.000 -2.268137 -.6446374
x2 | 1.784028 .3376697 5.28 0.000 1.122207 2.445848
_cons | -10.47489 1.707129 -6.14 0.000 -13.8208 -7.128981
------+--------------------------------------------------------
/ln_p | .7930337 .1422085 5.58 0.000 .5143103 1.071757
------+--------------------------------------------------------
p | 2.210091 .3142937 1.672485 2.920507
1/p | .45247 .0643451 .3424063 .5979129
---------------------------------------------------------------

. streg x1 x2, dist(weibull) time


---------------------------------------------------------------
_t | Coef. Std. Err. z P>|z| [95% Conf. Interval]
------+--------------------------------------------------------
x1 | .6589716 .189031 3.49 0.000 .2884777 1.029465
x2 | -.8072191 .1084224 -7.45 0.000 -1.019723 -.5947151
_cons | 4.739575 .3682582 12.87 0.000 4.017802 5.461348
------+--------------------------------------------------------
/ln_p | .7930337 .1422085 5.58 0.000 .5143103 1.071757
------+--------------------------------------------------------
p | 2.210091 .3142937 1.672485 2.920507
1/p | .45247 .0643451 .3424063 .5979129
---------------------------------------------------------------
Tampak estimasi p, 1/p, dan ln (p) bernilai sama untuk model PH dan
AFT. Untuk estimasi koefisien regresi X j berlaku β j = −α j × p, misalnya
untuk X1 :
-1.456387 = (-.6589716)(2.210091)
Untuk model eksponensial, karena p = 1 didapatkan β j = −α j .

60
Bab 7 Model Survival Parametrik

 Model Regresi Log-Logistik


λ pt p −1
Fungsi hazard untuk model log-logistik adalah , sedangkan
1 + λt p
1
fungsi survival-nya adalah .
1 + λt p
Model log-logistik merupakan model AFT, tetapi bukan model PH.
Model log-logistik merupakan model odds proporsional (model PO), yaitu
rasio odds diasumsikan konstan dalam perjalanan waktu. Odds di sini adalah
S (t )
survival odds, yaitu .
(1 − S ( t ) )
Sintaks Stata untuk fitting model regresi log-logistik adalah:
. streg [indepvars] [if] [in], distribution(loglogistic)

Contoh 7.3:
. use “D:\Analisis survival\Data\leukemia.dta”, clear
(Leukemia Remission Study)
. stset weeks, failure(relapse)
failure event: relapse != 0 & relapse < .
obs. time interval: (0, weeks]
exit on or before: failure

-----------------------------------------------------------------
42 total observations
0 exclusions
-----------------------------------------------------------------
42 observations remaining, representing
30 failures in single-record/single-failure data
541 total analysis time at risk and under observation
at risk from t = 0
earliest observed entry t = 0
61
Bab 7 Model Survival Parametrik

last observed exit t = 35

. streg x1 x2, dist(loglogistic)


failure _d: relapse
analysis time _t: weeks

Fitting constant-only model:

Iteration 0: log likelihood = -61.765573


Iteration 1: log likelihood = -56.424838
Iteration 2: log likelihood = -55.843837
Iteration 3: log likelihood = -55.835725
Iteration 4: log likelihood = -55.835723

Fitting full model:

Iteration 0: log likelihood = -55.835723 (not concave)


Iteration 1: log likelihood = -42.884032
Iteration 2: log likelihood = -33.571819
Iteration 3: log likelihood = -32.819326
Iteration 4: log likelihood = -32.816003
Iteration 5: log likelihood = -32.816002

Loglogistic AFT regression

No. of subjects = 42 Number of obs = 42


No. of failures = 30
Time at risk = 541
LR chi2(2) = 46.04
Log likelihood = -32.816002 Prob > chi2 = 0.0000

------------------------------------------------------------------
_t | Coef. Std. Err. z P>|z| [95% Conf. Interval]
---------+--------------------------------------------------------
x1 | .7425474 .2098214 3.54 0.000 .331305 1.15379
62
Bab 7 Model Survival Parametrik

x2 | -.7325418 .1075761 -6.81 0.000 -.943387 -.5216966


_cons | 4.26543 .3818616 11.17 0.000 3.516995 5.013865
---------+--------------------------------------------------------
/lngamma | -1.08906 .1509141 -7.22 0.000 -1.384846 -.7932738
---------+--------------------------------------------------------
gamma | .3365327 .0507875 .2503623 .4523614
------------------------------------------------------------------

. streg x1 x2, dist(loglogistic) time


---------------------------------------------------------
_t | Coef. Std. Err. z P>|z| [95% Conf. Interval]
---------+--------------------------------------------------------
x1 | .7425474 .2098214 3.54 0.000 .331305 1.15379
x2 | -.7325418 .1075761 -6.81 0.000 -.943387 -.5216966
_cons | 4.26543 .3818616 11.17 0.000 3.516995 5.013865
---------+--------------------------------------------------------
/lngamma | -1.08906 .1509141 -7.22 0.000 -1.384846 -.7932738
---------+--------------------------------------------------------
gamma | .3365327 .0507875 .2503623 .4523614
------------------------------------------------------------------
Tampak bahwa dengan dan tanpa opsi time, estimasi yang diperoleh
selalu adalah model AFT.

63
Bab 8 Power dan Ukuran Sampel

BAB 8
POWER DAN UKURAN SAMPEL
Dalam bab ini akan dibahas beberapa perhitungan ukuran sampel, power,
dan ukuran efek (effect size) untuk analisis survival dengan menggunakan Stata.

 Power dan Ukuran Sampel Uji Log-Rank


Sintaks

Untuk menghitung ukuran sampel:


power logrank [surv1 [surv2]] [, power(numlist) options]

Untuk menghitung power:


power logrank [surv1 [surv2]], n(numlist) [options]

Untuk menghitung ukuran efek:


power logrank [surv1], n(numlist) power(numlist) [options]

surv1 : Probabilitas survival grup kontrol pada akhir studi t


surv2 : Probabilitas survival grup eksperimen pada akhir studi t

Opsi:
alpha(numlist) : Tingkat signifikansi; default-nya adalah alpha(0.05)
power(numlist) : Power; default-nya adalah power(0.8)
beta(numlist) : Probabilitas kesalahan tipe II, default-nya adalah beta(0.2)
n(numlist) : Ukuran sampel, dibutuhkan pada perhitungan power atau
ukuran efek
n1(numlist) : Ukuran sampel grup kontrol
n2(numlist) : Ukuran sampel grup eksperimental
nratio(numlist) : Rasio ukuran sampel, N2/N1; default-nya adalah nratio(1)
hratio(numlist) : Rasio hazard; default-nya adalah hratio(0.5)
lnhratio(numlist) : Log rasio hazard

65
Bab 8 Power dan Ukuran Sampel

schoenfeld : Penggunaan formula berbasiskan log rasio hazard dalam


kalkulasi; default-nya adalah penggunaan formula
berbasiskan rasio hazard
effect(effect) : Spesifikasi tipe efek yang akan ditampilkan; default-nya
yaitu spesifik-metode
onesided : Uji satu sisi; default-nya adalah twosided

Contoh 8.1:
 Hitung ukuran sampel yang dibutuhkan untuk mendeteksi rasio hazard default
0.5 dengan menggunakan metode Freeman. Diasumsikan uji dua sisi dengan
tingkat signifikansi 5%, power 80% dan ukuran sampel kedua grup sama
besar (default).
. power logrank
Estimated sample sizes for two-sample comparison of
survivor functions
Log-rank test, Freedman method
Ho: HR = 1 versus Ha: HR != 1

Study parameters:

alpha = 0.0500
power = 0.8000
delta = 0.5000 (hazard ratio)
hratio = 0.5000

Censoring:

Pr_E = 1.0000

Estimated number of events and sample sizes:

E = 72
N = 72
N per group = 36

66
Bab 8 Power dan Ukuran Sampel

Ukuran sampel minimum per grup adalah 36 dan ukuran sampel seluruhnya
72.

 Sama seperti di atas, tetapi menggunakan metode Schoenfeld.

. power logrank, schoenfeld


Estimated sample sizes for two-sample comparison of
survivor functions
Log-rank test, Schoenfeld method
Ho: ln(HR) = 0 versus Ha: ln(HR) != 0

Study parameters:

alpha = 0.0500
power = 0.8000
delta = -0.6931 (log hazard-ratio)
hratio = 0.5000

Censoring:

Pr_E = 1.0000

Estimated number of events and sample sizes:

E = 66
N = 66
N per group = 33

Ukuran sampel minimum per grup adalah 33 dan ukuran sampel seluruhnya
66.

 Hitung ukuran sampel yang dibutuhkan dengan adanya sensoring untuk


mendeteksi perubahan survival dari 50% menjadi 60%, dengan menggunakan
uji satu-sisi.

. power logrank 0.5 0.6, onesided


Estimated sample sizes for two-sample comparison of
survivor functions
67
Bab 8 Power dan Ukuran Sampel

Log-rank test, Freedman method


Ho: HR = 1 versus Ha: HR < 1

Study parameters:

alpha = 0.0500
power = 0.8000
delta = 0.7370 (hazard ratio)
hratio = 0.7370

Censoring:

s1 = 0.5000
s2 = 0.6000
Pr_E = 0.4500

Estimated number of events and sample sizes:

E = 270
N = 600
N per group = 300

Ukuran sampel minimum per grup adalah 300 dan ukuran sampel seluruhnya
600.

 Hitung power pada studi dengan ukuran sampel grup kontrol 50 dan grup
eksperimental 100, probabilitas survival pada grup kontrol adalah 50% dan
rasio hazard 0.7370.
. power logrank 0.5, n(150) nratio(2) hratio(0.7370) onesided
Estimated power for two-sample comparison of
survivor functions
Log-rank test, Freedman method
Ho: HR = 1 versus Ha: HR < 1

Study parameters:

alpha = 0.0500
N = 150
68
Bab 8 Power dan Ukuran Sampel

N1 = 50
N2 = 100
N2/N1 = 2.0000
delta = 0.7370 (hazard ratio)
hratio = 0.7370

Number of events and censoring:

E = 66
s1 = 0.5000
s2 = 0.6000
Pr_E = 0.4333

Estimated power:

power = 0.3326

Power pada studi ini adalah 33.26%.

 Sama seperti di atas, tentukan rasio hazard minimum yang dapat dideteksi
pada sampel berukuran 150 dengan power 90%, dan sesuai default rasio
hazard target diasumsikan kurang daripada satu.

. power logrank, power(0.9) n(150) nratio(2) onesided

Estimated power for two-sample comparison of


survivor functions
Log-rank test, Freedman method
Ho: HR = 1 versus Ha: HR < 1

Study parameters:

alpha = 0.0500
N = 150
N1 = 50
N2 = 100
N2/N1 = 2.0000
delta = 0.7370 (hazard ratio)
hratio = 0.7370
69
Bab 8 Power dan Ukuran Sampel

Number of events and censoring:

E = 66
s1 = 0.5000
s2 = 0.6000
Pr_E = 0.4333

Estimated power:

power = 0.3326

Rasio hazard minimum yang dapat dideteksi adalah 0.7370.

 Power dan Ukuran Sampel Model PH Cox


Sintaks

Untuk menghitung ukuran sampel:


power cox [b1] [, power(numlist) options]

Untuk menghitung power:


power cox [b1], n(numlist) [options]

Untuk menghitung ukuran efek:


power cox [b1], n(numlist) power(numlist) [options]

b1 : Koefisien regresi hipotesis (ukuran efek) kovariat yang diminati pada


model PH Cox yang hendak dideteksi dengan uji yang powernya telah
dispesifikasikan

Opsi:
alpha(numlist) : Tingkat signifikansi; default-nya adalah alpha(0.05)
power(numlist) : Power; default-nya adalah power(0.8)
beta(numlist) : Probabilitas kesalahan tipe II, default-nya adalah beta(0.2)

70
Bab 8 Power dan Ukuran Sampel

n(numlist) : Ukuran sampel, dibutuhkan pada perhitungan power


atau ukuran efek
hratio(numlist) : Rasio hazard; default-nya adalah hratio(0.5)
sd(numlist) : Standar deviasi kovariat yang diminati; default-nya
adalah sd(0.5)
r2(numlist) : Kuadrat koefisien korelasi ganda dengan kovariat lain;
default-nya adalah r2(0)
eventprob(numlist) : Probabilitas total kejadian (kegagalan) yang diminati;
default-nya adalah eventprob(1)
failprob(numlist) : Sinonim untuk eventprob()
wdprob(numlist) : Proporsi subjek yang diantisipasi akan mengundurkan
diri dari studi; default-nya adalah wdprob(0)
effect(effect) : Tipe efek yang akan ditampilkan; default-nya adalah
effect(coefficient)
onesided : Uji satu sisi; default-nya adalah twosided

Contoh 8.2:
 Hitung jumlah kegagalan yang diperlukan untuk mendeteksi penurunan 0.5
pada hazard kovariat biner yang diminati. Sesuai default, rasio hazard adalah
0.5 sehingga koefisien regresi ln (0.5) = −0.6931, SD kovariat adalah 0.5,
tingkat signifikansi 5%, dan power 80%. Akan digunakan uji dua-sisi.

. power cox
Estimated sample size for Cox PH regression
Wald test
Ho: beta1 = 0 versus Ha: beta1 != 0

Study parameters:

alpha = 0.0500
power = 0.8000
delta = -0.6931 (coefficient)
hratio = 0.5000
sd = 0.5000

Censoring:
71
Bab 8 Power dan Ukuran Sampel

Pr_E = 1.0000

Estimated number of events and sample size:

E = 66
N = 66

Jumlah kegagalan yang dibutuhkan adalah 66.

 Hitung ukuran sampel yang dibutuhkan untuk mendeteksi koefisien regresi −1


untuk kovariat yang diminati dengan standar deviasi 0.3, dengan
menggunakan uji sat-sisi.

. power cox −1, sd(0.3) onesided


Estimated sample size for Cox PH regression
Wald test
Ho: beta1 = 0 versus Ha: beta1 < 0

Study parameters:

alpha = 0.0500
power = 0.8000
delta = -1.0000 (coefficient)
b1 = -1.0000
sd = 0.3000

Censoring:

Pr_E = 1.0000

Estimated number of events and sample size:

E = 69
N = 69

Ukuran sampel yang dibutuhkan adalah 69.

72
Bab 8 Power dan Ukuran Sampel

 Hitung power pada studi dengan koefisien regresi kovariat yang diminati −1,
probabilitas total kegagalan 0.85, ukuran sampel 150 dengan standar deviasi
0.3. Korelasi kuadrat kovariat yang diminati dengan kovariat lain adalah R2 =
0.3. Akan dilakukan uji sat-sisi.
. power cox -1, n(150) sd(0.3) eventprob(0.85) r2(0.3) onesided
Estimated power for Cox PH regression
Wald test
Ho: beta1 = 0 versus Ha: beta1 < 0

Study parameters:

alpha = 0.0500
N = 150
delta = -1.0000 (coefficient)
b1 = -1.0000
sd = 0.3000
R2 = 0.3000

Number of events and censoring:

E = 128
Pr_E = 0.8500

Estimated power:

power = 0.8828

Power studi adalah 88.28%.

73
KEPUSTAKAAN

Cleves M, Gutierrez RG, Gould W, Marchenko YV. An Introduction to


Survival Analysis Using Stata, 3rd Ed. College Station, Texas: Stata
Press, 2010.
Hosmer DW, Lemeshow S, May S. Applied Survival Analysis: Regression
Modeling of Time-to-Event Data, 2nd Ed. Hoboken, New Jersey:
John Wiley & Sons, Inc, 2008.
Kleinbaum DG, Klein M. Survival Analysis: A Self-Learning Text, 2nd
Ed. New York: Springer, 2005.
Liu X. Survival Analysis: Models and Applications. Chichester, West
Sussex: John Wiley & Sons Ltd, 2012.
Nikulin M, Wu H-D I. The Cox Models and Its Applications. Berlin:
Springer Nature, 2016.
Selvin S. Survival Analysis for Epidemiologic and Medical Research: A
Practical Guide. Cambridge: Cambridge University Press, 2008.
StataCorp LLC. Survival Analysis Reference Manual: Release 15. College
Station, Texas: Stata Press, 2017.

van Houwelingen HC, Stijnen T. Cox Regression Model. In: JP Klein, HC


van Houwelingen, JG Ibrahim, TH, Scheike (eds). Handbook of
Survival Analysis. Boca Raton, FL: CRC Press, 2014, pp 5-25.

75

Anda mungkin juga menyukai