1.1 Pendahuluan.
Teori analisis survival (kehidupan) lebih memfokuskan kepada penelitian
dibidang kesehatan. Oleh sebab itu dibeberapa universitas mata kuliah ini
disebut statistik kesehatan atau statistik perubatan. Waktu survival
(kehidupan) dapat didefinisikan secara luas sebagai waktu terjadinya
diberikan suatu peristiwa. Peristiwa yang dimaksud adalah perkembangan
suatu penyakit, reaksi terhadap suatu percobaan, kambuhnya suatu penyakit
dan kematian. Sehingga waktu survival dapat berupa waktu permulaan dari
percobaan hingga memberikan sebuah reaksi dan waktu hingga terjadinya
kematian. Lebih lanjut survival data dapat berupa :
1. waktu survival itu sendiri
2. reaksi terhadap diberikan suatu percobaan
3. perkembangan suatu penyakit
4. sifat pasien yang dihubungkan dengan reaksi yang diberikan
Analisis Survival merupakan suatu teori atau ilmu yang memberikan fokus
kajian kepada beberapa bidang diantaranya :
1. Perkiraan nilai peluang pada suatu reaksi
2. Rata-rata waktu hidup
3. Membandingkan distribusi yang dihasilkan pada percobaan pasien
manusia atau hewan
4. Mengidentifikasi faktor-faktor yang berhubungan dengan reaksi
yang ditimbulkan oleh penyakit
1
1.2.1 Jenis Data Sensor I
Biasanya penelitian dimulai dengan jumlah bilangan yang tepat dimana
diberikan suatu percobaan. Dikarenakan terbatasnya dana dan waktu, sering
sekali penelitian tidak dapat menunggu hingga objek yang diteliti bereaksi
atau meninggal. Dan seterusnya ditetapkan suatu perioda waktu pasti, untuk
mengatasi masalah di atas.Hal ini berarti bahwa batas waktu objek
penelitian hanya bergantung pada periode waktu
Contoh : 6 ekor tikus telah diperuntukkan sebagai penentu penyebab
penyakit kanker dengan menyuntikkan sel tumor kedalam lapisan kaki.
Sehingga waktu perkembangan tumor dari ukuran yang diberikan
diobservasi. Peneliti menetapkan periode selama 30 minggu.
D x
5 10 15 20 25 30
2
1.2.2 Jenis Data Sensor II
Sebagian besar penelitian kesehatan berkenaan dengan penelitian periode
yang tetap dan pasien memasuki perioda tersebut dengan waktu yang
berbeda-beda selama perioda tersebut, beberapa pasien mungkin mati
sebelum akhir perioda dan dikenal sebagai data tidak sensor dan beberapa
pasien mungkin hilang atau belum mati hingga perioda berakhir
A x
B
C x
D
E x
F
1 2 3 4 5 6 7 8 9 10 11 12 Akhir priod
4
Jika terdapat data sensor maka rumus di atas tidak dapat selalu digunakan.
S (t)
1,0
0,8
0,6
0,4
0,2
10 20 30 40 50 60 t
S (t)
1,0
0,8
0,6
0,4
0,2
10 20 30 40 50 60 t
5
Dari kedua gambar di atas dapat dilihat bahwa gambar di sebelah kiri
memiliki nilai kehidupan (survival) lebih rendah dibandingkan dengan nilai
kehidupan di sebelah kanan. Sedangkan nilai median disebelah kiri
mendekati 8 sedangkan nilai median dari kurva sebelah kanan mendekati
28, hal ini menambah dukungan bahwa kurva sebelah kanan memiliki nilai
kehidupan (survival) lebih lama.
Jika data sudah berbentuk interval, maka ada ketentuan Ketentuan yang
harus diperhatikan. Perhatikan contoh berikut
0-5 40 5 1
5-10 35 7 0,875
10-15 28 6 0,700
15-20 22 4 0,550
20-25 18 5 0,450
25-30 13 4 0,325
30-35 9 4 0,225
35-40 5 0 0,125
40-45 5 2 0,125
45-50 3 1 0,075
1.0
≥ 50 2 2
0.8
0.6
y
Sˆ 0 1
35 28
Sˆ 5 Sˆ 10
0.4
0,875 0,700
40 40
Penggambaran Kurva Survival
0.2
f t e t t 0
tentukan fungsi survival (S(t))
St 1 F t
e t
1.4 Fungsi Densitas Peluang atau Fungsi Densitas f(t)
Seperti variabel kontinu lainnya, waktu survival T mempunyai fungsi
densitas peluang. Pada prakteknya jika tidak terdapat observasi sensor,
fungsi densitas peluang diestimasi sebagai proporsi dari pasien yang
meninggal dalam interval perunit lebar :
f(t)
0 1 2 3
f(t)
0 1 2 3
8
Kurva densitas dapat digambarkan dengan menentukan titik tengah interval
dan titik estimasi fungsi densitas peluang
0 .0 3
0 .0 2
y
0 .0 1
0 .0
10 20 30 40
Pada kurva densitas dapat dilihat bahwa frekuensi tertinggi kematian terjadi
pada interval bulan 5-10
f t
h t
1 F t
f (t ) fungsi densitas peluang
F (t ) fungsi distribusi kumulatif
9
Fungsi hazard kemungkinan bisa menaik, tetap konstan,menurun, atau
menunjukka proses yang lebih komplek
25-30 13 4 0.072
30-35 9 4 0.114
0.08
35-40 5 0 0.000
40-45 5 2 0.100
0.06
y
45-50 3 1 0.080
0.04
≥ 50 2 2 -
Kurva fungsi bahaya
0.02
10
0.0
10 20 30 40
x
1.6 Hubungan Antara Fungsi Survival
Ketiga fungsi yang telah dibicarakan di atas akan ditentukan hubungannya,
sebelum itu akan didefinisikan fungsi kumulatif hazard sebagai berikut :
t
H t h x dx
0
Dari definisi sebelumnya diketahui
f t f t
h t
1 F t St
d d
f t F t 1 S t S ' t
dt dt
S't d
h t log S t
St dt
11
d
h t log S t
dt
inntegralkan dari 0 hingga t , dan menggunakan S 0 1
t
h x dx log S t
0
H t log t
t
S t eksp H t eksp h x dx
0
f t h t eksp H t
Contoh : dari soal sebelumnya diketahui bahwa f(t) = e-t dan S(t) = e-t
sehingga dapat ditentukan nilai h(t) = 1
Jawab :
t
H t c dx
0
t
cx o ct 0 ct
Selanjutnya
S t eksp ct
f t c eksp ct
13
Dimana n – i adalah jumlah orang dalam sampel survival yang lebih lama
dari t(i). Jika dua atau lebih t(i) kembar, nilai i yang terbesar digunakan.
Sebagai contoh jika t 2 t 3 t 4 , maka
n4
Sˆ t 2 Sˆ t 3 Sˆ t 4
n
Karena setiap orang hidup pada permulaan kajian dan tak satupun yang
lebih lama daripada t(n)
Sˆ t 0 1 dan Sˆ t n 0
Dalam prakteknya Ŝ t dihitung pada setiap waktu survival. Kita tidak
harus kuatir terhadap interval diantara waktu interval yang mana
didalamnya tak satupun yang mati dan Ŝ t adalah konstan tetap. Ŝ t
adalah fungsi tangga yang memulai pada 1 dan menurun dengan 1/n menuju
0. Ketika Ŝ t diplotkan dengan t, berbagai persentil dari waktu survival
dapat dibaca dari grafik atau dihitung dari Ŝ t .
14
Ŝ t digambarkan sebagai fungsi tangga dan fungsi mulus seperti
gambare berikut
1.0
0.8
0.6
yy
0.4
0.2
0.0
0 2 4 6 8 10 12
xx
1.0
0.8
0.6
yy
0.4
0.2
0.0
0 2 4 6 8 10 12
xx
15
Estimasi median waktu survival adalah bulan ke 8 pada gambar fungsi
tangga atau 7,6 pada gambar kurva mulus. Estimasi yang lebih akurat dapat
dihasilkan dengan menggunakan interpolasi linier seperti
86 8m
m 7,3
0,4 0,7 0,4 0,5
16
Kaplan – Meier estimasi S(2) seperti berikut
ˆ 2
S
proporsi pasien survive dua tahun diberikan mereka surv
untuk satu tahun
proporsi pasien survive satu tahun
Untuk data yang diberikan di atas, satu dari empat pasien yang survive pada
tahun pertama survive dua tahun, jadi proporsi pertama adalah ¼. 4 dari 10
pasien yang masuk pada permulaan tahun 2000 dan 5 dari 20 pasien yang
masuk pada pada akhir 2000 survive satu tahun. Oleh sebab itu proporsi
kedua kedua adalah (4+5)/(10+20). Produk Limit untuk mengestimasi S(2)
adalah
1 45
Sˆ 2 0,075
4 10 20
Aturan yang sederhana dapat dibangun seperti berikut : peluang dari survive
k 2 tahun atau lebih dari permulaan kajian adalah perkalian dari nilai
observasi survive
Sˆ k p1 p 2 p3 p k
Dimana p1 merupakan notasi proporsi pasien survive paling sedikit satu
tahun, p2 proporsi dari pasien survive tahun kedua setelah mereka survive
satu tahun, p3 adalah proporsi pasien survive pada tahun ketiga setelah
mereka survive dua tahun dan p k proporsi pasien survive pada tahun ke-k
setelah mereka survive k-1 tahun.
Oleh sebab itu Produk Limit estimasi peluang survive dari jumlah tahun
tertentu dari permulaan kajian adalah perkalian estimasi hingga tahun yang
mendahuluinya, dan nilai survive estimasi untuk tahun tertentu, yakni
Sˆ t Sˆ t 1 pt
Estimasi Produk Limit adalah estimasi maksimum likelihood.
Dalam prakteknya, Estimasi Produk Limit dapat dihitung dengan
membangun tabel dengan lima kolom, dengan mengikuti perintah di bawah
ini
1. Kolom 1 memuat semua waktu survive, baik sensor dan tidak sensor,
diurutkan dari yang terkecil hingga terbesar. Tanda plus diberikan
untuk observasi sensor. Jika observasi sensor mempunyai nilai yang
sama seperti nilai tidak sensor, yang belakangan harus muncul pertama.
2. Kolom kedua, dilebelkan dengan i, berisikan rangking yang
berhubungan dengan setiap observasi pada kolom 1
3. Kolom ketiga, dilabelkan dengan r, yang bersinggungan dengan dengan
observasi hanya tidak sensor. Misal r = i
17
4. Hitung n r n r 1 atau pi untuk setiap observasi yang
tidak sensor t(i) dalam kolom 4 untuk memberikan proporsi pasien
survive hingga dan kemudian sampai pada t(i)
5. Kolom kelima, Ŝ t adalah perkalian semua nilai dari
n r n r 1 hingga dan termasuk t. Jika beberapa observasi
yang tidak sensor kembar, Ŝ t yang terkecil harus digunakan.
Untuk menyimpulkan prosedur ini, misal n adalah jumlah total pasien yang
waktu survivenya sensor atau tidak tersedia. Lebelkan kembali n waktu
survive dalam urutan menaik sedemikian hingga t 1 t 2 t n .
Kemudian
nr
Sˆ t n r 1
t r t
18
Fungsi bentuk survival Ŝ t digambarkan pada grafik berikut, estimasi
median waktu remisi adalah m = 9,8 bulan
1.0
0.8
0.6
St
0.4
0.2
0.0
0 5 10 15
t
n r n1 r 1
Var Sˆ t Sˆ t
2
19
Dimana r termasuk kedalam bilangan bulat positif untuk yang mana
t r t dan t(r) berhubungan dengan kematian. Sebagai contoh
2
var Sˆ 10 0,482
1
1
1
1
0.0352
9 10 6 7 5 6 3 4
Rata-rata waktu survival dapat ditunjukkan sama dengan daerah di
bawah estimasi fungsi bentuk survival. Untuk mengestimasi , kita dapat
gunakan
̂ Sˆ t
0
dt
ˆ 1t 1 Sˆ t 1 t 2 t 1 Sˆ t 2 t 3 t 2 Sˆ t m1 t m t m 1
Bagaimanapun juga, juga jika observasi yang terbesar dalam data adalah
data sensor dan digunakan sebagai t(m) untuk mengestimasi sehingga
mungkin menghasilkan estimasi yang rendah. Pada kasus ini, Irwin (1949)
menyarankan bahwa sebagai pengganti mengestimasi rata-rata waktu
survival, salah satunya seharusnya memilih limit waktu L dan mengestimasi
rata-rata waktu survival dengan limit menuju L katakanlah L , dengan
menggunakan L untuk t(m). Sebagai contoh, jika pada contoh sebelumnya
20
observasi yang terbesar adalah data sensor, yakni 15+ dan jika kita
memisalkan L = 16, maka
16 3 3.150 2.251 0.964 0.24116 12
10.329
Dimana rata-rata waktu survival dibatasi (limit) pada 16 bulan.
Variansi ̂ diestimasikan oleh
Ar2
var ˆ
r n r n r 1
Dimana r begerak sampai pada bilangan bulat untuk t r yang berhubungan
dengan mati, dan Ar adalah daerah dibawah kurva Ŝ t kekanan t(r). Ar ke-
k berkaitan dengan m observasi tak sensor adalah
Sˆ t k t k 1 t k Sˆ t k 1 t k 1 t k 2 Sˆ t m1 t m t m1
Jika tidak ada observasi yang sensor akan menghasilkan rata-rata sampel
t t i n dan menghasilkan
Var ˆ Var t
t i t
2
n2
Yang mana estimasi tidak tak bias. Kaplan dan Meier menyarankan bahwa
kedua rumus variasi yang telah dibahas di atas harus dibagi secara berturut-
m n
turut dengan dan . Berikut akan dibahas untuk data-data
m 1 n 1
dari dua contoh soal yang telah diberikan sebelumnya dimana contoh soal
pertama tidak ada data sensor dan contoh kedua mempunyai data sensor
untuk itu masing-masing variansi untuk ̂ diberikan oleh
t ˆ 8.2 dan menghasilkan variansi yang tidak tak bias (bias) 0,616,
10
jika faktor n n 1 dikalikan akan menghasilkan variansi yang
9
takbias ialah 0.684. Selanjutnya untuk menghitung variansi dari ̂ dengan
menggunakan contoh yang memiliki data sensor, pertama sekali hitung lima
Ar yaitu A1 , A4 , A5 , A7 dan A9
21
A1 Sˆ t 1 t 2 t 1 Sˆ t 2 t 3 t 2 Sˆ t 5 t 6 t 5
3.150 2.251 0.964 0.723 7.088
A4 Sˆ t 2 t 3 t 2 Sˆ t 5 t 6 t 5
2.251 0.964 0.723 3,938
A5 2.251 0.964 0.723 3,938
A7 0.964 0.723 3,938
A9 0.723
var ˆ
7.088 2 3.938 2 3.938 2 1.687 2 0.723 2 1.942
9 10 6 7 5 6 3 4 1 2
Jika faktor m m 1 6 5 dikalikan pada nilai estimasi variansi di atas
akan menghasilkan variansi yang tak bias 2.330
24
Uji Logrank
Mantel (1966) membangun uji Savage (1965), seering dianggap sebagai uji
logrank (Peto dan Peto, 1972) yang didasari pada himpunan skor w i yang
diberikan oleh observasi. Skor adalah fungsi logaritma dari fungsi survival.
Altshuler (1970) mengestimasi fungsi log survival pada t (i) dengan
menggunakan
m j
e t i
j t i r j
Dimana m(j) dan r(j) telah didefinisikan pada seksi sebelumnya. Skor-skor
yang disarankan oleh Peto dan Peto adalah wi 1 e t i untuk
observasi yang tidak sensor dan e T untuk observasi yang sensor pada
saat T. Pada prakteknya untuk observasi sensor t i , wi e t j
dimana t(j) adalah observasi yang tidak sensor terbesar yakni t j t i . Jadi,
semakin besar observasi yang tidak sensor semakin kecil skornya.
Observasi sensor mendapat skor negatif. Jumlah skor w secara identik 0
untuk dua grup bersamaan. Uji logrank didasari pada jumlah S dari skor w
dua grup. Perhitungan variansi S diberikan oleh
n1 n2
n1 n2 w 2
i
var S i 1
n1 n2 n1 n2 1
Yang mana dapat ditulis kembali seperti
k m j r j m j n1 n2
v
j 1 r j n1 n2 n1 n2 1
X 2
O1 E1
2
O2 E 2
2
E1 E2
Memiliki hampiran distribusi chi-kuadrat dengan derjat kebebasan 1, Nilai
X 2 X 12, 0.05 akan mengizinkan untuk menolak hipotesis null.
Untuk menghitung E1 dan E2 kita menyusun semua observasi tidak sensor
dalam urutan menaik dan menghitung ekspektasi kematian pada waktu yang
tidak sensor dan menjumlahkannya. Jumlah ekspektasi kematian pada
waktu tak sensor adalah dihasilkan dengan mengalikan kematian yang
diobservasi pada waku tersebut dengan proporsi pasien mengarah (tak
terlindungi) ke resiko dalam percobaan grup. Misal d 1 adalah jumlah
kematian pada waktu t dan n 1t, n2t adalah jumlah pasien masih mengarah ke
resiko mati pada waktunya hingga t dalam dua percobaan grup. Ekspektasi
kematian untuk grup 1 dan 2 pada waktu t adalah
n1t n2t
e1t dt e2 t dt
n1t n 2t n1t n 2t
Total jumlah ekspektasi kematian dalam dua grup adalah
E1 e
semua t
1t dan E2 e
semua t
2t
X2
1 3.75 2
5 2.25 2 5.378
3.75 2.25
Dengan membandingkan nilai ini dengan tabel chi-kuadrat, maka akan
menghasilkan keputusan yang sama seperti sebelumnya yaitu terdapat
perbedaan yang signifikan antara dua grup percobaan.
dari fungsi survival. Notasi untuk skor observasi tidak sensor t (i) adalah
u i Sˆ t i Sˆ t i 1 1 dan Sˆ t 0 0 dan yang untuk observasi
sensor t j adalah u Sˆ t 1 , dimana t t . Skor yang dibangkit
j i i j
Var S 5 5
0.9 0.803
2 2
0.765
10 9
Jadi Z 2.128 0.765 2.433 Z 0.05 1.64 , kita
menolak H0 pada 0.05
Uji F Cox’s
Uji F Cox’s (Cox 1964) didasari pada urutan skor dari distribusi
eksponensial. Ini untuk sensor satu demi satu atau sampel lengkap. Ini tidak
dapat dipakai untuk data sensor yang banyak. Prosedurnya diberikan seperti
berikut :
1. Ranking observasi dalam sampel yang digabung
2. gantikan rangking dengan menghubungkan harapan statistic
berurut dalam pensampelan unit distribusi eksponensial
f t e t . Notasikan oleh trn nilai harapan dari observasi ke-r
dengan urutan jarak meningkat
1 1
t rn r 1, , n
n n r 1
Dimana n adalah jumlah total observasi dalam dua sampel.
Khususnya
29
1
t1n
n
1 1
t 2n
n n 1
1 1
t nn 1
n n 1
Untuk n yang tidak terlalu besar, mereka dapat dengan mudah
dihitung dengan menggunakan tabel timbale balik. Ketika dua atau
lebih observasi tunggal, rata-rata dari skor yang digunakan
3. Untuk data tanpa observasi, keseluruhan himpunan n observasi
digantikan oleh himpunan skor t rn yang dihasilkan. Rata-rata
skor sampel dinotasikan dengan t1 dan t 2 dari dua sampel
dengan n1, n2 observasi kemudian dihitung. Rasio t1 t 2 telah
ditunjukkan mengikuti distribusi F dengan derjat kebebasan
(2n1,2n2). Daerah kritis untuk menguji
H 0 : S1 S 2 melawan H1 : S1 S 2 , H1 : S1 S 2 ,
dan H1 : S1 S 2
4. Seterusnya
t1 t 2 F2 n1 , 2 n 2 , , t1 t 2 F2 n1 , 2 n 2 ,1
dan t1 t 2 F atau t1 t 2 F2 n ,1 2
2 n1 , 2 n 2 , 1 , 2 n2
2
5. Perhitungan F sedikit berbeda untuk data sensor. Misal r 1 dan r2
adalah jumlah gagal dan n1-r1 dan n2-r2 adalah observasi sensor
dalam dua sampel. Maka terdapat p = r1 + r2 kegagalan dalam
gabungan sampel dan n – p observasi sensor. Cox (1964)
menyarankan menggunakan skor t1n , , t pn seperti sebelumnya
untuk gagal dan t p 1 n untuk setiap observasi sensor. Rata-rata
skor untuk grup pertama adalah
r1t1 n1 r1 t p1 n
t1
r1
Dimana t1 adalah rata-rata skor gagal. Rata-rata untuk grup
kedua dihitung dengan cara yang sama. Uji statistic F t1 t 2
menghampiri distribusi F dengan derjat kebebasan (2r1,2r2)
30
Contoh : dalam eksprimen membandingkan dua treatment (A dan B) untuk
tumor ganas, andaikan bahwa pertanyaan apakah percobaan B lebih baik
dari pada percobaan A. Enam tikus diberikan percobaan A dan Enam
percobaan untuk B. Eksprimen diakhiri setelah 30 hari, waktu survival
berikut dicatat. Hipotesis null dan alternative berturut-turut adalah seperti
berikut
H0 : S A SB
H1 : S A S B
Treatment A : 8, 8, 10, 12, 12, 13
Treatment B : 9, 12, 15, 20, 30+, 30+
Semua tikus menerima percobaan A mati dalam 13 hari dan dua tikus yang
menerima treatment B masih hidup hingga akhir kajian. Apakah data
memberikan cukup bukti bahwa treatment B lebih efektif dari treatment A.
Untuk menghitung uji statistik, lebih baik disusun dalam tabel seperti
dibawah. Kolom pertama daftar semua observasi dalam dua sampel, kolom
kedua memuat skor eksponensial yang diurutkan t rn. Pada kasus ini n1 = 6,
n2 = 6, n = 12, r1 = 6 dan r2 = 4. Skor dihitung seperti prosedur kedua di atas,
sebagai contoh trn untuk ti = 10 sama dengan 1/12 + 1/11 + 1/10 + 1/9 =
0,385. Observasi kembar menerima rata-rata skor, sebagai contoh, untuk t i =
1
12, t rn 0,510 0,653 0,820 0,661 . Kolom dua terakhir
3
dari tabel memberikan skor untuk dua sampel dan jumlah dimasukkan pada
bagian bawah. Sehingga
2,985 8,014
tA 0,498 dan t B 2,004 dan pada akhirnya
6 4
t A 0,498
F 0,249
t B 2,004
Dengan derjat kebebasan (12,8). Karena nilai F < F12,8,0.05) maka dapat
disimpulkan karenanya data memberikan bukti yang kuat bahwa B lebih
baik dari pada A.
Uji Mantel-Haenszel
Uji mantel-Haenszel berguna sekali terutama untuk membandingkan
pengalaman survival diantara dua grup ketika penyesuaian untuk faktor
penentu lain diperlukan. Ujian ini telah banyak digunakan dalam kajian
secara klinik maupun secara epidemic seperti metoda mengontrol akibat-
akibat variabel yang dibaurkan. Sebagai contoh dalam membandingkan dua
percobaan untuk penyakit menular, ini akan menjadi penting untuk
penyesuaian perbandingan untuk variabel-variabel yang mungkin berbaur
seperti tingkatan penyakit. Dalam mempelajari hubungan merokok dengan
penyakit hati, ini akan menjadi penting untuk mengontrol akibat-akibat usia.
Untuk menggunakan uji Mantel-Haenszel, data distratifikasi oleh variabel-
variabel yang berbaur, dan dimasukkan dalam deretan tabel 2x2, satu untuk
tiap stratum.
Misal s adalah jumlah strata, nji adalah jumlah induvidu-induvidu dalam
grup j, j = 1,2 dan stratum i, i = 1,2,…s, dan d ji adalah jumlah kematian
dalam grup j dan stratum i, untuk tiap-tiap strata, data dapat digambarkan
dengan tabel kontingensi 2 x 2
32
H 0 : p11 p12
p 21 p 22
p s1 ps2
Dimana p ij P mati grup j , stratum i . Jadi ujian mengizinkan
secara simultan membandingkan semua s tabel kontingensi dari perbedaan
dalam peluang hidup atau mati untuk dua grup.
Uji statistic ci-kuadrat tanpa pembetul kekontinuan diberikan oleh
X2
s
d i 1 E d 1i
i 1 1i
s
2
var d1i
s
i 1
Dimana
n1i Di n n DS
E d1i dan Var d1i 1i2 2i i i
Ti Ti Ti 1
Adalah berturut-turut rata-rata dan varians dari jumlah kematian dalam grup
i yang dihitung secara bersyarat pada total marginal tabel kontingensi.
Statistik ini mengikuti distribusi chi-kuadrat dengan 1 derjat kebebasan.
Sehingga sebuah pilihan dihitung mengindentifikasikan perbedaan yang
signifikan dalam survival diantara dua kumpulan. Contoh berikut
mengilustrasikan penggunaan ujian.
Contoh : 595 orang yang berpartisipasi pada sebuah kasus kajian kontrol
yang berhubungan kolesterol dan koroner penyakit hati (CHD). Diantara
mereka, 300 orang diketahui mempunyai CHD dan 295 bebas dari CHD.
Untuk menemukan jika kolesterol dibuang secara signifikan dihubungkan
dengan CHD, peneliti memutuskan untuk mengontrol pengaruh-pengaruh
dari merokok. Subjek penelitian kemudian dibagi kedalam dua stratum
perokok dan tidak perokok.
Tabel berikut memberikan data untuk perokok :
33
Dan Untuk Tidak Perokok
X2
150 128,571 2 16,220
14,337 13,974
Jadi kolesterol yang dibuang adalah secara signifikan dihubungkan dengan
CHD setelah menyesuaikan untuk akibat-akibat dari perokok.
Contoh : Tabel berikut data survival dalam format tabel kehidupan dari
kasus laki-laki dengan dilokalisir kanker anus untuk tahun 1935-1944 dan
1945-1954. Kita gunakan uji chi-kuadrat Mantel-Haenszel untuk melihat
jika distribusi survival dari pasien yang didiagmosa pada tahun 1935-1944
sama dengan pasien yang didiagnosa pada tahun 1945-1954. Hipotesis null
adalah bahwa dua distribusi survival adalah sama. Ini tidak memerlukan
untuk menyediakan 10 tabel kontingensi untuk 10 interval.
34
1935-1944 1945-1954
Int mati selamat Total mati selamat Total
d1i n1i – d1i n1i d2i n2i – d2i n2i
1 167 220 387 185 559 744
2 45 173,5 218,5 88 461 549
3 45 127,5 172,5 55 396 451
4 19 108 127 43 343 386
5 17 91 108 32 299 331
6 11 79,5 90,5 31 235 266
7 8 71 79 20 170 190
8 5 66 71 7 132 139
9 6 59,5 65,5 6 101,5 101,5
10 7 52 59 6 71 77
330
X 2 330 246,50
2
132,491 52,624
35
menerima K percobaan memberikan cukup bukti untuk memutuskan bahwa
K percobaan tidak efektif sama. Permasalahan ini telah dipertimbangkan
oleh banyak ahli statistic, sebagai contoh Kruskal dan Wallis (1952), Mantel
Dan Haenszel (1959), Breslow (1970) dan Peto Dan Peto (1972). Pada seksi
ini dua uji nonparametric untuk permasalahan ini.
nj
Rj 1
R j rij Rj R N 1
i 1 nj 2
n j Rj R
K
12
2
H
N N 1 j 1
K R 2
12
3 N 1
j
N N 1 j 1 n j
36
Jika terdapat observasi-observasi terdapat yang kembar setiapnya diberikan
rata-rata dari rangking. Untuk membetulkan akibat dari adanya kembar, H
dihitung seperti rumus di atas dan dibagi dengan
g
1
1
N N
3 T
j 1
j
12 N N 1 kj 1 R 2j
n j 3 N 1
H
1 j 1 T j
g
N 3
N
Catatan, ketika tidak ada data kembar, g = N, t j = 1 untuk semua j, dan Tj =
0 sehingga hitungan H kembali seperti rumus penghitungan H yang
pertama.
Contoh : Pada kajian hubungan diantara tingkatan kolesterol dan diet, tiga
jenis diet diberikan secara acak kepada 12 lelaki yang tingkatan pertama
kolesterolnya hampir sama, seperti pada tabel berikut yang berisikan
tingkatan kolesterol dari 12 orang yang setelah diberikan diet untuk perioda
waktu yang diberikan. Tujuan dari penelitian ini adalah untuk memutuskan
jika tiga diet memiliki keefektifan yang sama dalam mengontrol tingkat
kolesterol.
H
12 12 13 784 4 156.25 4 1406.25 4 313 6.168
1 12 1728 12
Ini membuktikan bahwa terdapat perbedaan yang signifikan antara 3 diets
yang ada.
38
S nj
K
2
j
j 1
X
2
s2
N
w 2
i
s2 i 1
N 1
X2 mendekati distribusi chi-kuadrat dengan derjat kebebasan K – 1, jika
tolak H0 jika X k 1
2 2
1 2 3
4,5,9,10,12,13,10,23,28 8,10,10,12,14,20,48 8,10,11,23,25,25,28,2
,28,28, ,70,75,99, 8,31,31,
29,31,32,37,41,41,57,6 103,162,169,195,22 40,48,89,124,143,12+
2,74,100, 0,161+,199+, ,159+,190+,
139,20+,258+,269+ 217+,245+ 196+,197+,205+,219
+
Pada kasus ini N = 66, n1 = 25, n2 = 19, dan n3 = 22. Dengan menyusun
kedalam tabel seperti pada uji logrank, maka jumlah-jumlah skor dapat
dihasilkan S1 = -273, S2 = 170, dan S3 = 103. Sedangkan jumlah kuadrat
skor adalah wi2 89,702 . Karenanya dengan menggunakan rumusan
di atas dapat dihasilkan
X 2 3,612
Dari hasil ini membuktikan bahwa kita tidak dapat menolak H 0. Data tidak
menunjukkan perbedaan yang signifikan diantara tiga percobaan awal.
39
BEBERAPA DISTRIBUSI SURVIVAL PARAMETRIK DAN
APLIKASINYA
Pada bagian ini beberapa distribusi teoritis yang telah digunakan secara
meluas untuk menggambarkan waktu survival didiskusikan kesimpulan
sifatnya dan mengilustrasikan aplikasinya.
40
S(t)
1
2
1
0 t
h(t)
f(t)
0 t 0 t
Ketika waktu survival T mengikuti distribusi eksponensial dengan
parameter , fungsi densitas peluang didefinisikan seperti
e t , t 0, 0
f t
0 t0
F t 1 e t , t0
h t , t0
e t G , tG
f t
0, t G
Kemudian
1 e t G , t G
Ft
0, tG
e t G , tG
St
0, t G
Dan
0, 0t G
h t
, t G
42
Istilah G adalah jaminan waktu didalamnya yang tidak mati atau gagal
dapat terjadi atau waktu survival minimum. Rata-rata dari distribusi
eksponensial dua parameter adalah.
1
G
Contoh : Dalam kajian obat baru anti kanker dalam L1210 sistem leukemia
binatang, Zelen (1966) berhasil menggunakan distribusi eksponen sebagai
model untuk waktu survival. Sistem terdiri dari menyuntikkan tumor
kedalam tikus-tikus hasil perkawinan. Sel tumor ini kemudian berkembang
biak dan dengan cepat membunuh binatang, tetapi waktu survival mungkin
diperpanjang oleh obat yang aktif. Gambar berikut menunjukkan kurva
survival dalam skala semilogaritma dari tikus-tikus yang tidak dicoba
disuntik pada sel melemah yang berbeda. 25 tikus disuntik pada tiap sel
yang melemah. Bentuk linier yang layak menyarankan bahwa distribusi
survival mengikuti distribusi eksponen cukup baik. Empat garis lurus
ditetapkan untuk titik yang hampir parallel, mengindikasikan bahwa nilai
bahaya yang saling bebas dari ukuran zat yang disuntikkan.
1.00
0.80
43
0.60
0.01 0
0.02
0.04
0.06
0.08
0.10
0.20
0.40 5 10 15 20 25
3.2 Distribusi Weibull
Distribusi weibull adalah pembangkit distribusi eksponensial.
Bagaimanapun juga tidak sama dengan distribusi eksponensial, ini tidak
mengasumsikan bahwa nilai bahaya adalah konstan dan oleh sebab itu
memiliki aplikasi yang lebih luas. Distribusi ini telah diusulkan oleh
Weibull pada tahun 1939 dan diaplikasi untuk berbagai situasi gagal
didiskusikan kembali oleh Weibull pada tahun 1951. Distribusi Weibull
telah banyak digunakan pada kajian reabilitas dan penyakit penyebab
kematian sesorang.
Distribusi dicirikan dengan dua parameter dan . Nilai
memberikan kemiringan kurva distribusi dan nilai memberikan skala.
44
Konsekuensinya dan secara berturut-turut disebut dengan parameter
kemiringan dan skala. Hubungan diantara nilai
dan waktu survival dapat
dilihat dari gambar berikut yang menunjukkan nilai bahaya dari distribusi
weibull dan 0.5,1, 2 , 4 dengan nilai 1
h(t)
4 2
1 1
0.5
0 1 2 3 t
45
f t e t ,
1
t 0, 0, 0
F t 1 e t
S t e t
Sedangkan fungsi bahaya adalah rasio dari fungsi densitas peluang dan
fungsi selamat seperti berikut
h t t
1
f(t)
4
46
2
1
0.5
0 1 2 3 t
log S t t
atau
log log S t log log t
ln S(t)
0
47
1 2 3
1
-1
1
-2
-3 1
-4
1
1
1 2 1
2 1 2 1
2
gamma dimana
adalah bilangan bulat.
Distribusi weibull dapat juga dibangun atau dibangkitkan untuk mengambil
kedalam hitungan garansi waktu G selama tidak terdapat kematian atau
kegagalan dapat terjadi. Fungsi densitas peluang weibull tiga parameter
adalah
f t t G
1
eksp t G
48
Konsekuensinya adalah
S t eksp t G
Dan
h t t G
1
49
156 2 20 0,9500 0,9048 0,9590
163 3 19 0,9474 0,8572 0,9421
198 4 18 0,9444 0,8095 0,7990
204+ - 17 1,0000 0,8095 0,7647
205 6 16 0,9375 0,7589 0,7588
232 7 15 0,9333 0,7083 0,5778
232 8 14 0,9286 0,6577 0,5778
233 9 13 0,9231 0,6071 0,5706
233 10 12 0,9167 0,5565 0,5706
233 11 11 0,9091 0,5059 0,5706
233 12 10 0,9000 0,4553 0,5706
239 13 9 0,8888 0,4047 0,5271
240 14 8 0,8750 0,3541 0,5198
261 15 7 0,8571 0,3035 0,3697
280 16 6 0,8333 0,2529 0,2489
280 17 5 0,8000 0,2023 0,2489
296 18 4 0,7500 0,1517 0,1660
296 19 3 0,6667 0,1011 0,1660
323 20 2 0,5000 0,0506 0,0710
344+ - 1 1,0000 0,0506 0,0313
50
Pertimbangkan waktu survival T sedemikian hingga log T adalah
didistribusikan secara normal dengan rata-rata
dan variansi .
2
h(t)
0, 0.3
1.6
1.4 0, 0.1
1.2
0.3, 1.0
1.0
51
1, 1
0.8
0.6
0.4
0.2
0 1 2 3 4 5 t
2
2 dx
t
2 2 dx
t
at
1 G log
Dimana G(y) adalah distribusi fungsi kumulatif dari variabel normal baku.
y
1
G y e
u 2 2
du
2 0
52
Distribusi lognormal ditentukan dengan lengkap dengan dua parameter
dan 2 . Waktu T tidak bisa diasumsikan bernilai 0 karena log T tidak
dapat didefinisikan T = 0. Gambar berikut memberikan kurva frekuensi
lognormal untuk 0, 0.1,0.5,2
2
f(t)
1.0
0.8
0
0.6
0.4 0 .5
1
0.2
0 1 2 3 4 t
Jelas bahwa distribusi kemiringan positif dan bahwa semakin besar nilai
dari akan semakin besar kemiringannya.Fungi bahaya dapat diturunkan
2
dari fungsi densitas peluang dan fungsi keselamatan yang telah ditentukan
di atas seperti berikut
h t
1 t
2 eksp log at
2
2 2
1 G log at
53
e
eksp 2
3.4 Gamma Dan Distribusi Gamma Yang Dibangkitkan
Distribusi gamma yang termasuk kedalam distribusi chi-kuadrat dan
eksponensial, telah digunakan sejak lama oleh Brown dan Flood (1947)
untuk menggambarkan kehidupan sirkulasi gelas yang beredar pada
kafetaria dan Birnbaum dan Saunders (1958) memodelkan secara
berstatistik untuk lama waktu hidup material. Semenjak kasus ini distribusi
gamma telah digunakan lebih sering untuk memodelkan permasalahan
relabilitas industri dan lama hidup (survival) manusia.
Andaikan bahwa kegagalan atau kematian mangambil tempat dalam n
tahapan atau n sesegera mungkin sub bagian kegagalannya telah terjadi.
Pada akhir bagian tahapan pertama, setelah waktu T 1, terjadinya sub
kegagalan pertama setelah tahap kedua dimulai dan sub kegagalan kedua
terjadi Setelah waktu T 2 dan begitu seterusnya. Total kegagalan atau
kematian pada akhir tahapan ke-n, ketika sub kegagalan ke-n telah terjadi.
Waktu survival T adalah T1 + T2 + … + Tn, Waktu T1,T2,…,Tn yang
dihabiskan dalam setiap tahapan diasumsikan bebas secara distribusi
eksponensial dengan fungsi densitas peluang
eksp t i , i 1,2, , n. Jadi sub kegagalan terjadi secara bebas
pada sebuah nilai konstan . Distribusi T selanjutnya akan disebut
berdistribusi erlang. Tidak diperlukan untuk tahapan mempunyai sifat yang
signifikan karena kita selalu dapat mengasumsikan terjadinya kematian
dalam n proses tahapan telah digambarkan. Ide ini telah diperkenalkan oleh
A. K Erlang dalam kajiannya kebuntuan dalam sistem telephon, dan telah
digunakan secara meluas dalam teori antrian dan proses kehidupan.
Pembangkit alamiah dari distribusi erlang adalah menukarkan n parameter
yang dibatasi bilangan bulat 1,2,… dengan parameter
mengambil nilai
positif real. Kemudian selanjutnya akan menghasilkan distribusi gamma.
Distribusi gamma disifati oleh dua parameter yaitu dan . Ketika
0 1 , terdapat nilai bahaya yang menurun secara monoton dari tak
terhingga hingga seiring dengan meningkatnya dari 0 hingga ke tak
hingga. Ketika 1 terdapat nilai bahaya yang meningkat sedara
54
monoton dari 0 hingga seiring dengan meningkatnya waktu dari 0
hingga ke tak hingga. Ketika 1 nilai bahaya sama dengan sebuah
konstan seperti pada kasus eksponensial. Gambar berikut mengilustrasikan
fungsi bahaya gamma untuk 1 dan 1, 1,2,4 sehingga
distribusi gamma menggambarkan sebuah tipe yang berbeda dari pola
survival dimana nilai bahaya menurun atau meningkat pada sebuah nilai
konstan seiring dengan waktu yang mendekati tak hingga
h(t)
2
1
1 1
2 4
0 t
55
Fungsi densitas peluang dari distribusi gamma adalah
1
f t t 1 e t t 0, 0, 0
Dimana
x
1
e x dx
0
t
1
f(t)
1.0
1
0.5 2
4
0 1 2 3 4 5 6 7 8 t
56
Distribusi fungsi kumulatif (F) mempunyai bentuk komplek :
t
Ft x
1
e x dx
0
t
1
u
1
e u du
0
I t ,
Dimana
s
1
I S,
0
u 1e u du
e t
n 1 t k
F t 1
k 0 k!
St x
1
e x dx
t
n 1
S t e t
t k
k 0 k!
57
t
n 1
h t n 1
n 1! 1 t k
k 0 k!
58
dengan variabel tunggal dan persamaan tidak linier bervariabel banyak.
Misal f x 0 adalah persamaan yang akan ditentukan pemecahannya
untuk x. Metoda Newton-Rhapson secara lazimnya memerlukan nilai awal
dari x yang disimbolkan dengan x̂0 , sedemikian hingga f x̂0 mendekati
nilai 0, dan kemudian hampiran iterasi pertama adalah
f xˆ0
xˆ1 xˆ0
f ' xˆ0
f xˆ k
xˆ k 1 xˆ k
f ' xˆ k
Pemberhentian proses iterasi ini dapat dilakukan dengan menggunakan
ketentuan bahwa nilai f xˆ k atau d xˆ k xˆ k 1 kecil dari 10 6 .
f x x3 x 2
2
xˆ1 1 2
2
59
Secara berurutan dihasilkan nilai f xˆ1 xˆ13 xˆ1 2 f 2 4 ,
f ' xˆ1 3 xˆ12 1 11 , dan diperoleh hampiran iterasi kedua seperti
4
xˆ 2 2 1.6364
11
0.7456
xˆ3 1.6364 1.5304
7.0334
0.00036
xˆ5 1.52144 1.52138
5.9443
f xˆ5 0.0000017
nilai hampiran iterasi kelima sudah dapat dikatakan bahwa proses iterasi
dapat dihentikan karena nilai f xˆ5 0.0000017 telah memenuhi syarat
60
Metoda Newton-Rhapson dapat diperluas untuk variabel banyak, missal kita
ingin mendapatkan pemecahan untuk x1 , x2 , , x p sedemikian hingga
f1 x1 , x2 , , x p 0
f 2 x1 , x2 , , x p 0
f p x1 , x2 , , x p 0
misal aij adalah turunan parsial dari f i terhadap x j atau dapat ditulis
sebagai aij f i x j .
Diberikan sebuah matrik
a11 a12 a1 p
a a22 a2 p
J
21
a p1 a p2 a pp
yang disebut dengan matrik Jacobian, dan misalkan invers matrik tersebut
diberi seperti
b11 b12 b1 p
b b22 b2 p
21
J 1
b1 p b2 p b pp
k k k
selanjutnya misal x1 , x2 , , x p adalah nilai-nilai hampiran pada iterasi
k k k
ke-k, dan misalkan f1 , f 2 , , f p adalah nilai-nilai yang berhubungan
dengan fungsi f1 , f 2 , , f p , yaitu
61
f1k f1 x1k , x2k , , x kp
f 2k f x
2
k
1 , x2k , , x
k
p
f pk f p x1k , x2k , , x kp
k
dan misalkan bij adalah elemen dari J 1 yang dihasilkan pada
x1k , x2k , , x kp , maka hampiran iterasi selanjutnya secara umum
62
f10 f10 x10 , x20 x10
2
x10 x20 2 x10 1 1
f 20 f 20 x , x x
0
1
0
2
0 3
1 x10 x20 2 1
f1
2 x1 x2 2
x1
f1
x1
x 2
f 2
3 x12 1
x1
f 2
1
x 2
2 x x 2 x1
J 1 2 2
3 x1 1 1
dengan menggunakan nilai awal yang diberikan maka matrik jacobian dan
inversnya dapat dihasilkan seperti
1 0 1 1 0
J dan J
1 1 1 1
hampiran iterasi pertama dapat diperoleh seperti
x11 0 1 1 0 1 1
x12 1 1 1 1 1 1
63
dengan nilai di atas didapati nilai f11 1 dan f 21 1 , selanjutnya nilai
pada iterasi pertama ini juga dapat menghasilkan nilai matriks jacobian dan
invers matrik tersebut seperti
3 1 1 1
J dan J 1
2 1 2 3
L y1 , y 2 , , y n f y1 , y 2 , , y n
f y1 f y 2 f y n
Untuk penyederhanaan notasi like-lihood dapat ditulis sebagai L .
Contoh : Misal Y1 , Y2 , , Yn adalah sampel acak dimana Yi memiliki
fungsi densitas peluang seperti
64
1 yi
e , 0 y
f y
0, untuk yang lainnya
L y1 , y 2 , , y n f y1 , y 2 , , y n
f y1 f y 2 f y n
e y1 e y2
e yn
e i
y
e ny
n n
L ˆ; y L ; y untuk setiap didalam
l ˆ; y l ; y untuk semua didalam
Sering sekali lebih mudah untuk bekerja dalam logaritma dari pada fungsi
like lihood itu sendiri. Biasanya estimator ˆ dihasilkan dengan
menurunkan fungsi log-like lihood terhadap elemen j dari dan
mencari penyelesaian persamaan simultan berikut
65
l ; y
0 untuk j 1,2, , p
j
L , 2 f y1 , y 2 , , y n , 2
f y , f y , f y
1
2
2
2
n , 2
1 y1 2 1 y n 2
exp 2 exp 2
2 2 2 2
1
n2 1 n
2 2
exp 2
2
y
i 1
i
2
n
n n 1
l ln L , 2
2
ln 2 ln 2
2 2 2
yi 1
i 2
66
n
l 1
2
yi 1
i 0
y
i 1
i n 0
n
1
ˆ
n y
i 1
i y
n
l n 1 1
2
2
2 2 4
y
i 1
i 2 0
n
1
2
n y
i 1
i y2
i 0.5
, i 1,2, , n
n
Untuk sampel yang telah diurutkan dari kecil kebesa, untuk data kembar
Gunakan i (rangking terbesar setelah data diurutkan)
3. Gambarkan grafik dari data melawan fungsi distribusi kumulatif untuk
Sampel yang telah diestimasi
4. Grafik yang tergambar seperti garis lurus (fungsi linier) dapat digunakan
67
Untuk mendapatkan nilai parameter awal dengan menggunakan metoda
Kuadrat terkecil.
Contoh : Diberikan 21 data seperti 1 ,1 ,2 ,2 ,3 ,4 ,4 ,5 ,5 ,6 ,8 ,8 ,9 ,10 ,10 ,
12, 14,16,20,24,dan 34 yang terdistribusi dengan fungsi densitas peluang
seperti
f y y 1 exp y
Untuk menggunakan metoda grafik perlu dihasilkan fungsi distribusi
kumulatif seperti
F y 1 e y
F y 1 e y
e y 1 F y
log e y log1 F y
1 1 1
log y log log log
1 F y
i 0. 5
Dengan menggunakan hampiran nilai F y , dan
n
mengandaikan bahwa
1 1 1
t log y , a log ,b
, dan s log log dan akan
1 F y
diperoleh suatu bentuk persamaan regresi linier sederhana seperti
t a bs
Dengan menerapkan metoda kuadrat terkecil akan dapat diperoleh nilai a
dan b, seperti
68
n
s
i 1
i s ti t
b n
s
i 1
i s2
a t bs
Dari data yang telah diberikan di atas, selanjutnya akan ditentukan nilai
awal parameter dengan terlebih dahulu merancang suatu table yang dapat
memudahkan dalam menyelesaikan hal ini, tabel terdiri dari empat kolom
tabel pertama berisikan data yang telah diambil logaritma asli serta telah
diurutkan dari kecil kebesar, tabel kedua berisikan rengking (i) data
tersebut, 1 untuk data yang terkecil dan terus diurutkan hingga data terbesar,
i 0.5
selanjutnya kolom ketiga berisikan nilai Fi , dan tabel terakhir
n
1
berisikan nilai log log , tabel berikut dapat dilihat seperti
1 Fi
Log t i Fi 1
log log
1 Fi
0.0000000 1
0.0000000 2 0.07142857 -2.60223217
0.6931472 3
0.6931472 4 0.16666667 -1.70198336
1.0986123 5 0.21428571 -1.42228614
1.3862944 6
1.3862944 7 0.30952381 -0.99324254
1.6094379 8
1.6094379 9 0.40476190 -0.65624879
1.7917595 10 0.45238095 -0.50720651
2.0794415 11
2.0794415 12 0.54761905 -0.23164126
2.1972246 13 0.59523810 -0.10042132
2.3025851 14
69
2.3025851 15 0.69047619 0.15932606
2.4849066 16 0.73809524 0.29250120
2.6390573 17 0.78571429 0.43207136
2.7725887 18 0.83333333 0.58319808
2.9957323 19 0.88095238 0.75529145
3.1780538 20 0.92857143 0.97042178
3.5263605 21 0.97619048 1.31846232
Dari tabel di atas dapat dilihat beberapa baris yang kosong, hal ini
dikarenakan bahwa untuk data yang kembar, maka cukup diambil data pada
rangking atau urutan data yang terbesar. Selanjutnya untuk melihat apakan
rumus regresi linier sederhana dapat digunakan pada kasus ini, perlu
terlebih dahulu dilihat grafik yang memasangkan antara log (data) dan nilai
1
log log , dari grafik yang dihasilkan menghampiri suatu garis
1 Fi
lurus, maka rumus regresi linier sederhana (metoda kuarat terkecil) yang
telah ditentukan di atas dapat digunakan pada contoh ini, selanjutnya akan
digambarkan grafik seperti
70
Dari grafik di atas sangat terlihat jelas bahwa telah berhasil ditemukan suatu
hampiran garis lurus pada kasus ini. Hal ini mengakibatkan bahwa rumus
regresi linier sederhana untuk mendapatkan nilai a dan b dapat diterapkan
pada contoh soal ini. Selanjutnya nilai awal dapat dihasilkan seperti berikut
s
i 1
i s ti t
b n
s
i 1
i s2
0.769
a t bs
2,283
1
a log
1 1
exp a 0.1020085
exp a
1 1
b 1.299709
b
71
L y1 , y 2 , , y n f y1 , y 2 , , y n
f y1 f y 2 f y n
y1 1 exp y1 y n 1 exp y n
n n
n n i 1
yi 1 exp y
i 1
i
1 log y
n
l , log L n log n log i yi
i 1
Selanjutnya dapatkan dua fungsi yang homogen, seperti yang terdapat pada
contoh sebelumnya dipembahasan newton-rhapson, dengan cara mencari
turunan parsial pada fungsi log-lihood terhadap dua parameter yang
dimilikinya, seperti
l ,
n
n y
i 1
i 0 f 1
l , n
n n
n log
i 1
log yi y log log y 0
i 1
i i f 2
72
f1 f1
J
f 2 f 2
n
f1
1 yi -287.4726
i 1
n n
f1
log yi
i 1
y log y 113.1101
i 1
i i
yi
n n
f 2 n
i 1
1 yi log log yi
i 1
42.38152
n
f 2 n
2 log yi log log yi
i 1
n
y log y log log y 48.34
i 1
i i i
Selanjutnya dengan data yang ada pada contoh soal dan nilai-nilai awal
yang telah diperoleh akan dapat menghasilkan suatu matriks jacobian
seperti
0.00258 0.0061
J 1
0.0023 0.0154
73
ˆ1 0.102 0.0025 1.573 0.0061 1.573 0.107
ˆ1 1.299 0.0022 2.998 0.0153 2.998 1.351
Untuk hampiran iterasi kedua, dengan cara yang sama, tetapi nilai awal
yang digunakan adalah nilai yang diperoleh pada iterasi pertama, seperti
f1 f1
J
f 2 f 2
n
f1
1 yi -311.3598
i 1
n n
f1
log yi
i 1
y log y 122.9703
i 1
i i
yi
n n
f 2 n
i 1
1 yi log log yi
i 1
15.0412
n
f 2 n
2 log yi log log yi
i 1
n
y log y log log y 63.082
i 1
i i i
0.00354 0.00691
J 1
0.00084 0.0175
74
Selanjutnya nilai untuk f1 dan f2 berturut-turut -3.659 dan -5.307, sehingga
nilai hampiran untuk iterasi kedua adalah
75
PERKENALAN TERHADAP SOFTWARE R
Software R adalah salah satu alat bantu yang sering digunakan oleh ahli
statistik dalam melakukan penyelidikan. Keutamaan R adalah
kemampuannya dalam merancang bahasa program sesuai dengan keperluan
para peneliti. Software R juga dilengkapi dengan tool-tool yang secara
langsung dapat digunakan untuk mencari nilai-nilai statistik yang standar,
seperti statistik infrensi, regresi, anova, dan alat uji statistik lainnya.
Tampilan awal Software R dapat ditunjukkan seperti berikut.
76
Untuk pembuatan matrix dalam R, dapat dilakukan seperti
77
digunakan dengan bahasa eigen, dan penjumlahan dengan pengurangan
dapat dilakukan dengan cara sederhana seperti
78
Bahasa R dapat digunakan untuk merancang program tersendiri, hal ini
tentu saja bergantung kepada penelitian yang digunakan, untuk melakukan
ini, perlu terlebih dahulu layar baru dibuka seperti
79
Selanjutnya untuk menjalankan program yang telah dibuat, perlu diklik,
menu run and selection seperti
Contoh bahasa pemograman sederhana, misal diberi data pada contoh soal
di atas, akan ditentukan statistic inferensi yang diperlukan seperti rata-rata,
variansi dan simpangan baku seperti berikut
80
Terlihat bahwa untuk data yang berubah-ubah dapat digunakan program
yang telah dibuat sebelumnya.
81
82
Daftar Pustaka
Carnahan, B., Luther, H. A., and Wilkes, J.O. (1969) Applied Numerical
Methods. Wiley. New York
Lee. T. Elisa.,Wang Wenyu Jhon. ( 2003) . Statistical Methods For
Survival Data Analysis, Wiley, New York
McCracken, D. D., and Dorn, W. S. (1964). Numerical Methods and
Fortran Programming. Wiley. New York
Maindonald, J., Braun, J ., (2003). Data Analysis and Graphics Using R –
an Example Based Approach. Cambridge University Press, New York
Neter,J.,Wasserman, W. (1974). Applied Linier Statistical Models. Richard.
D. Irwin, HomeWood, IL.
83
Biografi Penulis
84
ANALISIS SURVIVAL
DAN PROGRAM R
85
RADO YENDRA
KATA PENGANTAR
86
diperlukan ide kreatif dari tenaga pengajar untuk dapat menerbitkan BUKU-
BUKU perkuliahan yang bermutu dengan menggunakan bahasa Indonesia.
Salah satu cara yang termudah dalam menghasilkan buku ini adalah dengan
menghasilkan buku-buku yang berasal dari beberapa sumber bacaan yang
berbahasa inggris dan diartikan kedalam bahasa Indonesia, hal ini tentu
akan lebih efektif dan dapat menjamin bahwa modul yang dihasilkan dapat
dipertanggung jawabkan isi kandungan modul tersebut. Untuk menjawab
tantangan di atas, maka analisis survival dan program R ini dibuat
berdasarkan beberapa sumber bacaan yang berbahasa Inggris diantaranya
1. Maths & Stats - Statistical Methods for Survival Data Analysis - 3rd,2003
[Wiley]
2. Survival Analysis - A Practical Approach
3. Medical Statistics A Guide to Data Analysis and Critical Appraisal
4. Using and Understanding Medical Statistics
5. R Book
Akhirnya penulis berharap bahwa buku ini dapat meningkatkan motivasi
mahsiswa untuk mengikuti perkuliahan analisis survival. Kritikan dari rekan
seperjuangan yang sangat membangun sangat diharapkan untuk perbaikan
buku ini kedepannya. Terimakasih yang sebesar-besarnya penulis
sampaikan pada Dekan Fakultas Sains dan Teknologi atas izin dan sumber
keuangan yang telah diberikan, tak lupa pada gangguan dari jagoan kecilku
Faris Raza Alim Sayendra dan bundanya yang menjadikan pembuatan buku
ini lebih bermakna.
DAFTAR ISI :
KATA PENGANTAR
1. PENDAHULUAN ANALISIS SURVIVAL ………………………1
2. METODA NON PARAMETRIK MENGESTIMASI FUNGSI
SURVIVAL………………………………………………………..13
87
3. BEBERAPA DISTRIBUSI SURVIVAL PARAMETRIK DAN
APLIKASINYA…………………………………………………....40
4 ESTIMASI PARAMETER DISTRIBUSI SURVIVAL
PARAMETRIK……………………………………………………59
5. PERKENALAN TERHADAP SOFTWARE R……………………76
88