Anda di halaman 1dari 88

PENDAHULUAN ANALISIS SURVIVAL

1.1 Pendahuluan.
Teori analisis survival (kehidupan) lebih memfokuskan kepada penelitian
dibidang kesehatan. Oleh sebab itu dibeberapa universitas mata kuliah ini
disebut statistik kesehatan atau statistik perubatan. Waktu survival
(kehidupan) dapat didefinisikan secara luas sebagai waktu terjadinya
diberikan suatu peristiwa. Peristiwa yang dimaksud adalah perkembangan
suatu penyakit, reaksi terhadap suatu percobaan, kambuhnya suatu penyakit
dan kematian. Sehingga waktu survival dapat berupa waktu permulaan dari
percobaan hingga memberikan sebuah reaksi dan waktu hingga terjadinya
kematian. Lebih lanjut survival data dapat berupa :
1. waktu survival itu sendiri
2. reaksi terhadap diberikan suatu percobaan
3. perkembangan suatu penyakit
4. sifat pasien yang dihubungkan dengan reaksi yang diberikan
Analisis Survival merupakan suatu teori atau ilmu yang memberikan fokus
kajian kepada beberapa bidang diantaranya :
1. Perkiraan nilai peluang pada suatu reaksi
2. Rata-rata waktu hidup
3. Membandingkan distribusi yang dihasilkan pada percobaan pasien
manusia atau hewan
4. Mengidentifikasi faktor-faktor yang berhubungan dengan reaksi
yang ditimbulkan oleh penyakit

1.2 Data Sensor


Satu perkembangan yang terpenting yang berkaitan dengan survival data
adalah terjadinya beberapa peristiwa yang diminati belum mengalami reaksi
hingga akhir penelitian, atau pasien masih hidup hingga akhir penelitian,
atau tidak terjadi perkembangan apa-apa terhadap suatu penyakit hingga
penelitian berakhir. Peristiwa ini disebut dengan data cencor. Waktu
survival dicatat untuk objek yang diteliti mengalami kematian hingga satu
periode yang ditetapkan, dimulai dari waktu pertama sekali percobaan
hingga mati sampai periode yang diberikan. Data survival disebut dengan
data tidak censor atau data eksak. Jika data tidak mengalami perubahan
setelah reaksi diberikan hingga akhir periode yang ditentukan, atau karena
alasan tertentu sebelum akhir periode data tersebut hilang. Data tersebut
dikatakan data censor. Data sensor dapat dibagi dengan 2 kategori data
sensor

1
1.2.1 Jenis Data Sensor I
Biasanya penelitian dimulai dengan jumlah bilangan yang tepat dimana
diberikan suatu percobaan. Dikarenakan terbatasnya dana dan waktu, sering
sekali penelitian tidak dapat menunggu hingga objek yang diteliti bereaksi
atau meninggal. Dan seterusnya ditetapkan suatu perioda waktu pasti, untuk
mengatasi masalah di atas.Hal ini berarti bahwa batas waktu objek
penelitian hanya bergantung pada periode waktu
Contoh : 6 ekor tikus telah diperuntukkan sebagai penentu penyebab
penyakit kanker dengan menyuntikkan sel tumor kedalam lapisan kaki.
Sehingga waktu perkembangan tumor dari ukuran yang diberikan
diobservasi. Peneliti menetapkan periode selama 30 minggu.

A x Data ke 19 termasuk data


Sensor karena karena
Sebab tertentu data tersebut
B x Hilang, sebelum mencapai
Akhir periode

D x

5 10 15 20 25 30

Terdapat dua data sensor


Yaitu pada tikus C, E dan F

Terdapat empat data tidak


Sensor yaitu pada tikus
A, B, D

Data tersebut dapat ditulis


Sebagai berikut :
10, 15, 30+, 25, 30+, 19+

2
1.2.2 Jenis Data Sensor II
Sebagian besar penelitian kesehatan berkenaan dengan penelitian periode
yang tetap dan pasien memasuki perioda tersebut dengan waktu yang
berbeda-beda selama perioda tersebut, beberapa pasien mungkin mati
sebelum akhir perioda dan dikenal sebagai data tidak sensor dan beberapa
pasien mungkin hilang atau belum mati hingga perioda berakhir

Contoh : Andaikan 6 pasien dengan kanker darah yang sangat parah,


memasuki pusat klinik selama perioda 1 tahun, andaikan terdapat 6
percobaan dengan berikut

A x
B
C x
D

E x
F

1 2 3 4 5 6 7 8 9 10 11 12 Akhir priod

Terdapat tiga data sensor


Yaitu pada pasien B, D, dan F

Terdapat tiga data tidak


Sensor yaitu pada tikus
A, C, dan E

Data tersebut dapat ditulis


Sebagai berikut :
4, 4+, 6, 8+, 3, dan 3+
3
1.3 Fungsi Waktu Survival
Data waktu survival mengukur waktu untuk peristiwa-peristiwa tertentu.
Diantaranya adalah peristiwa berikut :
1. Kegagalan
2. Kekambuhan penyakit
3. Perkembangan penyakit
4. dll
Waktu yang dipakai sebagai variabel random dan sifat-sifat distribusi
berlaku untuk data waktu survival. Distribusi waktu survival dilukiskan
dengan tiga cara : fungsi selamat, peluang fungsi densitas, dan fungsi
bahaya.
Misal T adalah waktu survival, distribusi T dapat ditentukan Fungsi
Survival (Survival Function), yang dinotasikan oleh S (t). Fungsi survival
dapat didefinisikan sebagai peluang kehidupan seseorang lebih lama dari t :

S  t   P kehidupan seseorang lebih lama dari t 


 P T  t 
Dari definisi fungsi distribusi kumulatif F(t) dari T

S  t   1  P  seseorang gagal atau mati sebelum t 


 1 F t
Disini S (t) adalah fungsi yang tidak turun dari waktu (t) dengan sifat
1, untuk t  0
St   
0 untuk t  

Untuk memahami fungsi survival komponen lain yang sangat mendukung


adalah kurva survival. Fungsi survival atau kurva survival dapat
menentukan nilai median dari waktu survival, yang digunakan untuk
membandingkan dua fungsi survival atau dua kurva survival. Kebiasaan
analisis survival lebih diuntungkan dengan berfokus pada median daripada
rata-rata (mean), hal ini dikarenakan : jumlah individu yang kecil dengan
waktu hidup yang luarbiasa singkat atau panjang akan mengakibatkan besar
atau kecil rata-rata waktu hidup yang tak sebanding. Dalam prakteknya jika
tidak terdapat data sensor maka fungsi keselamatan diestimasikan sebagai :

jumlah kehidupan pasien lebih lama dari t


Sˆ  t  
jumlah total pasien

4
Jika terdapat data sensor maka rumus di atas tidak dapat selalu digunakan.

Contoh : diberikan data Survival sebagai berikut 4, 6, 6+,10+,15, 20.


Dengan menggunakan rumusan di atas dapat diperoleh
5
Sˆ  5   0,833
6
S 11  tidak dapat dicari
ˆ

Bandingkan dua kurva survival berikut :

S (t)

1,0

0,8

0,6

0,4

0,2

10 20 30 40 50 60 t

S (t)

1,0

0,8

0,6

0,4

0,2

10 20 30 40 50 60 t

5
Dari kedua gambar di atas dapat dilihat bahwa gambar di sebelah kiri
memiliki nilai kehidupan (survival) lebih rendah dibandingkan dengan nilai
kehidupan di sebelah kanan. Sedangkan nilai median disebelah kiri
mendekati 8 sedangkan nilai median dari kurva sebelah kanan mendekati
28, hal ini menambah dukungan bahwa kurva sebelah kanan memiliki nilai
kehidupan (survival) lebih lama.
Jika data sudah berbentuk interval, maka ada ketentuan Ketentuan yang
harus diperhatikan. Perhatikan contoh berikut

Waktu Jumlah pasien Jumlah pasien mati   Ŝ  t 


survival (t) hidup pada dalam interval
permulaan

0-5 40 5 1
5-10 35 7 0,875
10-15 28 6 0,700
15-20 22 4 0,550
20-25 18 5 0,450
25-30 13 4 0,325
30-35 9 4 0,225
35-40 5 0 0,125
40-45 5 2 0,125
45-50 3 1 0,075
1.0

≥ 50 2 2
0.8
0.6
y

Sˆ  0   1
35 28
Sˆ  5  Sˆ 10  
0.4

 0,875  0,700
40 40
Penggambaran Kurva Survival
0.2

Pada interval Pada interval ketiga,


kedua, pasien pasien 6
Pada permulaan Hidup 35 orang Hidup 28 orang
pasien masih
0 10 20 30 40 50
hidup
x
Contoh: andaikan waktu survival dari suatu populasi memiliki fungsi
densitas sebagai berikut

f  t   e t t 0
tentukan fungsi survival (S(t))

Jawab : diketahui fungsi distribusi kumulatif adalah :


t t
F  t    f  x  dx   e  x dx   e  x
t
 1  e t
0
0 0

St  1 F t
 e t
1.4 Fungsi Densitas Peluang atau Fungsi Densitas f(t)
Seperti variabel kontinu lainnya, waktu survival T mempunyai fungsi
densitas peluang. Pada prakteknya jika tidak terdapat observasi sensor,
fungsi densitas peluang diestimasi sebagai proporsi dari pasien yang
meninggal dalam interval perunit lebar :

jumlah pasien meninggal dalam inerval yang mulai pada waktu t


fˆ  t  
 jumlah total pasien   lebar iterval  7
Jika terdapat data sensor maka rumus di atas tidak dapat digunakan. Grafik
yang dihasilkan oleh f(t) disebut dengan kurva densitas. Fungsi densitas
memenuhi dua sifat berikut :
1. f (t) adalah fungsi yang tidak negatif
f  t   0, untuk setiap t  0
f  t   0, untuk t  0
2. Daerah diantara kurva densitas dan sumbu x (waktu) same dengan 1

f(t)

0 1 2 3

f(t)

0 1 2 3

8
Kurva densitas dapat digambarkan dengan menentukan titik tengah interval
dan titik estimasi fungsi densitas peluang
0 .0 3
0 .0 2
y

0 .0 1
0 .0

10 20 30 40

Pada kurva densitas dapat dilihat bahwa frekuensi tertinggi kematian terjadi
pada interval bulan 5-10

1.5 Fungsi Bahaya, h(t)


Fungsi bahaya atau dinotasikan dengan h(t) dengan waktu survival T yang
memberikan nilai kegagalan bersyarat ini didefinisikan sebagai peluang
kegagalan pada interval waktu yang sangat kecil. Estimasi fungsi bahaya
diberikan oleh
ˆ t jumlah p asien mati persa tua n waktu da lam in nterval
h  
  jumla h p a sien h id u p p ad a wa ktu t  
 
leba r inerva l   jumla h kema tia n d alam in nterva l  
   
  2 

Fungsi bahaya dapat juga didefinisikan sebagai berikut :

f t
h t  
1 F t 
f (t )  fungsi densitas peluang
F (t )  fungsi distribusi kumulatif

9
Fungsi hazard kemungkinan bisa menaik, tetap konstan,menurun, atau
menunjukka proses yang lebih komplek

Nilai bahaya yang


meningkat
h1(t)

h4(t) Nilai bahaya yang


menurun

h3(t) Nilai bahaya yang konstan

h5(t) Kurva bathtup, proses


h2(t) kehidupan
manusia

Nilai bahaya yang


meningkat
lalu menurun
Estimasi nilai fungsi bahaya
Waktu survival Jumlah pasien Jumlah pasien
(t) hidup pada mati dalam 5
 0,027
permulaan interval  5
5 40  
 2
0-5 40 5 0.027
5-10 35 7 0.044
10-15 28 6 0.048
15-20 22 4 0.040
20-25 18 5 0.065
0.10

25-30 13 4 0.072
30-35 9 4 0.114
0.08

35-40 5 0 0.000
40-45 5 2 0.100
0.06
y

45-50 3 1 0.080
0.04

≥ 50 2 2 -
Kurva fungsi bahaya
0.02

10
0.0

10 20 30 40
x
1.6 Hubungan Antara Fungsi Survival
Ketiga fungsi yang telah dibicarakan di atas akan ditentukan hubungannya,
sebelum itu akan didefinisikan fungsi kumulatif hazard sebagai berikut :

t
H  t    h x  dx
0
Dari definisi sebelumnya diketahui

f t f t
h t   
1 F t St 
d d
f t  F  t   1  S  t     S '  t 
dt dt
 S't d
h t     log S  t 
St dt

Perhatikan bentuk terakhir dari persamaan di atas

11
d
h t    log S  t 
dt
inntegralkan dari 0 hingga t , dan menggunakan S  0  1
t
  h x  dx  log S  t 
0

H  t    log t 
 t 
S  t   eksp   H  t    eksp   h x  dx
 0 
f  t   h t  eksp  H  t  

Contoh : dari soal sebelumnya diketahui bahwa f(t) = e-t dan S(t) = e-t
sehingga dapat ditentukan nilai h(t) = 1

Contoh : jika diberikan fungsi bahaya h (t) = c, maka dapatkan fungsi


survival dan distribusi peluang densitas

Jawab :
t
H  t    c dx
0
t
 cx o  ct  0  ct
Selanjutnya
S  t   eksp  ct 
f  t   c eksp  ct 

METODA NON PARAMETRIK MENGESTIMASI FUNGSI


SURVIVAL
12
Pada bagian ini kita akan mendiskusikan metoda mengestimasi tiga fungsi
survival (densitas , survivor, dan hazard) untuk data sensor. Sayangnya
metoda sederhana pada pertemuan sebelumnya tidak dapat digunakan jika
beberapa pasien hidup pada waktu dianalisis dan karenanya waktu survival
mereka yang tepat tidak diketahui. Nonparametrik atau metoda bebas
distribusi cukup mudah untuk dipakai dan dipahami. Metoda ini lebih
sedikit efisiennya daripada metoda parametrik ketika waktu survival
mengikuti suatu distribusi teoritis dan efisiennya menjadi lebih ketika tidak
ada distibusi teoritis yang tepat diketahui. Oleh sebab itu disarankan
menggunakan metoda non parametrik untuk menganalisa data survival
sebelum mencoba menggunakan distribusi teoritis. Jika objek utama untuk
menentukan model data, estimasi-estimasi yang dihasilkan oleh metoda
nonparametrik dan grafik sangat berguna dalam memilih distribusi.
Dari tiga fungsi survival, bentuk survival atau persembahan secara grafik,
kurva survival paling sering digunakan. Pada bagian ini memperkenalkan
metoda product-limit mengestimasi fungsi bentuk survival yang
dikembangkan oleh Keplan dan Meier (1958). Bagaimanapun juga jika data
telah digrupkan dalam interval atau ukuran sampel sangat besar katakanlah
ribuan atau meminati terhadap populasi besar, akan lebih baik untuk
membentuk analisis tabel kehidupan. Metoda Product Limit dan Tabel
Kehidupan pada dasarnya adalah sama. Banyak penulis yang
mengistilahkan estimasi tabel kehidupan untuk estimasi Product Limit.
Bedanya hanya Product Limit didasari waktu survival induvidu, metoda
tabel kehidupan waktu survivalnya dikelompokkan atau digrupkan kedalam
interval.

2.1 Estimasi Produk Limit Dari Fungsi Bentuk Survival


Pertama sekali pertimbangkan kasus sederhana dimana semua pasien yang
diobservasi mati sehingga waktu survival eksak dan diketahui. Misal
t1 , t 2 ,  , t n adalah waktu survival eksak dari n induvidu yang dipelajari.
Secara konsep kita mempertimbangkan grup pasien ini sebagai sampel acak
dari populasi yang lebih besar dari pasien yang sama. Kita tuliskan kembali
n waktu survival dengan urutan t  1 , t  2  ,  , t  n  . Fungsi bentuk survival
pada t(i) dapat diestimasi seperti
ni
Sˆ  t  i   
i
 1
n n

13
Dimana n – i adalah jumlah orang dalam sampel survival yang lebih lama
dari t(i). Jika dua atau lebih t(i) kembar, nilai i yang terbesar digunakan.
Sebagai contoh jika t  2   t  3   t  4  , maka
n4
Sˆ  t  2    Sˆ  t  3    Sˆ  t  4   
n
Karena setiap orang hidup pada permulaan kajian dan tak satupun yang
lebih lama daripada t(n)
Sˆ  t  0    1 dan Sˆ  t  n    0
Dalam prakteknya Ŝ  t  dihitung pada setiap waktu survival. Kita tidak
harus kuatir terhadap interval diantara waktu interval yang mana
didalamnya tak satupun yang mati dan Ŝ  t  adalah konstan tetap. Ŝ  t 
adalah fungsi tangga yang memulai pada 1 dan menurun dengan 1/n menuju
0. Ketika Ŝ  t  diplotkan dengan t, berbagai persentil dari waktu survival
dapat dibaca dari grafik atau dihitung dari Ŝ  t  .

Contoh : Perimbangkan percobaan klinik yang mana 10


penderita kanker paru-paru diikuti dengan kematian. Tabel
uraian waktu survival t dalam bulan.
T i Ŝ  t 
4 1 9/10
5 2 8/10
6 3 7/10
8 4 4/10
8 5 4/10
8 6 4/10
10 7 2/10
10 8 2/10
11 9 1/10
12 10 0/10

14
Ŝ  t  digambarkan sebagai fungsi tangga dan fungsi mulus seperti
gambare berikut
1.0
0.8
0.6
yy
0.4
0.2
0.0

0 2 4 6 8 10 12
xx
1.0
0.8
0.6
yy

0.4
0.2
0.0

0 2 4 6 8 10 12
xx

15
Estimasi median waktu survival adalah bulan ke 8 pada gambar fungsi
tangga atau 7,6 pada gambar kurva mulus. Estimasi yang lebih akurat dapat
dihasilkan dengan menggunakan interpolasi linier seperti

86 8m
  m  7,3
0,4  0,7 0,4  0,5

Secara teori, Ŝ  t  seharusnya digambarkan dengan fungsi tangga karena


konstanta tetap diantara dua observasi waktu survival tetap. Bagaimanapun
juga ketika median waktu survival akan diestimasi dari kurva survival,
kurva mulus akan memberikan estimasi yang lebih baik dari pada fungsi
tangga.
Metoda ini dapat digunakan hanya jika semua pasien diikuti oleh kematian.
Jika beberapa pasien masih hidup pada akhir kajian, metoda yang berbeda
untuk mengestimasi Ŝ  t  , seperti Produk Limit estimasi yang diberikan
oleh Kaplan dan Meier (1958) diperlukan. Secara rasional dapat
digambarkan dengan mengikuti contoh sederhana, andaikan bahwa 10
pasien bergabung dengan kajian klinik yang dimulai pada tahun 2000,
selama tahun tersebut 6 pasien mati dan 4 bertahan hidup. Pada akhir tahun
20 tambahan pasien bergabung dalam kajian. Pada tahun 2001, 3 pasien
yang masuk pada permulaan tahun 2000 dan 15 pasien yang telah
bergabung kemudian mati, 1 pergi dan 5 pasien masih hidup. Andaikan
bahwa kajian berakhir pada akhir 2001 dan kita ingin mengestimasi
proporsi pasien dalam populasi untuk dua tahun atau lebih yakni S(2).
Grup pertama pasien dalam contoh ini diikuti oleh 2 tahun, grup kedua
diikuti oleh tahun pertama. Kemungkinan estimasi pertama adalah S(2) =
1/10 yang mengabaikan 20 pasien yang diikuti oleh hanya untuk satu tahun.
Kaplan dan Meier percaya bahwa sampel kedua , dibawah observasi hanya
untuk satu tahun, dapat melengkapi estimasi kedua S(2).
Pasien yang survive dua tahun boleh dianggap survive pada tahun pertama
dan kemudian survive untuk satu tahun lagi. Sehingga peluang survive
untuk dua tahun atau lebih sama dengan peluang survive pada tahun
pertama dan kemudian survive untuk satu tahun lagi. Yakni
S(2) = P (survive tahun pertama dan kemudian survive satu tahun lagi)
Yang mana dapat kita tulis sebagai
S(2) = P (survive dua tahun diberikan pasien pasien yang telah survive pada
tahun pertama) x P (survive pada tahun pertama)

16
Kaplan – Meier estimasi S(2) seperti berikut

ˆ  2  
S 
proporsi pasien survive dua tahun diberikan mereka surv
 untuk satu tahun

  proporsi pasien survive satu tahun
Untuk data yang diberikan di atas, satu dari empat pasien yang survive pada
tahun pertama survive dua tahun, jadi proporsi pertama adalah ¼. 4 dari 10
pasien yang masuk pada permulaan tahun 2000 dan 5 dari 20 pasien yang
masuk pada pada akhir 2000 survive satu tahun. Oleh sebab itu proporsi
kedua kedua adalah (4+5)/(10+20). Produk Limit untuk mengestimasi S(2)
adalah
1 45
Sˆ  2     0,075
4 10  20

Aturan yang sederhana dapat dibangun seperti berikut : peluang dari survive
k   2  tahun atau lebih dari permulaan kajian adalah perkalian dari nilai
observasi survive
Sˆ  k   p1  p 2  p3    p k
Dimana p1 merupakan notasi proporsi pasien survive paling sedikit satu
tahun, p2 proporsi dari pasien survive tahun kedua setelah mereka survive
satu tahun, p3 adalah proporsi pasien survive pada tahun ketiga setelah
mereka survive dua tahun dan p k proporsi pasien survive pada tahun ke-k
setelah mereka survive k-1 tahun.
Oleh sebab itu Produk Limit estimasi peluang survive dari jumlah tahun
tertentu dari permulaan kajian adalah perkalian estimasi hingga tahun yang
mendahuluinya, dan nilai survive estimasi untuk tahun tertentu, yakni
Sˆ  t   Sˆ  t  1 pt
Estimasi Produk Limit adalah estimasi maksimum likelihood.
Dalam prakteknya, Estimasi Produk Limit dapat dihitung dengan
membangun tabel dengan lima kolom, dengan mengikuti perintah di bawah
ini
1. Kolom 1 memuat semua waktu survive, baik sensor dan tidak sensor,
diurutkan dari yang terkecil hingga terbesar. Tanda plus diberikan
untuk observasi sensor. Jika observasi sensor mempunyai nilai yang
sama seperti nilai tidak sensor, yang belakangan harus muncul pertama.
2. Kolom kedua, dilebelkan dengan i, berisikan rangking yang
berhubungan dengan setiap observasi pada kolom 1
3. Kolom ketiga, dilabelkan dengan r, yang bersinggungan dengan dengan
observasi hanya tidak sensor. Misal r = i

17
4. Hitung  n  r   n  r  1 atau pi untuk setiap observasi yang
tidak sensor t(i) dalam kolom 4 untuk memberikan proporsi pasien
survive hingga dan kemudian sampai pada t(i)
5. Kolom kelima, Ŝ  t  adalah perkalian semua nilai dari
 n  r   n  r  1 hingga dan termasuk t. Jika beberapa observasi
yang tidak sensor kembar, Ŝ  t  yang terkecil harus digunakan.
Untuk menyimpulkan prosedur ini, misal n adalah jumlah total pasien yang
waktu survivenya sensor atau tidak tersedia. Lebelkan kembali n waktu
survive dalam urutan menaik sedemikian hingga t  1  t  2     t  n  .
Kemudian
nr
Sˆ  t    n  r 1
t r  t

Dimana r bergerak melalui bilangan positif itu untuk yang mana t  r   t


dan t(r) adalah tidak sensor. Nilai r adalah bilangan bulat yang berurutan 1,2,
…,n jika tidak ada observasi sensor, jika terdapat observasi sensor maka r
tidak ada.
Estimasi median waktu survive adalah persentil ke 50, yang mana nilai t
pada Sˆ  t   0,50
Contoh : Andaikan bahwa durasi remisi berikut telah diobservasi dari 10
pasien dengan tumor yang solid. Enam pasien kambuh pada 3, 6.5, 6.5, 10,
12, dan 15 bulan, satu pasien hilang mengikuti pada 8,4 bulan dan 3 pasien
masih di dalam remisi pada akhir kajian setelah 4, 5.7 dan 10 bulan.
Perhitungan Ŝ  t  ditunjukkan pada tabel berikut
Waktu Rank R n  r Ŝ  t 
remisi (t) (i) n  r 1
3.0 1 1 9/10 9/10 = 0.900
4.0+ 2 - - -
5.7+ 3 - - -
6.5 4 4 6/7 9/10 x 6/7 = 0.771
6.5 5 5 5/6 9/10 x 6/7 x 5/6 = 0.643
8.4+ 6 - - -
10.0 7 7 ¾ 9/10 x 6/7 x 5/6 x ¾ = 0.482
10.0+ 8 - - -
12.0 9 9 ½ 9/10 x 6/7 x 5/6 x ¾ x ½ = 0,241
15.0 10 10 0 0

18
Fungsi bentuk survival Ŝ  t  digambarkan pada grafik berikut, estimasi
median waktu remisi adalah m = 9,8 bulan
1.0
0.8
0.6
St
0.4
0.2
0.0

0 5 10 15
t

Dari perhitungan kita mencatat bahwa Ŝ  t  pada t  t  i  dihubungkan


kepada Ŝ  t  pada t  t  i 1 , sehingga dapat ditulis kembali sebagai
ni
Sˆ  t  i    Sˆ  t  i 1 
n  i 1
Dimana t  i  dan t  i 1 adalah observasi yang tidak sensor. Sebagai
contoh
1 1
Sˆ 12   Sˆ 10    0,482   0,241
2 2
Jika tidak ada observasi sensor atau hilang sebelum t maka rumus berikut
adalah ekivalen (menghasilkan hasil yang sama)
nr
Sˆ  t  i    1   
i
n t r  t n  r  1
Variansi dari produk limit estimasi Ŝ  t  dihampiri oleh

      n  r  n1  r  1
Var Sˆ  t   Sˆ  t 
2

19
Dimana r termasuk kedalam bilangan bulat positif untuk yang mana
t  r   t dan t(r) berhubungan dengan kematian. Sebagai contoh

  2
var Sˆ 10    0,482 
1

1

1

1 
  0.0352
 9  10 6  7 5  6 3  4 
Rata-rata waktu survival  dapat ditunjukkan sama dengan daerah di
bawah estimasi fungsi bentuk survival. Untuk mengestimasi  , kita dapat
gunakan

̂   Sˆ  t 
0
dt

Jadi, ̂ sama dengan daerah dibawah estimasi fungsi survival, sehingga


jika waktu mati diurutkan t  1  t  2     t  m  (jika terdapat m observasi
tidak sensor) dan t(m) adalah observasi yang terbesar dari n observasi, maka
 dapat diestimasi seperti

ˆ  1t  1  Sˆ  t  1   t  2   t  1   Sˆ  t  2    t  3  t  2      Sˆ  t  m1  t  m   t  m 1 

Yang mana adalah penjumlahan daerah persegi panjang bawah yang


dibentuk kurva survival oleh observasi yang tidak sensor. Pertimbangkan
data pada contoh sebelumnya dengan m = 6 dan

t  1  3, t  2   6.5, t  3   6.5, t  4   10, t  5   12, dan t  6   15 ,


rata-rata waktu survival diestimasikan seperti

ˆ  1  3  0.9 6.5  3  0.64310  6.5  0.48212  10  0.24115  12 


 3  3.150  2.251  0.964  0.723
 10.088 bulan

Bagaimanapun juga, juga jika observasi yang terbesar dalam data adalah
data sensor dan digunakan sebagai t(m) untuk mengestimasi  sehingga
mungkin menghasilkan estimasi yang rendah. Pada kasus ini, Irwin (1949)
menyarankan bahwa sebagai pengganti mengestimasi rata-rata waktu
survival, salah satunya seharusnya memilih limit waktu L dan mengestimasi
rata-rata waktu survival dengan limit menuju L katakanlah   L  , dengan
menggunakan L untuk t(m). Sebagai contoh, jika pada contoh sebelumnya

20
observasi yang terbesar adalah data sensor, yakni 15+ dan jika kita
memisalkan L = 16, maka
 16  3  3.150  2.251  0.964  0.24116  12
 10.329
Dimana rata-rata waktu survival dibatasi (limit) pada 16 bulan.
Variansi ̂ diestimasikan oleh
Ar2
var ˆ   
r  n  r  n  r  1
Dimana r begerak sampai pada bilangan bulat untuk t r yang berhubungan
dengan mati, dan Ar adalah daerah dibawah kurva Ŝ  t  kekanan t(r). Ar ke-
k berkaitan dengan m observasi tak sensor adalah

       
Sˆ t  k  t  k 1  t  k   Sˆ t  k 1 t  k 1  t  k  2     Sˆ t  m1 t  m   t  m1 
Jika tidak ada observasi yang sensor akan menghasilkan rata-rata sampel
t   t i n dan menghasilkan

Var  ˆ   Var  t  
t i t
2

n2
Yang mana estimasi tidak tak bias. Kaplan dan Meier menyarankan bahwa
kedua rumus variasi yang telah dibahas di atas harus dibagi secara berturut-
m n
turut dengan dan . Berikut akan dibahas untuk data-data
m 1 n 1
dari dua contoh soal yang telah diberikan sebelumnya dimana contoh soal
pertama tidak ada data sensor dan contoh kedua mempunyai data sensor
untuk itu masing-masing variansi untuk ̂ diberikan oleh
t  ˆ  8.2 dan menghasilkan variansi yang tidak tak bias (bias) 0,616,
10
jika faktor n  n  1  dikalikan akan menghasilkan variansi  yang
9
takbias ialah 0.684. Selanjutnya untuk menghitung variansi dari ̂ dengan
menggunakan contoh yang memiliki data sensor, pertama sekali hitung lima
Ar yaitu A1 , A4 , A5 , A7 dan A9

21
A1  Sˆ  t  1   t  2   t  1   Sˆ  t  2   t  3   t  2      Sˆ  t  5   t  6   t  5  
 3.150  2.251  0.964  0.723  7.088
A4  Sˆ  t  2   t  3   t  2      Sˆ  t  5   t  6   t  5  
 2.251  0.964  0.723  3,938
A5  2.251  0.964  0.723  3,938
A7  0.964  0.723  3,938
A9  0.723


var ˆ  
 7.088 2   3.938 2   3.938 2  1.687  2   0.723 2  1.942
9  10 6 7 5 6 3 4 1 2
Jika faktor m  m  1  6 5 dikalikan pada nilai estimasi variansi di atas
akan menghasilkan variansi yang tak bias 2.330

2.2 Analisis Tabel Kehidupan


Metoda analisis tabel adalah satu dari teknik yang tertua untuk mengukur
angka kematian dan menggambarkan pengalaman survival dari sepuah
populasi. Ini telah digunakan oleh ahli aktuaria, ahli geografi dan peneliti
kesehatan dalam kajian survival, pertumbuhan populasi, kelahiran, migrasi,
panjang kehidupan pernikahan, panjang hidup pekerjaan dan lain-lain.
Telah terdapat deretan setiap 10 tahun tabel kehidupan pada keseluruhan
populasi U.S sejak tahun 1900. Pemerintahan daerah dan pusat juga
menerbitkan tabel kehidupan. Tabel kehidupan ini menyimpulkan
pengalaman angka kematian dari populasi yang ditetapkan untuk periode
waktu yang ditetapkan yang disebut tabel kehidupan populasi. Sebagaimana
penelitian klinis dan epidemic menjadi lebih lazim, metoda tabel kehidupan
telah dipakai terhadap pasien dengan diberikan penyakit yang telah diikuti
untuk periode waktu. Tabel kehidupan dibangun untuk pasien disebut
dengan tabel kehidupan klinis. Meskipun populasi dan tabel kehidupan
klinis sama perhitungannya, sumber data yang diperlukan berbeda.

2.3 Tabel Kehidupan Populasi


Terdapat dua jenis tabel kehidupan populasi yakni tabel kehidupan cohort
dan tabel kehidupan current. Tabel kehidupan cohort menggambarkan
22
survival atau pengalaman angka kematian dari lahir hingga mati dari cohort
tertentu dari orang-orang yang lahir pada waktu yang sama, sebagai contoh
semua orang yang lahir pada tahun 1950. Cohort telah diikutkan dari tahun
1950 hingga semuannya mati. Proporsi kematian (survival) kemudian
digunakan untuk membangun tabel kehidupan untuk penanggalan tahunan
berturut-turut. Jenis tabel ini, berguna penuh dalam kajian proyeksi populasi
dan prospektif, ini tidak sering dibangun karena memerlukan kelanjutan
periode yang panjang.
Tabel kehidupan current dirancang dengan menerapkan usia nilai kematian
tertentu dari populasi dalam perioda waktu yang diberikan terhadap
hipotesis cohort 100000 atau 1000000 orang. Titik awal adalah kelahiran
pada tahun 0. Dua sumber data yang diperlukan untuk membangun tabel
kehidupan populasi (1) sensus data pada jumlah orang yang hidup pada
setiap umur untuk diberikan tahun pada pertengahan tahun (2) statistic vital
pada jumlah kematian dalam tahun diberikan untuk setiap umur. Sebagai
contoh Tabel kehidupan current untuk US mengasumsikan hipotesis cohort
dari 100000 orang yaitu subjek usia nilai kematian yang ditetapkan didasari
pada data yang diobservasi untuk US pada sensus 1990. Tabel kehidupan
current, didasari pada pengalaman hidup dari populasi nyata pada perioda
waktu yang singkat, memberikan kesimpulan yang baik pada kematian
current. Tabel kehidupan jenis ini secara teratur diterbitkan oleh agensi
pemerintah dengan tingkatan-tingkatan yang berbeda. Satu yang paling
sering dilaporkan secara statistik dari tabel kehidupan current adalah
harapan hidup.
Di Amerika serikat Pusat Statistik kesehatan nasional melaporkan secara
lengkap tabel kehidupan persepuluh tahun setelah setiap sensus sepuluh
tahunan. Ini merupakan tabel kehidupan yang lengkap menggunakan grup
usia satu tahunan. Diantara sensus, laporan tahunan tabel kehidupan juga
diterbitkan. Tabel kehidupan tahunan sering kelihatan dalam interval usia
lima tahunan dan disebut dengan kemudahan tabel kehidupan.
Tabel kehidupan current biasannya terdiri dari lima kolom :
1. Interval usia [x hingga x + t]. Interval waktu ini diantara dua usia
pasti x dan x + t ; t adalah panjang interval. Sebagai contoh,
interval 20 – 21 termasuk interval waktu dari ulang tahun yang ke-
20 hingga ulang tahun yang ke-21 (tetapi tidak termasuk ulang
tahun pada ke-21)
2. Proporsi dari orang-orang yang hidup pada permulaan interval usia
tetapi mati selama interval  t q x  . Informasi dihasilkan dari data
sensus. Sebagai contoh,  t q x  untuk interval usia 20-21 adalah
proporsi orang-orang yang mati pada atau setelah ulang tahun yang
23
ke-20 mereka dan sebelum ulang tahun mereka yang ke-21. Ini
estimasi dari peluang bersyarat dari kematian dalam interval
diberikan orang-orang yang hidup pada usia x. Kolom ini biasanya
dihitung dari data 10 tahunan dari populasi dan kematian-kematian
yang terjadi dalam interval waktu yang diberikan. Sebagai contoh,
angka kematian pada contoh tabel di bawah dari populasi data
sensus tahun 1990 dan kematian-kematian yang terjadi di US
dalam tiga tahun 1989-1991. Kolom ini adalah dasar dari tabel
kehidupan dari semua kolom lain yang dijalankan.
3. Jumlah kehidupan yang dimulai pada interval usia  l x  . Nilai
awal dari l x , ukuran populasi hipotesis biasannya 100000 atau
1000000. Nilai berikutnya berturut-turut dihitung menggunakan
formula
l x  l x 1 1  t q x 1 
Dimana 1 t q x 1 adalah proporsi orang-orang yang survival
interval usia . Pada tabel di bawah
t  1, l 20  l19 11 q19   983141  0,00101  98215 ,
yang jumlah orang-orang hidup pada permulaan usia 20

24
Uji Logrank
Mantel (1966) membangun uji Savage (1965), seering dianggap sebagai uji
logrank (Peto dan Peto, 1972) yang didasari pada himpunan skor w i yang
diberikan oleh observasi. Skor adalah fungsi logaritma dari fungsi survival.
Altshuler (1970) mengestimasi fungsi log survival pada t (i) dengan
menggunakan
m j 
 e t  i     
j t  i  r j 
Dimana m(j) dan r(j) telah didefinisikan pada seksi sebelumnya. Skor-skor
yang disarankan oleh Peto dan Peto adalah wi  1  e t  i    untuk
observasi yang tidak sensor dan  e T  untuk observasi yang sensor pada
saat T. Pada prakteknya untuk observasi sensor t i , wi  e t  j 

 

dimana t(j) adalah observasi yang tidak sensor terbesar yakni t  j   t i . Jadi,
semakin besar observasi yang tidak sensor semakin kecil skornya.
Observasi sensor mendapat skor negatif. Jumlah skor w secara identik 0
untuk dua grup bersamaan. Uji logrank didasari pada jumlah S dari skor w
dua grup. Perhitungan variansi S diberikan oleh
n1  n2
n1 n2 w 2
i
var S   i 1

 n1  n2  n1  n2  1
Yang mana dapat ditulis kembali seperti
 k m j   r j   m j    n1 n2
v   
 j 1 r j    n1  n2  n1  n2  1

Uji statistic L  S var  S  mempunyai distribusi normal baku. Jika S


dihasilkan dari grup 1, daerah kritis adalah L   Z  dan jika S adalah
dihasilkan dari grup 2, daerah kritis adalah L  Z  dimana  tingkat
signifikan untuk menguji H 0 : S1  S 2 melawan H 1 : S1  S 2
25
Contoh : Pertimbangkan data sebelumnya, uji logrank dapat dihitung
 
dengan mentabulasikan m i  , r i  , m i  r i  , dan e t  i  dalam sebuah
tabel. Karena setiap observasi dalam dua sampel, sensor atau tidak
diberikan skor, ini lebih baik untuk mendaftarkannya pada kolom 1, kolom
2 hingga 5 hanya menyinggung untuk waktu gagal. e t  i    adalah nilai
komulatif dari m i  r i  , Altshuler (1970) mengestimasi logaritma fungsi
keselamatan mengalikan dengan -1. Sebagai contoh, pada t (i) = 18,
e t  i   = 0,100 + 0,125 = 0,225, pada t(i) = 19, e t  i   = 0,225 + 0,333 =
0,558. Kolom terakhir wi memberikan skor untuk setiap observasi. Untuk
 
observasi yang tidak sensor wi  1  e t  i  , sebagai contoh, pada t(i) = 18,
w(i) = 1 – 0,225 = 0,775. Karena e t    adalah mengestimasi fungsi dari
i
fungsi keselamatan, yang mana kita asumsikan konstan diantara dua
kegagalan berurutan, e t (i )  adalah sama terhadap e t  i   untuk t  j   t i
. Jadi wi untuk observasi sensor t i sama dengan  e t  j  , dimana

 

t  j   t , sebagai contoh , skor wi untuk 16+ adalah –e(15) dan untuk 18+
i

adalah –e(18). Observsi kembar seperti pada penerimaan 19 menerima skor


yang sama yakni 0,442. 10 penjumlahan skor w i menuju 0 yang mana dapat
digunakan untuk memeriksan perhitungan.

Waktu remisi m(i) r(i) m(i)/r(i) e t  i   wi


pada kedua
sampel ti
15 1 10 0,1 0,100 -0,900
16+ - - - - 0,100
18 1 8 0,125 0,225 0,775
18+ - - - - -0,225
19 2 6 0,333 0,558 0,442
20 1 4 0.250 0,808 0,192
20+ - - - - -0,808
23 1 2 0,500 1,308 -0,308
24+ - - - - -1,308

Statistic S = 0.900 + 0.775 + 0.442 + 0.442 + 0.192 = 2.751, dan variasi


untuk S seperti rumus yang telah diberikan adalah 1,210. Karenanya nilai
26
uji statistik adalah L  2.751 1.210  2.5 dan nilai p menghampiri
0,0064, data menunjukkan bahwa percobaan CMF lebih unggul. Statistik
logrank S dapat ditunjukkan sama dengan menjumlahkan observasi gagal
minus ekspektasi gagal bersayarat dihitung pada setiap waktu kegagalan
atau secara sederhana selisih (perbedaan) diantara yang diobservasi dan
ekspektasi kegagalan dalam 1 grup. Versi yang sama dari uji logrank
adalah uji chi-kuadrat yang mana membandingkan jumlah observasi gagal
terhadap jumlah ekspektasi gagal dibawah hipotesis. Misal O1 dan O2 adalah
jumlah observasi dan E1 dan E2 ekspektasi jumlah kematian dalam 2 grup.
Uji statistic

X 2

 O1  E1 
2


 O2  E 2 
2

E1 E2
Memiliki hampiran distribusi chi-kuadrat dengan derjat kebebasan 1, Nilai
X 2  X 12, 0.05 akan mengizinkan untuk menolak hipotesis null.
Untuk menghitung E1 dan E2 kita menyusun semua observasi tidak sensor
dalam urutan menaik dan menghitung ekspektasi kematian pada waktu yang
tidak sensor dan menjumlahkannya. Jumlah ekspektasi kematian pada
waktu tak sensor adalah dihasilkan dengan mengalikan kematian yang
diobservasi pada waku tersebut dengan proporsi pasien mengarah (tak
terlindungi) ke resiko dalam percobaan grup. Misal d 1 adalah jumlah
kematian pada waktu t dan n 1t, n2t adalah jumlah pasien masih mengarah ke
resiko mati pada waktunya hingga t dalam dua percobaan grup. Ekspektasi
kematian untuk grup 1 dan 2 pada waktu t adalah
n1t n2t
e1t   dt e2 t   dt
n1t  n 2t n1t  n 2t
Total jumlah ekspektasi kematian dalam dua grup adalah
E1  e
semua t
1t dan E2  e
semua t
2t

Pada prakteknya kita hanya memerlukan untuk menghitung jumlah


ekspektasi kematian dalam 1 dari 2 grup, sebagai contoh, E 1, karena E2
adalah total jumlah yang diobservasi kematiannya minus E1.

Contoh : Misalkan kita menggunakah secara hipotesis data dalam data


waktu remisi dalam bulan seperti

CMF : 23, 16+, 18+, 20+, 24+


Control : 15, 18, 19, 19, 20
Pertimbangkan hiposis null dan hipotesis alternatif berikut.
27
H 0 : S1  S 2
H 1 : S1  S 2
Tabel di bawah memberikan perhitungan E1, sebagai contoh, pada waktu t =
18, 4 pasien pada grup 1 dan pasien pada grup 2 masih mengarah ke resiko
kedalam keadaan tak baik, dan terdapat 1 keadaan tak baik. Jadi d t = 1, n1t =
n2t = 4, dan e1t = 0.5.
Jumlah total ekspektasi tak baik adalah E 1 = 3.75. Karena ada total 6
kematian (O1 = 1 dan O2 = 5) dalam dua grup, E2 = 6 – 3,75 = 2.25
Kita miliki

X2 
1  3.75 2 
 5  2.25 2  5.378
3.75 2.25
Dengan membandingkan nilai ini dengan tabel chi-kuadrat, maka akan
menghasilkan keputusan yang sama seperti sebelumnya yaitu terdapat
perbedaan yang signifikan antara dua grup percobaan.

Waktu tak baik dt n1t n2t e1t e2t


15 1 5 5 0.5 0.5
18 1 4 4 0.5 0.5
19 2 3 3 1.0 1
20 1 3 1 0.75 0.25
23 1 2 0 1 0
Total 3.75 2.25

Peto Dan Peto’s Yang Dibangkit Uji Wilcoxon


Pembangkit lain dari uji penjumlahan ranking dua sampel digambarkan oleh
Peto dan Peto’s (1972). Dengan cara yang sama seperti uji logrank, uji ini
memberikan skor kepada setiap observasi. Untuk observasi tidak sensor t,
skor adalah u i  Sˆ  t    Sˆ  t    1 , dan untuk observasi sensor pada T
skor adalah u  Sˆ  T   1 , dimana Ŝ adalah estimasi Kaplan – Meier
i

dari fungsi survival. Notasi untuk skor observasi tidak sensor t (i) adalah
u i  Sˆ  t  i    Sˆ  t  i 1   1 dan Sˆ  t  0    0 dan yang untuk observasi
sensor t j adalah u  Sˆ  t  1 , dimana t  t . Skor yang dibangkit
 
j  i i j

wilcoxon penjumlahannya menuju 0. Prosedur uji setelah skor dihasilkan


adalah sama seperti uji logrank.
Contoh : Menggunakan data yang sama seperti sebelumnya, perhitungan
Peto dan Peto’s dibangkit Wilcoxon diberikan dalam tabel berikut
28
t(i) Ŝ  t  ui
15 0.900 1 + 0.900 – 1 = 0.900
16+ - 0.900 – 1 = -0.100
18 0.788 0.900 + 0.788 – 1 = 0.688
18+ - 0.788 – 1 = -0.212
19 0.657 0.788 + 0.657 – 1 = 0.445
19 0.526 0.526 + 0.657 – 1 = 0.183
20 0.395 0.395 + 0.526 – 1 = -0.079
20+ - 0.395 – 1 = -0.605
23 0.197 0.197 + 0.395 – 1 = -0.408
24+ - 0.197 – 1 = -0.803

Menggunakan skore pada grup 1, kita hasilkan


S = -0,100 - 0,212 - 0,605 – 0,408 – 0,803 = -2,128

Var  S    5 5
 0.9       0.803
2 2
 0.765
10  9
Jadi Z   2.128 0.765  2.433   Z 0.05  1.64 , kita
menolak H0 pada   0.05

Uji F Cox’s
Uji F Cox’s (Cox 1964) didasari pada urutan skor dari distribusi
eksponensial. Ini untuk sensor satu demi satu atau sampel lengkap. Ini tidak
dapat dipakai untuk data sensor yang banyak. Prosedurnya diberikan seperti
berikut :
1. Ranking observasi dalam sampel yang digabung
2. gantikan rangking dengan menghubungkan harapan statistic
berurut dalam pensampelan unit distribusi eksponensial
 
f  t   e  t . Notasikan oleh trn nilai harapan dari observasi ke-r
dengan urutan jarak meningkat
1 1
t rn   r  1,  , n
n n  r 1
Dimana n adalah jumlah total observasi dalam dua sampel.
Khususnya

29
1
t1n 
n
1 1
t 2n  
n n 1

1 1
t nn   1
n n 1
Untuk n yang tidak terlalu besar, mereka dapat dengan mudah
dihitung dengan menggunakan tabel timbale balik. Ketika dua atau
lebih observasi tunggal, rata-rata dari skor yang digunakan
3. Untuk data tanpa observasi, keseluruhan himpunan n observasi
digantikan oleh himpunan skor  t rn  yang dihasilkan. Rata-rata
skor sampel dinotasikan dengan t1 dan t 2 dari dua sampel
dengan n1, n2 observasi kemudian dihitung. Rasio t1 t 2 telah
ditunjukkan mengikuti distribusi F dengan derjat kebebasan
(2n1,2n2). Daerah kritis untuk menguji
H 0 : S1  S 2 melawan H1 : S1  S 2 , H1 : S1  S 2 ,
dan H1 : S1  S 2
4. Seterusnya
t1 t 2  F2 n1 , 2 n 2 , , t1 t 2  F2 n1 , 2 n 2 ,1
dan t1 t 2  F  atau t1 t 2  F2 n ,1 2
2 n1 , 2 n 2 , 1 , 2 n2
2
5. Perhitungan F sedikit berbeda untuk data sensor. Misal r 1 dan r2
adalah jumlah gagal dan n1-r1 dan n2-r2 adalah observasi sensor
dalam dua sampel. Maka terdapat p = r1 + r2 kegagalan dalam
gabungan sampel dan n – p observasi sensor. Cox (1964)
menyarankan menggunakan skor t1n ,  , t pn seperti sebelumnya
untuk gagal dan t  p 1 n untuk setiap observasi sensor. Rata-rata
skor untuk grup pertama adalah
r1t1   n1  r1  t  p1 n
t1 
r1
Dimana t1 adalah rata-rata skor gagal. Rata-rata untuk grup
kedua dihitung dengan cara yang sama. Uji statistic F t1 t 2
menghampiri distribusi F dengan derjat kebebasan (2r1,2r2)
30
Contoh : dalam eksprimen membandingkan dua treatment (A dan B) untuk
tumor ganas, andaikan bahwa pertanyaan apakah percobaan B lebih baik
dari pada percobaan A. Enam tikus diberikan percobaan A dan Enam
percobaan untuk B. Eksprimen diakhiri setelah 30 hari, waktu survival
berikut dicatat. Hipotesis null dan alternative berturut-turut adalah seperti
berikut
H0 : S A  SB
H1 : S A  S B
Treatment A : 8, 8, 10, 12, 12, 13
Treatment B : 9, 12, 15, 20, 30+, 30+
Semua tikus menerima percobaan A mati dalam 13 hari dan dua tikus yang
menerima treatment B masih hidup hingga akhir kajian. Apakah data
memberikan cukup bukti bahwa treatment B lebih efektif dari treatment A.
Untuk menghitung uji statistik, lebih baik disusun dalam tabel seperti
dibawah. Kolom pertama daftar semua observasi dalam dua sampel, kolom
kedua memuat skor eksponensial yang diurutkan t rn. Pada kasus ini n1 = 6,
n2 = 6, n = 12, r1 = 6 dan r2 = 4. Skor dihitung seperti prosedur kedua di atas,
sebagai contoh trn untuk ti = 10 sama dengan 1/12 + 1/11 + 1/10 + 1/9 =
0,385. Observasi kembar menerima rata-rata skor, sebagai contoh, untuk t i =
1
12, t rn   0,510  0,653  0,820  0,661 . Kolom dua terakhir
3
dari tabel memberikan skor untuk dua sampel dan jumlah dimasukkan pada
bagian bawah. Sehingga
2,985 8,014
tA   0,498 dan t B   2,004 dan pada akhirnya
6 4
t A 0,498
F   0,249
t B 2,004
Dengan derjat kebebasan (12,8). Karena nilai F < F12,8,0.05) maka dapat
disimpulkan karenanya data memberikan bukti yang kuat bahwa B lebih
baik dari pada A.

ti trn trn sampel A trn sampel B


8 1/12 = 0,0831 0,129 -
8 1/12 + 1/11 = 0.174 0,129 -
9 1/12 + 1/11 + 1/10 = 0.174 + - 0,274
31
0,100 = 0,274
10 0,274 + 1/9 = 0,385 0,385 -
12 0,385 + 1/8 = 0,510 0,661 -
12 0,510 + 1/7 = 0,661 0,661 -
12 0,653 + 1/6 = 0,820 - 0,661
13 0,820 + 1/5 = 1,020 1,020 -
15 1,020 + ¼ = 1,270 - 1,270
20 1,270 + 1/3 = 1,603 - 1,603
30+ 1, 603 + ½ = 2,103 - 2,103
30+ 2,103 - 2,103
2,985 8,014

Uji Mantel-Haenszel
Uji mantel-Haenszel berguna sekali terutama untuk membandingkan
pengalaman survival diantara dua grup ketika penyesuaian untuk faktor
penentu lain diperlukan. Ujian ini telah banyak digunakan dalam kajian
secara klinik maupun secara epidemic seperti metoda mengontrol akibat-
akibat variabel yang dibaurkan. Sebagai contoh dalam membandingkan dua
percobaan untuk penyakit menular, ini akan menjadi penting untuk
penyesuaian perbandingan untuk variabel-variabel yang mungkin berbaur
seperti tingkatan penyakit. Dalam mempelajari hubungan merokok dengan
penyakit hati, ini akan menjadi penting untuk mengontrol akibat-akibat usia.
Untuk menggunakan uji Mantel-Haenszel, data distratifikasi oleh variabel-
variabel yang berbaur, dan dimasukkan dalam deretan tabel 2x2, satu untuk
tiap stratum.
Misal s adalah jumlah strata, nji adalah jumlah induvidu-induvidu dalam
grup j, j = 1,2 dan stratum i, i = 1,2,…s, dan d ji adalah jumlah kematian
dalam grup j dan stratum i, untuk tiap-tiap strata, data dapat digambarkan
dengan tabel kontingensi 2 x 2

Grup Jumlah Kematian Jumlah Selamat Total


1 d1i n1i – d1i n1i
2 d2i n2i – d2i n2i
Total Di Si Ti

Hipotesis null untuk menguji dapat digambarkan sebagai

32
H 0 : p11  p12
p 21  p 22

p s1  ps2
Dimana p ij  P  mati grup j , stratum i  . Jadi ujian mengizinkan
secara simultan membandingkan semua s tabel kontingensi dari perbedaan
dalam peluang hidup atau mati untuk dua grup.
Uji statistic ci-kuadrat tanpa pembetul kekontinuan diberikan oleh

X2 
 s
d  i 1 E  d 1i 
i 1 1i
s
 2

 var d1i 
s
i 1
Dimana
n1i Di n n DS
E  d1i   dan Var  d1i   1i2 2i i i
Ti Ti  Ti  1
Adalah berturut-turut rata-rata dan varians dari jumlah kematian dalam grup
i yang dihitung secara bersyarat pada total marginal tabel kontingensi.
Statistik ini mengikuti distribusi chi-kuadrat dengan 1 derjat kebebasan.
Sehingga sebuah pilihan dihitung mengindentifikasikan perbedaan yang
signifikan dalam survival diantara dua kumpulan. Contoh berikut
mengilustrasikan penggunaan ujian.

Contoh : 595 orang yang berpartisipasi pada sebuah kasus kajian kontrol
yang berhubungan kolesterol dan koroner penyakit hati (CHD). Diantara
mereka, 300 orang diketahui mempunyai CHD dan 295 bebas dari CHD.
Untuk menemukan jika kolesterol dibuang secara signifikan dihubungkan
dengan CHD, peneliti memutuskan untuk mengontrol pengaruh-pengaruh
dari merokok. Subjek penelitian kemudian dibagi kedalam dua stratum
perokok dan tidak perokok.
Tabel berikut memberikan data untuk perokok :

Kolesterol CHD Tanpa CHD Total


dibuang
Ya 120 20 140
Tidak 80 60 140
Total 200 80 280

33
Dan Untuk Tidak Perokok

Kolesterol CHD Tanpa CHD Total


dibuang
Ya 30 60 90
Tidak 70 155 255
Total 100 215 315

Dengan menggunakan rumusan yang telah diberikan di atas, maka dapat


dihasilkan bentuk-bentuk berikut :

140  200 90  100


E  d 1i    100, E  d 2i    28,571
280 315
140  140  200  80
var d1i    14,337
 280 2  280  1
90  225  100  215
var d 2i    13,974
 315 2  315  1
Selanjutnya dengan menggunakan nilai d1i = 120 dan d2i = 30, maka kita
memiliki bentuk berikut

X2 
150  128,571 2  16,220
14,337  13,974
Jadi kolesterol yang dibuang adalah secara signifikan dihubungkan dengan
CHD setelah menyesuaikan untuk akibat-akibat dari perokok.

Contoh : Tabel berikut data survival dalam format tabel kehidupan dari
kasus laki-laki dengan dilokalisir kanker anus untuk tahun 1935-1944 dan
1945-1954. Kita gunakan uji chi-kuadrat Mantel-Haenszel untuk melihat
jika distribusi survival dari pasien yang didiagmosa pada tahun 1935-1944
sama dengan pasien yang didiagnosa pada tahun 1945-1954. Hipotesis null
adalah bahwa dua distribusi survival adalah sama. Ini tidak memerlukan
untuk menyediakan 10 tabel kontingensi untuk 10 interval.

(1) (2) (3) (4) (5) (6)

34
1935-1944 1945-1954
Int mati selamat Total mati selamat Total
d1i n1i – d1i n1i d2i n2i – d2i n2i
1 167 220 387 185 559 744
2 45 173,5 218,5 88 461 549
3 45 127,5 172,5 55 396 451
4 19 108 127 43 343 386
5 17 91 108 32 299 331
6 11 79,5 90,5 31 235 266
7 8 71 79 20 170 190
8 5 66 71 7 132 139
9 6 59,5 65,5 6 101,5 101,5
10 7 52 59 6 71 77

330

(7) (8) (9) (10) (11) (12)


Kombinasi Perioda Waktu E(d1i) Var(d1i)
n2i S i
Ti
mati
Di
selamat
Si
Total
Ti  3   7   6   810   11
 9  9  9  1
352 779 1131,0 120,45 512,45 56,624
133 634,5 767,5 37,86 453,86 22,418
100 523,5 623,5 27,67 378,67 16,832
62 451 513 15,35 339,35 10,174
49 390 439 12,05 294,05 8,090
42 314,5 356,5 10,66 234,66 7,036
28 241 269 8,22 170,22 5,221
12 198 210 4,06 131,06 2,546
12 161 173 4,54 100,04 2,641
13 123 136 5,64 69,64 2,909
246,50 132,491

Nilai chi-kuadrat dengan mudah dihitung dengan membangun tabel 7-12


secara langsung dari tabel kehidupan. Menggunakan jumlah pada kolom 1,
10, dan 12 kita hasilkan

X 2   330  246,50 
2
132,491  52,624

Yang signifikan dengan   0,001 . Jadi data menunjukkan perbedaan


yang signifikan diantara distribusi survival pasien yang didiagnosa diantara
tahun 1935-1944 dan 1945-1954.

Membandingkan K (K > 2) Sampel


Dalam seksi ini permasalahan dua sampel akan dibangkitkan untuk situasi
dimana data terdiri dari K (K > 2) sampel, satu sampel dari tiap-tiap K
populasi percobaan. Permasalahan untuk memutuskan apakah K sampel
saling bebas dapat dipandang sebagai asal dari populasi yang sama, atau
dalam istilah praktis untuk melihat jika data survival dari pasien yang

35
menerima K percobaan memberikan cukup bukti untuk memutuskan bahwa
K percobaan tidak efektif sama. Permasalahan ini telah dipertimbangkan
oleh banyak ahli statistic, sebagai contoh Kruskal dan Wallis (1952), Mantel
Dan Haenszel (1959), Breslow (1970) dan Peto Dan Peto (1972). Pada seksi
ini dua uji nonparametric untuk permasalahan ini.

Uji Kruskal – Wallis


Uji Kruskal-Wallis (1952) dengan cara yang sama seperti uji F dalam
analisis variansi, menggunakan rangking daripada data observasi
sebenarnya, hal ini juga disebut dengan analisis variansi satu arah Kruskal-
Wallis dengan rangking. Ini mengasumsikan bahwa variabel waktu survival
yang dipelajari mempunyai dasar distribusi yang kontinu. Misal N adalah
jumlah total dari observasi independent dalam K sampel, n j adalah jumlah
observasi dalam sampel ke-j. Hipotesis null H 0 menyatakan bahwa K
sampel berasal dari populasi yang sama.
Pada perhitungan Kruskal-Wallis uji H, kita pertama sekali merangking
samua N observasi dari yang terkecil hingga terbesar, misal rij adalah
rangking dari tij. Hitung untuk j = 1,2,…,K

nj
Rj 1
R j   rij Rj  R  N  1
i 1 nj 2

Dimana Rj dan R j secara berturut-turut adalah jumlah ranking dan rata-


rata rangking pada percobaan ke-j, dan R adalah rata-rata keseluruhan
ranking. Lalu Statistik H Kruskal-Wallis adalah

n j Rj  R 
K
12

2
H 
N  N  1 j 1
K R 2
12
  3  N  1
j

N  N  1 j 1 n j

Di bawah hipotesis null, H mempunyai distribusi chi-kuadrat yang


seimbang dengan derjat kebebasan K – 1. Jadi untuk nj besar , pendekatan
prosedur uji pada  untuk menolak H0 jika H    k 1 , .
2

36
Jika terdapat observasi-observasi terdapat yang kembar setiapnya diberikan
rata-rata dari rangking. Untuk membetulkan akibat dari adanya kembar, H
dihitung seperti rumus di atas dan dibagi dengan

g
1
1
N N
3 T
j 1
j

Dimana g adalah dari grup kembar, dan T j  t j  t j dimana tj adalah


3

jumlah observasi kembar dalam sebuah grup kembar. Dalam menghitung g


observasi yang tidak kembar dianggap sebagai grup kembar yang berukuran
satu. Jadi gambaran umum dari H yang dibetulkan untuk kembar adalah

12 N  N  1  kj 1  R 2j 
n j  3  N  1
H 
1   j 1 T j
g
N 3
N 
Catatan, ketika tidak ada data kembar, g = N, t j = 1 untuk semua j, dan Tj =
0 sehingga hitungan H kembali seperti rumus penghitungan H yang
pertama.

Contoh : Pada kajian hubungan diantara tingkatan kolesterol dan diet, tiga
jenis diet diberikan secara acak kepada 12 lelaki yang tingkatan pertama
kolesterolnya hampir sama, seperti pada tabel berikut yang berisikan
tingkatan kolesterol dari 12 orang yang setelah diberikan diet untuk perioda
waktu yang diberikan. Tujuan dari penelitian ini adalah untuk memutuskan
jika tiga diet memiliki keefektifan yang sama dalam mengontrol tingkat
kolesterol.

Diet 1 Diet 2 Diet 3


229 145 231
176 181 208
187 147 217
208 187 199

Hipotesi null H0 menyatakan tidak terdapat perbedaan dalam tingkatan


kolesterol dari laki-laki setelah mendapat tiga diet dan hipotesis tandingan
H1 mengatakan bahwa tingkatan kolesterol dari tiga laki-laki yang telah
melakukan diet adalah berbeda. Untuk menghitung statistic H, pertaman
37
sekali rangking observasi seperti tabel berikut dan hitung R j. Pada kasus ini
N = 12, n1 = n2 = n3 = 4, dan Tj = 0, kecuali untuk j = 5, 7.

Urutan Ranking Ranking Ranking Ranking


Observasi Diet 1 Diet 2 Diet 3
145 1 - 1 -
147 2 - 2 -
176 3 3 - -
181 4 - 4 -
187 5.5 - 5.5 -
187 5.5 5.5 - -
199 7 - - 7
208 8.5 8.5 - -
208 8.5 - - 8.5
217 10 - - 10
229 11 11 - -
231 12 - - 12
Rj 28 12.5 37.5
 T j  2 8  2   12 dan
g
karenanya, j 1

H
12 12 13   784 4  156.25 4  1406.25 4  313  6.168
1  12 1728  12 
Ini membuktikan bahwa terdapat perbedaan yang signifikan antara 3 diets
yang ada.

Uji Untuk Data Sensor


Pada bagian sebelumnya terdapat dua uji yang didasarkan oleh skor untuk
membandingkan dua sampel dengan data sensor yaitu peto dan peto
pembangkit uji wilxocon dan uji log-rang.
Andaikan bahwa kita memiliki himpunan N skor w 1,w2,…,wN dihasilkan
menurut cara penskoran dari salah satu uji dari dua uji yang disebutkan di
atas. Jumlah N skor adalah nol. Misal Sj adalah jumlah skor dalam sampel
ke-j. Hipotesis null menyatakan bahwa K sampel dari distribusi yang sama.
Untuk menguji H0 kita menghitung

38
 S nj 
K
2
j
j 1
X 
2

s2
N

w 2
i
s2  i 1

N 1
X2 mendekati distribusi chi-kuadrat dengan derjat kebebasan K – 1, jika
tolak H0 jika X    k 1 
2 2

Contoh : Pertimbangkan waktu remisi awal penderita leukemia dalam hari


seperti yang diberikan oleh 3 percobaan seperti yang diberikan dalam tabel

1 2 3
4,5,9,10,12,13,10,23,28 8,10,10,12,14,20,48 8,10,11,23,25,25,28,2
,28,28, ,70,75,99, 8,31,31,
29,31,32,37,41,41,57,6 103,162,169,195,22 40,48,89,124,143,12+
2,74,100, 0,161+,199+, ,159+,190+,
139,20+,258+,269+ 217+,245+ 196+,197+,205+,219
+

Pada kasus ini N = 66, n1 = 25, n2 = 19, dan n3 = 22. Dengan menyusun
kedalam tabel seperti pada uji logrank, maka jumlah-jumlah skor dapat
dihasilkan S1 = -273, S2 = 170, dan S3 = 103. Sedangkan jumlah kuadrat
skor adalah  wi2  89,702 . Karenanya dengan menggunakan rumusan
di atas dapat dihasilkan

X 2  3,612

Dari hasil ini membuktikan bahwa kita tidak dapat menolak H 0. Data tidak
menunjukkan perbedaan yang signifikan diantara tiga percobaan awal.

39
BEBERAPA DISTRIBUSI SURVIVAL PARAMETRIK DAN
APLIKASINYA

Pada bagian ini beberapa distribusi teoritis yang telah digunakan secara
meluas untuk menggambarkan waktu survival didiskusikan kesimpulan
sifatnya dan mengilustrasikan aplikasinya.

3.1 Distribusi Eksponensial


Distribusi yang paling penting dan paling sederhana dalam kajian survival
adalah distribusi eksponensial. Pada akhir tahun 1940, peneliti telah
memulai untuk memilih distribusi eksponensial untuk menggambarkan pola
kehidupan sistem elektronik. Pada tahun 1952 Davis memberikan sejumlah
contoh-contoh meliputi kesalahan pernyataan bank dan buku kas besar.
Kegagalan mesin penghitung otomatis dan kegagalan komponen
sekumpulan radar, yang mana data kegagalan akan baik digambarkan
dengan distribusi eksponensial. Pada tahun 1953 Epstein dan Sobel
melaporkan mengapa mereka memilih distribusi eksponensial melebihi
distribusi normal yang popular, dan memperlihatkan bagaimana untuk
mengestimasi parameter ketika data adalah sensor tunggal. Pada tahun 1958
Epstein juga mendiskusikan secara detail beberapa pertimbangan untuk
asumsi distribusi eksponensial. Distribusi eksponensial secara terus menerus
telah memegang peranan dalam kajian waktu hidup yang disamakan dengan
distribusi normal pada kajian statistik lainnya.
Distribusi eksponensial sering dianggap sebagai pola kegagalan murni acak.
Ini terkenal untuk kekurangan memori tunggal yang memerlukan usia orang
atau binatang yang tidak mempengaruhi survival yang akan datang.
Walaupun banyak data survival yang tidak dapat digambarkan secara tepat
dengan distribusi eksponen, memahami ini memudahkan untuk percobaan
dengan situasi yang lebih umum.
Distribusi eksponensial diciri-cirikan oleh nilai bahaya konstan  , ini
hanya merupakan parameter. Nilai  yang tinggi mengindikasikan tinggi
resiko, dan survival yang singkat, nilai  yang rendah mengindikasikan
resiko rendah dan survival yang lama. Gambar berikut menunjukkan fungsi
selamat, fungsi densitas dan fungsi bahaya dari distribusi eksponensial
dengan parameter  . Ketika  = 1 distribusi dipandang sebagai distribusi
eksponensial satuan.

40
S(t)

1

2
 1

0 t
h(t)
f(t)

 

0 t 0 t
Ketika waktu survival T mengikuti distribusi eksponensial dengan
parameter  , fungsi densitas peluang didefinisikan seperti

  e  t , t  0,   0
f t  
 0 t0

Distribusi fungsi komulatif adalah

F  t   1  e  t , t0

Sehingga fungsi keselamatan adalah


S  t   e  t , t0
41
Sehingga fungsi bahaya adalah

h t    , t0

Karena distribusi eksponensial dicirikan dengan nilai bahaya yang konstan,


kebebasan usia sesorang, Tidak ada yang berusia lanjut atau yang lama
digunakan dan gagal atau mati adalah peristiwa acak yang saling bebas dari
waktu, ketika logaritma asli fungsi keselamatan diambil log S  t   t ,
yang merupakan fungsi linier dari t. Jadi mudah untuk menghasilkan data
berasal dari distribusi eksponensial dengan membuat grafik log Ŝ  t 
melawan t, dimana Ŝ  t  adalah estimasi dari S(t). Bentuk linier
mengidentifikasikan bahwa data mengikuti distribusi eksponensial dan
kemiringan dari garis lurus adalah estimasi dari nilai bahaya  .
Rata-rata dan variansi dari distribusi eksponensial dengan parameter 
secara berturut-turut adalah 1  dan 1  .
2

Bentuk yang lebih umum dari distribusi eksponensial adalah distribusi


eksponensial dua parameter dengan fungsi densitas peluang

e    t G  , tG
f t  
 0, t G

Kemudian

1  e    t G  , t  G
Ft  
0, tG
 e   t G  , tG
St  
0, t G

Dan

0, 0t G
h t   
 , t G
42
Istilah G adalah jaminan waktu didalamnya yang tidak mati atau gagal
dapat terjadi atau waktu survival minimum. Rata-rata dari distribusi
eksponensial dua parameter adalah.

1
G

Contoh : Dalam kajian obat baru anti kanker dalam L1210 sistem leukemia
binatang, Zelen (1966) berhasil menggunakan distribusi eksponen sebagai
model untuk waktu survival. Sistem terdiri dari menyuntikkan tumor
kedalam tikus-tikus hasil perkawinan. Sel tumor ini kemudian berkembang
biak dan dengan cepat membunuh binatang, tetapi waktu survival mungkin
diperpanjang oleh obat yang aktif. Gambar berikut menunjukkan kurva
survival dalam skala semilogaritma dari tikus-tikus yang tidak dicoba
disuntik pada sel melemah yang berbeda. 25 tikus disuntik pada tiap sel
yang melemah. Bentuk linier yang layak menyarankan bahwa distribusi
survival mengikuti distribusi eksponen cukup baik. Empat garis lurus
ditetapkan untuk titik yang hampir parallel, mengindikasikan bahwa nilai
bahaya yang saling bebas dari ukuran zat yang disuntikkan.

1.00

0.80
43
0.60
0.01 0
0.02
0.04
0.06
0.08
0.10
0.20
0.40 5 10 15 20 25
3.2 Distribusi Weibull
Distribusi weibull adalah pembangkit distribusi eksponensial.
Bagaimanapun juga tidak sama dengan distribusi eksponensial, ini tidak
mengasumsikan bahwa nilai bahaya adalah konstan dan oleh sebab itu
memiliki aplikasi yang lebih luas. Distribusi ini telah diusulkan oleh
Weibull pada tahun 1939 dan diaplikasi untuk berbagai situasi gagal
didiskusikan kembali oleh Weibull pada tahun 1951. Distribusi Weibull
telah banyak digunakan pada kajian reabilitas dan penyakit penyebab
kematian sesorang.
Distribusi dicirikan dengan dua parameter  dan  . Nilai

memberikan kemiringan kurva distribusi dan nilai  memberikan skala.

44
Konsekuensinya  dan  secara berturut-turut disebut dengan parameter
kemiringan dan skala. Hubungan diantara nilai

dan waktu survival dapat
dilihat dari gambar berikut yang menunjukkan nilai bahaya dari distribusi
weibull dan   0.5,1, 2 , 4 dengan nilai   1

h(t)
 4  2

1  1

  0.5
0 1 2 3 t

Ketika   1 nilai bahaya adalah konstan seiring dengan meningkatnya


waktu dan ini adalah kasus untuk distribusi eksponensial. Niali hazard
meningkat ketika   1 dan menurun ketika   1 seiring dengan
meningkatnya t. Jadi distribusi weibull boleh digunakan untuk model
distribusi survival populasi dengan resiko yang kontan, naik dan
turun. Contoh nilai hazard yang meningkat dan menurun secara berturut-
turut adalah kanker paru-paru dan pasien yang sukser mengalami
perawatan.
Fungsi densitas peluang dan fungsi distribusi kumulatif secara berturut-turut
adalah

45
f  t       e   t  ,
 1 
t  0,   0,   0
F  t   1  e   t 

Fungsi selamat dapat diberikan sebagai berikut

S  t   e   t 

Sedangkan fungsi bahaya adalah rasio dari fungsi densitas peluang dan
fungsi selamat seperti berikut

h t     t 
 1

Gambar berikut memberikan fungsi densitas weibull dengan parameter


skala   1 dan beberapa nilai parameter kemiringan
 yang berbeda

f(t)
 4

46
 2

 1

  0.5

0 1 2 3 t

Untuk kurva keselamatan, ini menjadi sederhana menggambarkan


logaritma-logaritma dari fungsi keselamatan seperti

log S  t    t 

atau
log  log S  t     log    log t

Gambar berikut memberikan log S(t) untuk   1 dan   1,  1,  1 ,


ketika   1 adalah sebuah garis lurus dengan kemiringan negative, ketika
  1 , usia yang lanjut negatif, log S(t) menurun sangat lambat dari 0
kemudian mencapai suatu nilai konstan, ketika   1 , usia lanjut positif,
log S(t) menurun tajam dari nol seiring dengan t meningkat.

ln S(t)
0

47

1 2 3
 1
-1
 1
-2

-3  1

-4

Rata-rata dari distribusi weibull adalah

 1
1  

  

Dan variansi adalah

1   2  1 
2  1     2 1  
2  
      

Dimana     x e  x dx     1 ! diketahui sebagai fungsi


 1

gamma dimana
 adalah bilangan bulat.
Distribusi weibull dapat juga dibangun atau dibangkitkan untuk mengambil
kedalam hitungan garansi waktu G selama tidak terdapat kematian atau
kegagalan dapat terjadi. Fungsi densitas peluang weibull tiga parameter
adalah
f  t      t  G 
 1

eksp    t  G 


48
Konsekuensinya adalah


S  t   eksp    t  G 


Dan
h  t      t  G 
 1

Contoh : Pada tahun 1966 pike telah mengaplikasikan distribusi weibull


terhadap 2 kelompok percobaan pada kanker rahim dalam tikus yang
diarahkan untuk carcinogen DMBA. Dua kelompok dibedakan dengan
mencobakan anggota kelompok. Waktu dalam hari setelah memulai
percobaan, pada zat kanker yang telah didiagnosa untuk dua kumpulan tikus
seperti
Kelompok 1 : 143, 164, 188, 188, 190, 192, 206, 209, 213, 216, 220,
227, 230, 234, 246, 265, 304, 216+,244+
Kelompok 2 : 142, 156, 173, 198, 205, 232, 232, 233, 233, 233, 233,
233, 239, 240, 261, 280, 280, 296, 296, 323, 204+, 344+
Asumsikan bahwa G = 100 dan   3 , Pike menghasilkan

ˆ1   4,51  10 7  3 ˆ2   2,38  10 7  3


1 1

untuk kelompok 1 dan


untuk kelompok 2. Prosedur estimasi secara analitis akan didiskusikan pada
bagian berikutnya. Gambar grafik seperti gambar yang ditampilkan berikut
merupakan kurva survival dari dua kelompok. Fungsi tangga yang
dihasilkan merupakan hasil dari nonparametric seperti yang telah dibahas
sebelumnya dan begitu juga dengan estimasi Kaplan-Meier. Kurva mulus
yang dihasilkan adalah berasal dari distribusi weibull.
Selanjutnya juga tabel menunjukkan titik-titik grafik untuk kelompok 2. Ini
jelas bahwa distribusi weibull dengan G = 100 dan   3 ,

ˆ1   4,51  10 7  3 , ˆ2   2,38  10 7  3


1 1

menepatkan waktu bebas


zat kanker untuk dua kelompok tikus dengan baik.

time r n–r nr Estimasi Ŝ  t 


n  r 1 Kaplan- dihasilkan
Meier, distribusi
Ŝ  t  weibull
142 1 21 0,9524 0,9524 0,9825

49
156 2 20 0,9500 0,9048 0,9590
163 3 19 0,9474 0,8572 0,9421
198 4 18 0,9444 0,8095 0,7990
204+ - 17 1,0000 0,8095 0,7647
205 6 16 0,9375 0,7589 0,7588
232 7 15 0,9333 0,7083 0,5778
232 8 14 0,9286 0,6577 0,5778
233 9 13 0,9231 0,6071 0,5706
233 10 12 0,9167 0,5565 0,5706
233 11 11 0,9091 0,5059 0,5706
233 12 10 0,9000 0,4553 0,5706
239 13 9 0,8888 0,4047 0,5271
240 14 8 0,8750 0,3541 0,5198
261 15 7 0,8571 0,3035 0,3697
280 16 6 0,8333 0,2529 0,2489
280 17 5 0,8000 0,2023 0,2489
296 18 4 0,7500 0,1517 0,1660
296 19 3 0,6667 0,1011 0,1660
323 20 2 0,5000 0,0506 0,0710
344+ - 1 1,0000 0,0506 0,0313

3.3 Distribusi Lognormal


Dalam bentuk distribusi lognormal yang paling sederhana dapat
didefinisikan sebagai distribusi dari variabel yang logaritmanya mengikuti
distribusi normal. Sebagian besar aspek dibahwa kajian Gaddum (1945a,b)
telah memberikan gambaran aplikasinya dalam biologi, Boag’s (1949)
mengaplikasikan dalam penyakit kanker. Sejarah, sifat, dan permasalahan
estimasi juga penggunaan dalam ekonomi telah didiskusikan secara detail
oleh Aitchison dan Brown (1957). Sebelumnya peneliti lain juga telah
mengobservasi bahwa pada usia terserang penyakit Alzheimer dan leukemia
akut dapat secara dekat dihampiri oleh distribusi lognormal karena dengan
jelas miring kekanan dan logaritma waktu survival menghampiri distribusi
normal.

50
Pertimbangkan waktu survival T sedemikian hingga log T adalah
didistribusikan secara normal dengan rata-rata
 dan variansi  .
2

Kemudian kita mengatakan bahwa T terdistribusikan secara normal dan kita


 
tulis T seperti   ,  , ini harus dicatat bahwa
2
 dan  adalah
2

tidak rata-rata dan variansi dari distribusi lognormal. Gambar berikut


memberikan gambar fungsi bahaya dari distribusi lognormal dengan nilai
yang berbeda untuk parameter. Fungsi bahaya meningkat pada awalnya
menuju pada sebuah keadaan maksimum dan kemudian menurun hingga
menuju nol sampai waktu mendekati tak hingga (Watson dan Wells tahun
1961). Oleh sebab itu, distribusi lognormal cocok untuk pola survival
dengan fungsi bahaya awal yang meningkat dan kemudian turun.. Dengan
teorema limit memusat, dapat ditunjukkan bahwa distribusi dari perkalian
perkalian n variat saling bebas menghampiri distribusi normal dibawah
kondisi yang sangat umum. Sebagai contoh, distribusi dari ukuran
organisme yang tumbuh adalah subjek untuk beberapa dorongan gerak hati
yang kecil, pengaruh setiapnya adalah proporsi terhadap ukuran sementara
organisme.
Kepopuleran dari distribusi lognormal adalah pada bagian kenyataan bahwa
nilai komulatif y = log t dapat dihasilkan dari tabel distribusi normal baku
dan menghubungkan nilai t kemudian tentukan antilognya. Sehingga
presentile dari distribusi
lognormal dengan mudah ditemukan.

h(t)

  0,   0.3
1.6

1.4   0,   0.1

1.2
  0.3,   1.0
1.0
51
  1,   1
0.8

0.6

0.4

0.2
0 1 2 3 4 5 t

Fungsi densitas peluang dan fungsi keselamatan secara berturut-turut adalah


 1
f t 
1
eksp   log t    2  t  0,   2
 2
2
t 2 

1 1  1 
St   xeksp 2  log x   
2

 2
2  dx
t

Misal a  eksp    , maka    log a , bentuk di atas dapat ditulis


kembali sebagai

f t 
1
eksp 
1
 log at  2 
t 2  2
2

x
1 1  1 
St   xeksp  2  log ax 
2

 2 2  dx
t

 at 
 1  G log 
  

Dimana G(y) adalah distribusi fungsi kumulatif dari variabel normal baku.

y
1
G y   e
u 2 2
du
2 0

52
Distribusi lognormal ditentukan dengan lengkap dengan dua parameter
 dan  2 . Waktu T tidak bisa diasumsikan bernilai 0 karena log T tidak
dapat didefinisikan T = 0. Gambar berikut memberikan kurva frekuensi
lognormal untuk   0,   0.1,0.5,2
2

f(t)

1.0
0.8
 0
0.6
0.4   0 .5
 1
0.2

0 1 2 3 4 t

Jelas bahwa distribusi kemiringan positif dan bahwa semakin besar nilai
dari  akan semakin besar kemiringannya.Fungi bahaya dapat diturunkan
2

dari fungsi densitas peluang dan fungsi keselamatan yang telah ditentukan
di atas seperti berikut

h t  
1 t  
2 eksp   log at 
2
2 2 
1  G  log at  

Rata-rata dan variansi dari distribusi lognormal secara berturut-turut adalah


 1 
   
eksp    2  dan eksp  2  1 eksp 2    2
2
 
sebagai berikut,   .
Selanjutnya nilai median dari distribusi lognormal adalah

53
e

Dan nilai modus adalah


eksp    2 
3.4 Gamma Dan Distribusi Gamma Yang Dibangkitkan
Distribusi gamma yang termasuk kedalam distribusi chi-kuadrat dan
eksponensial, telah digunakan sejak lama oleh Brown dan Flood (1947)
untuk menggambarkan kehidupan sirkulasi gelas yang beredar pada
kafetaria dan Birnbaum dan Saunders (1958) memodelkan secara
berstatistik untuk lama waktu hidup material. Semenjak kasus ini distribusi
gamma telah digunakan lebih sering untuk memodelkan permasalahan
relabilitas industri dan lama hidup (survival) manusia.
Andaikan bahwa kegagalan atau kematian mangambil tempat dalam n
tahapan atau n sesegera mungkin sub bagian kegagalannya telah terjadi.
Pada akhir bagian tahapan pertama, setelah waktu T 1, terjadinya sub
kegagalan pertama setelah tahap kedua dimulai dan sub kegagalan kedua
terjadi Setelah waktu T 2 dan begitu seterusnya. Total kegagalan atau
kematian pada akhir tahapan ke-n, ketika sub kegagalan ke-n telah terjadi.
Waktu survival T adalah T1 + T2 + … + Tn, Waktu T1,T2,…,Tn yang
dihabiskan dalam setiap tahapan diasumsikan bebas secara distribusi
eksponensial dengan fungsi densitas peluang
 eksp  t i  , i  1,2,  , n. Jadi sub kegagalan terjadi secara bebas
pada sebuah nilai konstan  . Distribusi T selanjutnya akan disebut
berdistribusi erlang. Tidak diperlukan untuk tahapan mempunyai sifat yang
signifikan karena kita selalu dapat mengasumsikan terjadinya kematian
dalam n proses tahapan telah digambarkan. Ide ini telah diperkenalkan oleh
A. K Erlang dalam kajiannya kebuntuan dalam sistem telephon, dan telah
digunakan secara meluas dalam teori antrian dan proses kehidupan.
Pembangkit alamiah dari distribusi erlang adalah menukarkan n parameter
yang dibatasi bilangan bulat 1,2,… dengan parameter
 mengambil nilai
positif real. Kemudian selanjutnya akan menghasilkan distribusi gamma.
Distribusi gamma disifati oleh dua parameter yaitu  dan  . Ketika
0    1 , terdapat nilai bahaya yang menurun secara monoton dari tak
terhingga hingga  seiring dengan meningkatnya dari 0 hingga ke tak
hingga. Ketika   1 terdapat nilai bahaya yang meningkat sedara

54
monoton dari 0 hingga  seiring dengan meningkatnya waktu dari 0
hingga ke tak hingga. Ketika   1 nilai bahaya sama dengan  sebuah
konstan seperti pada kasus eksponensial. Gambar berikut mengilustrasikan
fungsi bahaya gamma untuk   1 dan   1,   1,2,4 sehingga
distribusi gamma menggambarkan sebuah tipe yang berbeda dari pola
survival dimana nilai bahaya menurun atau meningkat pada sebuah nilai
konstan seiring dengan waktu yang mendekati tak hingga

h(t)

2
 1

1  1
 2  4

0 t

55
Fungsi densitas peluang dari distribusi gamma adalah

1
f t   t   1 e  t t  0,   0,   0
  

Dimana


    x
 1
e  x dx
0

    1 ! ketika  adalah bilangan bulat positif

Gambar berikut menunjukkan bahwa fungsi densitas gamma dengan nilai


 dan  yang bervariasi. Ini kelihatan bahwa bermacam-macam 
merubah bentuk distribusi sedangkan bermacam-macam  hanya akan
merubah skala. Konsekuensinya  dan  parameter bentuk dan skala.
Ketika   1 terdapat puncak tunggal pada

t
   1

f(t)

1.0
 1

0.5  2
 4

0 1 2 3 4 5 6 7 8 t

56
Distribusi fungsi kumulatif (F) mempunyai bentuk komplek :

t

Ft        x 
 1
e x dx
0
t
1
u
 1
 e u du
   0

 I  t ,  
Dimana

s
1
I  S,  
   0
u  1e u du

Disebut sebagai fungsi gamma yang tidak sempurna. Untuk distribusi


erlangian dapat ditunjukkan bahwa

e  t 
n 1  t k
 
F t  1 
k 0 k!

Sehingga fungsi selamat untuk distribusi gamma 1 – F(t) adalah



St        x 
 1
e  x dx
t

Atau untuk distribusi erlang adalah

n 1
S  t   e t 
 t  k
k 0 k!

Seterusnya untuk fungsi bahaya adalah

57
  t 
n 1
h t   n 1
 n  1!  1  t  k
k  0  k! 

ESTIMASI PARAMETER DISTRIBUSI SURVIVAL PARAMETRIK

Pada bab ini akan diperkenalkan beberapa proses analitik untuk


mengestimasi parameter distribusi survival yang sangat lazim digunakan,
kita akan mendiskusikan Estimasi Maksimum Likelihood yang merupakan
cara yang paling sering digunakan untuk tujuan ini. Cara ini tidak dapat
dipisahkan dengan pengetahuan tentang analisis numeric. Analisis numeric
biasanya merupakan suatu metode yang digunakan untuk mendapatkan
solusi dari suatu persamaan yang tidak linier, pada umumnya para ahli
statistik lebih sering menggunakan metoda newton-rhapson untuk tujuan
ini.

4.1 Metoda Newton-Rhapson


Newton-Rhapson adalah suatu proses iterasi yang dilakukan dengan metoda
numerik yang dapat digunakan untuk mencari pemecahan persamaan tidak
linier. Proses iterasi adalah suatu teknik penghampiran yang berulang-ulang
dimana setiap pengulangan disebut iterasi. Jika hampiran tadi menghasilkan
suatu pemecahan yang sangat dekat dengan pemecahan persamaan yang
tidak linier tersebut maka iterasi telah mengalami proses konvergen. Pada
bagian ini kita akan mendiskusikan metoda ini untuk persamaan tidak linier

58
dengan variabel tunggal dan persamaan tidak linier bervariabel banyak.
Misal f  x   0 adalah persamaan yang akan ditentukan pemecahannya
untuk x. Metoda Newton-Rhapson secara lazimnya memerlukan nilai awal
dari x yang disimbolkan dengan x̂0 , sedemikian hingga f x̂0 mendekati  
nilai 0, dan kemudian hampiran iterasi pertama adalah

f  xˆ0 
xˆ1  xˆ0 
f '  xˆ0 

dimana f ' xˆ 0  adalah turunan pertama dari f  x  yang diberikan nilai


x  x̂0 . Secara umumnya untuk iterasi hingga ke  k  1 diberikan
seperti

f  xˆ k 
xˆ k 1  xˆ k 
f '  xˆ k 
Pemberhentian proses iterasi ini dapat dilakukan dengan menggunakan
 
ketentuan bahwa nilai f xˆ k atau d  xˆ k  xˆ k 1 kecil dari 10 6 .

Contoh : diberikan fungsi sebagai berikut

f  x   x3  x  2

dapatkan nilai x sedemikian hingga f  x   0 .


Andaikan nilai awal atau x̂0 = -1, dan seterusnya secara berturut-turut

dihasilkan nilai f  xˆ0   2 dan f '  xˆ0   3xˆ02  1  2 selanjutnya


dihasilkan hampiran iterasi pertama seperti

2
xˆ1  1   2
2

59
Secara berurutan dihasilkan nilai f  xˆ1   xˆ13  xˆ1  2  f   2  4 ,
f '  xˆ1   3 xˆ12  1  11 , dan diperoleh hampiran iterasi kedua seperti

4
xˆ 2  2   1.6364
11

sama seperti hampiran iterasi sebelumnya, diperoleh nilai berikut secara


berturut-turut f  xˆ 2   0.7456, f '  xˆ 2   7.0334 , seterusnya
dihasilkan hampiran iterasi ketiga, seperti

0.7456
xˆ3  1.6364   1.5304
7.0334

secara berturut-turut dihasilkan nilai


f  xˆ3   0.054 dan f '  xˆ3   6.0264 , hampiran iterasi keempat
dapat dihasilkan seperti
0.054
xˆ 4  1.5304   1.52144
6.0264
f  xˆ 4   0.00036 , f '  xˆ 4   5.9443

hampiran iterasi kelima dapat dihasilkan seperti

0.00036
xˆ5  1.52144   1.52138
5.9443
f  xˆ5   0.0000017

nilai hampiran iterasi kelima sudah dapat dikatakan bahwa proses iterasi
 
dapat dihentikan karena nilai f xˆ5  0.0000017 telah memenuhi syarat

untuk berhenti seperti yang telah dibahas sebelumnya  f  x   10  .


6

60
Metoda Newton-Rhapson dapat diperluas untuk variabel banyak, missal kita
ingin mendapatkan pemecahan untuk x1 , x2 ,  , x p sedemikian hingga
 
f1 x1 , x2 , , x p  0
f 2  x1 , x2 , , x p   0


f p x1 , x2 , , x p  0 

misal aij adalah turunan parsial dari f i terhadap x j atau dapat ditulis
sebagai aij  f i x j .
Diberikan sebuah matrik

 a11 a12  a1 p 
a a22  a2 p 
J 
21
    
 
a p1 a p2  a pp 

yang disebut dengan matrik Jacobian, dan misalkan invers matrik tersebut
diberi seperti
 b11 b12  b1 p 
b b22  b2 p 

21
J 1
    
 
b1 p b2 p  b pp 

k k k
selanjutnya misal x1 , x2 ,  , x p adalah nilai-nilai hampiran pada iterasi
k k k
ke-k, dan misalkan f1 , f 2 , , f p adalah nilai-nilai yang berhubungan
dengan fungsi f1 , f 2 ,  , f p , yaitu

61

f1k  f1 x1k , x2k ,  , x kp 
f 2k  f x
2
k
1 , x2k , , x 
k
p



f pk  f p x1k , x2k , , x kp 
k
dan misalkan bij adalah elemen dari J 1 yang dihasilkan pada
x1k , x2k ,  , x kp , maka hampiran iterasi selanjutnya secara umum

x1k 1  x1k  b11


k k
 k
f1  b12 f 2k    b1kp f pk 
x2k 1  x2k  b k
21 f1
k k
 b22 f 2k    b2k p f pk 


x kp 1  x kp  b pk1 f1k  b pk 2 f 2k    b kpp f pk 
Proses itersi dimulai dengan penentuan nilai-nilai awal pada variabel
banyak tersebut.
Contoh : Andaikan dua variabel berturut-turut x1 dan x 2 pada
persamaan-persamaan berikut akan dicari penyelesaiannya

x12  x1 x2  2 x1  1  0 dan x13  x1  x2  2  0


pada contoh ini akan dimisalkan bahwa

f1  x12  x1 x2  2 x1  1 dan f 2  x13  x1  x2  2

diberikan nilai awal berturut-turut untuk x1 dan x 2 yaitu


x10  0 dan x20  1 , selanjutnya akan diperoleh nilai f10 dan f 20
seperti berikut

62
   
f10  f10 x10 , x20  x10
2
 x10 x20  2 x10  1  1
f 20  f 20 x , x   x 
0
1
0
2
0 3
1  x10  x20  2  1

selanjutnya dapatkan setiap turunan parsial berikut

f1
 2 x1  x2  2
x1
f1
 x1
x 2
f 2
 3 x12  1
x1
f 2
1
x 2

matrik Jacobian akan didapati seperti

2 x  x  2 x1 
J  1 2 2 
 3 x1  1 1

dengan menggunakan nilai awal yang diberikan maka matrik jacobian dan
inversnya dapat dihasilkan seperti

 1 0 1  1 0
J   dan J  
  1 1   1 1
hampiran iterasi pertama dapat diperoleh seperti

x11  0     1  1  0  1   1
x12  1     1  1  1  1   1

63
dengan nilai di atas didapati nilai f11  1 dan f 21  1 , selanjutnya nilai
pada iterasi pertama ini juga dapat menghasilkan nilai matriks jacobian dan
invers matrik tersebut seperti

 3  1  1  1
J   dan J 1  
 2 1 2 3 

hampiran iterasi kedua dapat dihasilkan seperti

x12  1     11    1  1   1


x22  1    2 1   3  1   2

dengan nilai hampiran pada iterasi kedua ini diperolehi nilai


f12  0 dan f 22  0 , hal ini dapat diartikan bahwa proses hampiran iterasi
telah selesai pada iterasi kedua, dan nilai pemecahan untuk variabel di atas
adalah 1 dan 2.

4.2 Maksimum Log Like-Lihood


Misal y1 , y 2 , , y n adalah sampel yang diambil dari variabel acak yang
berhubungan dengan Y1 , Y2 , , Yn dimana distribusinya bergantung
pada parameter  , maka jika Y1 , Y2 , , Yn adalah variabel acak

kontinu, like-lihood L y1 , y 2 , , y n   definisikan sebagai densitas
bersama pada y1 , y 2 , , y n , sehingga dapat ditulis seperti

L y1 , y 2 , , y n    f  y1 , y 2 , , y n  
 f  y1    f  y 2      f  y n  
Untuk penyederhanaan notasi like-lihood dapat ditulis sebagai L  .
Contoh : Misal Y1 , Y2 , , Yn adalah sampel acak dimana Yi memiliki
fungsi densitas peluang seperti

64
 1   yi 
 e , 0 y
f  y     
 0, untuk yang lainnya

Like-lihood dapat ditentukan dengan cara berikut

L y1 , y 2 , , y n    f  y1 , y 2 , , y n  
 f  y1    f  y 2      f  y n  

e  y1  e  y2 
e  yn
   
  
e  i
 y 
e  ny 
 
n n

Fungsi like lihood L  ; y  yang berhubungan dengan vektor acak y,


sehingga mengakibatkan L menjadi variabel acak. Misal  adalah notasi
himpunan seluruh nilai yang berkemungkinan dari  , sehingga 
disebut dengan ruang parameter. Estimator maksimum like lihood dari 
adalah ˆ yang memaksimumkan fungsi like lihood, sehingga

 
L ˆ; y  L ; y  untuk setiap  didalam 

Secara ekivalen ˆ adalah nilai yang memaksimumkan fungsi log-like


lihood yang dinotasikan sebagai l  ; y   log L , y  , karena logaritma
adalah fungsi yang monoton. Sehingga dapat dinyatakan

 
l ˆ; y  l  ; y  untuk semua  didalam 
Sering sekali lebih mudah untuk bekerja dalam logaritma dari pada fungsi
like lihood itu sendiri. Biasanya estimator ˆ dihasilkan dengan
menurunkan fungsi log-like lihood terhadap elemen  j dari  dan
mencari penyelesaian persamaan simultan berikut
65
l  ; y 
0 untuk j  1,2,  , p
 j

Contoh : Misal Y1 , Y2 , , Yn adalah variabel acak yang terdistribusi


secara normal dengan rata-rata  dan variansi  2 , maka untuk
mendapatkan maksimum log like-lihood dapat dilakukan dengan cara

   
L  ,  2  f y1 , y 2 , , y n  ,  2
 f  y  ,   f  y  ,     f  y
1
2
2
2
n  , 2 
 1    y1    2    1    y n    2  
 exp 2       exp  2 
 2  2    2  2  
 1 
n2  1 n 
 
 2 2 
exp 2
 2
 y  
i 1
i
2



Selanjutnya dapatkan nilai logaritma asli dari like-lihood yang diperoleh di


atas seperti

 
n
n n 1
l  ln L  ,  2  
2
ln  2  ln 2 
2 2 2
 yi 1
i  2

Selanjutnya untuk menentukan maksimum log like-lihood dapat dilakukan


dengan mengambil turunan parsial dari fungsi log like-lihood terhadap 
dan  2 seperti

66
n
l 1
 2
   yi 1
i    0

y
i 1
i  n  0

n
1
ˆ 
n y
i 1
i y

n
l  n  1  1
 2
   2  
 2    2 4
 y
i 1
i  2  0

n
1
2 
n  y
i 1
i  y2

Oleh sebab itu y dan s 2 adalah estimator maksimum log like-lihood


terbaik untuk  dan  2 pada distribusi normal.

4.3 Metoda Grafik Untuk Mengestimasi Nilai Awal Parameter


Metoda grafik sangat sederhana dan yang paling sering digunakan oleh ahli
statistik untuk mendapatkan nilai awal dalam mengestimasi parameter yang
tepat dari suatu distribusi tertentu. Metoda ini sangat membantu untuk
mendapatkan nilai awal suatu parameter distribusi tertentu, bila nilai
estimasi parameter akan ditentukan secara bernumerik. Metoda grafik ini
dapat dilakukan dengan tahapan berikut :
1. Dapatkan fungsi densitas peluang
2. sampel dari distribusi kumulatif diestimasi dengan

i  0.5
, i  1,2, , n
n

Untuk sampel yang telah diurutkan dari kecil kebesa, untuk data kembar
Gunakan i (rangking terbesar setelah data diurutkan)
3. Gambarkan grafik dari data melawan fungsi distribusi kumulatif untuk
Sampel yang telah diestimasi
4. Grafik yang tergambar seperti garis lurus (fungsi linier) dapat digunakan
67
Untuk mendapatkan nilai parameter awal dengan menggunakan metoda
Kuadrat terkecil.
Contoh : Diberikan 21 data seperti 1 ,1 ,2 ,2 ,3 ,4 ,4 ,5 ,5 ,6 ,8 ,8 ,9 ,10 ,10 ,
12, 14,16,20,24,dan 34 yang terdistribusi dengan fungsi densitas peluang
seperti


f  y    y  1 exp   y   
Untuk menggunakan metoda grafik perlu dihasilkan fungsi distribusi
kumulatif seperti

F  y   1  e   y 

Selanjutnya dengan teknik aljabar sederhana, rubahlah bentuk fungsi diatas


sehingga menjadi suatu bentuk fungsi liner seperti

F  y   1  e   y 

e   y   1  F  y 

log e   y    log1  F  y  

 
1 1  1 
log y  log  log log 
   1  F  y  

i  0. 5
Dengan menggunakan hampiran nilai F  y  , dan
n
mengandaikan bahwa
1 1  1 
t  log y , a  log ,b
, dan s  log log  dan akan
   1 F  y 
diperoleh suatu bentuk persamaan regresi linier sederhana seperti
t  a  bs
Dengan menerapkan metoda kuadrat terkecil akan dapat diperoleh nilai a
dan b, seperti

68
n

s
i 1
i  s   ti  t 
b n

s
i 1
i  s2

a  t  bs

Dari data yang telah diberikan di atas, selanjutnya akan ditentukan nilai
awal parameter dengan terlebih dahulu merancang suatu table yang dapat
memudahkan dalam menyelesaikan hal ini, tabel terdiri dari empat kolom
tabel pertama berisikan data yang telah diambil logaritma asli serta telah
diurutkan dari kecil kebesar, tabel kedua berisikan rengking (i) data
tersebut, 1 untuk data yang terkecil dan terus diurutkan hingga data terbesar,
i  0.5
selanjutnya kolom ketiga berisikan nilai Fi  , dan tabel terakhir
n

 1 
berisikan nilai log log  , tabel berikut dapat dilihat seperti
 1  Fi 
Log t i Fi  1 
log log 
 1  Fi 
0.0000000 1
0.0000000 2 0.07142857 -2.60223217
0.6931472 3
0.6931472 4 0.16666667 -1.70198336
1.0986123 5 0.21428571 -1.42228614
1.3862944 6
1.3862944 7 0.30952381 -0.99324254
1.6094379 8
1.6094379 9 0.40476190 -0.65624879
1.7917595 10 0.45238095 -0.50720651
2.0794415 11
2.0794415 12 0.54761905 -0.23164126
2.1972246 13 0.59523810 -0.10042132
2.3025851 14

69
2.3025851 15 0.69047619 0.15932606
2.4849066 16 0.73809524 0.29250120
2.6390573 17 0.78571429 0.43207136
2.7725887 18 0.83333333 0.58319808
2.9957323 19 0.88095238 0.75529145
3.1780538 20 0.92857143 0.97042178
3.5263605 21 0.97619048 1.31846232

Dari tabel di atas dapat dilihat beberapa baris yang kosong, hal ini
dikarenakan bahwa untuk data yang kembar, maka cukup diambil data pada
rangking atau urutan data yang terbesar. Selanjutnya untuk melihat apakan
rumus regresi linier sederhana dapat digunakan pada kasus ini, perlu
terlebih dahulu dilihat grafik yang memasangkan antara log (data) dan nilai
 1 
log log  , dari grafik yang dihasilkan menghampiri suatu garis
 1  Fi 
lurus, maka rumus regresi linier sederhana (metoda kuarat terkecil) yang
telah ditentukan di atas dapat digunakan pada contoh ini, selanjutnya akan
digambarkan grafik seperti

70
Dari grafik di atas sangat terlihat jelas bahwa telah berhasil ditemukan suatu
hampiran garis lurus pada kasus ini. Hal ini mengakibatkan bahwa rumus
regresi linier sederhana untuk mendapatkan nilai a dan b dapat diterapkan
pada contoh soal ini. Selanjutnya nilai awal dapat dihasilkan seperti berikut

s
i 1
i  s   ti  t 
b n

s
i 1
i  s2

 0.769
a  t  bs
 2,283

Sehingga nilai parameter awal adalah

1
a  log

1 1
 exp a      0.1020085
 exp a 
1 1
b      1.299709
 b

Parameter sebenarnya yang diinginka dalam contoh kasus di atas, dapat


ditentukan dengan menggunakan cara bernumerik, salah satu diantaranya
adalah dengan menggunakan metoda newtoh-rhapson, pertama yang perlu
dilakukan dalam hal ini adalah mendapatkan fungsi like-lihood pada fungsi
densitas peluang yang diberikan pada contoh di atas, seperti

71
L y1 , y 2 , , y n    f  y1 , y 2 , , y n  
 f  y1    f  y 2      f  y n  
 
  y1 1 exp   y1       y n 1 exp   y n    
n n
  n n i 1
yi 1 exp    y  
i 1
i

Selanjutnya dapatkan log like-lihood untuk fungsi di atas, seperti

    1 log y 
n
l   ,    log L  n log   n log   i   yi
i 1

Selanjutnya dapatkan dua fungsi yang homogen, seperti yang terdapat pada
contoh sebelumnya dipembahasan newton-rhapson, dengan cara mencari
turunan parsial pada fungsi log-lihood terhadap dua parameter yang
dimilikinya, seperti

l   ,  
n


 n    y
i 1
i 0  f 1

l   ,   n
n n


  n log  
 
i 1
log yi    y   log   log y   0 
i 1
i i f  2

Seperti pada contoh sebelumnya selanjutnya dapatkan matriks jacobian


seperti

72
 f1 f1 
   
J  
 f 2 f 2 
   
n
f1
 
  1 yi  -287.4726
i 1
n n
f1
 
  log   yi  
i 1
 y log y   113.1101
i 1
i i

yi
n n
f 2 n
  i 1

   1 yi  log   log yi    
i 1

 42.38152

n
f 2 n
 

  2   log   yi  log   log yi 
i 1
n
   y  log y  log   log y   48.34
i 1
i i i

Selanjutnya dengan data yang ada pada contoh soal dan nilai-nilai awal
yang telah diperoleh akan dapat menghasilkan suatu matriks jacobian
seperti

 287.4726 113 .1101


J 
 42.38 48.34 

Selanjutnya dapatkan invers dari matrik Jacobian, seperti

 0.00258 0.0061
J 1  
 0.0023 0.0154

Selanjutnya untuk hampiran iterasi pertama, terlebih dahulu perlu


ditentukan nilai f1 dan f2 untuk nilai awal yang diperlukan, berturut-turut
-1.573 dan -2.998, dan hampiran iterasi pertama dapat dihasilkan seperti

73
ˆ1  0.102    0.0025  1.573   0.0061 1.573   0.107
ˆ1  1.299   0.0022  2.998   0.0153  2.998   1.351

Untuk hampiran iterasi kedua, dengan cara yang sama, tetapi nilai awal
yang digunakan adalah nilai yang diperoleh pada iterasi pertama, seperti

 f1 f1 
   
J  
 f 2 f 2 
   
n
f1
 
  1 yi  -311.3598
i 1
n n
f1
 
  log   yi  
i 1
 y  log y   122.9703
i 1
i i

yi
n n
f 2 n
  i 1

   1 yi  log   log yi    
i 1
 15.0412

n
f 2 n
 

  2   log   yi  log   log yi 
i 1
n
   y  log y  log   log y   63.082
i 1
i i i

Berikutnya dapatkan matriks jacobian seperti

 311 .3598 122.9703


J 
  15.0412 63.0824 

Dan invers dari matrik di atas adalah

 0.00354 0.00691
J 1  
 0.00084 0.0175 
74
Selanjutnya nilai untuk f1 dan f2 berturut-turut -3.659 dan -5.307, sehingga
nilai hampiran untuk iterasi kedua adalah

ˆ2  0.107    0.00354 3.6598   0.00691 3.6598   0.1073277


ˆ 2  1.351    0.000845 5.307544   0.0175  5.307544   1.439

Hampiran iterasi ini dapat diteruskan hingga , masing-masing parameter


memberikan selisih yang cukup kecil terhadap parameter sebelumnya.

75
PERKENALAN TERHADAP SOFTWARE R

Software R adalah salah satu alat bantu yang sering digunakan oleh ahli
statistik dalam melakukan penyelidikan. Keutamaan R adalah
kemampuannya dalam merancang bahasa program sesuai dengan keperluan
para peneliti. Software R juga dilengkapi dengan tool-tool yang secara
langsung dapat digunakan untuk mencari nilai-nilai statistik yang standar,
seperti statistik infrensi, regresi, anova, dan alat uji statistik lainnya.
Tampilan awal Software R dapat ditunjukkan seperti berikut.

Menjalankan alat bantu R, pada dasarnya sangat sederhana sekali, seperti


dalam tampilan berikut

76
Untuk pembuatan matrix dalam R, dapat dilakukan seperti

Operasi matrix seperti invers dapat diselesaikan dengan menggunakan


bahasa solve, perkalian matrik dapat digunakan dengan menggunakan
symbol %*%, determinan dapat digunakan bahasa det, nilai eigen dapat

77
digunakan dengan bahasa eigen, dan penjumlahan dengan pengurangan
dapat dilakukan dengan cara sederhana seperti

Operasi turunan parsial dapat diselesaikan dengan menggunakan bahasa R,


seperti

78
Bahasa R dapat digunakan untuk merancang program tersendiri, hal ini
tentu saja bergantung kepada penelitian yang digunakan, untuk melakukan
ini, perlu terlebih dahulu layar baru dibuka seperti

79
Selanjutnya untuk menjalankan program yang telah dibuat, perlu diklik,
menu run and selection seperti

Contoh bahasa pemograman sederhana, misal diberi data pada contoh soal
di atas, akan ditentukan statistic inferensi yang diperlukan seperti rata-rata,
variansi dan simpangan baku seperti berikut

80
Terlihat bahwa untuk data yang berubah-ubah dapat digunakan program
yang telah dibuat sebelumnya.

81
82
Daftar Pustaka

Carnahan, B., Luther, H. A., and Wilkes, J.O. (1969) Applied Numerical
Methods. Wiley. New York
Lee. T. Elisa.,Wang Wenyu Jhon. ( 2003) . Statistical Methods For
Survival Data Analysis, Wiley, New York
McCracken, D. D., and Dorn, W. S. (1964). Numerical Methods and
Fortran Programming. Wiley. New York
Maindonald, J., Braun, J ., (2003). Data Analysis and Graphics Using R –
an Example Based Approach. Cambridge University Press, New York
Neter,J.,Wasserman, W. (1974). Applied Linier Statistical Models. Richard.
D. Irwin, HomeWood, IL.

83
Biografi Penulis

Penulis Kelahiran Muaramahat 15 November


1975 ini bernama Rado Yendra, merupakan
dosen pada Jurusan Matematika Fakultas Sains
Dan Teknologi. Penulis menyelesaikan S1 nya
pada jurusan matematika pada fakultas
matematika dan ilmu pengetahuan alam di
Universitas Riau pada tahun 1999 kemudian
dengan bekal yang tak terlalu banyak dengan semangat yang membara
penulis berhasil meraih gelar master dalam bidang statistika di Universitas
Kebangsaan Malaysia pada tahun 2006. Sebelumnya penulis mengawali
pendidikan dengan Sekolah Dasar yang berada di Pekanbaru pada tahun
1982 pada Sekolah dasar Seruni, selanjutnya pada tahun 1988 penulis
melanjutkan pada sekolah menengah negeri 5 yang ada di Pekanbaru,
bermodalkan nilai yang sangat baik yang diperoleh pada sekolah menengah
tersebut penulis memberanikan diri untuk melanjutkan pada salah satu
sekolah menengah atas yang paling populer di Pekanbaru yaitu Sekolah
Menengah Atas Negeri 1 pada tahun 1991. Penulis pada saat ini selain aktif
dalam mengajar pada jurusannya juga aktif dalam berbagai seminar
penelitian dibidang matematika dan statistika baik tingkat nasional maupun
internasional. Selain itu penelitian-penelitian penulis tidak hanya pada
bidang keilmuannya juga penulis juga terlibat dalam penelitian-penelitian
dibidang sosial dan ilmu agama. Penulis yang sekarang tinggal di
Pekanbaru dengan alamat jalan Hang Jebat Gang Puskesmas no 53 juga
merupakan dosen aktif di Sekolah Tinggi Ilmu Ekonomi (STIE)
Bangkinang dengan keahlian dibidang statistika Ekonomi.

84
ANALISIS SURVIVAL
DAN PROGRAM R

85
RADO YENDRA

KATA PENGANTAR

Seiring dengan majunya ilmu pengetahuan dewasa ini, diperlukan adanya


berbagai sumber ilmu yang dapat membantu mahasiswa untuk memudahkan
dalam memahami ilmu pengatahuan tersebut. Salah satu penyebab
terjadinya kesulitan mahasiswa dalam memahami perkuliahan mata kuliah
eksak adalah kurangnya sumber bacaan yang berbahasa Indonesia, untuk itu

86
diperlukan ide kreatif dari tenaga pengajar untuk dapat menerbitkan BUKU-
BUKU perkuliahan yang bermutu dengan menggunakan bahasa Indonesia.
Salah satu cara yang termudah dalam menghasilkan buku ini adalah dengan
menghasilkan buku-buku yang berasal dari beberapa sumber bacaan yang
berbahasa inggris dan diartikan kedalam bahasa Indonesia, hal ini tentu
akan lebih efektif dan dapat menjamin bahwa modul yang dihasilkan dapat
dipertanggung jawabkan isi kandungan modul tersebut. Untuk menjawab
tantangan di atas, maka analisis survival dan program R ini dibuat
berdasarkan beberapa sumber bacaan yang berbahasa Inggris diantaranya
1. Maths & Stats - Statistical Methods for Survival Data Analysis - 3rd,2003
[Wiley]
2. Survival Analysis - A Practical Approach
3. Medical Statistics A Guide to Data Analysis and Critical Appraisal
4. Using and Understanding Medical Statistics
5. R Book
Akhirnya penulis berharap bahwa buku ini dapat meningkatkan motivasi
mahsiswa untuk mengikuti perkuliahan analisis survival. Kritikan dari rekan
seperjuangan yang sangat membangun sangat diharapkan untuk perbaikan
buku ini kedepannya. Terimakasih yang sebesar-besarnya penulis
sampaikan pada Dekan Fakultas Sains dan Teknologi atas izin dan sumber
keuangan yang telah diberikan, tak lupa pada gangguan dari jagoan kecilku
Faris Raza Alim Sayendra dan bundanya yang menjadikan pembuatan buku
ini lebih bermakna.

DAFTAR ISI :

KATA PENGANTAR
1. PENDAHULUAN ANALISIS SURVIVAL ………………………1
2. METODA NON PARAMETRIK MENGESTIMASI FUNGSI
SURVIVAL………………………………………………………..13

87
3. BEBERAPA DISTRIBUSI SURVIVAL PARAMETRIK DAN
APLIKASINYA…………………………………………………....40
4 ESTIMASI PARAMETER DISTRIBUSI SURVIVAL
PARAMETRIK……………………………………………………59
5. PERKENALAN TERHADAP SOFTWARE R……………………76

88

Anda mungkin juga menyukai