Anda di halaman 1dari 32

Definisi 1 :

Data survival adalah lama waktu sampai suatu peristiwa


terjadi atau data antar kejadian (time-to-event data).
Istilah-istilah yang digunakan untuk data survival :
a. Data durasi (durational data) di bidang ekonomi;
b. Data waktu kerusakan (failure time data) di bidang ilmu
perekayasaan;
c. Event history data dalam ilmu sosial
 Data survival banyak digunakan dalam bidang ilmu
kesehatan, lingkungan, epidemiologi, demografi dan
aktuaria.
1
 Untuk memperoleh data survival, diperlukan tiga
komponen yang harus terdefinisikan dengan jelas terkait
fenomena yang menjadi perhatian, yaitu
(1). Definisi event (peristiwa) yang menjadi perhatian;

(2). Titik asal (origin) yang digunakan untuk mengukur


lama waktu sampai suatu event terjadi;
(3). Unit pengukuran yang digunakan (jam, hari, bln, th dll)
2
Contoh :
 Misalkan fenomena yang menjadi perhatian adalah
mortalitas. Dalam contoh ini event didefinisikan
sebagai saat meninggalnya seseorang, apabila
ditentukan sebagai origin adalah saat kelahiran, maka
data survivalnya adalah usia kematian, misalnya dalam
satuan tahun.

 Tidak selalu event yang menjadi perhatian adalah


sesuatu yang terminate, yaitu event yang hanya sekali
saja terjadi dan berhenti, seperti misalnya kematian.
Event juga dapat berupa status (state) yang lebih
umum, seperti misalnya status sakit, status pekerjaan,
dst.
3
Contoh :
 Misalkan data survival yang menjadi perhatian adalah
lama waktu mulai terapi pertama kali diberikan kepada
penderita leukemia sampai kambuh kembali, dalam
satuan minggu. Dalam contoh ini event dapat berulang
(kambuh) dan bukan sesuatu yang berhenti dan hanya
sekali terjadi.
 Data survival sering diilustrasikan seperti gambar
batang ”korek api” (Gambar 1.1) dengan bulatan hitam
adalah event dan garis lurus horizontal adalah lama
waktu sampai terjadinya event. Apabila event
dipandang sebagai status (state) yang berubah
menurut waktu, dan kadang melibatkan lebih dari satu
status, maka dapat digunakan representasi data
survival seperti pada Gambar 1.2.

4
 Dalam pengembangannya data survival dapat memuat
informasi lebih dari satu status, sehingga gambaran
status yang berbeda terhadap berubahnya waktu dapat
ditunjukkan dari sumbu Y (sumbu vertikal) yang
nilainya berbeda, atau dari jenis garis horizontalnya,
misalnya garis biasa, garis tebal, dan seterusnya.

5
.

6
 Data survival merupakan realisasi dari suatu variabel
random survival, yaitu suatu variabel random non-
negatif T, yang menjadi dasar pembentukan model dan
metode dalam analisis data survival. Untuk menuliskan
suatu nilai T tertentu digunakan lambang t. Misalkan T
adalah lama waktu sampai seorang pasien leukemia
kambuh kembali (Contoh 1.2), maka pernyataan ”lama
waktu kambuh kembali lebih dari 5 minggu” dapat
dituliskan sebagai T > 5. Pada bahasan berikutnya akan
dibahas lebih lanjut beberapa macam fungsi terkait
variabel random T ini.

7
 Salah satu masalah yang sering muncul dalam analisis
data survival adalah adanya pengamatan yang tidak
lengkap, yang secara umum dapat dikelompokkan
menjadi data tersensor (censored) dan data terpotong
(truncated).
 Definisi :
Suatu data atau observasi dikatakan tersensor kanan
(right-censored) pada titik k apabila nilai observasi yang
digunakan adalah t jika t ≤ k; atau k jika t > k. Apabila k
ditentukan (fixed), maka observasi dikatakan tersensor Tipe
I; sedangkan bila banyaknya observasi r yang ditentukan
sedemikian sehingga t(1) ≤ t(2) ≤ ... ≤ t(r), maka observasi
tersensor Tipe II.
8
 Tersensor kanan Tipe I, jika waktu tersensornya
ditentukan terlebih dahulu
Contoh :
Data waktu studi mahasisa FMIPA Unmul, dengan
waktu sensor 6 tahun.
Pada kasus ini :
Evennya adalah saat mahasiswa diwusuda menjadi
sarjana; originnya adalah saat mhs regrestasi pertama;
waktu studi adalah waktu studi riil yaitu t
(dengan t < 6), jika masa studi mahasiswa adalah
kurang atau sama dengan 6 th; waktu studi adalah
t= k = 6 jika masa studi mhs lebih dari 6 tahun, yakni
jika t > k = 6 (tersensor)
9
 Tersensor kanan Tipe II, Jika saat tersensornya
ditentukan setelah tercapai persentase atau banyak
sampel tertentu yang telah mendapatkan event.

Contoh :
Berdasarkan contoh sebelumnya, ternyata banyak mhs
yang sudah lulus dengan masa sutudi 5 tahun, sehingga
waktu tersensornya dapat ditentukan, misalnya 5 tahun.
Dalam kasus ini untuk masa studi lebih dari 5 tahun
termasuk data tersensor

10
Definisi :
 Suatu data atau observasi dikatakan terpotong kiri (left-
truncated) pada titik k apabila data hanya menggunakan nilai
observasi t ≥ k.

Contoh
Data terpotong kiri: Suatu studi tentang mortalitas
pegawai pada suatu institusi dilakukan ketika pegawai
telah berusia 40 tahun ke atas. Apabila seorang pegawai
telah meninggal sebelum berusia 40, dia tidak masuk
dalam sampel (lefttruncated).

11
 Definisi :
Suatu data atau observasi dikatakan tersensor kiri (left-
censored) pada titik k apabila nilai observasi yang
digunakan adalah t jika t ≥ k; atau k jika t < k.
 Contoh :
Data tersensor kiri: Data seperti ini biasanya terjadi pada
pengumpulan data yang dilakukan secara retrospektif
atau melihat informasi ke belakang. Suatu studi
dilakukan untuk mengetahui faktor-faktor yang
mempengaruhi usia pertama kali merokok. Apabila
responden ingat usia saat dia pertama kali merokok,
dikatakan observasi yang diperoleh adalah lengkap. Bila
responden tidak ingat kapan dia mulai merokok, tapi
hanya ingat mulai merokok sebelum usia tertentu, maka
dikatakan observasi tersebut tersensor kiri.
12
 Definisi :
Suatu data atau observasi dikatakan terpotong kanan
(right-truncated) pada titik k apabila data hanya
menggunakan nilai observasi t ≤ k.
Contoh :
Data terpotong kanan: Data ini juga biasa terjadi pada
pengumpulan data retrospektif. Suatu studi tentang AIDS
dilakukan secara retrospektif. Yang menjadi perhatian
adalah durasi mulai infeksi HIV sampai terdiagnosis AIDS.
Hanya individu yang telah terdiagnosis AIDS sebelum mulai
studi saja yang akan masuk dalam sampel studi. Individu
yang belum terdiagnosis AIDS tidak masuk dalam studi
adalah sampel yang terpotong kanan, (tidak termasuk
dalam sampel studi)

13
14
15
16
17
.

18
 Observasi tersensor kanan sering dikatakan tersensor
dari atas, karena bagian yang tersensor adalah bagian
paling kini secara kronologis (atas).

 Observasi yang terpotong kanan sering disebut


terpotong dari atas.

 Observasi tersensor kiri dan terpotong kiri sering


disebut tersensor dari bawah dan terpotong dari
bawah, karena bagian yang tersensor atau terpotong
adalah pada bagian awal (bawah).

19
 Penyensoran (censoring) pada suatu pengamatan akan
berakibat ketidaklengkapan informasi lama-waktu atau
durasi pada data yang diperoleh.
 Sedangkan Pemotongan (truncation) akan berakibat
pada terambil atau tidaknya suatu subyek sebagai
sampel, selain ketidaklengkapan informasi pada durasi.
 Pada contoh data terpotong kiri, pegawai yang
meninggal sebelum berusia 40 tahun akan tidak
terambil sebagai sampel. Dengan kata lain, observasi
yang terpotong (meninggal sebelum usia 40)
mempengaruhi keterambilan subyek sebagai sampel.
Akibat yang sama terjadi pula untuk tersensor kanan
dan terpotong kanan.
20
 Diperoleh data dari studi tentang pasien leukemia (Cox and
Oakes, 1984) seperti pada Tabel 1.1. Event yang perhatian
dalam studi ini adalah relapse (kekambuhan kembali) dari 42
pasien leukemia anak-anak yang pada awal studi telah
dianggap sembuh (remission). Pasien mendapatkan
perawatan berupa 6-MP (6-mercaptopurine) dan placebo.

21
 Suatu percobaan dilakukan untuk meneliti pengaruh voltase
terhadap kerusakan suatu alat elektrik (Lawless, 2003). Diperoleh
data seperti pada Tabel 1.2. Dalam penelitian ini semua sampel
diamati sampai semuanya rusak, tidak ada censoring dalam data ini.
Terlihat bahwa semakin tinggi voltase, lama sampai suatu
komponen rusak semakin cepat. Voltase normal untuk komponen ini
adalah 20kV.

22
A. Fungsi Survival
Diketahui T adalah peubah acak survival (kontinu
nonnegatip), fungsi survival S(t) didefinisikan oleh

S (t )  P(T  t ), (1)

dimana t adalah nilai peubah acak survival tertentu. Fungsi


survival S(t) adalah fungsi non-increasing terhadap waktu t,
dengan sifat :
S (0)  1 dan S ()  0
 Fungsi survival dapat diinterpretasikan sebagai proporsi
individu yang hidup dari sekelompok cohort (angkatan). Pada
awal lahirnya cohort tersebut proporsi yang hidup besar
(mendekati satu). Seiring waktu berjalan proporsi yang hidup
dari cohort tersebut akan berkurang sampai akhirnya semua
meninggal (proporsi mendekati nol).
23
. 1

0.9

0.8

0.7

0.6

S(t)=exp(-2t)
S(t)

0.5

0.4

0.3
S(t)=exp(-0.9t)
0.2

0.1

0
0 1 2 3 4 5 6 7
t

24
. 1
Grafik fungsi Survival Weibull Versi skala-bentuk

0.9

0.8
S(t)=exp(-(t/2)3)
0.7

0.6
S(t)

0.5
S(t)=exp(-(t/0.9)2)
0.4

0.3

0.2

0.1

0
0 0.5 1 1.5 2 2.5 3 3.5 4
t (waktu)

25
 Contoh :
Misalkan T adalah lama waktu sampai seorang pasien
leukemia kambuh kembali (dalam satuan minggu),
maka S(5) = P(T > 5) dapat diinterpretasikan sebagai
probabilitas lama waktu kambuh kembali lebih dari 5
minggu. Kalau tidak kambuh dipandang sebagai
”survive”, maka peluang survival nya adalah S(5).

26
 Definisi :
Fungsi distribusi dari peubah acak survival T
didefinisikan oleh
t
F (t )  P (T  t )   f (z)dz , (2)
0
dengan f(t) adalah fungsi kepadatan peluang (FKP).
Bersarkan persamaan (1), fungsi distribusi kumulatif F(t)
dapat dinyatakan dalam fungsi survival, yaitu
F (t )  P(T  t )
 1  P(T  t ) Jadi F (t )  1  S (t ) (3)
 1  S (t )
27
 Definisi :
Fungsi kepadatan peluang (FKP) dari peubah acak
survival T didefinisikan oleh
P (t  T  t  t )
f (t )  lim
t 0 t
dF (t ) (4)

dt
Berdasarkan persamaan (3), FKP dapat didapat dari
hubungan :
dS (t ) (5)
f (t )  
dt
28
 Definisi :
Fungsi hazard (h(t)) dari peubah acak survival T
didefinisikan oleh
P(t  T  t  t | T  t ) (6)
h(t )  lim
t 0 t
 Berdasarkan persaman sebelumnya fungsi hazard dapat
ditentukan melalui hubungan :
f (t ) d (ln( S (t ))
h(t )  atau h(t )   (7)
S (t ) dt

29
 Fungsi hazard h(t) dapat diinterpretasikan sebagai
tingkat (rate) terjadinya suatu event.
6

5 h(t) dari distribusi Weibull dua parameter

4
h(t)

3 h(t) dari distribusi eksponensial

0
0 0.5 1 1.5 2 2.5 3 3.5 4
t
30
 Grafik fungsi hazard distribusi Weibull biasanya
menunjukkan resiko kematian pada makhluk hidup
secara biologis. Semakin tua maka tingkat atau resiko
kematian tinggi.
 Fungsi hazard bukan probabilitas, sehingga
dimungkinkan nilainya lebih dari satu.
 Integral dari fungsi hazard h(t) adalah fungsi hazard
kumulatif
t
H (t )   h( x)dx (8)
0

31
 Berdasarkan persamaan (7) untuk distribusi kontinu
didapat hubungan
d (ln( S (t ))
h(t )  
dt
 Karena S(0) = 1, maka didapat
 t 
S (t )  exp    h( x)dx 
 0 
(9)
 exp[ H (t )]
Atau
H (t )   ln S (t )
32

Anda mungkin juga menyukai