Anda di halaman 1dari 58

Terminologi dan Notasi

T adalah variabel acak untuk waktu kelangsungan hidup seseorang.


Karena T menunjukkan waktu, kemungkinan nilainya mencakup
semua bilangan nonnegative, yaitu, T dapat berupa bilangan apa pun
yang sama dengan atau lebih besar dari nol. Selanjutnya, kami
menyatakan dengan t setiap nilai spesifik tertentu untuk variabel
acak T. Misalnya, jika seorang peneliti tertarik untuk mengevaluasi
apakah seseorang bertahan selama lebih dari 5 tahun setelah
menjalani terapi kanker, t sama dengan 5; T lebih dari 5.
Terminologi dan Notasi
Misalkan d didefinisikan sebagai variabel acak (0,1) yang
menunjukkan kegagalan atau sensor. Artinya, d=(1) untuk kegagalan
jika peristiwa tersebut terjadi selama masa studi, atau d=(0) jika
waktu kelangsungan hidup tersensor pada akhir masa studi.
Perhatikan bahwa jika seseorang tidak gagal, yaitu tidak
mendapatkan kejadian selama masa studi, penyensoran adalah satu-
satunya kemungkinan yang tersisa untuk waktu kelangsungan hidup
orang tersebut. Artinya, d=(0) jika dan hanya jika salah satu dari
berikut ini terjadi: seseorang bertahan sampai studi berakhir,
seseorang mangkir, atau seseorang menundurkan diri selama masa
studi
Selanjutnya memperkenalkan dan menjelaskan dua istilah
kuantitatif yang dipertimbangkan dalam setiap analisis survival.
Ini adalah survivor function, dilambangkan dengan S(t), dan

hazard function, dilambangkan dengan h(t).

survivor function S(t) menunjukkan probabilitas bahwa


seseorang bertahan lebih lama dari waktu tertentu (t). S(t)
memberikan probabilitas bahwa variabel acak T melebihi waktu
tertentu t. survivor function sangat penting untuk analisis
kelangsungan hidup, karena memperoleh probabilitas
kelangsungan hidup untuk nilai t yang berbeda memberikan
informasi ringkasan penting dari data kelangsungan hidup.
Secara teoritis, karena t berkisar dari 0 hingga tak terhingga,
survivor function dapat digambarkan sebagai smooth curva.
Seperti yang diilustrasikan oleh grafik, di mana t
mengidentifikasi sumbu X, semua survivor function memiliki
karakteristik berikut:
a. tidak meningkat yaitu, menuju ke bawah saat t meningkat
b. pada waktu t=0, S(t)=S(0)=1; yaitu, pada awal penelitian,
karena belum ada yang mendapatkan kejadian tersebut,
peluang untuk bertahan melewati waktu 0 adalah satu;
c. pada waktu t=, S(t)=S()=0; yaitu, secara teoritis, jika
masa studi meningkat tanpa batas, akhirnya tidak ada yang
akan survive, sehingga survivor curve akhirnya harus turun
ke nol.
Dalam praktiknya, saat menggunakan data aktual, kita biasanya
memperoleh grafik yang merupakan step function, seperti yang
diilustrasikan di sini, daripada kurva mulus. Apalagi karena masa studi
tidak pernah terbataspanjang dan mungkin ada risiko bersaing untuk
kegagalan, ada kemungkinan bahwa tidak semua orang yang dipelajari
mendapatkan peristiwa tersebut. Taksiran survivor function, yang
dilambangkan dengan tanda topi di atas S dalam grafik, dengan
demikian mungkin tidak sepenuhnya turun ke nol pada akhir
penelitian.
Fungsi hazard, dilambangkan dengan h(t), diberikan oleh rumus: h(t),
ketika t mendekati nol, dari pernyataan probabilitas tentang
kelangsungan hidup, dibagi dengan t , di mana t menunjukkan
interval waktu yang kecil. Rumus matematika ini sulit dijelaskan
secara praktis
Sebelum masuk ke spesifikasi formula, kami memberikan interpretasi
konseptual. Fungsi hazard h(t) memberikan potensi sesaat per satuan
waktu untuk terjadinya peristiwa, mengingat individu tersebut telah
bertahan hingga waktu t. Perhatikan bahwa, berbeda dengan fungsi
survivor, yang berfokus pada tidak gagal, fungsi hazard berfokus pada
kegagalan, yaitu pada peristiwa yang terjadi. Jadi, dalam beberapa
hal, fungsi hazard dapat dianggap memberikan sisi berlawanan dari
informasi yang diberikan oleh survivor function.
Untuk mendapatkan gambaran tentang apa yang kita maksud dengan potensial
sesaat, pertimbangkan konsep kecepatan. Jika, misalnya, Anda sedang
mengemudi di mobil dan Anda melihat speedometer Anda menunjukkan
kecepatan 60 mph, apa artinya bacaan ini? Artinya, jika dalam satu jam
berikutnya, Anda terus mengemudi dengan cara ini, dengan spidometer tepat
60, Anda akan menempuh jarak 60 mil. Pembacaan ini memberikan potensi,
pada saat Anda melihat speedometer Anda, berapa mil yang akan Anda tempuh
dalam satu jam berikutnya. Namun, karena Anda mungkin memperlambat atau
mempercepat atau bahkan berhenti selama satu jam berikutnya, pembacaan
speedometer 60 mph tidak memberi tahu Anda jumlah mil yang benar-benar
akan Anda tempuh dalam satu jam berikutnya. Speedometer hanya memberi
tahu seberapa cepat Anda melaju pada saat tertentu; yaitu, instrumen
memberikan potensi atau kecepatan sesaat Anda
Mirip dengan ide kecepatan, fungsi hazard h(t) memberikan potensi sesaat
pada waktu t untuk mendapatkan suatu peristiwa, seperti kematian atau
penyakit tertentu, diberikan kelangsungan hidup sampai waktu t. Bagian
"diberikan", yaitu, bertahan hingga waktu t, analog dengan mengenali dalam
contoh kecepatan bahwa pembacaan speedometer pada suatu titik waktu secara
inheren mengasumsikan bahwa Anda telah menempuh jarak tertentu (yaitu,
selamat).
Dalam istilah matematika, bagian yang diberikan dari rumus untuk fungsi
hazard ditemukan dalam probabilitas bersyarat karena berbentuk, "P dari A,
dengan syarat B," di mana P menunjukkan probabilitas. Dalam rumus hazard,
probabilitas bersyarat memberikan probabilitas bahwa waktu bertahan hidup
seseorang, T, akan terletak pada interval waktu antara t dan t+ t, dengan
syarat waktu bertahan hidup lebih besar atau sama dengan t. Karena tanda
yang diberikan di sini, fungsi hazard kadang-kadang disebut tingkat
kegagalan bersyarat.
Hazard adalah rate dari probabilitas. Perhatikan bahwa dalam rumus fungsi
hazard, ekspresi di sebelah kanan tanda batas memberikan rasio dua kuantitas.
khusus, skala untuk rasio ini bukan 0 hingga 1, seperti untuk probabilitas,
melainkan berkisar antara 0 dan tak terhingga, dan tergantung pada apakah
waktu diukur dalam hari, minggu, bulan, atau tahun, dll.
Misalnya, jika probabilitas, yang dilambangkan di sini dengan P, adalah 1/3,
dan interval waktu adalah satu setengah hari, maka probabilitas dibagi dengan
interval waktu adalah 1/3 dibagi 1/2, yang sama dengan 0,67 per hari. Sebagai
contoh lain, misalkan, untuk probabilitas yang sama 1/3, bahwa interval waktu
dianggap dalam minggu, sehingga 1/2 hari sama dengan 1/14 minggu.
Kemudian probabilitas dibagi dengan interval waktu menjadi 1/3 dari 1/14,
yang sama dengan 14/3, atau 4,67 per minggu. Nilai yang diperoleh akan
memberikan angka yang berbeda tergantung pada satuan waktu yang
digunakan, bahkan dapat memberikan angka yang besar dari satu
Seperti halnya fungsi yang bertahan, fungsi hazard h(t) dapat digambarkan
sebagai rentang t pada berbagai nilai. Grafik di sebelah kiri menggambarkan
tiga hazard yang berbeda. Berbeda dengan fungsi yang bertahan, grafik h(t)
tidak harus dimulai dari 1 dan turun ke nol, melainkan dapat dimulai dari mana
saja dan naik turun ke segala arah dari waktu ke waktu. Secara khusus, untuk
nilai t yang ditentukan, fungsi hazard h(t) memiliki karakteristik sebagai
berikut:
a. selalu nonnegatif, yaitu sama dengan atau lebih besar dari nol;
b. tidak memiliki batas atas.
Contoh lain menunjukkan beberapa grafik dari berbagai jenis fungsi hazard.
Grafik pertama yang diberikan menunjukkan hazard konstan untuk studi orang
sehat. Dalam grafik ini, tidak peduli berapa nilai t yang ditentukan, h(t)
nilainya sama dengan dalam contoh ini. Ketika fungsi hazard konstan, kita
katakan bahwa model kelangsungan hidup adalah eksponensial.
Grafik kedua menunjukkan fungsi hazard yang meningkat dari waktu ke
waktu. Contoh dari jenis grafik ini disebut model Weibull meningkat.
Grafik seperti itu mungkin diharapkan untuk pasien leukemia yang tidak
menanggapi pengobatan, di mana peristiwa yang menarik adalah
kematian. Ketika waktu bertahan hidup meningkat untuk pasien seperti
itu, dan ketika prognosis memburuk, potensi pasien untuk meninggal
karena penyakit juga meningkat.

Pada grafik ketiga, fungsi hazard menurun dari waktu ke waktu. Contoh
grafik semacam ini disebut Weibull menurun. Sepertigrafik mungkin
diharapkan ketika kejadiannya adalah kematian pada orang yang baru
pulih dari operasi, karena potensi kematian setelah operasi biasanya
menurun seiring dengan bertambahnya waktu setelah operasi.

Grafik keempat yang diberikan menunjukkan fungsi hazard yang


pertama meningkat dan kemudian menurun. Contoh dari jenis grafik ini
adalah model kelangsungan hidup lognormal. Kita dapat mengharapkan
grafik seperti itu untuk pasien tuberkulosis, karena potensi kematian
mereka meningkat pada awal penyakit dan menurun kemudian.
Dari dua fungsi yang telah dibahas, S(t) dan h(t), fungsi survival lebih menarik secara
alami untuk analisis data kelangsungan hidup, hanya karena S(t) secara langsung
menggambarkan pengalaman bertahan hidup dari kelompok penelitian. Namun, fungsi
hazard juga menarik karena alasan berikut:
a. Potensi sesaat sedangkan kurva kelangsungan hidup adalah ukuran kumulatif dari
waktu ke waktu
b. dapat digunakan untuk mengidentifikasi bentuk model tertentu, seperti
eksponensial, Weibull, atau kurva lognormal yang sesuai dengan data peneliti
c. Pemodelan matematis data kelangsungan hidup dilakukan yaitu, model
kelangsungan hidup biasanya ditulis dalam bentuk fungsi hazard.
Tata letak data umum untuk analisis kelangsungan hidup

diberikan oleh tabel yang ditunjukkan di sebalah kiri. Kolom

pertama dari tabel mengidentifikasi subjek penelitian. Kolom

kedua memberikan informasi waktu kelangsungan hidup yang

diamati. Kolom ketiga memberikan informasi untuk d, variabel

dikotomis yang menunjukkan status sensor. Sisa informasi

dalam tabel memberikan nilai untuk variabel penjelas yang

menarik.
Tata letak data alternatif ditampilkan di sini. Tata letak ini adalah
dasar di mana kurva kelangsungan hidup Kaplan-Meier diturunkan.
Kolom pertama dalam tabel memberikan waktu kelangsungan hidup
berurutan dari terkecil hingga terbesar. Kolom kedua memberikan
jumlah frekuensi kegagalan pada setiap waktu kegagalan yang
berbeda. Kolom ketiga memberikan jumlah frekuensi, dilambangkan
dengan qf, dari orang-orang yang disensor dalam interval waktu yang
dimulai dengan waktu kegagalan t(f) tetapi tidak termasuk waktu
kegagalan berikutnya, dilambangkan dengan t (f+1). Kolom terakhir
memberikan set risiko, yang menunjukkan kumpulan individu yang
bertahan setidaknya sampai waktu t(f).
Ilmu analisis data terus mengalami perkembangan yang cukup signifikan dari masa ke masa.

Untuk menunjang tingkat keakuratan hasil analisis suatu fenomena, kini sudah banyak

bermunculan berbagai macam metode analisis data. Salah satu diantaranya adalah Metode Kaplan

Meier yang banyak digunakan untuk menganalisis ketahanan suatu individu ataupun populasi.

Istilah mengenai metode Kaplan Meier ini sendiri berasal dari gabungan dua orang ahli statistik

yaitu Edward L. Kaplan dan Paul Meier. Pada tahun 1958 keduanya melakukan kajian mengenai

cara-cara yang efektif untuk menangani data-data yang tidak lengkap atau tersensor.
Seiring dengan perkembangannya, metode ini semakin banyak digunakan di ranah medis. Metode
Kaplan Meier merupakan suatu jenis analisis estimasi non-parametrik dalam suatu fungsi survival
yang secara umum digunakan untuk menganalisis ketahahan hidup suatu populasi setelah
mendapatkan treatment tertentu seperti pengobatan dan berbagai hal lainnya.
Metode Analisis Kaplan Meier menjadi salah satu metode yang terbilang paling sederhana yang biasa
digunakan untuk menentukan kelangsungan hidup dari waktu ke waktu terlepas dari semua kesulitas
yang terkait dengan subjek penelitian itu sendiri.
Hal ini membuat analisis Kaplan Meier ini banyak digunakan sebagai metode analisis dalam dunia
medis seperti melakukan analisis terhadap kemungkinan bertahan hidup para pasien penderita kanker,
penderita HIV, dan berbagai kondisi pasien medis yang lainnya.
Seiring dengan perkembangannya, metode ini semakin banyak digunakan di ranah medis. Metode
Kaplan Meier merupakan suatu jenis analisis estimasi non-parametrik dalam suatu fungsi survival
yang secara umum digunakan untuk menganalisis ketahahan hidup suatu populasi setelah
mendapatkan treatment tertentu seperti pengobatan dan berbagai hal lainnya.
Metode Analisis Kaplan Meier menjadi salah satu metode yang terbilang paling sederhana yang biasa
digunakan untuk menentukan kelangsungan hidup dari waktu ke waktu terlepas dari semua kesulitas
yang terkait dengan subjek penelitian itu sendiri.
Hal ini membuat analisis Kaplan Meier ini banyak digunakan sebagai metode analisis dalam dunia
medis seperti melakukan analisis terhadap kemungkinan bertahan hidup para pasien penderita kanker,
penderita HIV, dan berbagai kondisi pasien medis yang lainnya.
Untuk memperkirakan probabilitas kelangsungan hidup pada waktu tertentu, menggunakan

risiko yang ditetapkan pada waktu itu untuk memasukkan informasi yang kami miliki tentang

orang yang tersensor hingga waktu penyensoran, daripada membuang semua informasi tentang

orang yang disensor.

Perhitungan sebenarnya dari probabilitas kelangsungan hidup seperti itu dapat dilakukan

dengan menggunakan metode Kaplan-Meier (KM). Kami memperkenalkan metode KM di

bagian berikutnya melalui sebuah contoh.


Untuk memperkirakan probabilitas kelangsungan hidup
pada waktu tertentu, kami menggunakan risiko yang
ditetapkan pada waktu itu untuk memasukkan informasi
yang kami miliki tentang orang yang disensor hingga
waktu penyensoran, daripada membuang semua
informasi tentang orang yang disensor.
Perhitungan sebenarnya dari probabilitas kelangsungan
hidup seperti itu dapat dilakukan dengan menggunakan
metode Kaplan-Meier (KM). Kami memperkenalkan
metode KM di bagian berikutnya melalui sebuah contoh.
Contoh Kurva Kaplan-Meier
Data untuk contoh ini berasal dari studi tentang waktu
remisi dalam beberapa minggu untuk dua kelompok
pasien leukemia, dengan 21 pasien di setiap kelompok.
Kelompok 1 adalah kelompok perlakuan dan kelompok 2
adalah kelompok plasebo. Pertanyaan dasar yang menjadi
perhatian adalah membandingkan pengalaman bertahan
hidup dari kedua kelompok
Contoh Kurva Kaplan-Meier
Dari 21 orang dalam kelompok 1, 9 gagal selama masa studi dan 12
tersensor. Sebaliknya, tidak ada data dalam kelompok 2 yang tersensor;
yaitu, semua 21 orang dalam kelompok plasebo keluar dari remisi selama
masa studi.
Dalam Bab 1, kami mengamati untuk kumpulan data ini bahwa kelompok
1 tampaknya memiliki prognosis kelangsungan hidup yang lebih baik
daripada kelompok 2, menunjukkan bahwa pengobatannya efektif.
Kesimpulan ini didukung oleh statistik deskriptif untuk waktu
kelangsungan hidup rata-rata dan tingkat bahaya rata-rata yang
ditampilkan. Namun, perhatikan bahwa statistik deskriptif memberikan
perbandingan keseluruhan.
Contoh Kurva Kaplan-Meier
Tabel waktu kegagalan yang ditampilkan di sini untuk setiap grup. Tabel ini
memberikan informasi dasar untuk perhitungan kurva KM.
Setiap tabel dimulai dengan waktu kelangsungan hidup nol, meskipun tidak
ada subjek yang benar-benar gagal pada awal tindak lanjut. Alasan untuk nol
adalah untuk kemungkinan bahwa beberapa subjek mungkin telah tersensor
sebelum waktu kegagalan paling awal.
Juga, setiap tabel berisi kolom yang dilambangkan sebagai nf yang
memberikan jumlah subjek dalam set risiko pada awal interval. Mengingat
bahwa set risiko didefinisikan sebagai kumpulan individu yang telah bertahan
setidaknya sampai waktu t(f), diasumsikan bahwa nf termasuk orang-orang
yang gagal pada waktu t(f). Dengan kata lain, nf menghitung subjek yang
berisiko gagal secara instan sebelum waktu t(f).
Contoh Kurva Kaplan-Meier

Kami sekarang menjelaskan cara menghitung kurva KM untuk tabel


untuk grup 2. Perhitungan untuk grup 2 cukup mudah karena tidak
ada subjek yang disensor untuk grup ini.
Tabel waktu kegagalan terurut untuk kelompok 2 disajikan kembali di
sini dengan penambahan kolom lain yang berisi perkiraan
probabilitas kelangsungan hidup. Perkiraan ini adalah probabilitas
kelangsungan hidup KM untuk kelompok ini. Kami akan membahas
perhitungan probabilitas ini segera.
Contoh Kurva Kaplan-Meier
Plot probabilitas kelangsungan hidup KM yang sesuai dengan setiap
waktu kegagalan yang dipesan ditampilkan di sini untuk grup 2. Plot
empiris seperti ini biasanya diplot sebagai fungsi langkah yang dimulai
dengan garis horizontal pada probabilitas kelangsungan hidup 1 dan
kemudian turun ke probabilitas kelangsungan hidup lainnya saat kita
berpindah dari satu waktu kegagalan berurutan ke waktu kegagalan
lainnya.
Kami sekarang menjelaskan bagaimana probabilitas kelangsungan hidup
untuk data kelompok 2 dihitung. Ingat bahwa probabilitas kelangsungan
hidup memberikan probabilitas bahwa subjek studi bertahan melewati
waktu yang ditentukan.
Contoh Kurva Kaplan-Meier
Jadi, dengan mempertimbangkan data grup 2, probabilitas untuk
bertahan melewati nol adalah satu, seperti yang akan selalu berlaku
untuk kumpulan data apa pun.
Selanjutnya, peluang untuk bertahan melewati waktu kegagalan yang
dipesan pertama selama 1 minggu diberikan oleh 19/21 atau (0.90)
karena 2 orang gagal pada 2 minggu, sehingga 19 orang dari 21 sebagai
yang selamat melewati 2 minggu.
Demikian pula, probabilitas berikutnya menyangkut subjek yang
bertahan dalam 2 minggu terakhir, yaitu 17/21 (atau 0,81) karena 2
subjek gagal pada 1 minggu dan 2 subjek gagal pada 2 minggu
menyisakan 17 dari 21 subjek asli yang bertahan selama 2 minggu.
Contoh Kurva Kaplan-Meier
Probabilitas kelangsungan hidup yang tersisa dalam tabel dihitung
dengan cara yang sama, yaitu, kami menghitung jumlah subjek yang
bertahan melewati waktu yang ditentukan yang dipertimbangkan dan
membagi angka ini dengan 21, jumlah subjek pada awal tindak lanjut.
Ingatlah bahwa tidak ada subjek di grup 2 yang disensor, jadi kolom q
untuk grup 2 seluruhnya terdiri dari nol. Jika beberapa q tidak nol,
formula alternatif untuk menghitung probabilitas kelangsungan hidup
akan diperlukan. Rumus alternatif ini disebut pendekatan Kaplan-Meier
(KM) dan dapat digambarkan dengan menggunakan data kelompok 2
meskipun semua nilai q adalah nol.
Contoh Kurva Kaplan-Meier
Misalnya, cara alternatif untuk menghitung probabilitas kelangsungan hidup
melebihi 4 minggu untuk data kelompok 2 dapat ditulis menggunakan rumus
KM yang ditunjukkan di sini. Rumus ini melibatkan produk dari istilah
probabilitas bersyarat. Artinya, setiap suku dalam hasil kali adalah probabilitas
melebihi waktu kegagalan tertentu yang dipesan t(f) yang diberikan bahwa
subjek bertahan hingga waktu kegagalan tersebut.
Jadi, dalam rumus KM untuk bertahan hidup 4 minggu terakhir, istilah 19/21
memberikan probabilitas bertahan melewati waktu kegagalan 1 minggu,
mengingat kelangsungan hidup hingga minggu pertama. Perhatikan bahwa
semua 21 orang dalam kelompok 2 bertahan hingga 1 minggu, tetapi 2 orang
gagal dalam 1 minggu, meninggalkan 19 orang bertahan melewati 1 minggu.
Contoh Kurva Kaplan-Meier
Demikian pula, istilah 16/17 memberikan probabilitas bertahan
melewati waktu kegagalan urutan ketiga pada minggu ke-3, mengingat
kelangsungan hidup hingga minggu ke-3. Ada 17 orang yang bertahan
hingga minggu ke-3 dan 1 di antaranya kemudian gagal, menyisakan 16
orang yang selamat. minggu 3. Perhatikan bahwa 17 orang dalam
penyebut mewakili jumlah risiko yang ditetapkan pada minggu 3.
Perhatikan bahwa istilah produk dalam rumus KM untuk bertahan 4
minggu terakhir berhenti pada minggu ke-4 dengan komponen 14/16.
Demikian pula, rumus KM untuk bertahan 8 minggu terakhir berhenti
pada minggu kedelapan.
Contoh Kurva Kaplan-Meier
Secara lebih umum, formula KM apa pun untuk probabilitas
kelangsungan hidup terbatas pada persyaratan produk hingga minggu
kelangsungan hidup yang ditentukan. Itulah sebabnya rumus KM sering
disebut sebagai rumus “batas produk”.
Selanjutnya, kami mempertimbangkan rumus KM untuk data dari grup
1, di mana ada beberapa pengamatan yang disensor.
Perkiraan probabilitas kelangsungan hidup yang diperoleh dengan
menggunakan rumus KM ditunjukkan di sini untuk kelompok 1.
Perkiraan kelangsungan hidup pertama dalam daftar adalah S(0)=1,
seperti yang akan selalu terjadi, karena ini memberikan probabilitas
untuk bertahan hidup melewati waktu nol.
Contoh Kurva Kaplan-Meier
Estimasi kelangsungan hidup lainnya dihitung dengan mengalikan perkiraan

untuk waktu kegagalan segera sebelumnya dengan sebagian kecil. Misalnya,

pecahannya adalah 18/21 untuk bertahan pada minggu ke-6, karena 21 subjek

bertahan hingga minggu ke-6 dan 3 dari subjek tersebut gagal untuk bertahan

melewati minggu ke-6. Pecahannya adalah 16/17 untuk bertahan pada minggu

ke-7, karena 17 orang tetap sampai minggu 7 dan 1 dari ini gagal untuk

bertahan melewati minggu 7. Pecahan lainnya dihitung dengan cara yang

sama.
Contoh Kurva Kaplan-Meier
Untuk waktu kegagalan tertentu t(f), fraksi dapat secara umum dinyatakan

sebagai probabilitas bersyarat untuk bertahan melewati waktu t(f), dengan

ketersediaan (yaitu, dalam set risiko) pada waktu t(f). Ini adalah rumus yang

sama persis dengan yang sebelumnya kita gunakan untuk menghitung setiap

suku produk dalam rumus batas produk yang digunakan untuk data grup 2.

Perhatikan bahwa subjek mungkin tidak tersedia pada waktu t(f) karena salah

satu dari dua alasan: (1) subjek gagal sebelum t(f), atau (2) subjek telah disensor

sebelum t(f) . Kelompok 1 memiliki pengamatan yang disensor, sedangkan

kelompok 2 tidak. Jadi, untuk grup 1, pengamatan tersensor harus

diperhitungkan saat menentukan jumlah yang tersedia di t(f).


Contoh Kurva Kaplan-Meier
Plot kurva KM untuk kelompok 1 dan 2 ditunjukkan di sini pada grafik yang sama.
Perhatikan bahwa kurva KM untuk kelompok 1 secara konsisten lebih tinggi
daripada kurva KM untuk kelompok 2. Angka-angka ini menunjukkan bahwa
kelompok 1, yang merupakan kelompok perlakuan, memiliki prognosis
kelangsungan hidup yang lebih baik daripada kelompok 2, kelompok plasebo. Selain
itu, seiring bertambahnya jumlah minggu, kedua kurva tampak semakin berjauhan,
menunjukkan bahwa efek menguntungkan dari pengobatan dibandingkan plasebo
semakin besar semakin lama seseorang bertahan dalam remisi.
Plot KM yang ditunjukkan di atas dapat dengan mudah diperoleh dari sebagian besar
paket komputer yang melakukan analisis kelangsungan hidup, termasuk SAS, Stata,
SPSS, dan R. Yang perlu dilakukan pengguna hanyalah menyediakan program
komputer KM dengan tata letak data dasar dan kemudian memberikan perintah yang
sesuai untuk mendapatkan plot.
General Features of KM Curves

Rumus umum untuk probabilitas kelangsungan hidup KM pada waktu


kegagalan t(f) ditunjukkan di sini. Rumus ini memberikan probabilitas
bertahan melewati waktu kegagalan sebelumnya t(f 1), dikalikan dengan
probabilitas bersyarat untuk bertahan melewati waktu t(f), diberikan
kelangsungan hidup untuk setidaknya waktu t(f).
General Features of KM Curves
Misalnya, peluang bertahan hidup 10 minggu terakhir diberikan dalam
tabel untuk kelompok 1 (halaman 65) dengan 0,8067 kali 14/15, yang
sama dengan 0,7529. Tetapi 0,8067 dapat ditulis secara alternatif sebagai
produk dari pecahan 18/21 dan 16/17. Jadi, formula batas produk untuk
bertahan 10 minggu terakhir diberikan oleh produk rangkap tiga yang
ditunjukkan di sini.
Demikian pula, peluang bertahan 16 minggu terakhir dapat ditulis
sebagai 0,6902 10/11, atau setara dengan produk pecahan lima arah yang
ditunjukkan di sini.
The Log-Rank Test for Two Groups
Kami sekarang menjelaskan bagaimana mengevaluasi apakah
kurva KM untuk dua atau lebih kelompok secara statistik setara.
Pada bagian ini kita hanya mempertimbangkan dua kelompok.
Metode pengujian yang paling populer disebut uji log-
rank.Ketika kami menyatakan bahwa dua kurva KM adalah
"setara secara statistik", kami bermaksud bahwa, berdasarkan
prosedur pengujian yang membandingkan dua kurva dalam
beberapa "pengertian keseluruhan", kami tidak memiliki bukti
untuk menunjukkan bahwa kurva kelangsungan hidup (populasi)
yang sebenarnya adalah berbeda.
The Log-Rank Test for Two Groups

Tes log-rank adalah tes chi-kuadrat sampel besar yang digunakan


sebagai kriteria pengujiannya sebuah statistik yang memberikan
perbandingan keseluruhan dari kurva KM. Statistik (log rank) ini,
seperti banyak statistik lain yang digunakan dalam jenis uji chi-
square, menggunakan jumlah sel yang diamati versus yang
diharapkan pada kategori hasil. Kategori untuk statistik log rank
ditentukan oleh masing-masing waktu kegagalan untuk seluruh
rangkaian data yang dianalisis.
The Log-Rank Test for Two Groups

Sebagai contoh informasi yang diperlukan untuk uji log-rank,


kami kembali mempertimbangkan perbandingan subjek
pengobatan (kelompok 1) dan plasebo (kelompok 2) dalam data
remisi pada 42 pasien leukemia.
Di sini, untuk setiap waktu kegagalan yang dipesan, t(f), di
seluruh kumpulan data, kami menunjukkan jumlah subjek (mif)
yang gagal pada saat itu, secara terpisah menurut grup (i), diikuti
dengan jumlah subjek (nif) dalam risiko yang ditetapkan pada saat
itu, juga secara terpisah berdasarkan kelompok
The Log-Rank Test for Two Groups

Jadi, misalnya, pada minggu ke-4, tidak ada subjek yang gagal di
grup 1, sedangkan dua subjek gagal di grup 2. Juga, pada minggu
ke-4, set risiko untuk grup 1 berisi 21 orang, sedangkan set risiko
untuk grup 2 berisi 16 orang.
Demikian pula pada minggu ke 10, 1 subjek gagal di grup 1, dan
tidak ada subjek yang gagal di grup 2; set risiko untuk masing-
masing kelompok berisi 15 dan 8 orang, masing-masing.
The Log-Rank Test for Two Groups

Kami sekarang memperluas tabel sebelumnya untuk memasukkan


jumlah sel yang diharapkan dan nilai yang diamati dikurangi yang
diharapkan untuk setiap grup pada setiap waktu kegagalan yang
dipesan. Rumus untuk jumlah sel yang diharapkan ditampilkan di
sini untuk setiap grup. Untuk kelompok 1, rumus ini menghitung
jumlah harapan pada waktu f (yaitu, e1f) sebagai proporsi dari total
subyek pada kedua kelompok yang berisiko pada waktu f, yaitu,
n1f/(n1f + n2f), dikalikan dengan jumlah total kegagalan pada saat itu
untuk kedua kelompok (yaitu, m1f + m2f). Untuk grup 2, e2f
dihitung dengan cara yang sama.
The Log-Rank Test for Two Groups
The Log-Rank Test for Two Groups

Ketika dua kelompok dibandingkan, statistik uji log-rank


dibentuk dengan menggunakan jumlah pengamatan
dikurangi jumlah yang diharapkan dari semua waktu
kegagalan untuk salah satu dari dua kelompok. Dalam
contoh ini, jumlah ini adalah -10,26 untuk grup 1 dan
10,26 untuk grup 2. Kami akan menggunakan nilai grup
2 untuk melakukan tes, tetapi seperti yang dapat kita
lihat, kecuali untuk tanda minus, perbedaannya sama
untuk dua kelompok
The Log-Rank Test for Two Groups

Untuk kasus dua kelompok, statistik log-rank, yang


ditunjukkan di sini di sebelah kiri, dihitung dengan
membagi kuadrat dari jumlah yang diamati dikurangi
skor yang diharapkan untuk salah satu kelompok —
katakanlah, grup 2 — dengan varians dari jumlah yang
diamati dikurangi skor yang diharapkan.
The Log-Rank Test for Two Groups

rumus untuk varians yang diperkirakan ditampilkan di sini. Untuk


dua kelompok, rumus varians untuk setiap kelompok sama.
Rumus varians ini melibatkan jumlah risiko yang ditetapkan di
setiap grup (nif) dan jumlah kegagalan di setiap grup (mif) pada
waktu f. Penjumlahan atas semua waktu kegagalan yang berbeda.
hipotesis nol yang sedang diuji adalah bahwa tidak ada perbedaan
keseluruhan antara dua kurva kelangsungan hidup. Di bawah
hipotesis nol, statistik log–rank kira-kira mendekati chi-kuadrat
dengan satu derajat kebebasan 1. Jadi, nilai-P untuk uji log-rank
ditentukan dari tabel distribusi chi-kuadrat.
The Log-Rank Test for Two Groups

Beberapa program komputer tersedia untuk menghitung


statistik log-rank. Misalnya paket Stata memiliki perintah
yang disebut "uji sts" yang menghitung informasi deskriptif
tentang kurva Kaplan-Meier, statistik log-rank, dan statistik
alternatif untuk statistik log-rank, yang akan dijelaskan nanti.
Paket lain, seperti SAS dan SPSS, memiliki prosedur yang
memberikan hasil yang serupa dengan Stata. Perbandingan
prosedur dan keluaran Stata, SAS, SPSS dan R disediakan
dalam Lampiran Komputer di bagian belakang teks ini.
The Log-Rank Test for Two Groups

Untuk data remisi, hasil cetakan yang diedit dari


menggunakan prosedur Stata “sts test” ditampilkan di
sini. Statistik log-rank adalah 16,79 dan nilai-P yang
sesuai adalah nol hingga tiga tempat desimal. Nilai-P ini
menunjukkan bahwa hipotesis nol harus ditolak. Oleh
karena itu kami dapat menyimpulkan bahwa kelompok
perlakuan dan plasebo memiliki kurva kelangsungan
hidup KM yang berbeda secara signifikan.
The Log-Rank Test for Two Groups

Meskipun penggunaan komputer adalah cara termudah untuk


menghitung statistik peringkat log, di sini kami menyediakan
beberapa detail perhitungan. Kita telah melihat dari
perhitungan sebelumnya bahwa nilai O2-E2 adalah 10,26.
Estimasi varians O2-E2 dihitung dari rumus varians di atas
menjadi 6,2685. Statistik log-rank kemudian diperoleh dengan
mengkuadratkan 10,26 dan membaginya dengan 6,285, yang
menghasilkan 16,793, seperti yang ditunjukkan pada cetakan
komputer.
The Log-Rank Test for Two Groups

Perkiraan statistik log-rank, yang ditunjukkan di sini,


dapat dihitung menggunakan nilai yang diamati dan yang
diharapkan untuk setiap kelompok tanpa harus
menghitung rumus varians. Rumus perkiraan adalah
bentuk chi-kuadrat klasik yang menjumlahkan setiap
kelompok yang dibandingkan kuadrat dari nilai yang
diamati dikurangi nilai yang diharapkan dibagi dengan
exp
The Log-Rank Test for Two Groups

Perhitungan rumus perkiraan ditampilkan di sini untuk


data remisi. Nilai yang diharapkan adalah 19,26 dan
10,74 untuk kelompok 1 dan 2, masing-masing. Nilai chi-
kuadrat yang diperoleh adalah 15,276, sedikit lebih kecil
dari statistik log-rank sebesar 16,793.
The Log-Rank Test for Several
Groups
Tes log-rank juga dapat digunakan untuk membandingkan tiga atau
lebih kurva kelangsungan hidup. Hipotesis nol untuk situasi yang lebih
umum ini adalah bahwa semua kurva kelangsungan hidup adalah
sama.
Meskipun tata letak tabel yang sama dapat digunakan untuk
melakukan perhitungan ketika ada lebih dari dua kelompok, statistik
uji lebih rumit secara matematis, yang melibatkan varians dan
kovarians dari penjumlahan yang diamati dikurangi skor yang
diharapkan untuk setiap kelompok. Rumus matematika yang nyaman
dapat diberikan dalam bentuk matriks. Kami menyajikan rumus
matriks untuk pembaca yang tertarik dalam Lampiran di akhir bab ini
The Log-Rank Test for Several
Groups

Kami tidak akan menjelaskan lebih lanjut tentang perhitungan


statistik log-rank, karena program komputer dapat dengan mudah
melakukan perhitungan dari file data dasar. Sebagai gantinya,
kami menggambarkan penggunaan tes ini dengan data yang
melibatkan lebih dari dua kelompok.
Jika jumlah kelompok yang dibandingkan adalah G (≥2), maka
statistik log-rank memiliki kira-kira distribusi chi-kuadrat sampel
yang besar dengan derajat kebebasan G- 1 df. Oleh karena itu,
keputusan tentang signifikansi dibuat menggunakan tabel chi-
kuadrat dengan derajat kebebasan yang sesuai.
The Log-Rank Test for Several
Groups

Rumus perkiraan yang dijelaskan sebelumnya hanya


melibatkan nilai yang diamati dan yang diharapkan tanpa
perhitungan varians atau kovarians juga dapat digunakan bila
ada lebih dari dua kelompok yang dibandingkan. Namun,
secara praktis, penggunaan rumus perkiraan ini tidak
diperlukan selama program komputer tersedia untuk
menghitung statistik peringkat log yang tepat.
Kami sekarang memberikan contoh untuk menggambarkan
penggunaan statistik log-rank untuk membandingkan lebih
dari dua kelompok.
The Log-Rank Test for Several
Groups
Kumpulan data "vets.dat" mempertimbangkan waktu bertahan
hidup dalam beberapa hari untuk 137 pasien dari Uji Coba Kanker
Paru-Paru Administrasi Veteran yang dikutip oleh Kalbfleisch dan
Prentice dalam tulisan mereka (The Statistical Analysis of Survival
Time Data, John Wiley, hlm. 223–224, 1980 ). Daftar lengkap
variabel ditampilkan di sini. Status kegagalan ditentukan oleh
variabel status (kolom 11).
Di antara variabel-variabel yang terdaftar, sekarang kita fokus pada
variabel status kinerja (kolom 7). Variabel ini adalah variabel
kontinu, jadi sebelum kita dapat memperoleh kurva KM dan uji
log-rank, kita perlu mengkategorikan variabel ini.
The Log-Rank Test for Several
Groups

Jika, untuk variabel status kinerja, kami memilih kategori


0–59, 60–74, dan 75–100, kami memperoleh tiga
kelompok dengan ukuran masing-masing 52, 50, dan 35.

Kurva KM untuk masing-masing dari tiga kelompok


ditampilkan di sini. Perhatikan bahwa kurva ini tampak
sangat berbeda. Uji signifikansi perbedaan ini disediakan
oleh statistik log-rank.
The Log-Rank Test for Several
Groups

Cetakan informasi deskriptif yang telah diedit tentang tiga kurva


KM bersama dengan hasil uji peringkat log ditampilkan di sini.
Hasil ini diperoleh dengan menggunakan paket Stata.
Karena tiga kelompok sedang dibandingkan di sini, G=3 dan
derajat kebebasan untuk uji log-rank dengan demikian G-1, atau 2.
Statistik log-rank dihitung menjadi 29,181, yang memiliki nilai-P
0,0000. Dengan demikian, kesimpulan dari uji log-rank adalah
bahwa ada perbedaan yang sangat signifikan antara tiga kurva
kelangsungan hidup untuk kelompok status kinerja.

Anda mungkin juga menyukai