Anda di halaman 1dari 18

Nama anggota: Dormauli Sinta Bella (1706047044), Karen Sophie (1706982304), M.

Imanuddin S. (1706047100), Mega Fransiska (1706982342), Melissa Melyana (1706985073)


- Survival Analysis Mrs. Sarini

Penjelasan Algoritma

1. Install dan ‘panggil’ packages yang akan digunakan pada program

2. Data yang digunakan adalah hasil penelitian mengenai waktu seorang pengangguran
sampai mendapat pekerjaan. Variabel-variabel yang akan digunakan hanya terbatas pada
‘spell’, ‘event’, ‘ui’. ‘Spell’ adalah waktu subjek penelitian sampai mendapat pekerjaan,
‘event’ menyatakan seseorang mendapat pekerjaan/tidak sampai akhir waktu penelitian,
‘ui’ menyatakan ada/tidaknya asuransi untuk pengangguran/unemployment insurance
yang dimiliki subjek penelitian, dimana ‘ui’ merupakan variabel bebas dalam penelitian.

3.‘Panggil’ variabel-variabel yang diperlukan dari data dan inisiasi variabel ‘spell’, ‘event’,
‘ui’ ke variabel ‘my_data’ (baris 4 dan 5), dalam hal ini hanya variabel ‘ui’ akan
digunakan untuk mengkategorikan kurva survival subjek penelitian. Ubah header kolom
(baris 6), panggil dan tampilkan ‘my_data’ (baris 7)

Outputnya:

4. Hapus ‘survival_unemployment’ yang telah di-’attach’ sebelumnya (baris 9). Attach


‘my_data’ untuk kemudian dipanggil dan ditampilkan (baris 10).
Mencari fungsi Survival dengan cara Kaplan-Meier
1. Untuk membuat fungsi survival dengan cara Kaplan-Meier, inisiasi fungsi ‘survfit’,
dengan parameter ‘time’ dan ‘event’, ke variabel ‘kmsurvival’ (baris 12). Untuk
mengeluarkan outputnya, panggil ‘summary(kmsurvival)’ (baris 13)

Outputnya:

2. ‘Panggil’ dan tampilkan nilai survival (baris 15). Plot kurva fungsi survival yang
didapat dengan cara Kaplan-Meier (baris 16)

Output baris 15:

Output baris 16:


Gambar di atas adalah grafik survival dari metode Kaplan-Meier dimana dapat dilihat
bahwa fungsi survivalnya masih berada dalam interval kepercayaan, sehingga grafik
tersebut adalah grafik yang valid.

Mencari fungsi survival dengan cara Nelson-Aalen


Nelson-Aalen mendefinisikan fungsi kumulatif hazard dengan menjumlahkan banyak
kejadian yang dibagi dengan banyak subjek yang berisiko. Karena hubungan fungsi survival
dan fungsi kumulatif Hazard H(t)= - ln(S(t)), dimana H(t)=fungsi kumulatif hazard dan
S(t)=fungsi survival, maka dapat dicari fungsi survival dengan cara Nelson-Aalen.
1. inisiasi fungsi ‘survfit(coxph())’, dengan parameter ‘time’, ‘event’, dan ‘type=aalen’ ke
variabel ‘nasurvival’ (baris 46). Untuk mengeluarkan outputnya, panggil
‘summary(nasurvival)’ (baris 47). Plot kurva survival (baris 48).

Algoritma di atas ditulis di lembar kerja berbeda dengan lembar kerja utama

Output baris 48:


Gambar di atas adalah grafik survival dari metode Nelson-Aalen dimana dapat dilihat
bahwa fungsi survivalnya masih berada dalam interval kepercayaan, sehingga grafik
tersebut adalah grafik yang valid.

Mencari fungsi kumulatif hazard dengan cara Kaplan-Meier


1. Untuk mencari kumulatif hazard dari fungsi survival Kaplan-Meier, inisiasi ‘-
log(kmsurvival$surv)’ ke dalam variabel ‘kmhazard’ (baris 18), hal ini dilakukan karena
rumus dari H(t)= - ln(S(t)), dimana H(t)=fungsi kumulatif hazard dan S(t)=fungsi
survival. Panggil kembali dan tampilkan nilai kumulatif hazard dari fungsi survival
Kaplan-Meier (baris 19). Plot kurva nilai kumulatif hazard dari fungsi survival Kaplan-
Meier (baris 20 dan 21).

Output baris 19:

Output baris 20 dan 21:


Grafik kumulatif Hazard Kaplan-Meier di atas mengalami kenaikan yang tidak terlalu
jauh, artinya nilai Hazard dari fungsi tersebut tidak memiliki kenaikan/penurunan yang
signifikan. Jika grafik kumulatif hazard nya cenderung linear, maka nilai hazard-nya pun
akan cenderung konstan.

Mencari fungsi kumulatif hazard dengan cara Nelson-Aalen


1. Nelson-Aalen mendefinisikan fungsi kumulatif hazard dengan menjumlahkan banyak
kejadian yang dibagi dengan banyak subjek yang berisiko sehingga kita bisa mengambil
jumlah ‘event’ dan jumlah ‘risk’ dari fungsi ‘kmsurvival’, kemudian membagi jumlah
‘event’ dengan jumlah ‘risk’ dan diinisiasi ke variabel ‘fungsihazard’ (baris 23). Panggil
dan tampilkan ‘fungsihazard’ (baris 24)

Output baris 24:

2. Selanjutnya akan dicari nilai dari kumulatif hazard menggunakan metode Nelson Aalen.
Inisiasi vektor kosong untuk menjadi tempat output nilai kumulatif harzard (baris 26).
Jumlahkan ‘fungsihazard’ dari indeks 1 sampai indeks ke-i (baris 27 dan 28). Panggil
dan tampilkan hasil dari proses tersebut (baris 29).

Output baris 29:


Plot kurva dari kumulatif hazard dengan menggunakan metode Nelson Aalen (baris 31
dan 32)

Output baris 31 dan 32:

Grafik kumulatif Hazard Nelson-Aalen di atas mengalami kenaikan yang tidak terlalu
jauh (tidak berbeda jauh dari grafik kumulatif Kaplan-Meier*, akan divisualisasikan
dengan grafik), artinya nilai kumulatif Hazard dari fungsi tersebut berdasarkan metode
NA juga tidak memiliki perbedaan laju yang signifikan.

Perbandingan grafik kumulatif hazard Nelson Aalen dan Kaplan Meier


1. Plot kurva kumulatif hazard dari metode Kaplan-Meier (baris 34 - 36) dan plot kurva
kumulatif hazard dari metode Nelson-Aalen (baris 37). Tambahkan legenda untuk
membedakan kedua kurva (baris 38 dan 39).

Output:
*Sebelumnya, dikatakan bahwa grafik kumulatif hazard dengan metode KM tidak berbeda jauh
dengan metode NA, yaitu kenaikannya tidak terlalu signifikan. Grafik di atas menggambarkan
perbandingan dari kedua metode tersebut. Dapat dilihat bahwa kumulatif hazard dari metode
Kaplan-Meier dan Nelson-Aalen tidak memiliki perbedaan yang jauh sehingga dapat
menggunakan metode yang mana saja.

Nonparametrik
Variabel respon yang digunakan adalah objek survival, dalam hal ini ‘time’ dan ‘event’, serta
variabel penjelas yang digunakan adalah ‘ui’, yaitu unemployment insurance. Pada algoritma
di bawah ini, ‘ui’ diganti menjadi ‘unemployment_insurance’. Karena
‘unemployment_insurance’ adalah data berupa bilangan bulat 0 dan 1 (0 untuk yang tidak
memiliki, dan 1 untuk yang memiliki), maka perlu diubah terlebih dahulu menjadi faktor.
Berikut code dan output dari dataset baru, new_data, dengan unemployment_insurance sebagai
faktor.

Perbandingan fungsi survival nonparametrik berdasarkan unemployment insurance


1. Akan dibandingkan kurva survival dari subjek yang memiliki dan yang tidak memiliki
asuransi pengangguran berdasarkan variabel bebas ‘ui’. Inisiasi fungsi ‘survfit’, dengan
parameter ‘time’, ‘event’ dan ‘ui’, ke variabel ‘kmsurvival1’ (baris 68). Untuk
mengeluarkan outputnya, panggil ‘summary(kmsurvival1)’ (baris 69). Plot kedua grafik
untuk dibandingkan (baris 70-42). Tambahkan legenda untuk membedakan kedua grafik
(baris 73).

Output baris 69:


Kedua tabel di atas merupakan data survival dari subjek pengangguran yang memiliki
unemployment insurance dan yang tidak memiliki unemployment insurance.

Output baris 70-73:

Pada gambar, terlihat kurva survival pengangguran yang memiliki asuransi


pengangguran/unemployment insurance lebih tinggi dibandingkan dengan pengangguran
yang tidak memiliki asuransi tersebut. Dengan kata lain, pengangguran yang tidak
memiliki unemployment insurance memiliki waktu menganggur lebih singkat atau cepat
mengalami ‘event’/ mendapat pekerjaan.
Perbandingan fungsi survival nonparametrik berdasarkan unemployment insurance
I. Distribusi Weibull
1. Selanjutnya akan dibuat kurva survival dari distribusi Weibull berdasarkan
unemployment_insurance. Inisiasi fungsi ‘flexsurvreg’ untuk fitting data dengan
distribusi weibull, dengan parameter ‘time’, ‘event’, ‘unemployment_insurance’, dan
‘weibull’, ke variabel ‘fs’ (baris 46 dan 47). Plot kurvanya dengan menyesuaikan
dengan kurva survival parametriknya (baris 48-52).

Output baris 48-52:

Dari kurva di atas terlihat kurva survival pengangguran yang punya


‘unemployment_insurance’ mendekati kurva survival dari metode Kaplan-Meier,
sedangkan kurva survival pengangguran yang tidak punya ‘unemployment_insurance’
mulai berjarak jauh dengan kurva survival dari metode Kaplan-Meier yang bersesuaian
kira-kira di waktu 7. Namun, secara umum kesimpulan yang didapat sama seperti
perbandingan kurva survival dari metode Kaplan-Meier, yaitu kurva survival
pengangguran yang memiliki asuransi pengangguran/unemployment insurance lebih
tinggi dibandingkan dengan pengangguran yang tidak memiliki asuransi tersebut.
Dengan kata lain, pengangguran yang tidak memiliki unemployment insurance
memiliki waktu menganggur lebih singkat atau cepat mengalami ‘event’/ mendapat
pekerjaan.

2. Untuk memplot kurva dari fungsi hazard dengan model distribusi Weibull, digunakan
code sebagai berikut
Output:

Pada grafik di atas, dapat dilihat bahwa nilai hazard untuk keduanya cenderung konstan.
Artinya, seiring berjalannya waktu, laju pengangguran mendapat pekerjaan (hazard rate
nya) tidak memiliki perbedaan yang signifikan.

3. Untuk mendapatkan grafik fungsi kumulatif hazard dengan model distribusi weibull
digunakan code sebagai berikut

Output:
Pada grafik di atas, dapat
dilihat bahwa nilai kumulatif
hazard untuk keduanya
cenderung naik secara
konstan. Artinya, seiring
berjalannya waktu,
pertambahan pengangguran
mendapat pekerjaan (hazard
rate nya) tidak memiliki
perbedaan yang signifikan.

4. Median life dari distribusi


weibull dapat dicari dengan algoritma berikut.
Output:

II. Distribusi Eksponensial


Berikut grafik fungsi survival dengan model eksponensial

Berikut grafik fungsi hazard dengan model eksponensial


Berikut grafik fungsi kumulatif hazard dengan model eksponensial

Berikut median life dari model distribusi eksponensial


Kaplan-Meier Non-Parametric Analysis ( Estimasi Fungsi Survival Kaplan-Meier )

Terlihat bahwa 294 orang mendapatkan pekerjaan ( mengalami event of interest ) 1 minggu
sejak studi dilakukan, dan 5 orang mendapatkan pekerjaan 27 minggu sejak studi dilakukan
dan masih ada 33 orang yang belum mendapatkan perkejaan sesudah waktu itu. Taksiran fungsi
survival diberikan dalam kolom “survival”.
Terlihat sebanyak 91,2% orang belum mendapatkan perkerjaan 1 minggu setelah studi
dilakukan. Dapat dilihat bahwa sebanyak 49,5% orang belum mendapatkan pekerjaan 15
minggu setelah studi dilakukan, atau dapat dinyatakan bahwa peluang untuk survive ( Tidak
mendapatkan pekerjaan ) hingga minggu ke 15 adalah 0,495. Artinya, lebih dari setengah dari
sampel yang diamati sudah mendapatkan pekerjaan 15 minggu setelah studi dilakukan. Terlihat
juga pada akhir masa studi, yaitu 27 minggu, sebanyak 31% orang belum mendapatkan
perkerjaan. Artinya, peluang seseorang masih belum mendapatkan pekerjaan hingga minggu
ke 27 adalah 0,31.
Bagaimana jika ingin diketahui efek adanya unemployment insurance ? Apakah orang
yang memiliki unemployment insurance akan lebih mudah untuk mendapatkan pekerjaan atau
justru sebaliknya ? Untuk menyelidiki hubungan ini, pembentukan fungsi survival harus
dibedakan, berdasarkan ada tidaknya unemployment insurance. Berikut diberikan tabel
estimasi fungsi survival kaplan meier berdasarkan ada tidaknya unemployment insurance.
Diberikan pula visualisasi ( Grafik ) dari data pada tabel diatas

Dari Grafik terlihat jelas bahwa orang yang memiliki unemployment insurance memiliki
kesempatan yang lebih besar untuk tidak mengalami event of interest dalam hal ini adalah tidak
mendapatkan pekerjaan. Artinya, seseorang yang tidak memiliki unemployment insurance akan
lebih mudah untuk mendapatkan perkerjaan dibandingkan orang yang memiliki unemployment
insurance.

Terlihat bahwa lebih dari 50% orang yang tidak mempunyai unemployment insurance
sudah mendapatkan perkerjaan 9 minggu setelah studi dilakukan, sementara pada saat yang
sama baru sekitar 27% orang yang memiliki unemployment insurance sudah mendapatkan
perkerjaan. Pada akhir masa studi, peluang seorang yang tidak memiliki unemployment
insurance belum mendapatkan pekerjaan hingga minggu ke 27 adalah sekitar 0,25 sedangkan
peluang seorang yang memiliki unemployment insurance belum mendapatkan pekerjaan
hingga minggu ke 27 adalah sekitar 0,35. Berdasarkan analisa data diatas, akan disarankan
untuk tidak memiliki unemployment insurance apabila ingin memiliki peluang yang lebih
tinggi untuk mendapatkan pekerjaan.

Nelson-Aalen Non-Parametric Analysis ( Estimasi Fungsi Survival Nelson-Aalen )


Pada Grafik estimasi fungsi survival Nelson-Aalen, terlihat bahwa sebanyak 91,6% orang
belum mendapatkan perkerjaan 1 minggu setelah studi dilakukan. Dapat dilihat bahwa
sebanyak 50,5% orang belum mendapatkan pekerjaan 15 minggu setelah studi dilakukan, atau
dapat dinyatakan bahwa peluang untuk survive ( Tidak mendapatkan pekerjaan ) hingga
minggu ke 15 adalah 0,505. Artinya, lebih dari setengah dari sampel yang diamati
kemungkinan baru mendapatkan pekerjaan 15 minggu setelah studi dilakukan. Hal ini cukup
kontras dengan hasil estimasi fungsi survival kaplan-meier yang menyatakan lebih dari 50%
orang sudah mendapatkan perkerjaan 15 minggu setelah studi dilakukan. Terlihat juga pada
akhir masa studi, yaitu 27 minggu, sebanyak 32,2% orang belum mendapatkan perkerjaan.
Artinya, peluang seseorang masih belum mendapatkan pekerjaan hingga minggu ke 27 adalah
0,322.
Pada umumnya untuk mengestimasi fungsi survival lebih sering digunakan metode kaplan-
meier, sedangkan untuk mengestimasi fungsi kumulatif hazard lebih sering digunakan metode
nelson-aalen karena hasil estimasi yang diberikan cukup baik. Sebenarnya kita dapat
mengestimasi fungsi survival dengan metode nelson-aalen dan begitu juga sebaliknya, namun
memang hasil yang diberikan bisa saja tidak sama dengan hasil dari metode kaplan meier
sehingga estimasi yang dihasilkan kurang baik. Oleh karena ini orang-orang lebih cenderung
menggunakan metode kaplan-meier untuk fungsi survival dan metode nelson-aalen untuk
kumlulatif hazard.

Sumber data: https://sites.google.com/site/econometricsacademy/econometrics-


models/survival-analysis

Anda mungkin juga menyukai