Anda di halaman 1dari 26

PENAKSIRAN NONPARAMETRIK

Program Studi S1 Statistika

Departemen Matematika
Universitas Indonesia

PTA 2019/2020

Sindy Devila, M.Si. (Universitas Indonesia) SCST603201-ANALISIS SURVIVAL 2019 1 / 26


Penaksiran Nonparametrik Pendahuluan

Ketika melakukan studi tentang mortalitas (tingkat kematian) manusia,


sangat tidak praktis untuk mengamati individu-individu tersebut dari lahir
hingga meninggal dunia.
Hal yang umum dilakukan adalah mengamati sekelompok individu dari
berbagai usia dalam beberapa tahun selama periode studi.
Ketika seorang individu masuk studi, artinya individu tersebut masih
survive pada saat itu. Usia saat meninggal dari individu ini haruslah
setidaknya sama dengan usia saat masuk studi. Kondisi tersebut
dinamakan left truncated.
Apabila seorang individu masih survive ketika studi berakhir, maka terjadi
right censoring. Usia saat meninggal dari individu tersebut tidak diketahui,
tetapi diketahui bahwa usia saat meninggalnya setidaknya sama dengan
usia saat studi berakhir. Right censoring juga terjadi ketika individu keluar
studi sebelum masa studi berakhir. Dalam hal ini, usia saat meninggal dari
individu setidaknya sama dengan usia saat keluar studi.

Sindy Devila, M.Si. (Universitas Indonesia) SCST603201-ANALISIS SURVIVAL 2019 2 / 26


Penaksiran Nonparametrik Pendahuluan

Pembahasan bab ini terbatas pada skema pemancungan kiri (left


truncation) dan penyensoran kanan (right censoring). Sebab, dua
skema tersebut merupakan skema yang paling umum ditemukan dalam
studi survival maupun aktuaria.
Untuk menyederhanakan penulisan, selanjutnya kata tersensor akan
merujuk pada tersensor kanan dan data terpancung merujuk pada kata
terpancung kiri.

Sindy Devila, M.Si. (Universitas Indonesia) SCST603201-ANALISIS SURVIVAL 2019 3 / 26


Penaksiran Nonparametrik Pendahuluan

Notasi untuk Merepresentasikan Data

Sebelum membangun distribusi empiris dari data tersensor maupun data


terpancung, perlu diketahui notasi yang umum digunakan untuk
merepresentasikan data, diantaranya:
(Untuk data individu)
di = waktu pemancungan untuk observasi ke-i.
Ketika tidak terdapat waktu pemancungan, maka di = 0.
Rekaman data (nilai data yang tercatat) dari observasi ke-i,
dinotasikan dengan:
xi apabila observasi ke-i merupakan observasi yang tidak tersensor,
atau
ui apabila observasi ke-i merupakan observasi yang tersensor.
dimana i = 1, 2, ..., n.

Sindy Devila, M.Si. (Universitas Indonesia) SCST603201-ANALISIS SURVIVAL 2019 4 / 26


Penaksiran Nonparametrik Pendahuluan

Summarizing Raw Data

Langkah selanjutnya yang perlu dilakukan sebelum mengonstruksi


penaksiran adalah meringkas data mentah agar lebih mudah dipahami dan
dianalisis.
Data mentah yang diringkas merupakan observasi yang tidak tersensor,
yaitu xi , i = 1, 2, ..., n.
Misalkan y1 < y2 < ... < yk merupakan k nilai tunggal dari xi yang
muncul di dalam sampel dan disusun dari nilai terkecil hingga nilai
terbesar.
Dengan demikian, k haruslah lebih kecil atau sama dengan jumlah
observasi yang tidak tersensor, yaitu k ≤ n.
Misalkan sj menyatakan banyak observasi yj yang muncul di dalam
sampel, dimana j = 1, 2, ..., k. Maka,
k
X
sj = n
j=1
Sindy Devila, M.Si. (Universitas Indonesia) SCST603201-ANALISIS SURVIVAL 2019 5 / 26
Penaksiran Nonparametrik Pendahuluan

Summarizing Raw Data

Kuantitas terakhir yang perlu didefinisikan adalah himpunan risiko


(risk set) pada observasi yj , yang dinotasikan dengan
rj , j = 1, 2, ..., k.
Pada studi mortalitas, misalkan X menyatakan usia saat meninggal.
Himpunan risiko (risk set), rj , dari studi tersebut terdiri dari individu yang
sedang diamati pada usia yj . Lebih tepatnya, individu yang berisiko
meninggal sesaat sebelum usia yj .
Individu yang dimaksud adalah semua individu yang meninggal pada usia
≥ yj dan semua individu yang tersensor pada usia ≥ yj . Sedangkan
individu yang teramati pertama kali (masuk studi) pada usia ≥ yj tidak
dihitung sebagai individu yang berisiko meninggal dunia saat yj .

Sindy Devila, M.Si. (Universitas Indonesia) SCST603201-ANALISIS SURVIVAL 2019 6 / 26


Penaksiran Nonparametrik Pendahuluan

Summarizing Raw Data

Dengan demikian, rj dapat ditentukan melalui persamaan:

rj = (#obs xi ≥ yj ) + (#obs ui ≥ yj ) − (#obs di ≥ yj ) (1)

Karena,
Total #obs di = #obs xi + #obs ui
maka himpunan risiko, rj juga dapat dihitung sebagai:

rj = (#obs di < yj ) − (#obs xi < yj ) − (#obs ui < yj ) (2)


Persamaan (2) lebih umum digunakan karna mudah untuk dipahami. Jadi,
himpunan risiko rj melibatkan semua individu yang telah memasuki studi
sebelum usia yj dan kemudian dikurangi dengan individu-individu yang
telah meninggal maupun tersensor sebelum yj .

Sindy Devila, M.Si. (Universitas Indonesia) SCST603201-ANALISIS SURVIVAL 2019 7 / 26


Penaksiran Nonparametrik Pendahuluan

Summarizing Raw Data

Pendefinisian notasi pada slide-slide sebelumnya berlaku umum untuk


kasus-kasus lainnya.
Kata kunci untuk memahami himpunan risiko (risk set), rj :
Jumlah subjek yang masih survive sesaat sebelum waktu yj , atau
Jumlah subjek yang berisiko mengalami event pada waktu yj .

Sindy Devila, M.Si. (Universitas Indonesia) SCST603201-ANALISIS SURVIVAL 2019 8 / 26


Penaksiran Nonparametrik Pendahuluan

Latihan

Sumber: Tse, Y.K. (2009): Nonlife Actuarial Models: Theory, Methods, and Evaluation, Research Collection School of

Economics. (Exercises page 298)

Sindy Devila, M.Si. (Universitas Indonesia) SCST603201-ANALISIS SURVIVAL 2019 9 / 26


Penaksiran Nonparametrik Pendahuluan

Latihan

Sumber: Tse, Y.K. (2009): Nonlife Actuarial Models: Theory, Methods, and Evaluation, Research Collection School of

Economics. (Exercises page 298)

Sindy Devila, M.Si. (Universitas Indonesia) SCST603201-ANALISIS SURVIVAL 2019 10 / 26


Penaksiran Nonparametrik Pendahuluan

Latihan

Sumber: Tse, Y.K. (2009): Nonlife Actuarial Models: Theory, Methods, and Evaluation, Research Collection School of

Economics. (Exercises page 299)

Sindy Devila, M.Si. (Universitas Indonesia) SCST603201-ANALISIS SURVIVAL 2019 11 / 26


Penaksiran Nonparametrik Metode Penaksiran Non-Parametrik

Terdapat dua metode yang umum digunakan untuk melakukan penaksiran


non-parametrik terhadap data tidak lengkap, yaitu:
1 Metode Kaplan Meier (Product Limit)
Metode ini biasanya digunakan untuk menaksir fungsi survival.
2 Metode Metode Nelson Aalen
Metode ini biasanya digunakan untuk menaksir fungsi hazard
kumulatif.

Sindy Devila, M.Si. (Universitas Indonesia) SCST603201-ANALISIS SURVIVAL 2019 12 / 26


Penaksiran Nonparametrik Metode Penaksiran Non-Parametrik

Metode Kaplan Meier (Product Limit)

Tujuannya adalah menaksir S(yj ) = Pr(X > yj ), j = 1, 2, ..., k.


Berdasarkan aturan peluang bersyarat,

S(yj ) = Pr(X > yj )


= Pr(X > yj |X > yj−1 )... Pr(X > y2 |X > y1 ) Pr(X > y1 )
j
Y
= Pr(X > y1 ) Pr(X > yh |X > yh−1 )
h=2

Sindy Devila, M.Si. (Universitas Indonesia) SCST603201-ANALISIS SURVIVAL 2019 13 / 26


Penaksiran Nonparametrik Metode Penaksiran Non-Parametrik

Metode Kaplan Meier (Product Limit)

Amati bahwa,
S(0) = 1, sebab tidak ada yang mengalami event sebelum y1 .
Berpikir secara kondisional bahwa tepat sebelum y1 , terdapat r1
subjek yang berisiko mengalami event. Kemudian, s1 subjek
diantaranya mengalami event pada saat y1 . Dengan demikian,
peluang survive di y1 adalah:
r1 − s1 s1
Pr(X
c > y1 ) = =1−
r1 r1
Dengan cara yang sama, maka:
rh − sh sh
Pr(X
c > yh |X > yh−1 ) = =1−
rh rh

Sindy Devila, M.Si. (Universitas Indonesia) SCST603201-ANALISIS SURVIVAL 2019 14 / 26


Penaksiran Nonparametrik Metode Penaksiran Non-Parametrik

Metode Kaplan Meier (Product Limit)

Berdasarkan hasil yang diperoleh sebelumnya, berikut adalah Estimator


Kaplan Meier dari Fungsi Survival adalah:


1,  
0 ≤ t < y1
Q
j
ŜK (t) = h=1 1 − srhh , yj ≤ t < yj+1 , j = 1, 2, ..., k − 1 (3)
  
Qk
 sh
h=1 1 − r , h
t ≥ yk

Catatan:
Apabila sk < rk (dapat terjadi ketika observasi terbesar merupakan
observasi yang tersensor), maka ŜK (yk ) > 0.
Akibatnya, salah satu sifat dari fungsi survival tidak terpenuhi.

Sindy Devila, M.Si. (Universitas Indonesia) SCST603201-ANALISIS SURVIVAL 2019 15 / 26


Penaksiran Nonparametrik Metode Penaksiran Non-Parametrik

Metode Kaplan Meier (Product Limit)

Solusi:
Diberikan beberapa alternatif untuk menentukan ŜK (t), t ≥ yk , yaitu:
1 Tetap menggunakan hasil yang diperoleh pada persamaan (3).
2 Menetapkan ŜK (t) = 0
h i t
yk
3 Menetapkan ŜK (t) = ŜK (yk )

Sindy Devila, M.Si. (Universitas Indonesia) SCST603201-ANALISIS SURVIVAL 2019 16 / 26


Penaksiran Nonparametrik Metode Penaksiran Non-Parametrik

Metode Kaplan Meier (Product Limit)

Estimator Kaplan Meier dari fungsi survival juga dapat dimanfaatkan


untuk menaksir fungsi hazard kumulatif melalui persamaan:

ĤK (t) = − ln[ŜK (t)]

Sindy Devila, M.Si. (Universitas Indonesia) SCST603201-ANALISIS SURVIVAL 2019 17 / 26


Penaksiran Nonparametrik Metode Penaksiran Non-Parametrik

Metode Kaplan Meier (Product Limit)

Variansi dari estimator Kaplan Meier dapat ditaksir melalui formula


Greenwood, yaitu:
j
X sh
ar[ŜK (yj )] = [ŜK (yj )]2
Vd
r (r
h=1 h h
− sh )

Standar error dari estimator Kaplan Meier diberian oleh persamaan:


q
Vd
ar[ŜK (yj )]

Sindy Devila, M.Si. (Universitas Indonesia) SCST603201-ANALISIS SURVIVAL 2019 18 / 26


Penaksiran Nonparametrik Metode Penaksiran Non-Parametrik

Latihan

You are given the following data from a mortality study:

i di xi ui
1 0 - 7
2 0 5 -
3 2 - 8
4 5 7 -

Estimate the survival function using the product-limit estimator.

Sindy Devila, M.Si. (Universitas Indonesia) SCST603201-ANALISIS SURVIVAL 2019 19 / 26


Penaksiran Nonparametrik Metode Penaksiran Non-Parametrik

Latihan

Sindy Devila, M.Si. (Universitas Indonesia) SCST603201-ANALISIS SURVIVAL 2019 20 / 26


Penaksiran Nonparametrik Metode Penaksiran Non-Parametrik

Latihan

Sindy Devila, M.Si. (Universitas Indonesia) SCST603201-ANALISIS SURVIVAL 2019 21 / 26


Penaksiran Nonparametrik Metode Penaksiran Non-Parametrik

Metode Nelson Aalen

Estimator alternatif dari fungsi hazard kumulatif dengan yang performance


lebih baik pada sample berukuran kecil, diperkenalkan oleh Nelson Aalen.
Adapun Estimator Nelson Aalen dari Fungsi Hazard Kumulatif,
adalah:



P0, 0 ≤ t < y1
j sh
Ĥ(t) = h=1 rh , yj ≤ t < yj+1 , j = 1, 2, ..., k − 1 (4)

 k sh ,
 P
t ≥ yk
h=1 rh

Berdasarkan persamaan (4), fungsi survival juga dapat ditaksir


menggunakan persamaan:
ŜN (t) = e−Ĥ(t) (5)
dimana untuk t ≥ yk , taksiran alternatifnya adalah ŜN (t) = 0 atau
h i t
yk
ŜN (t) = ŜN (yk )
Sindy Devila, M.Si. (Universitas Indonesia) SCST603201-ANALISIS SURVIVAL 2019 22 / 26
Penaksiran Nonparametrik Metode Penaksiran Non-Parametrik

Metode Nelson Aalen

Variansi dari estimator Nelson Aalen dapat ditaksir melalui persamaan:


j
X sh
Vd
ar[Ĥ(yj )] =
h=1
rh2

Sindy Devila, M.Si. (Universitas Indonesia) SCST603201-ANALISIS SURVIVAL 2019 23 / 26


Penaksiran Nonparametrik Metode Penaksiran Non-Parametrik

Latihan

Sindy Devila, M.Si. (Universitas Indonesia) SCST603201-ANALISIS SURVIVAL 2019 24 / 26


Penaksiran Nonparametrik Metode Penaksiran Non-Parametrik

Latihan

Sindy Devila, M.Si. (Universitas Indonesia) SCST603201-ANALISIS SURVIVAL 2019 25 / 26


Penaksiran Nonparametrik Metode Penaksiran Non-Parametrik

Latihan

Sindy Devila, M.Si. (Universitas Indonesia) SCST603201-ANALISIS SURVIVAL 2019 26 / 26

Anda mungkin juga menyukai