Anda di halaman 1dari 50

Program Studi Aktuaria – Departemen Matematika

AKT 403

TEORI RISIKO II
Koordinator: Endar H. Nugrahani
Edisi Online, Semester Ganjil 2020/2021
Materi Pertemuan ke-3

Bagian - 1

3.1 Pendugaan Titik Data Dimodifikasi


3.2 Rata-rata, Varians, dan Pendugaan Interval

2
3.1 Pendugaan Titik Data Dimodifikasi
• Data hasil pengamatan bisa jadi tak lengkap karena berbagai sebab, di
antaranya karena terpotong ataupun tersensor.
• Data klaim asuransi umumnya terpotong dari bawah karena adanya
besaran deductible atau risiko sendiri sebesar 𝑑, sehingga data kerugian
di bawah 𝑑 tidak tercatat.
• Data limit polis adalah tersensor di kanan, yaitu jika kerugian bernilai
lebih dari 𝑢 maka tidak ada benefit yang akan dibayarkan, sehingga nilai
kerugian hanya akan dicatat sebagai setidaknya sebesar 𝑢.

3
Definisi 3.1

• Pengamatan adalah terpotong dari bawah (truncated from below)


atau terpotong di kiri (left truncated) pada titik 𝑑 jika pengamatan pada
atau di bawah 𝑑 adalah tak tercatat, sedangkan data di atas 𝑑 tercatat
pada nilai teramati.

• Pengamatan adalah terpotong dari atas (truncated from above) atau


terpotong di kanan (right truncated) pada titik 𝑢 jika pengamatan pada
atau di atas 𝑢 adalah tak tercatat, sedangkan data di bawah 𝑢 tercatat
pada nilai teramati.

4
Definisi 3.1 (cont'd)

• Pengamatan adalah tersensor dari bawah (censored from below) atau


tersensor di kiri (left censored) pada titik 𝑑 jika pengamatan pada atau
di bawah 𝑑 adalah tercatat sebagai 𝑑, sedangkan data di atas 𝑑 tercatat
pada nilai teramati.

• Pengamatan adalah tersensor dari atas (censored from above) atau


tersensor di kanan (right censored) pada titik 𝑢 jika pengamatan pada
atau di atas 𝑢 adalah tercatat sebagai 𝑢, sedangkan data di bawah 𝑢
tercatat pada nilai teramati.

5
Prosedur penentuan distribusi empiris:
Dari data individual yang terpotong atau tersensor:
• Catat 𝑦! < 𝑦" < ⋯ < 𝑦# , 𝑘 ≤ 𝑛, sebagai 𝑘 nilai unik data tak tersensor
yang muncul dalam sampel 𝑥$ , 𝑖 = 1, . . . , 𝑛,
• Tetapkan nilai pemotongan data sebagai 𝑑% ,
• Jika tidak terdapat pemotongan, maka tetapkan 𝑑% = 0.
• Hitung 𝑠% : banyaknya nilai tak tersensor 𝑦% muncul dalam sampel,
• Pengamatan dicatat sebagai berikut:
• Jika data teramati, maka catat sebagai 𝑥!
• Jika data tersensor maka dicatat sebagai 𝑢!
6
• Tentukan nilai gugus risiko 𝑟! pada observasi ke-𝑗:

𝑟! = 𝐵𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑥" ≥ 𝑦! + 𝐵𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑢" ≥ 𝑦! − 𝐵𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑑" ≥ 𝑦!

atau
𝑟! = 𝐵𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑑" < 𝑦! − 𝐵𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑥" < 𝑦! − 𝐵𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑢" < 𝑦!

• Gugus risiko 𝑟! memenuhi hubungan rekursif berikut:

𝑟! = 𝑟!#$ + 𝐵𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑦!#$ ≤ 𝑑" < 𝑦!

− 𝐵𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑥" = 𝑦!#$ − 𝐵𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑦!#$ ≤ 𝑢" < 𝑦! ,

dengan 𝑟% = 0.

7
Contoh 3.1
Diketahui Data D2
(dari Bab 11)
tentang data 40
polis asuransi jiwa
berikut.
Akan ditentukan
nilai gugus risiko 𝑟% .

8
Penyelesaian:
Tentukan terlebih
dahulu nilai
pemotongan 𝑑$ dan
sensor 𝑢$ untuk setiap
titik data 𝑖.

9
Setelah itu data disajikan sebagai nilai 𝑦% , kemudian ditetapkan banyak
observasi 𝑠% , serta dihitung gugus risiko 𝑟% .

10
Setelah mendapatkan nilai gugus risiko 𝑟! , kita masih harus menentukan fungsi
survival empiris, yang lazim menggunakan penduga Kaplan-Meier Product-
Limit :
• Nilai survival dimulai dengan 𝑆 0 = 1, karena semua individu masih
bertahan hidup sebelum 𝑦$ .
• Selanjutnya, tepat sebelum 𝑦$ terdapat 𝑟$ individu berisiko meninggal, tetapi
hanya 𝑠$ yang benar meninggal.
&!#'!
• Sehingga peluang survival setelah 𝑦$ adalah 𝑆 𝑦$ = &!
.
• Dengan pemikiran yang sama, survival setelah 𝑦( adalah
𝑟( − 𝑠(
𝑆 𝑦( = 𝑆 𝑦$ .
2
• Demikian seterusnya untuk nilai 𝑦" yang lain.

11
Penduga Kaplan-Meier Product-Limit untuk fungsi survival empiris:

• Jika 𝑠) = 𝑟) maka masuk akal jika 𝑆 𝑡 = 0 untuk 𝑡 ≥ 𝑦) .


• Akan tetapi jika data adalah tersensor, maka masih memungkinkan bahwa
setelah usia orang terakhir meninggal masih mungkin ada orang lain yang
bertahan hidup tetapi tersensor pada usia terakhir tersebut, sehingga nilai
survival mungkin positif.
12
• Alternatif lain sebagai jalan tengah adalah menggunakan pendekatan
kurva eksponensial untuk menurunkan survival dari level sekarang
mendekat ke nilai 0.
Misalkan 𝑤 = max 𝑥! , . . . , 𝑥& , 𝑢! , . . . , 𝑢& , maka untuk 𝑡 ≥ 𝑤 berlaku
#
'
)* + ∗ ∗ '/( ∗
𝑟$ − 𝑠$
𝑆& 𝑡 = 𝑒( = 𝑠 , 𝑠 =: .
𝑟$
$.!

13
Contoh 3.2
222 ESTIMATION FOR MODIFIED DATA

Penduga fungsi
Based on survival
the previous Kaplan-Meier dari
example, we have Contoh 3.1 adalah
Ί, 0 < t < 0.8,
30-1
30 = 0.9667, 0.8 < t < 2.9,

0M^,Ύ7^^
2G
= 0.8923, 2.9 < t < 3.1,

0 . 8 9 2 3 ^ = 0.8580, 3.1 < t < 4.0,


Äio(t) =
0 . 8 5 8 0 ^ = 0.7920, 4.0 < t < 4.1, Perhatikan bahwa
peluang survival
0.7920 2 323- 1 = 0.7576, 4.1 <t < 4.8, terakhir diberikan
dalam tiga alternatif
0.7576 2 1, ,- 1- =0.7215, 4.8 < t < 5.0, nilai, yaitu nilai data
tersensor, atau nol, atau
0.7215 or 0 or 0.7215'/ 5 °, t > 5.0. nilai eksponensial.

An alternative to the Kaplan-Meier estimate is a modification of the Nelson-Aalen estimate 14


Alternatif pendugaan fungsi survival empiris dengan Excel:

15
16
Tugas (*): Implementasikan prosedur ini untuk data Contoh 3.1 pada sesi Responsi.
17
Alternatif dengan modifikasi penduga Nelson-Åalen
Misalkan:
• 𝑟 𝑡 adalah gugus risiko pada saat 𝑡;
• ℎ 𝑡 adalah fungsi tingkat hazard;
• 𝑠 𝑡 harapan terjadinya kematian sebelum waktu 𝑡.
Maka dapat dirumuskan
*
𝑠 𝑡 = : 𝑟 𝑢 ℎ 𝑢 𝑑𝑢 .
%
Didapat turunan
𝑑𝑠 𝑡
= 𝑟 𝑡 ℎ 𝑡 ↔ 𝑑𝑠 𝑡 = 𝑟 𝑡 ℎ 𝑡 𝑑𝑡.
𝑑𝑡
18
Serta
𝑑𝑠 𝑡
= ℎ 𝑡 𝑑𝑡.
𝑟 𝑡
Sehingga dengan pengintegralan didapat
" "
𝑑𝑠 𝑢
( = ( ℎ 𝑢 𝑑𝑢 = 𝐻 𝑡 .
! 𝑟 𝑢 !
$
Menggantikan 𝑠 𝑡 dengan penduganya 𝑠̂ 𝑡 , maka ruas kiri menjadi ∑"! #" ! , sehingga
%!
didapat penduga Nelson-Åalen untuk fungsi hazard kumulatif

0, 0 ≤ 𝑡 < 𝑦&
)*& 𝑠
'
3 , 𝑦)*& ≤ 𝑡 < 𝑦) , 𝑗 = 2, . . . , 𝑘
- 𝑡 =
𝐻 '(& 𝑟'
+ 𝑠
'
3 , 𝑡 ≥ 𝑦+
'(& 𝑟'
19
Dengan demikian penduga survival adalah
𝑆< 𝑡 = 𝑒 /10 ' .
Untuk 𝑡 ≥ 𝑤 penduga alternatif adalah
𝑆< 𝑡 = 0 atau 𝑆< 𝑡 = 𝑆< 𝑦# '/(
.

20
and then
S(t) = e - * W .
ContohFor3.3
t>w, alternative estimates are S(t) = 0 and S(t) = S(yk)t/w-

■ EXAMPLE 12.3
Dari Data D2 pada Contoh 3.1,
Determine the Nelson^\alen estimate of the survival function for Data Set D2:
penduga fungsi hazard Nelson-Åalen
adalah:
0, 0 < t < 0.8,

i = 0.0333, 0.8 < t < 2.9,

0.0333 + ^ = 0.1103, 2.9 < t < 3.1,

H(t) = 0.1103 + ^ = 0.1487, 3.1 < t < 4.0,

0.1487 + ^ = 0.2256, 4.0 < t < 4.1,

0.2256 + ^ = 0.2691, 4.1 < < 4.8,

0.2691 + ^ = 0.3167, f > 4.8.


21
0.2256 + ^ = 0.2691, 4.1 < < 4.8,
< 0 '
/1
serta penduga fungsi survival
0.2691 + ^ = 0.3167, adalah
𝑆 𝑡 = 𝑒 f > 4.8.

1, 0 < < 0.8,


e -0.0333 = 0 g672) 0.8 < t < 2.9,

e-o.no3 = 0 8 9 5 6 > 2.9 < < 3.1,


e -0.1487 = Q 8 6 1 8 i 3.1 < t < 4.0,
S(t) =
e -0.2256 = 0 7980i 4.0<i<4.1,
e -0.2691 = 0 7641i 4.1 < < 4.8,
e -0.3167 = 0 ?285> 4.8 < < 5.0,

0.7285 or 0 or 0.7285 t '' 5 · 0, t > 5.0. D

22
3.2 Rata-rata, Varians, dan Pendugaan Interval
2
Penduga empiris fungsi survival 𝑆 𝑥 adalah 𝑆& 𝑥 = , di mana 𝑌 adalah
&
banyaknya observasi pada sampel yang lebih besar atau sama dengan 𝑥.
Sehingga 𝑌 memiliki distribusi binomial dengan parameter 𝑛 dan 𝑆 𝑥 ,
serta
𝑌 𝑛𝑆 𝑥
𝐸 𝑆& 𝑥 =𝐸 = =𝑆 𝑥
𝑛 𝑛
menunjukkan penduga adalah tak berbias.

23
Varians adalah
𝑌 𝑆 𝑥 1−𝑆 𝑥
𝑉𝑎𝑟 𝑆& 𝑥 = 𝑉𝑎𝑟 =
𝑛 𝑛
memiliki limit nol, yang menunjukkan sebagai penduga konsisten.
Penduga varians diberikan oleh
𝑆& 𝑥 1 − 𝑆& 𝑥
A 𝑆& 𝑥
𝑉𝑎𝑟 = .
𝑛
Misalkan peluang 𝑝 = 𝑃𝑟 𝑎 < 𝑥 ≤ 𝑏 maka penduga empirisnya adalah
𝑝 1−𝑝
𝑝̂ = 𝑆& 𝑎 − 𝑆& 𝑏 dan 𝑉𝑎𝑟 𝑝̂ = .
𝑛

24
Contoh 3.4
Gunakan Data Set D1 untuk menduga secara empiris peluang 𝑞" , yaitu
peluang polis yang aktif sampai waktu 2 akan mati sebelum waktu 3 tiba:
𝑆 2 −𝑆 3
𝑞" = .
𝑆 2
Penyelesaian:
"5 "6
𝑛 = 30, 𝑆34 2 = 34, dan 𝑆34 3 = 34, didapat

𝑆34 2 − 𝑆34 3 2
𝑞K" = = .
𝑆34 2 29

25
Varians dari penduga adalah
𝑌 𝑉𝑎𝑟 𝑌|𝑋
𝑉𝑎𝑟 𝑞K" |𝑋 = 1 = 𝑉𝑎𝑟 O𝑋 = 1 = "
.
30 − 𝑋 29
A 𝑌|𝑋 = 1 = 29 2/29 27/29 didapat
dengan 𝑉𝑎𝑟

29 2/29 27/29 2 27
A 𝑞K" |𝑋 = 1 =
𝑉𝑎𝑟 = .
29" 293

26
Penduga Varians dari peluang empiris
Untuk sampel berukuran 𝑛, misalkan
• 𝑛7 banyaknya individu yang bertahan hidup pada umur 𝑥, serta
• 𝑛8 banyaknya individu yang bertahan hidup pada umur 𝑦,
maka penduga varians adalah
𝑛7 − 𝑛8 𝑛8
A
𝑉𝑎𝑟 8/7 𝑞
K 7 R𝑛 7 A
= 𝑉𝑎𝑟 8/7 𝑝̂ 7 R𝑛7 = .
𝑛73

27
Contoh 3.5
204 ESTIMATION FOR COMPLETE DATA
Dari data set B, akan diduga secara empiris, peluang bahwa pembayaran klaim
setidaknya 1000 ketika ada batas
Tablerisiko sendiri
11.1 Data Set A. (deductible) sebesar 250.
Number of accidents Number of drivers
Penyelesaian:
0 81,714
Pada data 𝑛 = 20, terdapat 1 11,306
2 1,618
• 𝑛, = 13 kerugian di atas
3 deductible 250, dan 250
4 40
• 𝑛- = 4 di antaranya5 melebihi
or more
1250 (sehingga pembayaran
7
klaim adalah 1000).

Table 11.2 Data Set B.


27 82 115 126 155 161 243 294 340 384
457 680 855 877 974 1,193 1,340 1,884 2,558 15,743

Definition 11.2 A parametric distribution is a set of distribution functions, each member 28


Peluang empiris adalah
𝑛8 4
𝑝̂ = = = 0.3077.
𝑛7 13
Serta penduga varians
𝑛7 − 𝑛8 𝑛8 13 − 4 4
A 𝑝̂ =
𝑉𝑎𝑟 = = 0.016386.
3 133
𝑛7

29
Fungsi survival data berkelompok
Untuk data berkelompok, fungsi survival akan diduga dengan menggunakan
cara berikut. Misalkan nilai 𝑥 ada di antara 𝑐!#$ dan 𝑐! .
Notasikan
• 𝑌 sebagai banyaknya pengamatan pada atau di bawah 𝑐!#$ , serta
• 𝑍 sebagai banyaknya pengamatan di atas 𝑐!#$ tetapi terletak pada atau di
bawah 𝑐! .
Maka nilai ogive dari fungsi survival adalah
𝑌 𝑐! − 𝑐!#$ + 𝑍 𝑥 − 𝑐!#$
𝑆+ 𝑥 = 1 − .
𝑛 𝑐! − 𝑐!#$
30
Serta nilai harapan survival
𝑛 1 − 𝑆 𝑐%/! 𝑐% − 𝑐%/! + 𝑛 𝑆 𝑐%/! − 𝑆 𝑐% 𝑥 − 𝑐%/!
𝐸 𝑆& 𝑥 =1−
𝑛 𝑐% − 𝑐%/!
𝑐% − 𝑥 𝑥 − 𝑐%/!
= 𝑆 𝑐%/! + 𝑆 𝑐% .
𝑐% − 𝑐%/! 𝑐% − 𝑐%/!

Nilai ini adalah berbias, walau merupakan penduga tak bias dari nilai
interpolasi sebenarnya.

31
Selanjutnya, varians dari penduga survival adalah
1 1
". #"./0 $%& ' ( )#"./0 $%& * (+ ". #"./0 )#"./0 ,-. ',*
𝑉𝑎𝑟 𝑆! 𝑥 = 1
! ". #"./0

dengan
𝑉𝑎𝑟 𝑌 = 𝑛 𝑆 𝑐)*& 1 − 𝑆 𝑐)*&

𝑉𝑎𝑟 𝑍 = 𝑛 𝑆 𝑐)*& − 𝑆 𝑐) 1 − 𝑆 𝑐)*& + 𝑆 𝑐)

𝐶𝑜𝑣 𝑌, 𝑍 = −𝑛 1 − 𝑆 𝑐)*& 𝑆 𝑐)*& − 𝑆 𝑐)

32
Untuk penduga density, nilai histogram adalah
𝑍
𝑓& 𝑥 =
𝑛 𝑐% − 𝑐%/!
dan
𝑆 𝑐%/! − 𝑆 𝑐%
𝐸 𝑓& 𝑥 =
𝑐% − 𝑐%/!
yang merupakan penduga berbias dari fungsi density sebenarnya. Serta
varians adalah
𝑆 𝑐%/! − 𝑆 𝑐% 1 − 𝑆 𝑐%/! + 𝑆 𝑐%
𝑉𝑎𝑟 𝑓& 𝑥 = "
𝑛 𝑐% − 𝑐%/!
33
Contoh 3.6
Dari data C, tentukan penduga 𝑆 10,000 , 𝑓 10,000 , serta varians dari
penduga tersebut.
INTRODUCTION 205
Penyelesaian:
1.3 Data Set C. Dari Data C dicatat: 𝑛 = 227,
Payment range Number of payments
0-7,500 99 nilai 𝑥 = 10,000 terletak antara
7,500-17,500 42
𝑐%/! = 7,500 dan 𝑐% = 17,500
17,500-32,500 29
32,500-67,500 28 sehingga 𝑌 = 99 dan 𝑍 = 42.
67,500-125,000 17
125,000-300,000 9
Over 300,000 3
34
𝑌 𝑐" − 𝑐"#$ + 𝑍 𝑥 − 𝑐"#$
𝑆! 𝑥 = 1 −
Penduga peluang survival adalah 𝑛 𝑐" − 𝑐"#$

99 17500 − 7500 + 42 10000 − 7500


𝑆223 10000 = 1 − = 0.51762.
227 17500 − 7500

𝑍
𝑓! 𝑥 =
Serta penduga density peluang 𝑛 𝑐" − 𝑐"#$

42
𝑓223 10,000 = = 0.000018502.
227 17500 − 7500

35
Untuk menduga varians, hitung terlebih dahulu
99×10000 + 42×0 128 𝑆! 𝑥 = 1 −
𝑌 𝑐" − 𝑐"#$ + 𝑍 𝑥 − 𝑐"#$
𝑆 7500 = 1 − = 𝑛 𝑐" − 𝑐"#$
227×10000 227
99×10000 + 42×10000 86
𝑆 17500 = 1 − =
227×10000 227
128 99
𝑉𝑎𝑟 𝑌 = 227×𝑆 7,500 1 − 𝑆 7,500 = 227×
227 227
𝑉𝑎𝑟 𝑍 = 227 𝑆 7,500 − 𝑆 17,500 1 − 𝑆 7,500 + 𝑆 17,500
128 86 128 86 42 185
= 227× − 1− + = 227×
227 227 227 227 227 227
𝐶𝑜𝑣 𝑌, 𝑍 = −227 1 − 𝑆 7500 𝑆 7500 − 𝑆 17500
128 128 86 99 42
= −227 1 − − = −227×
227 227 227 227 227
36
Sehingga didapat penduga varians survival
% %
𝑐" − 𝑐"#$ 𝑉𝑎𝑟 𝑌 + 𝑥 − 𝑐"#$ 𝑉𝑎𝑟 𝑍 + 2 𝑐" − 𝑐"#$ 𝑥 − 𝑐"#$ 𝐶𝑜𝑣 𝑌, 𝑍
𝑉𝑎𝑟 𝑆! 𝑥 = %
𝑛 𝑐" − 𝑐"#$

M 𝑆223 10000
𝑉𝑎𝑟
1 99 128 42 185 99 42
= 2 100002 + 25002 − 2 10000 2500
227 10,000 227 227 227 227 227 227

= 0.00094713

𝑆 𝑐"#$ − 𝑆 𝑐" 1 − 𝑆 𝑐"#$ + 𝑆 𝑐"


Serta penduga varians density 𝑉𝑎𝑟 𝑓! 𝑥 =
𝑛 𝑐" − 𝑐"#$
%

42 185
227 227 42×185
M 𝑓223 10,000
𝑉𝑎𝑟 = = = 6.6427×10*&2 .
227×100002 227?100002
37
Data Diskret
Data diskret dapat dipandang sebagai bentuk khusus dari data
berkelompok.
Misalkan 𝑁% adalah banyaknya kemunculan nilai 𝑥% dalam contoh. Maka
𝑁% memiliki distribusi binomial dengan parameter 𝑛 dan 𝑝 𝑥% .
Penduga empiris adalah
𝑁%
𝑝& 𝑥% = .
𝑛

38
Nilai harapan penduga
𝑁% 𝑛𝑝 𝑥%
𝐸 𝑝& 𝑥% =𝐸 = = 𝑝 𝑥%
𝑛 𝑛
menunjukkan bahwa penduga tak berbias.

Nilai varians
𝑁% 𝑛𝑝 𝑥% 1 − 𝑝 𝑥% 𝑝 𝑥% 1 − 𝑝 𝑥%
𝑉𝑎𝑟 𝑝& 𝑥% = 𝑉𝑎𝑟 = =
𝑛 𝑛" 𝑛
menunjukkan kekonsistenan karena menuju nol jika 𝑛 → ∞.

39
204 ESTIMATION FOR COMPLETE DATA

Contoh 3.7
Table 11.1 Data Set A.
Number of accidents Number of drivers
Dari data A, tentukan penduga empiris 𝑝 2 0 81,714
1 11,306
dan berikan penduga variansnya. 2 1,618
3 250
Penyelesaian: 4 40
5 or more 7
Penduga empiris
Table 11.2 Data Set B.
𝑁! 27161882 115 126 155 161 243 294 3
𝑝,-,./ 2 = = 457 680 = 855
0.017043
877 974 1,193 1,340 1,884 2,5
𝑛 94935
Varians Definition 11.2 A parametric distribution is a set of distribution functions,
of which is determined by specifying one or more values called parameters.
of parameters is fixed and finite.
𝑝 𝑥! 1 − 𝑝 𝑥! 0.017043 0.982957 #1 depend
𝑉𝑎𝑟 𝑝,-,,./ 2 = = Here, only two data-dependent distributions
= 1.76466×10
are considered. They .
𝑛 similar ways.94,935
The simplest definitions follow for the two types considered.

Definition 11.3 The empirical distribution is obtained by assigning proba


each data point. 40
Contoh 3.8
Gunakan data A untuk menyusun selang kepercayaan 95% untuk 𝑝 2 .
Penyelesaian:
Dari handout-1 (Bab 10) selang kepercayaan 1 − 𝛼 % untuk parameter 𝜃
adalah

𝜃R − 𝜃
𝑃𝑟 −𝑧2/( ≤ ≤ 𝑧2/( =̇ 1 − 𝛼
𝑣 𝜃
Sehingga selang kepercayaan 95% untuk 𝑝 2 adalah
𝑝+ 2 − 𝑝 2
𝑃𝑟 −1.96 ≤ ≤ 1.96 = 0.95
𝑝 2 1 − 𝑝 2 /𝑛
41
Akan ditentukan ujung interval kepercayaan bagi parameter 𝑝 dengan
menyelesaikan persamaan kuadrat berikut
𝑝& − 𝑝 𝑝& − 𝑝
−1.96 ≤ ≤ 1.96 ↔ ≤ 1.96
𝑝 1 − 𝑝 /𝑛 𝑝 1 − 𝑝 /𝑛
𝑝& − 𝑝 " 𝑛
= 1.96" ↔ 𝑛𝑝&" − 2𝑛𝑝𝑝& + 𝑛𝑝" = 1.96" 𝑝 − 1.96" 𝑝"
𝑝 1−𝑝
↔ 𝑛 + 1.96" 𝑝" − 2𝑛𝑝& + 1.96" 𝑝 + 𝑛𝑝&" = 0

2𝑛𝑝& + 1.96" ± 2𝑛𝑝& + 1.96" " − 4 𝑛 + 1.96" 𝑛𝑝&"


↔𝑝= .
2 𝑛 + 1.96"

42
Dari data A serta Contoh 3.7 didapat 𝑛 = 94,935 dan 𝑝& 2 = 0.017043,
sehingga selang kepercayaan 95% adalah
0.016239, 0.017886 .
Sebagai alternatif, dapat digunakan formula

𝑝& 1 − 𝑝&
𝑝& ± 1.96 .
𝑛
Untuk mendapatkan 0.017043 ± 0.000823 sebagai ujung-ujung interval,
sehingga selang kepercayaan 95% didapat
0.016220, 0.017866 .

43
Data Tersensor atau Terpotong
Jika data adalah tersensor atau terpotong, maka asumsi distribusi
binomial tidak lagi terpenuhi. Sehinga pendugaan dilakukan dengan
menggunakan penduga Kaplan-Meier product limit untuk 𝑆 𝑡 .
9" /+"
Pada bentuk asumsikan 𝑟% adalah fixed dan 𝑠% adalah acak, maka
9"

peubah acak 𝑆% memiliki distribusi binomial dengan peluang sukses


: 8"#$ /: 8"
adalah .
: 8"#$

44
Selanjutnya penduga tersebut adalah tak bias dengan
𝑟% − 𝑆% 𝑟% − 𝑟% 𝑆 𝑦%/! − 𝑆 𝑦% /𝑆 𝑦%/! 𝑆 𝑦%
𝐸 = = .
𝑟% 𝑟% 𝑆 𝑦%/!
Varians penduga adalah

𝑆 𝑦%/! − 𝑆 𝑦% 𝑆 𝑦%/! − 𝑆 𝑦%
𝑟% 1−
𝑟% − 𝑆% 𝑆 𝑦%/! 𝑆 𝑦%/!
𝑉𝑎𝑟 =
𝑟% 𝑟%"

𝑆 𝑦%/! − 𝑆 𝑦% 𝑆 𝑦%
= " .
𝑟% 𝑆 𝑦%/!
45
Selanjutnya diperhatikan penduga peluang survival pada usia kematian
tertentu 𝑆 𝑦% . Didapat nilai harapan
% % %
𝑟$ − 𝑆$ 𝑟$ − 𝑆$ 𝑆 𝑦$ 𝑆 𝑦$
𝐸 𝑆< 𝑦% =𝐸 : = :𝐸 =: =
𝑟$ 𝑟$ 𝑆 𝑦$/! 𝑆 𝑦4
$.! $.! $.!

dengan 𝑦4 adalah nilai terkecil yang teramati dalam sampel. Hasil


tersebut menunjukkan penduga adalah tak berbias.
Varians diberikan oleh
" %
𝑆 𝑦$ 𝑆 𝑦$/! − 𝑆 𝑦$
𝑉𝑎𝑟 𝑆& 𝑦% =̇ a .
𝑆 𝑦4 𝑟$ 𝑆 𝑦$
$.!
46
Karena survival 𝑆 𝑦% adalah bersyarat survival pada umur 𝑦4 , maka
9% /+% : 8%
9%
adalah penduga bagi : 8%#$
, sehingga didapat

%
" 𝑠$
A 𝑆& 𝑦%
𝑉𝑎𝑟 =̇ 𝑆& 𝑦% a .
𝑟$ 𝑟$ − 𝑠$
$.!

yang dikenal sebagai aproksimasi Greenwood.

47
Contoh 3.9
Menggunakan data D1, akan diduga varians dari 𝑆34 3 dengan cara
langsung dan menggunakan aproksimasi Greenwood.
Penyelesaian:
Data tidak mengalami pemotongan atau
sensoring dan diolah sebagai berikut:

48
Penduga empiris survival:
27
𝑆34 3 = .
30
Penduga varians empiris:
𝑆34 3 1 − 𝑆34 3 27/30 3/30 81
A 𝑆34 3
𝑉𝑎𝑟 = = = 3
30 30 30
Penduga varians aproksimasi Greenwood:
" "
𝑠$ 27 1 2 81
A 𝑆34 3
𝑉𝑎𝑟 =̇ 𝑆34 3 "
a = + = 3.
𝑟$ 𝑟$ − 𝑠$ 30 30 29 29 27 30
$.!

Catatan: hasil akan selalu identik untuk data tidak terpotong dan tidak tersensor.
49
Selamat Belajar

AKT403 Teori Risiko II – Pertemuan Online 3

50

Anda mungkin juga menyukai