Terisk2 - 3 - Compressed
Terisk2 - 3 - Compressed
AKT 403
TEORI RISIKO II
Koordinator: Endar H. Nugrahani
Edisi Online, Semester Ganjil 2020/2021
Materi Pertemuan ke-3
Bagian - 1
2
3.1 Pendugaan Titik Data Dimodifikasi
• Data hasil pengamatan bisa jadi tak lengkap karena berbagai sebab, di
antaranya karena terpotong ataupun tersensor.
• Data klaim asuransi umumnya terpotong dari bawah karena adanya
besaran deductible atau risiko sendiri sebesar 𝑑, sehingga data kerugian
di bawah 𝑑 tidak tercatat.
• Data limit polis adalah tersensor di kanan, yaitu jika kerugian bernilai
lebih dari 𝑢 maka tidak ada benefit yang akan dibayarkan, sehingga nilai
kerugian hanya akan dicatat sebagai setidaknya sebesar 𝑢.
3
Definisi 3.1
4
Definisi 3.1 (cont'd)
5
Prosedur penentuan distribusi empiris:
Dari data individual yang terpotong atau tersensor:
• Catat 𝑦! < 𝑦" < ⋯ < 𝑦# , 𝑘 ≤ 𝑛, sebagai 𝑘 nilai unik data tak tersensor
yang muncul dalam sampel 𝑥$ , 𝑖 = 1, . . . , 𝑛,
• Tetapkan nilai pemotongan data sebagai 𝑑% ,
• Jika tidak terdapat pemotongan, maka tetapkan 𝑑% = 0.
• Hitung 𝑠% : banyaknya nilai tak tersensor 𝑦% muncul dalam sampel,
• Pengamatan dicatat sebagai berikut:
• Jika data teramati, maka catat sebagai 𝑥!
• Jika data tersensor maka dicatat sebagai 𝑢!
6
• Tentukan nilai gugus risiko 𝑟! pada observasi ke-𝑗:
atau
𝑟! = 𝐵𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑑" < 𝑦! − 𝐵𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑥" < 𝑦! − 𝐵𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑢" < 𝑦!
dengan 𝑟% = 0.
7
Contoh 3.1
Diketahui Data D2
(dari Bab 11)
tentang data 40
polis asuransi jiwa
berikut.
Akan ditentukan
nilai gugus risiko 𝑟% .
8
Penyelesaian:
Tentukan terlebih
dahulu nilai
pemotongan 𝑑$ dan
sensor 𝑢$ untuk setiap
titik data 𝑖.
9
Setelah itu data disajikan sebagai nilai 𝑦% , kemudian ditetapkan banyak
observasi 𝑠% , serta dihitung gugus risiko 𝑟% .
10
Setelah mendapatkan nilai gugus risiko 𝑟! , kita masih harus menentukan fungsi
survival empiris, yang lazim menggunakan penduga Kaplan-Meier Product-
Limit :
• Nilai survival dimulai dengan 𝑆 0 = 1, karena semua individu masih
bertahan hidup sebelum 𝑦$ .
• Selanjutnya, tepat sebelum 𝑦$ terdapat 𝑟$ individu berisiko meninggal, tetapi
hanya 𝑠$ yang benar meninggal.
&!#'!
• Sehingga peluang survival setelah 𝑦$ adalah 𝑆 𝑦$ = &!
.
• Dengan pemikiran yang sama, survival setelah 𝑦( adalah
𝑟( − 𝑠(
𝑆 𝑦( = 𝑆 𝑦$ .
2
• Demikian seterusnya untuk nilai 𝑦" yang lain.
11
Penduga Kaplan-Meier Product-Limit untuk fungsi survival empiris:
13
Contoh 3.2
222 ESTIMATION FOR MODIFIED DATA
Penduga fungsi
Based on survival
the previous Kaplan-Meier dari
example, we have Contoh 3.1 adalah
Ί, 0 < t < 0.8,
30-1
30 = 0.9667, 0.8 < t < 2.9,
0M^,Ύ7^^
2G
= 0.8923, 2.9 < t < 3.1,
15
16
Tugas (*): Implementasikan prosedur ini untuk data Contoh 3.1 pada sesi Responsi.
17
Alternatif dengan modifikasi penduga Nelson-Åalen
Misalkan:
• 𝑟 𝑡 adalah gugus risiko pada saat 𝑡;
• ℎ 𝑡 adalah fungsi tingkat hazard;
• 𝑠 𝑡 harapan terjadinya kematian sebelum waktu 𝑡.
Maka dapat dirumuskan
*
𝑠 𝑡 = : 𝑟 𝑢 ℎ 𝑢 𝑑𝑢 .
%
Didapat turunan
𝑑𝑠 𝑡
= 𝑟 𝑡 ℎ 𝑡 ↔ 𝑑𝑠 𝑡 = 𝑟 𝑡 ℎ 𝑡 𝑑𝑡.
𝑑𝑡
18
Serta
𝑑𝑠 𝑡
= ℎ 𝑡 𝑑𝑡.
𝑟 𝑡
Sehingga dengan pengintegralan didapat
" "
𝑑𝑠 𝑢
( = ( ℎ 𝑢 𝑑𝑢 = 𝐻 𝑡 .
! 𝑟 𝑢 !
$
Menggantikan 𝑠 𝑡 dengan penduganya 𝑠̂ 𝑡 , maka ruas kiri menjadi ∑"! #" ! , sehingga
%!
didapat penduga Nelson-Åalen untuk fungsi hazard kumulatif
0, 0 ≤ 𝑡 < 𝑦&
)*& 𝑠
'
3 , 𝑦)*& ≤ 𝑡 < 𝑦) , 𝑗 = 2, . . . , 𝑘
- 𝑡 =
𝐻 '(& 𝑟'
+ 𝑠
'
3 , 𝑡 ≥ 𝑦+
'(& 𝑟'
19
Dengan demikian penduga survival adalah
𝑆< 𝑡 = 𝑒 /10 ' .
Untuk 𝑡 ≥ 𝑤 penduga alternatif adalah
𝑆< 𝑡 = 0 atau 𝑆< 𝑡 = 𝑆< 𝑦# '/(
.
20
and then
S(t) = e - * W .
ContohFor3.3
t>w, alternative estimates are S(t) = 0 and S(t) = S(yk)t/w-
■ EXAMPLE 12.3
Dari Data D2 pada Contoh 3.1,
Determine the Nelson^\alen estimate of the survival function for Data Set D2:
penduga fungsi hazard Nelson-Åalen
adalah:
0, 0 < t < 0.8,
22
3.2 Rata-rata, Varians, dan Pendugaan Interval
2
Penduga empiris fungsi survival 𝑆 𝑥 adalah 𝑆& 𝑥 = , di mana 𝑌 adalah
&
banyaknya observasi pada sampel yang lebih besar atau sama dengan 𝑥.
Sehingga 𝑌 memiliki distribusi binomial dengan parameter 𝑛 dan 𝑆 𝑥 ,
serta
𝑌 𝑛𝑆 𝑥
𝐸 𝑆& 𝑥 =𝐸 = =𝑆 𝑥
𝑛 𝑛
menunjukkan penduga adalah tak berbias.
23
Varians adalah
𝑌 𝑆 𝑥 1−𝑆 𝑥
𝑉𝑎𝑟 𝑆& 𝑥 = 𝑉𝑎𝑟 =
𝑛 𝑛
memiliki limit nol, yang menunjukkan sebagai penduga konsisten.
Penduga varians diberikan oleh
𝑆& 𝑥 1 − 𝑆& 𝑥
A 𝑆& 𝑥
𝑉𝑎𝑟 = .
𝑛
Misalkan peluang 𝑝 = 𝑃𝑟 𝑎 < 𝑥 ≤ 𝑏 maka penduga empirisnya adalah
𝑝 1−𝑝
𝑝̂ = 𝑆& 𝑎 − 𝑆& 𝑏 dan 𝑉𝑎𝑟 𝑝̂ = .
𝑛
24
Contoh 3.4
Gunakan Data Set D1 untuk menduga secara empiris peluang 𝑞" , yaitu
peluang polis yang aktif sampai waktu 2 akan mati sebelum waktu 3 tiba:
𝑆 2 −𝑆 3
𝑞" = .
𝑆 2
Penyelesaian:
"5 "6
𝑛 = 30, 𝑆34 2 = 34, dan 𝑆34 3 = 34, didapat
𝑆34 2 − 𝑆34 3 2
𝑞K" = = .
𝑆34 2 29
25
Varians dari penduga adalah
𝑌 𝑉𝑎𝑟 𝑌|𝑋
𝑉𝑎𝑟 𝑞K" |𝑋 = 1 = 𝑉𝑎𝑟 O𝑋 = 1 = "
.
30 − 𝑋 29
A 𝑌|𝑋 = 1 = 29 2/29 27/29 didapat
dengan 𝑉𝑎𝑟
29 2/29 27/29 2 27
A 𝑞K" |𝑋 = 1 =
𝑉𝑎𝑟 = .
29" 293
26
Penduga Varians dari peluang empiris
Untuk sampel berukuran 𝑛, misalkan
• 𝑛7 banyaknya individu yang bertahan hidup pada umur 𝑥, serta
• 𝑛8 banyaknya individu yang bertahan hidup pada umur 𝑦,
maka penduga varians adalah
𝑛7 − 𝑛8 𝑛8
A
𝑉𝑎𝑟 8/7 𝑞
K 7 R𝑛 7 A
= 𝑉𝑎𝑟 8/7 𝑝̂ 7 R𝑛7 = .
𝑛73
27
Contoh 3.5
204 ESTIMATION FOR COMPLETE DATA
Dari data set B, akan diduga secara empiris, peluang bahwa pembayaran klaim
setidaknya 1000 ketika ada batas
Tablerisiko sendiri
11.1 Data Set A. (deductible) sebesar 250.
Number of accidents Number of drivers
Penyelesaian:
0 81,714
Pada data 𝑛 = 20, terdapat 1 11,306
2 1,618
• 𝑛, = 13 kerugian di atas
3 deductible 250, dan 250
4 40
• 𝑛- = 4 di antaranya5 melebihi
or more
1250 (sehingga pembayaran
7
klaim adalah 1000).
29
Fungsi survival data berkelompok
Untuk data berkelompok, fungsi survival akan diduga dengan menggunakan
cara berikut. Misalkan nilai 𝑥 ada di antara 𝑐!#$ dan 𝑐! .
Notasikan
• 𝑌 sebagai banyaknya pengamatan pada atau di bawah 𝑐!#$ , serta
• 𝑍 sebagai banyaknya pengamatan di atas 𝑐!#$ tetapi terletak pada atau di
bawah 𝑐! .
Maka nilai ogive dari fungsi survival adalah
𝑌 𝑐! − 𝑐!#$ + 𝑍 𝑥 − 𝑐!#$
𝑆+ 𝑥 = 1 − .
𝑛 𝑐! − 𝑐!#$
30
Serta nilai harapan survival
𝑛 1 − 𝑆 𝑐%/! 𝑐% − 𝑐%/! + 𝑛 𝑆 𝑐%/! − 𝑆 𝑐% 𝑥 − 𝑐%/!
𝐸 𝑆& 𝑥 =1−
𝑛 𝑐% − 𝑐%/!
𝑐% − 𝑥 𝑥 − 𝑐%/!
= 𝑆 𝑐%/! + 𝑆 𝑐% .
𝑐% − 𝑐%/! 𝑐% − 𝑐%/!
Nilai ini adalah berbias, walau merupakan penduga tak bias dari nilai
interpolasi sebenarnya.
31
Selanjutnya, varians dari penduga survival adalah
1 1
". #"./0 $%& ' ( )#"./0 $%& * (+ ". #"./0 )#"./0 ,-. ',*
𝑉𝑎𝑟 𝑆! 𝑥 = 1
! ". #"./0
dengan
𝑉𝑎𝑟 𝑌 = 𝑛 𝑆 𝑐)*& 1 − 𝑆 𝑐)*&
32
Untuk penduga density, nilai histogram adalah
𝑍
𝑓& 𝑥 =
𝑛 𝑐% − 𝑐%/!
dan
𝑆 𝑐%/! − 𝑆 𝑐%
𝐸 𝑓& 𝑥 =
𝑐% − 𝑐%/!
yang merupakan penduga berbias dari fungsi density sebenarnya. Serta
varians adalah
𝑆 𝑐%/! − 𝑆 𝑐% 1 − 𝑆 𝑐%/! + 𝑆 𝑐%
𝑉𝑎𝑟 𝑓& 𝑥 = "
𝑛 𝑐% − 𝑐%/!
33
Contoh 3.6
Dari data C, tentukan penduga 𝑆 10,000 , 𝑓 10,000 , serta varians dari
penduga tersebut.
INTRODUCTION 205
Penyelesaian:
1.3 Data Set C. Dari Data C dicatat: 𝑛 = 227,
Payment range Number of payments
0-7,500 99 nilai 𝑥 = 10,000 terletak antara
7,500-17,500 42
𝑐%/! = 7,500 dan 𝑐% = 17,500
17,500-32,500 29
32,500-67,500 28 sehingga 𝑌 = 99 dan 𝑍 = 42.
67,500-125,000 17
125,000-300,000 9
Over 300,000 3
34
𝑌 𝑐" − 𝑐"#$ + 𝑍 𝑥 − 𝑐"#$
𝑆! 𝑥 = 1 −
Penduga peluang survival adalah 𝑛 𝑐" − 𝑐"#$
𝑍
𝑓! 𝑥 =
Serta penduga density peluang 𝑛 𝑐" − 𝑐"#$
42
𝑓223 10,000 = = 0.000018502.
227 17500 − 7500
35
Untuk menduga varians, hitung terlebih dahulu
99×10000 + 42×0 128 𝑆! 𝑥 = 1 −
𝑌 𝑐" − 𝑐"#$ + 𝑍 𝑥 − 𝑐"#$
𝑆 7500 = 1 − = 𝑛 𝑐" − 𝑐"#$
227×10000 227
99×10000 + 42×10000 86
𝑆 17500 = 1 − =
227×10000 227
128 99
𝑉𝑎𝑟 𝑌 = 227×𝑆 7,500 1 − 𝑆 7,500 = 227×
227 227
𝑉𝑎𝑟 𝑍 = 227 𝑆 7,500 − 𝑆 17,500 1 − 𝑆 7,500 + 𝑆 17,500
128 86 128 86 42 185
= 227× − 1− + = 227×
227 227 227 227 227 227
𝐶𝑜𝑣 𝑌, 𝑍 = −227 1 − 𝑆 7500 𝑆 7500 − 𝑆 17500
128 128 86 99 42
= −227 1 − − = −227×
227 227 227 227 227
36
Sehingga didapat penduga varians survival
% %
𝑐" − 𝑐"#$ 𝑉𝑎𝑟 𝑌 + 𝑥 − 𝑐"#$ 𝑉𝑎𝑟 𝑍 + 2 𝑐" − 𝑐"#$ 𝑥 − 𝑐"#$ 𝐶𝑜𝑣 𝑌, 𝑍
𝑉𝑎𝑟 𝑆! 𝑥 = %
𝑛 𝑐" − 𝑐"#$
M 𝑆223 10000
𝑉𝑎𝑟
1 99 128 42 185 99 42
= 2 100002 + 25002 − 2 10000 2500
227 10,000 227 227 227 227 227 227
= 0.00094713
42 185
227 227 42×185
M 𝑓223 10,000
𝑉𝑎𝑟 = = = 6.6427×10*&2 .
227×100002 227?100002
37
Data Diskret
Data diskret dapat dipandang sebagai bentuk khusus dari data
berkelompok.
Misalkan 𝑁% adalah banyaknya kemunculan nilai 𝑥% dalam contoh. Maka
𝑁% memiliki distribusi binomial dengan parameter 𝑛 dan 𝑝 𝑥% .
Penduga empiris adalah
𝑁%
𝑝& 𝑥% = .
𝑛
38
Nilai harapan penduga
𝑁% 𝑛𝑝 𝑥%
𝐸 𝑝& 𝑥% =𝐸 = = 𝑝 𝑥%
𝑛 𝑛
menunjukkan bahwa penduga tak berbias.
Nilai varians
𝑁% 𝑛𝑝 𝑥% 1 − 𝑝 𝑥% 𝑝 𝑥% 1 − 𝑝 𝑥%
𝑉𝑎𝑟 𝑝& 𝑥% = 𝑉𝑎𝑟 = =
𝑛 𝑛" 𝑛
menunjukkan kekonsistenan karena menuju nol jika 𝑛 → ∞.
39
204 ESTIMATION FOR COMPLETE DATA
Contoh 3.7
Table 11.1 Data Set A.
Number of accidents Number of drivers
Dari data A, tentukan penduga empiris 𝑝 2 0 81,714
1 11,306
dan berikan penduga variansnya. 2 1,618
3 250
Penyelesaian: 4 40
5 or more 7
Penduga empiris
Table 11.2 Data Set B.
𝑁! 27161882 115 126 155 161 243 294 3
𝑝,-,./ 2 = = 457 680 = 855
0.017043
877 974 1,193 1,340 1,884 2,5
𝑛 94935
Varians Definition 11.2 A parametric distribution is a set of distribution functions,
of which is determined by specifying one or more values called parameters.
of parameters is fixed and finite.
𝑝 𝑥! 1 − 𝑝 𝑥! 0.017043 0.982957 #1 depend
𝑉𝑎𝑟 𝑝,-,,./ 2 = = Here, only two data-dependent distributions
= 1.76466×10
are considered. They .
𝑛 similar ways.94,935
The simplest definitions follow for the two types considered.
𝜃R − 𝜃
𝑃𝑟 −𝑧2/( ≤ ≤ 𝑧2/( =̇ 1 − 𝛼
𝑣 𝜃
Sehingga selang kepercayaan 95% untuk 𝑝 2 adalah
𝑝+ 2 − 𝑝 2
𝑃𝑟 −1.96 ≤ ≤ 1.96 = 0.95
𝑝 2 1 − 𝑝 2 /𝑛
41
Akan ditentukan ujung interval kepercayaan bagi parameter 𝑝 dengan
menyelesaikan persamaan kuadrat berikut
𝑝& − 𝑝 𝑝& − 𝑝
−1.96 ≤ ≤ 1.96 ↔ ≤ 1.96
𝑝 1 − 𝑝 /𝑛 𝑝 1 − 𝑝 /𝑛
𝑝& − 𝑝 " 𝑛
= 1.96" ↔ 𝑛𝑝&" − 2𝑛𝑝𝑝& + 𝑛𝑝" = 1.96" 𝑝 − 1.96" 𝑝"
𝑝 1−𝑝
↔ 𝑛 + 1.96" 𝑝" − 2𝑛𝑝& + 1.96" 𝑝 + 𝑛𝑝&" = 0
42
Dari data A serta Contoh 3.7 didapat 𝑛 = 94,935 dan 𝑝& 2 = 0.017043,
sehingga selang kepercayaan 95% adalah
0.016239, 0.017886 .
Sebagai alternatif, dapat digunakan formula
𝑝& 1 − 𝑝&
𝑝& ± 1.96 .
𝑛
Untuk mendapatkan 0.017043 ± 0.000823 sebagai ujung-ujung interval,
sehingga selang kepercayaan 95% didapat
0.016220, 0.017866 .
43
Data Tersensor atau Terpotong
Jika data adalah tersensor atau terpotong, maka asumsi distribusi
binomial tidak lagi terpenuhi. Sehinga pendugaan dilakukan dengan
menggunakan penduga Kaplan-Meier product limit untuk 𝑆 𝑡 .
9" /+"
Pada bentuk asumsikan 𝑟% adalah fixed dan 𝑠% adalah acak, maka
9"
44
Selanjutnya penduga tersebut adalah tak bias dengan
𝑟% − 𝑆% 𝑟% − 𝑟% 𝑆 𝑦%/! − 𝑆 𝑦% /𝑆 𝑦%/! 𝑆 𝑦%
𝐸 = = .
𝑟% 𝑟% 𝑆 𝑦%/!
Varians penduga adalah
𝑆 𝑦%/! − 𝑆 𝑦% 𝑆 𝑦%/! − 𝑆 𝑦%
𝑟% 1−
𝑟% − 𝑆% 𝑆 𝑦%/! 𝑆 𝑦%/!
𝑉𝑎𝑟 =
𝑟% 𝑟%"
𝑆 𝑦%/! − 𝑆 𝑦% 𝑆 𝑦%
= " .
𝑟% 𝑆 𝑦%/!
45
Selanjutnya diperhatikan penduga peluang survival pada usia kematian
tertentu 𝑆 𝑦% . Didapat nilai harapan
% % %
𝑟$ − 𝑆$ 𝑟$ − 𝑆$ 𝑆 𝑦$ 𝑆 𝑦$
𝐸 𝑆< 𝑦% =𝐸 : = :𝐸 =: =
𝑟$ 𝑟$ 𝑆 𝑦$/! 𝑆 𝑦4
$.! $.! $.!
%
" 𝑠$
A 𝑆& 𝑦%
𝑉𝑎𝑟 =̇ 𝑆& 𝑦% a .
𝑟$ 𝑟$ − 𝑠$
$.!
47
Contoh 3.9
Menggunakan data D1, akan diduga varians dari 𝑆34 3 dengan cara
langsung dan menggunakan aproksimasi Greenwood.
Penyelesaian:
Data tidak mengalami pemotongan atau
sensoring dan diolah sebagai berikut:
48
Penduga empiris survival:
27
𝑆34 3 = .
30
Penduga varians empiris:
𝑆34 3 1 − 𝑆34 3 27/30 3/30 81
A 𝑆34 3
𝑉𝑎𝑟 = = = 3
30 30 30
Penduga varians aproksimasi Greenwood:
" "
𝑠$ 27 1 2 81
A 𝑆34 3
𝑉𝑎𝑟 =̇ 𝑆34 3 "
a = + = 3.
𝑟$ 𝑟$ − 𝑠$ 30 30 29 29 27 30
$.!
Catatan: hasil akan selalu identik untuk data tidak terpotong dan tidak tersensor.
49
Selamat Belajar
50