Anda di halaman 1dari 26

Program Studi Aktuaria – Departemen Matematika

AKT 403

TEORI RISIKO II
Koordinator: Endar H. Nugrahani
Edisi Online, Semester Ganjil 2020/2021
Materi Pertemuan ke-2

2.1 Pendahuluan Metode Pendugaan


2.2 Distribusi Empiris
2.3 Distribusi Empiris untuk Data Berkelompok
2
2.1 Pendahuluan Metode Pendugaan
Definisi 2.1 Distribusi bergantung data setidaknya sama kompleksnya dengan data
atau pengetahuan penyusunnya, banyak parameter meningkat seiring
dengan peningkatan pengetahuan yang diinginkan.

Definisi 2.2 Distribusi parametrik adalah sekumpulan fungsi distribusi, di mana


masing-masing ditentukan oleh sejumlah nilai parameter. Banyaknya
parameter adalah tetap dan terbatas.
1
Definisi 2.3 Distribusi empiris diperoleh dengan memberikan peluang 𝑛 untuk setiap
titik data.

Definisi 2.4 Distribusi kernel diperhalus diperoleh dengan menggantikan setiap titik
1
data dengan peubah acak kontinu dan kemudian memberikan peluang 𝑛
untuk setiap peubah acak tersebut.
3
2.2 Distribusi Empiris
!
Distribusi empiris mengalokasikan peluang pada setiap titik data,
"
sehingga didefinisikan fungsi distribusi empiris berikut.

Definisi 2.5 Fungsi Distribusi Empiris adalah


𝐵𝑎𝑛𝑦𝑎𝑘 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑠𝑖 ≤ 𝑥
𝐹" 𝑥 =
𝑛
dengan 𝑛 adalah banyaknya observasi.

4
Contoh 2.1
a. Akan ditentukan fungsi peluang dan distribusi empiris dari data berikut
Data A: Data banyaknya kecelakaan yang dialami oleh seorang pengemudi
selama
204
setahun antara
ESTIMATION FOR COMPLETE DATA
1956-1958. Data terkumpul atas 94,935
orang pengemudi (Dropkin, 1959)
Table 11.1 Data Set A.
Number of accidents Number of drivers
0 81,714
1 11,306
2 1,618
3 250
4 40
5 or more 7
5
Fungsi peluang empiris:
81,714/94,935 = 0.860736, 𝑥 =0
11,306/94,935 = 0.119092, 𝑥 =1
1,618/94,935 = 0.017043, 𝑥 =2
𝑝#$,#&' 𝑥 =
250/94,935 = 0.002633, 𝑥 =3
40/94,935 = 0.000421, 𝑥 =4
7/94,935 = 0.000074, 𝑥 =5

Fungsi distribusi empiris:


0/94,935 = 0.0000 𝑥<0
81,714/94,935 = 0.860736, 0≤𝑥<1
ON FOR COMPLETE DATA 93,020/94,935 = 0.979828, 1≤𝑥<2
Table 11.1 Data Set A.
𝐹#$,#&' 𝑥 = 94,638/94,935 = 0.996872, 2≤𝑥<3
Number of accidents Number of drivers 94,888/94,935 = 0.999505, 3≤𝑥<4
0 81,714
1 11,306 94,928/94,935 = 0.999926, 4≤𝑥<5
2
3
1,618
250
94,935/94,935 = 1, 𝑥≥5
4 40
5 or more 7 6
1 11,306

b. Akan ditentukan fungsi23 peluang empiris dari 1,618


data berikut.
250
4 40
Data B: Data artifisial (buatan) sampel
5 or more
acak 20 pembayaran
7
benefit
kompensasi medis.
Table 11.2 Data Set B.
27 82 115 126 155 161 243 294 340 384
457 680 855 877 974 1,193 1,340 1,884 2,558 15,743

Fungsi peluang
Definition empiris
11.2 A parametric distribution is a set of distribution functions, each member
of which is determined by specifying one or more values called parameters. The number
of parameters is fixed and finite.
0.05, 𝑥 = 27,
0.05, 𝑥 = 82,
Here, only two data-dependent distributions are considered. They depend on the data in
similar ways. The simplest definitions follow for the two types considered.
𝑝#$ 𝑥 = 0.05, 𝑥 = 115,
Definition 11.3 The empirical distribution is obtained by assigning probability \/n to
each data point.
⋮ ⋮
0.05, 𝑥 = 15,743.
Definition 11.4 A kernel smoothed distribution is obtained by replacing each data point
with a continuous random variable and then assigning probability 1/n to each such random 7
Sejauh ini, fungsi distribusi empiris adalah diskret. Karena turunan fungsi
diskret tidak dimungkinkan, maka fungsi kepekatan peluang dan fungsi hazard
akan ditentukan dengan pendekatan empiris berikut.

Definisi 2.6 Fungsi hazard rate kumulatif adalah


𝐻 𝑥 = − ln 𝑆 𝑥 .

Perhatikan jika fungsi survival 𝑆 𝑥 terturunkan, maka


𝑆′ 𝑥 𝑓 𝑥
𝐻′ 𝑥 = − = =ℎ 𝑥
𝑆 𝑥 𝑆 𝑥
#
sehingga 𝐻 𝑥 = ∫−∞ ℎ 𝑦 𝑑𝑦.
8
Perhatikan pula bahwa
𝑆 𝑥 = 𝑒 %& '
,
Sehingga, fungsi distribusi adalah
𝐹 𝑥 = 1 − 𝑆 𝑥 = 1 − 𝑒 %& '
.
Dengan demikian, mendapatkan dugaan bagi fungsi hazard kumulatif
dapat digunakan untuk menduga fungsi distribusi.

9
Menentukan fungsi distribusi empiris berdasarkan sampel berukuran 𝑛:
• Catat 𝑦! < 𝑦# < ⋯ < 𝑦( , 𝑘 ≤ 𝑛, sebagai 𝑘 nilai unik yang muncul dalam
sampel
• Notasikan 𝑠) sebagai banyaknya kemunculan observasi 𝑦) dalam
sampel.
• Periksa bahwa ∑()*! 𝑠) = 𝑛.
• Perlu dicermati: pengamatan yang lebih besar atau sama dengan nilai
tertentu, disebut sebagai himpunan risiko (risk set).
• Tentukan 𝑟) = ∑(+*) 𝑠+ sebagai banyaknya observasi yang lebih besar
atau sama dengan 𝑦) .
10
Fungsi distribusi empiris adalah

0, 𝑥 < 𝑦! ,
𝑟)
𝐹" 𝑥 = 1 − , 𝑦)%! ≤ 𝑥 ≤ 𝑦) , 𝑗 = 2, … , 𝑘,
𝑛
1, 𝑥 ≥ 𝑦( .

Sedangkan fungsi survival empiris adalah

1, 𝑥 < 𝑦! ,
𝑟)
𝑆" 𝑥 = , 𝑦)%! ≤ 𝑥 ≤ 𝑦) , 𝑗 = 2, … , 𝑘,
𝑛
0, 𝑥 ≥ 𝑦( .

11
Contoh 2.2
Akan ditentukan fungsi distribusi empiris berdasarkan data berikut:
1.0, 1.3, 1.5, 1.5, 2.1, 2.1, 2.1, 2.8.
Penyelesaian:
Perhatikan bahwa 𝑛 = 8 dan terdapat 𝑘 = 5 observasi berbeda.
Ringkasan data adalah:

12
Fungsi distribusi empiris

adalah

13
Penduga fungsi hazard rate kumulatif

Definisi 2.7 Penduga Nelson-Åalen untuk fungsi hazard rate kumulatif

0, 𝑥 < 𝑦! ,
)%!
𝑠+
H , 𝑦)%! ≤ 𝑥 ≤ 𝑦) , 𝑗 = 2, … , 𝑘
F 𝑟
𝐻 𝑥 = +*! +
(
𝑠+
H 𝑥 ≥ 𝑦( .
𝑟+
+*!

14
Contoh 2.3
Dari Contoh 2.2, akan ditentukan penduga 209 Nelson-Åalen untuk fungsi
THE EMPIRICAL DISTRIBUTION FOR COMPLETE, INDIVIDUAL DATA

hazard rate kumulatif dan digunakan


Table 11.6 Values for Example 11.2.
untuk menduga fungsi distribusi.
3 yj Sj **
1 1.0 1 8
2 1.3 1 7
3 1.5 2 6
4 2.1 3 4
5 2.8 1 1

ne empirical estimates, some additional notation is needed. For a sample of size


2/2 < ■ ■ ■ < Vk be the k unique values that appear in the sample, where k must
n or equal to n. Let Sj be the number of times the observation yj appears in the
hus, ΣΪ=\ SJ = n- Also of interest is the number of observations in the data set
eater than or equal to a given value. Both the observations themselves and the
observations are referred to as the risk set. Let Tj = Σί=ϊ Si be the number
tions greater than or equal to yj. Using this notation, the empirical distribution
15
Hasil tersebut dapat digunakan untuk alternatif pendugaan:
I ,
%& '
Fungsi distribusi, 𝐹 𝑥 = 1 − 𝑒 , yaitu

0, 𝑥 < 1.0,
1 − 𝑒 %$.!#. = 0.1175, 1.0 ≤ 𝑥 < 1.3,
%$.#/0 1.3 ≤ 𝑥 < 1.5,
1 − 𝑒 = 0.2351,
𝐹I 𝑥 = 1.5 ≤ 𝑥 < 2.1,
1 − 𝑒 %$./$! = 0.4517,
1 − 𝑒 %!.1.! = 0.7410, 2.1 ≤ 𝑥 < 2.8,
1 − 𝑒 %#.1.! = 0.9047, 𝑥 ≥ 2.8.
Hasil ini tidak sama dengan penduga distribusi
empiris (Contoh 2.2).
Adalah lazim, metode pendugaan berbeda, akan
memberikan hasil berbeda.
16
Contoh 2.4
Diberikan Data D1: 30 pemegang polis
asuransi jiwa periode 5 tahun.
Pertanggungan akan diakhiri jika
pemegang polis meninggal dan/atau
mengundurkan diri sebelum jatuh
tempo.
Akan ditentukan untuk data waktu
kematian:
• fungsi survival empiris,
• penduga Nelson-Åalen untuk fungsi
hazard rate kumulatif,
• penduga fungsi survival.
17
Penyelesaian:
Perhatikan bahwa 𝑛 = 30 dan terdapat 𝑘 = 5 waktu kematian berbeda.
Ringkasan data beserta hasil sebagai berikut:
Penduga Nelson-Åalen hazard
Fs survival empiris Penduga survival
rate kumulatif

Catatan: masing-masing baris didefinisikan untuk interval 𝑦( ≤ 𝑥 < 𝑦()*.


18
2.3 Distribusi Empiris Data Berkelompok
• Misalkan data dapat dikelompokkan dalam 𝑘 kelompok, notasikan batas
kelompok 𝑐0 < 𝑐1 < ⋯ 𝑐𝑘 , di mana mungkin saja 𝑐0 = 0 dan 𝑐𝑘 = ∞.
• Misalkan 𝑛) : banyaknya observasi di antara 𝑐𝑗−1 dan 𝑐𝑗 , dengan
𝑘
H 𝑛𝑗 = 𝑛.
𝑗=1

• Distribusi empiris di setiap kelompok adalah


1 𝑗
𝐹𝑛 𝑐𝑗 = H 𝑛𝑖
𝑛 𝑖=1

19
Fungsi distribusi
data, we areempiris data berkelompok.
able to determine the empirical distribution at each group boundary.That is,
Fn(cj) = (1/n) Σ£=ι ni- Note that no rule is proposed for observations that fall on a
group boundary. There is no correct approach, but whatever approach is used, consistency
Definisi 2.8 Untuk data berkelompok, fungsi distribusi empiris diperoleh
in assignment of observations to groups should be used. Note that in Data Set C it is not
dengan
possible menghubungkan
to tell how the assignments werenilai
made.fungsi distribusi
If we had pada masing-
that knowledge, it would not
affect any subsequent calculations.2
masing batas kelompok dengan suatu garis lurus,
Definition 11.8 For grouped data, the distribution function obtained by connecting the
menghasilkan grafik ogive. Formulasi fungsi distribusi data
values of the empirical distribution function at the group boundaries with straight lines is
calledberkelompok adalah:
the ogive. The formula is

Fn(x) = -*Zi-F9fo_x) + lZ^t±Fn{Cj)i Cj_x < x< c ..


Cj - Cj-i Cj - Cj-i

This function is differentiable at all values except group boundaries. Therefore the
densityini
Catatan: fungsi function can be obtained.pada setiap
terdiferensialkan To completely specify
titik the density
kecuali function,kelompok.
pada batas it is arbitrarily
made right continuous.
Dengan demikian fungsi kepekatan peluang akan dapat diperoleh dengan
Definition 11.9
menentukan For grouped data, the empirical density function can be obtained by dif-
turunannya.
ferentiating the ogive. The resulting function is called a histogram. The formula is 20
Fn(x) = -*Zi-F9fo_x) + lZ^t±Fn{Cj)i Cj_x <x< c..
Cj - Cj-i Cj - Cj-i
Fungsi kepekatan peluang empiris data berkelompok
This function is differentiable at all values except group boundaries. Therefore the
density function can be obtained. To completely specify the density function, it is arbitrarily
Definisi 2.9 continuous.
made right Untuk data berkelompok, fungsi kepekatan peluang empiris
dapat diperoleh dengan menurunkan ogive, grafik hasilnya
Definition 11.9 For grouped data, the empirical density function can be obtained by dif-
ferentiating disebut histogram:
the ogive. The resulting function is called a histogram. The formula is

FnjCj) - FnjCj-j) _ n,
/»(*) = n c C
- , Cj-i <X<Cj
Cj Cj — l (j ~ J'-1

Many computer programs that produce histograms actually create a bar chart with bar
heights proportional to rij/n. A bar chart is acceptable if the groups have equal width, but
Catatan: jika
if not, then lebar semua
the preceding kelompok
formula is needed.adalah sama, maka
The advantage histogram akan
of this approach is that the
berbentuk
histogram is indeed a bar chart dengan
density function, ketinggian
and, among proporsional
other things, terhadap
areas under the histogram
can be used to obtain empirical probabilities.
"!
.
"
technically, for the interval from c$-\ to CJ, x = <y should be included and x = CJ-I excluded in oider for
Fn (CJ ) to be the empirical distribution function. 21
Contoh 2.5
INTRODUCTION 205
Menggunakan Data C: Pembayaran 227 klaim pada suatu asuransi umum.
1.3 Data Set C.
Payment range Number of payments
0-7,500 99
7,500-17,500 42
17,500-32,500 29
32,500-67,500 28
67,500-125,000 17
125,000-300,000 9
Over 300,000 3

Data terdiri dari 𝑛 = 227 dan terdapat 𝑘 = 7 kelompok.


Data Set D These numbers are artificial. They represent the time at which a five-year term
Akan disusun fungsi
life insurance policy distribusi
terminates. dan
All policies fungsi
were kepekatan
sold at the same issue, sopeluang empiris.
only the time
from issue is relevant. For some policyholders, termination is by death, for some it is by 22
Penyelesaian:
Tulis kembali formulasi ogive sebagai

𝑐% 𝐹$ 𝑐%&' − 𝑐%&' 𝐹$ 𝑐% 𝐹$ 𝑐% − 𝐹$ 𝑐%&'


𝐹$ 𝑥 = + 𝑥 = 𝛼 + 𝛽𝑥
𝑐% − 𝑐%&' 𝑐% − 𝑐%&'

Catat bahwa 𝑐( = 0, 𝐹$ 𝑐( = 0, serta 𝑐) = ∞.


Olah data tsb atas distribusi empiris masing-masing kelompok.
𝑗 1 2 3 4 5 6
𝑐𝑗 7,500 17,500 32,500 67,500 125,000 300,000
𝑐" − 𝑐"#$ 7,500 10,000 15,000 35,000 57,500 175,000
99 141 170 198 215 224
𝐹𝑛 𝑐𝑗 = 0.4361 = 0.6211 = 0.7489 = 0.8722 = 0.9471 = 0.9868
227 227 227 227 227 227
𝛼 0 0.2976 0.47210 0.63436 0.78433 0.91882
𝛽 0.00005815 0.000018502 0.000008517 0.000003524 0.000001302 0.000000227
23
0.91882 + 0.000000227a;, 125,000 < x < 300,000,
The distribution function is
undefined, x > 300,000,
'0.000058150a:, 0 < x < 7,500,
where, •forFungsi
example, distribusi empiris
for the range 32,500 < x < 67,500 the calculation
0.29736is + 0.000018502x, 7,500 < x < 17,500,
dan gambar grafik ogive:
67,500-a; 170 x - 32,500 198 0.47210 + 0.000008517x, 17,500 < x < 32,500,
F227(X) = ^227
67,500 - 32,500 227 67,500 - Or) = I 227'
32,500 0.63436 + 0.000003524x, 32,500 < x < 67,500,
0.78433 + 0.000001302a;, 67,500 < x < 125,000,
he value is undefined above 300,000 because the last interval has0.91882
a width+of0.000000227a;,
infinity. 125,000 < x < 300,000,
A graph of the ogive for values up to 125,000 appears in Figure 11.1. The derivative
undefined, x > 300,000,
simply a step function with the following values:
where, for example, for the range 32,500 < x < 67,500 the calculation is

67,500-a; 170 x - 32,500 198


F227(X) = Catatan:
67,500 - 32,500 227 67,500 - 32,500 227'
Nilai distribusi empiris pada interval
The value is undefined above 300,000 because the last interval has a width of inf
𝑥 > 300,000 tak terdefinisi karena
A graph of the ogive for values up to 125,000 appears in Figure 11.1. The deriv
is simply a step function with thedengan asumsi
following values:𝑐! = ∞, maka lebar
interval adalah tak hingga.

25.000 50,000 75,000 100,000 125,000


x
24
0.000058150, 0 < x < 7,500,
• Fungsi kepekatan peluang 0.000018502, 7,500 < x < 17,500,
& gambar grafik histogram. 0.000008517, 17,500 < x < 32,500,
/227(a;) = < 0.000003524, 32,500 < x < 67,500,
0.000001302, 67,500 < x < 125,000,
0.000000227, 125,000 < x < 300,000,
ESTIMATION FOR COMPLETE DATA undefined, x > 300,000.

0.00006 - p A graph of the function up to 125,000 appears in Figure 11.2.


0.00005 - Catatan:
0.00004 - Fungsi kepekatan peluang didapat
J- 0.00003 - dengan menurunkan fungsi distribusi
0.00002 - pada masing-masing interval. Fungsi
0.00001 - ini tak kontinu, dan diasumsikan tak
o- - kontinu kanan.
0 25.000 50,000 75.000 100,000 125,000
x 25
Selamat Belajar

AKT403 Teori Risiko II – Pertemuan Online 2

26

Anda mungkin juga menyukai