Terisk2 - 2
Terisk2 - 2
AKT 403
TEORI RISIKO II
Koordinator: Endar H. Nugrahani
Edisi Online, Semester Ganjil 2020/2021
Materi Pertemuan ke-2
Definisi 2.4 Distribusi kernel diperhalus diperoleh dengan menggantikan setiap titik
1
data dengan peubah acak kontinu dan kemudian memberikan peluang 𝑛
untuk setiap peubah acak tersebut.
3
2.2 Distribusi Empiris
!
Distribusi empiris mengalokasikan peluang pada setiap titik data,
"
sehingga didefinisikan fungsi distribusi empiris berikut.
4
Contoh 2.1
a. Akan ditentukan fungsi peluang dan distribusi empiris dari data berikut
Data A: Data banyaknya kecelakaan yang dialami oleh seorang pengemudi
selama
204
setahun antara
ESTIMATION FOR COMPLETE DATA
1956-1958. Data terkumpul atas 94,935
orang pengemudi (Dropkin, 1959)
Table 11.1 Data Set A.
Number of accidents Number of drivers
0 81,714
1 11,306
2 1,618
3 250
4 40
5 or more 7
5
Fungsi peluang empiris:
81,714/94,935 = 0.860736, 𝑥 =0
11,306/94,935 = 0.119092, 𝑥 =1
1,618/94,935 = 0.017043, 𝑥 =2
𝑝#$,#&' 𝑥 =
250/94,935 = 0.002633, 𝑥 =3
40/94,935 = 0.000421, 𝑥 =4
7/94,935 = 0.000074, 𝑥 =5
Fungsi peluang
Definition empiris
11.2 A parametric distribution is a set of distribution functions, each member
of which is determined by specifying one or more values called parameters. The number
of parameters is fixed and finite.
0.05, 𝑥 = 27,
0.05, 𝑥 = 82,
Here, only two data-dependent distributions are considered. They depend on the data in
similar ways. The simplest definitions follow for the two types considered.
𝑝#$ 𝑥 = 0.05, 𝑥 = 115,
Definition 11.3 The empirical distribution is obtained by assigning probability \/n to
each data point.
⋮ ⋮
0.05, 𝑥 = 15,743.
Definition 11.4 A kernel smoothed distribution is obtained by replacing each data point
with a continuous random variable and then assigning probability 1/n to each such random 7
Sejauh ini, fungsi distribusi empiris adalah diskret. Karena turunan fungsi
diskret tidak dimungkinkan, maka fungsi kepekatan peluang dan fungsi hazard
akan ditentukan dengan pendekatan empiris berikut.
9
Menentukan fungsi distribusi empiris berdasarkan sampel berukuran 𝑛:
• Catat 𝑦! < 𝑦# < ⋯ < 𝑦( , 𝑘 ≤ 𝑛, sebagai 𝑘 nilai unik yang muncul dalam
sampel
• Notasikan 𝑠) sebagai banyaknya kemunculan observasi 𝑦) dalam
sampel.
• Periksa bahwa ∑()*! 𝑠) = 𝑛.
• Perlu dicermati: pengamatan yang lebih besar atau sama dengan nilai
tertentu, disebut sebagai himpunan risiko (risk set).
• Tentukan 𝑟) = ∑(+*) 𝑠+ sebagai banyaknya observasi yang lebih besar
atau sama dengan 𝑦) .
10
Fungsi distribusi empiris adalah
0, 𝑥 < 𝑦! ,
𝑟)
𝐹" 𝑥 = 1 − , 𝑦)%! ≤ 𝑥 ≤ 𝑦) , 𝑗 = 2, … , 𝑘,
𝑛
1, 𝑥 ≥ 𝑦( .
1, 𝑥 < 𝑦! ,
𝑟)
𝑆" 𝑥 = , 𝑦)%! ≤ 𝑥 ≤ 𝑦) , 𝑗 = 2, … , 𝑘,
𝑛
0, 𝑥 ≥ 𝑦( .
11
Contoh 2.2
Akan ditentukan fungsi distribusi empiris berdasarkan data berikut:
1.0, 1.3, 1.5, 1.5, 2.1, 2.1, 2.1, 2.8.
Penyelesaian:
Perhatikan bahwa 𝑛 = 8 dan terdapat 𝑘 = 5 observasi berbeda.
Ringkasan data adalah:
12
Fungsi distribusi empiris
adalah
13
Penduga fungsi hazard rate kumulatif
0, 𝑥 < 𝑦! ,
)%!
𝑠+
H , 𝑦)%! ≤ 𝑥 ≤ 𝑦) , 𝑗 = 2, … , 𝑘
F 𝑟
𝐻 𝑥 = +*! +
(
𝑠+
H 𝑥 ≥ 𝑦( .
𝑟+
+*!
14
Contoh 2.3
Dari Contoh 2.2, akan ditentukan penduga 209 Nelson-Åalen untuk fungsi
THE EMPIRICAL DISTRIBUTION FOR COMPLETE, INDIVIDUAL DATA
0, 𝑥 < 1.0,
1 − 𝑒 %$.!#. = 0.1175, 1.0 ≤ 𝑥 < 1.3,
%$.#/0 1.3 ≤ 𝑥 < 1.5,
1 − 𝑒 = 0.2351,
𝐹I 𝑥 = 1.5 ≤ 𝑥 < 2.1,
1 − 𝑒 %$./$! = 0.4517,
1 − 𝑒 %!.1.! = 0.7410, 2.1 ≤ 𝑥 < 2.8,
1 − 𝑒 %#.1.! = 0.9047, 𝑥 ≥ 2.8.
Hasil ini tidak sama dengan penduga distribusi
empiris (Contoh 2.2).
Adalah lazim, metode pendugaan berbeda, akan
memberikan hasil berbeda.
16
Contoh 2.4
Diberikan Data D1: 30 pemegang polis
asuransi jiwa periode 5 tahun.
Pertanggungan akan diakhiri jika
pemegang polis meninggal dan/atau
mengundurkan diri sebelum jatuh
tempo.
Akan ditentukan untuk data waktu
kematian:
• fungsi survival empiris,
• penduga Nelson-Åalen untuk fungsi
hazard rate kumulatif,
• penduga fungsi survival.
17
Penyelesaian:
Perhatikan bahwa 𝑛 = 30 dan terdapat 𝑘 = 5 waktu kematian berbeda.
Ringkasan data beserta hasil sebagai berikut:
Penduga Nelson-Åalen hazard
Fs survival empiris Penduga survival
rate kumulatif
19
Fungsi distribusi
data, we areempiris data berkelompok.
able to determine the empirical distribution at each group boundary.That is,
Fn(cj) = (1/n) Σ£=ι ni- Note that no rule is proposed for observations that fall on a
group boundary. There is no correct approach, but whatever approach is used, consistency
Definisi 2.8 Untuk data berkelompok, fungsi distribusi empiris diperoleh
in assignment of observations to groups should be used. Note that in Data Set C it is not
dengan
possible menghubungkan
to tell how the assignments werenilai
made.fungsi distribusi
If we had pada masing-
that knowledge, it would not
affect any subsequent calculations.2
masing batas kelompok dengan suatu garis lurus,
Definition 11.8 For grouped data, the distribution function obtained by connecting the
menghasilkan grafik ogive. Formulasi fungsi distribusi data
values of the empirical distribution function at the group boundaries with straight lines is
calledberkelompok adalah:
the ogive. The formula is
This function is differentiable at all values except group boundaries. Therefore the
densityini
Catatan: fungsi function can be obtained.pada setiap
terdiferensialkan To completely specify
titik the density
kecuali function,kelompok.
pada batas it is arbitrarily
made right continuous.
Dengan demikian fungsi kepekatan peluang akan dapat diperoleh dengan
Definition 11.9
menentukan For grouped data, the empirical density function can be obtained by dif-
turunannya.
ferentiating the ogive. The resulting function is called a histogram. The formula is 20
Fn(x) = -*Zi-F9fo_x) + lZ^t±Fn{Cj)i Cj_x <x< c..
Cj - Cj-i Cj - Cj-i
Fungsi kepekatan peluang empiris data berkelompok
This function is differentiable at all values except group boundaries. Therefore the
density function can be obtained. To completely specify the density function, it is arbitrarily
Definisi 2.9 continuous.
made right Untuk data berkelompok, fungsi kepekatan peluang empiris
dapat diperoleh dengan menurunkan ogive, grafik hasilnya
Definition 11.9 For grouped data, the empirical density function can be obtained by dif-
ferentiating disebut histogram:
the ogive. The resulting function is called a histogram. The formula is
FnjCj) - FnjCj-j) _ n,
/»(*) = n c C
- , Cj-i <X<Cj
Cj Cj — l (j ~ J'-1
Many computer programs that produce histograms actually create a bar chart with bar
heights proportional to rij/n. A bar chart is acceptable if the groups have equal width, but
Catatan: jika
if not, then lebar semua
the preceding kelompok
formula is needed.adalah sama, maka
The advantage histogram akan
of this approach is that the
berbentuk
histogram is indeed a bar chart dengan
density function, ketinggian
and, among proporsional
other things, terhadap
areas under the histogram
can be used to obtain empirical probabilities.
"!
.
"
technically, for the interval from c$-\ to CJ, x = <y should be included and x = CJ-I excluded in oider for
Fn (CJ ) to be the empirical distribution function. 21
Contoh 2.5
INTRODUCTION 205
Menggunakan Data C: Pembayaran 227 klaim pada suatu asuransi umum.
1.3 Data Set C.
Payment range Number of payments
0-7,500 99
7,500-17,500 42
17,500-32,500 29
32,500-67,500 28
67,500-125,000 17
125,000-300,000 9
Over 300,000 3
26