Anda di halaman 1dari 81

PROPOSAL TESIS

PENERAPAN NON-HOMOGENEOUS MARKED POISSON PROCESS


DALAM ESTIMASI CADANGAN UNTUK INDIVIDUAL KLAIM
DENGAN DATA KLAIM PER KLAIM

( THE APPLICATION OF NON-HOMOGENEOUS POISSON PROCESS IN


ESTIMATING THE RESERVE OF INDIVIDUAL CLAIMS WITH CLAIM BY
CLAIM DATA )

Sri Viona Irda


16/403770/PPA/05287

PROGRAM STUDI S2 MATEMATIKA


DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS GADJAH MADA
YOGYAKARTA
2019
HALAMAN PERSETUJUAN

PROPOSAL TESIS

PENERAPAN NON-HOMOGENEOUS MARKED POISSON PROCESS


DALAM ESTIMASI CADANGAN UNTUK INDIVIDUAL KLAIM
DENGAN DATA KLAIM PER KLAIM

Diusulkan oleh

Sri Viona Irda


16/403770/PPA/05287

Telah dipertahankan di depan Tim Penguji


pada tanggal 10 September 2019

Susunan Tim Penguji

Dr. Adhitya Ronnie Effendie, M.Sc Dr. Abdurakhman, M.Si.


Pembimbing Utama Ketua Tim Penguji

Dr. Herni Utami, M.Si.


Penguji
PERNYATAAN

Dengan ini saya menyatakan bahwa dalam Proposal Tesis ini tidak terdapat karya
yang pernah diajukan untuk Proposal Tesis maupun untuk memperoleh gelar Mas-
ter di suatu Perguruan Tinggi, dan sepanjang pengetahuan saya juga tidak terdapat
karya atau pendapat yang pernah ditulis atau diterbitkan oleh orang lain, kecuali
yang secara tertulis diacu dalam naskah ini dan disebutkan dalam daftar pustaka.

Yogyakarta, 10 September 2019

Sri Viona Irda

iii
DAFTAR ISI

HALAMAN PERSETUJUAN . . . . . . . . . . . . . . . . . . . . . . . . ii
HALAMAN PERNYATAAN . . . . . . . . . . . . . . . . . . . . . . . . . iii
DAFTAR ISI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv
I PENDAHULUAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1. Latar Belakang Masalah . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Rumusan Masalah . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3. Tujuan dan Manfaat Penelitian . . . . . . . . . . . . . . . . . . . . 5
1.4. Batasan Masalah . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.5. Tinjauan Pustaka . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.6. Metode Penelitian . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.7. Sistematika Penulisan . . . . . . . . . . . . . . . . . . . . . . . . . 8
II DASAR TEORI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.1. Teori Probabilitas . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2. Variabel Random . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.3. Distribusi Khusus . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.3.1. Distribusi Uniform . . . . . . . . . . . . . . . . . . . . . . 14
2.3.2. Distribusi Gamma . . . . . . . . . . . . . . . . . . . . . . 15
2.3.3. Distribusi Eksponensial . . . . . . . . . . . . . . . . . . . 15
2.3.4. Distribusi Weibull . . . . . . . . . . . . . . . . . . . . . . 15
2.3.5. Distribusi Lognormal . . . . . . . . . . . . . . . . . . . . . 16
2.3.6. Distribusi Poisson . . . . . . . . . . . . . . . . . . . . . . 16
2.4. Statistik Urutan . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.5. Proses Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.5.1. Proses Stokastik . . . . . . . . . . . . . . . . . . . . . . . 18
2.5.2. Counting Process . . . . . . . . . . . . . . . . . . . . . . . 18
2.5.3. Definisi Proses Poisson . . . . . . . . . . . . . . . . . . . . 20
2.5.4. Distribusi yang Terkait dengan Proses Poisson . . . . . . . 22
2.5.5. Distribusi Uniform dan Proses Poisson . . . . . . . . . . . . 26
2.6. Proses Poisson Non-Homogen . . . . . . . . . . . . . . . . . . . . 27
2.7. Non-Homogeneous Marked Poisson Process . . . . . . . . . . . . . 32
2.8. Metode Maximum Likelihood Estimation (MLE) . . . . . . . . . . . 33
2.9. Data dan Variabel Random Survival . . . . . . . . . . . . . . . . . 35
2.9.1. Fungsi Survival dan Hazard . . . . . . . . . . . . . . . . . 35

iv
v

2.9.2. Kuantil . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.9.3. Hubungan antar Fungsi . . . . . . . . . . . . . . . . . . . . 37
2.9.4. Estimasi Parameter . . . . . . . . . . . . . . . . . . . . . . 37
2.10. Uji Kolmogorov-Smirnov . . . . . . . . . . . . . . . . . . . . . . . 38
2.11. Simulasi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.12. Cadangan Klaim . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.13. Segitiga Run-Off Agregat . . . . . . . . . . . . . . . . . . . . . . . 40
2.14. Segitiga Run-Off Individu . . . . . . . . . . . . . . . . . . . . . . 41
2.15. Metode Chain Ladder . . . . . . . . . . . . . . . . . . . . . . . . 43
III RENCANA PENELITIAN . . . . . . . . . . . . . . . . . . . . . . . . 45
3.1. Rencana Pelaksanaan Penelitian . . . . . . . . . . . . . . . . . . . 45
3.1.1. Tahapan Penelitian . . . . . . . . . . . . . . . . . . . . . . 45
3.1.2. Jadwal Penelitian . . . . . . . . . . . . . . . . . . . . . . . 46
3.2. Hasil Sementara . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.2.1. Data Polis . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.2.2. Data dari Catatan Klaim . . . . . . . . . . . . . . . . . . . 49
3.2.3. Notasi untuk Klaim per Klaim . . . . . . . . . . . . . . . . 50
3.2.4. Pengelompokan Klaim . . . . . . . . . . . . . . . . . . . . 51
3.2.5. Model Proses Pembayaran . . . . . . . . . . . . . . . . . . 52
3.2.6. Model Proses Klaim . . . . . . . . . . . . . . . . . . . . . 57
3.2.7. Proses dari Klaim-g . . . . . . . . . . . . . . . . . . . . . 60
3.2.8. Estimasi Distribusi dan Parameter Model . . . . . . . . . . 63
3.2.9. Simulasi . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
DAFTAR PUSTAKA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
BAB I

PENDAHULUAN

1.1. Latar Belakang Masalah

Kejadian-kejadian yang tidak pasti seperti kecelakaan, kebakaran, bencana


alam, dan sebagainya, yang mengakibatkan munculnya suatu risiko finansial, sering
terjadi kepada perorangan maupun badan usaha. Untuk mengalihkan risiko tersebut
maka dibentuklah suatu usaha perlindungan yang disebut dengan usaha asuransi.
Asuransi adalah suatu janji dari perusahaan asuransi kepada pemegang polis dima-
na perusahaan asuransi akan memberikan ganti rugi atau santunan yang telah dite-
tapkan kepada pemegang polis terkait dengan risiko yang dialami pemegang polis
yang disebabkan oleh suatu kejadian yang tidak pasti, dan sebagai gantinya peme-
gang polis harus membayarkan sejumlah uang kepada perusahaan asuransi yang
disebut dengan premi. Ketika kejadian yang tidak pasti terjadi, pemegang polis ber-
hak melakukan klaim untuk memperoleh ganti rugi atau santunan dari perusahaan
asuransi.

Asuransi dibagi menjadi dua yaitu asuransi jiwa (life insurance) dan asu-
ransi non-jiwa (non-life insurance). Pada (life insurance), risiko yang dijamin oleh
perusahaan asuransi adalah berupa risiko kematian, sedangkan pada (non-life insu-
rance) risiko yang dijamin oleh perusahaan asuransi bermacam-macam tergantung
pada jenis yang diasuransikan. Asuransi non-jiwa atau (non-life insurance) sering
juga disebut dengan asuransi umum (general insurance) dan salah satu jenis asuransi
ini adalah asuransi tanggung gugat.

Asuransi tanggung gugat adalah suatu produk asuransi yang memberikan


perlindungan kepada pemegang polis, dimana pemegang polis mempunyai tang-
gung jawab atas risiko yang terjadi pada pihak ketiga, dan risiko tersebut disebab-
kan oleh kelalaian pemegang polis. Adapun contoh kasus yang memerlukan asu-

1
2

ransi ini adalah ketika ruang usaha dalam bentuk pabrik, gedung bioskop, restoran,
toko, dan lain sebagainya dianggap merugikan bagi lingkungan atau orang yang ber-
ada di sekitarnya, maka akan terjadi gugatan pada tempat usaha tersebut. Contoh
lainnya adalah ketika produk yang dibuat oleh produsen, ternyata berdampak buruk
pada salah satu konsumen. Konsumen pun menuntut produsen untuk mengganti
rugi kerugian yang ditimbulkannya. Ada juga klaim yang disebabkan oleh seorang
karyawan atau buruh yang mengalami kecelakaan kerja hingga harus meminta per-
tanggungjawaban kepada majikan atau pemilik usaha yang mempekerjakannya.

Beberapa jenis non-life insurance, pembayaran atas klaim mungkin dilaku-


kan dalam satu kali pembayaran, contohnya seperti asuransi kesehatan. Namun,
untuk asuransi tanggung gugat yang termasuk ke jenis long tailed business, pemba-
yaran klaimnya dilakukan lebih dari satu kali dan membutuhkan waktu yang cukup
lama untuk menyelesaikannya. Dengan adanya rentang waktu yang lama dari saat
klaim dilaporkan sampai klaim diselesaikan maka muncullah suatu hutang yang di-
sebut dengan hutang klaim (outstanding claims liability). Untuk membayar hutang
klaim tersebut, maka perusahaan asuransi haruslah menyediakan dana khusus yang
disebut dengan cadangan klaim.

Penaksiran outstanding claims sangat penting bagi perusahaan asuransi, me-


ngingat perusahaan asuransi dituntut untuk selalu dapat menyediakan cadangan
yang cukup untuk menutup pembayaran klaim di masa yang akan datang. Jika
estimasi outstanding claims terlalu tinggi dari nilai sebenarnya, maka perusahaan
asuransi tidak bisa menggunakan dana yang tersisa untuk keperluan lain, sedang-
kan ketika perkiraan outstanding claims terlalu rendah dari nilai sebenarnya, maka
perusahaan asuransi tidak bisa memenuhi kewajibannya untuk membayar tuntutan
klaim yang diajukan oleh pemegang polis. Ada dua jenis outstanding claims, yaitu
Incurred but Not Reported (IBNR) yaitu kejadian yang telah terjadi tetapi belum
dilaporkan ke perusahaan asuransi dan Reported but Not Settled (RBNS) yaitu ke-
jadian yang telah dilaporkan namun pembayarannya belum terselesaikan.

Ada beberapa metode statistika yang dapat digunakan untuk menaksirkan


3

outstanding claims liability, seperti Chain-Ladder yang paling populer, Bootstrap


Chain-Ladder, Bornhuetter-Ferguson, Bayesian, Benktander-Hovinen, dan GLM
dengan pendekatan over dispersed Poisson. Menurut Wütrich dan Merz (1998),
metode-metode tersebut belum ada yang membuat perbedaan yang jelas antara kla-
im yang telah dilaporkan dengan klaim IBNR (incurred but not reported claims)
yang di dalamnya juga terkandung klaim UPR (unearned premium reserves). Seha-
rusnya, untuk klaim yang telah dilaporkan ditentukan dengan data individu, karena
informasi-informasi mengenai klaim individu sudah ada, sedangkan untuk klaim
IBNR dan UPR ditentukan dengan suatu dasar kolektif/agregat, karena informa-
si untuk masing-masing klaim individu belum ada kecuali berupa informasi yang
sudah tertulis di dalam kontrak perjanjian atau masing-masing polis asuransi.

Selain itu, metode-metode yang telah disebutkan di atas biasanya menggu-


nakan data agregat. Memang secara umum semua metode agregat lebih mudah
dimengerti dan diterapkan, akan tetapi metode ini memiliki beberapa kekurangan,
salah satunya adalah hilangnya beberapa informasi untuk masing-masing klaim in-
dividu. Kemudian (England dan Verrall, 2002) berpendapat bahwa, [...]it has to be
borne in mind that traditional techniques were developed before the advent of desk-
top computers, using methods which could be evaluated using pencil and paper.
With the continuing increase in computer power, it has to be questioned whether it
would not be better to examine individual claims rather than use aggregate data.
Di dalam bukunya yang berjudul Risk Theory The Stochastic Basis of Insurance,
(Beard et al,1992) mengatakan bahwa, proses klaim merupakan proses stokastik
majemuk dalam arti bahwa waktu kejadian dan jumlah kejadian adalah fenomena
random dan besar setiap klaim yang dibayarkan juga merupakan variabel random.

Kerangka kerja matematika untuk cadangan klaim dengan proses stokastik


pertama kali dihadirkan oleh Arjas (1989), dimana semua tindakan terkait klaim
tercantum dalam tanggal pelaporannya. Dari sudut pandang seorang statistikawan
ini bisa diterima, namun menurut seorang akuntan sebaiknya klaim didaftarkan me-
nurut tanggal kejadiannya, dan hal tersebutlah yang telah dilakukan oleh Norberg
(1993) dan Norberg (1999). Selanjutnya Antonio dan Plat (2012) menggunakan ke-
4

rangka kerja yang sama dengan Norberg (1993) dan Norberg (1999), serta menggu-
nakan alat statistik kejadian berulang Cook and Lawless (2007) dan micro-level data
dalam penelitiannya. Kemudian Bednarik (2017), melakukan penelitian yang sa-
ma dengan Antonio dan plat (2012) dengan menambahkan beberapa asumsi-asumsi
yang digunakan untuk mempermudah pemodelan proses klaim.

Oleh karena itu, penulis tertarik membahas estimasi cadangan klaim meng-
gunakan model yang diadaptasi dari Antonio dan Plat (2012) dan asumsi-asumsi
serta simulasi seperti yang telah digunakan oleh Bednarik (2017). Model untuk
proses klaim dibangun dengan kerangka kerja non-homogeneous marked Poisson
process, dimana terdapat empat informasi terperinci yang akan diestimasi secara
terpisah yaitu proses klaim, waktu tunda pelaporan, waktu antar pembayaran dan
terakhir adalah besar pembayaran. Estimasi didasarkan pada teori Maximum Li-
kelihood dan kemudian dilanjutkan dengan simulasi. Studi kasus diterapkan pada
data klaim produk asuransi tanggung gugat. Hasil estimasi cadangan klaim de-
ngan model stokastik ini akan dibandingkan dengan hasil estimasi cadangan klaim
dengan menggunakan Bootstrap Chain-Ladder. Komputasi untuk model stokastik
dan BootstrapChain-Ladder ini dilakukan menggunakan software R.3.5.3.

1.2. Rumusan Masalah

Dari latar belakang tersebut dapat dirumuskan beberapa permasalahan yang


menjadi kajian dalam penelitian ini, yaitu sebagai berikut:

1. Bagaimana cara mengestimasi secara terpisah distribusi dan parameter da-


ri empat informasi klaim historis yaitu waktu tunda pelaporan, waktu antar
pembayaran, besar pembayaran, dan terakhir adalah proses klaim.

2. Bagaimana cara mengestimasi cadangan klaim dengan mengaplikasikan sa-


lah satu proses stokastik yang menggunakan kerangka kerja non-homogeneous
marked Poisson process, dan dengan memanfaatkan informasi dari masing-
masing perkembangan klaim per klaimnya.

3. Bagaimana mengaplikasikan kerangka kerja non-homogeneous marked Pois-


5

son process untuk mengestimasi cadangan klaim salah satu lini bisnis non-life
insurance yaitu produk asuransi tanggung gugat.

1.3. Tujuan dan Manfaat Penelitian

Tujuan yang ingin dicapai dari penelitian ini adalah

1. Mengetahui dan memahami cara mengestimasi secara terpisah distribusi dan


parameter dari empat informasi klaim historis yaitu waktu tunda pelaporan,
waktu antar pembayaran, besar pembayaran, dan terakhir adalah proses klaim
.

2. Mengetahui dan memahami cara mengestimasi cadangan klaim dengan meng-


aplikasikan salah satu proses stokastik yang menggunakan kerangka kerja
non-homogeneous marked Poisson process, dan dengan memanfaatkan in-
formasi dari masing-masing perkembangan klaim per klaimnya.

3. Mengaplikasikan kerangka kerja non-homogeneous marked Poisson process


untuk mengestimasi cadangan klaim salah satu lini bisnis non-life insurance
yaitu produk asuransi tanggung gugat.

Hasil penelitian ini diharapkan dapat menambah wawasan bagi siapa saja, terutama
yang mendalami bidang kajian estimasi cadangan klaim sehingga dapat digunakan
sebagai batu pijakan untuk penelitian lebih lanjut.

1.4. Batasan Masalah

Adapun beberapa batasan masalah dalam penulisan ini yaitu:

1. Data yang digunakan adalah data klaim produk asuransi tanggung gugat.
Asuransi tanggung gugat merupakan suatu asuransi yang memberikan jami-
nan perlindungan kepada pemegang polis terhadap resiko yang timbul karena
adanya tuntutan pihak lain (pihak ketiga).

2. Data yang digunakan adalah Paid Claim. Paid claims data adalah data pem-
bayaran klaim-klaim yang telah terjadi tanpa ditambah dengan case reserves.
6

Case reserves adalah taksiran besarnya uang yang dibuat oleh perusahaan
asuransi untuk membayar klaim-klaim yang sudah dilaporkan.

3. Data klaim yang digunakan adalah data klaim normal, tanpa mengikutserta-
kan klaim ex gratia, salvage dan subrogation. Klaim ex gratia adalah pemba-
yaran klaim dari perusahaan asuransi kepada pemegang polis atas dasar ke-
bijaksanaan untuk klaim yang sebenarnya tidak reliable dan tidak tercantum
dalam kontrak polis. Salvage adalah sisa dari kerusakan atau klaim merupa-
kan tanggung jawab atau diambil alih oleh perusahaan asuransi. Subrogation
adalah prinsip yang mengatur tentang hak perusahaan asuransi yang telah me-
nyelesaikan pembayaran ganti rugi yang diderita oleh pemegang polis, maka
secara otomatis hak yang dimiliki pemegang polis untuk menuntut pihak ke-
tiga yang menimbulkan kerugian atau kerusakan beralih ke perusahaan asu-
ransi.

1.5. Tinjauan Pustaka

Dalam penelitian ini dasar teori yang akan digunakan antara lain: untuk te-
ori probabilitas, variabel random, beberapa distribusi khusus, dan statistik urutan
diambil dari buku karangan Bain dan Engelhardt (1992), untuk model stokastik de-
ngan kerangka kerja non-homogeneous marked Poisson process beserta teori yang
mendasarinya diambil dari Daley dan Vere-Jones (2003), Ross (2010), Pinsky dan
Karlin (2011), Antonio dan Plat (2014), dan Bednárik (2017), untuk data dan fungsi
survival sendiri diambil dari buku Danardono (2012), untuk dasar teori segitiga run-
off agregat dan individu diambil dari buku Mutaqin dkk. (2008), Olofsson (2006)
dan jurnal Drieskens et al. (2012), untuk materi cadangan klaim dan Bootstrap
Chain-Ladder diambil dari buku Mack (1993), Wuthrich dan Merz (2008), England
dan Verrall (2002).
7

1.6. Metode Penelitian

Penelitian ini menggunakan studi literatur dari buku, jurnal, dan internet.
Studi kasus dilakukan dengan menggunakan data sekunder, yaitu data klaim produk
asuransi tanggung gugat. Langkah-langkah penelitian ini ialah pertama menentu-
kan tren yang cocok dari waktu tunda pelaporan, kemudian mengestimasi parame-
ternya, yang mana parameter tersebut selanjutnya akan digunakan untuk mentrans-
formasikan waktu tunda pelaporang yang sedang diamati. Transformasi semacam
itu memiliki keuntungan bahwa data yang ditransformasi membentuk sampel acak
kontinu. Selanjutnya tentukan distribusi yang sesuai dengan data yang telah ditrans-
formasikan tadi, dan cari estimasi parameternya. Kedua, Menentukan fungsi inten-
sitas dari proses klaim. Ketiga, Menentukan distribusi waktu antar pembayaran, di-
mana tipe pembayaran dibagi menjadi dua tipe, yaitu tipe 1 (pembayaran) dan tipe
2 (penyelesaian dengan pembayaran). Pada bagian ini akan terdapat penyensoran.
Oleh karena itu dalam penentuan distribusi waktu antar pembayaran teori analisis
data survival untuk data tersensor perlu diaplikasikan. Setelah distribusi diperoleh,
estimasi parameternya dicari.Kemudian parameter tersebut akan digunakan untuk
mensimulasikan tipe dan waktu pembayaran selanjutnya. Keempat, menentukan
distribusi dari besar pembayaran klaim serta mengestimasi parameternya. Terakhir,
melakukan simulasi.

Simulasi dapat diartikan sebagai sebuah metode untuk mengevaluasi suatu


model yang melibatkan bilangan acak sebagai salah satu input. Metode ini sering
digunakan jika model yang digunakan cukup kompleks, melibatkan lebih dari se-
pasang parameter yang tidak pasti. Sebuah simulasi dapat melibatkan lebih dari
10.000 evaluasi atas sebuah model. Metode simulasi digolongkan sebagai meto-
de sampling karena input dibangkitkan secara acak dari suatu distribusi probabilitas
untuk proses sampling dari populasi nyata. Oleh karena itu kita harus memilih suatu
distribusi sebagai input yang paling mendekati dengan data yang kita miliki.

Dalam metode simulasi tentunya terdapat beberapa keunggulan, diantaranya


adalah mudah untuk digunakan, karena sekali program telah dibuat dapat diguna-
8

kan dan ada banyak software untuk mensimulasikan. Kemudian mampu memper-
timbangkan perbaikan untuk meningkatkan keakuratan dan bisa mengurangi waktu
perhitungan.

Studi kasus yang diambil yaitu mengestimasi cadangan klaim produk asu-
ransi tanggung gugat. Hasil estimasi kemudian dibandingkan dengan hasil metode
Bootstrap Chain-Ladder sebagai metode estimasi cadangan klaim agregat. Kompu-
tasi dilakukan dengan menggunakan software R.3.5.3.

1.7. Sistematika Penulisan

Tesis ini disusun dengan sistematika penulisan sebagai berikut:

BAB I PENDAHULUAN
Bab ini membahas mengenai latar belakang, rumusan masalah, tujuan dan
manfaat penelitian, batasan masalah, tinjauan pustaka, metode penelitian,
dan sistematika penulisan.

BAB II DASAR TEORI


Bab ini membahas dasar teori yang mendukung pembahasan penerapan non-
homogeneous marked Poisson process dalam estimasi cadangan klaim indi-
vidu.

BAB III RENCANA PENELITIAN


Bab ini berisi tentang analisis cara mengestimasi cadangan klaim mengguna-
kan model stokastik dengan kerangka kerja non-homogeneous marked Pois-
son process dengan memanfaatkan empat informasi klaim historis yaitu pro-
ses klaim, waktu tunda pelaporan, waktu antar pembayaran dan terakhir ada-
lah besar pembayaran klaim.

BAB IV STUDI KASUS


Bab ini berisi pembahasan mengenai hasil estimasi dari distribusi dan para-
meter dari empat informasi klaim historis yaitu proses klaim, waktu tunda
9

pelaporan, waktu antar pembayaran dan terakhir adalah besar pembayaran


beserta estimasi cadangan klaim dengan mengaplikasikan kerangka kerja
non-homogeneous marked Poisson process pada produk asuransi tanggung
gugat. Kemudian membandingkan hasilnya dengan menggunakan metode
Bootsrap Chain-Ladder.

BAB V PENUTUP
Bab ini berisi tentang kesimpulan dari pembahasan pada bab sebelumnya
dan saran atas kekurangan dari hasil penelitian yang telah dilakukan.
BAB II

DASAR TEORI

Bab ini berisi dasar-dasar teori yang mendukung penerapan non-homogene-


ous marked Poisson process dalam estimasi cadangan klaim, yaitu teori probabili-
tas, variabel random, statistik urutan, proses titik, kejadian berulang, distribusi dan
proses Poisson, maximum likelihood estimation, data dan variabel random survival,
uji Kolmogorov-Smirnov, dan segitiga run-off. Untuk itu, penjelasan di bab 2 akan
dimulai dari topik yang paling umum yaitu tentang teori probabilitas.

2.1. Teori Probabilitas

Misalkan kita akan melakukan percobaan yang hasilnya tidak dapat diprediksi
sebelumnya. Namun, himpunan semua hasilnya mungkin bisa diketahui. Himpun-
an semua hasil yang mungkin dari suatu percobaan disebut sebagai ruang sampel
percobaan dan dinotasikan oleh S (Bain dan Engelhardt,1992). Setiap subset E
dari ruang sampel S disebut dengan suatu kejadian.

Untuk dua kejadian E dan F dari ruang sampel S, didefinisikan dua operator
pada himpunan yang disebut dengan gabungan dan irisan yang disimbolkan secara
berturut-turut dengan ∪ dan ∩. Misalkan dalam contoh pelemparan dadu E =
1, 3, 5 dan F = 1, 2, 3, maka E ∪ F = {1, 2, 3, 5} sedangkan E ∩ F = {1, 3}.

Selanjutnya, untuk setiap kejadian E didefinisikan suatu kejadian baru yaitu


E c yang disebut sebagai komplemen dari E. Terdiri dari semua hasil dalam ruang
sampel S yang tidak di E. Artinya, E c akan terjadi jika dan hanya jika E tidak
terjadi.

Definisi 2.1.1 mutually exclusive (Bain dan Engelhardt,1992) Dua kejadian E dan
F dikatakan mutually exclusive jika E ∩ F = ∅.

10
11

Jika E dan F mutually exclusive, maka

P (E ∪ F ) = P (E) + P (F ). (2.1)

Definisi 2.1.2 Probabilitas (Bain dan Engelhardt,1992) Suatu percobaan dengan


ruang sampel yang dinotasikan dengan S. Untuk setiap kejadian E dari ruang
sampel S, diasumsikan bahwa sejumlah P (E) didefinisikan dan memenuhi tiga
kondisi berikut:

1. 0 ≤ P (E) ≤ 1.

2. P (S) = 1.

3. Untuk setiap deretan kejadian E1 , E2 , E3 , ... yang saling asing maka berlaku.

[ ∞
X
P( En ) = P (En ), (2.2)
i=1 i=1

dimana P (E) adalah probabilitas dari kejadian E.

2.2. Variabel Random

Probabilitas suatu kejadian yang muncul dari ruang sampel biasanya dinya-
takan dalam bentuk nilai numerik, bukan sebagai warna atau karakteristik lainnya.
Oleh sebab itu, perlu didefinisikan suatu fungsi yang mengaitkan setiap hasil per-
cobaan dengan suatu bilangan real.

Definisi 2.2.1 (Bain dan Engelhardt,1992) Suatu variabel random, namakan X,


merupakan fungsi yang didefinisikan dari ruang sampel S yang menghubungkan
suatu bilangan real, X(e) = x, dengan setiap hasil e yang mungkin dari S.

Definisi 2.2.2 Variabel Random Diskrit (Bain dan Engelhardt,1992) Jika himpu-
nan semua nilai yang mungkin muncul dari suatu variabel random X, merupakan
himpunan terhitung (countable) x1 , x2 , x3 , ..., xn , atau x1 , x2 , x3 , ... maka X dise-
but variabel random diskrit. Fungsi

fX (x) = P (X = x), x = x1 , x2 , x3 , ... (2.3)


12

disebut fungsi densitas probabilitas diskrit (discrete probability density function-


P
/pdf) jika memenuhi sifat fX (xi ) ≥ 0 untuk semua xi dan ∀xi fX (xi ) = 1. Fungsi
distribusi kumulatif (cumulative distribution function/cdf) dari variabel random X
yang didefinisikan untuk setiap nilai , yaitu

FX (x) = P (X ≤ x), x = x1 , x2 , x3 , ... (2.4)

Definisi 2.2.3 Variabel Random Kontinu (Bain dan Engelhardt,1992) Suatu va-
riabel random X dinamakan variabel random kontinu jika nilainya dapat menca-
kup seluruh nilai dari suatu interval. Fungsi fX (x) merupakan pdf variabel ran-
dom kontinu jika dan hanya jika memenuhi sifat fX (x) ≥ 0 untuk semua x dan
R∞
f (x)dx = 1. CDF dari variabel random kontinu X yang didefinisikan untuk
−∞ X

setiap nilai x, yakni


Zx
FX (x) = fX (t) dt. (2.5)
−∞

Definisi 2.2.4 Distribusi Gabungan (Bain dan Engelhardt,1992) Fungsi densitas


probabilitas gabungan dari variabel random diskrit X berdimensi k, X = {X1 , X2 ,-
X3 , ..., Xk } didefinisikan sebagai berikut

fX (x1 , x2 , x3 , ..., xk ) = P (X = x1 , X = x2 , X = x3 , ..., X = xk ). (2.6)

Fungsi densitas probabilitas gabungan dari nilai vektor variabel random X berdi-
mensi k, X = {X1 , X2 , X3 , ..., Xk } disebut kontinu jika fungsi densitas probabili-
tas gabungan fX (x1 , x2 , x3 , ..., xk ) memiliki CDF gabungan sebagai berikut
Zx1 Zxk
FX (x1 , x2 , x3 , ..., xk ) = ... fX (t1 , ..., tk ) dt1 ...dtk . (2.7)
−∞ −∞

Definisi 2.2.5 Distribusi Marginal (Bain dan Engelhardt,1992) Jika variabel ran-
dom diskrit X1 dan X2 mempunyai pdf gabungan fX1 ,X2 (x1 , x2 ) maka pdf marginal
dari x1 dan x2 adalah
X X
fX1 (x1 ) = fX1 ,X2 (x1 , x2 ) dan fX2 (x2 ) = fX1 ,X2 (x1 , x2 ). (2.8)
x2 x1
13

Jika variabel random kontinu X1 dan X2 mempunyai pdf gabungan fX1 ,X2 (x1 , x2 )
maka pdf marginal dari x1 dan x2 adalah
Z∞ Z∞
fX1 (x1 ) = fX1 ,X2 (x1 , x2 ) dx2 dan fX2 (X2 ) = fX1 ,X2 (x1 , x2 ) dx1 .
−∞ −∞
(2.9)

Definisi 2.2.6 Variabel Random Independen (Bain dan Engelhardt,1992) Variabel


random X1 , X2 , ..., Xk dikatakan independen jika untuk setiap ai < bi
n
Y
P {a1 ≤ X1 ≤ b1 , ..., ak ≤ Xk ≤ bk } = P {ai ≤ Xi ≤ bi }. (2.10)
i=1

Salah satu konsep yang paling berguna dalam teori probabilitas adalah pro-
babilitas bersyarat. Dalam praktiknya, kita lebih sering tertarik untuk menghi-
tung probabilitas ketika sebagian informasi tersedia, karenanya probabilitas yang
diinginkan adalah probabilitas bersyarat.

Definisi 2.2.7 Distribusi Bersyarat (Bain dan Engelhardt,1992) Jika X1 dan X2


adalah variabel random diskrit atau kontinu dengan fungsi densitas probabilitas
gabungan fX1 ,X2 (x1 , x2 ), maka fungsi densitas probabilitas bersyarat dari X2 di-
berikan X1 = x1 didefinisikan menjadi
fX1 ,X2 (x1 , x2 )
fX1 |X2 (x1 | x2 ) = (2.11)
fX2 (x2 )
untuk nilai x1 sehingga fX2 (x2 ) > 0, dan 0 selainnya.

Teorema 2.2.8 (Bain dan Engelhardt,1992) Jika X1 dan X2 adalah variabel ran-
dom diskrit atau kontinu dengan fungsi densitas probabilitas gabungan f (X1 , X2 )
dan fungsi densitas probabilitas marginal fX1 (x1 ) dan fX2 (x2 ), maka

fX1 ,X2 (x1 , x2 ) = fX1 (x1 ).fX2 |X1 (x2 | x1 ) = fX2 (x2 ).fX1 |X2 (x1 | x2 ) (2.12)

dan jika X1 dan X2 independen, maka

fX2 |X1 (x2 | x1 ) = fX2 (x2 ) (2.13)

dan
fX1 |X2 (x1 | x2 ) = fX1 (x1 ). (2.14)
14

Definisi 2.2.9 Harga Harapan (Bain dan Engelhardt,1992) Misalkan X variabel


random dengan fungsi densitas probabilitas fX (x), harga harapan X didefinisikan
X
E(X) = xfX (x), jika X diskrit, (2.15)
x
Z∞
E(X) = xfX (x)dx, jika X kontinu. (2.16)
−∞

Harga harapan/ekspektasi/mean X dapat ditulis µ.

2.3. Distribusi Khusus

Pada subbab ini diberikan beberapa distribusi khusus yang sering diaplika-
sikan dalam estimasi cadangan klaim.

2.3.1. Distribusi Uniform

Definisi 2.3.1 (Wackerly, 2007) Jika θ1 < θ2 , suatu variabel random Y dikata-
kan memiliki distribusi probabilitas Uniform kontinu pada interval (θ1 , θ2 ) jika dan
hanya jika fungsi densitas probabilitas dari Y adalah

 1 , untuk θ1 ≤ θ2

θ2 −θ1
fY (y) = (2.17)
0, lainnya.

Teorema 2.3.2 Probability Integral Transformation (Bain dan Engelhardt,1992)


Jika X adalah kontinu dengan CDF F (x), maka U = F (x) ∼ U N IF (0, 1).

Bukti. Teorema akan dibuktikan dalam kasus dimana F (x) adalah one-to-one, se-
hingga invers F −1 (u) ada:

FU (u) = P [F (X) ≤ u]

= P [X ≤ F −1 (u)]

= F (F −1 (u))

= u.
15

Karena 0 ≤ F (x) ≤ 1, diperoleh FU (u) = 0 jika u ≤ 0 dan FU (u) = 1 jika u ≥ 1.




2.3.2. Distribusi Gamma

Definisi 2.3.3 (Wackerly, 2007) Suatu variabel random Y dikatakan mempunyai


distribusi Gamma dengan parameter α > 0 dan β > 0 jika dan hanya jika fungsi
densitas probabilitas dari Y adalah
 y

 yα−1

α
e β
, 0≤y<∞
β Γ(α)
fY (y) = (2.18)
0, lainnya,

dimana
Z∞
Γ(α) = y α−1 e−y dy. (2.19)
0

2.3.3. Distribusi Eksponensial

Definisi 2.3.4 (Wackerly, 2007) Suatu variabel random Y dikatakan memiliki dis-
tribusi Eksponensial dengan parameter β > 0 jika dan hanya jika fungsi densitas
probabilitas dari Y adalah

y
 1 e− β , 0 ≤ y < ∞

β
fY (y) = (2.20)
0, lainnya.

2.3.4. Distribusi Weibull

Definisi 2.3.5 (Bain dan Engelhardt,1992) Suatu variabel random Y dikatakan


memiliki distribusi Weibull dengan parameter α > 0 dan β > 0 jika dan hanya jika
fungsi densitas probabilitas dari Y adalah

y α
 αα y α−1 e−( β ) , 0 ≤ y < ∞

β
fY (y) = (2.21)
0, lainnya.

16

2.3.5. Distribusi Lognormal

Definisi 2.3.6 ( Danardono, 2012 ) Suatu variabel random non-negatif X dika-


takan memiliki distribusi Lognormal jika variabel random Y = ln X berdistribusi
Normal. Hasil fungsi densitas probabilitas dari variabel random Lognormal ketika
ln X terdistribusi Normal dengan parameter µ dan σ adalah

(ln y−µ)2
 √1 e− (2σ2 ) , 0 ≤ x < ∞

fY (y) = σy 2π (2.22)
0, lainnya.

2.3.6. Distribusi Poisson

Distribusi Poisson merupakan salah satu distribusi khusus yang paling ba-
nyak digunakan. Biasanya digunakan untuk menyatakan probabilitas banyaknya
kejadian yang terjadi dalam interval waktu tertentu.

Definisi 2.3.7 (Bain dan Engelhardt,1992) Suatu variabel random X dikatakan


memiliki distribusi probabilitas Poisson jika dan hanya jika
(µ)x
pX (x) = e−µ , untuk x = 0, 1, ..., µ > 0. (2.23)
x!

Misalkan X adalah variabel random yang memiliki distribusi Poisson (2.23),


maka mean atau momen pertamanya E(X) adalah
∞ ∞
X X e−µ µx
E(X) = xpX (x) = x
x=0 x=0
x!

−µ
X µx−1
= µe
x=1
(x − 1)!
= µ. (2.24)

Untuk menentukan variansinya, lebih mudah untuk menentukan terlebih dahulu



X
E(X(X − 1)) = x(x − 1)pX (x)
x=0

X µ(x−2)
= µ2 e−µ
x=2
(x − 2)
= µ2 . (2.25)
17

Kemudian

E(X 2 ) = E(X(X − 1)) + E(X)

= µ2 + µ, (2.26)

maka
2
σX = V ar(X) = E(X 2 ) − (E(X))2

= µ2 + µ − µ2

= µ. (2.27)

Dengan demikian, distribusi Poisson memiliki karakteristik dimana mean dan vari-
ansi memilik nilai yang sama yaitu µ. Sedangkan Moment generating function dari
distribusi Poisson, yaitu
n
X
tx
MX (t) = E(e ) = etx pX (x)
x=0
n µ x
X e µ
= etx
x=0
x!
n
−λ
X (λet )x
= e
x=0
x!
n t
t
X e−λe (λet )x
= e−λ eλe
x=0
x!
t
= e−λ eλe
t
= eλ(e −1) . (2.28)

2.4. Statistik Urutan

Misalkan Y(1) menyatakan nilai minimum dari sampel random X1 , X2 , ..., Xn ,


Y(2) menyatakan nilai minimum kedua dari sampel random X1 , X2 , ..., Xn , dan
Y(n) menyatakan nilai maksimum dari sampel random X1 , X2 , ..., Xn . Jadi Y(1) ≤
Y(2) ≤ ... ≤ Y(n) menyatakan nilai-nilai dari sampel random yang telah disusun da-
lam urutan naik, yang kemudian disebut sebagai statistik urutan [Gibbons, 2003].

Teorema 2.4.1 [Bain dan Engelhardt,1992] Jika X1 , X2 , ..., Xn , sampel random


dari suatu populasi dengan fungsi densitas probabilitas yang kontinu, maka fungsi
18

densitas probabilitas gabungan dari Y(1) , Y(2) , ..., Y(n) adalah

g(y1 , ..., yn ) = n!f (y1 )f (y2 )...f (yn ) (2.29)

jika y1 < y2 < ... < yn , dan nol selainnya.

2.5. Proses Poisson

Proses Poisson merupakan salah satu counting process yang paling penting
yang memenuhi beberapa kondisi. Proses Poisson sering digunakan untuk menghi-
tung kejadian-kejadian yang muncul dalam laju/rate tertentu yang benar-benar ran-
dom. Sebelum menjelaskan definisi proses Poisson, akan dijelaskan terlebih dahulu
mengenai definisi proses stokastik dan counting process.

2.5.1. Proses Stokastik

Salah satu contoh yang paling sering digunakan untuk merepresentasikan


proses stokastik adalah banyaknya pelanggan yang datang ke ”Mirota Kampus” da-
lam interval waktu tertentu. Berikut diberikan definisi formal dari proses stokastik.

Definisi 2.5.1 [Ross, 2010] Proses stokastik {X(t), t ∈ T } adalah himpunan vari-
abel random sedemikian sehingga untuk setiap t dalam himpunan indeks T berlaku
X(t) merupakan variabel random.

Jika T merupakan himpunan countable maka X(t) disebut proses stokastik


diskrit, dan jika T himpunan bilangan riil non-negatif maka X(t) disebut proses
stokastik kontinu.

2.5.2. Counting Process

Berikut ini diberikan definisi beserta contoh yang dapat menginterpretasikan


counting process

Definisi 2.5.2 Counting Process (Ross, 2010) Proses stokastik {N (t), t ≥ 0} di-
katakan sebagai counting process jika N (t) mewakili total banyak ”kejadian” yang
terjadi sampai waktu t yang memenuhi kondisi:
19

1.) N (t) ≥ 0.

2.) N (t) adalah bilangan bulat.

3.) Jika s < t, maka N (s) ≤ N (t).

4.) Untuk s < t, N (t) − N (s) menyatakan banyak kejadian yang terjadi dalam
interval waktu (s, t].

Beberapa contoh counting process adalah sebagai berikut:

1. Jika N (t) sama dengan total banyak orang yang memasuki toko tertentu sam-
pai waktu t, maka {N (t), t ≥ 0} adalah counting process dimana suatu keja-
dian berhubungan dengan seseorang yang memasuki toko.

2. Jika N (t) sama dengan total banyak gol yang dicetak oleh pemain sepak bola
sampai waktu t, maka {N (t), t ≥ 0} adalah counting process.

Counting process {N (t), t ≥ 0} dikatakan memiliki independent increments


jika banyaknya kejadian yang terjadi pada interval (s, t] yaitu [N (t) − N (s)] inde-
penden dengan banyaknya kejadian sapai waktu s yaitu N (s). Maksudnya adalah
banyaknya kejadian pada suatu interval tidak dipengaruhi oleh banyaknya kejadian
pada interval sebelumnya. Misalnya, banyak orang yang masuk ke toko pada jam
10.00 (yaitu N (10.00)) harus independen dari banyak orang yang masuk ke toko
antara jam 10.00 dan 15.00 (yaitu N (15.00) − N (10.00)).

Counting process {N (t), t ≥ 0} dikatakan stationary increments jika ba-


nyaknya kejadian pada suatu interval hanya bergantung pada panjang interval wak-
tunya. Dengan kata lain, banyaknya kejadian pada interval waktu (t1 + s, t2 + s]
yakni [N (t2 + s) − N (t1 + s)] memiliki distribusi yang sama dengan banyaknya
kejadian pada interval waktu(t1 , t2 ] yakni [N (t2 ) − N (t1 )]

Selain itu, suatu counting process dikatakan stasioner jika memiliki statio-
nary increments.
20

Secara matematis, himpunan-himpunan yang disjoint direpresentasikan se-


bagai partisi. Oleh karena itu, penjelasan di bawah ini menguraikan tentang definisi
dan cara partisi himpunan.

Definisi 2.5.3 Partisi (Capiński dan Kopp, 2003) Misal himpunan A ⊆ <d dengan
d = 1, 2, 3. Didefinisikan partisi hingga dari himpunan A, dinotasikan dengan ℘,
adalah koleksi hingga dari subhimpunan Ai untuk i = 1, 2, ..., n yang saling lepas,
atau ℘ = {Ai }i=1,2,...,n , dimana Ai ⊂ A dan Ai ∩ Aj = ∅ untuk i, j = 1, 2, ...n,i 6=
j. Gabungan dari subhimpunan Ai tersebut menghasilkan himpunan A itu sendiri,
yang dapat dituliskan sebagai berikut;
n
[
A= Ai dengan Ai ∩ Aj = ∅ untuk i, j = 1, 2, ..., n, i 6= j. (2.30)
i=1

2.5.3. Definisi Proses Poisson

Dalam bukunya, (Ross, 2010) menyebutkan bahwa salah satu counting pro-
ses yang paling penting adalah proses Poisson, yang didefinisikan sebagai berikut.

Definisi 2.5.4 (Ross, 2010) Counting process {N (t), t ≥ 0} dikatakan proses Po-
isson dengan intensitas λ > 0, jika memenuhi kondisi:

1.) N (0) = 0.

2.) Proses memiliki independent increments.

3.) Banyak kejadian di dalam interval dengan panjang t berdistribusi Poisson de-
ngan mean λt, sehingga untuk setiap s, t ≥ 0.
x
−λt (λt)
P (N (t + s) − N (s) = x) = e , x = 0, 1, 2, ... (2.31)
x!

Berdasarkan kondisi 3.) maka diperoleh

E[N (t)] = λt (2.32)


E[N (t)]
= λ, (2.33)
t
21

yang menjelaskan mengapa λ disebut laju/rate dari proses atau banyak kejadian
yang terjadi persatuan waktu.

Definisi kedua muncul karena pada Definisi 2.5.4 belum jelas bagaimana
cara memenuhi kondisi 3.).

Berikut diberikan definisi dari fungsi o(h) yang akan sering digunakan untuk
penjelasan selanjutnya.

Definisi 2.5.5 (Ross, 2010) Fungsi f (·) dikatakan o(h) jika

f (h)
lim = 0. (2.34)
h→0 h

Contoh 2.5.6 Fungsi f (x) = x2 merupakan o(h) karena


f (h) h2
lim = lim = lim h = 0.
h→0 h h→0 h h→0

Contoh 2.5.7 Fungsi f (x) = x merupakan o(h) karena


f (h) h
lim = lim = lim 1 = 1 6= 0.
h→0 h h→0 h h→0

Definisi 2.5.8 (Ross, 2010) Counting process {N (t), t ≥ 0} dikatakan proses Po-
isson dengan intensitas λ, λ > 0, jika memenuhi kondisi:

1.) N (0) = 0.

2.) Proses bersifat independent dan stationary increments

3.) P {}N (h)} = λh + o(h).

4.) P {N (h) ≥ 2} = o(h).

Untuk mengeliminasi Definisi 2.5.8 kondisi 2.) yang menyatakan bahwa


proses bersifat stationary increments yaitu dengan mengganti pernyataan 3.) dan
4.) dari Definisi 2.5.8 dengan pernyataan 5.) dan 6.) di bawah ini.
5.) P {N (t + h) − N (t)} = λh + o(h).
6.) P {N (t + h) − N (t) ≥ 2} = o(h).
22

Dari Definisi di atas, berikut diperoleh beberapa asumsi untuk proses Pois-
son:

1. Peluang terjadi satu kejadian antara waktu t dan t + ∆t adalah λ∆t + o(∆t)
dengan (∆t −→ 0). Berikut penjelasannya.
e−λ∆t (λ∆t)
P N (t + ∆t) − N (t) = 1 =
1! 
1 2 2−...
= (λ∆t) 1 − λ∆t + λ ∆t
2
= λ∆t + o(∆t). (2.35)

2. Peluang lebih dari satu kejadian yang terjadi antara t dan t+∆t adalah sangat
kecil atau bisa dikatakan diabaikan.

X e−λ∆t (λ∆t)2
P N (t + ∆t) − N (t) ≥ 2 =
n=2
2!
1
X e−λ∆t (λ∆t)n
= 1−
n=0
n!
−λ∆t
+ e−λ∆t (λ∆t)

= 1− e

= 1 − (1 + λ∆t)e−λ∆t
 
1 2 2
= 1 − ((1 + λ∆t)) 1 − λ∆t + λ ∆t − ...
2
1 2 2 1 3 3
= λ ∆t − λ ∆t + ...
2 3
= o(∆t) (2.36)

3. Peluang tidak ada kejadian yang terjadi antara t dan t + ∆t adalah e−λ∆t .
e−λ∆t (λ∆t)0
P N (t + ∆t) − N (t) = 0 = = e−λ∆t (2.37)
0!
Proses Poisson terbagi menjadi dua jenis, yaitu proses Poisson homogen dan
non-homogen. Dalam thesis ini akan dipelajari lebih jauh mengenai proses Poisson
non-homogen beserta studi kasusnya.

2.5.4. Distribusi yang Terkait dengan Proses Poisson

Berdasarkan counting process {N (t), t ≥ 0}, N (t) menyatakan banyaknya


kejadian sampai waktu t. Perhatikan bahwa kejadian-kejadian tersebut dapat terjadi
23

kapan saja dalam interval [0, t]. Misalkan kejadian pertama terjadi pada saat t1 , di
sini N (t1 ) = 1 dan N (t) = 0 untuk t < t1 . Kejadian kedua terjadi pada saat t2 , ma-
ka N (t2 ) = 2 dan N (t) = 1 untuk t1 ≤ t < t2 . Perhatikan bahwa (tk+1 − tk ) adalah
panjang waktu terjadinya kejadian ke-(k + 1) setelah kejadian ke-k. Panjang selang
ini disebut dengan waktu antar kejadian, atau dapat ditulis dengan Xn , dimana Xn
adalah waktu antar kejadian ke-(n − 1) dengan kejadian ke-n dengan X1 menyatak-
an waktu kejadian pertama, dan dapat ditulis pula bahwa {Xn , n = 1, 2, ...} adalah
barisan waktu antar kejadian atau interarrival time.

Definisi 2.5.9 Waktu Antar Kejadian (Ross, 2010) Berdasarkan counting process
{N (t), t ≥ 0}, misalkan X1 adalah waktu dari kejadian pertama. Untuk n ≥ 1,
misalkan Xn adalah waktu antara kejadian ke (n − 1) dan kejadian ke n. Maka
{Xn , n ≥ 1} disebut barisan waktu antar kedatangan atau waktu antar kejadian.

Teorema 2.5.10 (Pinsky dan Karlin, 2011) Waktu antar kedatangan Xn , n =


1, 2, ..., n dari suatu proses Poisson adalah saling bebas dan berdistribusi ekspo-
nensial dengan parameter λ.

Gambar 2.1 Waktu Antar Kedatangan

Bukti. Akan ditunjukkan bahwa X1 , X2 , ..., Xn adalah perkalian dari fungsi densi-
tas eksponensial yang diberikan oleh

fX1 ,X2 ,...,Xn (x1 , x2 , ..., xn ) = λe−λx1 λe−λx2 ... λe−λxn .


  
(2.38)
24

Dari Gambar 2.1 bisa dilihat bahwa kejadian bersama dari

x1 < X1 < x1 + 4x1

x2 < X2 < x2 + 4x2

···

···

···

xn < Xn < xn + 4xn

sesuai dengan tidak ada kejadian dalam interval (0, x1 ], (x1 +4x1 , x1 +4x1 +x2 ], ...
, (x1 +4x1 +x2 +4x2 +...+4xn−1 , x1 +4x1 +x2 +4x2 +...+4xn−1 +xn ] dan tepat
satu kejadian di setiap interval (x1 , x1 +4x1 ], (x1 +4x1 +x2 , x1 +4x1 +x2 +4x2 ],
... , (x1 + 4x1 + x2 + 4x2 + ... + 4xn−1 + xn , x1 + 4x1 + x2 + 4x2 + ... +
4xn−1 + xn + 4xn ]. Sehingga

f (x1 , ..., xn ) 4 x1 ... 4 xn = P r(x1 < X1 < x1 + 4x1 , x2 < X2 < x2 + 4x2

, ..., xn < Xn < xn + 4xn ) + o(4x1 4 x2 ... 4 xn )

= P r{N ((0, x1 ]) = 0} × P r{N ((x1 + 4x1 , x1 + 4x1 +

x2 ]) = 0} × ... × P r{N ((x1 + 4x1 + x2 + 4x2 + ...

+ 4 xn−1 , x1 + 4x1 + x2 + 4x2 + ... + 4xn−1 +

xn ]) = 0} × P r{N ((x1 , x1 + 4x1 ]) = 1} × P r{N ((x1

+ 4 x1 + x2 , x1 + 4x1 + x2 + 4x2 ]) = 1} × ... × P r

{N ((x1 + 4x1 + x2 + 4x2 + ... + 4xn−1 + xn , x1 +

4x1 + x2 + 4x2 + ... + 4xn−1 + xn + 4xn ]) = 1}

= e−λx1 e−λx2 ...e−λxn e−λ4x1 e−λ4x2 ...e−λ4xn λ(4x1 )λ

(4x2 )...λ(4xn ) + o(4x1 4 x2 ... 4 xn )

= λe−λx1 λe−λx2 ... λe−λxn (4x1 )(4x2 )...(4xn ) +


  

o(4x1 4 x2 ... 4 xn ).
25

Setelah membagi kedua sisi dengan (4x1 )(4x2 )...(4xn ) dan mencari nilai limit
dengan (4x1 → 0),(4x2 → 0), ..., dan (4xn → 0), sehingga diperoleh (2.38). 

Jika Sn adalah waktu tunggu sampai kejadian ke n, maka

Sn = X1 + X2 + ... + Xn , n = 1, 2, .. (2.39)

Teorema 2.5.11 (Pinsky dan Karlin, 2011) Waktu tunggu Sn memiliki distribusi
gamma yang fungsi densitas probabilitasnya adalah

λn (λt)n−1 −λt
fSn (t) = e n = 1, 2, ..., t ≥ 0. (2.40)
(n − 1)!
Bukti. Sn ≤ t terjadi jika dan hanya jika ada setidaknya n kejadian dalam interval
(0, t], dan karena jumlah kejadian dalam (0, t] memiliki distribusi Poisson dengan
mean λt diperoleh fungsi distribusi kumulatif dari

FSn (t) = P r{Sn ≤ t} = P r{N (t) ≥ n}



X (λt)k e−λt
=
k=n
k!
n−1
X (λt)k e−λt
= 1− .
k=0
k!

Fungsi densitas probabilitas fSn (t) diperoleh dengan cara mencari turunan dari
fungsi distribusi kumulatif FSn (t).

d
fSn (t) = FSn (t)
dt 
λt (λt)2 (λt)n−1
 
d −λt
= 1−e 1− + + ... +
dt 1! 2! (n − 1)!
2
λ(λt)n−2
 
−λt λ(λt) λ(λt)
= −e λ+ + + ... +
1! 2! (n − 2)!
2
(λt)n−1
 
−λt λt (λt)
+λe 1− + + ... +
1! 2! (n − 1)!
n n−1
λ (λt)
= e−λt n = 1, 2, ..., t ≥ 0.
(n − 1)!


26

2.5.5. Distribusi Uniform dan Proses Poisson

Hasil utama dari subbab ini adalah, Teorema 2.5.12, yang menyediakan alat
penting untuk menghitung fungsionalitas tertentu pada proses Poisson. Jika suatu
kejadian bersyarat dengan bersyaratkan total banyak kejadian yang tetap dalam su-
atu interval, maka lokasi kejadian tersebut didistribusikan secara uniform dengan
cara tertentu.

Untuk benar-benar memahami teorema, pertimbangkan terlebih dahulu ek-


sperimen berikut. Terdapat t unit segmen garis yang sama panjang dan n jumlah
tetap dari anak panah, dan kemudian melempar anak panah ke segmen garis sehing-
ga posisi setiap anak panah saat mendarat didistribusikan secara uniform di sepan-
jang segmen, terlepas dari lokasi anak panah lainnya. Misalkan T1 menjadi posisi
anak panah pertama yang dilemparkan, T2 posisi anak panah kedua, dan seterusnya
hingga Tn .

Teorema 2.5.12 (Pinsky dan Karlin, 2011) Misalkan T1 , T2 , ... menjadi waktu ter-
jadinya dalam proses Poisson dengan intensitas λ > 0. Bersyaratkan N (t) = n,
variabel random T1 , T2 , ..., Tn , memiliki fungsi densitas probabilitas gabungan
n!
untuk 0 < x1 < ... < xn ≤ t.
fX1 ,...,Xn |N (t)=n (x1 , .., xn ) = (2.41)
tn
Bukti. Kejadian xi < Xi ≤ xi +4xi untuk i = 1, ..., n dan N (t) = n sesuai dengan
tidak ada kejadian yang terjadi dalam interval (0, x1 ], (x1 + 4x1 , x2 ], ..., (xn−1 +
4xn−1 , xn ], (xn + 4xn , t], dan tepat satu kejadian di setiap interval (x1 , x1 + 4x1 ],
(x2 , x2 + 4x2 ], ..., (xn , xn + 4xn ]. Interval ini terpisah, dan

P r{N ((0, x1 ]) = 0, ..., N ((xn + 4xn , t]) = 0}

= e−λx1 e−λ(x2 −x1 −4x1 ) · · · e−λ(xn −xn−1 −4xn−1 ) e−λ(t−xn −4xn )

= e−λt eλ(4x1 +...+4xn )


 

= e−λt [1 + o(max{4xi })] ,

sementara

P r{N ((x1 , x1 + 4x1 ]) = 1, ..., N ((xn , xn + 4xn ]) = 1}

= λ(4x1 )...λ(4xn )[1 + o(max{4xi })].


27

Sehingga

fX1 ,...,Xn |N (t)=n (x1 , . . . , xn ) 4 x1 . . . 4 xn

= P r{x1 < X1 ≤ x1 + 4x1 , . . . , xn < Xn ≤ xn + 4xn | N (t) = n}

+o(4x1 · · · 4 xn )

P r{xi < Xi ≤ xi + 4xi , i = 1, . . . , n, N (t) = n}


=
P r{N (t) = n}
+o(4x1 · · · 4 xn )
e−λt λ(4x1 ) . . . λ(4xn )
= e−λt (λt)n
[1 + o(max{4xi })]
n!
n!
= n (4x1 ) . . . (4xn )[1 + o(max{4xi })].
t
Membagi kedua sisi dengan (4x1 ) . . . (4xn ) dan mencari limitnya dengan (4x1 →
0), . . . , (4xn ) → 0, sehingga diperoleh (2.41). 

2.6. Proses Poisson Non-Homogen

Proses Poisson non-homogen disebut juga proses Poisson tidak stasioner


dengan intensitas dianggap sebagai fungsi dari waktu t.

Definisi 2.6.1 (Ross, 2010) (Ross, 2007) Counting process N (t), t ≥ 0 dikatakan
proses Poisson non-homogen dengan fungsi intensitas λ(t) jika memenuhi kondisi:

1.) N (0) = 0.

2.) {N (t), t ≥ 0} memiliki independent increments.

3.) P (N (t + h) − N (t) ≥ 2) = o(h).

4.) P (N (t + h) − N (t) = 1) = λ(t)h + o(h).

Untuk t ∈ [0, +∞] didefinisikan suatu fungsi hazard kumulatif atau disebut
juga nilai harapan dari increments yang dinyatakan oleh persamaan berikut, yaitu
Zt
Λ(t) = E(N (t)) = λ(s)ds. (2.42)
0
28

Berdasarkan fungsi Λ(t) maka peluang bahwa ada kejadian sebanyak k da-
lam interval waktu t adalah

(Λ(t))k
P {N (t) = k | N (0) = 0} = e−Λ(t) (2.43)
k!

Teorema 2.6.2 (Ross, 2010) Misalkan {N (t), t ≥ 0} dan {M (t), t ≥ 0} merupa-


kan proses Poisson non-homogen dengan fungsi intensitas masing-masing λ(t),
µ(t), t ≥ 0. Berikut ini berlaku:

1.) Untuk semua t ≥ 0, h > 0 variabel random N (t + h) − N (t) berdistribusi


Poisson dengan parameter Λ(t + h) − Λ(t).

2.) Misalkan Ti menyatakan waktu dari kejadian ke-i, kemudian untuk 0 ≤ t1 <
... < tn < ∞ maka
n
P [Ti ∈ [ti , ti + hi )] −Λ(t)
Y
lim =e λ(ti ). (2.44)
(h1 ,...,hn )→(0+ ,...,0+ ) h i=1

3.) Jika N ∗ (t) = N (t) + M (t), maka {N ∗ (t), t ≥ 0} adalah proses Poisson non-
homogen dengan fungsi intensitas λ(t) + µ(t). Mengingat bahwa pada saat
waktu t terjadi suatu kejadian, dimana kejadian itu merupakan proses {Nt , t ≥
0} dengan peluang
λ(t)
. (2.45)
λ(t) + µ(t)
Bukti.

1.) Diketahui {N (.)} merupakan proses Poisson non-homogen, dan berdasarkan


Rt
persamaan (2.42) diperoleh secara berturut-turut bahwa Λ(t) = λ(x) dx dan
0
t+h
R
Λ(t+h) = λ(x) dx adalah fungsi nilai rata-rata dari {N (t)} dan {N (t+h)},
0
untuk semua t ≥ 0, h ≥ 0. Dengan menggunakan moment generating function
akan ditunjukkan bahwa variabel random Y = N (t + h) − N (t) berdistribusi
29

Poisson dengan parameter Λ(t + h) − Λ(t)

MY (s) = E(eY s )

= E(e(N (t+h)−N (t))s )


 N (t+h)s 
e
= E
eN (t)s
E(eN (t+h)s )
=
E(eN (t)s )
s
eΛ(t+h)(e −1)
=
eΛ(t)(es −1)
s
= eΛ(t+h)−Λ(t)(e −1) .

Jadi terbukti bahwa N (t + h) − N (t) berdistribusi Poisson dengan parameter


Λ(t + h) − Λ(t).

2.) Dengan mencari P {N (t) = 0} dari persamaan (2.43) diperoleh,

e−(Λ(b)−Λ(a))

yaitu probabilitas bahwa tidak ada kejadian pada interval waktu (a, b]. Selan-
jutnya, definisi 2.6.1 nomor 4.) menyatakan bahwa probabilitas bahwa ada satu
kejadian pada interval (a, a + h] adalah sama dengan

λh + o(h).

Misalkan tidak ada kejadian selama interval [0, t1 ), ada satu kejadian selama
interval [t1 , t1 + h1 ), tidak ada kejadian selama interval [t1 + h1 , t2 ), ada satu
kejadian selama interval [t2 , t2 + h2 ), dan seterusnya sampai ada satu kejadian
selama interval [tn, tn + hn ), dan tidak ada kejadian selama interval [tn + h, ∞).
Kemudian dengan menggunakan sifat kenaikan bebas dan sifat yang telah dise-
butkan sebelumnya, maka probabilitas di dalam limit bisa ditulis dalam bentuk
n
e−Λ(t1 ) [λ(ti hi + o(hi))]eΛ(ti+1 −Λ(ti +hi ))
Q
n
Y
i=1 −Λ(t)
lim =e λ(ti )
(h1 ...hn )→(0+ ...0+ ) h1 ...hn i=1
30

3.) Untuk memverifikasi bahwa {Nt∗ (t), t ≥ 0} adalah proses Poisson non-homogen
dengan fungsi intensitas λ(t)+µ(t) cukup dengan membuktikan bahwa {Nt∗ (t), t ≥
0} memenuhi definisi 2.6.1 yaitu

(a) Karena {N (t), t ≥ 0} dan {M (t), t ≥ 0} merupakan proses Poisson non-


homogen, maka N (0) = N (0) + M (0) = 0.

(b) Untuk memverifikasi sifat independent increments, misalkan I1 , ..., In ada-


lah interval yang tidak tumpang tindih, dan misalkan N (I) dan M (I) se-
cara terurut menyatakan jumlah kejadian dari proses {N (t)} dan proses
{M (t)} yang ada dalam interval I. Karena setiap proses menghitung me-
miliki sifat independent increments, dan kedua proses itu independen satu
sama lain, maka N (I1 ), ..., N (In ), M (I1 ), ..., M (In ) semuanya indepen-
den, dan demikian juga N (I1 ) + M (I1 ), ..., N (In ) + M (In ), yang menun-
jukkan bahwa {N ∗ (t), t ≥ 0} juga memiliki sifat independent increments.

(c) Agar ada tepat satu kejadian dari proses N ∗ antara t dan t + h, baik sa-
tu kejadian dari proses N dan 0 kejadian dari proses M atau sebaliknya.
Untuk satu kejadian dari proses N dan 0 kejadian dari proses M memiliki
probabilitas

P {N (t, t + h) = 1, M (t, t + h) = 0}

⇔ P {N (t, t + h) = 1}P {M (t, t + h) = 0}

⇔ (λ(t)h + o(h))(1 − µ(t)h + o(h))

⇔ λ(t)h + o(h).

Untuk 0 kejadian dari proses N dan satu kejadian dari proses M memiliki
probabilitas

P {N (t, t + h) = 0, M (t, t + h) = 1}

⇔ P {N (t, t + h) = 0}P {M (t, t + h) = 1}

⇔ (1 − λ(t)h + o(h))(µ(t)h + o(h))

⇔ µ(t)h + o(h).
31

Sehingga untuk P {N ∗ (t + h) − N ∗(t) = 1} diperoleh

P {N ∗ (t + h) − N ∗ (t) = 1} = (λ(t) + µ(t))h + o(h).

(d) Agar setidaknya ada dua kejadian yang terjadi pada proses N ∗ antara t dan
t + h, salah satu dari tiga kemungkinan berikut harus terjadi: setidaknya
ada dua kejadian yang terjadi pada proses N antara t dan t + h; setidaknya
ada dua kejadian yang terjadi pada proses M antara t dan t+h; atau kedua
proses memiliki tepat satu kejadian antara t dan t + h. Dua kemungkinan
pertama terjadi dengan probabilitas o(h), sedangkan yang ketiga terjadi
dengan probabilitas (λ(t)h + o(h))(λ(t)h + o(h)) = o(h). Sehingga dipe-
roleh

P {N ∗ (t + h) − N ∗ (t) =≥ 2} ≤ o(h).

Berdasarkan (a),(b), (c), dan (b) terbukti bahwa {N ∗ (t), t ≥ 0} merupakan


proses Poisson non-homogen.

Selanjutnya untuk membuktikan teorema 2.6.2 nomor 3.), pertama ingat bahwa
{N ∗ (t), t ≥ 0} mempunyai sifat independent increments yang menyebabkan
kejadian pada waktu t independen terhadap kejadian yang terjadi sebelum t.
Untuk menemukan probabilitas bersyarat bahwa kejadian pada waktu t berasal
dari proses N , adalah dengan menggunakan

P {N (t, t + h) = 1, M (t, t + h) = 0}
P {N (t, t + h) = 1|N ∗ (t, t + h) = 1} =
P {N ∗ (t, t + h) = 1}
λ(t)h + o(h)
=
(λ(t) + µ(t))h + o(h)
o(h)
λ(t) + h
= o(h)
.
λ(t) + µ(t) + h

selanjutnya cari nilai limit h → 0 dari persamaan di atas sehingga diperoleh


(2.45) dan Teorema 2.6.2 nomor 3.) terbukti.


32

2.7. Non-Homogeneous Marked Poisson Process

Untuk proses titik tertentu, setiap titik yang random dari proses titik dapat
memiliki objek matematika yang random juga, yang dikenal sebagai tanda. Tanda-
tanda ini dapat beragam seperti bilangan bulat, bilangan real, garis, objek geometris
atau proses titik lainnya. Pasangan yang terdiri dari satu titik proses titik dan tanda
yang bersangkutan disebut titik bertanda, dan semua titik yang ditandai membentuk
proses titik yang ditandai. Sering diasumsikan bahwa tanda yang random bersifat
independen antara satu dengan yang lain dan terdistribusi secara identik, namun tan-
da suatu titik masih dapat bergantung pada lokasi titik terkait di ruang atau keadaan
yang mendasarinya. Jika proses titik yang mendasari adalah proses titik Poisson
non-homogen, maka proses titik yang dihasilkan adalah proses titik Poisson non-
homogen yang ditandai.

Misalkan Y menjadi proses titik pada T ⊆ Rd . Diberi beberapa ruang M,


jika ”tanda” bersifat random dan mξ ∈ M melekat pada setiap titik ξ ∈ Y , maka

X = {(ξ, mξ ) : ξ ∈ Y } (2.46)

disebut proses titik bertanda dengan titik di T dan ruang tanda M . Dalam penelitian
ini dipertimbangkan kasus-kasus di mana M merupakan himpunan terbatas atau
himpunan bagian dari Rp , p ≥ 1.

Definisi 2.7.1 Marked Poisson Process ( Daley dan Vere-Jones, 2003) Misalkan
Y adalah Poisson (T, φ), di mana φ adalah fungsi intensitas yang dapat diinte-
grasikan, dan bersyarat Y , tanda {mξ : ξ ∈ Y } saling independen. Kemudian
X adalah proses Poisson yang ditandai. Jika tanda didistribusikan secara identik
dengan distribusi Q yang umum, maka Q disebut distribusi tanda.

Berikut diberikan definisi Non-Homogeneous Marked Poisson Process di-


mana proses titiknya merupakan proses Poisson non-homogen.

Definisi 2.7.2 Non-Homogeneous Marked Poisson Process (Bednárik,2017) Pro-


ses titik Poisson ditandai dengan fungsi intensitas non-negatif λ(t), t ≥ 0, dan
33

tanda yang bergantung posisi adalah proses yang dinotasikan oleh

{(Ti , Zi ), i = 1, ..., N } ∼ P o(λ(t), fZ|t ), (2.47)

dimana proses titik {Ti , i ∈ N } ditentukan oleh proses Poisson non-homogen {Nt , t ≥
0} dengan fungsi intensitas λ(t), dan tanda Zi = ZTi ∈ Z memenuhi asumsi beri-
kut ini:

1.) {Zt , t ≥ 0} adalah keluarga dari elemen random di Z yang saling independen;

2.) {Zt , t ≥ 0} tidak bergantung pada proses {Nt , t ≥ 0};

3.) Tanda bersyaratkan titik kejadian Z|T = t mempunyai densitas fZ|T (z | t), z ∈
Z.

2.8. Metode Maximum Likelihood Estimation (MLE)

Salah satu metode yang digunakan untuk mencari nilai estimasi dari suatu
parameter adalah metode maksimum likelihood. Ide dasar dari metode ini adalah
menggunakan nilai dalam suatu ruang parameter yang menghubungkannya dengan
data observasi yang memiliki kemungkinan terbesar sebagai penduga dari parame-
ter yang tidak diketahui.

Definisi 2.8.1 (Fungsi Likelihood) (Bain dan Engelhardt,1992) Fungsi densitas


bersama dari n variabel random X1 , X2 , ..., Xn dengan nilai variabel random ada-
lah x1 , x2 , ..., xn dilambangkan dengan f (x1 , x2 , ..., xn ) merupakan fungsi likeli-
hood. Untuk x1 , x2 , ..., xn fungsi likelihoodnya adalah fungsi dari θ yang dilam-
bangkan dengan L(θ). Jika x1 , x2 , ..., xn menggambarkan sebuah sampel random
dari f (x; θ), maka
L(θ) = f (x1 ; θ)...f (xn ; θ) (2.48)

Definisi 2.8.2 (Maximum Likelihood Estimator) (Bain dan Engelhardt,1992) Mi-


salkan L(θ) = f (x1 ; θ)f (x2 ; θ)...f (xn ; θ) merupakan densitas probabilitas bersa-
ma dari sampel random X1 , ..., Xn dengan memandangnya sebagai fungsi θ. Un-
tuk suatu himpunan observasi-observasi x1 , x2 , ..., xn , suatu nilai θ̂ yang memaksi-
34

mumkan L(θ) disebut sebagai Maximum Likelihood Estimator (MLE) dari θ. Maka
θ̂ merupakan suatu nilai dari θ yang memenuhi:

f (x1 , x2 , ..., xn ; θ̂) = max f (x1 , x2 , ..., xn ; θ) (2.49)


θ∈Ω

Untuk memudahkan dalam perhitungan, maka fungsi Likelihood pada Persa-


maan (2.48) ditransformasikan menjadi fungsi log-likelihood. Fungsi log-likelihood
dapat didefinisikan sebagai berikut:

n
Y
`(θ) = log(L | x)) = log f (xi : θ). (2.50)
i=1

Untuk memperoleh nilai θ̂ yang memaksimumkan L(θ) dilakukan dengan


langkah-langkah sebagai berikut:

1. Nilai θ̂(x) diperoleh dari derivatif pertama L(θ | x) yaitu,



L(θ) = 0. (2.51)
∂θ

2. Nilai θ̂(x) dikatakan memaksimumkan L(θ | x) jika turunan keduanya berni-


lai negatif. Dengan kata lain
∂2
L(θ) |θ=θ̂ < 0. (2.52)
∂θ

Selain memaksimumkan fungsi likelihood, nilai θ̂ juga dapat diperoleh de-


ngan memaksimumkan fungsi log-likelihood, `(θ). Karena fungsi log merupakan
fungsi monoton naik, maka nilai θ̂ yang memaksimumkan L(θ) juga memaksi-
mumkan log-likelihood, `(θ).

Untuk memperoleh nilai θ̂ yang dengan langkah-langkah beriku:

1. Nilai θ̂ diperoleh dari derivatif pertama,



`(θ) = 0 (2.53)
∂θ

2. Nilai θ̂ dikatakan memaksimumkan jika:


∂2
`(θ) |θ=θ̂ < 0. (2.54)
∂θ
35

2.9. Data dan Variabel Random Survival

Data survival adalah suatu data yang berkaitan dengan lamanya waktu dari
waktu awal sampai suatu kejadian terjadi (waktu akhir). Data klaim termasuk da-
ta survival dengan waktu awal berupa waktu klaim terjadi dan waktu akhir berupa
periode waktu pembayaran diselesaikan. Data survival dinyatakan dalam suatu va-
riable random non-negatif T . Fenomena yang terkait dengan data survival antara
lain:

1. Kejadian (event) yang menjadi perhatian.

2. Waktu awal (Origin), yaitu titik asal dimana suatu unit penelitian mulai dia-
mati sampai mendapatkan/mengalami kejadian (event).

3. Unit waktu yang digunakan, misalnya bulan atau tahun.

Definisi 2.9.1 Tersensor ( Danardono, 2012 ) Suatu observasi dikatakan tersensor


kanan (right cencored) pada titik k jika nilai observasi yang digunakan adalah t, ji-
ka t ≤ k; atau k jika t > k. Jika titik k ditentukan terlebih dahulu, maka observasi
dikatakan tersensor Tipe I, sedangkan jika pengamatan dihentikan setelah dipero-
leh r buah unit penelitian yang mengalami kejadian (event), maka observasi pada
unit penelitian yang belum mendapatkan event dikatakan tersensor kanan Tipe II.

Penyensoran (censoring) pada suatu pengamatan akan berakibat ketidakleng-


kapan informasi lama waktu atau durasi pada data yang diperoleh.

2.9.1. Fungsi Survival dan Hazard

Dalam analisis data survival, fungsi variabel random yang menjadi perhatian
adalah fungsi survival dan fungsi hazard. Fungsi survival adalah probabilitas satu
individu hidup (survive) lebih lama daripada t
Z∞
S(t) = P (T > t) = f (s)ds. (2.55)
t
36

Fungsi S(t) adalah fungsi non-increasing terhadap waktu t dengan sifat S(0) = 1
dan lim S(t) = 0. Fungsi variabel random lain yang cukup penting adalah fungsi
t→∞
hazard yang didenisikan sebagai
P (t ≤ T < t + 4t | T ≥ t)
h(t) = lim , (2.56)
4t→0 4t
yang dapat diinterpretasikan sebagai tingkat (rate) terjadinya suatu kejadian (event).
Fungsi hazard bukan probabilitas, sehingga dimungkinkan nilainya lebih dari satu.
Batasan yang dikenakan pada fungsi hazard hanyalah h(t) ≥ 0. Integral dari fungsi
hazard h(t) adalah fungsi hazard kumulatif
Zt
H(t) = h(x)dx, (2.57)
0

yang hubungan fungsionalnya dengan S(t) cukup penting sebagai dasar dalam pe-
modelan data survival.

Fungsi S(t), h(t), H(t) dan f (t) merupakan fungsi yang bergantung pada
waktu t.

2.9.2. Kuantil

Kadang diperlukan fungsi yang hasilnya berupa nilai waktu t dengan dibe-
rikan probabilitas atau kuantitas yang lain. Misalnya dalam penghitungan median.
Median adalah nilai tengah, yaitu jika t0,5 adalah median, maka S(t0,5 ) = 0, 5.
Secara umum diperlukan fungsi yang dapat digunakan mencari median atau titik
waktu yang lain dengan diberikan probabilitas yang dinamakan fungsi kuantil.

Kuantil merupakan suatu titik yang membagi serangkaian obeservasi ke da-


lam kelompok-kelompok yang berukuran sama. tp disebut kuantil ke-p dari variabel
random T jika P (T ≤ tp ) = p, untuk sebarang p(0 < p < 1) (Gibbons, 2003).
Fungsi kuantil dapat dinyatakan dalam bentuk

tp = S −1 (p), 0<p<1 (2.58)

atau
tp = F −1 (p), 0 < p < 1. (2.59)
37

2.9.3. Hubungan antar Fungsi

Fungsi survival S(t) dapat diturunkan dari distribusi kumulatif F (t) sebagai
berikut
S(t) = 1 − F (t). (2.60)

Sedangkan fungsi hazard h(t) dapat dituliskan sebagai

f (t)
h(t) = . (2.61)
S(t)

2.9.4. Estimasi Parameter

Estimasi parameter suatu model survival parametrik dapat dilakukan dengan


metode Maximum Likelihood Estimation.

Untuk data survival yang diasumsikan independen dan identik serta lengkap,
apabila ada t1 , t2 , ..., tn observasi, maka dari persamaan (2.48) diperoleh fungsi like-
lihood sebagai berikut.
n
Y
L(θ | t) = f (ti ; θ). (2.62)
i=1

Untuk data survival yang tidak lengkap, baik karena tersensor maupun terpotong,
fungsi likelihood ditentukan sebagai berikut.

Data survival dengan kemungkinan tersensor kanan dapat direpresentasikan


sebagai pasangan nilai observasi survival dengan status tersensornya yaitu (ti , δi ),
i = 1, 2, ..., n dengan

0,

jika i tersensor
δi = (2.63)
1,

jika i mendapatkan kejadian (event).

Dengan asumsi masing-masing (Ti , δi ) independen satu dengan yang lain,


fungsi likelihood untuk data tersensor kanan adalah
n
Y
L(θ) ∝ f (ti ; θ)δi S(ti ; θ)1−δi , (2.64)
i=1

dengan θ = (θ1 , ..., θp ) adalah p parameter yang akan diestimasi; f (ti ; θ)


38

adalah fungsi densitas probabilitas untuk i yang mendapatkan kejadian (event) dan
S(ti ; θ) adalah fungsi survival untuk i yang tidak mendapatkan kejadian (event).

Fungsi log-likelihood untuk data tersensor kanan dari fungsi likelihood (2.64)
adalah
n
X
`(θ) ∝ (δi ) log(f (ti ; θ)) + (1 − δi ) log(S(ti ; θ)). (2.65)
i=1

Untuk mendapatkan estimasi dari θ dapat digunakan metode Maximum Likeliho-


od Estimator seperti Definisi 2.8.2, kemudian dilanjutkan dengan langkah-langkah
Maximum Likelihood Estimator yang telah dijelaskan sebelumnya.

2.10. Uji Kolmogorov-Smirnov

Uji Kolmogorov-Smirnov digunakan untuk menguji apakah distribusi da-


ta sampel yang teramati sesuai dengan distribusi teoritis tertentu atau tidak. Uji
Kolmogorov-Smirnov dirancang secara khusus untuk distribusi kontinu, tetapi da-
pat digunakan untuk distribusi diskrit bila ukuran sampel kurang dari 30. Hipotesis
uji secara umum ditulis,

• H0 : F (x) = Ft (x) untuk semua nilai x,

• H1 : F (x) 6= Ft (x) untuk sekurang-kurangnya sebuah nilai x.

Uji Kolmogorov-Smirnov menggunakan statistik uji:

D= sup |Fs (xi ) − Ft (xi )|, (2.66)


−∞<x<∞

dimana Fs (x) adalah fungsi distribusi frekuensi kumulatif dan Ft (x) adalah fungsi
distribusi kumulatif teoritis dari sampel random X1 , X2 , ..., Xn .

Kesimpulan yang diambil adalah menolak H0 jika D > Dn,α , dengan Dn,α
adalah nilai kritis yang diperoleh dari tabel Kolmogorov-Smirnov.

2.11. Simulasi

Ada beberapa metode yang dapat digunakan untuk mencari estimasi cadang-
an klaim, salah satunya adalah metode simulasi. Simulasi dapat diartikan sebuah
39

metode untuk mengevaluasi suatu model yang melibatkan bilangan random sebagai
salah satu input. Metode ini sering digunakan jika model yang digunakan cukup
kompleks, melibatkan lebih dari sepasang parameter yang tidak pasti. Sebuah si-
mulasi dapat melibatkan lebih dari 10.000 evaluasi atas sebuah model, suatu peker-
jaan yang di masa lalu hanya bisa dikerjakan oleh sebuah super komputer. Metode
simulasi digolongkan sebagai metode sampling kerena input dibangkitkan secara
random dari suatu distribusi probabilitas untuk proses sampling dari populasi nya-
ta. Oleh karena itu kita harus memilih suatu distribusi sebagai input yang paling
mendekati data yang kita miliki.

2.12. Cadangan Klaim

Dalam asuransi kerugian, penyelesaian klaim biasanya tidak dilakukan de-


ngan segera. Hal ini disebabkan beberapa alasan (Wüthrich dan Merz, 2008):

1. Terdapat waktu tunda pelaporan klaim atau adanya selisih waktu antara keja-
dian klaim dan pelaporan klaim.

2. Setelah klaim dilaporkan, terdapat waktu tunda sampai klaim diselesaikan.

3. Terdapat kasus suatu klaim yang sudah ditutup harus dibuka kembali dengan
diikuti penambahan pembayaran klaim.

Penyelesaian klaim yang tidak dilakukan dengan segera akan mengakibat-


kan adanya hutang pada perusahaan asuransi, Perusahaan dapat mengatasi masalah
hutang klaim tersebut dengan mempersiapkan dana yang khusus digunakan untuk
membayar hutang klaim. Dana yang dipersiapkan dinamakan dengan cadangan
klaim (claim reserves). Cadangan klaim terdiri dari dua jenis, yaitu sebagai berikut:

1. Cadangan IBNR (incurred but not reported), yaitu cadangan untuk klaim
yang terjadi tetapi belum dilaporkan. Klaim ini berkaitan dengan kejadian
yang terjadi dan diumumkan di media informasi tetapi belum dilaporkan ke
perusahaan asuransi. cadangan IBNR dihitung berdasarkan analisa penga-
40

laman terdahulu oleh bagian akuntansi, statistik, dan aktuaria pada perusaha-
an asuransi.

2. Cadangan RBNS (reported but not settled), yaitu cadangan untuk klaim yang
waktu pembayaran dan penyelesaiannya tertunda. Cadangan yang termasuk
di dalamnya adalah klaim yang sedang dalam proses penyelesaian.

Gambar 2.2 Jenis Cadangan Klaim

2.13. Segitiga Run-Off Agregat

Tabel 2.1 Segitiga Run-Off Agregat Incremental

Data yang ada dalam run-off triangle biasanya merupakan salah satu dari
dua kemungkinan berikut, yaitu claims amount (besarnya klaim) atau number of
41

claims (banyaknya klaim), dimana keduanya tersaji dalam bentuk cumulative atau
incremental. Jika datanya adalah claims amount, maka run-off triangle data berisi-
kan paid claims data atau incurred claims data (Olofsson, 1999). Paid claims data
adalah data pembayaran klaim-klaim yang telah terjadi, sedangkan incurred claims
data adalah paid claims data ditambah dengan case reserves. Case reserves ada-
lah taksiran besarnya uang yang dibuat oleh perusahaan asuransi untuk membayar
klaim-klaim yang sudah dilaporkan (Calandro dan OBrien, 2004).

Segitiga run-off digunakan untuk memprediksi besarnya klaim atau banyak-


nya klaim yang akan terjadi di masa yang akan datang. Metode segitiga ini sering
digunakan dalam bidang asuransi, terutama asuransi kerugian kelas long tailed bu-
siness. Segitiga run-off agregat merupakan ringkasan dari klaim-klaim individu
sehingga informasi klaim yang ada pada data tersebut terabaikan (Mutaqin ,2008).
Segitiga run-off agregat berisi periode kejadian, periode perkembangan dan besar
pembayaran klaim yang dapat dilihat pada Tabel 2.1. Periode kejadian klaim adalah
suatu periode ketika terjadi resiko pada seseorang pemegang polis yang mengaki-
batkan klaim. Periode perkembangan adalah suatu periode ketika klaim tersebut
telah dibayarkan oleh perusahaan asuransi kepada pemegang polis.

Yi,j dengan i, j ∈ {1, 2, ..., n} adalah suatu variabel random yang menya-
takan klaim yang terjadi pada periode kejadian ke-i dan dibayarkan pada periode
perkembangan ke-j yang terobservasi saat i + j ≤ n + 1 dan tidak terobservasi saat
i + j > n + 1. Berdasarkan tabel di atas menunjukkan bahwa data segitiga run-off
yaitu sel-sel Yi,j (untuk i + j ≤ n + 1) yang berada pada segitiga atas dan berwarna
putih, sedangkan future triangle data yaitu sel-sel Yi,j (untuk i + j > n + 1) yang
berada pada segitiga bawah dan berwarna abu-abu mempresentasikan pembayaran
klaim dalam setiap periode pembayaran.

2.14. Segitiga Run-Off Individu

Segitiga run-off individu merupakan bentuk representasi dari klaim-klaim


individu ( (Drieskens, et al., 2012). Konsep dari segitiga run-off individu sama de-
42

Tabel 2.2 Segitiga Run-Off Individu Incremental

ngan segitiga run-off agregat, hanya saja dalam segitiga run-off individu klaim tidak
diringkas sebagaimana dalam segitiga run-off agregat. Dengan demikian, informa-
si yang berkaitan dengan kliam individu tersebut dapat ditampilkan pada segitiga
run-off individu. Bentuk umum dari segitiga run-off individu yang dikenalkan oleh
( (Drieskens, et al., 2012) dapat dilihat pada Tabel 2.2.
43

2.15. Metode Chain Ladder

Tabel 2.3 Segitiga Run-Off Agregat Kumulatif

Menurut (Mack, 1993) metode Chain Ladder merupakan metode yang di-
gunakan untuk mengestimasi total klaim yang akan datang pada data yang tersaji
dalam segitiga ron-off agregat (Tabel 2.1). Tahap awal metode ini adalah memben-
tuk segitiga run-off agregat kumulatif yang ditunjukkan pada Tabel 2.3 yang dapat
diperoleh dengan menggunakan persamaan
n
X
Ci,j = Yi,j (2.67)
j=1

dengan i ∈ {1, 2, ..., n} dan j ∈ {1, 2, ..., n − i + 1}. Variabel random Ci,j me-
nyatakan total besar klaim pada periode kejadian ke-i dan dibayar sampai dengan
periode perkembangan ke-j.

Untuk mengestimasi segitiga bagian bawah yaitu Ĉi,j yang merupakan total
besar klaim yang akan datang dilakukan perhitungan faktor perkembangan terlebih
44

dahulu. Estimasi faktor perkembangan ke-j dihitung menggunakan


n−j
P
Ci,j+1
i=1
λ̂j = n−j
(2.68)
P
Ci,j
i=1

dengan j ∈ {1, 2, ..., n − 1}. Selanjutnya, faktor perkembangan tersebut digunakan


untuk mengestimasi klaim kumulatif pada segitiga bawah sampai periode perkem-
bangan ke-j, yaitu dengan persamaan

Ĉi,j = Ĉi,j−1 λ̂j−1 (2.69)

untuk i ∈ {2, 3, ..., n} dan j ∈ {n − i + 2, ..., n}. Selain itu, dapat pula diperoleh
total klaim untuk periode kejadian-i, i ∈ {2, 3, ..., n}, yaitu dengan persamaan

R̂i = Ĉi,n − Ci,n+1−i . (2.70)

Dengan demikian, diperoleh total klaim yang akan datang adalah


n
X
R̂ = R̂i . (2.71)
i=2
BAB III

RENCANA PENELITIAN

Bab ini membahas rencana pelaksanaan penelitian yang berisi tahapan pene-
litian, jadwal penelitian, serta hasil sementara yang meliputi model yang digunakan,
proses estimasi parameter, simulasi, serta hasil estimasi.

3.1. Rencana Pelaksanaan Penelitian

Berikut akan dijelaskan tahapan penelitian, jadwal penelitian beserta hasil


sementara yang diperoleh dari penelitian.

3.1.1. Tahapan Penelitian

Tahapan-tahapan penelitian ini sebagai berikut.

1. Menenentukan Jurnal dan Mencari Literatur


Tahapan ini meliputi penentuan artikel/topik penelitian dengan pertimbangan
dari dosen pembimbing. Selanjutnya mencari literatur-literatur terkait topik
penelitian baik dalam bentuk jurnal maupun buku.

2. Studi Literatur
Mempelajari literatur-literatur yang diperoleh.

3. Menyusun Proposal Penelitian


Setelah memahami literatur-literatur yang digunakan, dilakukan penyusunan
proposal penelitian.

4. Ujian Proposal Penelitian


Apabila proposal sudah disetujui pembimbing, proposal penelitian kemudian
dipresentasikan kepada tim penguji dan dosen pembimbing. Tahap ini me-
nentukan penelitian dilanjutkan atau tidak.

45
46

5. Revisi Proposal Penelitian


Apabila tim penguji memutuskan penelitian dilanjutkan, tahapan berikutnya
adalah menegerjakan revisi yang disyaratkan serta saran yang disampaikan
oleh tim penguji.

6. Menyusun Pembahasan
Tahapan berikutnya adalah mencari data dari sumber yang dapat dipertang-
gungjawabkan keasliannya untuk selanjutnya digunakan sebagai materi pada
bab pembahasan yang membahas pemodelan cadangan klaim individual.

7. Membuat Draft Hasil Penelitian


Membuat draft hasil penelitian dalam dua bahasa yaitu Bahasa Indonesia dan
Bahasa Inggris.

8. Ujian Tesis
Mempresentasikan hasil penelitian kepada tim penguji dan dosen pembim-
bing.

9. Revisi tesis dan Publikasi Hasil penelitian


Apabila tim penguji dan dosen pembimbing menyatakan lulus, hasil peneliti-
an dapat dipublikasikan dengan revisi yang disyaratkan.

3.1.2. Jadwal Penelitian

Jadwal penelitian disajikan dalam bentuk tabel yang berisi tahapan peneli-
tian seperti dijelaskan di atas beserta waktu pengerjaannya. Jadwal penelitian ini
disajikan dalam tabel berikut.
47

Bulan
Kegiatan Penelitian
1 2 3 4 5 6 7 8 9 10 11 12
Menentukan Jurnal dan Men-
cari Literatur
Studi Literatur
Menyususn Proposal Peneliti-
an
Ujian Proposal Penelitian
Revisi Proposal Penelitian
Menyusun Pembahasan
Membuat Draft Hasil Peneliti-
an
Ujian Tesis
Revisi Tesis dan Publikasi Ha-
sil Penelitian

3.2. Hasil Sementara

Dalam mengestimasi cadangan klaim, dibutuhkan suatu model yang dapat


menginterpretasikan setiap variabel random yang terkait dengan cadangan klaim.
Oleh karena itu, dalam penelitian ini suatu model akan dibangun dengan suatu
analisis yang disebut dengan analisis statistik kejadian berulang dengan penerapan
non-homogeneous marked Poisson process, karena disini klaim-klaim yang terjadi
dianggap sebagai kejadian berulang. Perlu diketahui bahwa beberapa konsep dasar
yang diperluka untuk analisis ini adalah konsep fungsi intensitas, counting process,
proses Poisson non-homogen, dan non-homogeneous marked Poisson process.

Kerangka kanonik untuk proses menghitung adalah proses Poisson, dimana


proses Poisson dapat dibedakan menjadi proses Poisson homogen dan proses Po-
isson non-homogen. Dalam penelitian ini klaim diasumsikan dihasilkan oleh non-
homogeneous marked Poisson process, dengan tanda mewakili waktu tunda pela-
48

poran dan proses penyelesaian klaimnya. Berdasarkan status perkembangan klaim,


klaim dapat dibagi menjadi empat kategori yaitu selesai (settled), telah dilaporkan
tetapi belum diselesaikan (RBNS), terjadi tetapi belum dilaporkan (IBNR), dan ca-
dangan premi yang belum merupakan pendapatan (UPR).

Selain menerapkan non-homogeneous marked Poisson process, model juga


akan dibangun dengan memanfaatkan teori distribusi gabungan, distribusi bersya-
rat, dan teori statistika urutan. Dalam membangun model, ada 4 informasi yang
akan digunakan yaitu waktu tunda pelaporan klaim, waktu antar pembayaran klaim,
besarnya pembayaran, dan proses klaim itu sendiri. Masing-masing bagian dicari
distribusi probabilitasnya, dan kemudian parameternya diestimasi dengan menggu-
nakan metode Maximum Likelihood. Setelah model diperoleh, akan dilanjutkan
dengan simulasi.

3.2.1. Data Polis

Gambar 3.1 Eksposur bisnis hingga waktu τ

Pada penelitian ini, pembahasan difokuskan pada satu lini bisnis yaitu asu-
ransi tanggung gugat. Suatu Portofolio terdiri dari banyak unit risiko kecil sehingga
satu klaim tidak memiliki dampak signifikan pada ukuran dan komposisi portofo-
lio, oleh karena itu tidak perlu dikaitkan dengan risiko individu. Berdasarkan teori
risiko kolektif diasumsikan bahwa informasi yang diberikan oleh catatan polis pa-
da waktu t dirangkum secara memadai oleh w(t) atau disebut juga dengan risiko
eksposure per unit waktu pada waktu t. Tingkat exposure w(t) dapat dianggap se-
bagai volume bisnis atau jumlah kontrak asuransi (polis). Fungsi w biasanya akan
49

terlihat seperti pada Gambar 3.1. Eksposur di masa depan setelah waktu τ berkaitan
dengan kontrak yang saat ini berlaku. Dalam praktiknya mereka akan kedaluwarsa
dalam waktu yang terbatas sehingga w(t) = 0 untuk t cukup besar. Total eksposur
dinotasikan sebagai
Z∞
W = w(t) dt, (3.1)
0

dengan W terbatas.

3.2.2. Data dari Catatan Klaim

Gambar 3.2 Perkembangan Klaim Asuransi Long Tailed Business

Berdasarkan Gambar 3.2 berikut adalah informasi-informasi umum dari kla-


im per klaim yang biasa diperoleh dari data catatan klaim:

1. Nomor ID klaim.

2. Waktu terjadinya klaim (T = A1 ).

3. Waktu pelaporan klaim (A2 ).

4. Waktu pembayaran klaim (A3 , A4 , A5 , A8 ).


50

5. Waktu penyelesaian klaim (A6 , A9 ).

6. Besar pembayaran klaim selama interval waktu tertentu.

Selain itu waktu tunda pelaporan dinotasikan oleh U = A2 − A1 dan waktu tunggu
hingga penyelesaian klaim dinotesikan ole V = A6 − A2 atau V = A9 − A2 .

3.2.3. Notasi untuk Klaim per Klaim

Dalam subbab ini diperkenalkan beberapa variabel random yang secara ber-
sama akan digunakan untuk membangun model. Sebelumnya sudah dijelaskan bah-
wa T , U , V , dan C(v) secara berturut-turut menotasikan waktu terjadinya klaim,
waktu tunda pelaporan, waktu tunggu hingga penyelesaian klaim, dan pembayaran
klaim per klaim selama interval waktu tertentu. Jika Z = (U, C) adalah tanda untuk
klaim per klaim dimana
C = {C(v), 0 ≤ v ≤ V } (3.2)

adalah pembayaran klaim per klaim dalam interval [A2 , A6 ], maka suatu klaim dapat
dinyatakan sebagai pasangan (T, Z). Jika Z dinyatakan sebagai ruang perkembang-
an klaim yang mungkin dari Z, maka klaim (T, Z) adalah elemen random dalam
himpunan C = [0, ∞) × Z.

Klaim diasumsikan terjadi pada waktu T1 , T2 , ... dan tidak ada klaim yang
terjadi secara bersamaan. Klaim diurutkan dalam urutan naik terkait waktu terjadi-
nya, sehingga klaim ke-i terjadi pada waktu Ti . Berdasarkan Persamaan (??)

Ti = inf{t ≥ 0 : N (t) ≥ i}.

Sedangkan banyak klaim yang terjadi sebelum waktu t dapat ditulis sebagai
X
N (t) = I(Ti ≤ t),
i≥1

dimana I() adalah fungsi indikator ”at risk” yang berguna untuk menunjukkan kla-
im mana yang memberikan informasi tentang kejadian klaim pada waktu tertentu.
Fungsi indikator akan bernilai satu jika benar, dan bernilai nol untuk selainnya.
51

Fungsi indikator ditulis dalam bentuk



1, jika Ti ≤ t,

I(Ti ≤ t) =
0, lainnya.

Total banyak klaim bisa ditentukan dengan

N = lim N (t).
t→∞

Perlu diingat bahwa waktu terjadinya klaim Ti terkait dalam proses menentukan
banyak klaim {N (t), t ≥ 0}, dan juga berlaku sebaliknya.

Klaim pada masing-masing polis diasumsikan mengikuti proses Poisson non-


homogen dengan fungsi intensitas yang non-negatif yaitu λ(t), t ≥ 0. Ketika suatu
interval atau waktu t terpilih untuk diamati, dan misalkan (w(t), t ≥ 0) merupakan
fungsi non-negatif dari tingkat eksposure per satuan waktu yang menyatakan ba-
nyak polis, maka banyak klaim yang terpilih pada waktu t mengikuti proses Pois-
son non-homogen dengan fungsi intensitas yang non-negatif yaitu w(t)λ(t), t ≥ 0.
Ini menyiratkan bahwa semua polis asuransi adalah suatu resiko yang homogen
dengan klaim bisa terjadi selama jangka waktu yang telah disepakati dalam suatu
kontrak asuransi. Berdasarkan (2.42) dan Teorema 2.6.2 nomor 1.), total banyak
klaim mengikuti distribusi Poisson dengan parameter Λ(∞) dimana

Zt
Λ(t) = w(s)λ(s)ds, (3.3)
0

karena W terbatas maka total banyak klaim juga terbatas dengan peluang sama
dengan satu.

3.2.4. Pengelompokan Klaim

Berdasarkan status perkembangan klaim saat ini atau waktu sekarang dino-
tasikan oleh τ ≥ 0, maka klaim dikelompokkan kedalam 4 kelompok yaitu, selesai
(settled), telah dilaporkan tetapi belum diselesaikan (RBNS), terjadi tetapi belum di-
laporkan (IBNR), dan cadangan premi yang belum merupakan pendapatan (UPR).
52

Masing-masing kelompok klaim bisa dinotasikan dengan

CS = {(t, z) ∈ C; t + u + v ≤ τ }, (3.4)

CRBN S = {(t, z) ∈ C; t + u ≤ τ < t + u + v}, (3.5)

CIBN R = {(t, z) ∈ C; t ≤ τ t + u}, (3.6)

CU P R = {(t, z) ∈ C; τ < t}. (3.7)

Berdasarkan pengelompokan klaim di atas, maka tanda dari masing-masing kelom-


pok klaim di atas merupakan himpunan

ZSt = {z ∈ Z : t + u + v ≤ τ }, (3.8)

ZRBN
t
S
= {z ∈ Z : t + u ≤ τ < t + u + v}, (3.9)

ZIBN
t
R
= {z ∈ Z : t ≤ τ < t + u}, (3.10)

ZUt P R = {z ∈ Z : t > τ }. (3.11)

Disini kelompok klaim selesai (settled) digabungkan dengan kelompok klaim telah
dilaporkan tetapi belum diselesaikan (RBNS) menjadi klaim yang telah dilaporkan
atau disimbolkan dengan (R). Sehingga bisa dibuat suatu notasi himpunan yaitu

ZR S RBN S
t = Zt ∪ Zt = {z ∈ Z : t + u ≤ τ }. (3.12)

Penggabungan itu dilakukan karena bentuk data nyata yang biasa diperoleh dari per-
usahaan asuransi adalah data tentang klaim yang telah dilaporkan. Kemudian data
klaim yang telah dilaporkan tersebut akan digunakan untuk mengestimasi cadang-
an klaim (IBNR) dengan memanfaatkan konsep dasar teori probabilitas yang akan
dijelaskan pada penjelasan selanjutnya.

Jadi pengelompokan klaim yang akan digunakan yaitu G ={R, IBNR, UPR}
yang merujuk pada himpunan yang telah dijelaskan di atas.

3.2.5. Model Proses Pembayaran

Model dari proses pembayaran untuk klaim yang telah terpilih dalam inter-
val waktu tertentu dibangun dengan beberapa asumsi.
53

Gambar 3.3 Proses Pembayaran

1. Jumlah Pembayaran bersifat independent increaments.

2. Proses pembayaran independen terhadap waktu tunda pelaporan U dan waktu


terjadinya klaim T , dengan kata lain klaim diatasi dengan cara yang sama dari
tahun ke tahun.

3. Modifikasi dilakukan pada pembayaran yaitu dengan cara membagi pemba-


yaran kedalam dua tipe. Pembayaran tipe 1 dan pembayaran tipe 2. pemba-
yaran tipe 1 berupa pembayaran saja, sedangkan tipe 2 berupa penyelesaian
dengan pembayaran (pembayaran akhir).

4. Masing-masing tipe pembayaran diasumsikan terjadi mengikuti proses Pois-


son non-homogen dan independen.

5. Waktu pembayaran diasumsikan sebagai bilangan positif yang diurutkan de-


ngan urutan naik.

6. Besar pembayaran i.i.d dan independen terhadap waktu dan tipe pembayaran.
54

Perhatikan Gambar 3.3, waktu pembayaran adalah suatu variabel random


V1 , V2 , ... yang dimulai setelah waktu pelaporan klaim. Waktu pembayaran bersama
dengan tipe pembayaran menentukan banyak pembayaran yang dinotasikan dengan
Ñ dari klaim yang terpilih. Tipe pembayaran 1 dan tipe pembayaran 2 mengikuti
proses Poisson non-homogen dengan intensitas

µj (t), j = 1, 2, (3.13)

sehingga diperoleh fungsi hazard kumulatif masing-masing tipe pembayaran


Zt
Mj (t) = µj (s)ds, t ∈ [0, +∞], j = 1, 2. (3.14)
0

Fungsi hazard kumulatif totalnya adalah


2
X
M (t) = Mj (t). (3.15)
j=1

Misalkan pengamatan pembayaran dilakukan pada interval (a, b], sehingga


diperoleh fungsi hazard kumulatif masing-masing tipe pembayaran dalam interval
tersebut adalah
Zb
µ1 (s)ds = M1 (b) − M1 (a) (3.16)
a

dan
Zb
µ2 (s)ds = M2 (b) − Mb (a). (3.17)
a

Berdasarkan (3.16) dan (3.17), probabilitas tidak ada pembayaran tipe 1 dalam in-
terval (a, b] adalah

e−(M1 (b)−M1 (a)) (M1 (b) − M1 (a))0


P r{N1 (a, b] = 0} =
0!
−(M1 (b)−M1 (a))
= e , (3.18)

dan probabilitas tidak ada pembayaran tipe 2 dalam interval (a, b] adalah

e−(M2 (b)−M2 (a)) (M2 (b) − M2 (a))0


P r{N2 (a, b] = 0} =
0!
−(M2 (b)−M2 (a))
= e . (3.19)
55

Karena pembayaran tipe 1 independen terhadap pembayaran tipe 2, sehingga pelu-


ang tidak ada pembayaran dalam interval (a, b] adalah perkalian dari probabilitas-
nya.

P r{N1 (a, b] = 0}P r{N2 (a, b] = 0} = e−(M1 (b)−M1 (a)) e−(M2 (b)−M2 (a))

= e(M1 (a)+M2 (a)−(M1 (b)+M2 (b))

= eM (a)−M (b)

= e−(M (b)−M (a)) . (3.20)

Selanjutnya gunakan waktu pembayaran dan tipe pembayaran untuk menentukan


banyak pembayaran Ñ dalam klaim yang terpilih. Jumlah pembayaran dalam klaim
terpilih dinotasikan oleh

X
Ñ = I(Vk < ∞), (3.21)
k=1

dengan Ñ untuk waktu yang terbatas.

Misalkan tidak ada pembayaran selama interval [0, v1 ) dengan v0 = 0, ada


satu pembayaran selama interval [v1 , v1 + h1 ), tidak ada pembayaran selama inter-
val [v1 + h1 , v2 ), ada satu pembayaran selama interval [v2 , v2 + h2 ), dan ada satu
penyelesaian dengan pembayaran selama interval [vn, vn + hn ). Pernyataan tersebut
bisa ditulis menjadi

P r{Ñ = n, Vk ∈ [vk + hk ), k = 1, ..., n}


(n−1 )
Y
= e−M (v1 ) [µ1 (vk )hk + o(hk )]e−(M (vk+1 )−M (vk +hk )) [µ2 (vn )hn + o(hn )].
k=1

Sama seperti pembuktian teorema 2.6.2 nomor 2.), maka fungsi densitas proba-
bilitas untuk proses pembayaran yang diamati selama interval waktu tetap [v0 , vn ]
adalah
( )
n−1
−(M (vk+1 )−M (vk +hk ))
e−M (v1 )
Q
[µ1 (vk )hk + o(hk )]e [µ2 (vn )hn + o(hn )]
k=1
f (n, v1 , ..., vn ) = lim
(h1 ...hn )→(0+ ,...,0+ ) h1 ...hn
 
n−1
−M (v1 )
Y
= e  µ1 (vk ) µ2 (vn ) (3.22)
k=1

Persamaan 3.22 menjelaskan fungsi densitas probabilitas n pembayaran (tidak spe-


sifik) pada waktu v1 , ..., vn dan penyelesaian dengan pembayaran pada waktu vn .
56

Misalkan X adalah variabel random dari besar pembayaran yang telah dila-
kukan dan Y adalah variabel radom dari waktu dan tipe pembayaran. Jika diamati,
informasi mengenai waktu dan tipe pembayaran berpengaruh terhadap besar pem-
bayaran yang telah dibayarkan. Artinya, besar pembayaran yang telah dibayarkan
bisa dicari atau ditentukan jika informasi mengenai waktu dan tipe pembayaran
diberikan. Dengan kata lain, fungsi densitas probabilitas dari besar pembayaran
yang telah dibayarkan adalah suatu fungsi densitas probabilitas bersyarat, yaitu
fX|Y (x | y). Dalam hal ini fungsi densitas probabilitas proses pembayaran ada-
lah fungsi densitas probabilitas gabungan dari waktu, tipe pembayaran, dan besar
pembayaran yang telah dilakukan, atau dinotasikan dengan fX,Y (x, y). Fungsi den-
sitas probabilitas proses pembayaran ditentukan dengan menggunakan Persamaan
(2.12), sehingga diperoleh

fX,Y (x, y) = fX|Y (x | y)fY (y)


fX,Y (x, y)
= fY (y)
fY (y)
fX (x)fY (y)
= fY (y)
fY (y)
= fX (x)fY (y). (3.23)

Misalkan P1 , P2 , ... dinotasikan sebagai variabel random dari besar pemba-


yaran dengan fungsi densitas probabilitas fP (p) dan independen terhadap sisa dari
proses pembayaran. Untuk menyederhanakan model, pembayaran juga diasumsi-
kan i.i.d, sehingga diperoleh fungsi densitas probabilitas dari n besar pembayaran
adalah
n
Y
fP (p) = fX (x) (3.24)
j=1

Sedangkan fungsi densitas probabilitas dari waktu dan tipe pembayaran adalah

f (n, v1 , ..., vn ) = fY (y). (3.25)


57

Berdasarkan Persamaan (3.24) dan (3.25), maka Persamaan (3.23) berubah menjadi
n
Y
fC (c) = f (n, v1 , ..., vn ) fP (p)
j=1
"n−1 # n
Y Y
−M (v1 )
= e µ1 (vk ) µ2 (vn ) fP (p), (3.26)
k=1 j=1

dimana C = (Ñ , V1 , ..., VÑ , P1 , ..., PÑ ) dan c = (n, v1 , ..., vn , p1 , ..., pn ).

3.2.6. Model Proses Klaim

Misalkan T1 , T2 , ... menjadi waktu terjadinya klaim dalam proses Poisson


non-homogen dengan intensitas λ(t)w(t) > 0, bersyaratkan N (t) = n. Berda-
sarkan Teorema 2.5.12 variabel ramdom dari waktu terjadinya klaim T1 , T2 , ..., Tn
memiliki fungsi densitas probabilitas gabungan

f (T1 , ..., Tn ) = P {x1 < X1 ≤ x1 + 4x1 , ..., xn < Xn ≤ xn + 4xn }


P {ti < Ti ≤ ti + 4ti }
=
P {N (t) = n}
n
e−Λ(∞)
Q
λ(ti )w(ti )
i=1
= e−Λ(∞) (Λ(∞))n
n!
n  
−Λ(∞)
Y n!
= e λ(t)w(t) −Λ(∞)
i=1
e (Λ(∞))n
n  
Y λ(ti )w(ti )
= n! . (3.27)
i=1
Λ(∞)

Persamaan (3.27) menunjukkan formula dari statistik urutan dari waktu terjadinya
klaim yaitu f (t1 , ..., tn ) = n!f (t1 )f (t2 )...f (tn ), yang merupakan gabungan densi-
tas marjinal dari masing-masing waktu terjadinya klaim. Sehingga bisa dikatakan
bahwa fungsi densitas probabilitas marjinal waktu terjadinya masing-masing klaim
individu adalah
λ(t)w(t)
fT (t) = , t≥0 (3.28)
Λ(∞)
Titik awal dari suatu klaim adalah waktu terjadinya klaim. Diasumsikan
klaim dari masing-masing kontrak asuransi terjadi mengikuti proses Poisson non-
58

homogen dengan fungsi intensitas λ(t) pada waktu t ≥ 0, ditulis

{Ti } ∼ P o(λ(t); t ≥ 0) (3.29)


Rt
Ini berarti bahwa proses N (t) − N (t) ∼ P o( λ(t)dt) untuk setiap interval (s, t].
s
Khususnya, karena eksposur total di (3.1) adalah terbatas, maka banyak total kla-
im juga terbatas dengan probabilitas 1. Banyak klaim N (t) mengikuti distribusi
Poisson N (t) ∼ P o(Λ(∞)) dengan
Zt
Λ(t) = w(s)λ(s)ds. (3.30)
0

dan
[Λ(∞)]n −Λ(∞)
P {N (t) = n} = e . (3.31)
n!
Mempertimbangkan hanya satu klaim (T, Z), maka fungsi densitas proba-
bilitas klaim tersebut ditulis dalam bentuk

fT,Z (t, z) = fZ|T (z | t)fT (t), (3.32)

dimana fZ|T adalah fungsi densitas probabilitas bersyarat dari waktu tunda pelapor-
an U dan proses pembayaran C ketika diberikan informasi waktu kejadian T = t,
yang akan dibahas dalam subbab berikutnya.

Berikut diberikan teorema terkait dengan proses klaim.

Teorema 3.2.1 (Norberg, 1999) Proses Poisson yang ditandai {(Ti , Zi )}i=l,...,N
dapat dibangun dalam dua langkah, pertama menghasilkan
 
Zt
N ∼ P o Λ(∞) = λ(t)w(t) (3.33)
0

dan, kedua, memilih sampel random N dari fungsi densitas probabilitas distribusi
fT,Z (t, z) pada C yang diberikan oleh

λ(t)w(t)
fT,Z (t, z) = fZ|T (z | t) (3.34)
Λ(t)

(T, Z) ∈ C, dan mengurutkannya berdasarkan kronologi kejadian.


59

Bukti. Distribusi probabilitas bersama dari observasi klaim diberikan oleh


Rt1
− λ(t)w(t)dt
P {N = n, (Ti , Zi ), i = 1, ..., n} = e 0 λ(t1 )w(t1 )...
tRn ∞
− λ(t)w(t)dt
R
− λ(t)w(t)dt
tn−1
e λ(tn )w(tn )e tn

Yn
fZi |Ti (zi | ti )
i=1


R n
λ(t)w(t)dt Y
= e 0 λ(ti )w(ti )fZi |Ti (zi | ti )
i=1
n
(Λ(∞))n Y λ(ti )w(ti )
= e−Λ(∞) n! fZi |Ti (zi | ti )
n! Λ(∞)
i=1
(3.35)

Berdasarkan Persamaan (3.28) dan (3.32) maka Persamaan (3.35) bisa ditulis dalam
bentuk
n
(Λ(∞))n −Λ(∞) Y
P {N = n, (Ti , Zi ), i = 1, ..., n} = e n! fTi (ti )fZi |T i (zi | ti )
n! i=1
n
(Λ(∞))n −Λ(∞) Y
= e n! fTi ,Zi (ti , zi ) (3.36)
n! i=1

Terlihat bahwa fT,Z adalah fungsi densitas probabilitas gabungan dari pasangan
λ(t)w(t)
random (T, Z), dimana T memiliki distribusi marjinal fT dengan densitas Λ(∞)
,
t > 0, dan Z memiliki fungsi densitas probabilitas bersyarat fZ|T untuk T = t
tetap. 

Berdasarkan Teorema 3.2.1 fungsi densitas probabilitas bersama dari semua


klaim adalah
n 
[Λ(∞)]n −Λ(∞) Y λ(ti )w(ti )

fN,T,Z (n, t, z) = e n! fZi |Ti (zi , ti ) , (3.37)
n! i=1
Λ(∞)

dimana T = (T1 , ..., TN ), Z = (Z1 , ..., ZN ). Perhatikan bahwa dalam notasi ini
banyak klaim N juga secara tidak langsung terkandung di dalam T sebagai pan-
jangnya. Bentuk lain untuk menulis Persamaan (3.37) adalah
n  
Y λ(ti )w(ti )
fN,T,Z (n, t, z) = P {N = n}n! fZi |Ti (zi , ti ) . (3.38)
i=1
Λ(∞)
60

Dari Persamaan (3.38) bisa dilihat bahwa proses klaim memiliki dua tahap yaitu;
pertama, membangkitkan banyak total klaim N dari distribusi Poisson dengan mean
λ(t)w(t)
Λ(∞); kedua, mendistribusikan klaim dari waktu ke waktu dengan densitas Λ(∞)

dan mengurutkan klaim berdasarkan waktu kejadiannya.

3.2.7. Proses dari Klaim-g

Berdasarkan pengelompokan klaim G = {R, IBN R, U P R}, untuk setiap


g ∈ G dipertimbangkan suatu proses komponen

{(Tig , Zig ), i = 1, ..., N g }, (3.39)

dimana variabel random di atas dikonstruksi langsung dengan proses menghitung


kalaim-g yaitu
X
N g (t) = I(Ti ≤ t, Zi ∈ Zg ), (3.40)
i≥1

dengan waktu terjadinya klaim adalah

Tig = inf(t ≥ 0 : N g (t) ≥ i), (3.41)

dan tanda yaitu Zig = ZTig .

Teorema 3.2.2 (Bednárik,2017) Misalkan G suatu pengelompokan klaim yang ter-


batas, sehingga untuk setiap t ≥ 0 memenuhi
X
P {Z ∈ Zgt | T = t} = 1. (3.42)
g∈G

Kemudian proses komponen dalam (3.39) adalah independen dan untuk setiap g ∈
G memenuhi
 
{(Tig , Zig ), i = 1, ..., N g } ∼ P o λg (t), fZ|T
g
, (3.43)

dengan
λg (t) = w(t)λ(t)P {Z ∈ Zgt | T = t} (3.44)

dan
g fZ|T (z | t)
fZ|T (z | t) = g I(z ∈ Zgt ). (3.45)
P {Z ∈ Zt | T = t}
61

Bukti. Karena asumsi (3.42), fungsi densitas probabilitas fN,T,Z (n, t, z) bisa ditulis
dalam bentuk
ng 
( g )
Y [Λg (∞)]n −Λg (∞) g Y λg (tgi ) g g g
fN,T,Z (n, t, z) = e n ! f g (z | t ) ,
g∈G
ng ! i=1
Λg (∞) Z|Ti i i
(3.46)
dimana
Zt
g
Λ (t) = λg (s)ds,
0

sebagian besar mengenai pengindeksan ulang semua kuantitas sehubungan dengan


pengelompokan klaimnya. Terlihat Persamaan (3.46) mengikuti independensi dan
pernyataan bahwa proses komponen mengikuti non-homogeneous marked Poisson
process. 

Teorema 3.2.2 menyatakan bahwa klaim-g terjadi dengan fungsi intensitas


asli dikalikan dengan probabilitas bahwa klaim yang terjadi pada waktu t berada
dalam kelompok g. Demikian pula, distribusi tanda ditentukan oleh distribusi ber-
syarat dari tanda, mengingat bahwa itu berada dalam kelompok g.

Sebelumnya sudah dijelaskan bahwa data klaim dari kelompok klaim yang
telah dilaporkan akan digunakan untuk mengestimasi cadangan klaim (IBNR). Se-
lanjutnya, gunakan Teorema 3.2.2 untuk menentukan distribusi dari klaim yang te-
lah dilaporkan (R) dan klaim IBN R. Untuk data klaim yang telah dilaporkan,
terlebih dahulu kita harus menentukan probabilitas bahwa klaim yang telah terjadi
pada waktu t ≤ τ benar-benar telah dilaporkan. Probabilitas bahwa klaim yang
telah terjadi pada waktu t ≤ τ benar-benar telah dilaporkan adalah

P {T + U ≤ τ | T = t} = P {U ≤ τ − t | T = t}

= FU |T (τ − t), (3.47)

dimana FU |T adalah fungsi distribusi kumulatif bersyarat dari waktu tunda pelapora
(U ), ketika waktu kejadian klaim T = t diberikan. Berdasarkan Teorema 3.2.2 dan
Persamaan (3.47), klaim yang telah dilaporkan (R), klaim (IBN R), dan (U P R)
62

mempunyai fungsi intensitas yaitu

λR (t) = w(t)λ(t)FU |T (τ − t) (3.48)

λIBN R (t) = w(t)λ(t)[1 − FU |T (τ − t)]I(t ≤ τ ) (3.49)

λU P R (t) = w(t)λ(t)I(t > τ ) (3.50)

Perlu diingat bahwa jumlahan dari (3.48), (3.49), dan (3.50) sama dengan intensitas
asli w(t)λ(t), atau bisa ditulis.

w(t)λ(t) = λR (t) + λIBN R (t) + λU P R (t). (3.51)

Selain itu juga diperoleh fungsi densitas probabilitas dari tanda untuk klaim yang
telah dilaporkan (R), klaim (IBN R), dan (U P R) yaitu

R fZ|T (z | t)
fZ|T (z | t) = I(u ≤ τ − t) (3.52)
FU |T (τ − t)
IBN R fZ|T (z | t)
fZ|T (z | t) = I(t ≤ τ < t + u) (3.53)
[1 − FU |T (τ − t)]
UP R
fZ|T (z | t) = fZ|T (z | t)I(t > τ ). (3.54)

Sebagai contoh untuk klaim yang telah dilaporkan, maka fungsi densitas
probabilitas gabungan dari klaim yang telah dilaporkan adalah
n 
[ΛR (∞)]n −ΛR (∞) Y λR (ti ) R

R
fN,T,Z (n, t, z) = e n! f (zi | ti )
n! i=1
ΛR (∞) Z|Ti
n
R (∞)
Y
= e−Λ λR (ti )fZ|T
R
i
(zi | ti ), (3.55)
i=1

dengan

R
fZ|Ti
(zi | ti ) = fU |Ti (ui | ti )fC|Ti ,Ui (ci | ti , ui )

= fU |Ti (ui | ti )fC (ci ). (3.56)

Persamaan di atas berubah karena sebelumnya telah diasumsikan bahwa proses


pembayaran C independen terhadap U dan T . Fungsi densitas probabilitas untuk
klaim IBN R dan U P R dapat ditentukan dengan cara yang sama seperti cara di
atas atau cukup dengan mengganti indeks R dengan indeks IBN R dan U P R.
63

Jadi bentuk umum dari model yang akan digunakan untuk mengestimasi
cadangan klaim adalah
n
−Λg (∞)
g
Y
fN,T,Z (n, t, z) =e λg (ti )fU |Ti (ui | ti )fC (ci ), (3.57)
i=1

dengan "n−1 #
Y n
Y
−M (v1 )
fC (ci ) = e µ1 (vk ) µ2 (vn ) fP (p) (3.58)
k=1 j=1

dan g ∈ G = {R, IBN R, U P R}.

3.2.8. Estimasi Distribusi dan Parameter Model

n
"n−1 # n
−Λg (∞)
Y Y Y
e λg (ti )fU |Ti (ui | ti )e−M (v1 ) µ1 (vk ) µ2 (vn ) fP (p) (3.59)
i=1 k=1 j=1

Jika dilihat model (3.59), ada empat bagian yang perlu diestimasi distribusi
dan parameternya yaitu:

1. Mengestimasi distribusi dari fU |Ti (ui | ti ).

2. Mengestimasi intensitas asli λ(t) dari proses klaim itu sendiri.


n−1 
−M (v1 )
Q
3. Mengestimasi waktu antar pembayarannya e µ1 (vk ) µ2 (vn ). Saat
k=1
observasi dilakukan, beberapa pembayaran akan tersensor oleh τ , dimana τ
adalah waktu pada saat ini. Pada bagian ini akan dicari distribusi yang sesu-
ai, yang terkait data tersensor dan mengestimasi parameternya. Tujuan dari
estimasi ini adalah untuk mengetahui waktu dan tipe pembayaran yang akan
terjadi pada waktu berikutnya;

4. Mengestimasi distribusi dari fP (p).

1.) Estimasi Distribusi Waktu Tunda Pelaporan

Langkah pertama, tahapan awal dari suatu proses klaim adalah adanya tang-
gal kejadian klaim dan tanggal pelaporan klaim. Sudah jelas bahwa tanggal
64

kejadian klaim diketahui setelah klaim dilaporkan. Pada bagian ini informasi
yang ingin diobservasi adalah mengenai waktu tunda pelaporan dari suatu kla-
im, dimana tren waktu terjadi. Adapun langkah-langkah yang dilakukan untuk
mencari dan mengestimasi parameter dari suatu distribusi waktu tunda pelapor-
an adalah;

(a) Mencari waktu tunda masing-masing klaim, dimana waktu tunda adalah
U = (A2 − A1 ) dengan A1 dan A2 adalah tanggal terjadinya klaim dan
tanggal klaim dilaporkan.

(b) Karena data klaim terurut dan klaim diselesaikan dalam beberapa kali ba-
yar, jadi pilih waktu tunda dengan nomor urut 1.

(c) Cari nilai (t = tanggal kejadian klaim − t0 ) yang akan digunakan da-
lam transformasi data waktu tunda klaim.

(d) Plot data waktu tunda pelaporan.

(e) Tetapkan tren yang sesuai dengan plot data dan estimasi parameternya.

(f) Transformasi fungsi distribusi kumulatif FUt ke bentuk FU0 dengan ban-
tuan parameter tren. Tujuannya adalah mengubah data waktu tunda pela-
poran klaim dari bentuk diskrit ke bentuk sampel random kontinu.

(g) Plot kembali data dari hasil transformasi.

(h) Pilih distribusi yang sesuai untuk FU0 . Kemudian bandingkan beberapa
distribusi yang diduga cocok untuk FU0 dengan melakukan tes Kolmogo-
rov Smirnov.

(i) Estimasi parameter dari distribusi yang terpilih.

2.) Estimasi Proses Klaim

Langkah kedua adalah mengestimasi fungsi intensitas dari proses Poisson


non-homogen yang mendasari terjadinya klaim. Ide dasar diperoleh dari [Anto-
nio dan Plat, 2014]. Estimasi distribusi waktu tunda pelaporan klaim diketahui
dan untuk menentukan fungsi intensitas λ(t), digunakan spesifikasi konstan ter-
65

pisah (piecewise constant specication). Berikut adalah langkah-langkah dalam


menentukan fungsi intensitas dari klaim λ(t):

(a) Memilih divisi atau pembagian interval waktu yang sesuai yaitu

0 = d0 < d1 < ... < dm = τ

dimana τ adalah perbedaan waktu antara waktu observasi terakhir dan


waktu observasi awal, dan m adalah bilangan bulat positif. Fungsi ek-
sposur w(t) juga diasumsikan sebagai (piecewise constant specification)
dan memiliki divisi yang sama dengan λ(t).

(b) Gunakan bagian dari Persamaan (3.55) untuk mendapatkan estimasi λ(t)
dan diperoleh fungsi likelihood-nya adalah
n
−ΛR (∞)
Y
L(λ(ti )) = e λR (ti )
i=1
n
R (∞)
Y
= e−Λ λ(ti )w(ti )fU |Ti (τ − ti ) (3.60)
i=1

dimana n adalah banyak pengamatan. Fungsi eksposure dan distribusi


waktu tunda pelaporan dapat dikeluarkan dari perkalian di atas karena su-
dah diketahui. Kemudian Persamaan (3.60) diubah kebentuk likelihood
setelah interval dibagi. Banyak yang diamati dari klaim yang dilaporkan
dalam interval ke-j adalah
n
X
N (j) = I(ti ∈ (dj−1 , dj ])
i=1

untuk j = 1, ..., m dan dengan notasi ini Persamaan (3.60) ditulis ulang
66

fungsi likelihood-nya menjadi


n
−ΛR (∞)
Y
L(λj ) = e λR (ti )
i=1
n
R (∞)
Y
= e−Λ λ(ti )w(ti )fU |Ti (τ − ti )
i=1
( )
N (1) N (2)
Y
= λ1 λ2 ...λN
m
(m)
fU |Ti (τ − ti )
i≥
d d
R2
R1
−λ1 w1 fU |T (τ −t)dt −λ2 w2 fU |T (τ −t)dt
e 0 e d1
...
dRm
−λm wm fU |T (τ −t)dt
dm−1
e
dj
m
R
Y −λj wj fU |T (τ −t)dt
N (j) dj−1
= λj e . (3.61)
j=1

Fungsi log-likelihood dari Persamaan (3.61) adalah


 dj

m
R
−λj wj fU |T (τ −t)dt 

Y 
N (j) dj−1
ln L(λj ) = ln λj e

j=1 

m
X m
X Zdj
= N (j) ln(λj ) − λj wj fU |T (τ − t)dt.(3.62)
j=1 j=1 dj−1

Turunan pertama dari fungi log-likelihood Persamaan (3.62) terhadap λj


adalah
" #
m
P m
P Rdj
∂ N (j) ln(λj ) − λj w j fU |T (τ − t)dt
∂ ln L(λj ) j=1 j=1 dj−1
=
∂λj ∂λj
m m Zdj
X N (j) X
= − wj fU |T (τ − t)dt. (3.63)
j=1
λj j=1
dj−1

Estimator maksimum likelihood λj adalah solusi Persamaan likelihood


yang diperoleh dengan menurunkan fungsi log-likelihood dan kemudian
67

disamakan dengankan nol (0), maka

m m Zdj
∂ ln L(λj ) X N (j) X
= − wj fU |T (τ − t)dt = 0
∂λj j=1
λj j=1
dj−1

m m Zdj
X N (j) X
= wj fU |T (τ − t)dt
j=1
λj j=1 dj−1

Zdj
N (j)
= wj fU |T (τ − t)dt
λj
dj−1

N (j)
λ̂j = (3.64)
Rdj
wj fU |T (τ − t)dt
dj−1

untuk semua j = 1, ..., m. Bentuk lain dari Persamaan (3.64) adalah


N (j)
λ̂j wj = . (3.65)
Rdj
fU |T (τ − t)dt
dj−1

(c) Hitung intensitas λ̂j perinterval dengan Persamaan (3.65). Untuk t ∈


(dj−1 , dj ] fungsi intensitas λ(t) sama dengan λj dan fungsi eksposure w(t)
sama dengan wj untuk semua j = 1, ..., m.

(d) Gunakan Persamaan (3.49) untuk menghitung intensitas klaim (IBNR).

λIBN R (t) = w(t)λ(t)(1 − FU |T (τ − t))I(t ≤ τ ). (3.66)

Ekspektasi untuk Banyak total klaim IBNR bisa dihitung dengan


Z∞
ΛIBN R (∞) = λIBN R (t)dt. (3.67)
0

Jadi, banyak total klaim IBNR adalah variabel random yang memiliki dis-
tribusi Poisson dengan parameter ΛIBN R (∞).

3.) Estimasi Waktu antar Pembayaran

Langkah ketiga, memperoleh likelihood untuk distribusi kontinu dari waktu


antar pembayaran yang diamati v1 , v2 , .... Perlu disadari bahwa hanya dengan
68

satu peristiwa, pasangan (V1 , δ1 ), (V2 , δ2 ), ..., harus diamati, dimana δ memiliki
arti indikator kegagalan, yaitu δi = I(Vi ≤ Wi ), dan Wi adalah waktu penyen-
soran. Berdasarkan Persamaan (2.64) dan asumsi yang mendasarinya, bentuk
fungsi likelihood-nya adalah
Y Y
S(vi ) f (vi ) (3.68)
i:δi =0 i:δi =1

dimana f adalah suatu fungsi densitas probabilitas kontinu dan S adalah suatu
fungsi survival yang dapat dihitung sebagai
Z∞
S(v) = f (t)dt, v ≥ 0. (3.69)
v

Ada dua tipe pembayaran yaitu pembayaran tipe 1 dan pembayaran tipe 2. Di-
asumsikan bahwa pembayaran tipe 1 mempunyai fungsi densitas probabilitas
f1 dan pembayaran tipe 2 mempunyai fungsi densitas probabilitas f2 . Kare-
na diasumsikan independent increaments atau kenaikan bebas, fungsi survival
keseluruhan sama dengan

S(v) = S1 (v)S2 (v), (3.70)

misalkan δi adalah indikator kegagalan yang digeneralisasi, yang dapat ditulis


sebagai




 0, jika Vi > Wi


δi = 1, jika Vi ≤ Wi dan pembayaran tipe 1, (3.71)




2, jika Vi ≤ Wi dan pembayaran tipe 2,

yaitu nol artinya tersensor dan nilai positif mengacu pada tipe pembayaran.
Fungsi likelihood untuk pembayaran yang tersensor kanan adalah:
Y Y Y Y
L(θ) = S1 (vi ; θ) S2 (vj ; θ) f1 (vk ; θ) f2 (vl ; θ)
i:δi =0 j:δj =0 k:δk =1 l:δl =2
Y Y
= Sm (vi ; θ) fm (vj ; θ), m = 1, 2. (3.72)
i:δi =0 j:δj =0
69

Persamaan (3.72) mengindikasikan bahwa distribusi diestimasi secara terpisah,


tetapi waktu sensor tetap terkandung dalam kedua tipe pembayaran.

Berikut langkah-langkah yang dilakukan untuk menentukan dan mengestimasi


distribusi waktu antar pembayaran.

(a) Hitung perbedaan waktu antar pembayaran.

(b) Kelompokkan klaim menjadi klaim yang telah diselesaikan (S) dan klaim
yang telah dilaporkan tapi belum diselesaikan (RBNS), dengan klaim (S)
berarti mempunyai beberapa pembayaran tipe 1 dan terakhir pembayaran
tipe 2, sedangkan klaim (RBNS) hanya mengandung pembayaran tipe 1
atau bisa jadi hanya sampai waktu pelaporan saja.

(c) Menentukan perbedaan waktu antara waktu terakhir observasi dengan wak-
tu terakhir pembayaran atau waktu terakhir observasi dengan dengan wak-
tu pelaporan klaim.

(d) Tentukan distribusi waktu antar pembayaran yang cocok, dan lakukan uji
kecocokan distribusi Kolmogorov-Smirnov.

(e) Buat fungsi negatif log-likelihood dari persamaan (3.72).

(f) Lakukan optimisasi dengan fungsi optim() pada R dan hasilkan matriks
Hessian.

4.) Estimasi Distribusi dan Parameter Besar Pembayaran

Langkah keempat, mengestimasi distribusi besar pembayaran. Berikut di-


berikan langkah-langkah dalam mengestimasi distribusi pembayaran.

(a) Data disaring, supaya data besarnya pembayaran tidak mengandung infla-
si, dan tidak mengandung klaim ex gratia, salvage dan subrogation.

(b) Plot data besar pembayaran.

(c) Pilih distribusi yang sesuai dengan plot data besar pembayaran, kemudian
lakukan uji kecocokan distribusi Kolmogorov-Smirnov.

(d) Estimasi parameter dari distribusi besar pembayaran.


70

3.2.9. Simulasi

Dalam melakukan simulasi, parameter-parameter yang digunakan adalah


parameter dari waktu tunda pelaporan klaim, waktu antar pembayaran klaim, be-
sar pembayaran, dan proses klaim yang sebelumnya sudah diestimasi. Namun un-
tuk waktu antar pembayaran klaim dan besar pembayaran klaim akan dilakukan
penyampelan parameter baru, sedangkan untuk parameter waktu tunda pelaporan
klaim dan proses klaim tidak dilakukan, karena diasumsikan dampak mereka relatif
kecil terhadap prediksi cadangan klaim. Adapun langkah-langkah dalam simulasi
ini mengacu pada (Antonio dan Plat, 2014) dengan melakukan beberapa penyesu-
aian dengan data.

Simulasi untuk Prediksi Klaim IBNR

Klaim IBNR adalah klaim yang telah terjadi tetapi belum dilaporkan kepada
perusahaan asuransi. Oleh karena itu, waktu kemunculannya hilang pada saat die-
valuasi. Proses prediksi untuk klaim IBNR membutuhkan langkah-langkah berikut:

a. Simulasi banyak klaim IBNR dalam interval [0, τ ] dan hubungannya de-
ngan waktu terjadinya klaim.

Sebelumnya, banyak klaim IBNR adalah variabel random yang memiliki


distribusi Poisson dengan parameter (3.67), sehingga banyak random klaim IB-
NR dapat dengan mudah dihasilkan dengan fungsi rpois() di R. Dengan banyak
klaim IBNR yang telah dihasilkan, maka waktu kejadian klaim juga bisa diha-
silkan dengan fungsi
λIBN R (t)
fT (t) = . (3.73)
ΛIBN R(∞)
Karena fT (t) adalah fungsi densitas probabilitas umum, berdasarkan Teorema
2.3.2 maka akan dihasilkan bilangan random p dari distribusi U N IF (0, 1) de-
ngan menggunakan fungsi runif() di R sehingga
Zt
fT (s)ds − p = 0. (3.74)
0
71

Selanjutnya, cari akar dari Persamaan (3.74) dengan fungsi uniroot() di R untuk
memperoleh t.

b. Simulasi waktu tunda pelaporan untuk klaim IBNR.

Untuk setiap klaim IBNR juga akan dihasilkan waktu tunda pelaporannya.
Berdasarkan Teorema 2.3.2 dan fungsi distribusi kumulatif bersyarat maka wak-
tu tunda pelaporan dinyatakan sebagai

P (Ut ≤ u | Ut > τ − t) = p1
P (τ − t < Ut ≤ u)
= p1
P (Ut > τ − t)
P (Ut ≤ u) − P (Ut < τ − t)
= p1
1 − P (Ut ≤ τ − t)
P (Ut ≤ u) − P (Ut < τ − t) = p1 [1 − P (Ut ≤ τ − t)]

P (Ut ≤ u) = p1 [1 − P (Ut ≤ τ − t)] + P (Ut < τ − t)

FUt (u) = p1 [1 − FUt (τ − t)] + FUt (τ − t) (3.75)

dengan p1 dihasilkan oleh distribusi UNIF(0, 1) melalui fungsi runif() di R. Ke-


mudian akan dicari u yang memenuhi Persamaan (3.75) dengan cara mencari
inversnya.

Simulasi untuk Prediksi Klaim RBNS

Klaim RBNS adalah klaim yang telah dilaporkan tetapi belum diselesaikan
oleh perusahaan asuransi. Oleh karena itu, pembayaran berikutnya masih diharap-
kan. Proses prediksi untuk klaim RBNS membutuhkan langkah-langkah berikut:

a. Simulasi waktu pembayaran berikutnya.

Klaim RBNS yang dipilih memiliki pembayaran terakhir atau tanggal pela-
poran t hari sejak awal pengamatan atau sejak t0 , dan ada sensor c = τ − takhir .
Untuk klaim IBNR cukup ditetapkan bahwa sensor c = 0. Pada bagian ini yang
ingin ditentukan adalah bilangan random yang dihasilkan untuk fungsi distribusi
kumulatif bersyarat dari V < vnext | V > c. Sama seperti Persamaan (3.75),
72

sehingga diperoleh

P (V < vnext | V > c) = punif (0,1)


P (c < V < vnext )
= punif (0,1)
P (V > c)
P (V < vnext ) − P (V < c)
= punif (0,1)
1 − P (V ≤ c)
P (V < vnext ) − P (V < c) = punif (0,1) [1 − P (V ≤ c)]

P (V < vnext ) = punif (0,1) [1 − P (V ≤ c)] + P (V < c)

F (vnext ) = punif (0,1) [1 − F (c)] + F (c),

dengan punif (0,1) dihasilkan dengan runif() di R. Untuk selanjutnya F (vnext ) di-
anggap sebagai pnew atau F (vnext ) = pnew . Kemudian Persamaan (3.70) secara
tidak langsung menyiratkan bahwa fungsi distribusi kumulatif keseluruhannya
adalah
F (v) = F1 (v)F2 (v). (3.76)

Kemudian kembali menggunakan Teorema 2.3.2, sehingga diperoleh

F (v) = p2

F1 (v)F2 (v) − pnew = 0. (3.77)

Gunakan fungsi uniroot() di R untuk menemukan solusi secara numerik dari


Persamaan (3.77).

b. Simulasi tipe kejadian berikutnya.

Berdasarkan Teorema 2.6.2 nomor 3.) dan Persamaan (2.45), ketika suatu
pembayaran terjadi pada waktu v dan pembayaran tersebut adalah pembayaran
tipe 1, maka probabilitas terjadinya pembayaran tipe 1 adalah
h1 (v)
p(v) = ,
h1 (v) + h2 (v)
dimana h1 dan h2 adalah fungsi hazard, yang dapat diartikan juga sebagai fungsi
intensitas. Adapun formula untuk h1 dan h2 adalah sebagai berikut.
fm (v)
hm (v) = , m = 1, 2.
Sm (v)
73

Berikut diberikan cara yang mungkin untuk mendapatkan secara random suatu
kejadian dengan probabilitas yang ditentukan oleh p(v) adalah sebagai berikut:

(a) Hasilkan bilangan random ptipe dari distribusi UNIF(0, 1) dan memban-
dingkannya dengan p(v).

(b) Jika ptipe ≤ p(v), maka tipe pembayaran adalah tipe 1, selain itu tipe pem-
bayaran adalah tipe 2.

(c) Lakukan proses tersebut sampai setiap klaim RBNS mempunyai pembayar-
an tipe 2, dimana pembayaran tipe 2 berarti tidak akan ada lagi pembayaran
lain di masa depan.

c. Simulasi besar pembayaran berikutnya

Simulasi untuk besar pembayaran berikutnya sangat sederhana, yaitu dengan


menghasilkan secara random besar pembayaran dengan menggunakan parameter
distribusi besar pembayaran yang sebelumnya sudah diestimasi.
DAFTAR PUSTAKA

Antonio, K. and Plat, R., 2014, Micro-level Stochastic Loss Reserving for General
Insurance, Scandinavia Actuarial Journal, No.7:pp. 649-669.

Bain, Lee J. dan Engelhardt, Max., 1992, Introduction to Probability and Mathe-
matical Statistics, Duxburry Press:California.

Beard, R., Pentikainen, T., and Pesonen, E., 1984, Risk Theory The Stochastic Basis
of Insurance, Chapman and Hall, New York.

Bednárik, V.,2017, Loss Reserving for individual Claim-by-Claim Data , Pra-


gue:Charles University.

Calandro, Jr. J. dan OBrien, T. J., 2004, A User-Friendly Introduction to Property-


Casualty Claim Reserves, Risk Management and Insurance Review. Vol 7(2),
177-187.

Capiński M. dan Kopp E., 2003, Measure, Integran, and Probability, Second Edi-
tion, Springer, New York.

Cook, R. dan Lawless, J., 2007, The Statistical Analysis of Recurrent Event, Spri-
nger, New York.

Daley, D.J dan Vere-Jones, D., 2003, An Introduction to the Theory of Point Pro-
cesses, Springer, USA.

Danardono, 2012, Analisis Data Survival, Program Studi Statistika Jurusan Ma-
tematika Fakultas Matematika dan Iimu Pengetahuan Alam Universitas Gadjah
Mada: Yogyakarta.

Drieskens, et al., 2012, Stochastic Projection for Large Individual Losses, Scandi-
navian Actuarial Journal. Vol 1, 1-39.

74
75

England, P.D. dan Verrall, R.J., 2002, Stochastic Claims Reserving in General In-
surance, British Actuarial Journal. 8:443-544.

Efron, B.dan Tibshirani, Robert, J., 1993, An Introduction to the Bootstrap, Cha-
pman and Hall: New York.

Gibbons, Jean D. Dan Chakraborti, Subhabrata., 2003, Nonparametric Statistical


Inference Fourth Edition, Revised and Expanded, Marcel Dekker, Inc:USA.

Mack, T., 1993, Distribution-free Calculation of the Standard Error of Chain La-
dder Method Reserves Estimates, ASTIN Bulletin. Vol 23, 213-225.

Mutaqin, A. K., Tampubolon, D. R. dan Darwis. S., 2008, Run-Off Triangle Data
dan Permasalahannya, Statistika. Vol 8(1), 55-59.

Norberg, R., 1999, Prediction of Outstanding Liabilities: Model Variations and


Extensions, ASTIN Bulletin, 29(1):pp. 5-25.

Olofsson, Maria, 2006, tochastic Loss Reserving Testing the New Guidelines from
the Australian Prudential Regulation Authority (APRA) on Swedish Portfolio Da-
ta Using a Bootstrap Simulation and Distribution-Free Method by Thomas Mack,
Stockholm University.

Pinsky, M. A., dan Karlin, S., 2011, An Introduction to Stochastic Modeling, Else-
vier, 223-276.

Rausand, M., dan Hoyland, A., 2004, System Reliability Theory, 2th edition, John
Wiley and Sons, Inc., New Jersey.

Ross, S. M., 2010, Introduction to Probability Models,10th edition, Elsevier, Bos-


ton, USA.

Schoenberg, F. P., 2011, Introduction to Point Processes, Wiley Encyclopedia of


Operations Research and Management Science.

Wackerly, D., Mendenhall, W., dan Scheaffer, R.L., 2007, Mathematical Statistics
with Applications, edisi 7, Duxbury Press, ISBN: 978-0495110811.
76

Wüthrich, M. V. dan Merz, M., 2008, Stochastic Claims Reserving Methods in In-
surance, Wiley Finance, London, UK.

Anda mungkin juga menyukai