Anda di halaman 1dari 18

PERTEMUAN 3

ESTIMASI UNTUK MODIFIED DATA


ESTIMASI TITIK
CENSORING (TERSENSOR) DAN TRUNCATION
(TERPANCUNG) DATA
• Data incomplete (tidak lengkap) biasanya karena censoring dan truncation.
• DEFINISI:
Suatu pengamatan dikatakan terpancung dari bawah (terpancung kiri/left truncated) pada d jika pada d
atau di bawah d, tidak tercatat, tetapi di atas d tercatat sebagai nilai pengamatannya.
Suatu pengamatan dikatakan terpancung dari atas (terpancung kanan/right truncated) pada u jika pada u
atau di atas u, tidak tercatat tetapi di bawah u tercatat sebagai nilai nilai pengamatannya.
Suatu pengamatan dikatakan tersensor dari bawah (tersensor kiri/left censored) pada d jika pada d atau di
bawah d, tercatat sama dengan d, tetapi di atas d tercatat sebagai nilai pengamatannya.
Suatu pengamatan dikatakan tersensor dari atas (tersensor kanan/right censored) pada u jika pada u atau
di atas u, tercatat sama dengan u, tetapi di bawah u tercatat sebagai nilai pengamatannya.
CENSORING (TERSENSOR) DAN TRUNCATION
(TERPANCUNG) DATA

• Karena terpancung kiri dan tersensor kanan merupakan kejadian paling umum dalam bidang aktuaria,
maka kedua kasus tersebut yang akan dibahas pada pertemuan ini.
• Untuk selanjutnya, istilah kata “truncated” atau “terpancung” berarti terpancung kiri sedangkan kata
“censored” atau “tersensor” berarti tersensor kanan.
• Untuk membangun distribusi dari data terpancung atau tersensor, hal pertama adalah membuat notasi
untuk merepresentasikan data.
CENSORING (TERSENSOR) DAN TRUNCATION
(TERPANCUNG) DATA

• Untuk data individu, misalkan titik pancung ke-j dinotasikan dengan 𝑑𝑗 dan jika tidak ada yang
terpancung, maka 𝑑𝑗 = 0.
• Data pengamatan yang bergantung pada apakah pengamatan tersebut tersensor atau tidak. Jika tidak
tersensor, maka dinotasikan dengan 𝑥𝑗 . Jika tersensor maka dinotasikan dengan 𝑢𝑗 .
• Selanjutnya untuk pengamatan yang tidak tersensor xj, misalkan terdapat k unik sehingga dapat
dinotasikan dengan 𝑦1 < 𝑦2 < … < 𝑦𝑘 .
• Misalkan 𝑠𝑗 adalah banyaknya pengamatan tidak tersensor 𝑦𝑗 yang muncul dalam sampel.
CENSORING (TERSENSOR) DAN TRUNCATION
(TERPANCUNG) DATA
• Yang terpenting adalah, 𝑟𝑗 yaitu risiko pada observasi terurut ke-j (𝑦𝑗 ), yang didefinisikan sebagai:

𝑟𝑗 = 𝑛𝑢𝑚𝑏𝑒𝑟 𝑜𝑓 𝑥𝑖 𝑠 ≥ 𝑦𝑗 + 𝑛𝑢𝑚𝑏𝑒𝑟 𝑜𝑓 𝑢𝑖 𝑠 ≥ 𝑦𝑗 − (𝑛𝑢𝑚𝑏𝑒𝑟 𝑜𝑓 𝑑𝑖 𝑠 ≥ 𝑦𝑗 )


• Atau bisa dengan:
𝑟𝑗 = 𝑛𝑢𝑚𝑏𝑒𝑟 𝑜𝑓 𝑑𝑖 𝑠 < 𝑦𝑗 − 𝑛𝑢𝑚𝑏𝑒𝑟 𝑜𝑓 𝑥𝑖 𝑠 < 𝑦𝑗 − (𝑛𝑢𝑚𝑏𝑒𝑟 𝑜𝑓 𝑢𝑖 𝑠 < 𝑦𝑗 )
• Kita bisa gunakan rumus rekursif,
𝑟𝑗 = 𝑟𝑗−1 + 𝑛𝑢𝑚𝑏𝑒𝑟 𝑜𝑓 𝑑𝑖 𝑠 𝑏𝑒𝑡𝑤𝑒𝑒𝑛 𝑦𝑗−1 𝑎𝑛𝑑 𝑦𝑗
− 𝑛𝑢𝑚𝑏𝑒𝑟 𝑜𝑓 𝑥𝑖 𝑠 𝑒𝑞𝑢𝑎𝑙 𝑡𝑜 𝑦𝑗−1
−(𝑛𝑢𝑚𝑏𝑒𝑟 𝑜𝑓 𝑢𝑖 𝑠 𝑏𝑒𝑡𝑤𝑒𝑒𝑛 𝑦𝑗−1 𝑎𝑛𝑑 𝑦𝑗 )
• Between merepresentasikan “lebih dari sama dengan 𝑦𝑗−1 dan kurang dari 𝑦𝑗 ”, dan 𝑟0 = 0.
CONTOH 1

• Hitunglah 𝑟𝑗 dari DATA SET D2 !


ESTIMASI KAPLAN-MEIER

• Estimator Kaplan-Meier merupakan salah satu metode yang sering digunakan untuk mendapatkan
estimator dari fungsi survival.
• Estimasi ini, dimulai dengan S(0)=1.
• Estimasi Kaplan-Meier untuk fungsi survival didefinisikan sebagai:
ESTIMASI NELSON-AALEN

• Estimasi terhadap fungsi survival juga dapat kita dapatkan dengan estimator Nelson-Aalen, dengan
menghitung estimator terhadap fungsi hazard rate kumulatif.
• Estimator Nelson-Aalen dapat diperoleh dengan formula berikut:

• Sehingga diperoleh penduga fungsi survivalnya:


𝑡/𝑤
Dimana, saat 𝑡 ≥ 𝑤, maka penduga alternatifnya adalah 𝑠Ƹ 𝑡 = 0 dan 𝑠Ƹ 𝑡 = 𝑠Ƹ 𝑦𝑘
CONTOH 2

• Tentukan estimator fungsi


survival dengan Kaplan Meier
dan dengan Nelson-Aalen.
MEAN, VARIANSI, DAN ESTIMASI INTERVAL
MEAN DAN VARIANSI
𝑌
• Kita tahu bahwa estimasi empiris untuk 𝑆(𝑥) adalah 𝑆𝑛 (𝑥) yang dapat didefinisikan sebagai: 𝑆𝑛 =
𝑛
dimana Y adalah banyaknya pengamatan yang lebih dari x. Oleh karena itu, Y pasti berdistribusi
binomial dengan parameter n dan S(x).
• Oleh karena itu, mean:
𝑌 𝑛𝑆 𝑥
𝐸 𝑆𝑛 𝑥 =𝐸 = = 𝑆(𝑥) -> maka 𝑆𝑛 (𝑥) adalah penduga tak bias untuk 𝑆(𝑥).
𝑛 𝑛

• Dan variansinya:
𝑌 𝑆 𝑥 1−𝑆 𝑥
𝑉𝑎𝑟 𝑆𝑛 𝑥 = 𝑉𝑎𝑟 𝑛
= 𝑛
-> memenui sifat konsistensi, yaitu Ketika limit untuk n-> takhingga
maka hasilnya = 0
• Berdasarkan hasil sebelumnya, karena 𝑆(𝑥) tidak diketahui dan 𝑆(𝑥) diestimasi dengan 𝑆𝑛 (𝑥), maka
𝑌 𝑆𝑛 𝑥 1−𝑆𝑛 𝑥
෢ 𝑆𝑛 𝑥
𝑉𝑎𝑟 = 𝑉𝑎𝑟 =
𝑛 𝑛
MEAN DAN VARIANSI

• Misalkan, Pr 𝑎 < 𝑋 ≤ 𝑏 = 𝑝. Penduga empiris dari 𝑝 adalah: 𝑝Ƹ = 𝑆𝑛 𝑎 − 𝑆𝑛 (𝑏), dan


𝐸 𝑝Ƹ = 𝐸 𝑆𝑛 𝑎 − 𝑆𝑛 𝑏 = 𝐸 𝑆𝑛 𝑎 − 𝐸 𝑆𝑛 𝑏 =𝑆 𝑎 −𝑆 𝑏 =𝑝
𝑝 1−𝑝
𝑉𝑎𝑟 𝑝Ƹ = , maka saat lim n-> tak hingga, hasilnya adalah 0
𝑛

• Akibatnya, 𝑝Ƹ adalah penduga untuk 𝑝 yang tak bias, dan konsisten.


MEAN DAN VARIANSI

• Untuk data grup, misalkan 𝑥 adalah nilai di antara 𝑐𝑗−1 dan 𝑐𝑗 .


• Misalkan 𝑌 adalah banyaknya pengamatan yang kurang dari sama dengan 𝑐𝑗−1 dan 𝑍 adalah banyaknya
pengamatan lebih dari 𝑐𝑗−1 dan kurang dari sama dengan 𝑐𝑗 , maka nilai ogive:

• Sehingga ekspektasi dan variansinya adalah:


MEAN DAN VARIANSI

• Selanjutnya, estimator untuk densitasinya, yaitu nilai histogram:

• Sehingga ekspektasi dan variansinya:


MEAN DAN VARIANSI
• Untuk data diskrit,
• Misalkan 𝑁𝑗 adalah banyaknya nilai 𝑥𝑗 pada sampel. Maka 𝑁𝑗 berdistribusi binomial dengan parameter
𝑛 dan 𝑝 𝑥𝑗 .
• Estimator empirisnya adalah:
𝑁𝑗
𝑝𝑛 𝑥𝑗 =
𝑛
• Dan ekspektasi serta variansinya adalah:
ESTIMASI INTERVAL

• Bentuk umum estimasi interval:

• Jika 5% alfanya, atau dengan kata lain, tingkat kepercayaannya adalah 95%, maka nilai z adalah 1,96.
• Contoh:
TUGAS INDIVIDU

• Dikumpulkan dengan deadline, Jumat 12 Maret 2021 Pukul 23.00 WIB di EMAS UI
• EXERCISES 12.1.1 No 12.2 dan 12.3
• EXAMPLE 12.6 dan 12.7

Anda mungkin juga menyukai