net/publication/320910919
CITATIONS READS
0 3,220
2 authors, including:
SEE PROFILE
All content following this page was uploaded by Devni Prima Sari on 07 November 2017.
xi
MODEL REGRESI POISSON TERGENERALISASI
DENGAN STUDI KASUS KECELAKAAN KENDARAAN BERMOTOR DI
LALU LINTAS
Intisari: Model regresi Poisson telah lama digunakan untuk penggolongan resiko.
Metode regresi Poisson mempunyai asumsi equi-dispersion, yaitu kondisi dimana nilai
mean dan variansi dari variabel respon bernilai sama. Pada kenyataannya, seringkali
dijumpai pada data dengan variansi dari variabel respon lebih besar dari pada nilai
rataannya (overdispersi). Sehingga model regresi Poisson dianggap kurang tepat untuk
mengatasi masalah tersebut. Sehingga digunakan model regresi Poisson
Tergeneralisasi untuk mengatasi masalah overdispersi.
Dalam tulisan ini, model regresi Poisson dan Poisson Tergeneralisasi akan diterapkan
pada data kasus kecelakaan kendaraan bermotor di lalu lintas. Berdasarkan hasil
estimasi parameter dispersi, a, pada model regresi Poisson Tergeneralisasi diketahui
bahwa terjadi kasus overdispersi. Setelah model regresi Poisson dan Poisson
Tergeneralisasi di uji dengan menggunakan uji deviance, Pearson Chi-Square, AIC,
BIC, maka disimpulkan bahwa model regresi terbaik dihasilkan oleh model regresi
Poisson Tergeneralisasi.
A. PENDAHULUAN
Penggolongan resiko adalah proses dari pemodelan alternatif dengan
menggolongkan resiko menurut rating factors dengan karakteristik-karakteristik yang
dibentuk ke dalam rating classes. Sebagai contoh, di dalam kecelakaan kendaraan
bermotor yang diperlakukan sebagai faktor penilaian dapat dilihat pada faktor
pengemudi, kendaraan, jalan, cuaca dan faktor lainnya.
Model regresi Poisson secara luas telah banyak digunakan untuk memodelkan
penggolongan resiko. Sebagai contoh, McCullagh dan Nelder dalam buku Generalized
Linear Models (1989) menggunakan model regresi Poisson untuk memodelkan jumlah
klaim pada peristiwa kerusakan muatan yang dibawa kapal-kapal di dalam asuransi
laut. Di dalam asuransi motor, Brockman dan Wright dalam penelitiannya tahun 1992
menerapkan model itu pada klaim kerusakan kepemilikan motor di UK, dan Renshaw
tahun 1994 memakai model tersebut untuk klaim-klaim motor yang disediakan oleh
suatu perusahaan asuransi yang terkemuka di dalam UK. Selanjutnya, model regresi
Poisson diterapkan oleh Ismail dan Jemain tahun 2003 pada himpunan dari klaim
kerusakan mobil milik pribadi yang disediakan oleh satu perusahaan asuransi di
Malaysia.
Bagaimanapun, model regresi Poisson berasumsi bahwa rata-rata dan variansi
dari variabel dependen adalah sama, E(Y)=Var(Y), atau disebut juga equidispersi.
Dalam praktek, data itu boleh ditampilkan overdispersion atau extra – variasi Poisson,
yaitu, suatu situasi di mana variansi melebihi rata-rata, Var(Y)>E(Y). Selain itu, data
juga dapat disajikan underdispersi, yaitu keadaan dimana variansi kurang dari rata-
rata, Var(Y)<E(Y). Pembebanan yang tidak sesuai pada Poisson mengabaikan standar
error dan terlalu menekankan makna dari parameter-parameter regresi, dan sebagai
konsekuensi, memberikan kesimpulan salah tentang parameter-parameter regresi. Oleh
karena itu, sasaran dari penelitian ini untuk menggunakan model regresi Poisson
Tergeneralisasi sebagai satu alternatif untuk penggolongan resiko. Selanjutnya, model-
model regresi Poisson dan Poisson Tergeneralisasi dicoba, diuji dan dibandingkan pada
jenis data jumlah kecelakaan kendaraan bermotor di lalu lintas.
linear xi T β . Suatu fungsi link di sebut sebagai fungsi link kanonik (canonical link
y b( )
f ( y; ) exp c( y, )
a( )
Dalam hal ini, adalah parameter dispersi dan f ( y; ) merupakan fungsi
probabilitas variabel random Y yang termasuk dalam keluarga eksponensial.
𝜇 𝑦 .𝑒 −𝜇
𝑃 (𝑌 = 𝑦|𝑥1 , … , 𝑥𝑘 ) = , 𝑦 = 0,1,2, … (1)
𝑦!
Salah satu tujuan dari analisis regresi adalah untuk menentukan pola hubungan
antara variabel respon dengan variabel penjelas. Selanjutnya, dalam regresi Poisson
hubungan tersebut dapat dituliskan dalam bentuk:
Karena nilai 𝜇𝑖 > 0, maka digunakan fungsi link 𝜂𝑖 = log( xi T β ) atau 𝜂𝑖 = 𝑙𝑜𝑔𝜇𝑖 =
Dengan 𝛽 merupakan parameter yang tidak diketahui dalam model dan harus di
estimasi.
Teorema 1 Jika Y merupakan suatu variabel random GPD yang dinotasikan dengan
𝑌~𝐺𝑃(𝜃, 𝜆), maka nilai mean dan variansinya adalah sebagai berikut:
E Y ,
1
Var Y 2 ,
(1 )3
Definisi 2 Asumsikan bahwa variabel dependen yi yang menyatakan jumlah kejadian
adalah berdistribusi Poisson Tergeneralisasi. Diberikan sejumlah variabel independen
x1,x2,...,xp.
𝑒 −(𝜃+𝜆𝑖 𝑦𝑖)
𝜃 (𝜃 + 𝜆𝑖 𝑦𝑖 ) 𝑦𝑖 −1 , 𝑦𝑖 = 0,1,2, …
𝑦𝑖 !
𝑃(𝑌𝑖 = 𝑦𝑖 |𝑥1 , 𝑥2 , … , 𝑥𝑝 ) = (6)
0, 𝑦𝑖 > 𝑚, 𝜆𝑖 < 0
{ 0, 𝑦𝑖 yang lain
Wang dan Famoye (1997) menyatakan bahwa fungsi kepadatan peluang dari
distribusi GP I adalah
yi
i (1 ayi ) yi 1 (1 ayi )
P Yi yi exp i , yi 0,1, (7)
1 a i yi ! 1 a i
dengan Yi sebagai variabel random untuk distribusi GP I.
Mean diasumsikan ke dalam persamaan 𝐸 [𝑌𝑖 |𝑥𝑖 ] = 𝜇𝑖 = ℯ𝑖 exp(𝒙𝑻𝒊 𝜷),
sedangkan variansi bersyarat ekuivalen dengan 𝑉𝑎𝑟[𝑌𝑖 |𝑥𝑖 ] = 𝜇𝑖 (1 + 𝑎𝜇𝑖 )2 . Ketika
parameter dispersi, a, sama dengan nol, fungsi kepadatan peluang pada persamaan (7)
akan beralih menuju Poisson, sehingga mean sama dengan variansi, yaitu 𝐸 [𝑌𝑖 |𝑥𝑖 ] =
𝑉𝑎𝑟[𝑌𝑖 |𝑥𝑖 ]. Untuk a>0, variansi lebih besar daripada mean, 𝐸 [𝑌𝑖 |𝑥𝑖 ] > 𝑉𝑎𝑟[𝑌𝑖 |𝑥𝑖 ], dan
untuk kondisi ini model regresi merepresentasikan data cacah dengan overdispersi.
Sedangkan untuk a<0, variansi lebih kecil daripada mean, 𝐸 [𝑌𝑖 |𝑥𝑖 ] < 𝑉𝑎𝑟[𝑌𝑖 |𝑥𝑖 ], dan
untuk kondisi ini model regresi merepresentasikan data cacah dengan underdispersi.
Jika 𝛽 di estimasi dengan metode maksimum likelihood dan log likelihood
dinotasikan dengan , maka persamaan yang terkait adalah:
exp( xiT ) exp( xiT )(1 ayi )
( , a) { yi log yi 1 log 1 ayi
1 a exp( xi ) 1 a exp( xiT )
T
i
log( yi !)}
Selanjutnya, apabila persamaan tersebut diturunkan terhadap j , maka diperoleh
Karena persamaan (8) adalah juga ekuivalen dengan kuadrat terkecil terbobot, dengan
suatu pengabaian modifikasi, estimasi dari dapat diselesaikan dengan prosedur
IWLS.
Di dalam penelitian ini, akan digunakan dua metode untuk memecahkan
parameter dispersi, a, yaitu dengan metode maksimum likelihood dan metode moment.
Persamaan untuk penyelesaian metode maksimum likelihood dapat diperoleh dengan
menurunkan persamaan log likelihood terhadap 𝑎, adalah sebagai berikut:
y y ( y 1) i ( yi i )
i i i i 0 (9)
a i 1 a i 1 ayi (1 ai ) 2
2 yi i 2 yi 2 ( yi 1) 2i 2 ( yi i )
a 2
i (1 a )2 (1 ay )2 (1 a )3
(10)
i i i
a. Deviance
Deviance yaitu logaritma dari uji rasio likelihood-nya (McCullagh & Nelder,
1989). Uji rasio likelihoodnya membandingkan current model-nya dengan saturated
model-nya. Deviance dituliskan sebagai berikut:
𝐷 = 2(𝑙(𝒚; 𝒚) − 𝑙 (𝝁; 𝒚)) (12)
di mana 𝑙(𝒚; 𝒚)dan 𝑙 (𝝁; 𝒚)adalah model log likelihood yang dievaluasi masing-
masing di bawah 𝝁 dan 𝒚. Untuk model yang memadai, D juga memiliki asimtotik
distribusi chi-squre dengan n - p derajat kebebasan. Oleh karena itu, jika nilai-nilai
untuk kedua Pearson Chi-Square dan D adalah dekat dengan derajat kebebasan, model
dapat dianggap memadai.
b. Pearson Chi-Square
Ukuran lain yang bisa digunakan untuk goodness of fit test yaitu statistik
Pearson Chi- Square (McCullagh & Nelder, 1989) yang didefinisikan sebagai
𝑛
2
(𝑦𝑖 − 𝜇𝑖 )2
𝑋 =∑ (13)
𝑉𝑎𝑟(𝑌𝑖 )
𝑖=1
1. Data Penelitian
Data yang digunakan dalam penelitian ini adalah data sekunder dari laporan
Unit Lakalantas Poltabes Padang selama tahun 2012. Rating factor dan rating classes
yang dipakai dalam penelitian ini berdasarkan pada penelitian sebelumnya serta
berdasarkan data yang tersedia di Lakalantas Poltabes Padang.
Variabel dalam penelitian ini terdiri dari variabel respon dan prediktor. Adapun
variabel yang digunakan pada penelitian ini adalah:
Ada kalanya kita melakukan suatu regresi dimana variabel penjelas berupa data
kualitatif. Jika data kualitatif tersebut memiliki m kategori, maka jumlah variabel
dummy yang dicantumkan di dalam model adalah (m - 1).
Dari tabel 2 terlihat bahwa terdapat rating classes yang tidak signifikan. Sehingga
harus dilakukan kembali analisis deviance dengan membuang pasangan rating classes
yang tidak signifikan. Berikut adalah ini adalah analisis deviance model regresi Poisson
untuk tiap rating classes yang telah signifikan.
Tabel 3. Analisis deviance model regresi Poisson untuk tiap rating classes yang sudah
signifikan.
Df Deviance P(>|Chi|)
NULL 42 371.7
A1 Lengah 1 33.998 5.52E-09 ***
A2 Mengantuk 1 26.96 2.08E-07 ***
A3 Tidak terampil 1 28.561 9.08E-08 ***
A4 Mabuk 1 14.501 0.00014 ***
A5 Kecepatan tinggi 1 51.037 9.06E-13 ***
A6 Tidak menjaga jarak 1 12.516 0.000403 ***
A7 Kesalahan pejalan 1 10.184 0.001417 **
B1 Kerusakan sistem rem 1 21.342 3.84E-06 ***
B5 Kerusakan sistem kemudi 1 6.874 0.008748 **
C1 Persimpangan 1 12.695 0.000367 ***
D1 Gelap 1 15.544 8.06E-05 ***
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Dari hasil analisis deviansi model regresi Poisson untuk tiap rating classes
hanya diperoleh beberapa rating classes yang signifikan yaitu lengah, mengantuk,
tidak terampil, mabuk, kecepatan tinggi, tidak menjaga jarak, kesalahan pejalan,
kerusakan sistem rem, kerusakan sistem kemudi, persimpangan dan gelap. Hasil
estimasi parameter untuk rating classes yang signifikan, dapat dilihat pada Tabel 4.
Tabel 4. Estimasi parameter untuk model Poisson rating classes yang signifikan
Nilai estimasi beta tiap dummy
No. Beta Nilai_beta Standar.error Varians Pval
Intercept 1.61 0.088 0.008 0
A1 Lengah 0.83 0.13 0.017 0
A2 Mengantuk 0.56 0.152 0.023 0.00024
A3 Tidak terampil 0.77 0.157 0.025 0
A4 Mabuk 0.94 0.163 0.026 0
A5 Kecepatan tinggi 0.99 0.16 0.026 0
A6 Tidak menjaga jarak 0.63 0.17 0.029 0.00022
A7 Kesalahan pejalan 0.82 0.199 0.04 0.00004
B1 Kerusakan sistem rem 0.72 0.214 0.046 0.00077
B5 Kerusakan sistem kemudi 0.51 0.157 0.025 0.00114
C1 Persimpangan 0.71 0.173 0.03 0.00003
D1 Gelap 0.68 0.168 0.028 0.00005
df 31
Pearson's X^2 126.7225
log L -154.4214
Nilai p-value untuk semua parameter kecil dari 0.005, nilai ini mengidentifikasikan
bahwa estimasi parameter sudah signifikan. Dari Tabel 4 terlihat bahwa terjadi
overdispersi pada data karena nilai Pearson Chi-square dibagi dengan derajat bebas
nilainya lebih besar dari 1. Untuk mengatasi masalah overdispersi pada data cacah ini
penulis mencoba memodel-ulangkan dengan regresi Poisson Tergeneralisasi.
Hasil estimasi parameter untuk masing-masing rating classes, dapat dilihat
pada tabel 5. Perbandingan antara Poisson dan Poisson Tergeneralisasi menunjukkan
bahwa parameter regresi untuk semua model memberikan estimasi yang hampir sama.
Nilai AIC pada model Poisson Tergeneralisasi (Moment) menunjukkan nilai lebih kecil
daripada model lainnya. Ini berarti, model Poisson Tergeneralisasi (Moment) lebih
baik daripada model Poisson. Tetapi nilai standar error pada model Poisson
Tergeneralisasi (Moment) menunjukkan nilai paling besar dari model lainnya,
sehingga mengakhibatkan parameter regresi tidak signifikan untuk A6, B1, B5 dan C1.
Menurut uji statistik Pearson Chi-Square, apabila nilai Pearson Chi-Square dibagi
dengan derajat bebasnya menghasilkan nilai lebih besar dari satu, maka hal ini
menunjukkan bahwa terjadi overdispersi. Ternyata dari data yang ada, ketiga model
yaitu model Poisson, Poisson Tergeneralisasi (MLE) dan Poisson Tergeneralisasi
(Moment) masih mengindikasikan terjadinya overdispersi. Tetapi jika dilihat dari nilai
a, maka model Poisson Tergeneralisasi (MLE) lebih baik dalam mengatasi
overdispersi dimana a < 0.
E. DAFTAR PUSTAKA
Ismail, Noriszura, and Abdul Aziz Jemain. "Bridging Minimum Bias and Maximum
Likelihood Methods through Weighted Equation." Casualty Actuarial Society
Forum, 2005: 367-394.
Ismail, Noriszura, and Abdul Aziz Jemain. "Handling Overdispersion with Negative
binomial and Generalized Poisson Regression Models." Casualty Actuarial
Society Forum, 2007: 103-158.
McCullagh, P., dan J.A. Nelder. Generalized Linear Models. 2nd Edition. London:
Chapman and Hall, 1989.
Sari, Devni Prima. Penanganan Overdispersi dengan Model Regresi Binomial Negatif
I Pada Faktor-Faktor yang Mempengaruhi Angka Kematian yang Disebabkan
Oleh Kanker Paru-Paru. Prosiding Seminar Nasional Matematika UNS, 2010:
445-452.
Sari, Devni Prima. Kajian Overdispersi Pada Regresi Poisson dengan Menggunakan
Regresi Poisson Tergeneralisasi I. Prosiding Seminar Nasional Matematika
UNAND, 2011: 122-128.
UU RI No.22 Tahun 2009. Undang-Undang No. 22 Tahun 2009 tentang Lalu Lintas
dan Angkutan Jalan. Diakses melalui www.polri.go.id tanggal 2 Januari 2013.