Anda di halaman 1dari 25

PERBANDINGAN ANTARA REGRESI POISSON, BINOMIAL NEGATIF,

DAN ZERO-INFLATED POISSON PADA DATA OVERDISPERSI

AJI SETYAWAN

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2012
ABSTRAK
AJI SETYAWAN. Perbandingan antara Regresi Poisson, Binomial Negatif, dan Zero-Inflated
Poisson pada Data Overdispersi. Dibimbing oleh KUSMAN SADIK dan INDAHWATI.

Regresi Poisson digunakan untuk mengkaji hubungan antara peubah penjelas dengan peubah
respon yang berupa data cacah. Regresi Poisson mengasumsikan nilai tengah dan ragam dari
peubah respon mempunyai nilai yang sama. Akan tetapi, dalam penerapannya sering terjadi
kondisi overdispersi. Overdispersi adalah kondisi pada saat ragam dari peubah respon lebih besar
dari nilai tengah peubah respon. Overdispersi dapat terjadi karena banyaknyajumlah pengamatan
yang bernilai nol pada peubah respon.Salah satu penanganan overdispersi pada regresi Poisson
adalah menggunakan Regresi Binomial Negatif. Sedangkan penanganan overdispersi yang
disebabkan oleh banyaknya jumlah amatan dengan peubah respon yang bernilai nol dapat
menggunakan regresi Zero-Inflated Poisson (ZIP).Kajian simulasi dilakukan untuk
membandingkan kinerja metode regresi Poisson, regresi Binomial Negatif, dan regresi ZIP yang
dicobakan pada data yang tidak overdispersi dan data overdispersi. Pada data overdispersi diatur
berbagai persentase jumlah amatan dengan peubah respon yang bernilai nol pada tiap jumlah
amatan. Ketiga metode memberikan hasil yang sama baiknya pada data yang tidak mengalami
overdispersi baik dari penduga parameter, penduga galat baku, dan sisaan. Overdispersi pada
regresi Poisson akan menghasilkan galat baku yang lebih kecil dari nilai sesungguhnya
(underestimate). Semakin besar jumlah amatan maka penduga parameter yang dihasilkan akan
semakin mendekati parameter yang sebenarnya. Semakin besar persentase jumlah amatan yang
bernilai nol pada peubah respon maka parameter yang dihasilkan akan semakin jauh dari
parameter yang sebenarnya. Penerapan regresi ZIP pada data dengan banyak jumlah amatan yang
bernilai nol pada peubah respon menghasilkan penduga parameter dan penduga galat baku dari
penduga parameter yang sangat dekat dengan nilai sebenarnya daripada penduga parameter dan
penduga galat baku yang dihasilkan oleh regresi Poisson dan regresi Binomial Negatif.

Kata kunci: Regresi Poisson, Overdispersi, Regresi Binomial Negatif,Regresi Zero-Inflated


Poisson
PERBANDINGAN ANTARA REGRESI POISSON, BINOMIAL NEGATIF,
DAN ZERO-INFLATED POISSON PADA DATA OVERDISPERSI

Oleh :

AJI SETYAWAN

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Statistika pada
Departemen Statistika

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2012
Judul : Perbandingan antara Regresi Poisson, Binomial Negatif, dan Zero-Inflated Poisson
pada Data Overdispersi
Nama : Aji Setyawan
NRP : G14080021

Disetujui

Pembimbing I Pembimbing II

Dr. Ir. Kusman Sadik, M.Si Dr. Ir. Indahwati, M.Si


NIP : 196909121997021001 NIP : 19650712199032002

Diketahui

Ketua Departemen Statistika


Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor

Dr. Ir. Hari Wijayanto, M.Si


NIP : 196504211990021001

Tanggal Lulus :
KATA PENGANTAR
Puji syukur penulis panjatkan kehadirat Allah SWT karena atas rahmat dan hidayah-Nya,
penulis dapat menyelesaikan karya ilmiah ini. Karya ilmiah ini berjudul ”Perbandingan antara
Regresi Poisson, Binomial Negatif, dan Zero-Inflated Poisson pada Data Overdispersi”.Karya
ilmiah ini penulis susun sebagai salah satu syarat untuk mendapatkan gelar Sarjana Statistika pada
Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian
Bogor.
Penulisan karya ilmiah ini dapat diselesaikan oleh penulis tidak lepas dari dukungan,
bimbingan, dan bantuan dari banyak pihak. Oleh karena itu, dalam kesempatan ini penulis
menyampaikan ucapan terima kasih kepada:
1. Bapak Ir. Hari Wijayanto, M.Si selaku Ketua Departemen Statistika FMIPA IPB.
2. Bapak Dr. Ir. Kusman Sadik, M.Sidan Ibu Dr. Ir. Indahwati, M.Si selaku dosen
pembimbing yang telah memberikan bimbingan,masukan dan arahan kepada penulis.
3. Seluruh Dosen Departemen Statistika yang telah memberikan ilmu dan wawasan selama
penulis menuntut ilmu di Departemen Statistika serta seluruh staf Departemen Statistika
yang telah banyak membantu penulis.
4. Kedua orang tua, adik, dan bude yang telah memberikan doa, kasih sayang serta dukungan
baik moril maupun materil selama menuntut ilmu.
5. Rizki Fadhilah dan keluarga yang telah memberikan doa, kasih sayang, nasehat, dan
dukungannya.
6. Bimandra A. Djafaara, Rifki Rizal, Andzar Syafa’atur Rahman, Iqbal Noviandi, Hadi
Septian Guna Putra, M. Ferdiansyah, M. Seftian, Wisnu Panata Praja, Ferdian Bangkit
Wijaya, Agus Sopian, dan De Budi Sudarsono yang telah memberikan dukungan dan
bantuan selama penulis menyelesaikan karya ilmiah ini.
7. Teman-teman seperjuangan statistika khususnya Statistika 45 yang telah bersama-sama
dalam segala suka maupun duka.
8. Seluruh pihak yang telah memberikan dukungan dan bantuan dalam penyelesaian karya
ilmiah ini.
Semoga karya ilmiah ini dapat memberikan manfaat bagi semua pihak. Amin.

Bogor, November2012

Aji Setyawan
RIWAYAT HIDUP
Penulis dilahirkan di Rembangpada tanggal 9 Agustus 1990 dari pasangan Suwarno dan
Sulistyaningsih. Penulis merupakan anak pertama dari dua bersaudara. Tahun 2002 penulis lulus
dari SD Negeri Kutoharjo2Rembang. Kemudian melanjutkan studi di SLTP Negeri 2 Rembang
hingga tahun 2005. Selanjutnya, penulis menyelesaikan pendidikan di SMA Negeri 1Rembang dan
lulus pada tahun 2008. Pada tahun yang sama penulis lulus seleksi masuk Institut Pertanian Bogor
(IPB) melalui jalur Undangan Seleksi Masuk IPB (USMI) dan diterima sebagai mahasiswa
Departemen Statistika, FMIPA IPB dengan mayor Statistika dengan pilihan minor Matematika
Keuangan dan Aktuaria.
Selama mengikuti perkuliahan, penulis aktif dalam organisasi kemahasiswaan statistika
Himpunan Profesi Gamma Sigma Beta (GSB)sebagai Ketua Badan Pengawas Himpunan Profesi
Gamma Sigma Beta periode kepengurusan 2011 dan menjadi staf Beta ClubHimpunan Profesi
Gamma Sigma Beta (GSB) pada periode kepengurusan 2010. Selain itu, penulis juga aktif dalam
kegiatan kepanitiaan seperti Lomba Jajak Pendapat Statistika 2011 sebagai staf Divisi Logistik dan
Transportasi, Statistika Ria 2010 sebagai Ketua Divisi Acara dan 2009 sebagai staf Divisi Logistik
dan Transportasi,Welcome Ceremony Statistics (WCS) 2010 sebagai Ketua Pelaksana, serta
beberapa kegiatan lainnya. Pada Februari - April 2012, penulis melaksanakan kegiatan praktik
lapang di Balai Penelitian Tanaman Pemanis dan Serat (BALITTAS), Malang.
DAFTAR ISI

Halaman
DAFTAR GAMBAR ................................................................................................................. viii
DAFTAR TABEL .................................................................................................................... viii
DAFTAR LAMPIRAN ............................................................................................................ viii

PENDAHULUAN .................................................................................................................... 1
Latar Belakang .................................................................................................................... 1
Tujuan ................................................................................................................................. 1

TINJAUAN PUSTAKA ........................................................................................................... 1


Regresi Poisson .................................................................................................................... 1
Overdispersi ........................................................................................................................ 2
Regresi Binomial Negatif ................................................................................................... 2
Regresi Zero-Inflated Poisson (ZIP) ..................................................................................... 3
Evaluasi Penduga Parameter dan Penduga Galat Baku Relatif ............................................. 3

METODOLOGI ....................................................................................................................... 3
Data ..................................................................................................................................... 3
MetodeSimulasi .................................................................................................................... 4

HASIL DAN PEMBAHASAN ................................................................................................ 5


Mendeteksi Overdispersi ...................................................................................................... 5
Data Tidak Overdispersi ....................................................................................................... 5
Data Overdispersi ................................................................................................................. 6

KESIMPULAN DAN SARAN ................................................................................................ 8


Kesimpulan ........................................................................................................................... 8
Saran ..................................................................................................................................... 9

DAFTAR PUSTAKA ............................................................................................................... 9

LAMPIRAN ............................................................................................................................. 10
viii

DAFTAR GAMBAR
Halaman
1 Plot peluang sebaran Poisson ............................................................................................ 1
2 Plot hubungan peubah penjelas dengan peubah respon pada regresi Poisson ................... 2
3 Plot antara sisaan dengan nilai Y dari ketiga model pada data tidak overdispersi ........... 6
4 Plot antara sisaan dengan nilai Y dari ketiga model pada data overdispersi .................... 8

DAFTAR TABEL
Halaman
1 Rata-rata nilai-p dan jumlah amatan bernilai nol pada peubah respon dari setiap set data 5
2 Nilai mutlak bias relatif (ARB) dan MSE dari setiap penduga parameter regresi pada
data yang tidak overdispersi ............................................................................................... 6
3 Galat baku dugaan dan galat baku sebenarnyadari penduga parameter regresi pada data
yang tidak overdispersi ..................................................................................................... 7
4 Nilai mutlak bias relatif (ARB) dan MSE pada persentase jumlah amatan dengan
peubah respon yang bernilai nol sebesar 60%.................................................................... 7
5 Galat baku dugaan dan galat baku sebenarnya penduga parameter pada persentase
jumlah amatan dengan peubah respon yang bernilai nol sebesar 60%............................... 8

DAFTAR LAMPIRAN
Halaman
1 Diagram alir metode simulasi ........................................................................................... 11
2 Diagram kotak garis nilai bias relatif penduga parameter (bukan dalam satuan persen)
untuk data yang tidakoverdispersi .................................................................................... 12
3 Diagram kotak garis nilai bias relatif penduga parameter (bukan dalam satuan persen)
untuk data yang mengalami overdispersi .......................................................................... 13
4 Nilai mutlak bias relatif (ARB) dan MSE pada setiap persentase jumlahamatan dengan
peubah respon yang bernilai nol ....................................................................................... 16
5 Galat baku dugaan dan galat baku sebenarnya dari penduga parameter pada setiap
persentase jumlah amatan dengan peubah respon yang bernilai nol ................................. 17
1

PENDAHULUAN respon dengan kondisi overdispersi dan


tidak overdispersi.
Latar belakang 2. Membandingkan penduga galat baku dari
Dalam berbagai penelitian yang penduga parameter dari regresi Poisson,
menggunakan penerapan statistika, sering regresi Binomial Negatif, dan regresi ZIP
dilakukan pengkajian hubungan antara peubah untuk data dengan banyak jumlah amatan
respon dengan peubah penjelas. Hubungan bernilai nol pada peubah respon dengan
fungsional antara peubah respon dengan kondisi overdispersi dan tidak overdispersi.
peubah penjelas dapat dijelaskan oleh analisis
regresi. Analisis regresi linier mengasumsikan
bahwa peubah respon merupakan peubah TINJAUAN PUSTAKA
kontinu yang mengikuti sebaran normal.
Apabila peubah respon berupa diskret atau Regresi Poisson
data cacah, maka analisis ini tidak dapat Regresi Poisson sering digunakan untuk
digunakan. Jika analisis regresi linier memodelkan kejadian yang jarang terjadi
digunakan untuk peubah respon berupa data dengan data berupa data cacah. Fungsi
cacah maka akan menyebabkan hasil yang peluang dari sebaran Poisson dengan
tidak efisien, tidak efektif, dan pendugaan parameter µ (Hardin & Hilbe 2007) adalah:
parameter yang berbias (Long 1997). exp(- µ ) µ
y

Metode yang tepat digunakan untuk P (Y = y | µ ) =


peubah respon berupa data cacah adalah y!
analisis regresi Poisson. Pada regresi Poisson, dengany = 0, 1, 2, … dan µ > 0. Contoh plot
peluang data cacah ditentukan berdasarkan peluang sebaran Poisson dapat dilihat pada
sebaran Poisson. Nilai tengah dari sebaran Gambar 1.
Poisson merupakan fungsi dari peubah
Plot peluang sebaran Poisson
penjelasnya. Regresi Poisson mengasumsikan 0.25 Keterangan
nilai tengah dan ragam dari peubah respon µ=3
mempunyai nilai yang sama. Akan tetapi, µ=5
0.20 µ=8
dalam penerapannya sering terjadi kondisi µ=12
overdispersi. Overdispersi adalah kondisi pada 0.15
Peluang

saat ragam dari peubah respon lebih besar dari


nilai tengah peubah respon (Long 1997). 0.10
Overdispersi dapat terjadi karena banyaknya
pengamatan yang bernilai nol pada peubah 0.05

respon (Ridout et al. 1998).


0.00
Salah satu penanganan overdispersi pada
0 10 20 30 40 50
regresi Poisson adalah menggunakan Regresi y
Binomial Negatif. Sedangkan penanganan
overdispersi yang disebabkan oleh Gambar 1 Plot peluang sebaran Poisson
banyaknyaamatanyang bernilai nol pada
peubah respon dapat menggunakan regresi Poisson juga merupakan bagian dari
Zero-Inflated Poisson (ZIP). Regresi ZIP ini keluarga eksponensial, sehingga bisa
membagi amatan ke dalam dua proses atau dituliskan:
model. Model pertama digunakan untuk P (Y = y | µ ) = exp { y ln( µ ) - µ - ln Γ ( y + 1)}
menentukan peluang dari peubah respon suatu Kemudian nilai tengah parameter dapat ditulis:
amatan bernilai nol yang selanjutnya disebut
model logit sedangkan model kedua E ( yi | xi ) = µi = exp(xi β)
digunakan untuk menentukan peluang dari sehingga model regresi Poisson (Long 1997)
peubah respon suatu amatanyang bernilai adalah:
selain nol (Long 1997). ln(µi )=xi β

Tujuan =β 0 +β1 x i1 +β 2 x i2 +...+β k x ik +ε i


Penelitian ini dilakukan dengan tujuan dengan:
sebagai berikut: i = 1, 2, ..., n
1. Membandingkan penduga parameter dari j = 1, 2, ..., k
regresi Poisson, regresi Binomial Negatif, xij = peubah penjelas ke-j, amatan ke-i
dan regresi ZIPuntuk data dengan banyak β0 = konstanta
jumlahamatan bernilai nol pada peubah
2

βj = koefisien regresi peubah penjelas overdispersi dapat ditulis var(Y) > E(Y).
ke-j Sebaliknya, data yang ragam peubah respon
n = banyaknya amatan bernilai lebih kecil dari rata-rata peubah
k = banyaknya peubah penjelas respon disebut dengan underdispersi
Keluarga eksponensial biasanya ditulis dalam (McCullagh & Nelder 1989).
bentuk: Long (1997) dalam Jackman (2007)
 yθ − b (θ )  menyatakanoverdispersi dapat terjadi karena
f y ( y; θ , φ ) = exp  + c( y, φ )  adanya sumber keragaman yang tidak teramati
 a (φ )  pada data atau adanya pengaruh peubah lain
Dengan θ adalah parameter natural dan ø yang mengakibatkan peluang terjadinya suatu
adalah skala yang dibutuhkan untuk kejadian bergantung pada kejadian
menghasilkan galat baku yang mengikuti sebelumnya. Overdispersi akan
distribusi dalam keluarga eksponensial mengakibatkan simpangan baku dari
(Hardin & Hilbe 2007). Gambar 2 parameter dugaan menjadi berbias ke bawah
memperlihatkan contoh plot hubungan antara (underestimate) dan signifikansi dari pengaruh
peubah respon dengan peubah penjelas pada peubah penjelas menjadi berbias ke atas
regresi Poisson. (overstate) (Ismail & Jemain 2007).
P lo t re g re s i P o is s o n Dugaan overdispersi dapat diukur melalui
30
rasio antara deviance dengan derajat bebasnya.
25
Jika rasio ini menghasilkan nilai yang lebih
20
besar dari satu, maka model tersebut dikatakan
Y 15 mengalami overdispersi. Deviance model
10
regresi Poisson memiliki persamaan sebagai
5 berikut :

0
௜
0 2 4
X
6 8 10
‫ ܦ‬ൌ ʹ ෍ ൜‫ݕ‬ ௜ Ž   െ ௜ െ ̂ ௜

̂ ௜
Gambar 2 Plot hubungan peubah penjelas ௜ୀ௜

dengan peubah respon pada dengan yi merupakan nilai aktual amatan ke-i
regresi Poisson dari peubah respon dan ̂ ௜ merupakan nilai
dugaan peubah respon untuk amatan ke-i
Pendugaan dari parameter koefisien regresi (Hardin & Hilbe 2007).Rasio dispersi(α) ini
Poisson dapat dilakukan dengan menggunakan dapat diuji secara formal dengan hipotesis
metode Maximum Likelihood Estimation sebagai berikut :
(MLE). Fungsi kemungkinan dari regresi H0 : α = 1
Poisson adalah (Yesilova et al. 2010a): H1 : α > 1
n
Hipotesis nol ditolak jika D > χ2(n-p;α) (Halekoh
L(β) = ∏P( y | β) i
et al. 2007) dengan n adalah jumlah amatan
i =1 dan p adalah jumlah parameter.

(∑ [ exp(xiβ)]) ∏ [ exp(xiβ)] { }
n yi
n
exp - i =1 i =1
Regresi Binomial Negatif
= Regresi Binomial Negatif merupakan salah
n
∏ i =1
yi ! satu cara untuk mengatasi masalah
overdispersi pada data cacah yang didasarkan
dan logaritma natural dari fungsi
pada model campuran Poisson-Gamma
kemungkinannya sebagai berikut:

ln L(β ) = ∑ { yi x i β - exp( x i β ) - ln ( yi !)}


n
(Hardin & Hilbe 2007). Fungsi peluang
Binomial Negatif adalah sebagai berikut :
-1
i =1
P ( y | µ,α ) =
(
Γ y +α )  αµ  y  1 α
−1

   
y ! Γ (α )  1 + αµ   1 + αµ 
−1

Overdispersi
Dalam model regresi Poisson terdapat dengan y merupakan nilai dari data cacah,µ
asumsi yang harus dipenuhi. Asumsi tersebut adalah nilai harapan y, dan α merupakan
parameter dispersi, α>0 (Yesilova et al.

adalah nilai rata-rata dari peubah respon harus
bernilai sama dengan ragam peubah respon, 2010b). Jika α 0, maka distribusi ini
yang disebut juga ekuidispersi. Namun, dalam mendekati sebaran Poisson(µ). Sebaran
analisis data cacah sering dijumpai data Binomial Negatif memiliki nilai tengah
dengan ragam peubah respon bernilai lebih 
 dan ragam 

  ଶ (Ismail
besar dari rata-rata peubah respon, biasa & Jemain 2007).
disebut dengan overdispersi. Fenomena
3

lnL(β,γ)=∑ I(yi =0)ln exp ( gi γ ) +exp -exp ( xiβ ) +


Peubah respon didefinisikan sebagai n

peubah acak berdistribusi Binomial Negatif i=1


( ( ))
∑(1-I ( y =0) ) ( y xiβ-exp ( xiβ) ) -
dengan fungsi penghubung log. Model regresi n
yang akan dibentuk, yaitu : i i

ln(µ i )=x i β
i=1

∑ ln (1+exp ( gi γ ) )
n

=β 0 +β1 x i1 +β 2 x i2 +...+β k x ik i=1

Parameter regresi Binomial Negatif (β) diduga dengan I(yi=0) bernilai 1 jikayi=0 danbernilai
menggunakan penduga kemungkinan 0 jikayiselainnya.
maksimum. Pendugaankemungkinanmaksimumuntukβdan
γdiperolehdenganmenggunakanalgoritmaExpe
Regresi Zero-Inflated Poisson (ZIP) ctation-Maximization (EM) (Cameron
Model Regresi ZIP merupakan model &Trivedi 1998).
campuran untuk data cacahdengan banyak
nilai nol pada peubah respon. Model ini Evaluasi Penduga Parameter dan Penduga
merupakan kombinasi dari sebaran Poisson Galat Baku Relatif
dengan sebaran kejadian yang bernilai nol Menurut Savic (2009) akurasi nilai
(Cameron & Trivedi 1998). Berikut fungsi penduga parameter dapat dilihat dari nilai bias
sebaran dari ZIP:
 ω + (1 - ω ) exp(- µ ); y = 0
relatif (BR) dan Root Mean Square Error

Pr(Y = y ) = 
(RMSE). Persamaan dari nilai bias relatif

(1 - ω ) exp ( - µ ) µ / y !; y > 0  βɵi -β 


y
adalah:

∑ x100%
r
1
dengan Y~ZIP(µ,ω). µ adalah parameter dari
i=1  β 
BR=
sebaran Poisson, sedangkan ω adalah peluang r
dari kejadian bernilai nol (Ridout et al. 1998). Menurut Muzathik (2011) jika nilai bias relatif
Kemudian dari fungsi sebaran tersebut terletak dalam selang -10% sampai 10% maka
didapatkan E(Y) dan var(Y) sebagai berikut: penduga parameter tersebut dapat diterima.
E(Y)=(1-ω)µ
 ω  ( E (Y ))2
Sedangkan nilai RMSE dapat diketahui dari
var(Y ) = E (Y ) +  
persamaan:
 1- ω 
∑ ( βɵ -β )
r
1 2

Berdasarkan nilai di atas regresi ZIP tidak RMSE= i


r i=1
mengasumsikan nilai var(Y)=E(Y) karena nilai
dari var(Y) ZIP lebih besar dari E(Y) sehingga dengan:
ZIP bisa digunakan untuk mengatasi masalah r = banyaknya data dugaan
overdispersi. ୧ = penduga ke-i parameter
Model penghubung yang digunakan untuk = parameter yang sebenarnya.
µ dan ω adalah Semakin kecil nilai bias relatif dan nilai
 ω  = Gγ
ln( µ ) = X β dan ln  
RMSE maka model dikatakan semakin baik.

 1- ω 
Sedangkan jika ingin mengetahui nilai
penduga galat baku relatif dapat dicari dengan
X dan G adalah matriks peubah penjelas membagi antara galat baku penduga dengan
(Yesilova et al. 2010b). Sedangkanβ dan γ penduga parameter. Kemudian untuk
adalah vektor-vektor parameter model mengetahui nilai galat baku relatif sebenarnya
berukuran (p+1)x1 dan (q+1)x1 yang akan dapat menggunakan persamaan (Savic 2009):

1 r  βɵ i -β 
diduga nilainya. Peubah penjelas yang

∑ 
2

digunakan dalam model log dapat bernilai


sd (βɵ )=
r i=1  β 
*
sama atau berbeda dengan peubah penjelas
yang digunakan dalam model logit. Jika
peubah penjelas yang digunakan dalam model
log dan model logit sama maka fungsi
penghubungnya menjadi ln( µ ) = X β dan METODOLOGI

 ω  = τ Xβ (Ridout et al. 1998).


ln  
 1- ω 
Data
Data yang digunakan adalah data hasil
Fungsi log-likelihood untuk model ZIP simulasi dengan parameter yang telah
dapat ditulis sebagai: ditentukan. Data yang dibangkitkan digunakan
untuk mendapatkan penduga parameter dari
4

regresi Poisson, regresi Binomial Negatif, dan a. Pada data yang tidak mengalami
regresi ZIP. Data yang dibangkitkan adalah overdispersi, data respon didapat
data dengan banyak jumlah amatan bernilai dengan cara membangkitkan n buah
nol (excess zero) pada peubah respon dengan data peubah respon yang menyebar
kondisi overdispersi dan tidak overdispersi. Poisson (µi).
Pada data overdispersi, persentase jumlah b. Pada data yangmengalami
amatan pada peubah respon yang bernilai nol overdispersi, data respon didapat
ditentukan sebesar 40%, 60%, dan 80%. dengan cara:
Besaran parameter dan peubah yang 1) Menghitung parameter γ0=τβ0,
ditentukan untuk membuat model γ1= τβ1,dan γ2= τβ2
ln(µ)=β0+β1X1i+β2X2i, adalah: 2) Menghitung nilai ωi pada
1. Parameter koefisien regresi: masing-masing amatan dengan
a. Untuk data tanpa overdispersi: cara:
β0=1.5, β1=-ln(2), β2=ln(3) exp ( γ 0 +γ1 x 1i +γ 2 x 2i )
b. Untuk data dengan overdispersi: ωi =
β0=1, β1=0.4, β2=0.6, dan τ yang 1+exp ( γ 0 +γ1 x 1i +γ 2 x 2i )
berbeda-beda untuk setiap persentase 3) Membangkitkan variabel c
amatan pada peubah respon yang dengan cara membangkitkan n
bernilai nol. Untuk 40% τ ditetapkan buah data yang menyebar
sebesar -0.15, untuk 60% τ=0.175, dan Seragam (0,1).
untuk 80% τ=0.5 4) Membangkitkan variabel Yp
2. Peubah bebas: dengan cara membangkitkan
a. Untuk data tanpa overdispersi: bilangan acak yang menyebar
peubah X1 adalah peubah acak yang Poisson (µi).
menyebar Normal (5,2) dan peubah X2 5) Membandingkan variabel c pada
adalah peubah acak yang menyebar tiap amatan dengan nilai ωi.
Seragam (1,2). X1 dan X2 diasumsikan Apabila ci>ωi maka Yi=Yp,
sebagai peubah tetap. sedangkan apabila ci≤ωimaka
b. Untuk data dengan overdispersi: Yi=0.
Peubah X1 adalah peubah acak yang 4. Mencatat nilai peubah respon dan semua
menyebar Normal (3,1), sedangkan X2 peubah penjelas.
adalah peubah acak yang menyebar 5. Menghitung jumlah data respon yang
Seragam (0,2). X1 dan X2 diasumsikan bernilai nol.
sebagai peubah tetap. 6. Melakukan pendugaan parameter
3. Peubah respon: menggunakan regresi Poisson, regresi
Peubah respon Yi merupakan data yang Binomial Negatif, dan regresi ZIP.
akan dibangkitkan. Dalam simulasi ini 7. Mencatat nilai deviance yang dihasilkan
peubah respon yang dibangkitkan adalah dari regresi Poisson dan menghitung nilai-
a. Peubah respon dengan banyak jumlah p yang digunakan untuk melakukan uji
amatan bernilai nol pada kondisi tanpa formal overdispersi.
overdispersi (α=0). 8. Mencatat nilai pendugaan parameter dari
b. Peubah respon dengan banyak jumlah masing-masing metode regresi.
amatan bernilai nol pada kondisi 9. Mencatat penduga galat baku dari masing-
overdispersi. masing penduga parameter untuk ketiga
4. Respon yang diamati dalam penelitian metode regresi.
sebanyak n=60, 100, dan 200. Untuk 10. Menghitung nilai bias relatif, nilai mutlak
memperoleh hasil pendugaan yang bias relatif mutlak (ARB/Absolute
mewakili populasi maka pembangkitan Relative Bias), dan Mean Square Error
data diulang sebanyak r=1000 kali. (MSE) dari masing-masing penduga
parameter.
Metode Simulasi 11. Mengulangi langkah 1-10 1000 kali
1. Membangkitkan n buah data peubah 12. Menghitung rata-rata nilai-p dan rata-
penjelasX1 dan peubah bebas X2. rataamatanyang bernilai nol pada peubah
2. Menghitung nilai µ pada masing-masing respon.
amatan dengan cara µi=exp(β0+β1x1i+ 13. Membuat diagram kotak garis dari nilai-
β2x2i). nilai bias relatif masing-masing penduga
3. Membangkitkan peubah respon: parameter dari regresi Poisson, regresi
Binomial Negatif,dan regresi ZIP.
5

14. Menghitung rata-rata dari 1000 nilai bias besar dibandingkan yang lain tetapi
relatif mutlak dan MSE dari masing- perbedaannya tidak signifikan. Dari hasil nilai
masing penduga parameter untuk ketiga mutlak bias relatif dan MSE yang dihasilkan
metode. dapat dikatakan bahwa regresi Poisson, regresi
15. Menghitung rata-rata dari penduga galat Binomial Negatif, dan regresi ZIP sama
baku masing-masing penduga parameter baiknya dalam pendugaan parameter untuk
untuk ketiga metode data yang tidak mengalami overdispersi.
16. Menghitung galat baku sebenarnya dari Namun, regresi Poisson dan regresi Binomial
penduga parameter pada ketiga metode Negatif lebih efektif digunakan dalam
regresi, dengan rumus: pendugaan parameter karena pada regresi ZIP
selain menduga parameter β (model log) juga

1000
1
( βɵ -β )
2
sd*(βɵ )= i
dilakukan pendugaan terhadap parameter γ
n i=1 (model logit).
17. Melihat nilai mutlak bias relatif dan MSE
dari penduga parameter serta nilai galat Tabel 1 Rata-rata nilai-p dan jumlah amatan
baku duga dan sebenarnya dari bernilai nol pada peubah respon dari
setiappenduga parameter untuk ketiga setiap set data
metode. Ditetapkan Hasil simulasi
Diagram alir dari metode simulasi dapat n
Parameter Jumlah Jumlah
Nilai-p Keterangan
dilihat pada Lampiran 1. dispersi nol nol

α=0 - 46.22% 0.583 Ekuidispersi


HASIL DAN PEMBAHASAN
α>0 40% 39.67% 0 Overdispersi
60
Mendeteksi Overdispersi α>0 60% 62.07% 0 Overdispersi

Adanya overdispersi pada data hasil α>0 80% 79.44% 0 Overdispersi


simulasi dapat dideteksi dengan menggunakan
α=0 - 46.47% 0.632 Ekuidispersi
nilai deviance atau nilai-p yang terbentuk.
Pendeteksian overdispersi untuk data hasil α>0 40% 39.72% 0 Overdispersi
100
simulasi dapat dilihat pada Tabel 1. Pada data α>0 60% 61.89% 0 Overdispersi
cacah yang tidak mengandung overdispersi α>0 80% 79.80% 0 Overdispersi
(α=0), pengujian rasio dispersi menghasilkan
nilai peluang yang lebih besar dari taraf nyata α=0 - 46.39% 0.693 Ekuidispersi

yang ditentukan, yaitu sebesar 5%, artinya α>0 40% 39.74% 0 Overdispersi
data cacah hasil simulasi tersebut terbukti 200
α>0 60% 62.00% 0 Overdispersi
tidak mengandung overdispersi. Sedangkan
α>0 80% 79.96% 0 Overdispersi
pada data cacah yang mengandung
overdispersi (α>0), uji formal untuk rasio
dispersi memiliki nilai pelung yang lebih kecil Sebaran nilai bias relatif dari masing-
dari taraf nyata yang ditentukan, artinya data masing penduga parameter untuk semua data
cacah yang dibangkitkan terbukti mengalami disajikan dalam diagram kotak garis pada
overdispersi. Lampiran 2. Berdasarkan diagram kotak garis
tersebut dapat dilihat bahwa nilai tengah dari
Data Tidak Overdispersi bias relatif untuk semua parameter dari seluruh
Data cacah yang tidak mengalami data yang tidak mengalami overdispersi
overdispersi dianalisis menggunakan regresi mendekati nol.
Poisson, regresi Binomial Negatif, dan regresi Pada penelitian ini juga dilakukan
ZIP. Ketiga metode ini menghasilkan penduga pendugaan terhadap galat baku dari penduga
parameter yang mendekati nilai parameter parameter regresi. Ketiga metode regresi ini
sebenarnya. Semakin besar ukuran contoh menghasilkan penduga galat baku yang
maka nilai penduga parameter yang dihasilkan mendekati nilai galat baku sebenarnya dari
akan semakin dekat dengan parameter yang setiap penduga parameter regresi. Nilai
sebenarnya.Tabel 2 memperlihatkan bahwa penduga galat baku dari penduga parameter
nilai mutlak bias relatifdan MSE dari ketiga dan galat baku sebenarnya dapat dilihat pada
metode pada setiap parameter bernilai kecil. Tabel 3. Pada Tabel 3 dapat dilihat bahwa
Selain itu, nilai mutlak bias relatifdan MSE penduga galat baku dari ketiga metode regresi
antar metode menghasilkan nilai yang hampir menghasilkan nilai yang hampir sama dengan
sama. Nilai mutlak bias relatif dan MSE pada nilai galat baku sebenarnya dari penduga
regresi ZIP memiliki nilai yang sedikit lebih parameter. Pada regresi ZIP menghasilkan
6

Tabel 2 Nilai mutlak bias relatif (ARB) dan MSE dari setiap penduga parameter regresi pada data
yang tidak overdispersi
Poisson Binomial Negatif ZIP
n Parameter
ARB(%) MSE ARB(%) MSE ARB(%) MSE
b0 34.664 0.437 34.888 0.443 35.590 0.473
60 b1 6.832 0.004 6.929 0.004 8.508 0.006
b2 28.730 0.160 28.943 0.162 30.612 0.180
b0 24.440 0.216 24.538 0.218 25.096 0.236
100 b1 4.897 0.002 4.931 0.002 5.719 0.003
b2 20.224 0.079 20.224 0.079 21.002 0.088
b0 17.160 0.104 17.303 0.106 17.662 0.111
200 b1 3.262 0.001 3.290 0.001 3.728 0.001
b2 14.284 0.040 14.462 0.040 14.955 0.043

selisih antara penduga galat baku dengan galat regresi Binomial Negatif, dan regresi ZIP
baku sebenarnya yang sedikit lebih besar dalam berbagai kondisi jumlah amatan yang
dibandingkan regresi Poisson dan regresi bernilai nol pada peubah respon. Penelitian ini
Binomial Negatif tetapi selisih atau perbedaan ingin melihat seberapa besar penyimpangan
tersebut tidak terlalu signifikan. yang terjadi pada data cacah yang mengalami
Plot sisaan dengan nilai Y overdispersi dengan banyak jumlah amatan
6 Keterangan
yang bernilai nol pada peubah respon jika
Poisson
Binomial Negatif
dianalisis menggunakan regresi Poisson dan
4 ZIP regresi Binomial Negatif.
Pada data yang mengalami overdispersi
2 dengan persentase jumlah amatan yang
Sisaan

bernilai nol pada peubah respon sebesar 40%,


0 60%, dan 80%, regresi Poisson dan regresi
Binomial Negatif tidak tepat digunakan dalam
-2
pendugaan parameter karena penduga
-4
parameter regresi yang dihasilkan sangat jauh
0 2 4 6 8 10 12 dari nilai parameter sebenarnya. Nilai
Y
mutlakbias relatif dan MSE yang dihasilkan
Gambar 3 Plot antara sisaan dengan nilai Y untuk persentase jumlah amatan yang bernilai
dari ketiga model pada data tidak nol pada peubah respon sebesar 60% dapat
overdispersi dilihat pada Tabel 4 dan selengkapnya terdapat
pada Lampiran 3. Semakin besar
Contoh plot sisaan dari ketiga model ukuranpersentase jumlah amatan yang bernilai
regresi dengan setiap nilai Y atau setiap nol pada peubah respon maka nilai mutlak bias
amatan pada salah satu set data (n=100) dapat relatif dan MSE yang dihasilkan akan semakin
dilihat pada Gambar 3. Plot ini besar. Semakinbesar ukuran contoh maka nilai
memperlihatkan bahwa residual yang mutlak bias relatif dan MSE dari masing-
terbentuk menghasilkan nilai yang hampir masing penduga parameter akan semakin
sama untuk model regresi Poisson, regresi kecil. Pada keseluruhan data yang
Binomial Negatif, dan regresi ZIP. Hal ini dibangkitkan, nilai mutlak bias relatif dan
menunjukkan ketiga model memberikan hasil MSE yang dihasilkan oleh regresi Poisson dan
penduga parameter yang sama baiknya. regresi Binomial Negatif jauh lebih besar
daripada yang dihasilkan oleh regresi ZIP.
Data Overdispersi Bahkan untukpersentase jumlah amatan
Data cacah yang mengalami overdispersi dengan peubah respon yang bernilai nol
dibangkitkan dengan berbagai persentase sebesar 80% padajumlah amatan (n) sebesar
jumlah amatan yang bernilai nol pada peubah 60 dan 100 regresi Binomial Negatif tidak bisa
responnya. Hal ini dilakukan untuk menghasilkan iterasi yang konvergen yang
mengetahui penduga parameter yang menyebabkan tidak ada penduga parameter
dihasilkan menggunakan regresi Poisson, yang dihasilkan. Dari nilai mutlak bias relatif
7

Tabel 3 Galat baku dugaan dan galat baku sebenarnyadari penduga parameter regresi pada data
yang tidak overdispersi
Poisson Binomial Negatif ZIP
n Parameter
Dugaan Sebenarnya Dugaan Sebenarnya Dugaan Sebenarnya
b0 0.614 0.661 0.629 0.665 0.635 0.688
60 b1 0.061 0.061 0.063 0.062 0.067 0.076
b2 0.373 0.399 0.383 0.402 0.388 0.425
b0 0.455 0.465 0.464 0.466 0.469 0.486
100 b1 0.043 0.044 0.044 0.044 0.046 0.052
b2 0.277 0.280 0.283 0.281 0.287 0.297
b0 0.308 0.323 0.314 0.325 0.317 0.334
200 b1 0.028 0.029 0.029 0.029 0.030 0.033
b2 0.188 0.199 0.191 0.200 0.194 0.208

dan MSE yang dihasilkan menunjukkan regresi yang dihasilkan. Pada data yang tidak
bahwa penduga parameter yang dihasilkan mengalami overdispersi, nilai galat baku dari
oleh regresi Binomial Negatif dan regresi koefisien regresi Poisson mendekati nilai
Poisson tidak sesuai dengan parameter galat baku sebenarnya. Namun pada data yang
sebenarnya atau parameter yang ditetapkan. mengalami overdispersi,nilai galat baku dari
Pada Tabel 4 dan Lampiran 4 nilai mutlak bias penduga parameter regresi Poisson menjadi
relatif dan MSE dari regresi ZIP memiliki nilai lebih kecil dari nilai galat baku sebenarnya
yang kecil untuk keseluruhan data yang telah (underestimate). Kondisi ini juga terjadi pada
dibangkitkan dengan kriteria yang ditentukan. penduga dari galat baku penduga parameter
Hal ini menunjukkan bahwa regresi ZIP baik yang dihasilkan oleh regresi Binomial Negatif.
digunakan dalam pendugaan parameter untuk Nilai penduga galat baku dari penduga
data yang mengalami overdispersi dengan parameter dan nilai galat baku sebenarnya dari
seluruh jenis persentase jumlah amatan penduga parameter regresi ketiga model untuk
bernilai nol pada peubah respon yang telah persentase jumlah amatan dengan peubah
ditetapkan. respon yang bernilai nol sebesar 60% dapat
Sebaran nilai bias relatif dari masing- dilihat pada Tabel 5 dan selengkapnya terdapat
masing penduga parameter untuk semua data pada Lampiran 5. Pada Tabel 5 dan Lampiran
yang mengalami overdispersi dengan berbagai 5 juga dapat dilihat bahwa regresi ZIP
persentase jumlah amatan yang bernilai nol menghasilkan penduga galat baku yang
pada peubah respon disajikan dalam diagram mendekati nilai galat baku sebenarnya dari
kotak garis pada Lampiran 3. Berdasarkan setiap penduga parameter regresi. Dari
diagram kotak garis tersebut dapat dilihat penduga parameter dan penduga galat baku
bahwa nilai tengah dari bias relatif untuk yang dihasilkan menunjukkan bahwa regresi
semua parameter regresi ZIP sangat dekat ZIP mampu mengatasi overdispersi pada
dengan nol. Hal ini menunjukkan parameter- regresi Poisson dengan data yang memiliki
parameter yang dihasilkan oleh regresi ZIP banyak jumlah amatan yang bernilai nol pada
tidak berbias. peubah respon.
Pengaruh overdispersi pada regresi Poisson
terlihat jelaspada penduga galat baku koefisien

Tabel 4 Nilai mutlak bias relatif (ARB) dan MSE pada persentase jumlah amatan dengan peubah
respon yang bernilai nol sebesar 60%
Persentase Poisson Binomial Negatif ZIP
Jumlah
respon bernilai Parameter
amatan ARB (%) MSE ARB (%) MSE ARB (%) MSE
nol
b0 88.379 1.180 86.033 1.100 18.207 0.053
60% 60 b1 45.247 0.052 44.427 0.050 11.243 0.003
b2 47.146 0.131 46.984 0.130 13.014 0.010
8

Persentase Poisson Binomial Negatif ZIP


Jumlah
respon bernilai Parameter
amatan ARB (%) MSE ARB (%) MSE ARB (%) MSE
nol

b0 84.191 1.041 83.560 1.016 13.037 0.027


100 b1 37.143 0.034 36.747 0.033 8.162 0.002
b2 37.518 0.079 37.322 0.078 9.560 0.005
60%
b0 78.369 0.787 78.306 0.784 9.231 0.013
200 b1 24.863 0.016 24.816 0.016 5.587 0.001
b2 27.510 0.043 27.511 0.043 6.795 0.003

Plot sisaan dengan nilai Y


dari model regresi ZIP berada sekitar nilai nol.
50 Keterangan
Hal ini menunjukkan bahwa pada data
40
Poisson overdispersi dengan banyak jumlah amatan
Binomial Negatif
ZIP yang bernilai nol pada peubah respon, regresi
30
ZIP akan menghasilkan pendugaan model
20
na yang lebih baik.
sai 10
S
0

-10 KESIMPULAN DAN SARAN


-20
Kesimpulan
-30
0 20 40 60 80 100 Parameter dugaan yang dihasilkan oleh
Y
regresi ZIP memberikan hasil yang lebih baik
Gambar 4 Plot antara sisaan dengan nilai Y dibandingkan regresi Poisson dan regresi
dari ketiga model pada data Binomial Negatif pada data yang mengandung
overdispersi overdispersi dengan banyak jumlah amatan
yang bernilai nol pada peubah respon.
Plot sisaan dari ketiga model regresi Penerapan regresi ZIP pada data yang
dengan setiap nilai Y atau setiap amatan pada mengalami overdispersi dengan banyak
salah satu set data yang mengalami jumlah amatan yang bernilai nol pada peubah
overdispersi yaitu n=100 dengan persentase respon menghasilkan penduga galat baku yang
jumlah amatan yang bernilai nol pada peubah hampir sama dengan nilai galat baku
respon sebesar 60 % dapat dilihat pada sebenarnya dari masing-masing penduga
Gambar 4. Plot ini memperlihatkan bahwa parameter. Pada data yang mengandung
residual yang terbentuk dari model regresi ZIP overdispersidengan banyak jumlah amatan
menghasilkan nilai yang lebih baik dari model yang bernilai nol pada peubah respon,
regresi Poisson dan regresi Binomial Negatif
karena sebagian besar sisaan yang dihasilkan

Tabel 5 Galat baku dugaan dan galat baku sebenarnya penduga parameter pada persentase jumlah
amatan dengan peubah respon yang bernilai nol sebesar 60%
Persentase Poisson Binomial Negatif ZIP
Jumlah
respon Parameter
amatan Dugaan Sebenarnya Dugaan Sebenarnya Dugaan Sebenarnya
bernilai nol

b0 0.210 1.086 0.241 1.049 0.225 0.231


60 b1 0.052 0.228 0.061 0.224 0.056 0.057
b2 0.093 0.362 0.109 0.360 0.097 0.100

b0 0.159 1.020 0.165 1.008 0.166 0.166


60% 100 b1 0.039 0.185 0.041 0.183 0.041 0.041
b2 0.070 0.281 0.073 0.279 0.071 0.073

b0 0.111 0.887 0.112 0.886 0.113 0.116


200 b1 0.027 0.125 0.027 0.125 0.028 0.028
b2 0.048 0.208 0.049 0.208 0.049 0.051
9

regresi ZIP dapat memberikan uji signifikansi McCullagh P, Nelder JA. 1989. Generalized
peubah bebas yang lebih berarti dibandingkan Linear Models. London: Chapman &
regresi Poisson dan regresi Binomial Negatif. Hall.
Padadata yang tidak mengalami overdispersi, Muzathik MA, Nik WBW, Samo KB, Sopian
regresi Poisson, regresi Binomial Negatif, dan K, Alghoul MA. 2011. Daily Global
regresi ZIP memberikan hasil yang sama Solar Radiation Estimate Based on
baiknya dalam penduga parameter dan Sunshine Hours.International Journal of
penduga galat baku. Mechanical and Materials Engineering
Semakin besar ukuran contoh atau jumlah (IJMME), Vol.6 (2011), No.1, 75-80
amatan maka nilai mutlak bias relatif dan Ridout M, Demetrio CGB, Hinde JP. 1998.
MSE dari masing-masing parameter akan Models for Counts Data with Many
semakin kecil. Sedangkan semakin besar Zeros. Proceedings of XIXth
persentase jumlah amatan yang bernilai nol International Biometric Conference,
pada peubah respon maka nilai mutlak bias Cape Town, Invited Papers, pp. 179-192.
relatif dan MSE dari masing-masing parameter Savic R. 2009. Performance in Population
untuk tiap metode akan semakin besar. Models for Count Data, Part II: A New
SAEM algorithm. Paris: Universite Paris-
Saran Diderot-Paris VII.
Hal yang perlu diberikan perhatian dalam Yesilova A, Kaya Y, Kaki B, Kasap I. 2010.
penelitian ini adalah penentuan parameter, Analysis of Plant Protection Studies with
persentase jumlah amatan yang bernilai nol Excess Zeros Using Zero-Inflated and
pada peubah, dan ukuran contoh. Tentunya Negative Binomial Hurdle Models.
akan lebih menarik jika parameter, persentase Turkey: Gazi University Journal of
jumlah amatan yang bernilai nol pada peubah Science.
respon, jenis peubah bebas, dan ukuran contoh Yesilova A, Kaydan MB, Kaya Y. 2010.
yang ditetapkan lebih bervariasi agar lebih Modelling Insect-Egg Data with Excess
dapat mewakili populasi sehingga akan Zeros Using Zero-Inflated Regression
diperoleh kesimpulan yang lebih mewakili Models. Turkey: Faculty of Science,
kondisi yang sebenarnya di lapangan. Hacettepe University.

DAFTAR PUSTAKA

Cameron AC, Trivedi PK. 1998. Regression


Analysis of Count Data. Cambridge:
Cambridge University Press.
Halekoh U, Hojsgaard S. 2007.
Overdispersion. Denmark: Unit of
Statistics and Decision Analysis, The
Faculty of Agricultural Sciences,
University of Aarhus.
Hardin JW, Hilbe JM. 2007. Generalized
Linear Models and Extensions. Texas: A
Stata Press Publication.
Ismail N, Jemain AA. 2007. Handling
Overdispersion with Negative Binomial
and Generalized Poisson Regression
Models. Virginia: Casualty Actuarial
Society Forum.
Jackman S. 2007. Models for Counts Political
Science. [terhubung berkala].
http://jackman.stanford.edu/classes/350C/
Poisson.pdf [4 Mei 2012].
Long JS. 1997. Regression Models for
Categorical and Limited Dependent
Variables. Number 7 in Advance
Quantitive Techniques in The Social
Sciences. California: Sage Publications.
LAMPIRAN
11

Lampiran 1 Diagram alir metode simulasi

Non-overdispersi Menentukan jumlah amatan (n) Overdispersi


n=60, 100, dan 200

Membangkitkan X1i dan X2i Membangkitkan X1i dan X2i


X1i ~ Normal (5,2); X1i ~ Normal (3,1);
X2i ~ Seragam (1,2) X2i ~ Seragam (0,2)

Menghitung nilai µ i Menghitung nilai µ i


µ i=exp(β0+β1X1i+β2X2i) µ i=exp(β0+β1X1i+β2X2i)
β0=1.5; β1=-ln(2); β2=ln(3) β0=1; β1=0.4; β2=0.6

Menentukan persentase
Yi~Poisson (µ i) amatan yang bernilai nol
(40%, 60%, dan 80%)

Menghitung parameter
γ0=τβ0, γ1=τβ1, dan γ2=τβ2
τ40%=-0.15; τ60%=0.175; τ80%=0.5

Menghitung nilai
     

        
    

    

Membangkitkan variabel ci ~ Seragam(0,1)

Ya
Yi=0  <ci

Tidak

Yi~Poisson (µ i)

Regresi Poisson Regresi Binomial Negatif Regresi ZIP

Penduga parameter (Nilai Penduga parameter (Nilai


Nilai deviasi bias relatif, nilai mutlak bias relatif, nilai mutlak
bias relatif, dan MSE) bias relatif, dan MSE)

Nilai-p
Galat Baku Galat Baku
12

Lampiran 2 Diagram kotak garis nilai bias relatif penduga parameter (bukan dalam satuan
persen) untuk data yang tidakoverdispersi

Untuk n=60

Untuk n=100

Untuk n=200
13

Lampiran 3 Diagram kotak garis nilai bias relatif penduga parameter (bukan dalam satuan
persen) untuk data yang mengalami overdispersi

Untuk n=60 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 40%

Untuk n=100 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 40%

Untuk n=200 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 40%
14

Untuk n=60 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 60%

Untuk n=100 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 60%

Untuk n=200 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 60%
15

Untuk n=60 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 80%

Untuk n=100 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 80%

Untuk n=200 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 80%
16

Lampiran 4 Nilai mutlak bias relatif (ARB) dan MSE pada setiap persentase jumlah amatan
dengan peubah respon yang bernilai nol

Persentase Poisson Binomial Negatif ZIP


Jumlah
respon Parameter
amatan ARB (%) MSE ARB (%) MSE ARB (%) MSE
bernilai nol
60 b0 70.491 0.689 70.279 0.684 13.515 0.028
b1 27.751 0.019 27.625 0.019 8.020 0.002
b2 30.255 0.050 30.189 0.050 9.426 0.005
100 b0 63.765 0.528 63.627 0.525 10.275 0.017
40% b1 20.613 0.011 20.543 0.011 6.193 0.001
b2 23.272 0.031 23.261 0.031 7.581 0.003
200 b0 63.024 0.473 63.024 0.473 6.995 0.008
b1 15.894 0.006 15.894 0.006 4.267 0.000
b2 16.463 0.015 16.462 0.015 4.995 0.001
60 b0 88.379 1.180 86.033 1.100 18.207 0.053
b1 45.247 0.052 44.427 0.050 11.243 0.003
b2 47.146 0.131 46.984 0.130 13.014 0.010
100 b0 84.191 1.041 83.560 1.016 13.037 0.027
60% b1 37.143 0.034 36.747 0.033 8.162 0.002
b2 37.518 0.079 37.322 0.078 9.560 0.005
200 b0 78.369 0.787 78.306 0.784 9.231 0.013
b1 24.863 0.016 24.816 0.016 5.587 0.001
b2 27.510 0.043 27.511 0.043 6.795 0.003
60 b0 117.954 2.238 Tidak konvergen 27.379 0.147
b1 79.417 0.160 Tidak konvergen 18.839 0.012
b2 86.377 0.450 Tidak konvergen 20.193 0.029
100 b0 98.624 1.528 Tidak konvergen 19.141 0.060
80% b1 65.743 0.106 Tidak konvergen 12.230 0.004
b2 70.267 0.292 Tidak konvergen 13.751 0.012
200 b0 95.441 1.245 95.298 1.240 12.833 0.026
b1 50.279 0.060 50.261 0.061 8.485 0.002
b2 52.455 0.150 52.499 0.151 9.267 0.005
17

Lampiran 5 Galat baku dugaan dan galat baku sebenarnya dari penduga parameter pada setiap
persentase jumlah amatan dengan peubah respon yang bernilai nol

Persentase Poisson Binomial Negatif ZIP


Jumlah
respon Parameter
amatan Dugaan Sebenarnya Dugaan Sebenarnya Dugaan Sebenarnya
bernilai nol
60 b0 0.166 0.830 0.168 0.827 0.169 0.169
b1 0.040 0.139 0.041 0.138 0.041 0.041
b2 0.071 0.224 0.072 0.224 0.072 0.072
100 b0 0.126 0.727 0.127 0.725 0.128 0.131
40% b1 0.030 0.104 0.031 0.103 0.031 0.031
b2 0.054 0.175 0.055 0.175 0.055 0.057
200 b0 0.088 0.688 0.088 0.688 0.089 0.088
b1 0.021 0.078 0.021 0.078 0.021 0.021
b2 0.038 0.123 0.038 0.123 0.038 0.037
60 b0 0.210 1.086 0.241 1.049 0.225 0.231
b1 0.052 0.228 0.061 0.224 0.056 0.057
b2 0.093 0.362 0.109 0.360 0.097 0.100
100 b0 0.159 1.020 0.165 1.008 0.166 0.166
60% b1 0.039 0.185 0.041 0.183 0.041 0.041
b2 0.070 0.281 0.073 0.279 0.071 0.073
200 b0 0.111 0.887 0.112 0.886 0.113 0.116
b1 0.027 0.125 0.027 0.125 0.028 0.028
b2 0.048 0.208 0.049 0.208 0.049 0.051
60 b0 0.291 1.496 Tidak konvergen 0.348 0.383
b1 0.076 0.400 Tidak konvergen 0.095 0.108
b2 0.134 0.671 Tidak konvergen 0.155 0.170
100 b0 0.221 1.236 Tidak konvergen 0.244 0.245
80% b1 0.057 0.326 Tidak konvergen 0.064 0.064
b2 0.101 0.541 Tidak konvergen 0.107 0.108
200 b0 0.153 1.116 0.157 1.113 0.163 0.162
b1 0.039 0.246 0.040 0.247 0.042 0.044
b2 0.069 0.387 0.071 0.388 0.072 0.070