AJI SETYAWAN
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2012
ABSTRAK
AJI SETYAWAN. Perbandingan antara Regresi Poisson, Binomial Negatif, dan Zero-Inflated
Poisson pada Data Overdispersi. Dibimbing oleh KUSMAN SADIK dan INDAHWATI.
Regresi Poisson digunakan untuk mengkaji hubungan antara peubah penjelas dengan peubah
respon yang berupa data cacah. Regresi Poisson mengasumsikan nilai tengah dan ragam dari
peubah respon mempunyai nilai yang sama. Akan tetapi, dalam penerapannya sering terjadi
kondisi overdispersi. Overdispersi adalah kondisi pada saat ragam dari peubah respon lebih besar
dari nilai tengah peubah respon. Overdispersi dapat terjadi karena banyaknyajumlah pengamatan
yang bernilai nol pada peubah respon.Salah satu penanganan overdispersi pada regresi Poisson
adalah menggunakan Regresi Binomial Negatif. Sedangkan penanganan overdispersi yang
disebabkan oleh banyaknya jumlah amatan dengan peubah respon yang bernilai nol dapat
menggunakan regresi Zero-Inflated Poisson (ZIP).Kajian simulasi dilakukan untuk
membandingkan kinerja metode regresi Poisson, regresi Binomial Negatif, dan regresi ZIP yang
dicobakan pada data yang tidak overdispersi dan data overdispersi. Pada data overdispersi diatur
berbagai persentase jumlah amatan dengan peubah respon yang bernilai nol pada tiap jumlah
amatan. Ketiga metode memberikan hasil yang sama baiknya pada data yang tidak mengalami
overdispersi baik dari penduga parameter, penduga galat baku, dan sisaan. Overdispersi pada
regresi Poisson akan menghasilkan galat baku yang lebih kecil dari nilai sesungguhnya
(underestimate). Semakin besar jumlah amatan maka penduga parameter yang dihasilkan akan
semakin mendekati parameter yang sebenarnya. Semakin besar persentase jumlah amatan yang
bernilai nol pada peubah respon maka parameter yang dihasilkan akan semakin jauh dari
parameter yang sebenarnya. Penerapan regresi ZIP pada data dengan banyak jumlah amatan yang
bernilai nol pada peubah respon menghasilkan penduga parameter dan penduga galat baku dari
penduga parameter yang sangat dekat dengan nilai sebenarnya daripada penduga parameter dan
penduga galat baku yang dihasilkan oleh regresi Poisson dan regresi Binomial Negatif.
Oleh :
AJI SETYAWAN
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Statistika pada
Departemen Statistika
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2012
Judul : Perbandingan antara Regresi Poisson, Binomial Negatif, dan Zero-Inflated Poisson
pada Data Overdispersi
Nama : Aji Setyawan
NRP : G14080021
Disetujui
Pembimbing I Pembimbing II
Diketahui
Tanggal Lulus :
KATA PENGANTAR
Puji syukur penulis panjatkan kehadirat Allah SWT karena atas rahmat dan hidayah-Nya,
penulis dapat menyelesaikan karya ilmiah ini. Karya ilmiah ini berjudul ”Perbandingan antara
Regresi Poisson, Binomial Negatif, dan Zero-Inflated Poisson pada Data Overdispersi”.Karya
ilmiah ini penulis susun sebagai salah satu syarat untuk mendapatkan gelar Sarjana Statistika pada
Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian
Bogor.
Penulisan karya ilmiah ini dapat diselesaikan oleh penulis tidak lepas dari dukungan,
bimbingan, dan bantuan dari banyak pihak. Oleh karena itu, dalam kesempatan ini penulis
menyampaikan ucapan terima kasih kepada:
1. Bapak Ir. Hari Wijayanto, M.Si selaku Ketua Departemen Statistika FMIPA IPB.
2. Bapak Dr. Ir. Kusman Sadik, M.Sidan Ibu Dr. Ir. Indahwati, M.Si selaku dosen
pembimbing yang telah memberikan bimbingan,masukan dan arahan kepada penulis.
3. Seluruh Dosen Departemen Statistika yang telah memberikan ilmu dan wawasan selama
penulis menuntut ilmu di Departemen Statistika serta seluruh staf Departemen Statistika
yang telah banyak membantu penulis.
4. Kedua orang tua, adik, dan bude yang telah memberikan doa, kasih sayang serta dukungan
baik moril maupun materil selama menuntut ilmu.
5. Rizki Fadhilah dan keluarga yang telah memberikan doa, kasih sayang, nasehat, dan
dukungannya.
6. Bimandra A. Djafaara, Rifki Rizal, Andzar Syafa’atur Rahman, Iqbal Noviandi, Hadi
Septian Guna Putra, M. Ferdiansyah, M. Seftian, Wisnu Panata Praja, Ferdian Bangkit
Wijaya, Agus Sopian, dan De Budi Sudarsono yang telah memberikan dukungan dan
bantuan selama penulis menyelesaikan karya ilmiah ini.
7. Teman-teman seperjuangan statistika khususnya Statistika 45 yang telah bersama-sama
dalam segala suka maupun duka.
8. Seluruh pihak yang telah memberikan dukungan dan bantuan dalam penyelesaian karya
ilmiah ini.
Semoga karya ilmiah ini dapat memberikan manfaat bagi semua pihak. Amin.
Bogor, November2012
Aji Setyawan
RIWAYAT HIDUP
Penulis dilahirkan di Rembangpada tanggal 9 Agustus 1990 dari pasangan Suwarno dan
Sulistyaningsih. Penulis merupakan anak pertama dari dua bersaudara. Tahun 2002 penulis lulus
dari SD Negeri Kutoharjo2Rembang. Kemudian melanjutkan studi di SLTP Negeri 2 Rembang
hingga tahun 2005. Selanjutnya, penulis menyelesaikan pendidikan di SMA Negeri 1Rembang dan
lulus pada tahun 2008. Pada tahun yang sama penulis lulus seleksi masuk Institut Pertanian Bogor
(IPB) melalui jalur Undangan Seleksi Masuk IPB (USMI) dan diterima sebagai mahasiswa
Departemen Statistika, FMIPA IPB dengan mayor Statistika dengan pilihan minor Matematika
Keuangan dan Aktuaria.
Selama mengikuti perkuliahan, penulis aktif dalam organisasi kemahasiswaan statistika
Himpunan Profesi Gamma Sigma Beta (GSB)sebagai Ketua Badan Pengawas Himpunan Profesi
Gamma Sigma Beta periode kepengurusan 2011 dan menjadi staf Beta ClubHimpunan Profesi
Gamma Sigma Beta (GSB) pada periode kepengurusan 2010. Selain itu, penulis juga aktif dalam
kegiatan kepanitiaan seperti Lomba Jajak Pendapat Statistika 2011 sebagai staf Divisi Logistik dan
Transportasi, Statistika Ria 2010 sebagai Ketua Divisi Acara dan 2009 sebagai staf Divisi Logistik
dan Transportasi,Welcome Ceremony Statistics (WCS) 2010 sebagai Ketua Pelaksana, serta
beberapa kegiatan lainnya. Pada Februari - April 2012, penulis melaksanakan kegiatan praktik
lapang di Balai Penelitian Tanaman Pemanis dan Serat (BALITTAS), Malang.
DAFTAR ISI
Halaman
DAFTAR GAMBAR ................................................................................................................. viii
DAFTAR TABEL .................................................................................................................... viii
DAFTAR LAMPIRAN ............................................................................................................ viii
PENDAHULUAN .................................................................................................................... 1
Latar Belakang .................................................................................................................... 1
Tujuan ................................................................................................................................. 1
METODOLOGI ....................................................................................................................... 3
Data ..................................................................................................................................... 3
MetodeSimulasi .................................................................................................................... 4
LAMPIRAN ............................................................................................................................. 10
viii
DAFTAR GAMBAR
Halaman
1 Plot peluang sebaran Poisson ............................................................................................ 1
2 Plot hubungan peubah penjelas dengan peubah respon pada regresi Poisson ................... 2
3 Plot antara sisaan dengan nilai Y dari ketiga model pada data tidak overdispersi ........... 6
4 Plot antara sisaan dengan nilai Y dari ketiga model pada data overdispersi .................... 8
DAFTAR TABEL
Halaman
1 Rata-rata nilai-p dan jumlah amatan bernilai nol pada peubah respon dari setiap set data 5
2 Nilai mutlak bias relatif (ARB) dan MSE dari setiap penduga parameter regresi pada
data yang tidak overdispersi ............................................................................................... 6
3 Galat baku dugaan dan galat baku sebenarnyadari penduga parameter regresi pada data
yang tidak overdispersi ..................................................................................................... 7
4 Nilai mutlak bias relatif (ARB) dan MSE pada persentase jumlah amatan dengan
peubah respon yang bernilai nol sebesar 60%.................................................................... 7
5 Galat baku dugaan dan galat baku sebenarnya penduga parameter pada persentase
jumlah amatan dengan peubah respon yang bernilai nol sebesar 60%............................... 8
DAFTAR LAMPIRAN
Halaman
1 Diagram alir metode simulasi ........................................................................................... 11
2 Diagram kotak garis nilai bias relatif penduga parameter (bukan dalam satuan persen)
untuk data yang tidakoverdispersi .................................................................................... 12
3 Diagram kotak garis nilai bias relatif penduga parameter (bukan dalam satuan persen)
untuk data yang mengalami overdispersi .......................................................................... 13
4 Nilai mutlak bias relatif (ARB) dan MSE pada setiap persentase jumlahamatan dengan
peubah respon yang bernilai nol ....................................................................................... 16
5 Galat baku dugaan dan galat baku sebenarnya dari penduga parameter pada setiap
persentase jumlah amatan dengan peubah respon yang bernilai nol ................................. 17
1
βj = koefisien regresi peubah penjelas overdispersi dapat ditulis var(Y) > E(Y).
ke-j Sebaliknya, data yang ragam peubah respon
n = banyaknya amatan bernilai lebih kecil dari rata-rata peubah
k = banyaknya peubah penjelas respon disebut dengan underdispersi
Keluarga eksponensial biasanya ditulis dalam (McCullagh & Nelder 1989).
bentuk: Long (1997) dalam Jackman (2007)
yθ − b (θ ) menyatakanoverdispersi dapat terjadi karena
f y ( y; θ , φ ) = exp + c( y, φ ) adanya sumber keragaman yang tidak teramati
a (φ ) pada data atau adanya pengaruh peubah lain
Dengan θ adalah parameter natural dan ø yang mengakibatkan peluang terjadinya suatu
adalah skala yang dibutuhkan untuk kejadian bergantung pada kejadian
menghasilkan galat baku yang mengikuti sebelumnya. Overdispersi akan
distribusi dalam keluarga eksponensial mengakibatkan simpangan baku dari
(Hardin & Hilbe 2007). Gambar 2 parameter dugaan menjadi berbias ke bawah
memperlihatkan contoh plot hubungan antara (underestimate) dan signifikansi dari pengaruh
peubah respon dengan peubah penjelas pada peubah penjelas menjadi berbias ke atas
regresi Poisson. (overstate) (Ismail & Jemain 2007).
P lo t re g re s i P o is s o n Dugaan overdispersi dapat diukur melalui
30
rasio antara deviance dengan derajat bebasnya.
25
Jika rasio ini menghasilkan nilai yang lebih
20
besar dari satu, maka model tersebut dikatakan
Y 15 mengalami overdispersi. Deviance model
10
regresi Poisson memiliki persamaan sebagai
5 berikut :
0
0 2 4
X
6 8 10
ܦൌ ʹ ൜ݕ െ െ ̂
̂
Gambar 2 Plot hubungan peubah penjelas ୀ
dengan peubah respon pada dengan yi merupakan nilai aktual amatan ke-i
regresi Poisson dari peubah respon dan ̂ merupakan nilai
dugaan peubah respon untuk amatan ke-i
Pendugaan dari parameter koefisien regresi (Hardin & Hilbe 2007).Rasio dispersi(α) ini
Poisson dapat dilakukan dengan menggunakan dapat diuji secara formal dengan hipotesis
metode Maximum Likelihood Estimation sebagai berikut :
(MLE). Fungsi kemungkinan dari regresi H0 : α = 1
Poisson adalah (Yesilova et al. 2010a): H1 : α > 1
n
Hipotesis nol ditolak jika D > χ2(n-p;α) (Halekoh
L(β) = ∏P( y | β) i
et al. 2007) dengan n adalah jumlah amatan
i =1 dan p adalah jumlah parameter.
(∑ [ exp(xiβ)]) ∏ [ exp(xiβ)] { }
n yi
n
exp - i =1 i =1
Regresi Binomial Negatif
= Regresi Binomial Negatif merupakan salah
n
∏ i =1
yi ! satu cara untuk mengatasi masalah
overdispersi pada data cacah yang didasarkan
dan logaritma natural dari fungsi
pada model campuran Poisson-Gamma
kemungkinannya sebagai berikut:
y ! Γ (α ) 1 + αµ 1 + αµ
−1
Overdispersi
Dalam model regresi Poisson terdapat dengan y merupakan nilai dari data cacah,µ
asumsi yang harus dipenuhi. Asumsi tersebut adalah nilai harapan y, dan α merupakan
parameter dispersi, α>0 (Yesilova et al.
→
adalah nilai rata-rata dari peubah respon harus
bernilai sama dengan ragam peubah respon, 2010b). Jika α 0, maka distribusi ini
yang disebut juga ekuidispersi. Namun, dalam mendekati sebaran Poisson(µ). Sebaran
analisis data cacah sering dijumpai data Binomial Negatif memiliki nilai tengah
dengan ragam peubah respon bernilai lebih
dan ragam
ଶ (Ismail
besar dari rata-rata peubah respon, biasa & Jemain 2007).
disebut dengan overdispersi. Fenomena
3
ln(µ i )=x i β
i=1
∑ ln (1+exp ( gi γ ) )
n
Parameter regresi Binomial Negatif (β) diduga dengan I(yi=0) bernilai 1 jikayi=0 danbernilai
menggunakan penduga kemungkinan 0 jikayiselainnya.
maksimum. Pendugaankemungkinanmaksimumuntukβdan
γdiperolehdenganmenggunakanalgoritmaExpe
Regresi Zero-Inflated Poisson (ZIP) ctation-Maximization (EM) (Cameron
Model Regresi ZIP merupakan model &Trivedi 1998).
campuran untuk data cacahdengan banyak
nilai nol pada peubah respon. Model ini Evaluasi Penduga Parameter dan Penduga
merupakan kombinasi dari sebaran Poisson Galat Baku Relatif
dengan sebaran kejadian yang bernilai nol Menurut Savic (2009) akurasi nilai
(Cameron & Trivedi 1998). Berikut fungsi penduga parameter dapat dilihat dari nilai bias
sebaran dari ZIP:
ω + (1 - ω ) exp(- µ ); y = 0
relatif (BR) dan Root Mean Square Error
Pr(Y = y ) =
(RMSE). Persamaan dari nilai bias relatif
∑ x100%
r
1
dengan Y~ZIP(µ,ω). µ adalah parameter dari
i=1 β
BR=
sebaran Poisson, sedangkan ω adalah peluang r
dari kejadian bernilai nol (Ridout et al. 1998). Menurut Muzathik (2011) jika nilai bias relatif
Kemudian dari fungsi sebaran tersebut terletak dalam selang -10% sampai 10% maka
didapatkan E(Y) dan var(Y) sebagai berikut: penduga parameter tersebut dapat diterima.
E(Y)=(1-ω)µ
ω ( E (Y ))2
Sedangkan nilai RMSE dapat diketahui dari
var(Y ) = E (Y ) +
persamaan:
1- ω
∑ ( βɵ -β )
r
1 2
1- ω
Sedangkan jika ingin mengetahui nilai
penduga galat baku relatif dapat dicari dengan
X dan G adalah matriks peubah penjelas membagi antara galat baku penduga dengan
(Yesilova et al. 2010b). Sedangkanβ dan γ penduga parameter. Kemudian untuk
adalah vektor-vektor parameter model mengetahui nilai galat baku relatif sebenarnya
berukuran (p+1)x1 dan (q+1)x1 yang akan dapat menggunakan persamaan (Savic 2009):
1 r βɵ i -β
diduga nilainya. Peubah penjelas yang
∑
2
regresi Poisson, regresi Binomial Negatif, dan a. Pada data yang tidak mengalami
regresi ZIP. Data yang dibangkitkan adalah overdispersi, data respon didapat
data dengan banyak jumlah amatan bernilai dengan cara membangkitkan n buah
nol (excess zero) pada peubah respon dengan data peubah respon yang menyebar
kondisi overdispersi dan tidak overdispersi. Poisson (µi).
Pada data overdispersi, persentase jumlah b. Pada data yangmengalami
amatan pada peubah respon yang bernilai nol overdispersi, data respon didapat
ditentukan sebesar 40%, 60%, dan 80%. dengan cara:
Besaran parameter dan peubah yang 1) Menghitung parameter γ0=τβ0,
ditentukan untuk membuat model γ1= τβ1,dan γ2= τβ2
ln(µ)=β0+β1X1i+β2X2i, adalah: 2) Menghitung nilai ωi pada
1. Parameter koefisien regresi: masing-masing amatan dengan
a. Untuk data tanpa overdispersi: cara:
β0=1.5, β1=-ln(2), β2=ln(3) exp ( γ 0 +γ1 x 1i +γ 2 x 2i )
b. Untuk data dengan overdispersi: ωi =
β0=1, β1=0.4, β2=0.6, dan τ yang 1+exp ( γ 0 +γ1 x 1i +γ 2 x 2i )
berbeda-beda untuk setiap persentase 3) Membangkitkan variabel c
amatan pada peubah respon yang dengan cara membangkitkan n
bernilai nol. Untuk 40% τ ditetapkan buah data yang menyebar
sebesar -0.15, untuk 60% τ=0.175, dan Seragam (0,1).
untuk 80% τ=0.5 4) Membangkitkan variabel Yp
2. Peubah bebas: dengan cara membangkitkan
a. Untuk data tanpa overdispersi: bilangan acak yang menyebar
peubah X1 adalah peubah acak yang Poisson (µi).
menyebar Normal (5,2) dan peubah X2 5) Membandingkan variabel c pada
adalah peubah acak yang menyebar tiap amatan dengan nilai ωi.
Seragam (1,2). X1 dan X2 diasumsikan Apabila ci>ωi maka Yi=Yp,
sebagai peubah tetap. sedangkan apabila ci≤ωimaka
b. Untuk data dengan overdispersi: Yi=0.
Peubah X1 adalah peubah acak yang 4. Mencatat nilai peubah respon dan semua
menyebar Normal (3,1), sedangkan X2 peubah penjelas.
adalah peubah acak yang menyebar 5. Menghitung jumlah data respon yang
Seragam (0,2). X1 dan X2 diasumsikan bernilai nol.
sebagai peubah tetap. 6. Melakukan pendugaan parameter
3. Peubah respon: menggunakan regresi Poisson, regresi
Peubah respon Yi merupakan data yang Binomial Negatif, dan regresi ZIP.
akan dibangkitkan. Dalam simulasi ini 7. Mencatat nilai deviance yang dihasilkan
peubah respon yang dibangkitkan adalah dari regresi Poisson dan menghitung nilai-
a. Peubah respon dengan banyak jumlah p yang digunakan untuk melakukan uji
amatan bernilai nol pada kondisi tanpa formal overdispersi.
overdispersi (α=0). 8. Mencatat nilai pendugaan parameter dari
b. Peubah respon dengan banyak jumlah masing-masing metode regresi.
amatan bernilai nol pada kondisi 9. Mencatat penduga galat baku dari masing-
overdispersi. masing penduga parameter untuk ketiga
4. Respon yang diamati dalam penelitian metode regresi.
sebanyak n=60, 100, dan 200. Untuk 10. Menghitung nilai bias relatif, nilai mutlak
memperoleh hasil pendugaan yang bias relatif mutlak (ARB/Absolute
mewakili populasi maka pembangkitan Relative Bias), dan Mean Square Error
data diulang sebanyak r=1000 kali. (MSE) dari masing-masing penduga
parameter.
Metode Simulasi 11. Mengulangi langkah 1-10 1000 kali
1. Membangkitkan n buah data peubah 12. Menghitung rata-rata nilai-p dan rata-
penjelasX1 dan peubah bebas X2. rataamatanyang bernilai nol pada peubah
2. Menghitung nilai µ pada masing-masing respon.
amatan dengan cara µi=exp(β0+β1x1i+ 13. Membuat diagram kotak garis dari nilai-
β2x2i). nilai bias relatif masing-masing penduga
3. Membangkitkan peubah respon: parameter dari regresi Poisson, regresi
Binomial Negatif,dan regresi ZIP.
5
14. Menghitung rata-rata dari 1000 nilai bias besar dibandingkan yang lain tetapi
relatif mutlak dan MSE dari masing- perbedaannya tidak signifikan. Dari hasil nilai
masing penduga parameter untuk ketiga mutlak bias relatif dan MSE yang dihasilkan
metode. dapat dikatakan bahwa regresi Poisson, regresi
15. Menghitung rata-rata dari penduga galat Binomial Negatif, dan regresi ZIP sama
baku masing-masing penduga parameter baiknya dalam pendugaan parameter untuk
untuk ketiga metode data yang tidak mengalami overdispersi.
16. Menghitung galat baku sebenarnya dari Namun, regresi Poisson dan regresi Binomial
penduga parameter pada ketiga metode Negatif lebih efektif digunakan dalam
regresi, dengan rumus: pendugaan parameter karena pada regresi ZIP
selain menduga parameter β (model log) juga
∑
1000
1
( βɵ -β )
2
sd*(βɵ )= i
dilakukan pendugaan terhadap parameter γ
n i=1 (model logit).
17. Melihat nilai mutlak bias relatif dan MSE
dari penduga parameter serta nilai galat Tabel 1 Rata-rata nilai-p dan jumlah amatan
baku duga dan sebenarnya dari bernilai nol pada peubah respon dari
setiappenduga parameter untuk ketiga setiap set data
metode. Ditetapkan Hasil simulasi
Diagram alir dari metode simulasi dapat n
Parameter Jumlah Jumlah
Nilai-p Keterangan
dilihat pada Lampiran 1. dispersi nol nol
yang ditentukan, yaitu sebesar 5%, artinya α>0 40% 39.74% 0 Overdispersi
data cacah hasil simulasi tersebut terbukti 200
α>0 60% 62.00% 0 Overdispersi
tidak mengandung overdispersi. Sedangkan
α>0 80% 79.96% 0 Overdispersi
pada data cacah yang mengandung
overdispersi (α>0), uji formal untuk rasio
dispersi memiliki nilai pelung yang lebih kecil Sebaran nilai bias relatif dari masing-
dari taraf nyata yang ditentukan, artinya data masing penduga parameter untuk semua data
cacah yang dibangkitkan terbukti mengalami disajikan dalam diagram kotak garis pada
overdispersi. Lampiran 2. Berdasarkan diagram kotak garis
tersebut dapat dilihat bahwa nilai tengah dari
Data Tidak Overdispersi bias relatif untuk semua parameter dari seluruh
Data cacah yang tidak mengalami data yang tidak mengalami overdispersi
overdispersi dianalisis menggunakan regresi mendekati nol.
Poisson, regresi Binomial Negatif, dan regresi Pada penelitian ini juga dilakukan
ZIP. Ketiga metode ini menghasilkan penduga pendugaan terhadap galat baku dari penduga
parameter yang mendekati nilai parameter parameter regresi. Ketiga metode regresi ini
sebenarnya. Semakin besar ukuran contoh menghasilkan penduga galat baku yang
maka nilai penduga parameter yang dihasilkan mendekati nilai galat baku sebenarnya dari
akan semakin dekat dengan parameter yang setiap penduga parameter regresi. Nilai
sebenarnya.Tabel 2 memperlihatkan bahwa penduga galat baku dari penduga parameter
nilai mutlak bias relatifdan MSE dari ketiga dan galat baku sebenarnya dapat dilihat pada
metode pada setiap parameter bernilai kecil. Tabel 3. Pada Tabel 3 dapat dilihat bahwa
Selain itu, nilai mutlak bias relatifdan MSE penduga galat baku dari ketiga metode regresi
antar metode menghasilkan nilai yang hampir menghasilkan nilai yang hampir sama dengan
sama. Nilai mutlak bias relatif dan MSE pada nilai galat baku sebenarnya dari penduga
regresi ZIP memiliki nilai yang sedikit lebih parameter. Pada regresi ZIP menghasilkan
6
Tabel 2 Nilai mutlak bias relatif (ARB) dan MSE dari setiap penduga parameter regresi pada data
yang tidak overdispersi
Poisson Binomial Negatif ZIP
n Parameter
ARB(%) MSE ARB(%) MSE ARB(%) MSE
b0 34.664 0.437 34.888 0.443 35.590 0.473
60 b1 6.832 0.004 6.929 0.004 8.508 0.006
b2 28.730 0.160 28.943 0.162 30.612 0.180
b0 24.440 0.216 24.538 0.218 25.096 0.236
100 b1 4.897 0.002 4.931 0.002 5.719 0.003
b2 20.224 0.079 20.224 0.079 21.002 0.088
b0 17.160 0.104 17.303 0.106 17.662 0.111
200 b1 3.262 0.001 3.290 0.001 3.728 0.001
b2 14.284 0.040 14.462 0.040 14.955 0.043
selisih antara penduga galat baku dengan galat regresi Binomial Negatif, dan regresi ZIP
baku sebenarnya yang sedikit lebih besar dalam berbagai kondisi jumlah amatan yang
dibandingkan regresi Poisson dan regresi bernilai nol pada peubah respon. Penelitian ini
Binomial Negatif tetapi selisih atau perbedaan ingin melihat seberapa besar penyimpangan
tersebut tidak terlalu signifikan. yang terjadi pada data cacah yang mengalami
Plot sisaan dengan nilai Y overdispersi dengan banyak jumlah amatan
6 Keterangan
yang bernilai nol pada peubah respon jika
Poisson
Binomial Negatif
dianalisis menggunakan regresi Poisson dan
4 ZIP regresi Binomial Negatif.
Pada data yang mengalami overdispersi
2 dengan persentase jumlah amatan yang
Sisaan
Tabel 3 Galat baku dugaan dan galat baku sebenarnyadari penduga parameter regresi pada data
yang tidak overdispersi
Poisson Binomial Negatif ZIP
n Parameter
Dugaan Sebenarnya Dugaan Sebenarnya Dugaan Sebenarnya
b0 0.614 0.661 0.629 0.665 0.635 0.688
60 b1 0.061 0.061 0.063 0.062 0.067 0.076
b2 0.373 0.399 0.383 0.402 0.388 0.425
b0 0.455 0.465 0.464 0.466 0.469 0.486
100 b1 0.043 0.044 0.044 0.044 0.046 0.052
b2 0.277 0.280 0.283 0.281 0.287 0.297
b0 0.308 0.323 0.314 0.325 0.317 0.334
200 b1 0.028 0.029 0.029 0.029 0.030 0.033
b2 0.188 0.199 0.191 0.200 0.194 0.208
dan MSE yang dihasilkan menunjukkan regresi yang dihasilkan. Pada data yang tidak
bahwa penduga parameter yang dihasilkan mengalami overdispersi, nilai galat baku dari
oleh regresi Binomial Negatif dan regresi koefisien regresi Poisson mendekati nilai
Poisson tidak sesuai dengan parameter galat baku sebenarnya. Namun pada data yang
sebenarnya atau parameter yang ditetapkan. mengalami overdispersi,nilai galat baku dari
Pada Tabel 4 dan Lampiran 4 nilai mutlak bias penduga parameter regresi Poisson menjadi
relatif dan MSE dari regresi ZIP memiliki nilai lebih kecil dari nilai galat baku sebenarnya
yang kecil untuk keseluruhan data yang telah (underestimate). Kondisi ini juga terjadi pada
dibangkitkan dengan kriteria yang ditentukan. penduga dari galat baku penduga parameter
Hal ini menunjukkan bahwa regresi ZIP baik yang dihasilkan oleh regresi Binomial Negatif.
digunakan dalam pendugaan parameter untuk Nilai penduga galat baku dari penduga
data yang mengalami overdispersi dengan parameter dan nilai galat baku sebenarnya dari
seluruh jenis persentase jumlah amatan penduga parameter regresi ketiga model untuk
bernilai nol pada peubah respon yang telah persentase jumlah amatan dengan peubah
ditetapkan. respon yang bernilai nol sebesar 60% dapat
Sebaran nilai bias relatif dari masing- dilihat pada Tabel 5 dan selengkapnya terdapat
masing penduga parameter untuk semua data pada Lampiran 5. Pada Tabel 5 dan Lampiran
yang mengalami overdispersi dengan berbagai 5 juga dapat dilihat bahwa regresi ZIP
persentase jumlah amatan yang bernilai nol menghasilkan penduga galat baku yang
pada peubah respon disajikan dalam diagram mendekati nilai galat baku sebenarnya dari
kotak garis pada Lampiran 3. Berdasarkan setiap penduga parameter regresi. Dari
diagram kotak garis tersebut dapat dilihat penduga parameter dan penduga galat baku
bahwa nilai tengah dari bias relatif untuk yang dihasilkan menunjukkan bahwa regresi
semua parameter regresi ZIP sangat dekat ZIP mampu mengatasi overdispersi pada
dengan nol. Hal ini menunjukkan parameter- regresi Poisson dengan data yang memiliki
parameter yang dihasilkan oleh regresi ZIP banyak jumlah amatan yang bernilai nol pada
tidak berbias. peubah respon.
Pengaruh overdispersi pada regresi Poisson
terlihat jelaspada penduga galat baku koefisien
Tabel 4 Nilai mutlak bias relatif (ARB) dan MSE pada persentase jumlah amatan dengan peubah
respon yang bernilai nol sebesar 60%
Persentase Poisson Binomial Negatif ZIP
Jumlah
respon bernilai Parameter
amatan ARB (%) MSE ARB (%) MSE ARB (%) MSE
nol
b0 88.379 1.180 86.033 1.100 18.207 0.053
60% 60 b1 45.247 0.052 44.427 0.050 11.243 0.003
b2 47.146 0.131 46.984 0.130 13.014 0.010
8
Tabel 5 Galat baku dugaan dan galat baku sebenarnya penduga parameter pada persentase jumlah
amatan dengan peubah respon yang bernilai nol sebesar 60%
Persentase Poisson Binomial Negatif ZIP
Jumlah
respon Parameter
amatan Dugaan Sebenarnya Dugaan Sebenarnya Dugaan Sebenarnya
bernilai nol
regresi ZIP dapat memberikan uji signifikansi McCullagh P, Nelder JA. 1989. Generalized
peubah bebas yang lebih berarti dibandingkan Linear Models. London: Chapman &
regresi Poisson dan regresi Binomial Negatif. Hall.
Padadata yang tidak mengalami overdispersi, Muzathik MA, Nik WBW, Samo KB, Sopian
regresi Poisson, regresi Binomial Negatif, dan K, Alghoul MA. 2011. Daily Global
regresi ZIP memberikan hasil yang sama Solar Radiation Estimate Based on
baiknya dalam penduga parameter dan Sunshine Hours.International Journal of
penduga galat baku. Mechanical and Materials Engineering
Semakin besar ukuran contoh atau jumlah (IJMME), Vol.6 (2011), No.1, 75-80
amatan maka nilai mutlak bias relatif dan Ridout M, Demetrio CGB, Hinde JP. 1998.
MSE dari masing-masing parameter akan Models for Counts Data with Many
semakin kecil. Sedangkan semakin besar Zeros. Proceedings of XIXth
persentase jumlah amatan yang bernilai nol International Biometric Conference,
pada peubah respon maka nilai mutlak bias Cape Town, Invited Papers, pp. 179-192.
relatif dan MSE dari masing-masing parameter Savic R. 2009. Performance in Population
untuk tiap metode akan semakin besar. Models for Count Data, Part II: A New
SAEM algorithm. Paris: Universite Paris-
Saran Diderot-Paris VII.
Hal yang perlu diberikan perhatian dalam Yesilova A, Kaya Y, Kaki B, Kasap I. 2010.
penelitian ini adalah penentuan parameter, Analysis of Plant Protection Studies with
persentase jumlah amatan yang bernilai nol Excess Zeros Using Zero-Inflated and
pada peubah, dan ukuran contoh. Tentunya Negative Binomial Hurdle Models.
akan lebih menarik jika parameter, persentase Turkey: Gazi University Journal of
jumlah amatan yang bernilai nol pada peubah Science.
respon, jenis peubah bebas, dan ukuran contoh Yesilova A, Kaydan MB, Kaya Y. 2010.
yang ditetapkan lebih bervariasi agar lebih Modelling Insect-Egg Data with Excess
dapat mewakili populasi sehingga akan Zeros Using Zero-Inflated Regression
diperoleh kesimpulan yang lebih mewakili Models. Turkey: Faculty of Science,
kondisi yang sebenarnya di lapangan. Hacettepe University.
DAFTAR PUSTAKA
Menentukan persentase
Yi~Poisson (µ i) amatan yang bernilai nol
(40%, 60%, dan 80%)
Menghitung parameter
γ0=τβ0, γ1=τβ1, dan γ2=τβ2
τ40%=-0.15; τ60%=0.175; τ80%=0.5
Menghitung nilai
Ya
Yi=0 <ci
Tidak
Yi~Poisson (µ i)
Nilai-p
Galat Baku Galat Baku
12
Lampiran 2 Diagram kotak garis nilai bias relatif penduga parameter (bukan dalam satuan
persen) untuk data yang tidakoverdispersi
Untuk n=60
Untuk n=100
Untuk n=200
13
Lampiran 3 Diagram kotak garis nilai bias relatif penduga parameter (bukan dalam satuan
persen) untuk data yang mengalami overdispersi
Untuk n=60 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 40%
Untuk n=100 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 40%
Untuk n=200 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 40%
14
Untuk n=60 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 60%
Untuk n=100 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 60%
Untuk n=200 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 60%
15
Untuk n=60 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 80%
Untuk n=100 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 80%
Untuk n=200 dengan persentase jumlah amatan yang bernilai nol pada peubah respon sebesar 80%
16
Lampiran 4 Nilai mutlak bias relatif (ARB) dan MSE pada setiap persentase jumlah amatan
dengan peubah respon yang bernilai nol
Lampiran 5 Galat baku dugaan dan galat baku sebenarnya dari penduga parameter pada setiap
persentase jumlah amatan dengan peubah respon yang bernilai nol