Anda di halaman 1dari 3

1.2.

4 Overdispersi
Dalam prakteknya, jumlah observasi sering kali menunjukkan variabilitas yang
melebihi prediksinya dengan distribusi binomial atau poisson. Fenomena ini disebut
overdispersi. Kita mengasumsikan diatas, jika setiap orang memiliki probabilitas kematian
yang sama pada sebuah kecelakaan fatal di minggu berikutnya. Secara lebih realistis,
probabilitas tersebut berubah-ubah dalam kaitan beberapa faktor seperti berapa lama waktu
yang dihabiskan untuk menyetir, apakah orang tersebut mengenakan sabuk pengaman, dan
lokasi geografis. Variasi tersebut menyebabkan jumlah kematian yang lebih bervariasi dari
yang diprediksikan dengan model poisson.
Diduga Y adalah variabel random dengan varians var(Y|μ) diketahui μ, namun μ
sendiri berubah-ubah karena faktor yang tidak dapat diukur seperti yang sudah dijelaskan.
Jika θ = E(μ). Maka tanpa syarat,
E(Y)= E[E(Y| μ), var(Y) = E[var(Y| μ)] + var[E(Y| μ)]
Ketika Y adalah berdistribusi poisson (diketahui μ), misalnya E(Y) = E(μ) = θ dan
var(Y) = E(μ)+ var (μ) = θ + var(μ) > θ
Diasumsikan distribusi poisson untuk jumlah variabel sering kali sangat sederhana,
karena beberapa faktor yang menyebabkan overdispersi. Binomial negatif adalah distribusi
yang berhubungan dengan jumlah data yang mengizinkan variansnya melebihi rata-rata. Kita
mengenalnya di Section 4.3.4
Menganalisis pengasumsian distribusi binomial (atau multinomial) juga kadang kali
tiak valid karena adanya overdispersi. Hal ini dapat terjadi karena distribusi yang sebenarnya
merupakan campuran dari distribusi binomial yang berbeda, dengan parameter yang berubah-
ubah karena variabel yang tidak dapat diukur. Untuk ilustrasi, diduga jika sebuah eksperimen
menyingkap tikus mengandung pada sebuah toksin dan setelah 1 minggu diamati jumlah
janin pada setiap percobaan tikus yang menunjukkan kecacatan. Maka ni menunjukkan
jumlah janin percobaan untuk tikus ke-i. Tikus-tikus juga berubah berdasarkan faktor lain
yang mungkin tidak dapat diukur, seperti bobotnya, kesehatan keseluruhan, dan makeup
genetik. Keragaman yang ekstra dapat terjadi karena variabilitas dari percobaan ke percobaan
pada probabilitas kecacatan π. Distribusi dari jumlah janin per percobaan menunjukkan
kecacatan dapat diklasterkan berkisar 0 dan mendekati ni, menunjukkan dispersion yang lebih
daripada ekspektasi untuk sampling binomial dengan hasil tunggal π. Overdispersi juga
terjadi ketika π berubah diantara janin pada percobaan berdasarkan beberapa distribusi
(Problem 1.12). pada chapter 4, 12, dan 13 kita memperkenalkan metode untuk data yang
terdapat overdispersi relatif ke asumsi binomial dan poisson.
Overdispersi adalah kondisi pada saat ragam dari variabel respon lebih besar dari nilai
tengahnya. Overdispersi dapat terjadi karena banyaknya jumlah pengamatan yang bernilai nol
pada peubah respon. Ada atau tidaknya overdispersi dapat dilihat dari nilai deviance atau
pearson chi-square yang dibagi dengan derajat bebasnya.
 2 pearson
1
db
dengan, db = m – k
m : banyaknya penamatan
k : banyaknya parameter yang diduga
Jika nilai pearson chi-square lebih dari 1 maka, terdapat overdispersi. Hal tersebut
menunjukkan bahwa nilai varians lebih besar daripada nilai meannya.
Munculnya masalah overdispersi dalam pengamatan data diskrit dapat dijelaskan oleh
dua hal, yaitu adanya keragaman dalam variabel respon dan adanya korelasi antar variabel
respon kedua kejadian tersebut merupakan kejadian yang saling berhubungan, artinya jika
terdapat keragaman dalam peluang respon maka terdapat korelasi antar variabel respon.
Begitu juga sebaliknya, jika terdapat korelasi antara variabel respon, maka terdapat
keragaman dalam variabel respon. McCullagh dan Nelder (1989) menyatakan bahwa kedua
kejadian tersebut dapat terjadi karena adanya pengelompokan (clustering) dalam populasi.
Model regresi poisson adalah salah satu model regresi yang sering diunakan untuk
menganalisis data diskrit. Model regressi poisson mempunyai asumsi equidispersi, yaitu
kondisi dimana nilai rataan dan ragam dan variabel respon bernilai sama.
Var (Y|x) = E(Y|x) = μ
Dalam berbagai kasus, seringkali dijumpai pelanggaran asumsi diatas, dimana variasi
dari variabel respon lebih besar daripada nilai rataannya yang dikenal dengan overdispersi.
Untuk menangani masalah overdispersi, dapat dilakukan pemodelan dengan regresi binomial
negatif.