PENDAHULUAN menyatakan ada tiga komponen dalam GLM
yaitu: Latar Belakang Random component (komponen acak) yang ditunjukkan dengan peubah respon Y dan Model Regresi Poisson secara umum telah peluang distribusinya. banyak digunakan untuk menganalisis data Systematic component (komponen cacah di mana rata-rata dan ragamnya sama. sistematik) yang ditunjukkan dengan Akan tetapi kondisi ini jarang sekali peubah penjelas yang digunakan. ditemukan pada data, sehingga seringkali Link function ditunjukkan dengan fungsi ditemukan keragaman data lebih besar nilai harapannya sama dengan systematic daripada rata-ratanya. Fenomena seperti ini component. disebut overdispersi. Kajian yang digunakan dalam penelitian ini adalah mengetahui Regresi Poisson pengaruh faktor eksternal terhadap ketidaklulusan siswa SMA dalam Ujian Regresi Poisson termasuk ke dalam GLM Nasional (UN) di DKI Jakarta. dan merupakan salah satu bentuk analisis UN merupakan salah satu isu pendidikan regresi yang digunakan untuk model data yang sering menimbulkan kontroversi cacah (count data) dan data dalam bentuk dikalangan siswa. Hal ini bermula pada tahun tabel kontingensi. Model Regresi Poisson 2003 ketika pemerintah mengubah Evaluasi kadang dikenal dengan log-linear model, Belajar Tahap Akhir Nasional (EBTANAS) terutama ketika digunakan untuk model tabel menjadi UN. Perubahan ini ditujukan agar kontingensi. sumber daya yang dihasilkan lebih berkualitas Model Regresi Poisson dengan peubah yaitu dengan memberlakukan standar nilai penjelas X dapat dituliskan sebagai berikut kelulusan. (Agresti, 2002) : Jumlah siswa SMA yang tidak lulus UN Log = +x dapat dikatakan masih cukup tinggi. Fungsi peluang sebaran Poisson adalah: Sementara itu diketahui bahwa tingkat e y pendidikan penduduk berkorelasi positif f ( y; ) y=0,1,2,.... dengan status ekonomi, derajat kesehatan dan y ! laju pertumbuhan penduduk (Depdiknas dalam dengan asumsi E(Y)= Var(Y)=. Wulansari 2008). Hasil penelitian Wulansari Fungsi penghubung kanonik (cannonical (2008) menyatakan secara statistik jumlah link function) untuk Regresi Poisson yaitu: siswa yang tidak lulus UN dapat diasumsikan g ( ) log( ) ( X ' ) berdistribusi Poisson karena kejadian tersebut jarang terjadi dalam ruang sampel yang besar, Pendugaan parameter koefisien Regresi sehingga hubungan antara jumlah siswa yang Poisson dapat diduga dengan menggunakan tidak lulus UN dengan faktor-faktor yang Maximum Likelihood Estimation (MLE) berpengaruh dapat diketahui melalui Regresi melalui iterasi dengan metode Newton Poisson. Raphson untuk memaksimumkan fungsi log- Tujuan likelihoodnya L(y,,).
Tujuan dari penelitian ini adalah Overdispersi pada Regresi Poisson
mengetahui faktor-faktor eksternal yang mempengaruhi ketidaklulusan siswa SMA Data cacah untuk Regresi Poisson dalam UN di DKI Jakarta untuk tahun ajaran dikatakan mengandung overdispersi apabila 2005/2006 dan 2006/2007. keragamannya lebih besar dari nilai tengahnya. Jika pada data cacah terjadi overdispersi namun tetap digunakan Regresi Poisson, maka dugaan dari parameter TINJAUAN PUSTAKA koefisien regresinya tetap konsisten namun tidak efisien. Hal ini berdampak pada nilai Generalized Linear Model standar error yang menjadi under estimate, sehingga kesimpulannya menjadi tidak valid. Generalized Linear Model (GLM) Fenomena overdispersi (McCullagh & Nelder, merupakan perluasan dari model regresi umum 1983) dapat dituliskan: untuk respon berdistribusi dalam keluarga Var(Y) > E(Y) eksponensial dan modelnya merupakan fungsi dari nilai harapannya. Agresti (2002) 2
Overdispersi dapat diindikasikan dengan BAHAN DAN METODE
nilai dispersi Pearson Chi-square dan Deviance yang dibagi dengan derajat Bahan bebasnya. Jika kedua nilai ini lebih besar dari 1 maka dikatakan terjadi overdispersi pada Data yang digunakan dalam penelitian ini data. Overdispersi dapat pula terjadi karena adalah data sekunder jumlah kelulusan siswa adanya pengamatan missing pada peubah tiap SMA di DKI Jakarta yang diperoleh dari penjelas, adanya pencilan pada data, perlunya Dinas Pendidikan Menengah dan Tinggi interaksi dalam model, peubah penjelas perlu (DIKMENTI) Propinsi DKI Jakarta. Peubah ditransformasi atau kesalahan spesifikasi link respon yang diamati adalah jumlah siswa yang function (Hardin & Hilbe, 2007). tidak lulus UN tahun ajaran 2005-2006 dan 2006-2007. Peubah penjelas yang digunakan Regresi Binomial Negatif berupa data karakteristik SMA tahun ajaran 2007/2008 disajikan pada Tabel 1. Regresi Binomial Negatif merupakan salah Pada penelitian ini untuk membangun satu solusi untuk mengatasi masalah model dimasukkan pula peubah offset, yaitu overdispersi pada data cacah yang didasarkan suatu peubah penjelas yang dimasukkan ke pada model campuran Poisson-Gamma dalam model namun nilai koefisiennya tidak (Hardin & Hilbe, 2007). Fungsi peluang diestimasi tapi diasumsikan nilainya sama Binomial Negatif adalah sebagai berikut: dengan 1 dan biasanya nilainya bervariasi dari k y satu observasi ke observasi lain. Peubah yang ( y k) k k f ( y, k, ) 1 digunakan sebagai peubah offset adalah jumlah (k)( y 1) k k peserta UN. y=0,1,2,.... Metode di mana k dan adalah parameter dengan E(Y)= dan Var(Y)= +2/k ; k-1 disebut Tahapan metode yang dilakukan dalam parameter dispersi. penelitian ini disajikan pada Gambar 1. Secara lengkap langkah-langkah yang dilakukan Goodness Of Fit Tests adalah sebagai berikut : 1. Analisis statistika deskriptif jumlah siswa Ismail dan Jemain (2007) menyatakan tidak lulus UN per rayon wilayah. bahwa goodness of fits model Regresi Poisson 2. Deskripsi peubah penjelas untuk dan Regresi Binomial Negatif dapat dilihat mendapatkan karakteristik SMA pada dari nilai Pearson Chi-squares, Deviance, AIC masing-masing tahun ajaran. (Akaike Information Criterion), BSC 3. Pendeteksian overdispersi pada data dengan (Bayesian Schwartz Information Criterion) melihat nilai Pearson Chi-squares dan dan nilai Likelihood Ratio statistics. Nilai Deviance yang dibagi dengan derajat Pearson Chi-squares dan Deviance yang lebih bebasnya. mendekati derajat bebasnya menunjukkan 4. Melakukan analisis Regresi Poisson dan model yang lebih baik. Sedangkan nilai AIC Regresi Binomial Negatif untuk dan BSC yang lebih kecil menujukkan model mengetahui faktor-faktor eksternal yang yang lebih baik dan untuk nilai Likelihood berpengaruh terhadap jumlah siswa yang Ratio Statistics yang menunjukkan Tolak H0 tidak lulus UN. berarti model tersebut yang lebih baik, karena 5. Interpretasi model Regresi Poisson dan mengindikasikan adanya overdispersi pada Regresi Binomial Negatif. data. 6. Identifikasi kebaikan model Regresi Famoye, Wulu & Singh (2004) Poisson dan Regresi Binomial Negatif menyatakan untuk goodness of fits dapat pula dengan melihat nilai AIC, BSC, Pearson digunakan nilai log-likelihood di mana model Chi-squares, Deviance, Likelihood ratio dengan nilai log-likelihood yang lebih besar statistics dan log-likelihood dalam menunjukkan model yang lebih baik. permasalahan overdispersi. Software yang digunakan dalam penelitian ini adalah Microsoft Excel 2007, SPSS 15, Stata 10 dan SAS 9.1.