Anda di halaman 1dari 7

J. Sains MIPA, Desember 2007, Vol. 13, No. 3, Hal.

: 145 - 151
ISSN 1978-1873

PENDEKATAN GENERALIZED ADDITIVE MIXED MODELS


DALAM PENDUGAAN PARAMETER PADA SMALL AREA ESTIMATION
1Anang
1,2

Kurnia dan 2Khairil A. Notodiputro

Departemen Statistika, Institut Pertanian Bogor, Jl. Meranti Wing 22 Level 4


Kampus IPB Darmaga, Bogor Indonesia 16680
E-mail : 1 anangk@ipb.ac.id, 2 khairiln@bima.ipb.ac.id
Diterima 15 Oktober 2007, disetujui untuk diterbitkan 22 Januari 2008

ABSTRACT
Small Area Estimation (SAE) is a statistical technique to estimate parameters of sub-population containing small size of
samples with adequate precision. This technique is very important to be developed due to the increasing needs of
statistic for small domains, such as districts or villages. Some SAE techniques have been developed in Canada, USA,
and UE based on real data. We adapted this technique to produce small area statistic in Indonesia based on national
data collected by the Statistics Indonesia (Badan Pusat Statistik). We found that the linear model applied to auxiliary data
produced estimates with low precision. In this paper we propose a class of generalized additive mixed model to improve
the model of auxiliary data in small area estimation.
Keywords: small area estimation, generalized additive mixed models

1. PENDAHULUAN
Berbagai metode pendugaan area kecil (small area
estimation) telah dikembangkan khususnya menyangkut
metode yang berbasis model (model-based area
estimation). Perhatian yang besar ini terjadi seiring
dengan meningkatnya kebutuhan pemerintah dan para
pengguna statistik (termasuk dunia bisnis) terhadap
informasi yang lebih rinci, cepat, dan handal, tidak saja
untuk lingkup nasional tetapi pada lingkup yang lebih
kecil seperti provinsi, kabupaten, bahkan kecamatan
atau desa/kelurahan. Bagi kita di Indonesia pentingnya
statistik area kecil semakin dirasakan seiring dengan era
otonomi daerah dimana sistem ketatanegaraan
bergeser dari sistem sentralisasi ke sistem
desentralisasi. Pada sistem desentralisasi pemerintah
daerah memiliki kewenangan yang lebih besar untuk
mengatur dirinya sendiri. Kebutuhan statistik pada level
kabupaten, dengan demikian, menjadi keniscayaan
sebagai dasar bagi pemerintah daerah untuk menyusun
sistem perencanaan, pemantauan dan penilaian
pembangunan daerah atau kebijakan penting lainnya.
Pendugaan area kecil merupakan konsep terpenting
dalam pendugaan parameter secara tidak langsung di
suatu area yang relatif kecil dalam percontohan survei
(survey sampling). Dalam makalah ini area yang
dimaksud mungkin saja direpresentasikan oleh objek
survei yang jumlahnya sangat kecil sehingga analisis
yang didasarkan hanya pada objek-objek tersebut
menjadi sangat tidak dapat diandalkan sehingga
pendugaan langsung (direct estimation) pada subpopulasi tidak memiliki presisi yang memadai karena

2007 FMIPA Universitas Lampung

kecilnya jumlah contoh yang


memperoleh dugaan tersebut.

digunakan

untuk

Alternatif metode lain adalah dengan cara


menghubungkan area tersebut dengan area lain melalui
model yang tepat. Dengan demikian dugaan tersebut
merupakan dugaan tidak langsung (indirect estimation),
dalam arti bahwa dugaan tersebut mencakup data dari
domain yang lain.
Chand dan Alexander1)
menyebutkan bahwa prosedur pendugaan area kecil
pada dasarnya memanfaatkan kekuatan area sekitarnya
(neighbouring areas) dan sumber data diluar area yang
statistiknya ingin diperoleh. Metode ini memiliki sejarah
yang panjang tetapi baru mendapat perhatian dalam
beberapa dekade terakhir untuk digunakan sebagai
pendekatan pada pendugaan parameter area kecil.
Lebih lanjut pengembangan yang sudah dilakukan
dapat dilihat pada Rao2) .
Dalam makalah ini kita akan mendiskusikan pendugaan
area kecil berdasarkan metode tidak langsung atau
berdasarkan pada model. Salah satu permasalahan
yang ditemukan di dalam penggunaan prosedur ini
adalah ketepatan yang rendah jika model linier
digunakan untuk menyusun model. Penulis, dalam
makalah ini, mengusulkan untuk menggunakan
pendekatan generalized additive mixed model (GAMM)
untuk meningkatkan akurasi pemodelan yang dilakukan.
Pada bagian akhir dari makalah ini juga disajikan kasus
pendugaan area kecil dengan menggunakan data
pengangguran dari Susenas 2005 dan Podes 2005
pada Kota Bogor - Jawa Barat.

145

Anang Kurnia dan Khairil A. Notodiputro... Pendekatan Generalized Additive Mixed Models

1.1. Pendekatan GAMM dalam Pendugaan Area Kecil


Rao2) menyajikan secara intensif ulasan berbagai teknik
dalam small area estimation yang sering digunakan oleh
peneliti maupun pemakai statistika, termasuk
didalamnya teknik atau pendekatan synthetic,
composite estimator, empirical best unbiased linear
predictors, empirical Bayes and hierarchical Bayes.
Seluruh metode-metode tersebut menggunakan
pendekatan parametrik. Dalam bab ini, penulis
mendeskripsikan suatu pendekatan nonparametrik,
generalized additive mixed model (GAMM). Pendekatan
GAMM memiliki keuntungan yang lebih dibandingkan
dengan pendekatan parametrik khususnya dalam
memodelkan pola hubungan peubah respon dengan
peubah penjelas (auxiliary variable). Kelebihan tersebut
yang selanjutkan digunakan penulis untuk pemodelan
yang dilakukan dalam pendugaan area kecil.
Dengan berlandasakan pada model Fay-Herriot pada
basic area level model.
yi = xi + i + ei , i = 1, 2, ..., k
dengan adalah koefisien regresi, i adalah pengaruh
acak area, dan ei adalah sampling error. Dalam model
ini juga diasumsikan bahwa ei ~ (0, Di), i ~ (0, A) dan
keduanya bersifat saling bebas dengan Di biasanya
diasumsikan diketahui. Lebih lengkap pembahasan ini
bisa dilihat pada Rao2) .
Kita asumsikan bahwa yi dan xi memiliki suatu pola
hubungan yang dapat didekati oleh suatu fungsi
pemulus m(.). Untuk X sebagai peubah penjelas, maka
yi = m(xi) + i + ei , i = 1, 2, ..., k
dengan i|X ~ (0, (xi)), ei ~ (0, Di), serta ei dengan i
saling bebas. Fungsi nilai tengah area kecil dapat
dituliskan sebagai berikut:
i(xi) = m(xi) + i
yang merupakan kombinasi linear dari nilai tengah m(xi)
dan pengaruh acak i. Kita dapat menggunakan suatu
teknik pendugaan untuk mendapatkan fungsi pemulus
seperti menggunakan fungsi pemulus linear meliputi
pemulus spline, regresi spline, dan local polynomial
regression. Lebih jelas pembahasan secara teknis
metode-metode tersebut dapat dilihat pada Hastie dan
Tibshirani3) .
Jika digunakan fungsi pemulus kernel untuk menduga
m(xi), penduga terbaik (best predictor) bagi nilai tengah
area kecil i dapat dituliskan sebagai berikut
E(i|yi) = i yi + (1 - i) m
h (xi)
dimana i = (xi) / ((xi) + Di). Pendekatan pendugaan
MSE bagi penduga parameter tersebut dapat dilakukan
dengan mengadopsi pendekatan yang diberikan Prasad
dan Rao4) dengan mensubstitusi xi dalam model
linear campuran dengan m
h (xi), sehingga diperoleh
formulasi sebagai berikut :

146

mse( i )

u2
Di

u2
Di +
-3
u2 + Di mse
u2
2Di2

(1- )2 mse ( m h ( xi )) +

( )

2. METODE PENELITIAN
2.1. Model Dasar Pendugaan Area Kecil
Suatu penduga parameter i dari suatu sub-populasi Wi
secara langsung dapat diperoleh berdasarkan anggota
contoh pada sub-populasi tersebut (direct/design-based
estimator). Metode pendugaan tersebut menimbulkan
dua permasalahan penting. Pertama, penduga tersebut
merupakan penduga tak bias tetapi memiliki ragam yang
besar karena diperoleh dari ukuran contoh yang kecil5) .
Kedua, apabila pada suatu sub-populasi Wi tidak
terwakili didalam survey, maka tidak memungkinkan
dilakukan pendekatan/pendugaan secara langsung.
Fay dan Herriot6) secara umum menggunakan model
linear campuran (linear mixed model) dengan pengaruh
acak yang hanya mengandung intersep, dengan kata
lain model hanya meliputi pengaruh acak area, untuk
menduga rata-rata pendapatan sub-populasi (<1000)
dengan menggunakan data sensus 1970 di Amerika
Serikat.
Model Fay-Herriot tersebut merupakan model dasar
bagi pengembangan pemodelan area kecil yaitu yi = i
+ ei ; i = xi + i, dimana ei dan i saling bebas
dengan E(ei) = E(i) = 0 serta Var(ei) = Di dan Var(i) =
A untuk i = 1, 2, 3, ..., k. Russo7) menjabarkan lebih
lanjut model area kecil dengan memperjelas pengaruh
acak sub-populasi di dalam model sebagai berikut :
1. xi = (xi1, xi2, ..., xip) adalah vektor data penyerta
(auxiliary variable)
2. i = xi + zii untuk i = 1, 2, ..., k : merupakan
parameter yang menjadi perhatian dan
diasumsikan memiliki hubungan dengan data
penyerta pada (1) sedang i pengaruh acak
dengan nilai tengah nol dan ragam A.
3.
4.

i = i + ei : penduga langsung untuk sub-populasi

ke-i dengan sampling error


i = xi + zii + ei untuk i = 1, 2, ..., k : model

tersebut terdiri dari pengaruh acak dan pengaruh


tetap sehingga merupakan bentuk model linear
campuran dengan struktur peragam yang diagonal.

Model regresi merupakan upaya untuk membentuk


model umum dan memanfatkan kekuatan dan
keakuratan pendugaan pada level populasi, sedangkan
deviasi sub-populasi untuk menangkap kekhasan yang
terjadi pada setiap sub-populasi dan bersifat acak.
Dengan demikian jika hanya memanfaatkan informasi
umum maka i = xi, dan jika pengaruh umum dan
lokal kita adopsi, diperoleh i = xi + i. Secara

2007 FMIPA Universitas Lampung

J. Sains MIPA, Desember 2007, Vol. 13, No. 3

statistika model pada point (4) diatas melibatkan


pengaruh acak akibat desain sampling (designedinduced, ei) dan pengaruh acak pemodelan subpopulasi (model-based, i) serta model tersebut
merupakan bentuk khusus dari model linear terampat
(generaizedl linear mixed model).
Ada dua jenis model dasar pada pendugaan area kecil
yang dikembangkan dan dapat dipelajari melalui
beberapa literatur. Jenis pertama disebut basic area
level model. Jenis ini didasarkan pada ketersediaan
data penyerta yang hanya ada untuk level area tertentu,
katakan xi = (x1i, x2i, , xpi) yang akan digunakan untuk
membangun model i = xi + i dengan i ~ N(0, A).
Suatu model yang menggabungkan model berdasarkan

i = i + ei dimana
penarikan contoh yang bersesuaian
i adalah penduga langsung bagi i dan ei|i ~ N(0, Di)

serta Di yang diketahui dengan model i = xi + i


i = xi + i + ei
untuk menghasilkan model gabungan
yang tidak lain adalah suatu bentuk khusus dari model
linear campuran. Namum demikian, basic area level
model memiliki dua keterbatasan8) , yaitu:
asumsi diketahuinya sampling error 2ei yang
sangat membatasi, dan
(ii) asumsi E(ei|i) = 0 mungkin tidak dapat dipenuhi
jika ukuran contoh yang bersesuaian ni kecil dan i
merupakan fungsi nonlinear.

komponen keragaman ini melalui data contoh. Metode


Empirical Best Linear Unbiased Predictor (EBLUP)
menggantikan komponen keragaman yang tidak
diketahui ini dengan menduganya terlebih dahulu9) .
Henderson10) memperlihatkan bahwa menggantikan
komponen keragaman di dalam BLUP dengan
penduganya dapat menimbulkan bias. Tetapi Kackar
dan Harville11) memperlihatkan bahwa 2 pendekatan
(pertama, menduga komponen keragaman kemudian
menggunakannya untuk menduga dan memprediksi
parameter-parameter tetap dan komponen-komponen
acak) dapat menghasilkan penduga yang tidak
berbias9).
Fay

dan

mengembangkan

model

yi = xi + vi + ei
sebagai
dasar
dalam
pengembangan pendugaan area kecil. Selanjutnya
diasumsikan bahwa dan A tidak diketahui, tetapi Di
(i = 1, 2, ...., k) diketahui. Penduga terbaik (best
prediction) bagi i = xi + vi jika dan A diketahui
adalah
'

i BP = i ( y i | , Di )
= xi ' + (1 Bi )( y i xi ' )

(i)

Jenis kedua disebut basic unit level model, dimana


data-data penyerta yang tersedia bersesuaian secara
individu dengan data respon, katakan xij = (x1ij, x2ij, ,
xpij) sehingga bisa dibangun model regresi tersarang yij
= xij + i + ei dengan i ~ N(0, A) dan eij ~ N(0, Di).

Herriot6)

'

dengan Bi = Di / (A + Di) untuk i = 1, 2, ..., k sedangkan


MSE( BP ) = Var(i|yi, , A) = (1 Bi) Di = g1i(A).
i

Dalam prakteknya, baik maupun A biasanya tidak


diketahui sehingga untuk kasus A diketahui, dapat
diduga dengan metode kemungkinan maksimum atau
metode momen * = ( A) =(X`V-1X)-1 X`V-1Y dengan V
i

= Diag(A + D1, A + D2, ..., A + Dk). Kemudian dengan


mensubtitusi dengan * pada BP , maka diperoleh
i

Lebih lanjut pada makalah ini difokuskan terhadap


inferensi pada model basic area level. Ada tiga metode
yang biasa digunakan pada pendugaan area kecil yang
berbasis model, yaitu EBLUP (Empirical Best Linear
Unbiased Predictor), EB (Empirical Bayes) dan HB
(Hierarchical Bayes). Pendugaan titik pada EBLUP tidak
membutuhkan asumsi sebaran, tetapi kenormalan dari
pengaruh acak biasa diasumsikan untuk menduga MSE
(Mean Squared Error) dari pendugaan. Pendugaan
dengan metode EBLUP dan EB bersifat identik
berdasarkan kenormalan dan demikian halnya dengan
pendugaan dengan HB, hanya saja pengukuran
keragaman dari penduganya dapat berbeda8) .
2.2. Metode Empirical Best Linear Unbiased
Predictor (EBLUP)
Best Linear Unbiased Predictor (BLUP) awalnya
dikembangkan dengan mengasumsikan bahwa
komponen keragaman telah diketahui. Dalam
prakteknya, komponen keragaman sangat sulit untuk
diketahui. Untuk itu diperlukan pendugaan terhadap

2007 FMIPA Universitas Lampung

BLUP

= i ( y i | A)

= xi ' * +(1 Bi )( y i xi ' *)


Menurut Ghosh dan Rao12) MSE( i BLUP ) = g1i(A) +
g2i(A), dengan g2i(A) = (D1)2/(A + Di) [Xi`(X`V-1X)-1Xi].
Jika terlebih dahulu A diduga oleh A baik
menggunakan metode ML, REML ataupun momen
sehingga dengan mensubtitusi oleh dan A oleh A
terhadap penduga BLUP ( i BLUP ), maka akan
diperoleh suatu penduga baru

i EBLUP = i ( y i | A )
= xi ' + (1 B i )( yi xi ' )
Jika didefinisikan MSE dari i EBLUP adalah
EBLUP ) = E( i EBLUP - i)2
MSE( i

147

Anang Kurnia dan Khairil A. Notodiputro... Pendekatan Generalized Additive Mixed Models

= Var(

Model Bayes dijelaskan oleh:

i EBLUP )+(Bias i EBLUP )2

persamaan tersebut dapat diuraikan menjadi


EBLUP ) = MSE( i BLUP ) + E( i EBLUP MSE( i
i BLUP )2
= H1i(A) + H2i(A)
dengan
BLUP ) = g (A) + g (A)
H1i(A) = MSE( i
1i
2i
EBLUP BLUP

H2i(A) = E( i
- i
)2
Prasad dan
untuk

Rao4)

menggunakan ekspansi deret Taylor


EBLUP ) dan diperoleh
menduga MSE( i

MSE( i )PR = g1i( A ) + g2i( A ) + 2g3i( A ) dengan

g3i( A )
2 Di
2
m ( A + D )2
i

( A + Di ) 2

j =1

2.3. Metode Empirical Bayes (EB)


Pada metode empirical Bayes, sebaran posterior untuk
parameter yang diamati dari data dinotasikan
f ( i | y i , , A ) adalah hal pertama yang ingin
didapatkan, dengan asumsi parameter model dan A
diketahui. Parameter model diduga oleh sebaran
marginal dari data (yi), dan kesimpulan yang diperoleh
didasarkan pada dugaan sebaran posterior dari i,

.
f i | y i , , A

dengan vi ~N(0, A) dan ei ~N(0, Di ) , ei dan i


saling bebas. A dan diasumsikan tidak diketahui,
tetapi Di (i = 1, 2,, k) diketahui. Best Predictor (BP)
jika

A dan diketahui,

berdasarkan penduga composite pada model FayHerriot, yaitu :


BP = w Y

i
i 1i + (1- w i )Y2i
= xiT + wi ( yi - xi)
= xiT + (1 Bi)( yi - xi)
dengan Bi = Di / (A + Di) untuk i = 1, 2,, k.
B
Misal i merupakan penduga Bayes untuk i dengan
mengikuti model Bayes :
yi |i ~ N(i, Di)
i ~ N(xi, A) adalah sebaran prior untuk i, i = 1, 2, ,
k.

148

1
i xiT
exp
2A
2A
1

f ( y , | , A) =

) dan
2

1
exp
( yi i )2
2
D
2Di
i

i =1

2
1
exp
i xiT
2A
2A

untuk y = (y1, y2, , yk), = (1, 2, , k). Dengan


penurunan aljabar, kita peroleh bahwa :

( i | y i , , A ) ~N

Ay + D x T

i
i i

A
+
D
i

1
1
,
+
D
A
i

A
ADi

~N x i T +
y i x i T ,
A + Di
A + D i

Berdasarkan sebaran tersebut dan dengan pendekatan


the squared error loss (pendugaan Bayes menggunakan
konsep nilai harapan), didapatkan bahwa

iB = E ( i | y i , , A )

= xi + (1 Bi)( yi - xi )
Jika dan A diduga, maka penduga tersebut menjadi
penduga empirical Bayes (EB), yaitu

iEB = E i | y i , , A
T
T
= x i + (1 Bi ) y i x i
dimana ,
EB

y i = x i T + v i + ei

i = x i ' + vi

( i ) =

MSE( i

Model Fay - Herriot untuk model basic area level adalah


sebagai berikut :

dari

exp
( yi i )2 dan
2Di
2 Di

f ( yi | i ) =

= (1 Bi)Di
) =Var i | y i , , A

BP
EB
Penduga i dan i identik untuk kasus normal.

Jika A diketahui, dapat diduga dengan menggunakan


metode maximum likelihood
log L(, V)=-log |V| - (Y -X)T V-1(Y -X) dengan
V = Diag(A + D1, A + D2, , A + Dk). Turunan dari log
L(, V) terhadap adalah
d
log L(, V) = XT V-1 (Y -X)
d
= XT V-1Y (XT V-1X) (=0)
(XT V-1X) = XT V-1Y
= (XT V-1X)-1 XT V-1Y
Dalam praktiknya, baik maupun A biasanya tidak
diketahui. A bisa diduga dengan menggunakan
maximum likelihood (ML), restricted/residual maximum
likelihood (REML), atau metode momen. Pendugaan A
menggunakan REML konsisten meskipun terdapat
pelanggaran asumsi kenormalan13) . Karena maupun
A diduga, maka akan ada keragaman pada pendugaan
yang diperoleh, sehingga MSE yang didapatkan juga
akan meningkat. Untuk mengetahui seberapa besar

2007 FMIPA Universitas Lampung

J. Sains MIPA, Desember 2007, Vol. 13, No. 3

peningkatan MSE akibat adanya pendugaan pada dan


A dapat dihitung menggunakan metode bootstrap14)
maupun metode Jackknife15). Lebih lanjut, perbandingan
berbagai teknik pendugaan MSE dibahas dalam Rao16) .

Model aditif men-general-kan model linear dengan


memodelkan nilai harapan bersyarat sebagai
E(Y|X1Xp) = 0 + s1(X1) + + sp(Xp)
dengan si(X), i = 1,2, ... , p adalah fungsi pemulusan.

2.4. Generalized Additive (Mixed) Model

Dipahami bahwa model linear dan aditif tradisional


dapat digunakan pada sebagian besar analisis data
statistik, namun ada beberapa kasus dimana modelmodel tersebut tidak sesuai untuk digunakan, misalnya
sebaran normal tidak cukup baik untuk memodelkan
peubah diskret seperti data pencacahan atau respon
yang memiliki batas, seperti proporsi. GAM mengatasi
kesulitan tersebut, dengan memperluas penggunaannya
ke sebaran lain selain normal. Dengan demikian, GAM
bisa diaplikasikan untuk masalah analisis data yang
lebih luas.

Analisis regresi merupakan suatu teknik statistik yang


paling luas pemakaiannya. Teknik ini memiliki sifat
pendugaan yang sangat baik (powerful tool) jika asumsiasumsi yang melandasinya terpenuhi, termasuk
didalamnya adalah hubungan antara peubah respon
dengan peubah penjelas dapat digambarkan dengan
suatu fungsi tertentu yang terdefinisi seperti pola garis
lurus, berbentuk polinomial, atau berpola eksponensial.
Didalam banyak aplikasi, bagaimanapun, untuk
memperoleh fungsi-fungsi tersebut secara tepat sangat
sulit bahkan banyak gejala menunjukkan bahwa datadata yang diperoleh tidak menunjukkan suatu pola
hubungan yang mudah untuk digambarkan.
Untuk mengatasi kesulitan-kesulitan di atas, Stone17)
mengajukan penggunaan model aditif. Model ini
menduga pendekatan secara aditif dari fungsi regresi
multivariate. Keuntungan penggunaan pendekatan ini
paling tidak ada dua hal. Pertama, karena setiap suku
aditif diduga secara individu menggunakan pemulus
univariate, maka tidak terjadi masalah curse of
dimensionality. Yang kedua, pendugaan setiap suku
secara individual dapat menjelaskan bagaimana
perubahan variabel respon terhadap perubahan variabel
penjelas.
Untuk memperluas penggunaan model aditif dalam
berbagai keluarga sebaran, Hastie dan Tibshirani3)
mengusulkan model aditif terampat (generalized additive
model, GAM). Model ini menghubungkan nilai harapan
peubah respon dengan prediktor aditif melalui fungsi
hubung yang tak linear. Model ini memungkinkan
sebaran dari peubah respon berasal dari keluarga
sebaran eksponensial. Banyak model statistik yang
termasuk dalam kelas ini, antara lain model aditif untuk
data Gaussian, model logistik non-parametrik untuk data
biner, dan model log-linear non-parametrik untuk data
Poisson.
Misalkan Y adalah peubah acak respon dan X1, X2, ... ,
Xp adalah gugus peubah penjelas. Prosedur regresi
dapat menduga nilai harapan (expected value) dari Y
untuk nili X1, X2, ... , Xp yang telah diketahui. Model
regresi linear standar mengasumsikan bentuk linear dari
nilai harapan bersyarat sebagai berikut
E(Y|X1Xp) = 0 + 1 X1 + + p Xp
Dengan data contoh, penduga bagi 0, 1, , p
umumnya diperoleh dengan menggunakan metode
kuadrat terkecil (least squares method).

2007 FMIPA Universitas Lampung

Sejalan dengan perkembangan teknologi komputasi,


Generalized Additive Mixed Models (GAMM) juga
berkembang untuk melengkapi teknik-teknik pemodelan
khususnya model aditif dengan menyertakan pengaruh
acak ke dalam model. Hal ini merupakan perluasan
secara aditif dari bentuk Generalized Linear Mixed
Models (GLMM) berdasarkan konsep yang
dikembangkan oleh Hastie dan Tibshirani3) .

3. HASIL DAN PEMBAHASAN


Kajian empirik menggunakan dua gugus data. Data
pertama menggunakan data bangkitan yang terdiri dari
32 area kecil dengan i dan ei masing-masing
dibangkitkan dari sebaran normal dengan rataan 0 dan
ragam 1.
Peubah yang menjadi perhatian Y,
didefinisikan sebagai fungsi dari X2 dan X dimana X
adalah peubah penyerta.
Pendekatan GAMM
menunjukkan pendugaan yang lebih baik dibandingkan
dengan teknik EBLUP. Nilai mean absolute relative
estimation (MARE) dari pendekatan GAMM adalah
0.0193 sedangkan pendekatan EBLUP adalah 0.0212.
Lebih lanjut, nilai relative root mean square error
(RRMSE) dari pendekatan GAMM adalah 0.0289
sedangkan pendekatan EBLUP adalah 0.0327
Gugus data kedua, digunakan data yang dikumpulkan
oleh BPS khususnya data PODES 2005 sebagai
sumber peubah penyerta dan data SUSENAS 2005
sebagai data survey, khususnya untuk Kota Bogor.
Peubah yang menjadi perhatian adalah tingkat
pengangguran yang direpresentasikan dengan
persentase tenaga kerja yang tidak sedang bekerja atau
tidak memiliki pekerjaan tetap untuk setiap kelurahan di
Kota Bogor. Persentasi banyaknya penduduk laki-laki
(X2), persentasi rumah tidak permanen (X5), persentasi
surat miskin yang dikeluarkan kelurahan (X7), dan
persentasi keluarga pra sejahtera dan sejahtera 1 (X8)
digunakan sebagai peubah penyerta dalam kajian ini.

149

Anang Kurnia dan Khairil A. Notodiputro... Pendekatan Generalized Additive Mixed Models

Table 1. Pendugaan Tingkat Pengangguran di Kota Bogor

1002
1005
1006
1009
1013
1015
1016
2002
2006
3001
3002
3004
3006
3007
3008
4002
4004

Desa
Pamoyanan
Kertamaya
Rancamaya
Muarasari
Batutulis
Empang
Cikaret
Sindangrasa
Sukasari
Bantarjati
Tegalgundil
Cimahpar
Cibuluh
Kedunghalang
Ciparigi
Gudang
Tegallega

Direct
13.04
8.42
25.00
1.85
6.38
3.33
9.80
1.67
8.33
5.45
6.90
3.28
10.53
9.09
4.88
14.81
2.27

GAMM
12.64
8.86
23.36
1.97
6.46
3.42
9.74
1.75
8.21
5.56
6.98
3.59
10.91
8.94
5.16
14.48
2.53

EBLUP
13.03
8.43
24.94
1.85
6.39
3.34
9.80
1.67
8.33
5.46
6.90
3.29
10.53
9.09
4.88
14.79
2.28

4006
4010
5002
5003
5004
5006
5008
5009
5012
5015
6001
6003
6004
6005
6007
6009
6011

Desa
Sempur
Kebonkelapa
Pasirkuda
Pasirjaya
Gunungbatu
Menteng
Cilendek Barat
Sindangbarang
Situgede
Curugmekar
Kedungwaringin
Kebonpedes
Tanahsareal
Kedungbadak
Sukadamai
Kayumanis
Kencana

Direct
10.94
12.07
20.00
13.51
10.64
10.91
16.67
6.38
4.00
10.42
6.38
9.43
11.54
6.38
12.50
5.45
6.25

GAMM
10.38
12.06
17.60
12.91
10.31
10.91
15.81
6.72
4.24
10.25
6.33
9.55
10.92
6.35
11.99
5.56
6.57

EBLUP
10.93
12.07
19.95
13.49
10.63
10.90
16.64
6.39
4.00
10.41
6.39
9.44
11.53
6.38
12.49
5.47
6.26

Gambar 1. Scater plot peubah penyerta


Tabel 1 menyajikan hasil pendugaan untuk setiap
metode yang digunakan pada gugus data kedua. Nilai
RRMSE untuk pendugaan langsung (direct estimator),
pendekatan GAMM dan EBLUP masing-masing adalah
0.0361, 0.0326 and 0.0335.
Seluruh metode
pendugaan mengarah ke hasil yang diperoleh oleh
teknik pendugaan langsung. Kemungkinan faktor yang

150

menyebabkan hal tersebut yang utama adalah


pengaruh dari kondisi dimana keragaman antar area
kecil yang diamati jauh lebih besar dibandingkan
dengan keragaman akibat sampling error di dalam
setiap area kecil. Walapun demikian, pendekatan
GAMM mampu untuk mereduksi pengaruh peubah
penyerta yang tidak memiliki pola hubungan linear.

2007 FMIPA Universitas Lampung

J. Sains MIPA, Desember 2007, Vol. 13, No. 3

Gambar 1 menyajikan scater plot dari peubah penyerta,


dan peubah X2 serta X7 jelas tidak memiliki hubungan
yang linear.
Kedua peubah tersebut dengan
menggunakan pendekatan GAMM diaproksimasi sesuai
dengan gambaran yang disajikan pada Gambar 1
tersebut.

4. KESIMPULAN
Berdasarkan kajian yang dilakukan, mampu ditunjukkan
keunggulan generalized additive mixed model
dibandingkan dengan generalized linear mixed model di
dalam pendekatan EBLUP, setidaknya dapat ditemukan
dalam dua aspek. Pertama, generalized additive mixed
model bersifat bebas dari asumsi kelinearan hubungan
diantara peubah penyerta dan peubah respon sehingga
mampu untuk mereduksi masalah jika terjadi
ketidaktepatan (misspecification) pemodelan didalam
EBLUP. Aspek yang kedua, dengan kemampuannya
untuk mengelaborasi pengaruh nonlinear dalam model,
generalized additive mixed model mampu untuk mengcover pola-pola yang tersembunyi dari peubah penyerta
dan pada akhirnya akan meningkatkan akurasi dari
pendugaan yang dilakukan.

<www.odh.ohio.gov/Data/OFHSurv/ ofhsrfq7.pdf>,
[25 Mei 2005]
6.

Fay, R.E. and Herriot, R.A. 1979. Estimates of


income for small places: an application of JamesStein procedures to Census data. Journal of the
American Statistical Association, . 74 : 269-277

7.

Russo, C., M. Sabbatini dan R. Salvatore. 2005.


General linear models in small area estimation : an
assessment in agricultural surveys. Paper
presented
in
The
Mexsai
Conference.<www.siap.sagarpa.gob.mx/mexsai/tra
bajos/t44.pdf [29 April 2005]

8.

Rao, J.N.K. 1999. Some Recent Advances in


Model-Based Small Area Estimation. Survey
Methodology 25 (2) : 175-186.

9.

Saei, A. and Chambers, R. 2003. Small area


estimation: A Review of Methods Based on the
Application of Mixed Models. S3RI Methodology
Working Paper M03/16.

UCAPAN TERIMA KASIH

10. Henderson, C.R. 1975. Best linear unbiased


estimation and prediction under selection model.
Biometrics 31 : 423-447.

Penelitian ini merupakan bagian dari penelitian Hibah


Pasca yang dibiayai oleh Direktorat Jenderal Pendidikan
Tinggi Departemen Pendidikan Nasional dengan judul
Hibah Pengembangan Pendugaan Area Kecil dan
Penerapannya pada Data BPS. Oleh karenanya terima
kasih kami ucapkan kepada pihak Dikti dan LPPM-IPB.

11. Kackar, R.N. and Harville, D.A. 1981. Unbiased of


two-stage estimation and prediction procedure for
mixed linear models. Communications in Statistics
Theory and Methods A 10 : 1249-1261.

DAFTAR PUSTAKA

12. Ghosh, M. and Rao, J.N.K. 1994. Small area


estimation : An appraisal. Statistical Science 9(1) :
55-93.

1.

Chand, N. and Alexander, C.H. 1995. Using


Administrative Records for Small Area Estimation
in the American Community Survey. US Bureau of
the census.

13. Jiang, J. 1996. REML estimation: Asymptotic


behavior and related topics. Annals of Statistics 24
: 255-286.

2.

Rao, J.N.K. 2003. Small Area Estimation, New


York : John Wiley and Sons.

3.

Hastie, T. and Tibshirani, R. 1990. Generalized


Additive Models. London: Chapman and Hall.

14. Butar, F.B. and Lahiri, P. 2003. On Measure of


Uncertainty of Empirical Bayes Small Area
Estimator. Journal of Statistical Planning and
Inference 112 : 63-76.

4.

5.

Prasad, N.G.N. and Rao, J.N.K. 1990. The


Estimation of Mean Squared Errors of Small Area
Estimators.
Journal of American Statistical
Association 85 :163-171.
Ramsini, B., Suciu, G., Woodard, S.H., Elliott, M.,
dan Doss, H. 2001. Uninsured Estimates by
County: A Review of Options and Issues.

2007 FMIPA Universitas Lampung

15. Jiang, J., Lahiri, P. and Wan, S.M. 2002. A Unified


Jackknife Theory for Empirical Best Prediction with
M-Estimation. Annals of Statistics 30 : 1782-1810.
16. Rao, J.N.K. 2005. Inferential Issues In Small Area
Estimation: Some New Developments. Statistics In
Transition 7 (3) : 513526.
17. Stone, C.J. 1985. Additive Regression and Other
Nonparametric Models. Annals of Statistics 13 :
689705.

151