Draft Kolokium Nadya Avicena (G151190121) - Signed
Draft Kolokium Nadya Avicena (G151190121) - Signed
DEPARTEMEN STATISTIKA
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
Tujuan Penelitian
Tujuan dari penelitian ini antara lain:
1. Menduga rata-rata pengeluaran per kapita setiap unit area di kota Bogor dengan metode Small
Area Estimation two level model.
2. Menduga frekuensi relatif rumah tangga setiap unit area di kota Bogor dengan metode Small
Area Estimation two level model.
3. Memprediksi nilai gini rasio setiap kecamatan di Kota Bogor berdasarkan nilai dugaan
frekuensi relatif rumah tangga dan pengeluaran rumah tangga setiap unit area.
2. Tinjauan Pustaka
Wilayah Administratif Kota Bogor
Secara admistratif, kota Bogor dikelilingi beberapa kecamatan di wilayah kabupaten
Bogor. Luas wilayah kota Bogor sebesar 11.850 Ha, terdiri dari 6 kecamatan serta 68 kelurahan.
Masing-masing kecamatan tersebut antara lain Bogor Selatan, Bogor Timur, Bogor Utara, Bogor
Tengah, Bogor Barat dan Tanah Sareal (BPS, 2020).
Gini Rasio
Menurut BPS (2020) gini rasio merupakan ukuran tingkat ketimpangan pengeluaran
sebagai proksi pendapatan penduduk. Koefisien gini didasarkan pada kurva lorenz, yaitu sebuah
kurva pengeluaran kumulatif yang membandingkan distribusi dari suatu variabel tertentu
(misalnya pendapatan) dengan distribusi uniform (seragam) yang mewakili persentase kumulatif
penduduk. Koefisien gini berkisar antara 0 sampai 1. Apabila koefisien gini bernilai 0 berarti
pemerataan sempurna, sedangkan apabila bernilai 1 berarti ketimpangan sempurna. Perubahan
gini rasio merupakan indikasi dari adanya perubahan distribusi pengeluaran penduduk, gini rasio
mengalami penurunan berarti distribusi pengeluaran penduduk mengalami perbaikan.
Gini rasio dapat dihitung melalui rumus berikut :
𝑚𝑖
Definisi pengeluaran perkapita menurut BPS (2020) adalah biaya yang dikeluarkan untuk
konsumsi semua anggota rumah tangga selama sebulan dibagi dengan banyaknya anggota rumah
tangga. Pola pengeluaran dapat dipakai sebagai salah satu alat untuk mengukur tingkat
kesejahteraan penduduk, dimana perubahan komposisinya digunakan sebagai petunjuk perubahan
tingkat kesejahteraan. Pada data Survei Sosial Ekonomi Nasional (SUSENAS) 2019, pengeluaran
perkapita tersedia untuk setiap unit rumah tangga, sehingga rata-rata pengeluaran perkapita untuk
masing-masing kelas pengeluaran dihitung berdasarkan persamaan berikut :
𝑛𝑖𝑗
∑𝑘=1 𝑦𝑖𝑗𝑘
𝑦̅𝑖𝑗 = , 𝑖 = 1, … , 𝑙 ; 𝑗 = 1, … , 𝑚𝑖 (2)
𝑁𝑖𝑗
Keterangan :
𝑦̅𝑖𝑗 : Rata-rata pengeluaran perkapita pada kelas pengeluaran ke-j dan kecamatan ke-i
𝑦𝑖𝑗𝑘 : Pengeluaran perkapita rumah tangga ke-k, kelas pengeluaran ke-j dan kecamatan ke-i
𝑁𝑖𝑗 : Jumlah rumah tangga pada kelas pengeluaran ke-j dan kecamatan ke-i
Sehingga proporsi pengeluaran untuk setiap kelas pengeluaran pada masing-masing
kecamatan adalah :
𝑦̅𝑖𝑗 𝑁𝑖𝑗
𝑐𝑖𝑗 = 𝑚𝑖 𝑛𝑖𝑗 , 𝑖 = 1, … , 𝑙 (3)
∑𝑗=1 ∑𝑘=1 𝑦𝑖𝑗𝑘
Dengan 𝑐𝑖𝑗 merupakan proporsi pengeluaran perkapita rumah kelas pengeluaran ke-j dan
kecamatan ke-i. Sedangkan frekuensi relatif rumah tangga menurut kelas pengeluaran dalam hal
ini dapat didefinisikan berdasarkan persamaan berikut :
𝑝𝑖𝑗
𝑓𝑝𝑖𝑗 = , 𝑖 = 1, … , 𝑙 ; 𝑗 = 1, … , 𝑚𝑖 (4)
𝑝𝑖
Keterangan :
𝑓𝑝𝑖𝑗 : Frekuensi relatif rumah tangga kelas pengeluaran ke-j dan kecamatan ke-i
𝑝𝑖𝑗 : Banyaknya rumah tangga pada kelas pengeluaran ke-j dan kecamatan ke-i
𝑝𝑖 : Banyaknya rumah tangga pada kecamatan ke-i
2.19 <300.000
0.00
15.49 300.000 - 499.999
38.96
17.66 500.000 - 749.999
750.000 - 999.999
25.7
1.000.000 - 1.499.999
> 1.499.999
Gambar 1. Persentase Penduduk Kota Bogor Menurut Kelas Pengeluaran Per Kapita
Sebulan Tahun 2019 (BPS, 2020)
Persentase penduduk menurut kelas pengeluaran perkapita pada Gambar 1 didapatkan
dengan pendugaan langsung berdasarkan data SUSENAS 2019. Pendugaan langsung dapat
dilakukan karena survei tersebut dirancang untuk mendapatkan statistik nasional hingga level
kabupaten/kota. Untuk mendapatkan persentase penduduk menurut kelas pengeluaran setiap
kecamatan di kota Bogor, diperlukan ukuran contoh yang lebih banyak. Agar tidak perlu
menambah ukuran contoh, frekuensi relatif rumah tangga dan rata-rata pengeluaran perkapita pada
kelas pengeluaran ke-j untuk masing-masing kecamatan (𝑓𝑝𝑖𝑗 dan 𝑦̅𝑖𝑗 ) akan diduga menggunakan
Small Area Estimation (SAE).
Small Area Estimation (SAE)
Suatu survei dilakukan bertujuan untuk menghasilkan penduga langsung (direct
estimation) suatu parameter untuk populasi dengan tingkat wilayah atau domain tertentu dengan
jumlah contoh yang besar. Jika penduga langsung digunakan untuk domain yang lebih kecil namun
contoh yang tersedia bagi domain tersebut tidak cukup besar, maka akan menghasilkan galat baku
yang besar (Ghosh dan Rao, 1994). Penanganan masalah tersebut dapat diatasi dengan small area
estimation, yaitu dengan menambahkan informasi mengenai parameter yang sama pada area kecil
lain yang memiliki karakteristik serupa, atau nilai pada waktu yang lalu, atau nilai dari peubah
yang memiliki hubungan dengan peubah yang sedang diamati. Teknik pendugaan seperti ini
disebut juga sebagai penduga tak langsung (indirect estimation). Pendekatan statistik untuk
penduga tak langsung berbasiskan model (model based) terbagi menjadi dua, yaitu berdasarkan
model implisit dan eksplisit. Model eksplisit mencakup model berbasis level unit dan model
berbasis level area (Rao, 2003).
a. Model berbasis level area merupakan model yang didasarkan pada ketersediaan data peubah
pendukung (auxiliary variable) yang ada hanya untuk tingkatan area tertentu. Diasumsikan
bahwa peubah yang menjadi perhatian merupakan fungsi rata-rata dari peubah respon, 𝜃𝑖 =
𝑔(𝑌̅𝑖 ) untuk 𝑔( . ) tertentu, yang berhubungan dengan data penyerta area kecil tertentu yaitu
𝑥𝑖 = (𝑥1𝑖 , … , 𝑥𝑝𝑖 )𝑇 dan mengikuti model linier sebagai berikut :
𝜃𝑖 = 𝒙𝒊 𝑻 𝜷 + 𝑧𝑖 𝑣𝑖 , 𝑖 = 1, … , 𝑚 (5)
Dimana 𝑧𝑖 adalah konstanta positif yang diketahui dan 𝛽 = (𝛽1 , … , 𝛽𝑝 )𝑇 adalah vector
kefisien regresi berukuran 𝑝 × 1, sedangkan 𝑣𝑖 adalah pengaruh acak area yang diasumsikan
memiliki distribusi yang identik dan independen dengan 𝐸𝑚 (𝑣𝑖 ) = 0 dan 𝑉𝑚 (𝑣𝑖 ) =
𝜎 2 𝑣 , 𝜎 2 𝑣 ≥ 0. Penduga 𝜃𝑖 bisa diketahui dengan mengasumsikan bahwa penduga langsung
dari 𝜃̂𝑖 ada, yaitu :
𝜃̂𝑖 = 𝜃𝑖 + 𝑒𝑖 , 𝑖 = 1, … , 𝑚
Dengan 𝑒𝑖 ~𝑁(0, 𝜎𝑒2𝑖 ) dan 𝜎𝑒2𝑖 diketahui. Sehingga, dari kedua persamaan diatas didapatkan,
Battese et.al (1998) menggunakan 𝜇𝑖 sebagai parameter target untuk rata-rata area ke i, maka
estimator BLUP adalah sebagai berikut :
̅ 𝒊𝑻𝜷
𝜇̂ 𝑖𝐵𝐿𝑈𝑃 = 𝑿 ̂ + 𝑣̂𝑖 , ̂)
̅𝒊𝒂 𝑻 𝜷
𝑣̂𝑖 = 𝛾𝑖 (𝑦̅𝑖𝑎 − 𝒙 (8)
Dengan
𝒎 𝒎
𝑻 −𝟏
̂ = (∑ 𝑿𝒊 𝑽𝒊
𝜷 −𝟏
𝑿𝒊 ) ∑ 𝑿𝒊 𝑻 𝑽𝒊 −𝟏 𝒚𝒊 )
𝒊=𝟏 𝒊=𝟏
𝑚𝑠𝑒[𝜇̂ 𝑖𝐸𝐵𝐿𝑈𝑃 (𝜎̂𝑣2 , 𝜎̂𝑒2 )] = 𝑔1𝑖 (𝜎𝑣2 , 𝜎𝑒2 ) + 𝑔2𝑖 (𝜎𝑣2 , 𝜎𝑒2 ) + 2𝑔3𝑖 (𝜎𝑣2 , 𝜎𝑒2 ) (11)
Persamaan (16) merupakan penduga tak bias dari 𝑣𝑒𝑐ℎ(𝑉), dimana 𝑣𝑒𝑐ℎ(𝑉) merupakan fungsi
linier 𝜃.
𝐸[(𝑌 − 𝑋𝑍𝛾̂)(𝑌 − 𝑋𝑍𝛾̂)𝑇 ] = 𝑉 − 𝑋𝑍 − 𝑋𝑍(𝑍 𝑇 𝑋 𝑇 𝑉 −1 𝑋𝑍)−1 𝑍 𝑇 𝑋 𝑇 (17)
(𝑌 − 𝑋𝑍𝛾)(𝑌 − 𝑋𝑍𝛾)𝑇 + 𝑋𝑍(𝑍 𝑇 𝑋 𝑇 𝑉 −1 𝑋𝑍)−1 𝑍 𝑇 𝑋 𝑇 (18)
Untuk mendapatkan penduga 𝑉 dan 𝜃 disarankan untuk menggunakan persamaan (18) untuk setiap
iterasi daripada (𝑌 − 𝑋𝑍𝛾)(𝑌 − 𝑋𝑍𝛾)𝑇 .
Berdasarkan persamaan (13) dan dengan menganggap populasi berukuran 𝑁𝑖 pada area
kecil ke 𝑖 besar, maka rata-rata untuk area kecil adalah :
𝑇 𝑇
𝜇𝑖 = 𝑋̅𝑖 𝑍𝑖 𝛾 + 𝑋̅𝑖 𝑣𝑖 (19)
Dimana 𝑋̅𝑖 adalah (𝑝 + 1) vektor rata-rata populasi untuk area kecil ke 𝑖.
Penduga 𝜇̂ 𝑖 didapatkan dengan subtitusi hasil dugaan 𝛾 dan 𝜃 pada persamaan (19).
Prediktor efek acak area kecil ke 𝑖 yaitu 𝑣𝑖 = Ω ̂ 𝑋𝑖 𝑇 𝑉̂𝑖 −1 (𝑌𝑖 − 𝑋𝑖 𝑍𝑖 𝛾̂), dimana 𝑉̂𝑖 −1 = 𝜎̂ −2 𝐼 −
̂ 𝐺̂𝑖 −1 𝑋𝑖 𝑇 dan 𝐺̂𝑖 −1 = (𝐼 + 𝜎̂ −2 𝑋𝑖 𝑇 𝑋𝑖 Ω
𝜎̂ −4 𝑋𝑖 Ω ̂ )−1. Sehingga penduga rata-rata multilevel model
adalah :
𝑇 𝑇
𝜇̂ 𝑖 = 𝑋̅𝑖 𝑍𝑖 𝛾̂ + 𝑋̅𝑖 𝑣̂𝑖 (20)
Battese et al (1981,1988) dalam Moura dan Holt (1999) menggunakan model intercept
acak pada penduga area kecil sebagai berikut :
𝑇
𝜇̂ 𝐼𝐴 = 𝑋̅𝑖 𝛽̂ + 𝑣̂𝑖0 (21)
Digunakan label 𝐼𝐴 untuk menerapkan model (21) jika intercept untuk masing-masing area kecil
acak, sedangkan komponen lainnya pada 𝛽 tetap.
Prasad dan Rao (1990) mengembangkan pendekatan untuk menduga MSE penduga rata-rata
multilevel model yaitu :
𝑀𝑆𝐸(𝜇̂ 𝑖 ) ≈ 𝑇1 + 𝑇2 + 𝑇3 (22)
𝑇1 adalah keragaman dari 𝜇̂ 𝑖 ketika seluruh parameter diketahui, 𝑇2 berdasarkan pendugaan pada
efek tetap dan 𝑇3 didapatkan ketika menduga komponen ragam. Moura dan Holt (1999)
mengembangkan persamaan 2.5.10 berdasarkan hasil simulasi yang dilakukan pada Moura (1994)
dan menghasilkan penduga 𝑀𝑆𝐸(𝜇̂ 𝑖 ) yang serupa yaitu :
̂ (𝜇̂ 𝑖 ) = 𝑇̂1 + 𝑇̂2 + 2𝑇̂3
𝑀𝑆𝐸 (23)
Dimana,
𝑇 −1
𝑇̂1 = 𝑋̅𝑖 (𝐺̂𝑖 )𝑇 Ω
̂ 𝑋̅𝑖
−1
𝑙
−1 𝑇 −1 −1
𝑇̂2 = 𝜎̂ 2 𝑋̅𝑖 (𝐺̂𝑖 ) 𝑍𝑖 (∑ 𝑍𝑖𝑇 𝐺̂𝑖 𝑋𝑖𝑇 𝑋𝑖 𝑍𝑖 ) 𝑍𝑖𝑇 𝐺̂𝑖 𝑋̅𝑖
𝑖=1
−1
Dengan 𝐺̂𝑖 = (𝐼 + 𝜎̂ −2 𝑋𝑖 𝑇 𝑋𝑖 Ω
̂ )−1
𝑠−1 𝑠−1 𝑠−1
−1 −1 −1
𝑇̂3 = 𝑋̅𝑖𝑇 (𝐺̂𝑖 )𝑇 (∑ ∑ 𝑏𝑗𝑘 ∆𝑗 𝐶𝑖 ∆𝑇𝑘 ) 𝐺̂𝑖 𝑋̅𝑖 − 2𝑋̅𝑖𝑇 (𝐺̂𝑖 )𝑇 (∑ 𝑏𝑗,𝑠 ∆𝑗 ) 𝑅𝑖 Ω
̂ 𝑋̅𝑖 + 𝑏𝑠𝑠 𝑋̅𝑖𝑇 Ω
̂ 𝑆𝑖 Ω
̂ 𝑋̅𝑖
𝑗=1 𝑘=1 𝑗=1
−1 −2 −3
Dimana 𝐶𝑖 = 𝜎̂ −2 𝐺̂𝑖 𝑋𝑖𝑇 𝑋𝑖 ; 𝑅𝑖 = 𝜎̂ −4 𝐺̂𝑖 𝑋𝑖𝑇 𝑋𝑖 ; 𝑆𝑖 = 𝜎̂ −6 𝐺̂𝑖 𝑋𝑖𝑇 𝑋𝑖 ; dan
𝜕Ω
∆𝑘 = , 𝑘 = 1, … , 𝑠 − 1
𝜕𝜃𝑘
Merupakan matriks persegi turunan terhadap 𝜃𝑘 dengan ukuran 𝑠 − 1. Sedangkan 𝑏𝑗𝑘 merupakan
elemen invers matriks covarians dari penduga RMLE (Restricted Maximum Likelihood Estimator)
ke 𝑗𝑘 (Harville, 1977) :
𝑚
𝜕𝑉 𝜕𝑉
𝑏𝑗𝑘 = 𝑇𝑟 (∑ 𝑃𝑖 𝑃 )
𝜕𝜃𝑗 𝑖 𝜕𝜃𝑘
𝑖=1
𝑇 𝑇 −1 𝑇 𝑇 −1
Untuk 𝑗 dan 𝑘 = 1, … , 𝑠 dimana 𝑃𝑖 = 𝑉𝑖−1 − 𝑉𝑖−1 𝑋𝑖 𝑍𝑗 (∑𝑚
𝑖=1 𝑍𝑖 𝑋𝑖 𝑉𝑖 𝑋𝑖 𝑍𝑖 )𝑍𝑖 𝑋𝑖 𝑉𝑖 .
3. METODOLOGI
Sumber Data dan Peubah Penelitian
Data yang digunakan dalam penelitian ini bersumber dari SUSENAS 2019 dan potensi desa
(PODES 2019). Data tersebut antara lain:
Tabel 1. Peubah Penelitian dan Sumber Data
Peubah Penelitian Level Sumber
Rata-rata pengeluaran perkapita (Y) Unit area SUSENAS 2019
Banyaknya rumah tangga yang memiliki anggota
1 Unit area SUSENAS 2019
rumah tangga usia 0-4 tahun (Xy)
Langkah Penelitian
Penelitian ini akan dilakukan dengan bantuan software R. Tahapan-tahapan yang akan
dilakukan pada penelitian ini adalah :
1. Penentuan hirarki pada peubah yang digunakan yaitu :
a. Level 1 (unit) : 36 unit area, yaitu kelas pengeluaran ke-j pada kecamatan ke-i, dengan 6
kelas pengeluaran pada 6 kecamatan.
b. Level 2 (kontekstual) : Kecamatan, yaitu 6 kecamatan di Kota Bogor.
2. Menduga rata-rata pengeluaran per kapita setiap unit area.
a. Persiapan data
• Data yang digunakan sebagai peubah respon dan penduga langsung dalam hal ini
adalah rata-rata pengeluaran perkapita level unit area yang dihitung berdasarkan
persamaan (2).
• Data yang digunakan sebagai peubah pendukung banyaknya rumah tangga yang
memiliki anggota rumah tangga usia 0-4 tahun level unit area dan jumlah pengguna
listrik non PLN level kecamatan.
b. Menduga rata-rata pengeluaran perkapita setiap area secara langsung berdasarkan
persamaan (2) dan menghitung RRMSE untuk masing-masing area dengan persamaan
berikut :
√𝑀𝑆𝐸𝐷𝑦
𝑅𝑅𝑀𝑆𝐸𝐷𝑦 = × 100%
𝑦̅̂𝑖𝑗
c. Melakukan pendugaan komponen tetap (𝛾𝑦 ) dan acak 𝜃𝑦 = ([𝑉𝑒𝑐ℎ(Ω)]𝑇 , 𝜎 2 )𝑇
menggunakan algoritma RIGLS (Restricted Iterative Generalized Least Square).
d. Memodelkan dan menduga rata-rata pengeluaran perkapita untuk setiap unit area
menggunakan two level model, serta menghitung RRMSE hasil pendugaan tidak langsung.
e. Membandingkan hasil RRMSE penduga tidak langsung dan secara langsung.
3. Menduga frekuensi relatif rumah tangga setiap unit area dengan tahapan seperti langkah
penelitian 2 dengan data yang digunakan sebagai peubah respon dan penduga langsung dalam
hal ini adalah frekuensi relatif rumah tangga level unit area yang dihitung berdasarkan
persamaan (4). Sedangkan data yang digunakan sebagai peubah pendukung adalah banyaknya
rumah tangga yang memiliki anggota rumah tangga perempuan usia 10-54 tahun berstatus
pernah kawin level unit area dan jumlah minimarket/swalayan level kecamatan.
4. Menghitung gini rasio setiap kecamatan berdasarkan persamaan (1) dengan menggunakan
hasil dugaan rata-rata pengeluaran perkapita dan frekuensi relatif rumah tangga dengan
RRMSE terbaik.
DAFTAR PUSTAKA
Battese, G.E., Harter R.M dan Fuller, W.A. 1988. An Error Component Model for Prediction of
County Crop Areas Using Survei and Satelite Data. Journal of the American Statistical
Association. 83 : 28-36.
[BPS] Badan Pusat Statistik. 2019. Gini Rasio Provinsi. Jakarta. https://bps.go.id.
[BPS] Badan Pusat Statistik. 2020. Gini Rasio Provinsi. Jakarta. https://bps.go.id.
Ghosh, M dan Rao, J.N.K. 1994. Small Area Estimation: An Appraisal. Statistical Science. 9(1) :
55-98.
Goldstein, H. 1989. Restricted Unbiased Iterative Generalized Least Square Estimation.
Biometrika. 76 : 622-623.
Goldstein, H. 1995 Multilevel Statistical Models 2nd edition. London : Arnold.
Harville, D.A. 1977. Maximum Likelihood Approach to Variance Component Estimation and
Related Problems. Journal of The American Statistical Association. 73 : 724-731.
Hox, J.J. 1995. Applied Multilevel Analysis 1st edition. Amsterdam : TT-Publikaties.
Hox, J,J. 2002. Multilevel Analysis. London : Lawrence Earlbaurn Associates.
Kistiana, S., Nasution, S dan Naibaho, M. Faktor Kontekstual dan Individual terhadap Jumlah
Anak Lahir Hidup : Sebuah Analisis Multilevel. Jurnal Kependudukan Indonesia. 15 (1) :
33-48.
Moura, F.A.S dan Holt, D. 1999. Small area estimation using multilevel models. Survei
Methodology. 25: 73-80.
Prasad, N.G.N dan Rao, J.N.K. 1990. The Estimation of the Mean Squared Error of Small Area
Estimators. Journal of the American Statistical Association. 85 : 163-171.
Rao, J.N.K. 2003. Small Area Estimation. New Jersey : John wiley and Sons, Inc.
Rao, J.N.K dan Molina, I. 2015. Small Area Estimation : Second Edition. New Jersey : John wiley
and Sons, Inc.
Tambunan, Tulus. 2001. Perekonomian Indonesia : Teori dan Temuan Empiris. Jakarta : Ghalia
Indonesia.
Todaro, Michael P. 2003. Pembangunan Ekonomi di Dunia Ketiga. Jakarta : Ghalia Indonesia.
Torabi, M dan Rao, J.N.K. 2008. Small Area Estimation under Two Level Model. Survei
Methodologi. 34(1) : 11-17.
Ubaidillah, A., Kurnia, A dan Sadik, K. 2017. Generalized Multilevel Linear Model dengan
Pendekatan Bayesian untuk Pemodelan Data Pengeluaran Perkapita Rumah Tangga. Jurnal
Aplikasi Statistika & Komputasi Statistik. 9 (1).