Draft Kolokium Nadya Avicena (G151190121) - Signed

KOLOKIUM
DEPARTEMEN STATISTIKA
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
Nama : Nadya Avicena

Nrp : G151190121
Program Studi : Statistika
Judul Penelitian : Prediksi Gini Rasio dengan Menduga Komponen Penyusunnya
Berdasarkan Two Level Model Small Area Estimation
(Studi Kasus: Kecamatan di Kota Bogor)
Komisi Pembimbing : 1. Dr. Anang Kurnia, M.Si.
2. Dr. Ir. I Made Sumertajaya, M.Si.
Hari/Tanggal : Selasa, 16 Februari 2021
Waktu : 10.00 – 11.00 WIB
Tempat : Zoom Meeting
1. PENDAHULUAN
Latar Belakang
Sebagai negara berkembang, Indonesia masih mengalami beberapa permasalahan
ekonomi. Menurut Tambunan (2001) dua diantara permasalahan tersebut adalah kesenjangan
ekonomi atau ketimpangan dalam distribusi pendapatan antara kelompok masyarakat
berpendapatan tinggi dan kelompok masyarakat berpendapatan rendah serta tingkat kemiskinan
atau jumlah orang yang berada dibawah garis kemiskinan (poverty line). Ketimpangan pendapatan
adalah perbedaan pendapatan yang dihasilkan masyarakat sehingga terjadi perbedaan pendapatan
yang mencolok dalam masyarakat (Todaro, 2003). Parameter yang digunakan untuk mengukur
ketimpangan pendapatan adalah gini rasio. Gini rasio bernilai antara 0 sampai dengan 1, yang
berarti bahwa semakin kecil nilai gini rasio, mengindikasikan semakin meratanya distribusi
pendapatan, sebaliknya semakin besar nilai gini rasio mengindikasikan distribusi yang semakin
timpang (senjang) antar kelompok penerima pendapatan. Adapun kriteria ketimpangan pendapatan
berdasarkan koefisien gini menurut Todaro (2003) yaitu lebih dari 0,5 adalah tingkat ketimpangan
tinggi, antara 0,35 – 0,5 adalah tingkat ketimpangan sedang, kurang dari 0,35 adalah tingkat
ketimpangan rendah.
Pada tahun 2019, gini rasio Indonesia senilai 0,382 dengan delapan provinsi yang memiliki
angka ketimpangan di atas rasio gini nasional. Provinsi Jawa Barat dengan nilai gini rasio 0,402
menduduki peringkat ketiga gini rasio tertinggi nasional (BPS, 2019). Dari 27 kabupaten/kota di
Jawa Barat, pada tahun 2017 kota Bogor termasuk dalam dua gini rasio tertinggi di Jawa Barat
(0,41). Meskipun gini rasio kota Bogor tergolong sedang, namun masih jauh diatas target prediksi
yang ditentukan oleh pemerintah kota yaitu 0,35. Upaya yang dilakukan pemerintah kota untuk
mengatasi hal tersebut antara lain melalui pemerataan pembangunan yang tepat sasaran di berbagai
sektor. Untuk itu perlu diketahui letak ketimpangan tertinggi hingga level daerah terkecil seperti
kecamatan, namun gini rasio hingga level kecamatan tidak tersedia. Gini rasio dihitung melalui
rumus berikut:
𝑚𝑖
𝑅𝑖 = 1 − ∑ 𝑓𝑝𝑗 (𝐹𝑐𝑗−1 + 𝐹𝑐𝑗 ) , 𝑖 = 1, … , 𝑙

𝑗=1
Dengan 𝑅𝑖 adalah penduga gini rasio setiap kecamatan ke-i, 𝑓𝑝𝑗 adalah frekuensi relatif rumah
tangga pada kelas pengeluaran ke-j dan 𝐹𝑐𝑗 adalah frekuensi kumulatif dari proporsi pengeluaran
dalam kelas pengeluaran ke-j, sehingga 𝑓𝑝𝑗 , 𝐹𝑐𝑗−1 dan 𝐹𝑐𝑗 merupakan komponen penyusun gini
rasio. Untuk tiap kecamatan komponen penyusun tersebut tidak tersedia, maka perlu diduga
dengan menggunakan hasil survei yang dilakukan oleh BPS.
Rata-rata pengeluaran perkapita masing-masing kelas pengeluaran sebagai pembilang
untuk proporsi pengeluaran, dapat diduga dengan menggunakan data survei sosial ekonomi
nasional (SUSENAS). Pada umumnya data SUSENAS memiliki struktur data yang berhirarki
menurut wilayah dengan level terendah (level unit/rumah tangga) dan level yang lebih tinggi
seperti desa/kelurahan, kecamatan, dsb. Frekuensi relatif rumah tangga pada setiap kelas
pengeluaran untuk masing-masing kecamatan juga dapat diduga menggunakan data SUSENAS,
yaitu dengan membagi banyaknya rumah tangga pada kelas pengeluaran ke-j dan kecamatan ke-i,
dengan banyaknya rumah tangga pada kecamatan ke-i. Namun survei yang dilaksanakan oleh BPS
dirancang untuk mengumpulkan data sosial kependudukan yang relatif sangat luas, yaitu untuk
memperoleh statistik nasional hingga pada tingkat kabupaten/kota. Sehingga hasil survei ini tidak
cocok digunakan untuk melakukan pendugaan pada tingkat yang lebih kecil secara langsung
(direct estimation) karena akan muncul persoalan galat baku yang besar, yang disebabkan oleh
ukuran contoh yang tidak memadai.
Salah satu metode yang dikembangkan untuk menangani masalah tersebut adalah Small
Area Estimation (SAE), yaitu melakukan pendugaan dengan informasi-informasi tambahan yang
bisa didapatkan dari area lain yang serupa, survei terdahulu yang dilakukan di area yang sama dan
peubah lain yang berhubungan dengan peubah lain yang ingin diduga (Rao, 2003). Pendugaan
seperti ini disebut dengan pendugaan tidak langsung (indirect estimation). Metode yang sering
digunakan dalam small area estimation salah satunya adalah Emprical Best Linear Unbiased
Prediction (EBLUP). Rao (2003) menyebutkan bahwa terdapat dua tipe model dasar dalam SAE
yang digunakan sebagai basis model pada EBLUP, yaitu model berbasis level area dan model
berbasis level unit. Kedua model tersebut didasarkan pada ketersediaan data pendukung yang
digunakan. Model berbasis level area digunakan jika data pendukung hanya tersedia pada level
area tertentu, sedangkan model berbasis level unit digunakan jika data pendukung yang tersedia
bersesuaian secara individu dengan data respon.
Moura dan Holt (1999) memperkenalkan model multilevel umum untuk SAE dimana
informasi dari peubah pendukung baik yang tersedia pada level unit dan level area dapat
digunakan. Model ini dengan efektif menggabungkan kegunaan dari level unit dan kovariat level
area dalam satu model. Hasil penelitian dari Torabi dan Rao (2008) mengenai perbandingan two
level model dengan penduga GREG (Generalized Regression) menyimpulkan bahwa dengan
meminjam kekuatan dari peubah pendukung level area, two level model menghasilkan performa
yang lebih baik. Pengeluaran perkapita dan frekuensi relatif rumah tangga yang memiliki struktur
data berhirarki, akan memiliki kelebihan jika dimodelkan dengan two level model. Menurut
Goldstein (1995) dan Hox (1995) dalam Ubaidillah, dkk (2017), kelebihan tersebut antara lain
model multilevel dapat digunakan untuk menganalisis informasi dari beberapa tingkatan yang
berbeda menjadi satu analisis statistik dan memperhitungkan variasi setiap tingkat data terhadap
variasi respon. Sehingga memungkinkan peneliti untuk mengetahui variasi di setiap tingkatan data
terhadap variasi respon. Selain itu menurut Hox (2002) dalam Kistiana, dkk (2020), pemilihan
hirarki pada data yang digunakan juga penting untuk dilakukan agar tidak terjadi kesalahan
kontekstual yaitu adanya kesalahan sehubungan dengan korelasi dalam setiap individu yang berada
pada kontekstual (wilayah) yang sama yang dapat menyebabkan bias dalam memperkirakan
parameter. Hirarki pada peubah yang digunakan dalam penelitian ini terdiri dari dua level, yaitu
level 1 (masing-masing kelas pengeluaran pada setiap kecamatan) sebagai peubah level unit dan
level 2 (kecamatan) sebagai peubah kontekstual. Oleh karena itu, penelitian ini bertujuan untuk
memprediksi gini rasio dengan menduga komponen penyusunnya, yaitu frekuensi relatif rumah
tangga dan rata-rata pengeluaran pengeluaran per kapita pada masing-masing kelas pengeluaran
untuk setiap kecamatan di kota Bogor sesuai dengan ketersediaan peubah pendukung level unit
area dan kontekstual (kecamatan).
Tujuan Penelitian
Tujuan dari penelitian ini antara lain:
1. Menduga rata-rata pengeluaran per kapita setiap unit area di kota Bogor dengan metode Small
Area Estimation two level model.
2. Menduga frekuensi relatif rumah tangga setiap unit area di kota Bogor dengan metode Small
Area Estimation two level model.
3. Memprediksi nilai gini rasio setiap kecamatan di Kota Bogor berdasarkan nilai dugaan
frekuensi relatif rumah tangga dan pengeluaran rumah tangga setiap unit area.
2. Tinjauan Pustaka
Wilayah Administratif Kota Bogor
Secara admistratif, kota Bogor dikelilingi beberapa kecamatan di wilayah kabupaten
Bogor. Luas wilayah kota Bogor sebesar 11.850 Ha, terdiri dari 6 kecamatan serta 68 kelurahan.
Masing-masing kecamatan tersebut antara lain Bogor Selatan, Bogor Timur, Bogor Utara, Bogor
Tengah, Bogor Barat dan Tanah Sareal (BPS, 2020).
Gini Rasio
Menurut BPS (2020) gini rasio merupakan ukuran tingkat ketimpangan pengeluaran
sebagai proksi pendapatan penduduk. Koefisien gini didasarkan pada kurva lorenz, yaitu sebuah
kurva pengeluaran kumulatif yang membandingkan distribusi dari suatu variabel tertentu
(misalnya pendapatan) dengan distribusi uniform (seragam) yang mewakili persentase kumulatif
penduduk. Koefisien gini berkisar antara 0 sampai 1. Apabila koefisien gini bernilai 0 berarti
pemerataan sempurna, sedangkan apabila bernilai 1 berarti ketimpangan sempurna. Perubahan
gini rasio merupakan indikasi dari adanya perubahan distribusi pengeluaran penduduk, gini rasio
mengalami penurunan berarti distribusi pengeluaran penduduk mengalami perbaikan.
Gini rasio dapat dihitung melalui rumus berikut :
𝑚𝑖
𝑅𝑖 = 1 − ∑ 𝑓𝑝𝑖𝑗 (𝐹𝑐𝑖𝑗−1 + 𝐹𝑐𝑖𝑗 ) , 𝑖 = 1, … , 𝑙 (1)

𝑗=1
Keterangan :
𝑅𝑖 : Gini rasio kecamatan ke-i
𝑓𝑝𝑖𝑗 : Frekuensi relatif rumah tangga dalam kelas pengeluaran ke-j
𝐹𝑐𝑖𝑗−1 : Frekuensi kumulatif dari proporsi pengeluaran dalam kelas pengeluaran ke- j-1
𝐹𝑐𝑖𝑗 : Frekuensi kumulatif dari proporsi pengeluaran dalam kelas pengeluaran ke-j
Berdasarkan persamaan diatas nilai gini rasio setiap kecamatan dihitung berdasarkan
frekuensi relatif rumah tangga dalam kelas pengeluaran ke-j dan proporsi pengeluaran untuk kelas
pengeluaran ke-j pada kecamatan ke-i. Kelas pengeluaran dalam hal ini berupa interval
pengeluaran yang digunakan oleh BPS dalam Kota Bogor dalam Angka (2020) yaitu sebagai
berikut :
Tabel 1. Kelas Pengeluaran (BPS, 2020)
Kode Kelas Interval Pengeluaran (Rupiah)
1 < 300.000
2 300.000 – 499.999
3 500.000 – 749.999
4 750.000 – 999.999
5 1.000.000 – 1.499.999
6 ≥ 1.500.000
Definisi pengeluaran perkapita menurut BPS (2020) adalah biaya yang dikeluarkan untuk
konsumsi semua anggota rumah tangga selama sebulan dibagi dengan banyaknya anggota rumah
tangga. Pola pengeluaran dapat dipakai sebagai salah satu alat untuk mengukur tingkat
kesejahteraan penduduk, dimana perubahan komposisinya digunakan sebagai petunjuk perubahan
tingkat kesejahteraan. Pada data Survei Sosial Ekonomi Nasional (SUSENAS) 2019, pengeluaran
perkapita tersedia untuk setiap unit rumah tangga, sehingga rata-rata pengeluaran perkapita untuk
masing-masing kelas pengeluaran dihitung berdasarkan persamaan berikut :
𝑛𝑖𝑗
∑𝑘=1 𝑦𝑖𝑗𝑘
𝑦̅𝑖𝑗 = , 𝑖 = 1, … , 𝑙 ; 𝑗 = 1, … , 𝑚𝑖 (2)
𝑁𝑖𝑗
Keterangan :
𝑦̅𝑖𝑗 : Rata-rata pengeluaran perkapita pada kelas pengeluaran ke-j dan kecamatan ke-i
𝑦𝑖𝑗𝑘 : Pengeluaran perkapita rumah tangga ke-k, kelas pengeluaran ke-j dan kecamatan ke-i
𝑁𝑖𝑗 : Jumlah rumah tangga pada kelas pengeluaran ke-j dan kecamatan ke-i
Sehingga proporsi pengeluaran untuk setiap kelas pengeluaran pada masing-masing
kecamatan adalah :
𝑦̅𝑖𝑗 𝑁𝑖𝑗
𝑐𝑖𝑗 = 𝑚𝑖 𝑛𝑖𝑗 , 𝑖 = 1, … , 𝑙 (3)
∑𝑗=1 ∑𝑘=1 𝑦𝑖𝑗𝑘
Dengan 𝑐𝑖𝑗 merupakan proporsi pengeluaran perkapita rumah kelas pengeluaran ke-j dan
kecamatan ke-i. Sedangkan frekuensi relatif rumah tangga menurut kelas pengeluaran dalam hal
ini dapat didefinisikan berdasarkan persamaan berikut :
𝑝𝑖𝑗
𝑓𝑝𝑖𝑗 = , 𝑖 = 1, … , 𝑙 ; 𝑗 = 1, … , 𝑚𝑖 (4)
𝑝𝑖
Keterangan :
𝑓𝑝𝑖𝑗 : Frekuensi relatif rumah tangga kelas pengeluaran ke-j dan kecamatan ke-i
𝑝𝑖𝑗 : Banyaknya rumah tangga pada kelas pengeluaran ke-j dan kecamatan ke-i
𝑝𝑖 : Banyaknya rumah tangga pada kecamatan ke-i
Persentase Penduduk Kota Bogor Menurut

Kelas Pengeluaran Per Kapita Sebulan Tahun 2019
2.19 <300.000
0.00
15.49 300.000 - 499.999
38.96
17.66 500.000 - 749.999
750.000 - 999.999
25.7
1.000.000 - 1.499.999
> 1.499.999
Gambar 1. Persentase Penduduk Kota Bogor Menurut Kelas Pengeluaran Per Kapita
Sebulan Tahun 2019 (BPS, 2020)
Persentase penduduk menurut kelas pengeluaran perkapita pada Gambar 1 didapatkan
dengan pendugaan langsung berdasarkan data SUSENAS 2019. Pendugaan langsung dapat
dilakukan karena survei tersebut dirancang untuk mendapatkan statistik nasional hingga level
kabupaten/kota. Untuk mendapatkan persentase penduduk menurut kelas pengeluaran setiap
kecamatan di kota Bogor, diperlukan ukuran contoh yang lebih banyak. Agar tidak perlu
menambah ukuran contoh, frekuensi relatif rumah tangga dan rata-rata pengeluaran perkapita pada
kelas pengeluaran ke-j untuk masing-masing kecamatan (𝑓𝑝𝑖𝑗 dan 𝑦̅𝑖𝑗 ) akan diduga menggunakan
Small Area Estimation (SAE).
Small Area Estimation (SAE)
Suatu survei dilakukan bertujuan untuk menghasilkan penduga langsung (direct
estimation) suatu parameter untuk populasi dengan tingkat wilayah atau domain tertentu dengan
jumlah contoh yang besar. Jika penduga langsung digunakan untuk domain yang lebih kecil namun
contoh yang tersedia bagi domain tersebut tidak cukup besar, maka akan menghasilkan galat baku
yang besar (Ghosh dan Rao, 1994). Penanganan masalah tersebut dapat diatasi dengan small area
estimation, yaitu dengan menambahkan informasi mengenai parameter yang sama pada area kecil
lain yang memiliki karakteristik serupa, atau nilai pada waktu yang lalu, atau nilai dari peubah
yang memiliki hubungan dengan peubah yang sedang diamati. Teknik pendugaan seperti ini
disebut juga sebagai penduga tak langsung (indirect estimation). Pendekatan statistik untuk
penduga tak langsung berbasiskan model (model based) terbagi menjadi dua, yaitu berdasarkan
model implisit dan eksplisit. Model eksplisit mencakup model berbasis level unit dan model
berbasis level area (Rao, 2003).
a. Model berbasis level area merupakan model yang didasarkan pada ketersediaan data peubah
pendukung (auxiliary variable) yang ada hanya untuk tingkatan area tertentu. Diasumsikan
bahwa peubah yang menjadi perhatian merupakan fungsi rata-rata dari peubah respon, 𝜃𝑖 =
𝑔(𝑌̅𝑖 ) untuk 𝑔( . ) tertentu, yang berhubungan dengan data penyerta area kecil tertentu yaitu
𝑥𝑖 = (𝑥1𝑖 , … , 𝑥𝑝𝑖 )𝑇 dan mengikuti model linier sebagai berikut :
𝜃𝑖 = 𝒙𝒊 𝑻 𝜷 + 𝑧𝑖 𝑣𝑖 , 𝑖 = 1, … , 𝑚 (5)
Dimana 𝑧𝑖 adalah konstanta positif yang diketahui dan 𝛽 = (𝛽1 , … , 𝛽𝑝 )𝑇 adalah vector
kefisien regresi berukuran 𝑝 × 1, sedangkan 𝑣𝑖 adalah pengaruh acak area yang diasumsikan
memiliki distribusi yang identik dan independen dengan 𝐸𝑚 (𝑣𝑖 ) = 0 dan 𝑉𝑚 (𝑣𝑖 ) =
𝜎 2 𝑣 , 𝜎 2 𝑣 ≥ 0. Penduga 𝜃𝑖 bisa diketahui dengan mengasumsikan bahwa penduga langsung
dari 𝜃̂𝑖 ada, yaitu :
𝜃̂𝑖 = 𝜃𝑖 + 𝑒𝑖 , 𝑖 = 1, … , 𝑚
Dengan 𝑒𝑖 ~𝑁(0, 𝜎𝑒2𝑖 ) dan 𝜎𝑒2𝑖 diketahui. Sehingga, dari kedua persamaan diatas didapatkan,
𝜃̂𝑖 = 𝒙𝒊 𝑻 𝜷 + 𝑧𝑖 𝑣𝑖 , +𝑒𝑖 , 𝑖 = 1, … , 𝑚 (6)

yang merupakan bentuk khusus dari model linear campuran atau model Fay-Herriot dalam
small area estimation.
b. Model berbasis unit merupakan suatu model dimana peubah penyerta tersedia untuk masing-
masing anggota populasi ke-j pada setiap area kecil ke i. Peubah respon 𝑦𝑖𝑗 diasumsikan
memiliki hubungan dengan peubah 𝑥𝑖𝑗 = (𝑥𝑖𝑗1 , … , 𝑥𝑖𝑗𝑝 )𝑇 , melalui model berikut :
𝑦𝑖𝑗 = 𝒙𝒊𝒋 𝑻 𝜷 + 𝑣𝑖 + 𝑒𝑖𝑗 , 𝑖 = 1, … , 𝑚, 𝑗 = 1, … , 𝑛𝑖
Dimana j adalah masing-masing anggota populasi pada area ke i, sedangkan 𝑣𝑖 merupakan
pengaruh acak area kecil yang mempunyai sebaran identik dan independen, 𝑒𝑖𝑗 = 𝑘𝑖𝑗 𝑒̃𝑖𝑗 juga
peubah acak dengan sebaran identik dan independen serta saling bebas dengan 𝑣𝑖 , dengan
𝑘𝑖𝑗 diketahui. Kedua peubah tersebut berdistribusi normal dengan 𝑣𝑖 ~𝑁(0, 𝜎𝑣2 ) dan
𝑒𝑖𝑗 ~𝑁(0, 𝜎𝑒2 ).
Empirical Best Linear Unbiased Prediction (EBLUP)
Berdasarkan model berbasis unit yaitu (Rao dan Molina, 2015) :
𝑦𝑖𝑗 = 𝒙𝒊𝒋 𝑻 𝜷 + 𝑣𝑖 + 𝑒𝑖𝑗 𝑖 = 1, … , 𝑚, 𝑗 = 1, … , 𝑛𝑖 (7)
Battese et.al (1998) menggunakan 𝜇𝑖 sebagai parameter target untuk rata-rata area ke i, maka
estimator BLUP adalah sebagai berikut :
̅ 𝒊𝑻𝜷
𝜇̂ 𝑖𝐵𝐿𝑈𝑃 = 𝑿 ̂ + 𝑣̂𝑖 , ̂)
̅𝒊𝒂 𝑻 𝜷
𝑣̂𝑖 = 𝛾𝑖 (𝑦̅𝑖𝑎 − 𝒙 (8)
Dengan
𝒎 𝒎
𝑻 −𝟏
̂ = (∑ 𝑿𝒊 𝑽𝒊
𝜷 −𝟏
𝑿𝒊 ) ∑ 𝑿𝒊 𝑻 𝑽𝒊 −𝟏 𝒚𝒊 )
𝒊=𝟏 𝒊=𝟏
̅𝒊𝒂 adalah rata-rata terboboti,

dan 𝑦̅𝑖𝑎 dan 𝒙
𝑛 𝑛
̅𝒊𝒂 = ∑ 𝑎𝑖𝑗 𝒙𝑖𝑗 / 𝑎𝑖.

𝑦̅𝑖𝑎 = ∑ 𝑎𝑖𝑗 𝑦𝑖𝑗 / 𝑎𝑖. , 𝒙
𝑗=1 𝑗=1
𝑛
𝑎𝑖𝑗 = 𝑘𝑖𝑗 −2 , 𝑎𝑖. = ∑ 𝑎𝑖𝑗

𝑗=1
Pembobot 𝛾𝑖 = 𝜎𝑣2 /(𝜎𝑣2 + 𝜎𝑒2 /𝑎𝑖. ) mengukur keragaman antar area yang tidak bisa dijelaskan
yaitu 𝜎𝑣2 yang relative terhadap keragaman total 𝜎𝑣2 + 𝜎𝑒2 /𝑎𝑖. .
Penduga BLUP mengasumsikan bahwa penduga komponen ragam diketahui, namun pada
kenyataan, komponen ragam tidak diketahui, dan akibatnya ragam pengaruh acak harus diduga.
Pendugaan komponen ragam dilakukan dengan metode kemungkinan maksimum (ML) dan
metode kemungkinan maksimum terkendala (REML). Sehingga penduga EBLUP adalah sebagai
berikut :
𝜇̂ 𝑖𝐸𝐵𝐿𝑈𝑃 = 𝛾̂𝑖 [𝑦̅𝑖𝑎 + (𝑿

̅𝑖 − 𝒙
̅𝒊𝒂 )𝑻 𝜷 ̅ 𝒊𝑻𝜷
̂ ] + (1 − 𝛾̂𝑖 )𝑿 ̂ (9)
Dimana 𝛾̂𝑖 dan 𝜷 ̂ adalah nilai dari 𝛾𝑖 dan 𝜷

̂ Ketika 𝜎𝑣2 dan 𝜎𝑒2 diganti dengan hasil dugaan yaitu
𝜎̂𝑣2 dan 𝜎̂𝑒2 . Mean Square Error (MSE) dari 𝜇̂ 𝑖𝐸𝐵𝐿𝑈𝑃 menurut Rao dan Molina (2015) adalah sebagai
berikut :
𝑀𝑆𝐸(𝜇̂ 𝑖𝐸𝐵𝐿𝑈𝑃 ) = 𝑀𝑆𝐸(𝜇̂ 𝑖𝐵𝐿𝑈𝑃 ) + 𝑔3𝑖 (𝜎𝑣2 , 𝜎𝑒2 ) (10)
dengan,
𝑀𝑆𝐸(𝜇̂ 𝑖𝐵𝐿𝑈𝑃 ) = 𝑔1𝑖 (𝜎𝑣2 , 𝜎𝑒2 ) + 𝑔2𝑖 (𝜎𝑣2 , 𝜎𝑒2 )
Jika 𝜎̂𝑣2 dan 𝜎̂𝑒2 diduga dengan metode REML, maka 𝑚𝑠𝑒[𝜃̂𝑖𝐸𝐵𝐿𝑈𝑃 (𝜎̂𝑣2 , 𝜎̂𝑒2 )] adalah :
𝑚𝑠𝑒[𝜇̂ 𝑖𝐸𝐵𝐿𝑈𝑃 (𝜎̂𝑣2 , 𝜎̂𝑒2 )] = 𝑔1𝑖 (𝜎𝑣2 , 𝜎𝑒2 ) + 𝑔2𝑖 (𝜎𝑣2 , 𝜎𝑒2 ) + 2𝑔3𝑖 (𝜎𝑣2 , 𝜎𝑒2 ) (11)
Jika 𝜎̂𝑣2 dan 𝜎̂𝑒2 diduga dengan metode ML maka :

𝑚𝑠𝑒[𝜇̂ 𝑖𝐸𝐵𝐿𝑈𝑃 (𝜎̂𝑣2 , 𝜎̂𝑒2 )] = 𝑔1𝑖 (𝜎𝑣2 , 𝜎𝑒2 ) + 𝑔2𝑖 (𝜎𝑣2 , 𝜎𝑒2 ) + 2𝑔3𝑖 (𝜎𝑣2 , 𝜎𝑒2 ) − 𝑏𝑀𝐿
𝑇
(𝜎𝑣2 , 𝜎𝑒2 )𝑉̅𝑔1𝑖 (𝜎𝑣2 , 𝜎𝑒2 ) (12)
Two Level Model Small Area Estimation
Untuk memprediksi rata-rata pada area kecil, Moura dan Holt (1999) menggunakan model
multilevel dalam bentuk matriks sebagai berikut :
𝑌𝑖 = 𝑋𝑖 𝛽𝑖 + 𝜀𝑖 , 𝛽ℎ = 𝑍𝛾ℎ + 𝑣ℎ , 𝑖 = 1, 2, … , 𝑙 ; ℎ = 0,1, … , 𝑝 (13)
Dimana 𝑌𝑖 = [𝑦1𝑖 𝑦2𝑖 … 𝑦𝑚𝑖 𝑖 ]𝑇

1 𝑥11𝑖 𝑥21𝑖 ⋯ 𝑥𝑝1𝑖
1 𝑥12𝑖 𝑥22𝑖 ⋯ 𝑥𝑝2𝑖
𝑋𝑖 = [ ⋮ ], 𝛽𝑖 = [𝛽0𝑖 𝛽1𝑖 … 𝛽𝑝𝑖 ]𝑇
⋮ ⋮ ⋱ ⋮
1 𝑥1𝑚𝑖𝑖 𝑥2𝑚𝑖𝑖 ⋯ 𝑥𝑝𝑚𝑖𝑖
1 𝑧11 𝑧21 ⋯ 𝑧𝑞1
1 𝑧12 𝑧22 ⋯ 𝑧𝑞2
𝜀𝑖 = [𝜀1𝑖 𝜀2𝑖 … 𝜀𝑚𝑖𝑖 ]𝑇 , 𝑍=[ ]
⋮ ⋮ ⋮ ⋱ ⋮
1 𝑧1𝑙 𝑧2𝑙 ⋯ 𝑧𝑞𝑙
𝛽ℎ = [𝛽ℎ1 𝛽ℎ2 … 𝛽ℎ𝑙 ]𝑇 , 𝛾ℎ = [𝛾0ℎ 𝛾1ℎ … 𝛾𝑞ℎ ]𝑇 , 𝑣ℎ = [𝑣ℎ1 𝑣ℎ2 … 𝑣ℎ𝑙 ]𝑇
Dengan gabungan dari persamaan (13) sebagai berikut :
𝑌𝑖 = 𝑋𝑖 𝑍𝑖 𝛾 + 𝑋𝑖 𝑣𝑖 + 𝜀𝑖
(14)
Asumsi mengenai distribusi vektor acak 𝑣𝑖 antara lain :
a. 𝑣𝑖 saling bebas antara masing-masing area kecil dan mempunyai distribusi gabungan antar area
kecil dengan 𝐸(𝑣𝑖 ) = 0 dan 𝑉𝑎𝑟(𝑣𝑖 ) = Ω.
b. 𝜀𝑖 dan 𝑣𝑖 saling bebas dengan 𝑉𝑎𝑟(𝜀𝑖 ) = 𝜎 2 𝐼.
Goldstein (1986) dalam Moura dan Holt (1999) menduga parameter komponen tetap (𝛾)
dan acak 𝜃 = ([𝑉𝑒𝑐ℎ(Ω)]𝑇 , 𝜎 2 )𝑇 menggunakan algoritma RIGLS (Restricted Iterative
Generalized Least Square). Algoritma RIGLS adalah berdasarkan fakta bahwa 𝛾 diduga dengan
GLS (Generalized Lesat Square) dengan 𝑉 diketahui, dimana 𝑉 = 𝐷𝑖𝑎𝑔(𝑉1 , … , 𝑉𝑙 ) dan 𝑉𝑖 =
𝜎 2 𝐼 + 𝑋 𝑇 Ω𝑋 yang merupakan matriks covarians dari 𝑦𝑖 , sehingga
−1
𝑙 𝑙
𝑇 𝑇 −1
𝛾̂ = (∑ 𝑍𝑖 𝑋𝑖 𝑉𝑖 𝑋𝑖 𝑍𝑖 ) (∑ 𝑍𝑖 𝑇 𝑋𝑖 𝑇 𝑉𝑖 −1 𝑌𝑖 ) (15)
𝑖=1 𝑖=1
𝑌 ∗ = 𝑣𝑒𝑐ℎ[(𝑌 − 𝑋𝑍𝛾)(𝑌 − 𝑋𝑍𝛾)𝑇 ] (16)
Persamaan (16) merupakan penduga tak bias dari 𝑣𝑒𝑐ℎ(𝑉), dimana 𝑣𝑒𝑐ℎ(𝑉) merupakan fungsi
linier 𝜃.
𝐸[(𝑌 − 𝑋𝑍𝛾̂)(𝑌 − 𝑋𝑍𝛾̂)𝑇 ] = 𝑉 − 𝑋𝑍 − 𝑋𝑍(𝑍 𝑇 𝑋 𝑇 𝑉 −1 𝑋𝑍)−1 𝑍 𝑇 𝑋 𝑇 (17)
(𝑌 − 𝑋𝑍𝛾)(𝑌 − 𝑋𝑍𝛾)𝑇 + 𝑋𝑍(𝑍 𝑇 𝑋 𝑇 𝑉 −1 𝑋𝑍)−1 𝑍 𝑇 𝑋 𝑇 (18)
Untuk mendapatkan penduga 𝑉 dan 𝜃 disarankan untuk menggunakan persamaan (18) untuk setiap
iterasi daripada (𝑌 − 𝑋𝑍𝛾)(𝑌 − 𝑋𝑍𝛾)𝑇 .
Berdasarkan persamaan (13) dan dengan menganggap populasi berukuran 𝑁𝑖 pada area
kecil ke 𝑖 besar, maka rata-rata untuk area kecil adalah :
𝑇 𝑇
𝜇𝑖 = 𝑋̅𝑖 𝑍𝑖 𝛾 + 𝑋̅𝑖 𝑣𝑖 (19)
Dimana 𝑋̅𝑖 adalah (𝑝 + 1) vektor rata-rata populasi untuk area kecil ke 𝑖.
Penduga 𝜇̂ 𝑖 didapatkan dengan subtitusi hasil dugaan 𝛾 dan 𝜃 pada persamaan (19).
Prediktor efek acak area kecil ke 𝑖 yaitu 𝑣𝑖 = Ω ̂ 𝑋𝑖 𝑇 𝑉̂𝑖 −1 (𝑌𝑖 − 𝑋𝑖 𝑍𝑖 𝛾̂), dimana 𝑉̂𝑖 −1 = 𝜎̂ −2 𝐼 −
̂ 𝐺̂𝑖 −1 𝑋𝑖 𝑇 dan 𝐺̂𝑖 −1 = (𝐼 + 𝜎̂ −2 𝑋𝑖 𝑇 𝑋𝑖 Ω
𝜎̂ −4 𝑋𝑖 Ω ̂ )−1. Sehingga penduga rata-rata multilevel model
adalah :
𝑇 𝑇
𝜇̂ 𝑖 = 𝑋̅𝑖 𝑍𝑖 𝛾̂ + 𝑋̅𝑖 𝑣̂𝑖 (20)
Battese et al (1981,1988) dalam Moura dan Holt (1999) menggunakan model intercept
acak pada penduga area kecil sebagai berikut :
𝑇
𝜇̂ 𝐼𝐴 = 𝑋̅𝑖 𝛽̂ + 𝑣̂𝑖0 (21)
Digunakan label 𝐼𝐴 untuk menerapkan model (21) jika intercept untuk masing-masing area kecil
acak, sedangkan komponen lainnya pada 𝛽 tetap.
Prasad dan Rao (1990) mengembangkan pendekatan untuk menduga MSE penduga rata-rata
multilevel model yaitu :
𝑀𝑆𝐸(𝜇̂ 𝑖 ) ≈ 𝑇1 + 𝑇2 + 𝑇3 (22)
𝑇1 adalah keragaman dari 𝜇̂ 𝑖 ketika seluruh parameter diketahui, 𝑇2 berdasarkan pendugaan pada
efek tetap dan 𝑇3 didapatkan ketika menduga komponen ragam. Moura dan Holt (1999)
mengembangkan persamaan 2.5.10 berdasarkan hasil simulasi yang dilakukan pada Moura (1994)
dan menghasilkan penduga 𝑀𝑆𝐸(𝜇̂ 𝑖 ) yang serupa yaitu :
̂ (𝜇̂ 𝑖 ) = 𝑇̂1 + 𝑇̂2 + 2𝑇̂3
𝑀𝑆𝐸 (23)
Dimana,
𝑇 −1
𝑇̂1 = 𝑋̅𝑖 (𝐺̂𝑖 )𝑇 Ω
̂ 𝑋̅𝑖
−1
𝑙
−1 𝑇 −1 −1
𝑇̂2 = 𝜎̂ 2 𝑋̅𝑖 (𝐺̂𝑖 ) 𝑍𝑖 (∑ 𝑍𝑖𝑇 𝐺̂𝑖 𝑋𝑖𝑇 𝑋𝑖 𝑍𝑖 ) 𝑍𝑖𝑇 𝐺̂𝑖 𝑋̅𝑖
𝑖=1
−1
Dengan 𝐺̂𝑖 = (𝐼 + 𝜎̂ −2 𝑋𝑖 𝑇 𝑋𝑖 Ω
̂ )−1
𝑠−1 𝑠−1 𝑠−1
−1 −1 −1
𝑇̂3 = 𝑋̅𝑖𝑇 (𝐺̂𝑖 )𝑇 (∑ ∑ 𝑏𝑗𝑘 ∆𝑗 𝐶𝑖 ∆𝑇𝑘 ) 𝐺̂𝑖 𝑋̅𝑖 − 2𝑋̅𝑖𝑇 (𝐺̂𝑖 )𝑇 (∑ 𝑏𝑗,𝑠 ∆𝑗 ) 𝑅𝑖 Ω
̂ 𝑋̅𝑖 + 𝑏𝑠𝑠 𝑋̅𝑖𝑇 Ω
̂ 𝑆𝑖 Ω
̂ 𝑋̅𝑖
𝑗=1 𝑘=1 𝑗=1
−1 −2 −3
Dimana 𝐶𝑖 = 𝜎̂ −2 𝐺̂𝑖 𝑋𝑖𝑇 𝑋𝑖 ; 𝑅𝑖 = 𝜎̂ −4 𝐺̂𝑖 𝑋𝑖𝑇 𝑋𝑖 ; 𝑆𝑖 = 𝜎̂ −6 𝐺̂𝑖 𝑋𝑖𝑇 𝑋𝑖 ; dan
𝜕Ω
∆𝑘 = , 𝑘 = 1, … , 𝑠 − 1
𝜕𝜃𝑘
Merupakan matriks persegi turunan terhadap 𝜃𝑘 dengan ukuran 𝑠 − 1. Sedangkan 𝑏𝑗𝑘 merupakan
elemen invers matriks covarians dari penduga RMLE (Restricted Maximum Likelihood Estimator)
ke 𝑗𝑘 (Harville, 1977) :
𝑚
𝜕𝑉 𝜕𝑉
𝑏𝑗𝑘 = 𝑇𝑟 (∑ 𝑃𝑖 𝑃 )
𝜕𝜃𝑗 𝑖 𝜕𝜃𝑘
𝑖=1
𝑇 𝑇 −1 𝑇 𝑇 −1
Untuk 𝑗 dan 𝑘 = 1, … , 𝑠 dimana 𝑃𝑖 = 𝑉𝑖−1 − 𝑉𝑖−1 𝑋𝑖 𝑍𝑗 (∑𝑚
𝑖=1 𝑍𝑖 𝑋𝑖 𝑉𝑖 𝑋𝑖 𝑍𝑖 )𝑍𝑖 𝑋𝑖 𝑉𝑖 .
3. METODOLOGI
Sumber Data dan Peubah Penelitian
Data yang digunakan dalam penelitian ini bersumber dari SUSENAS 2019 dan potensi desa
(PODES 2019). Data tersebut antara lain:
Tabel 1. Peubah Penelitian dan Sumber Data
Peubah Penelitian Level Sumber
Rata-rata pengeluaran perkapita (Y) Unit area SUSENAS 2019
Banyaknya rumah tangga yang memiliki anggota
1 Unit area SUSENAS 2019
rumah tangga usia 0-4 tahun (Xy)
Jumlah pengguna listrik non PLN (Zy) Kecamatan PODES 2019

Frekuensi relatif rumah tangga (F) Unit area SUSENAS 2019
Banyaknya rumah tangga yang memiliki anggota
rumah tangga perempuan usia 10-54 tahun berstatus Unit area SUSENAS 2019
2
pernah kawin (Xf)
Jumlah minimarket/swalayan (Zf) Kecamatan PODES 2019
Langkah Penelitian
Penelitian ini akan dilakukan dengan bantuan software R. Tahapan-tahapan yang akan
dilakukan pada penelitian ini adalah :
1. Penentuan hirarki pada peubah yang digunakan yaitu :
a. Level 1 (unit) : 36 unit area, yaitu kelas pengeluaran ke-j pada kecamatan ke-i, dengan 6
kelas pengeluaran pada 6 kecamatan.
b. Level 2 (kontekstual) : Kecamatan, yaitu 6 kecamatan di Kota Bogor.
2. Menduga rata-rata pengeluaran per kapita setiap unit area.
a. Persiapan data
• Data yang digunakan sebagai peubah respon dan penduga langsung dalam hal ini
adalah rata-rata pengeluaran perkapita level unit area yang dihitung berdasarkan
persamaan (2).
• Data yang digunakan sebagai peubah pendukung banyaknya rumah tangga yang
memiliki anggota rumah tangga usia 0-4 tahun level unit area dan jumlah pengguna
listrik non PLN level kecamatan.
b. Menduga rata-rata pengeluaran perkapita setiap area secara langsung berdasarkan
persamaan (2) dan menghitung RRMSE untuk masing-masing area dengan persamaan
berikut :
√𝑀𝑆𝐸𝐷𝑦
𝑅𝑅𝑀𝑆𝐸𝐷𝑦 = × 100%
𝑦̅̂𝑖𝑗
c. Melakukan pendugaan komponen tetap (𝛾𝑦 ) dan acak 𝜃𝑦 = ([𝑉𝑒𝑐ℎ(Ω)]𝑇 , 𝜎 2 )𝑇
menggunakan algoritma RIGLS (Restricted Iterative Generalized Least Square).
d. Memodelkan dan menduga rata-rata pengeluaran perkapita untuk setiap unit area
menggunakan two level model, serta menghitung RRMSE hasil pendugaan tidak langsung.
e. Membandingkan hasil RRMSE penduga tidak langsung dan secara langsung.
3. Menduga frekuensi relatif rumah tangga setiap unit area dengan tahapan seperti langkah
penelitian 2 dengan data yang digunakan sebagai peubah respon dan penduga langsung dalam
hal ini adalah frekuensi relatif rumah tangga level unit area yang dihitung berdasarkan
persamaan (4). Sedangkan data yang digunakan sebagai peubah pendukung adalah banyaknya
rumah tangga yang memiliki anggota rumah tangga perempuan usia 10-54 tahun berstatus
pernah kawin level unit area dan jumlah minimarket/swalayan level kecamatan.
4. Menghitung gini rasio setiap kecamatan berdasarkan persamaan (1) dengan menggunakan
hasil dugaan rata-rata pengeluaran perkapita dan frekuensi relatif rumah tangga dengan
RRMSE terbaik.
DAFTAR PUSTAKA
Battese, G.E., Harter R.M dan Fuller, W.A. 1988. An Error Component Model for Prediction of
County Crop Areas Using Survei and Satelite Data. Journal of the American Statistical
Association. 83 : 28-36.
[BPS] Badan Pusat Statistik. 2019. Gini Rasio Provinsi. Jakarta. https://bps.go.id.
[BPS] Badan Pusat Statistik. 2020. Gini Rasio Provinsi. Jakarta. https://bps.go.id.
Ghosh, M dan Rao, J.N.K. 1994. Small Area Estimation: An Appraisal. Statistical Science. 9(1) :
55-98.
Goldstein, H. 1989. Restricted Unbiased Iterative Generalized Least Square Estimation.
Biometrika. 76 : 622-623.
Goldstein, H. 1995 Multilevel Statistical Models 2nd edition. London : Arnold.
Harville, D.A. 1977. Maximum Likelihood Approach to Variance Component Estimation and
Related Problems. Journal of The American Statistical Association. 73 : 724-731.
Hox, J.J. 1995. Applied Multilevel Analysis 1st edition. Amsterdam : TT-Publikaties.
Hox, J,J. 2002. Multilevel Analysis. London : Lawrence Earlbaurn Associates.
Kistiana, S., Nasution, S dan Naibaho, M. Faktor Kontekstual dan Individual terhadap Jumlah
Anak Lahir Hidup : Sebuah Analisis Multilevel. Jurnal Kependudukan Indonesia. 15 (1) :
33-48.
Moura, F.A.S dan Holt, D. 1999. Small area estimation using multilevel models. Survei
Methodology. 25: 73-80.
Prasad, N.G.N dan Rao, J.N.K. 1990. The Estimation of the Mean Squared Error of Small Area
Estimators. Journal of the American Statistical Association. 85 : 163-171.
Rao, J.N.K. 2003. Small Area Estimation. New Jersey : John wiley and Sons, Inc.
Rao, J.N.K dan Molina, I. 2015. Small Area Estimation : Second Edition. New Jersey : John wiley
and Sons, Inc.
Tambunan, Tulus. 2001. Perekonomian Indonesia : Teori dan Temuan Empiris. Jakarta : Ghalia
Indonesia.
Todaro, Michael P. 2003. Pembangunan Ekonomi di Dunia Ketiga. Jakarta : Ghalia Indonesia.
Torabi, M dan Rao, J.N.K. 2008. Small Area Estimation under Two Level Model. Survei
Methodologi. 34(1) : 11-17.
Ubaidillah, A., Kurnia, A dan Sadik, K. 2017. Generalized Multilevel Linear Model dengan
Pendekatan Bayesian untuk Pemodelan Data Pengeluaran Perkapita Rumah Tangga. Jurnal
Aplikasi Statistika & Komputasi Statistik. 9 (1).

Draft Kolokium Nadya Avicena (G151190121) - Signed

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Draft Kolokium Nadya Avicena (G151190121) - Signed

Diunggah oleh

Hak Cipta:

Format Tersedia

KOLOKIUM

Nama : Nadya Avicena

𝑅𝑖 = 1 − ∑ 𝑓𝑝𝑗 (𝐹𝑐𝑗−1 + 𝐹𝑐𝑗 ) , 𝑖 = 1, … , 𝑙

𝑅𝑖 = 1 − ∑ 𝑓𝑝𝑖𝑗 (𝐹𝑐𝑖𝑗−1 + 𝐹𝑐𝑖𝑗 ) , 𝑖 = 1, … , 𝑙 (1)

Persentase Penduduk Kota Bogor Menurut

𝜃̂𝑖 = 𝒙𝒊 𝑻 𝜷 + 𝑧𝑖 𝑣𝑖 , +𝑒𝑖 , 𝑖 = 1, … , 𝑚 (6)

̅𝒊𝒂 adalah rata-rata terboboti,

̅𝒊𝒂 = ∑ 𝑎𝑖𝑗 𝒙𝑖𝑗 / 𝑎𝑖.

𝑎𝑖𝑗 = 𝑘𝑖𝑗 −2 , 𝑎𝑖. = ∑ 𝑎𝑖𝑗

𝜇̂ 𝑖𝐸𝐵𝐿𝑈𝑃 = 𝛾̂𝑖 [𝑦̅𝑖𝑎 + (𝑿

Dimana 𝛾̂𝑖 dan 𝜷 ̂ adalah nilai dari 𝛾𝑖 dan 𝜷

Jika 𝜎̂𝑣2 dan 𝜎̂𝑒2 diduga dengan metode ML maka :

Dimana 𝑌𝑖 = [𝑦1𝑖 𝑦2𝑖 … 𝑦𝑚𝑖 𝑖 ]𝑇

𝑌 ∗ = 𝑣𝑒𝑐ℎ[(𝑌 − 𝑋𝑍𝛾)(𝑌 − 𝑋𝑍𝛾)𝑇 ] (16)

Jumlah pengguna listrik non PLN (Zy) Kecamatan PODES 2019

Anda mungkin juga menyukai