Proposal Tugas Akhir Muhammad Hanafi Lubis

Anda mungkin juga menyukai

Anda di halaman 1dari 57

PEMODELAN DAN PEMETAAN JUMLAH ANGKATAN

KERJA DI PROVINSI JAWA TENGAH DENGAN

PENDEKATAN GEOGRAPHICALLY WEIGHTED

NEGATIVE BINOMIAL REGRESSION

PROPOSAL TUGAS AKHIR

Disusun Oleh:

MUHAMMAD HANAFI LUBIS

NIM. 24050119130103

DEPARTEMEN STATISTIKA

FAKULTAS SAINS DAN MATEMATIKA

UNIVERSITAS DIPONEGORO

SEMARANG

2023
PEMODELAN DAN PEMETAAN JUMLAH ANGKATAN

KERJA DI PROVINSI JAWA TENGAH DENGAN

PENDEKATAN GEOGRAPHICALLY WEIGHTED

NEGATIVE BINOMIAL REGRESSION

Disusun Oleh:

MUHAMMAD HANAFI LUBIS

NIM. 24050119130103

Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Statistika pada

Departemen Statistika Fakultas Sains dan Matematika

Universitas Diponegoro

DEPARTEMEN STATISTIKA

FAKULTAS SAINS DAN MATEMATIKA

UNIVERSITAS DIPONEGORO

SEMARANG

2023

i
HALAMAN PENGESAHAN I

Proposal Tugas Akhir dengan judul:

Pemodelan dan Pemetaan Jumlah Angkatan Kerja di Provinsi Jawa Tengah

dengan Pendekatan Geographically Weighted Negative Binomial Regression

Disusun oleh:

Nama : Muhammad Hanafi Lubis

NIM : 24050119130103

Departemen : Statistika

Telah diujikan pada sidang Tugas Akhir dan dinyatakan lulus pada

tanggal………(di isi tanggal dinyatakan lulus).

Semarang, (tanggal)

Mengetahui Panitia Penguji Ujian Tugas Akhir


Ketua Departemen Statistika Ketua,
FSM Undip

Dr. Tarno, M.Si (Nama Lengkap +Gelar)


NIP. 196307061991021001 NIP.

ii
HALAMAN PENGESAHAN II

Proposal Tugas Akhir dengan judul :

Pemodelan dan Pemetaan Jumlah Angkatan Kerja di Provinsi Jawa Tengah

dengan Pendekatan Geographically Weighted Negative Binomial Regression

Disusun oleh :

Nama : Muhammad Hanafi Lubis

NIM : 24050119130103

Departemen : Statistika

Telah diperiksa dan disetujui untuk dibuat sebagai Tugas Akhir.

Semarang, 27 Juli 2023

Pembimbing I Pembimbing II

Drs. Agus Rusgiyono, M.Si. Bagus Arya Saputra, S.Si., M.Si.


NIP. 196408131990011001 NIP. H.7.199607092022041001

iii
KATA PENGANTAR

Puji syukur penulis panjatkan kehadirat Allah SWT yang telah

melimpahkan rahmat, hidayah, serta kasih sayang-NYA kepada penulis sehingga

penulisan Proposal Tugas Akhir ini dapat terselesaikan. Proposal Tugas Akhir ini

berjudul “Pemodelan dan Pemetaan Jumlah Angkatan Kerja di Provinsi

Jawa Tengah dengan Pendekatan Geographically Weighted Negative

Binomial Regression” dan bertujuan untuk memenuhi salah satu syarat penulisan

Tugas Akhir pada Departemen Statistika Fakultas Sains dan Matematika

Universitas Diponegoro. Oleh karena itu, pada kesempatan ini penulis ingin

mengucapkan terima kasih kepada :

1. Bapak Dr. Tarno, M.Si, selaku Ketua Departemen Statistika Fakultas Sains dan

Matematika Universitas Diponegoro.

2. Bapak Drs. Agus Rusgiyono, M.Si selaku Dosen Pembimbing I dan Bapak

Bagus Arya Saputra, S.Si, M.Si selaku Dosen Pembimbing II.

3. Bapak dan Ibu Dosen Departemen Statistika Fakultas Sains dan Matematika

Universitas Diponegoro.

4. Semua pihak yang tidak dapat disebutkan satu persatu yang telah mendukung

penulis dalam menyelesaikan penulisan Proposal Tugas Akhir ini.

Penulis menyadari dalam penulisan laporan Tugas Akhir ini terdapat banyak

kekurangan. Oleh karena itu penulis mengharapkan saran dan kritikan yang

bersifat membangun dan semoga penulisan Proposal Tugas Akhir ini dapat

bermanfaat bagi semua pihak.

Semarang, 04 Juli 2023

Penulis

iv
ABSTRAK

(Berisi Latar Belakang pentingnya penelitian ini, metode penelitian secara


ringkas, serta hasil yang didapatkan. Maximal 300 kata)

Kata Kunci: (Maksimal 8 kata)

v
ABSTRACT

(ditulis menggunakan Bahasa Inggris)

Keywords: (ditulis menggunakan bahasa inggris)

vi
DAFTAR ISI

HALAMAN JUDUL........................................................................................ i
HALAMAN PENGESAHAN I ....................................................................... ii
HALAMAN PENGESAHAN II ...................................................................... iii
KATA PENGANTAR ..................................................................................... iv
ABSTRAK ....................................................................................................... v
ABSTRACT ..................................................................................................... vi
DAFTAR ISI .................................................................................................... vii
DAFTAR TABEL ............................................................................................ ix
DAFTAR GAMBAR ....................................................................................... x
DAFTAR LAMPIRAN .................................................................................... xi
BAB I PENDAHULUAN ........................................................................... 1
1.1 Latar Belakang.......................................................................... 1

1.2 Rumusan Masalah .................................................................... 5

1.3 Batasan Masalah ....................................................................... 6

1.4 Tujuan Penelitian ...................................................................... 6


BAB II TINJAUAN PUSTAKA .................................................................. 7
2.1 Angkatan Kerja ......................................................................... 7

2.2 Generalized Linear Model ....................................................... 8

2.3 Uji Multikolinearitas ................................................................. 9

2.4 Regresi Poisson ........................................................................ 10

2.4.1. Distribusi Poisson ......................................................... 10

2.4.2. Model Regresi Poisson ................................................. 12

2.4.3. Estimasi Parameter Model Regresi Poisson ................. 13

2.4.4. Prosedur Komputasi Penaksir Parameter Model Regresi

Poisson .......................................................................... 14

2.4.5. Pengujian Parameter Model Regresi Poisson ............... 15

2.4.6. Pengujian Overdispersi ................................................. 17

vii
2.5 Regresi Binomial Negatif ......................................................... 18

2.5.1. Estimasi Parameter Model Regresi Binomial Negatif .. 20


2.5.2. Prosedur Komputasi Penaksir Parameter Model
Regresi Binomial Negatif .............................................. 23
2.5.3. Pengujian Parameter Model Regresi Binomial Negatif 24
2.6 Pengujian Aspek Spasial ......................................................... 25

2.6.1. Pengujian Heterogenitas Spasial ................................... 26


2.6.2. Pengujian Dependensi Spasial ...................................... 27
2.7 Bandwidth dan Pembobot Optimum ........................................ 28

2.8 Geographically Weighted Negative Binomial Regression ....... 29

2.8.1. Estimasi Parameter Model Geographically Weighted


Negative Binomial Regression ..................................... 30
2.8.2. Pengujian Kesamaan Model GWNBR dengan Regresi
Binomial Negatif ........................................................... 32
2.8.3. Pengujian Parameter Model Geographically Weighted
Negative Binomial Regression ..................................... 33
2.9 Pemilihan Model Terbaik ........................................................ 34
BAB III METODOLOGI PENELITIAN ...................................................... 36
3.1 Jenis dan Sumber Data ............................................................ 36

3.2 Variabel Penelitian .................................................................. 36

3.3 Tahapan Analisis Data ............................................................. 38

3.4 Diagram Alir Analisis Data ..................................................... 40

DAFTAR PUSTAKA ...................................................................................... 42


LAMPIRAN ..................................................................................................... 44

viii
DAFTAR TABEL

Tabel 3.1 Variabel Penelitian ......................................................................... 37

ix
DAFTAR GAMBAR

Gambar 3.1 Diagram Alir Analisis Data ........................................................ 41

x
DAFTAR LAMPIRAN

Lampiran 1. Data Jumlah Angkatan kerja di Provinsi Jawa Tengah Tahun 2021

dan Faktor yang Diduga Memengaruhinya ...................................... 44

Lampiran 2. Data Lintang dan Bujur Masing - Masing Lokasi ........................... 45

xi
BAB I

PENDAHULUAN

1.1 Latar Belakang

Provinsi Jawa Tengah merupakan salah satu provinsi yang terletak di Pulau

Jawa bagian tengah. Provinsi Jawa Tengah masih memiliki permasalahan

ketenagakerjaan yang harus cepat diselesaikan oleh pemerintah. Upaya yang

dilakukan salah satunya yaitu pembangunan dalam bidang ketenagakerjaan,

karena sumber daya manusia memiliki peranan yang sangat penting dalam

pembangunan. Maka dari itu, pembangunan di bidang ketenagakerjaan diharapkan

mampu memberi kontribusi yang nyata untuk meningkatkan kesejahteraan

masyarakat (Prasetyawati, 2016).

Menurut Badan Pusat Statistik (BPS), seseorang digolongkan sebagai

penduduk usia produktif ketika sudah berumur pada rentang 15 – 64 tahun.

Penduduk yang produktif akan membantu dalam segala hal guna untuk kelancaran

dari segi perekonomian dan pembangunan dalam satu wilayah. Menurut UU No.

13 tahun 2003 Bab I pasal 1 ayat 2 Tentang Ketenagakerjaan menyebutkan bahwa

tenaga kerja adalah orang yang mampu menghasilkan barang dan jasa untuk

memenuhi kebutuhan hidupnya sendiri maupun untuk masyarakat. Angkatan kerja

adalah penduduk dengan rentang usia produktif atau usia kerja yang sedang

bekerja, atau punya pekerjaan namun sementara tidak bekerja dan pengangguran.

Sedangkan bukan angkatan kerja didefinisikan sebagai penduduk usia produktif

atau kerja berusia 15 tahun ke atas yang bersekolah atau kuliah, mengurus rumah,

pensiun, atau melakukan kegiatan nonpribadi lainnya. Golongan yang masih

bersekolah dan yang mengurus rumah tangga dapat masuk ke pasar tenaga kerja

1
kapan saja sehingga kelompok ini dapat disebut juga sebagai angkatan kerja

potensial.

Jumlah penduduk yang besar akan menghasilkan angkatan kerja yang besar

pula. Angkatan kerja yang besar jika dapat dimanfaatkan dengan baik akan

mampu meningkatkan kegiatan perekonomian yang pada akhirnya akan

meningkatkan kesejahteraan masyarakat. Namun, hal itu baru dapat dicapai

apabila angkatan kerja seluruhnya terserap oleh kesempatan kerja.

Masalah tenaga kerja adalah masalah yang sangat kompleks dan besar

dikarenakan masalah tenaga kerja mempengaruhi sekaligus dipengaruhi oleh

banyak faktor yang saling berinteraksi dengan pola yang tidak selalu mudah

dipahami. Menurut (Alghofari 2010 dalam Lumi dkk., 2021) pengangguran dapat

terjadi sebagai akibat dari tingginya tingkat perubahan angkatan kerja yang tidak

diimbangi dengan adanya lapangan pekerjaan yang cukup luas serta penyerapan

tenaga kerja yang cenderung kecil persentasenya.

Untuk mengatasi permasalahan angkatan kerja yang berada di Provinsi Jawa

Tengah dapat dilakukan analisis pola penyebaran dan mengidentifikasi faktor-

faktor yang diduga mempengaruhinya. Pada penelitian ini digunakan metode

regresi yang memperhatikan efek spasial data yaitu menggunakan metode

Geographically Weighted Negative Binomial Regression dengan unit penelitian

35 kabupaten/kota di Provinsi Jawa Tengah. Data jumlah angkatan kerja di Jawa

Tengah merupakan data diskrit dan tiap daerah memiliki faktor-faktor yang

mempengaruhi variabel respon yang berbeda sehingga metode Geographically

Weighted Negative Binomial Regression cocok untuk digunakan.

2
Model Geographically Weighted Negative Binomial Regression (GWNBR),

merupakan bentuk lokal dari regresi Binomial Negatif yang menghasilkan

parameter model yang bersifat lokal untuk setiap titik atau lokasi dimana data

tersebut dikumpulkan, dengan mengasumsikan data berdistribusi Binomial

Negatif. Menurut Ricardo dan Calvalho (2013), model Geographically Weighted

Negative Binomial Regression (GWNBR) adalah salah satu metode yang cukup

efektif menduga data yang memiliki heterogenitas spasial yang memiliki

overdispersi. Model Geographically Weighted Negative Binomial Regression

akan menghasilkan penduga parameter lokal dengan masing-masing lokasi akan

memiliki parameter yang berbeda-beda.

Penelitian sebelumnya mengenai jumlah kasus penyakit tuberculosis pernah

dilakukan oleh Wahendra Pratama, dan Sri Pingit Wulandari (2015)

menggunakan metode Geographically Weighted Negative Binomial Regression

(GWNBR) dengan hasil penelitian menghasilkan 5 pengelompokkan

kabupaten/kota berdasarkan variabel yang mempengaruhi. Faktor yang

mempengaruhi jumlah kasus TBC di semua kabupaten/kota di Provinsi Jawa

Barat adalah persentase rumah tangga yang berperilaku hidup bersih dan sehat

(PHBS).

Data jumlah angkatan kerja di Provinsi Jawa Tengah merupakan

data count sehingga analisis yang digunakan untuk memodelkan data count adalah

dengan regresi poisson. Dalam analisis regresi poisson, terdapat asumsi yang

harus terpenuhi yaitu variance dari variabel responnya sama dengan mean. Sering

kali data count memiliki variance yang lebih besar dari mean, atau biasa disebut

fenomena overdispersion (Cameron & Trivedi, 1998). Jika terjadi overdispersi,

3
regresi poisson tidak sesuai untuk memodelkan data. Implikasi dari terjadinya

overdispersi yaitu model regresi Poisson akan menghasilkan estimasi parameter

yang bias. Hal ini disebabkan karena nilai penduga bagi standard eror yang lebih

kecil (underestimate) yang selanjutnya mengakibatkan overestimate signifikansi

dari parameter regresi (Hinde & Dem’etrio, 1998).

Salah satu metode yang digunakan dalam mengatasi overdispersi dalam

regresi poisson adalah regresi binomial negatif. Model regresi Binomial Negatif

dapat mengatasi masalah overdispersi karena tidak mengharuskan nilai mean yang

sama dengan nilai varians seperti pada model regresi Poisson. Hal ini disebabkan,

model tersebut memiliki parameter dispersi yang berguna untuk menggambarkan

variasi dari data, biasa dinotasikan dengan θ.

Model regresi Poisson dan Binomial Negatif termasuk dalam kelompok

Generalized Linear Model (GLM). GLM merupakan perluasan dari proses

pemodelan linier untuk pemodelan data yang mengikuti distribusi probabilitas

selain distribusi normal, seperti: poisson, binomial, multinomial, binomial negatif

dan lain-lain (keluarga eksponensial).

Pada kenyataannya, kondisi geografis, sosial budaya dan ekonomi tentunya

akan berbeda antar wilayah yang satu dengan wilayah yang lain. Hal ini

menggambarkan adanya efek heterogenitas spasial antar wilayah. Pengembangan

model regresi yang memperhatikan faktor heterogenitas spasial yaitu regresi

dengan pembobotan geografi (Geographically Weighted Regression; GWR)

(Fotheringham dkk, 2002). Selanjutnya, jika variabel respon yang diteliti

mengikuti distribusi campuran Poisson-Gamma (Binomial Negatif) maka

4
pengembangannya menjadi Geographically Weighted Negative Binomial

Regression (GWNBR).

Dengan memperhatikan aspek spasial (wilayah) maka digunakan

metode Geographically Weighted Negative Binomial Regression dengan

menggunakan pembobot adaptive bisquare kernel. Penerapan metode

Geographically Weighted Negative Binomial Regression ini diharapkan dapat

dijadikan informasi kepada pemerintahan Provinsi Jawa Tengah untuk membuat

skala prioritas dalam pemberdayaan angkatan kerja berdasarkan faktor-faktor

yang berpengaruh secara signifikan di setiap kabupaten/kota.

1.2 Rumusan Masalah

Berdasarkan latar belakang di atas, maka rumusan masalah dalam penelitian

ini adalah sebagai berikut :

1. Bagaimana gambaran karakteristik jumlah angkatan kerja di Provinsi Jawa

Tengah dan faktor–faktor yang mempengaruhinya menggunakan peta

tematik?

2. Bagaimana pemodelan jumlah angkatan kerja di Provinsi Jawa Tengah dan

faktor-faktor yang mempengaruhinya menggunakan regresi poisson?

3. Bagaimana pemodelan jumlah angkatan kerja di Provinsi Jawa Tengah dan

faktor-faktor yang mempengaruhinya menggunakan regresi binomial

negatif?

4. Bagaimana pemodelan jumlah angkatan kerja di Provinsi Jawa Tengah dan

faktor-faktor yang mempengaruhinya menggunakan metode Geographically

Weighted Negative Binomial Regression dengan pembobot adaptive

bisquare kernel?

5
1.3 Batasan Masalah

Batasan masalah dalam penelitian ini adalah data jumlah angkatan kerja di

35 kabupaten/kota di Provinsi Jawa Tengah tahun 2021 sebagai variabel respon.

Sedangkan variabel prediktor yang digunakan adalah tingkat pengangguran

terbuka, tingkat partisipasi angkatan kerja, kepadatan penduduk, rasio angka

beban ketergantungan, dan distribusi persentase jumlah penduduk. Pada penelitian

ini masalah dibatasi pada penggunaan fungsi pembobot adaptive bisquare kernel

dan tidak bertujuan untuk membandingkan model dengan pembobot yang

berbeda.

1.4 Tujuan Penelitian

Tujuan yang ingin dicapai dari penelitian ini berdasarkan rumusan masalah

yang telah diuraikan di atas adalah sebagai berikut:

1. Mengetahui gambaran karakteristik jumlah angkatan kerja di Provinsi Jawa

Tengah dan faktor–faktor yang mempengaruhinya menggunakan peta

tematik.

2. Mengetahui model jumlah angkatan kerja di Provinsi Jawa Tengah dan

faktor-faktor yang mempengaruhinya menggunakan regresi poisson.

3. Mengetahui model jumlah angkatan kerja di Provinsi Jawa Tengah dan

faktor-faktor yang mempengaruhinya menggunakan regresi binomial

negatif.

4. Mengetahui model jumlah angkatan kerja di Provinsi Jawa Tengah dan

faktor-faktor yang mempengaruhinya menggunakan metode Geographically

Weighted Negative Binomial Regression dengan pembobot adaptive

bisquare kernel.

6
BAB II

TINJAUAN PUSTAKA

2.1 Angkatan Kerja

Angkatan kerja dapat didefinisikan sebagai penduduk yang sudah memasuki

usia kerja, baik yang sudah bekerja, belum bekerja, atau sedang mencari

pekerjaan. Angkatan kerja (labor force) adalah bagian penduduk yang mampu dan

bersedia melakukan pekerjaan. Arti dari mampu adalah mampu secara fisik dan

jasmani, kemampuan mental dan secara yuridis mampu serta tidak kehilangan

kebebasan untuk memilih dan melakukan pekerjaan serta bersedia secara aktif

maupun pasif melakukan dan mencari pekerjaan (Sumarsono, 2004). Angkatan

kerja dibagi ke dalam dua kelompok, yaitu pekerja (employed) dan bukan pekerja

atau pengangguran (unemployed). Pekerja adalah penduduk angkatan kerja yang

benar-benar mendapat pekerjaan penuh, sedangkan pengangguran adalah

penduduk usia kerja tetapi belum mendapatkan kesempatan bekerja.

Selain jumlah penduduk, pertumbuhan angkatan kerja dipengaruhi juga

oleh struktur penduduk berdasarkan jenis kelamin, usia penduduk, dan tingkat

pendidikan. Makin banyak komposisi jumlah penduduk laki-laki dalam suatu

negara, semakin tinggi pula angkatan kerja di negara tersebut, karena ibu rumah

tangga tidak digolongkan sebagai angkatan kerja. Sementara usia penduduk

berpengaruh terhadap jumlah angkatan kerja dalam suatu negara karena semakin

besar jumlah penduduk yang berusia produktif maka semakin tinggi angkatan

kerja. Selanjutnya, semakin rendah tingkat pendidikan suatu negara akan makin

rendah pula angkatan kerja maka saat ini tingkat pendidikan dan keterampilan

7
merupakan salah satu syarat untuk memasuki dunia kerja. Sebagai contoh hasil

SP2000 dengan menggunakan usia 15 tahun ke atas yang termasuk dalam

kelompok bukan angkatan kerja adalah 42,6 juta dari 140 juta atau sekitar 30

persen terdiri dari 21 persen mengurus rumah tangga dan sekolah sekitar 7 persen.

Menurut Chris Manning (1983) analisis data mengenai kegiatan ekonomi

penduduk umumnya menitik beratkan pada alokasi angkatan kerja yang bekerja

menurut sektor, tren perpindahan, (terutama dari sektor pertanian ke sektor lain)

dan penyebab perpindahan tersebut serta implikasinya. Pentingnya pembagian

angkatan kerja yang bekerja menurut sektor dalam pembangunan pertama-tama

dipopulerkan oleh Clark dalam tulisannya Condition of Economic Progres pada

tahun 1931, kemudian diteliti secara seksama dalam berbagai dalam tulisan

Kuznets (1957,1966) terutama dalam tujuanya terhadap sejarah pembangunan di

negara barat. Sumber daya manusia sebagai potensi yang terkandung dalam diri

manusia harus mampu mewujudkan perannya sebagai makhluk sosial yang adaptif

dan transformatif yang mampu mengelola dirinya sendiri serta seluruh potensi

yang terkandung di alam menuju tercapainya kesejahteraan kehidupan dalam

tatanan yang seimbang dan berkelanjutan.

2.2 Generalized Linear Model

Generalized Linear Model (GLM) adalah perluasan dari model regresi

linier dimana sebaran variabel respon merupakan anggota dari keluarga

eksponensial (Nelder dan Wedderburn, 1972; McCullagh dan Nelder, 1989).

Tujuan dari Generalized Linear Model (GLM) yaitu untuk mengetahui pengaruh

dari variabel prediktor terhadap variabel respon (McCulloch, 2001). Keunggulan

GLM dari model linier terletak pada bentuk kurva atau distribusi variabel respon.

8
Variabel respon pada GLM tidak diisyarakatkan berbentuk kurva lonceng

simetris (berditribusi Normal), akan tetapi distribusi-distribusi yang termasuk

dalam distribusi keluarga eksponensial, di antaranya distribusi Poisson,

Gamma, Binomial, Invers Gaussian, Normal, dan Binomial Negatif

(Wedderburn, 1974). Jadi dalam model linier tergeneralisir ada tiga komponen

yang penting yaitu:

1. komponen distribusi, yaitu Y berdistribusi keluarga eksponensial

2. komponen prediktor linier, yaitu

3. fungsi link yaitu fungsi monoton dan diferensiabel g sehingga ( )

atau dalam bentuk yang lebih lengkap yaitu

( ) , ( )- (2.1)

Adanya fungsi link memungkinkan prediktor linier memiliki daerah rentang

seluruh bilangan riil (−∞<x<∞) tetapi respon Y memiliki rentang tertentu

(misalnya 0<y<1 untuk binomial, dan bilangan cacah untuk respon hasil

pencacahan atau count data).

2.3 Uji Multikolinearitas

Multikolinearitas adalah adanya hubungan linear yang sempurna atau pasti

di antara beberapa atau semua variabel (Gujarati, 2009). Sebaiknya

multikolinieritas ini tidak terjadi atau tidak terdapat multikolinieritas diantara

variabel-variabel. Salah satu cara indentifikasi adanya multikolinieritas adalah

menghitung nilai Varians Inflation Factor (VIF ) dengan rumus sebagai berikut

(Gujarati, 2009):

(2.2)

9
Dengan adalah koefisien determinasi antara satu variabel prediktor

dengan variabel prediktor lainnya. Solusi untuk mengatasi adanya kasus

multikolinieritas yaitu dengan mengeluarkan variabel prediktor satu per satu mulai

dari yang memiliki nilai VIF paling besar (Hocking, 1996). Jika nilai Variance

Inflation Factor (VIF) lebih besar dari 10 maka menunjukkan adanya

multikolinieritas antar variabel prediktor.

2.4 Regresi Poisson

Regresi poisson merupakan model regresi nonlinier dengan varibel respon

(Y) mengikuti distribusi poisson untuk mengatasi data count. Dalam hal ini respon

data tersebut berdistribusi Poisson dengan parameter μ . Parameter μ ini sangat

bergantung pada beberapa unit tertentu atau periode dari waktu, jarak, luas area,

volume, dan sebagainya.

2.4.1. Distribusi Poisson

Distribusi Poisson merupakan suatu distribusi untuk peristiwa yang

probabilitas kejadiannya kecil, dimana kejadiannya tergantung pada interval

waktu tertentu atau di suatu daerah tertentu dengan hasil pengamatan berupa

variabel diskrit dan antar variabel saling independen. Interval waktu tersebut dapat

berapa saja panjangnya, misalnya semenit, sehari, seminggu, sebulan atau bahkan

setahun. Daerah tertentu yang dimaksudkan dapat berupa suatu garis, suatu

luasan, suatu volume, atau mungkin sepotong bahan (Walpole, 1995).

Peubah acak Y dikatakan berdistribusi Poisson jika memiliki fungsi

probabilitas sebagai berikut :

( ) ( )

(2.3)

10
dimana adalah suatu parameter yang menyatakan rata – rata banyaknya kejadian

dalam selang atau interval tertentu. Distribusi Poisson dengan parameter biasa

dinotasikan dengan P( ) .

Distribusi Poisson memiliki suatu karakteristik khusus yaitu nilai mean dan

variansi yang sama. Nilai mean dan variansi dari peubah acak Y yang distribusi

Poisson dengan parameter adalah

( ) ∑ ( )


( )


( )

Misalkan , maka diperoleh

( ) ∑
( )

∑ ( ) ( ) (2.4)

Sehingga mean dari distribusi Poisson adalah parameternya yaitu . Selanjutnya

akan dihitung nilai variansi dari distribusi Poisson, yaitu :

( ) ∑ ( )


( )

11
∑ (( ) ) ( )

∑ 20( ) 1 0 13
( ) ( )

0∑ ( ) ∑ 1
( )( ) ( )

0 ∑ ∑ 1
( ) ( )

Misalkan , dan , maka diperoleh

( ) [ ∑ ∑ ]
( ) ( )

[ ∑ ( ) ∑ ( )] , ( ) -

( ) ( ) , ( )-

(2.5)

Sehingga variansi dari distribusi Poisson juga merupakan parameternya bernilai

sama dengan mean yaitu .

2.4.2. Model Regresi Poisson

Dalam penerapannya distribusi Poisson sering digunakan sebagai

distribusi untuk menghitung jumlah kesalahan ketik per halaman dari suatu

laporan, jumlah kecelakaan di suatu jalan tertentu, banyaknya claim pada

perusahaan asuransi, dan jumlah mahkluk hidup di suatu wilayah tertentu.

Jika variabel random diskrit (Y) merupakan distribusi poisson dengan

parameter maka fungsi probabilitas dari distribusi poisson dapat dinyatakan

sebagai berikut (Myers, 1990).

( ) (2.6)

12
dengan merupakan rata-rata variabel respon yang berdistribusi poisson dimana

nilai rata-rata dan varian dari mempunyai nilai lebih dari 0. Regresi Poisson

merupakan penerapan dari GLM yang menggambarkan hubungan antara variabel

terikat Y data diskrit berdistribusi Poisson dengan variabel bebas X. Dengan

menggunakan fungsi link diperoleh model Poisson dalam bentuk sebagai berikut:

( )

dengan,

[ ] [ ]

Maka, model regresi Poisson dapat dituliskan dalam persamaan berikut:

( )

( ) (2.7)

Dengan merupakan rata-rata jumlah kejadian yang terjadi dalam interval waktu

tertentu dan sebagai variabel prediktor serta sebagai parameter regresi yang

akan ditaksir.

2.4.3. Estimasi Parameter Model Regresi Poisson

Metode yang digunakan untuk menduga parameter regresi poisson adalah

metode Maximum Likelihood Estimation (MLE). Metode MLE biasa digunakan

dengan cara memaksimumkan fungsi likelihood (Shafira, 2011). Fungsi

Likelihood dari regresi poisson adalah :

( ) 0∏ 1 (2.8)

13
Dalam model regresi poisson, parameter yang diestimasi adalah

dengan hasil estimasi dilambangkan dengan ̂ . Untuk mendapatkan nilai

estimasi dilakukan dengan cara berikut ini :

1. Mengambil n data sampel random.

2. Membentuk fungsi likelihood dari regresi poisson seperti berikut.

( )
( ) ∏

( ( ))( ( ))

( ∑ ( )( (∑ ))

(2.9)

Fungsi likelihood diubah dalam bentuk logaritma natural. Fungsi

log-likelihood dirumuskan sebagai berikut :

* ( )+ ∑ ∑ ∑ ( ) (2.10)

Kemudian Persamaan (2.10) diturunkan terhadap yang merupakan bentuk

vektor, menjadi

* ( )+

∑ ( ) ∑ (2.11)

2.4.4. Prosedur Komputasi Penaksir Parameter Model Regresi Poisson

( )
Menurut Lawless (2003) misalkan terdapat fungsi-fungsi

dengan maka nilai-nilai yang memenuhi fungsi implisit tersebut

dapat diperoleh melalui iterasi Newton-Raphson sebagai berikut :

a. Menentukan nilai estimasi awal parameter ̂ yaitu

̂ ( ) (2.12)

b. Membentuk vektor gradien g sebagai berikut.

14
( ) ( ) ( )
( ̂ ( ) )( ) [ ] (2.13)
̂( )

adalah banyaknya parameter yang diestimasi.

c. Menentukan matriks Hessian H sebagai berikut.

( ) ( ) ( )

( ) ( ) ( )
( ̂ ( ) )( )( ) (2.14)

( ) ( ) ( )
[ ] ̂( )

d. Mulai dari m = 0 dilakukan iterasi dengan persamaan :

̂( )
̂( ) ( ̂ ( )) ( ̂ ( )) (2.15)

Nilai ̂ ( ) merupakan sekumpulan penaksir parameter yang konvergen pada

iterasi ke-m.

e. Jika belum didapatkan penaksir parameter yang konvergen, maka dilanjutkan

kembali langkah d hingga iterasi ke m = m+1. Iterasi berhenti pada keadaan

konvergen yaitu pada saat ‖ ̂ ( )


̂ ( )‖ .

2.4.5. Pengujian Parameter Model Regresi Poisson

Pengujian parameter model regresi poisson bertujuan untuk menguji

parameter berpengaruh signifikan terhadap variabel respon (Y). Pengujian

signifikansi parameter terdiri dari pengujian serentak dan parsial. Model regresi

Poisson dapat ditulis sebagai berikut (Myers,1990) :

( )

( ∑ )

15
1. Pengujian Secara Serentak

Uji signifikansi secara serentak menggunakan Maximum Likelihood Ratio

Test (MLRT) dengan hipotesis sebagai berikut (McCullagh dan Nelder, 1989) :

paling sedikit ada satu

Statistik uji yang digunakan adalah sebagai berikut :

̂ ̂
(̂) ∑ 0. ̂ / ( ̂ )1 (2.16)

Keterangan :

( ̂ ) : nilai devians model regresi poisson

Kriteria penolakan adalah tolak jika nilai ( ̂ ) ( )


yang artinya minimal

terdapat satu parameter dalam regresi poisson yang berpengaruh signifikan

terhadap variabel respon.

2. Pengujian Secara Parsial

Setelah dilakukan pengujian serentak, dilakukan pengujian secara parsial

untuk mengetahui parameter yang memberikan pengaruh signifikan terhadap

variabel respon dengan hipotesis sebagai berikut :

Statistik uji yang digunakan sebagai berikut :

̂
(2.17)
(̂ )

16
( ̂ ) adalah standar error parameter ̂ didapatkan dari elemen diagonal ke

(k+1) dari (̂) ( ( ̂ )).

Kesimpulan:

Daerah penolakan adalah tolak jika nilai dari | | > yang artinya

parameter tersebut berpengaruh signifikan terhadap variabel respon dalam model

regresi poisson.

2.4.6. Pengujian Overdispersi

Overdispersi dalam regresi poisson terjadi apabila nilai varians data lebih

besar daripada nilai meannya. Jika dalam regresi poisson terjadi overdispersi,

namun tetap menggunakan regresi poisson sebagai metode penyelesaiannya, maka

akan menyebabkan estimasi dari parameter koefisien regresinya tidak efisien. Hal

ini akan berdampak pada nilai standar error menjadi underestimate sehingga

kesimpulan yang diambil tidak valid. Overdispersi dapat dituliskan sebagai

berikut (McCullagh dan Nelder, 1989) :

( )> ( ) (2.18)

Overdispersi dapat dideteksi dengan nilai dispersi Pearson chi Square atau

devians yang dibagi dengan derajat bebasnya. Jika hasil pembagian kedua nilai

tersebut lebih besar dari 1, maka dapat dikatakan terjadi overdispersi. Jika pada

regresi poisson terjadi overdispersi, maka salah satu alternatif yang dapat

digunakan adalah regresi binomial negatif (Hardin dan Hilbe, 2007).

17
2.5 Regresi Binomial Negatif

Kasus overdispersi pada regresi poisson dapat mengakibatkan tingkat

kesalahan model semakin besar dan model regresi poisson menjadi tidak sesuai.

regresi binomial negatif (RBN) berdistribusi binomial negatif untuk memodelkan

data cacah yang mengalami kondisi ekuidispersi maupun yang mengalami

overdispersi (Shafira, 2011).

Model binomial negatif merupakan salah satu solusi untuk mengatasi

masalah overdispersi yang didasarkan pada model campuran Poisson-Gamma

(Hardin & Hilbe 2007). Misalkan Y adalah peubah acak yang bergantung pada

paremeter yang merupakan nilai dari suatu peubah acak Λ dengan fungsi

probabilitas ( ) | merupakan peubah acak yang berdistribusi Poisson dengan

fungsi probabilitas ( | ). Misalkan ( ) merupakan fungsi probabilitas dari Λ

yang berdistribusi Gamma dengan parameter α dan β, sehingga fungsi probabilitas

dari Λ adalah

( ) . /
( )( )

,( ) ( )- . / (2.19)
( )( )

Jika Λ berdistribusi Gamma dengan parameter α dan β, maka akan didapat nilai

harapan serta variansi dari Λ adalah

( )

( )

Pada umumnya, nilai mean dikenal dengan notasi , atau dapat ditulis sebagai

( ) sehingga didapat , misalkan maka dan

18
. Dengan kata lain dapat dikatakan bahwa Λ berdistribusi Gamma dengan

parameter dan , dengan fungsi probabilitas sebagai berikut :

( ) . / (2.20)
. /( )

Fungsi probabilitas bersama antara | dan Λ adalah

( | ) ( ) . /
. /( )

. /
(2.21)
. /( )

fungsi probabilitas marginal dari Y adalah

( ) ∫ ( | ) ( )

. /

. /( )

∫ . /
. /( )

( )
∫ . /
. /( )

( )
∫ . / . / . /
. /( )

( ) ( )
∫ . /. / . /
. /( )

( ) ( )
. / ∫ . /. / (2.22)
. /( )

( )
Misalkan , maka sehingga

Sehingga persamaan ( ) menjadi

19
( ) . / ∫ ( )
. /( )

. / ∫ ( )
. /( )

. / ∫ ( )
. /( )

. / . /
. /( )

. / . / . /
. /( )

( )
. / . / (2.23)
. /

Sehingga diperoleh fungsi probabilitas binomial negatif yaitu :

( )
( ) . / . / (2.24)
. /

Bentuk umum dari regresi binomial negatif adalah :

( )

( ) (2.25)

dengan 𝝁 adalah variabel respon berdistribusi binomial negatif yang berbentuk

vektor dengan ukuran (n x 1), adalah variabel prediktor yang berbentuk matriks

dengan ukuran (n x (p+1)) dan adalah parameter yang berbentuk vektor dengan

ukuran ((p+1) x 1).

2.5.1. Estimasi Parameter Model Regresi Binomial Negatif

Estimasi parameter model regresi binomial negatif menggunakan metode

Maximum Likelihood Estimation dengan prosedur Newton Raphson. Metode ini

20
menggunakan turunan pertama dan kedua dari fungsi likelihood mempunyai

fungsi masa probabilitas distribusi binomial negatif sebagai berikut :

( )
( | ) . / . / (2.26)
. /

Karena fungsinya saling bebas, maka fungsi log-likelihood adalah :

( )
( ) ∏ . / . /
. /

∏ ((∏ ( )) . / . / ) (2.27)

( )
Dengan ∏ ( )
. /

( ) ∏ (∏ ( )) . / . /

( , ) = 𝑙 { ( , )}

∑ [(∑ ( ))] 𝑙 ( ) ( )

( ) ( ) (2.28)

Turunan pertama fungsi log-likelihood terhadap koefisien adalah sebagai

berikut.

( )
∑ 0 . /. /1

∑ . /

21
( )
∑ 0 . /. /1

( )
∑ . / (2.29)

Turunan pertama dari fungsi log-likelihood terhadap parameter dispersi adalah

sebagai berikut.

( )
( )

( )
∑ 0 ∑ ( ) . /1

∑ 0 ∑ 𝑙 ( ) . /1 (2.30)
( )

Turunan parsial kedua untuk parameter adalah sebagai berikut.

( ) ( )
∑ 0( 1
)

( ) ( ) ( )( ) ( )
∑ 0 1 ∑ 0 1 (2,31)
( ) ( )

Turunan kedua dari fungsi log-likelihood terhadap parameter dispersi adalah

sebagai berikut.

( )
( ) ∑ 0 ∑ 𝑙 ( ) 1 (2,32)
( )

Dengan

( )( )
( )

22
2.5.2. Prosedur Komputasi Penaksir Parameter Model Regresi Binomial

Negatif

Langkah – langkah estimasi parameter regresi binomial negatif dilakukan

dengan langkah sebagai berikut (Hilbe, 2011):

a. Menentukan estimasi awal , misal ̂ = 0,1

b. Menentukan estimasi likelihood dari parameter menggunakan prosedur

iterasi Fisher scoring dengan asumsi = ̂

c. Membentuk vektor g

( ) ( ) ( ) ( )
( ̂ ( )) ( )
[ ] (2.33)
̂( )

∑ [ ∑ 𝑙 ( ) ( )]
( )
∑ [( )]
(̂ ( )) ( ) [( )]

∑ [( )]
[ ]

dengan p adalah banyaknya parameter yang diestimasi

d. Membentuk matriks Hessian H

( ) ( ) ( )

( ) ( ) ( )
( ̂ ( ) )( )( ) (2.34)

( ) ( ) ( )
[ ] ̂( )

e. Melakukan iterasi mulai dari m=0 pada persamaan

̂( )
̂( ) ( ̂ ( )) ( ̂ ( )) (2.35)

23
f. Proses iterasi dapat dihentikan ketika nilai estimasi yang diperoleh sudah

konvergen ke suatu nilai atau ̂ ( )


̂( )

g. Jika belum mencapai penaksir yang konvergen, maka diulang kembali pada

langkah e hingga konvergen. Penaksir parameter yang konvergen diperoleh

jika ‖ ̂ ( )
̂ ( )‖ .

2.5.3. Pengujian Parameter Model Regresi Binomial Negatif

Pengujian signifikansi parameter model regresi binomial negatif dengan

model regresi sebagai berikut:

( )

( ∑ )

1. Pengujian Secara Serentak

Uji kesesuaian model regresi binomial negatif dengan serentak sebagai

berikut :

paling sedikit ada satu

Statistik uji yang digunakan adalah sebagai berikut :

̂ ̂
(̂) ∑ 0. ̂ / ( ̂ )1 (2.36)

24
Kriteria penolakan adalah tolak jika nilai ( ̂ ) ( )
yang artinya minimal

terdapat satu parameter dalam regresi binomial negatif yang berpengaruh

signifikan terhadap variabel respon.

2. Pengujian Secara Parsial

Setelah dilakukan pengujian serentak, dilakukan pengujian secara parsial

untuk mengetahui parameter mana saja yang memberikan pengaruh signifikan

terhadap variabel respon dengan hipotesis sebagai berikut :

Statistik uji yang digunakan sebagai berikut :

̂
(2.37)
(̂ )

Kesimpulan:

Daerah penolakan adalah tolak jika nilai dari | | > yang artinya

parameter tersebut berpengaruh signifikan terhadap variabel respon dalam model

regresi binomial negatif.

2.6 Pengujian Aspek Spasial

Regresi spasial merupakan salah satu metode yang digunakan untuk

mengetahui hubungan antara variabel respon dan variabel prediktor dengan

memperhatikan aspek lokasi atau spasial. Aspek spasial yang dimaksud adalah

25
data yang digunakan memiliki error saling berkorelasi dan memiliki heterogenitas

spasial (AnseIin, 1988).

2.6.1. Pengujian Heterogenitas Spasial

Pengujian heterogenitas spasial dilakukan untuk melihat apakah terdapat

kekhasan pada setiap lokasi pengamatan, sehingga parameter regresi yang

dihasilkan berbeda-beda secara spasial. Pengujian heterogenitas spasial ini

dilakukan untuk melihat perbedaan karakteristik antara satu titik pengamatan

dengan titik pengamatan lainnya menyebabkan adanya heterogenitas spasial

(Anselin, 1988). Pengujian heterogenitas spasial dilakukan menggunakan statistik

uji Breusch-Pagan (BP) dengan hipotesis sebagai berikut :

(variansi antar lokasi sama)

(variansi antar lokasi berbeda)

Statistik uji yang digunakan adalah sebagai berikut :

. / ( ) ( )
(2.38)

Keterangan :

( ) dengan
̂

: kuadrat sisaan untuk pengamatan ke-i

26
Z : matriks berukuran n x p yang elemen-elemennya adalah vektor yang telah di

normal standarkan untuk setiap data variabel prediktor

̂ : nilai variansi data respon (Y)

Kesimpulan:

Kriteria penolakan yaitu tolak jika nilai ( )


atau p-value yang

berarti variansi antar lokasi berbeda.

2.6.2. Pengujian Dependensi Spasial

Pengujian dependensi spasial dilakukan untuk melihat pengamatan di

suatu lokasi berpengaruh terhadap pengamatan di lokasi lain yang letaknya

berdekatan. Statistik uji yang sering digunakan dalam autokorelasi spasial adalah

Moran’s I. Moran’s I adalah ukuran hubungan antara pengamatan yang saling

berdekatan.

Hipotesis yang digunakan dalam pengujian dependensi spasial adalah sebagai

berikut :

(tidak ada dependensi spasial)

(terdapat dependensi spasial)

Statistik uji yang digunakan adalah sebagai berikut:

̂ ( ̂)
(2.39)
√ ( ̂)

27
dengan

∑ ∑ ( ̅ )( ̅)
̂ (2.40)
.∑ ∑ /∑ ( ̅)

Keterangan :

n = banyaknya unit spasial dalam analisis

̅ = nilai rata – rata dari dari n lokasi

= nilai pengamatan pada lokasi ke-i

= nilai pengamatan pada lokasi ke-j

= elemen matriks pembobot

Kesimpulan:

Kriteria penolakan yaitu tolak jika nilai | | ( ) yang berarti terdapat

dependensi spasial dalam model.

2.7 Bandwidth dan Pembobot Optimum

Secara teoritis bandwidth merupakan luasan dengan radius h dari titik

pusat lokasi yang digunakan sebagai dasar menentukan bobot setiap pengamatan

terhadap model regresi pada lokasi tersebut. Bandwidth merupakan lingkaran

dengan radius h dari titik lokasi pengamatan ke-i. Lokasi pengamatan terdekat

dengan lokasi ke-i akan memiliki pengaruh yang lebih besar dalam penaksiran

parameter. Pengamatan yang terletak dalam radius h akan diboboti sesuai dengan

fungsi pembobotan yang digunakan. Sedangkan pengamatan yang terletak di luar

28
radius h akan diboboti nol sehingga tidak mempengaruhi penaksiran parameter.

Oleh karena itu, penentuan bandwidth optimum dilakukan menggunakan metode

Cross Validation (CV), yang dirumuskan sebagai berikut :

( ) ∑ ( ̂ ( )) (2.41)

̂ ( ) merupakan nilai penaksir dengan pengamatan lokasi ( )

dihilangkan dari proses penaksiran.

Keragaman spasial yang terjadi pada suatu pengamatan diperlukan matriks

pembobot. Fungsi kernel adaptif yaitu fungi kernel yang memiliki bandwidth

yang berbeda pada setiap lokasi pengamatan. Fungsi pembobot yang digunakan

adalah fungsi adaptive bisquare kernel sebagai berikut :

( . / )
( ) { (2.42)

Dengan √( ) ( ) adalah jarak Euclidean antara lokasi

( ) dengan ( ) dan adalah nilai adaptive bandwidth.

2.8 Geographically Weighted Negative Binomial Regression

Geographically Weighted Negative Binomial Regression (GWNBR)

merupakan metode untuk menduga data yang memiliki heterogenitas spasial pada

data yang overdispersi. GWNBR merupakan pengembangan dari model regresi

binomial negatif yang menghasilkan parameter lokal dengan masing-masing

lokasi yang memiliki parameter berbeda-beda. Model GWNBR dapat dituliskan

sebagai berikut (Ricardo dan Carvalho, 2013) :

29
[ ( ∑ ( ) ) ( )] (2.43)

Keterangan :

= nilai observasi respon ke-i

= nilai observasi variabel prediktor ke-k pada pengamatan lokasi ( )

( ) = koefisien regresi variabel prediktor ke-k untuk setiap lokasi ( )

( ) = parameter dispersi untuk setiap lokasi ( )

Fungsi sebaran binomial negatif untuk tiap lokasi dapat ditulis dalam

persamaan sebagai berikut.

( )
( | ( ) ( ) . / . / (2.44)
. /

Penaksir parameter koefisien GWNBR dilakukan dengan metode maximum

likelihood. Fungsi likelihood yang telah diberi pembobot adalah sebagai berikut.

. | ( ) ( )/

. /
∑ (𝑙 𝑙 ( ) . /( ( )) ( ) (2.45)
. /( )

2.8.1. Estimasi Parameter Model Geographically Weighted Negative

Binomial Regression

Estimasi parameter model GWNBR dilakukan dengan menggunakan

metode Maximum Likelihood Estimation. Fungsi likelihood dapat dituliskan

sebagai berikut (Ricardo dan Carvalho, 2013) :

30
( ( ) | ) ∏ .∏ ( )/ . / . / . /

* ( ( ) | )+

∑ 0∑ ( ) ( ) ( ) . /1

∑ 0∑ . / ( ) . / ( )1 (2.46)

Proses estimasi parameter diperoleh melalui metode iterasi numerik Newton

Raphson. Langkah – langkah yang digunakan adalah sebagai berikut (Hilbe,

2011):

a. Menentukan nilai estimasi awal parameter

̂ , - (2.47)

iterasi pada saat m=0

b. Membentuk vektor g

( ) ( ) ( ) ( )
( ̂ ( )) ( )
[ ] (2.48)
̂( )

dengan p adalah banyaknya parameter yang diestimasi

c. Membentuk matriks Hessian H

( ) ( ) ( )

( ) ( ) ( )
( ̂ ( ) )( )( ) (2.49)

( ) ( ) ( )
[ ] ̂( )

d. Melakukan iterasi mulai dari m=0 pada persamaan

̂( )
̂( ) ( ̂ ( )) ( ̂ ( )) (2.50)

31
e. Proses iterasi dapat dihentikan ketika nilai estimasi yang diperoleh sudah

konvergen ke suatu nilai atau ̂ ( )


̂( )

f. Jika belum mencapai penaksir yang konvergen, maka diulang kembali

pada langkah d hingga konvergen. Penaksir parameter yang konvergen

diperoleh jika ‖ ̂ ( )
̂ ( )‖ .

2.8.2. Pengujian Kesamaan Model GWNBR dengan Regresi Binomial

Negatif

Pengujian kesamaan model GWNBR dengan regresi binomial negatif

dilakukan untuk melihat terdapat perbedaan yang signifikan atau tidak antara

model GWNBR dengan regresi binomial negatif dengan hipotesis berikut.

( )

minimal terdapat satu ( )

Statistik uji:


(2.51)

Dimisalkan model A adalah model binomial negatif dan model B adalah model

GWNBR. Tolak jika ( ) yang artinya bahwa ada

perbedaan yang signifikan antara model binomial negatif dengan model GWNBR.

32
2.8.3. Pengujian Parameter Model Geographically Weighted Negative

Binomial Regression

Pengujian parameter model GWNBR dengan model regresi sebagai

berikut:

[ ( ∑ ( ) ) ( )] (2.52)

1. Pengujian Secara Serentak

Pengujian parameter secara serentak dapat menggunakan Maximum

Likelihood Ratio Test (MLRT). Dengan hipotesis sebagai berikut :

( ) ( ) ( )

paling sedikit ada satu ( )

Statistik uji yang digunakan adalah sebagai berikut :

̂ ̂
(̂) ∑ 0. ̂ / ( ̂ )1 (2.53)

Kriteria penolakan adalah tolak jika nilai ( ̂ ) ( )


yang artinya minimal

terdapat satu parameter dalam model GWNBR yang berpengaruh signifikan

terhadap variabel respon.

2. Pengujian Secara Parsial

Setelah dilakukan pengujian serentak, dilakukan pengujian secara parsial

untuk mengetahui parameter mana saja yang memberikan pengaruh signifikan

terhadap variabel respon pada tiap – tiap lokasi dengan hipotesis sebagai berikut :

33
( )

( )

Statistik uji yang digunakan sebagai berikut :

̂ ( )
(2.54)
(̂ ( ))

Kesimpulan:

Daerah penolakan adalah tolak jika nilai dari | | > yang artinya

parameter tersebut berpengaruh signifikan terhadap variabel respon pada tiap –

tiap lokasi dalam model GWNBR.

2.9 Pemilihan Model Terbaik

Salah satu tujuan dalam analisis regresi adalah untuk mendapatkan model

terbaik dari sejumlah kemungkinan model. Model terbaik merupakan model yang

mampu menjelaskan hubungan antara variabel prediktor dengan variabel respon

berdasarkan kriteria tertentu. Kriteria yang sering digunakan untuk mendapatkan

model terbaik adalah nilai Akaike Information Criterion (AIC).

Nilai AIC adalah kriteria kesesuaian model dalam menduga model secara

statistik. Kriteria AIC digunakan apabila pemodelan regresi bertujuan untuk

mengidentifikasi faktor-faktor yang berpengaruh terhadap model. Besarnya nilai

AIC sejalan dengan nilai devians dari model. Semakin kecil nilai devians maka

akan semakin kecil pula tingkat kesalahan yang dihasilkan model sehingga model

yang diperoleh menjadi semakin tepat. Nilai AIC dapat dirumuskan sebagai

berikut (Collet, 1994).

34
. ̂ ( ̂)/ (2.55)

Keterangan :

̂ ( ̂) = nilai likelihood

= jumlah parameter pada setiap model yang terentu

35
BAB III

METODOLOGI PENELITIAN

3.1 Jenis dan Sumber Data

Data yang digunakan dalam penelitian ini adalah data sekunder yang

bersumber dari Badan Pusat Statistik (BPS) Provinsi Jawa Tengah yaitu data

tenaga kerja tahun 2021. Sumber utama data ketenagakerjaan adalah Survei

Angkatan Kerja Nasional (Sakernas). Survei Angkatan Kerja Nasional (Sakernas)

adalah survei yang diselenggarakan oleh Badan Pusat Statistik (BPS) yang

dirancang khusus untuk mengumpulkan data yang dapat menggambarkan keadaan

umum ketenagakerjaan antar periode pencacahan.

Penelitian ini mencakup 35 kabupaten/kota di Provinsi Jawa Tengah dan

menggunakan variabel lokasi berupa koordinat garis lintang dan garis bujur pada

setiap titik pusat (centroid) lokasi untuk melakukan analisis berbasis spasial.

Mengingat data yang digunakan merupakan data sekunder, maka diasumsikan

bahwa alat ukur yang digunakan telah tervalidasi dan petugas sudah mengisi

dengan benar.

3.2 Variabel Penelitian

Dalam penelitian ini, variabel yang digunakan yaitu variabel respon (Y)

dan variabel prediktor (X) setiap kabupaten/kota di Jawa Tengah tahun 2021.

Berikut ini merupakan rincian variabel data yang disajikan dalam Tabel 3.1.

36
Tabel 3.1 Variabel Penelitian

Variabel Keterangan

Y Jumlah angkatan kerja tiap kota dan kabupaten di Jawa Tengah (jiwa)

Tingkat pengangguran terbuka tiap kota dan kabupaten di Jawa

Tengah (%)

Tingkat partisipasi angkatan kerja tiap kota dan kabupaten di Jawa

Tengah (%)

Kepadatan penduduk menurut kabupaten/kota di Jawa Tengah

Rasio angka beban ketergantungan menurut kabupaten/kota di Jawa

Tengah

Distribusi persentase jumlah penduduk menurut kabupaten/ kota di

Jawa Tengah

Lintang (latitude) kabupaten/kota ke-i

Bujur (longitude) kabupaten/kota ke-i

Berikut ini adalah pendefinisian untuk setiap variabel prediktor penelitian, yaitu :

a. Tingkat pengangguran terbuka ( ) adalah penduduk usia kerja yang tidak

bekerja, sedang mencari pekerjaan, mempersiapkan suatu usaha, mereka

yang tidak mencari pekerjaan karena merasa tidak mungkin mendapatkan

pekerjaan, sudah punya pekerjaan tetapi belum mulai bekerja. TPT dapat

dihitung menggunakan rumus sebagai berikut :

b. Tingkat partisipasi angkatan kerja ( ) adalah suatu indikator

ketenagakerjaan yang memberikan gambaran tentang penduduk yang aktif

37
secara ekonomi dalam kegiatan sehari-hari merujuk pada suatu waktu dalam

periode survei. TPAK dapat dihitung dengan rumus sebagai berikut :

c. Kepadatan penduduk ( ) adalah perbandingan jumlah penduduk dengan

luas wilayah. Untuk menghitung kepadatan penduduk digunakan rumus

sebagai berikut :

d. Rasio angka beban ketergantungan ( ) adalah angka yang menyatakan

perbandingan antara banyaknya penduduk usia non produktif (penduduk

usia dibawah 15 tahun/penduduk muda dan penduduk usia 65 tahun ke

atas) dengan banyaknya penduduk usia produktif (penduduk usia 15

sampai 64 tahun). Semakin tingginya angka Dependency

Ratio menunjukkan semakin tingginya beban yang harus di tanggung

penduduk yang produktif untuk membiayai hidup penduduk yang tidak

produktif. Berikut ini rumus untuk mencari rasio angka beban

ketergantungan yaitu :

e. Distribusi persentase jumlah penduduk ( ) adalah bentuk penyebaran

penduduk di suatu wilayah atau negara, apakah penduduk tersebar merata

atau tidak. Persebaran penduduk dapat diketahui dari kepadatan penduduk.

3.3 Tahapan Analisis Data

Dari data yang didapatkan akan dilakukan analisis untuk memodelkan

jumlah angkatan kerja di Provinsi Jawa Tengah pada tahun 2021 dengan

38
menggunakan pendekatan model Geographically Weighted Negative Binomial

Regression (GWNBR). Alat bantu yang digunakan dalam analisis data penelitian

adalah R Studio. Langkah-langkah yang dilakukan dalam analisis data penelitian

ini adalah sebagai berikut :

1. Melakukan analisis deskriptif terhadap variabel respon dan variabel

prediktor.

2. Mendeskripsikan karakteristik jumlah angkatan kerja di Jawa Tengah

tahun 2021 berserta faktor-faktor yang mempengaruhinya menggunakan

pemetaan wilayah.

3. Mendeteksi adanya kasus multikolinearitas pada variabel prediktor. Jika

ditemukan multikolinearitas karena nilai VIF lebih dari 10, maka variabel

prediktor dihapus.

4. Menganalisis model regresi poisson dengan langkah sebagai berikut.

a. Penaksiran parameter model regresi poisson menggunakan metode

MLE.

b. Pengujian signifikansi parameter model regresi poisson.

c. Menghitung nilai AIC model regresi poisson.

d. Pengujian overdispersi model regresi poisson.

5. Memodelkan dengan regresi binomial negatif dengan langkah sebagai

berikut.

a. Penaksiran parameter model binomial negatif menggunakan metode

MLE.

b. Pengujian signifikansi parameter model binomial negatif.

c. Menghitung nilai AIC model binomial negatif.

39
6. Melakukan analisis pemodelan GWNBR untuk jumlah angkatan kerja di

Provinsi Jawa Tengah pada tahun 2021, dengan langkah-langkah sebagai

berikut.

a. Uji Breusch-Pagan untuk melihat heterogenitas spasial data dan uji

Moran’s I untuk menguji dependensi spasial data.

b. Menghitung jarak Euclidean antar titik lokasi pengamatan.

c. Mendapatkan bandwidth optimal untuk setiap lokasi pengamatan

dengan menggunakan Cross Validation (CV).

d. Menghitung matriks pembobot dengan menggunakan fungsi kernel

adaptive bisquare kernel.

e. Pengujian kesamaan model GWNBR dengan model regresi binomial

negatif.

f. Pengujian signifikansi parameter model GWNBR secara serentak dan

parsial.

g. Intepretasi model GWNBR dan membentuk peta pengelompokkan

berdasarkan variabel yang signifikan.

h. Pemilihan model terbaik.

3.4 Diagram Alir Analisis Data

Dari langkah-langkah analisis data yang dilakukan dapat digambarkan

dalam diagram alir. Diagram alir menggambarkan proses yang harus dilalui dalam

penelitian. Diagram alir dari penelitian ini dapat dilihat pada Gambar 3.1

40
Mulai

Data jumlah angkatan kerja dan faktor


– faktor yang mempengaruhinya

Membuat deskripsi karakteristik data jumlah angkatan kerja dan faktor–


faktor yang mempengaruhinya menggunakan pemetaan wilayah

Ada
Deteksi Penanganan
multikolinearitas multikolinearitas

Tidak ada

Regresi Poisson

Tidak ada
Deteksi
Regresi
overdispersi
Poisson

Ada

Regresi Binomial Negatif

Tidak ada
Aspek data Pemodelan
spasial Regresi Binomial
Negatif
Ya

Pembentukan Matriks Pembobot Spasial dan


Bandwidth Optimum

Pemodelan GWNBR

Pemilihan model terbaik

Selesai

Gambar 3.1 Diagram Alir Analisis Data

41
DAFTAR PUSTAKA

Amaliasari, C. H. O. I. R. (2015). Penggunaan Pembobot Adaptive Gaussian


Kernel dan Adaptive Bisquare Kernel Pada Model Geographically
Weighted Negative Binomial Regression (GWNBR). Jurnal Mahasiswa
Statistika, 3(3).
Anselin, L. (1988). Spatial Econometris: Methods and Models. Dordrecht: Kluwer
Academic Publishers.
Badan Pusat Statistik Provinsi Jawa Tengah. 2023. Sosial dan Kependudukan.
Tersedia: https://jateng.bps.go.id/ (Diakses pada tanggal 21 Februari
2023).
Dao, A. F. J. P., & Kartiko, K. (2019). ANALISIS GEOGRAPHICALLY
WEIGHTED REGRESSION MENGGUNAKAN PEMBOBOT
ADAPTIVE BISQUARE DAN NEAR NEIGHBOURHOOD KERNEL
(Studi Kasus: Kemiskinan di Provinsi Sulawesi Tenggara tahun 2017).
Jurnal Statistika Industri dan Komputasi, 4(2), 75-93.
Maulidiyah, F. (2019). Pemodelan Regresi Binomial Negatif dan Geographically
Weighted Negative Binomial Regression untuk Kasus HIV di Provinsi
Papua (Doctoral dissertation, Muhammadiyah University, Semarang).
Mumtaz, T., & Utomo, A. P. (2018). Modelling The Number of New Pulmonary
Tuberculosis Cases with Geographically Weighted Negative Binomial
Regression Method. Indonesian Journal of Statistics and Its
Applications, 2(2), 77-92.
Mustika, D. A., & Nooraeni, R. (2019). KAJIAN EFEK SPASIAL KASUS
DIFTERI DENGAN GEOGRAPHICALLY WEIGHTED NEGATIVE
BINOMIAL REGRESSION (GWNBR). Indonesian Journal of Statistics
and Its Applications, 3(1), 91-104.
Priambodo, B. W. Y., & Irhamah, I. (2019). Pemetaan Jumlah Property Crime di
Provinsi Jawa Timur Menggunakan Metode Geographically Weighted
Negative Binomial Regression (GWNBR) dan Geographically Weighted
Poisson Regression (GWPR). Inferensi, 2(2), 53-62.
POISSON, K. S. O. P. R., & BURUK, D. B. G. (2020). Puput Cahya
Ambarwati1, Indahwati2, and Muhammad Nur Aidi3. Indonesian Journal
of Statistics and Its Applications (eISSN: 2599-0802), 4(3), 484-497.
Putera, M. L. S., Wahyunita, L., & Yusup, F. (2021). Spatial Modelling of Covid-
19 Confirmed Cases in Kalimantan, Indonesia: How Neighborhood
Matters?. Walailak Journal of Science and Technology (WJST), 18(15),
22120-17.

42
Rachelia, R. S. S., Jaya, I. G. N. M., & Hendrawati, T. (2022). PEMODELAN
KASUS COVID-19 DI KABUPATEN CIAMIS MENGGUNAKAN
METODE GEOGRAPHICALLY WEIGHTED NEGATIVE BINOMIAL
REGRESSION (GWNBR). E-Journal BIAStatistics| Departemen
Statistika FMIPA Universitas Padjadjaran, 16(1), 17-30.
Ricardo, A., Carvalho, T. (2013). Geographically Weighted Negative Binomial
Regression-Incorporating Overdispersion. Business Media New York:
Springer Science.
SARI, M. P. (2016). PEMODELAN JUMLAH KRIMINALITAS DI INDONESIA
DENGAN PENDEKATAN GEOGRAPHICALLY WEIGHTED NEGATIVE
BINOMIAL REGRESSION (Doctoral dissertation, UNIVERSITAS
AIRLANGGA).
Su, Z., Hu, H., Tigabu, M., Wang, G., Zeng, A., & Guo, F. (2019).
Geographically weighted negative Binomial regression model predicts
wildfire occurrence in the Great Xing’an Mountains better than negative
Binomial Model. Forests, 10(5), 377.
Suliyanto, S. (2016). Modelling the Amount of Crime in Indonesia Using
Geographically Weighted Negative Binomial Regression Approach. E-
Prosiding Internasional| Departemen Statistika FMIPA Universitas
Padjadjaran, 2(1), 103-109.
Sumargo, B., Kirana, S. J., & Rohimah, S. R. (2023, January). Dengue
hemorrhagic fever modeling using geographically weighted negative
binomial regression. In AIP Conference Proceedings (Vol. 2588, No. 1, p.
050013). AIP Publishing LLC.
Wang, C. (2021). NON-STATIONARY MODELING OF ROAD-CURVE CRASH
FREQUENCY WITH GEOGRAPHICALLY WEIGHTED
REGRESSION (Doctoral dissertation, Purdue University Graduate
School).
Zaina, A. S. N., Pontoh, R. S., & Tantular, B. (2021, August). Pemodelan dan
Pemetaan Penyakit TB Paru di Kota Bandung Menggunakan
Geographically Weighted Negative Binomial Regression: Studi Kasus
Dinas Kesehatan Kota Bandung. In E-Prosiding Seminar Nasional
Statistika| Departemen Statistika FMIPA Universitas Padjadjaran (pp. 8-
8).
Zhang, L., Cheng, J., & Jin, C. (2019). Spatial interaction modeling of OD flow
data: Comparing geographically weighted negative binomial regression
(GWNBR) and OLS (GWOLSR). ISPRS International Journal of Geo-
Information, 8(5), 220.

43
LAMPIRAN

Lampiran 1. Data Jumlah Angkatan kerja di Provinsi Jawa Tengah Tahun 2021

dan Faktor yang Diduga Memengaruhinya

Kabupaten/Kota Y
Kabupaten Cilacap 830043 9.97 62.91 924 50.48 5.34
Kabupaten Banyumas 865982 6.05 65.07 1340 49.47 4.87
Kabupaten Purbalingga 503682 6.05 69.52 1487 50.51 2.74
Kabupaten Banjarnegara 499741 5.86 69.76 1003 47.75 2.79
Kabupaten Kebumen 620127 6.03 67.76 1124 54.61 3.71
Kabupaten Purworejo 415299 3.59 73.29 709 53.1 2.11
Kabupaten Wonosobo 428053 5.26 70.77 903 49.55 2.41
Kabupaten Magelang 774589 5.03 75.78 1184 46.93 3.55
Kabupaten Boyolali 589941 5.09 75.79 1061 49.69 2.91
Kabupaten Klaten 631245 5.48 66.89 1925 47.98 3.45
Kabupaten Sukoharjo 493258 3.32 68.78 1864 43.52 2.48
Kabupaten Wonogiri 573025 2.43 73.09 585 51.07 2.86
Kabupaten Karanganyar 517787 5.89 73.15 1211 45.58 2.56
Kabupaten Sragen 507752 4.76 71.74 1045 47.68 2.68
Kabupaten Grobogan 783035 4.38 72.88 725 46.53 3.98
Kabupaten Blora 485525 3.81 70.54 491 45.52 2.41
Kabupaten Rembang 362020 3.67 70.67 730 41.27 1.76
Kabupaten Pati 694427 4.6 68.99 894 44.37 3.62
Kabupaten Kudus 521094 3.77 74.77 2005 39.58 2.32
Kabupaten Jepara 687284 4.23 69.55 1122 45.08 3.23
Kabupaten Demak 595111 5.28 66.23 1347 43.97 3.3
Kabupaten Semarang 630040 5.02 74.1 1115 44.35 2.88
Kabupaten Temanggung 454927 2.62 74.01 948 45.24 2.16
Kabupaten Kendal 534030 7.55 69.93 917 44.41 2.79
Kabupaten Batang 430690 6.59 71.4 1023 43.51 2.2
Kabupaten Pekalongan 486248 4.28 71.46 1167 47.56 2.66
Kabupaten Pemalang 645103 6.71 65.9 1328 49.75 4.04
Kabupaten Tegal 715845 9.97 66.24 1836 48.33 4.38
Kabupaten Brebes 879258 9.78 63.97 1047 47.81 5.42
Kota Magelang 66086 8.73 67.07 7572 40.67 0.33
Kota Surakarta 282178 7.85 66.89 11361 37 1.42
Kota Salatiga 112124 7.26 70.36 3374 39.34 0.53
Kota Semarang 1034794 9.54 69.41 4432 37.16 4.51
Kota Pekalongan 181210 6.89 75.77 6813 40.6 0.84
Kota Tegal 132440 8.25 68.25 6950 41.18 0.75

44
Lampiran 2. Data Lintang dan Bujur Masing - Masing Lokasi

Kabupaten/Kota
Kabupaten Cilacap -7.6275 108.7917
Kabupaten Banyumas -7.4354 109.0545
Kabupaten Purbalingga -7.325 108.8833
Kabupaten Banjarnegara -7.3584 109.6236
Kabupaten Kebumen -7.6417 109.6917
Kabupaten Purworejo -7.7167 109.965
Kabupaten Wonosobo -7.3917 109.8917
Kabupaten Magelang -7.5124 110.2401
Kabupaten Boyolali -7.5584 110.6
Kabupaten Klaten -7.625 110.625
Kabupaten Sukoharjo -7.6819 110.3971
Kabupaten Wonogiri -7.8917 110.9917
Kabupaten Karanganyar -7.6167 110.9167
Kabupaten Sragen -7.375 110.9584
Kabupaten Grobogan -7.25 110.3334
Kabupaten Blora -6.5689 111.4084
Kabupaten Rembang -7.1667 111.25
Kabupaten Pati -6.7084 111.0417
Kabupaten Kudus -7.0584 111.7167
Kabupaten Jepara -6.5995 110.7857
Kabupaten Demak -6.9429 110.6396
Kabupaten Semarang -7.2829 110.4539
Kabupaten Temanggung -7.3882 110.5792
Kabupaten Kendal -6.9667 109.9834
Kabupaten Batang -7.0296 109.8618
Kabupaten Pekalongan -7.0439 109.6395
Kabupaten Pemalang -8.1057 109.4834
Kabupaten Tegal -7.0472 109.1554
Kabupaten Brebes -6.7347 108.9425
Kota Magelang -7.4704 110.2114
Kota Surakarta -7.7667 110.757
Kota Salatiga -7.3382 110.5011
Kota Semarang -7.0235 110.3901
Kota Pekalongan -6.8842 109.6832
Kota Tegal -6.8677 109.1196

45

Anda mungkin juga menyukai