Anda di halaman 1dari 14

MODUL 7: REGRESI SPASIAL AREA dengan Software R

1. Pendahuluan

Analisis regresi spasial mulai banyak diaplikasikan pada berbagai bidang untuk menguji
pengaruh hubungan antar wilayah (spatial effects). Model-model yang umum digunakan
untuk mengakomodir adanya spatial effects yaitu Regresi Spasial Lag (Spatial
Autoregressive: SAR) dan Regresi Spasial Error (SEM). Model SAR memperhitungkan
korelasi spasial (ketergantungan) dalam variabel dependen, sedangkan SEM
memperhitungkan ketergantungan spasial dalam error term. Selain itu, terdapat model
kombinasi dari kedua model tersebut yaitu Spatial Autoregressive Moving Average
(SARMA), yang memperhitungkan baik ketergantungan lag spatial maupun error term.
Pada praktikum ini akan dipraktekkan ketiga model tersebut yaitu SAR, SEM, dan
SARMA dengan bantuan software R.

Pemilihan model regresi spasial terbaik penting dilakukan untuk memastikan bahwa
model yang dihasilkan mampu menjelaskan pengaruh tidak hanya dari variabel bebas,
namun juga spatial effects terhadap variabel terikat. Untuk itu, pengujian depedensi
spasial menjadi syarat utama yang harus dilakukan untuk melihat apakah terjadi suatu
depedensi spasial pada lag, error, atau keduanya. Sehingga kita dapat menentukan jenis
model regresi spasial yang cocok digunakan sekaligus mengidentifikasi signifikansi
pengaruh spatial effects antar wilayah-wilayah pengamatan.

2. Tujuan Praktikum

a. Mahasiswa dapat melakukan Regresi Spasial Lag (SAR)

b. Mahasiswa dapat melakukan Regresi Spasial Error (SEM)

c. Mahasiswa dapat melakukan Regresi Spasial SARMA

3. Material Praktikum

1) Peta Jawa Timur menurut kabupaten/kota (35_Jatim.shp)

2) Data atribut Jawa Timur menurut kabupaten/kota (Data Jatim.xlsx)

4. Kegiatan Praktikum Menyiapkan Data

1) Lakukan penggabungan data yang berapa pada file Data Jatim.xlsx ke peta
35_Jatim.shp dan simpan dengan menggunakan Geoda. Data Jatim.xlsx terdiri dari
1
beberapa variabel.
2) Buka file peta, pilih ESRI Shapefile (*.shp). Buka file 35_Jatim.shp melalui aplikasi R.
3) Sebelum masuk ke dalam pembuatan model, terlebih dahulu mempersiapkan package.
#PACKAGE YANG DIPERLUKAN UNTUK SPASIAL
library(tmap)
library(raster)
library(spdep)
library(spatialreg)
library(rgdal)
#PACKAGE TAMBAHAN UNTUK ASUMSI DAN MEMBACA EXCEL
library(readxl)
library(lmtest)
library(tseries)
library(car)
library(sf)

4) Lakukan penginputan file peta (.shp) di aplikasi R


#INPUT SHP FILE
setwd("C:/Users/Windows10/Downloads/pertemuan 7/Jawa Timur")
spJatim = shapefile("35_Jatim.shp")

5) Menampilkan Peta Jawa Timur


#Menampilkan Peta Jawa
tm_shape(spJatim) + tm_polygons()

P1 : Screenshot hasil peta Jawa Timur !

6) Buat pembobot spasial ketersinggungan (queen contiguity) melalui sintax berikut. File
pembobot akan disimpan dengan ekstensi .csv. Simpan dengan nama Matriks Pembobot
Queen.csv
2
#MATRIKS PEMBOBOT
queen.nb=poly2nb(spJatim) #Pembobot queen
queen.jatim=nb2listw(queen.nb,style="W",zero.policy=TRUE)

#Menyimpan Matriks Pembobot


bobot.queen = listw2mat(queen.jatim) #convert listw to matrix
write.csv(bobot.queen, "Matriks Bobot Queen Jatim.csv")

7) Buka pembobot .csv, rapikan data hingga menjadi seperti berikut :

Blok kolom A → klik “Data” lalu akan muncul “Convert Test to Columns Wizard” → klik
“Delimited” → lalu next → pilih delimiters “Tab” dan “Comma” → Finish

3
8) Karena diantara Kota Surabaya dan Kabupaten Bangkalan terdapat jembatan Suramadu
maka kita akan lakukan modifikasi pada keduanya, dari yang sebelumnya menurut R
tidak bersinggungan kita buat bersinggungan. Modifikasi file .csv untuk Kota Surabaya
(3578) dan Kabupaten Bangkalan (3526).
9) Simpan dalam bentuk .xlsx sebelum ditutup dan beri nama Matriks Pembobot
Queen_baru.xlsx
10) Input kembali matriks pembobot yang telah dimodifikasi ke dalam R. Dengan sintax
berikut.
#Memanggil bobot queen yang dimodifikasi
bobot=read_excel("C:/Users/Windows10/Downloads/pertemuan 7/Matriks Bobot
Queen_baru.xlsx")
head(bobot)
bobot_modif=as.matrix(bobot)
modif_bobot=mat2listw(bobot_modif,style="W",)

P2 : Apakah terjadi error seperti gambar di atas? Jika Ya, jelaskan !

11) Karena ada error, maka kita hapus kolom A pada Matriks Pembobot Queen_baru.xlsx
agar berbentuk matriks yang simetris. Lakukan penginputan ulang pembobot yang
dimodifikasi pada langkah 10. Maka error dapat teratasi

4
Regresi Klasik, Regresi Spasial Lag (SAR), Regresi Spasial Error (SEM) dan Regresi
Spasial Autoregressive Moving Average (SARMA)
Model Regresi Klasik

Univariate Moran’s I hanya dapat mendeteksi adanya pengaruh efek spasial pada
satu variabel bukan pada suatu model regresi. Pendeteksian efek spasial pada
model regresi dilakukan dengan melakukan model regresi yang diberikan penimbang
(pembobot) spasial.

Sebelumnya akan disampaikan definisi operasional dari setiap variabel yang digunakan
dalam model pada data contoh.

Variabel respon : AKI = Angka Kematian Ibu


Variabel bebas : AHH = Angka Harapan Hidup
PERSALINAN = Persentase penolong persalinan dokter/bidan
FE13 = Persentase pemberian zat besi (FE)
RLS = Rata-rata Lama Sekolah

12) Langkah selanjutnya ialah mendeteksi ada atau tidaknya efek spasial dengan
menggunakan Global Moran’s I dan pembuatan moran plot.
#MORAN TEST: PEMBOBOT QUEEN
moran.test(spJatim$AKI,modif_bobot,randomisation=FALSE,
zero.policy = TRUE)
moran.plot(spJatim$AKI,modif_bobot)

5
P3 : Interpretasi hasil Moran’s I Global !

13) Langkah awalnya yaitu melakukan regresi linier klasik/berganda.


#REGRESI OLS
reg1=lm(spJatim$AKI~spJatim$AHH+spJatim$PERSALINAN+spJatim$FE13+spJatim$
RLS)
summary(reg1)
AIC_reg1 = AIC(reg1) #melihat nilai AIC
AIC_reg1

Muncul jendela yang menampilkan output estimasi model regresi. Berikut ini adalah
contoh output hasil proses estimasi R. Beberapa hal yang perlu diperhatikan dalam
membaca output terutama terkait estimasi model adalah sebagai berikut:

6
✓ Berdasarkan hasil regresi klasik, Nilai R-squared yang diperoleh yaitu 0,329 dan nilai
AIC sebesar 387,22. Dua variabel bebas (AHH dan PERSALINAN) yang memberikan
pengaruh nyata terhadap variabel respon pada tingkat kepercayaan 95%. Pada akhirnya
model yang dihasilkan yaitu:

AKIi = 1423, 4 −11, 2 AHHi − 5,13PERSALINANi −1, 06FE13i + 7, 21RLSi

14) Melakukan uji asumsi model regresi OLS.


#UJI ASUMSI MODEL
#NORMALITAS
res <- reg1$residuals
jarque.bera.test(res)
#HOMOSKEDASTISITAS
bptest(reg1)
#NON-MULTIKOLINEARITAS
vif(reg1)

Muncul jendela yang menampilkan output diagnosa residual model regresi. Berikut ini
adalah contoh output R. Beberapa hal yang perlu diperhatikan dalam membaca output
terutama terkait diagnosa residual adalah sebagai berikut:

7
✓ Pada asumsi normalitas, diketahui nilai p-value yang didapat lebih kecil dari tingkat
signifikansi 5 persen sehingga keputusan yang diambil Tolak H0. Artinya bahwa error
tidak berdistribusi normal.

✓ Pada asumsi homoskedastisitas, diketahui nilai p-value yang didapat lebih besar dari
tingkat signifikansi 5 persen sehingga keputusan yang diambil Gagal Tolak H0. Artinya
bahwa varians error yang dihasilkan konstan atau dengan kata lain asumsi
homoskedastisitas terpenuhi.

✓ Pada syarat non-multikolinearitas, diketahui nilai VIF tidak ada lebih besar dari 10.
Menunjukkan bahwa antar variabel bebas tidak ada yang saling mempengaruhi atau
dengan kata lain syarat non-multikolinearitas terpenuhi

15) Lalu melakukan pengidentifikasi pemodelan spasial yang terbentuk dengan


memperhatikan Uji Lagrange Multiplier dan Robust LM.
#IDENTIFIKASI MODEL SPASIAL
uji_lm=lm.LMtests(reg1,modif_bobot,test = "all",zero.policy = T)
summary(uji_lm)

✓ Hasil Diagnostic for spatial dependence digunakan untuk mengetahui permasalahan


korelasi spasial. Diketahui bahwa Nilai p-value untuk Uji Lagrange Multiplier (error) dan

8
Robust LM (error) memiliki nilai lebih kecil dari tingkat signifikansi 5 persen. Artinya
terdapat efek dependensi spasial error yang dapat menyebabkan estimator OLS tidak
efisien.
✓ Selain itu Nilai p-value untuk Uji Lagrange Multiplier (SARMA) menunjukkan bukti yang
signifikan dimana p-value yang dihasilkan lebih kecil dari tingkat signifikansi 5 persen.
Artinya model SARMA juga dapat terbentuk yang mengindikasikan adanya pengaruh
dependensi spasial dalam hal error dan lag secara bersama-sama.

16) Model Regresi Spatial Lag (SAR).

Berdasarkan hasil uji Lagrange Multiplier (LM) pada tahap regresi klasik sebelumnya
dapat disimpulkan bahwa sebenarnya tidak terdapat dependensi spasial lag (lihat Prob
LM lag sebesar 0,2323 yang berarti gagal tolak Ho, atau tidak terdapat efek spasial lag)
pada model. Akan tetapi untuk kepentingan praktikum kita akan tetap mencoba
melakukan pemodelan regresi spasial lag (SAR).
#SAR
sar <-
lagsarlm(spJatim$AKI~spJatim$AHH+spJatim$PERSALINAN+spJatim$FE13+spJatim
$RLS,spJatim,modif_bobot)
summary(sar,Nagelkerke=TRUE)

#UJI HOMOSKEDASTISITAS MODEL TERBAIK


bptest.Sarlm(sar)

9
✓ Jika Rho (W_AKI) signifikan model yang dihasilkan yaitu:

✓ Pada model regresi Spatial Lag, diketahui lag spasial tetangganya memiliki p-value
yang lebih besar dari taraf signifikansi 5 persen. Artinya, angka kematian ibu
tetangganya tidak memiliki pengaruh terhadap angka kematian ibu di wilayah tertentu.

✓ Selain itu berdasarkan Nilai pseudo R-squared dan AIC, pseudo R-squared dari
model Spatial Lag sebesar 0,3653 dan nilai AIC model Spatial Lag 389,1.
✓ Perhatikan nilai di bawah kolom PROB pada output Diagnostic for
heteroskedasticity. Statistik: Breusch–Pagan test dengan nilai PROB > 0,05
menunjukkan bukti bahwa tidak adanya pengaruh heterogenitas spasial dalam
model.

17) Model Regresi Spatial Error Model (SEM)

Berdasarkan hasil uji Lagrange Multiplier (LM) pada tahap regresi klasik sebelumnya
dapat disimpulkan bahwa terdapat dependensi spasial error (SEM) pada model, sehingga
perlu dilanjutkan dengan pemodelan regresi spasial SEM.
#SEM
sem <-
errorsarlm(spJatim$AKI~spJatim$AHH+spJatim$PERSALINAN+spJatim$FE13+spJat
im$RLS,spJatim,modif_bobot)
summary(sem,Nagelkerke=TRUE)

#UJI HOMOSKEDASTISITAS MODEL TERBAIK


bptest.Sarlm(sem)

10
✓ Model regresi SEM yang dihasilkan yaitu:

AKIi = 1664,44 −11,94 AHHi − 5,55PERSALINANi − 2,81FE13i + 9, 05RLSi + ui

✓ Pada model regresi Spatial Error, diketahui error spasial tetangganya memiliki p-value
yang lebih kecil dari taraf signifikansi 5 persen. Artinya, error spasial tetangganya
memiliki pengaruh terhadap angka kematian ibu di wilayah tertentu. Error spasial yang
dimaksud ialah variabel-variabel yang di luar dari model penelitian ini.
✓ Selain itu berdasarkan Nilai pseudo R-squared dan AIC yang diperoleh juga
menunjukkan hal yang sama, pseudo R-squared dari model Spatial Error yaitu 0,5064.
Artinya variabel-variabel yang terdapat pada model dapat menjelaskan variasi angka
kematian ibu sebesar 50,64 persen sedangkan sisanya dijelaskan oleh variabel lain.
Diketahui pula, Nilai AIC model Spatial Error sebesar 379,55
✓ Statistik: Breusch–Pagan test dengan nilai p-value > 0,05 menunjukkan bukti
bahwa tidak adanya pengaruh heterogenitas spasial error dalam model.

18) Model Regresi Spatial Autoregressive Moving Average (SARMA).

Berdasarkan hasil uji Lagrange Multiplier (LM) pada tahap regresi klasik sebelumnya
dapat disimpulkan bahwa terdapat dependensi error spasial dan dependensi lag spasial

11
(SARMA) pada model, sehingga perlu dilanjutkan dengan pemodelan regresi spasial
SARMA.
#SARMA
sarma <-
sacsarlm(spJatim$AKI~spJatim$AHH+spJatim$PERSALINAN+spJatim$FE13+spJatim
$RLS,spJatim,modif_bobot)
summary(sarma, Nagelkerke=TRUE)

#UJI HOMOSKEDASTISITAS MODEL TERBAIK


bptest.Sarlm(sarma)

✓ Jika Rho (W_AKI) dan Lamda signifikan model yang dihasilkan yaitu:

✓ Pada model regresi SARMA, diketahui bahwa tidak adanya pengaruh dependensi
spasial lag pada model, melainkan adanya pengaruh dependensi spasial error.
Perhatikan nilai p-value pada Rho dan Lamda. Pada Rho memiliki Nilai > 0,05
menunjukkan bukti bahwa tidak adanya pengaruh dependensi spasial lag artinya
12
angka kematian ibu daerah tetangganya tidak memiliki pengaruh terhadap angka
kematian ibu daerah tertentu. Sedangkan pada Lamda memiliki Nilai < 0,05
menunjukkan bukti bahwa adanya dependensi spasial error artinya ada variabel-
variabel yang di luar dari model tetangganya memiliki pengaruh terhadap angka
kematian ibu di daerah tertentu.

✓ Selain itu berdasarkan Nilai pseudo R-squared dan AIC, pseudo R-squared dari
model SARMA (0,5277). Artinya variabel-variabel yang terdapat pada model dapat
menjelaskan variasi angka kematian ibu sebesar 52,77 persen sedangkan sisanya
dijelaskan oleh variabel lain. Nilai AIC model SARMA didapat sebesar 379,87.
✓ Perhatikan nilai di bawah kolom PROB pada output Diagnostic for
heteroskedasticity. Statistik: Breusch–Pagan test dengan nilai PROB > 0,05
menunjukkan bukti bahwa tidak adanya pengaruh heterogenitas spasial dalam
model.

19) Pemilihan Model yang Terbaik.

Berdasarkan hasil uji Lagrange Multiplier (LM) dan Robust LM pada tahap regresi klasik
sebelumnya dapat disimpulkan bahwa Lagrange Multiplier (error) dan Robust LM (error)
menunjukkan hasil yang signifikan. Hal ini berarti hanya ada efek dependensi spasial
error. Sedangkan pada Lagrange Multiplier SARMA juga menunjukkan hasil yang
signifikan, meskipun hanya dependensi spasial error yang signifikan. Untuk itu perlu
dilakukan pemilihan model terbaik menggunakan sintax berikut :

#MEMBANDINGKAN MODEL
LR.Sarlm(sem, sarma)

✓ Berdasarkan perbandingan antara model SEM dan model SARMA dari software R,
diketahui bahwa Likelihood ratio for spatial linear models menunjukkan p-value
yang lebih besar dari taraf signifikansi yaitu 5 persen. Hal ini menunjukkan baik
model SARMA maupun SEM tidak adanya perbedaan yang signifikan. Dilihat dari
nilai Log Likelihood pada SARMA dan SEM tidak berbeda jauh.
13
✓ Hasil ini juga dapat diperkuat dari nilai R-Square dan nilai AIC dari kedua model :
Nilai SEM SARMA
R-Square 0,5065 0,5277
AIC 379,55 379,87

Berdasarkan nilai R-Square didapat bahwa nilai koefisien determinasi dari Model
SARMA lebih besar dari model SEM. Akan tetapi jika dilihat dari nilai AIC, model
SEM memiliki nilai AIC yang lebih kecil dari pada SARMA.

5. Penugasan

1. Lakukan semua tahapan pada kegiatan praktikum dan jawab semua pertanyaan
yang ada.

2. Buatlah pemodelan regresi spasial menggunakan peta Jawa dengan variabel


responnya adalah persentase kemiskinan tahun 2021 dan variabel prediktornya
adalah rata-rata lama sekolah. Pilih model terbaik dan interpretasikan!

14

Anda mungkin juga menyukai