Anda di halaman 1dari 49

DAFTAR ISI

DAFTAR ISI .......................................................................................................

C.2 MODEL SPASIAL DATA PANEL............................................................

C.2.1 Pendahuluan ...............................................................................

C.2.2 Model umum untuk Spasial Panel............................................

C.2.3 Estimasi dari Model Data Panel.................................................

(i) Model Efek Tetap .................................................................

(ii) Model Efek Random ............................................................. 10


C.2.4 Estimasi dari Model Spasial Data Panel....................................
(i)

12

Model Efek Tetap Spasial Lag...........................................

12

(ii) Model Efek Tetap Spasial Error.........................................

15

(iii) Model Efek Random Spasial Lag .....................................

16

(iv) Model Efek Random Spasial Error ..................................

17

C.2.5 Model Perbandingan dan Prediksi ..........................................

20

(i) Efek Random Versus Efek Tetap....................................

20

(ii) Googness-of-fit ................................................................

20

(iii) Prediksi ............................................................................

22

Ucapan Terima Kasih............................................................................

23

C.5 GEOGRAPHICALLY WEIGTHED REGRESSION.............................

25

C.5.1 Pendahuluan ...................................................................................

25

C.5.2 Estimasi ...........................................................................................

25

C.5.3 Issue ................................................................................................

30

C.5.4 Alat Diagnosis .................................................................................

32

C.5.5 Ekstensi..... ......................................................................................

35

Autoregresi GWR ............................................................................

35

Constraited GWR .............................................................................

35

Model Logistik dan probit dengan bobot geografis.......................

35

C.5.6 Model Hierarchical Bayesian pada sebuah alternatif untuk GWR 37


C.5.7 Contoh pada Kematian Kanker Kantung Kemih ......................

40

C.2 Model Spasial Data Panel


J. Paul Elhorst
University of Groningen

C.2.1 Pendahuluan
Panel spasial biasanya mengacu pada data yang mengandung pengamatan time series
dari sejumlah unit spasial (kode pos, kotamadya, daerah, negara, yurisdiksi, negara, dll).
Data panel umumnya lebih informatif, dan

mengandung lebih banyak variasi dan

kurangnya kolinearitas antar variabel. Penggunaan data panel lebih besar dari derajat
kebebasan, oleh karena itu diefisiensikan pada estimasi. Data Panel juga memungkinkan
untuk spesifikasi pada hipotesis yang lebih rumit, termasuk efek yang tidak dapat diatasi
dengan menggunakan data cross-sectional murni (lihat Hsiao 2005 untuk keterangan
lebih lanjut).
Elhorst (2003) telah memberikan review masalah yang timbul pada estimasi dari
empat model data panel yang digunakan pada penelitian terapan cenderung adanya
autokorelasi error spasial atau spasial lag variabel dependen: efek tetap, efek random,
koefisien tetap, dan model koefisien random.
Bab ini akan mengulas dan mengatur ini tentang metodologi. Ini berkaitan dengan
kemungkinan untuk menguji efek interaksi spasial dalam model data panel standar,
estimasi efek tetap dan yang penghentian tingkat signifikansinya, kemungkinan untuk
menguji spesifikasi efek tetap terhadap spesifikasi efek random pada model data panel
diperluas untuk mencakup autokorelasi spasial error atau spasial lag variabel dependen
menggunakan uji spesifikasi Hausman, penentu pada matriks varians-kovarians dari
estimasi parameter model lag, penentuan tindakan goodness-of-fit dan prediktor yang
terbaik ketika menggunakan model linier untuk tujuan prediksi.
C.2.2 Model Standard untuk Panel Spasial
Pertama, model pooled regresi linear sederhana dengan mempertimbangkan efek
khusus spasial , tetapi tanpa interaksi pada efek spasial.

yit x it i it

(C.2.1)

Dimana i adalah indeks untuk dimensi penampang (unit spasial), dengan i = 1, ..., N,
dan t adalah indeks untuk dimensi waktu (periode waktu), dengan t = 1, ..., T. y it adalah
pengamatan terhadap variabel dependen pada i dan t, x it sebuah vektor baris (1,K) dari
pengamatan pada variabel independen, dan sebuah pencocokan vektor tetap (K,1)
tetapi parameternya tidak diketahui. it adalah independen dan terdistribusi identik pada
kesalahan untuk i dan t dengan mean nol dan varians 2 ,Sedangkan i menunjukkan
efek spasial secara spesifik. Alasan umum yang digunakan dibalik efek spasial tertentu
adalah bahwa mereka mengontrol semua ruang khusus variabel waktu invariant yang
bisa menyebabkan perkiraan yang bias dalam studi cross-sectional.
Ketika menentukan interaksi antara unit spasial, model mungkin mengandung
variabel dependen spasial lag atau proses autoregressive spasial pada error, yang dikenal
sebagai spasial lag dan model spasial error. Model spasial lag berpendapat bahwa
variabel dependen mampu tergantung pada variabel dependen yang diamati di unit
tetangga dan pada satu set karakteristik lokal yang diamati
N

yit wij y jt x it i it ,

(C.2.2)

j 1

di mana disebut koefisien autoregressive spasial dan wit adalah unsur dari matriks
pembobot spasial W yang menjelaskan dari unit dalam sampel. Hal ini diasumsikan
bahwa W adalah presepectif matriks non-negatif dari N 2 . Menurut Anselin et al. (2006,
p. 6), model spasial lag ini biasanya dianggap sebagai spesifikasi formal untuk hasil
ekuilibrium dari proses interaksi spasial atau sosial, di mana nilai dari variabel dependen
untuk satu agen secara bersama-sama ditentukan dengan agen tetangga.
Model spasial error bergantung pada variabel pada karakteristik lokal diamati dan
bahwa error yang berkorelasi pada ruang .

yit x it i it ,

(C.2.3a )

it wijit i ,

(C.2.3b )

j 1

dimana it mencerminkan autokorelasi error spasial dan disebut koefisien autokorelasi


spasial. Menurut Anselin et al. (2006, p. 7), spesifikasi spasial error bentuk kesalahan
dari spesifikasi formal yang tidak memerlukan model teoritis untuk spasial atau proses
interaksi sosial, tetapi, sebaliknya, kasus khusus dari matriks kovarian error.
Dalam

spasial

lag

dan

model

error

spasial,

stationer

membutuhkan

1/ min 1/ max dan 1/ min 1/ max , dimana min dan max menunjukkan yang
terkecil (yaitu, paling negatif) dan karakteristik terbesar dari akar matriks W.
Sebagai alternatif untuk normalisasi baris, W mungkin dinormalisasi sehingga unsurunsur masing-masing jumlah kolom ke satu. Jenis

normalisasi kadang-kadang

digunakan dalam literatur ekonomi sosial (Leenders 2002). Normalisasi baris memiliki
efek bahwa dampak pada setiap Unit oleh semua unit lain untuk menyamakan
kedudukan, sementara normalisasi kolom memiliki dampak dari setiap unit di semua
unit lain menyamakan kedudukan.
Jika W0 menunjukkan matriks pembobot spasial sebelum normalisasi, salah satunya
juga dapat membagi elemen W0 pada karakteristik akar terbesarnya 0,max untuk
mendapatkan W = 1 / 0,max W0 atau menormalkan W0 oleh W = D

12

W0 D

12

,di mana

D adalah matriks diagonal yang berisi jumlah baris dari matriks W0. Operasi pertama
diberi label matriks normalisasi, karena memiliki efek bahwa akar karakteristik W0 juga
dibagi dengan 0,max ,sebagai akibat dari 0,max 1 , seperti akar karakteristik terbesar
dari baris atau kolom matriks yang dinormalisasi. Operasi kedua telah diusulkan oleh
Ord (1975) dan memiliki efek yang akar karakteristik dari W yang identik dengan akar
karakteristik dari normalisasi baris W0. Proporsi antara unsur-unsur W tetap tidak
berubah sebagai hasil dari dua normalisasi alternatif. Ketika W merupakan inverse
matriks jarak, jika mencapai baris atau kolom invers matriks jarak sehingga bobot
berjumlah satu akan menyebabkan matriks kehilangan maknanya untuk interpretasi
ekonomi (Anselin 1988, pp. 23-24).
Dua pendekatan utama untuk estimasi model yang mencakup interaksi efek spasial.
Satu didasarkan pada prinsip maksimum Likelihood (ML) dan metode umum teknik
momen (IV/GMM). Meskipun estimator IV/GMM berbeda dari estimator ML bahwa
4

mereka tidak bergantung pada kesalahan asumsi normalitas, baik estimator yang
berasumsi bahwa it gangguan secara independen dan identik didistribusikan untuk
semua i dan t dengan mean nol dan varians 2 . Jarque-Bera (1980) memungkinkan
menggunakan uji untuk menyelidiki asumsi normalitas saat menggunakan estimatitor
ML . Salah satu kelemahan dari estimator IV/GMM adalah kemungkinan akhir dengan
estimasi koefisien untuk atau berada diluar ruang parameter 1/ min ,1/ max .
Sedangkan koefisien ini dibatasi untuk ruang parameter Jacobian dalam fungsi loglikelihood estimator ML, keterbatasan pengguanaan IV/GMM karena estimator ini
mengabaikan istilah Jacobian .
Franzese dan Hays (2007) membandingkan kinerja estimator IV dan estimator ML
pada model data panel dengan spasial pada variabel dependen dalam hal ketidakbiasan
dan efisiensi, tapi sayangnya tanpa mempertimbangkan efek tetap atau random spasial.
Penaksir ML menawarkan efisiensi lemah yang dominan dan umumnya pada kinerja di
ketidakbiasan, meskipun kadang-kadang sedikit lebih rendah dari IV atas dasar
ketidakbiasan pada nilai yang lebih rendah dari . Kelejian et al. (2006), menganggap
estimasi IV dari model spasial lag dengan waktu- periode efek tetap. Model ini tidak
bisa digabungkan dengan matriks pembobot spasial yang unsur-unsur non-diagonal
semua sama dengan 1/(N -1). Dalam situasi ini, variabel dependen spasial lag bisa ditulis
dalam bentuk vektor sebagai

y11
yN1
y1T
1
1
1
yNT
1
y

,
y

,
y

j1 N 1 N 1 j jT N 1 N 1 j jT N 1 ,
N 1 j j1 N 1
N 1 j

(C.2.4)
yang merupakan asimtotik proporsional dengan demikian kolinear dengan waktuperiode efek tetap sebagai N sampai tak terbatas.
Satu kekurangan dari model spasial lag dan model autokorelasi spasial error adalah
bahwa pola spasial dalam data dapat dijelaskan tidak hanya oleh efek interaksi endogen
atau error yang berkorelasi, tetapi juga oleh efek interaksi endogen, efek interaksi
eksogen dan korelasi error pada waktu yang sama (Manski 1993). Strategi terbaiknya,
bagaimanapun harus menyertakan variabel dependen spasial lag, K spasial lag variabel

independen, dan spasial autokorelasi error secara bersamaan. Namun, Manski (1993)
juga telah menunjuk bahwa setidaknya salah satu dari ini 2+K efek interaksi spasial
dapat disimpulkan, jika parameter interaksi mereka tidak diidentifikasi. Selain itu,
matriks pembobot spasial pada variable depend spasial lag harus berbeda dari matriks
pembobot spasial matriks autokorelasi error spasial, persyaratan tambahan untuk
identifikasi ketika menerapkan estimasi ML (Anselin dan Bera 1998). Satu nyata
keuntungan dari estimator IV/GMM adalah matrisk pembobot spasial dapat digunakan
untuk memperkirakan model yang diperluas mencakup variabel dependen spasial dan
istilah autokorelasi error spasial (Kelejian dan Prucha 1998; Lee 2003). Namun,
estimator ini dapat memperkirakan model dengan variabel independen spasial lag,
karena mereka menggunakan variabel tersebut sebagai instrumen.
Kemungkinan pertama adalah menguji apakah spasial lag untuk variabel independen
harus disertakan dan kemudian apakah model harus diperluas untuk mencakup variabel
dependen spasial lag atau autocorrelasi error spasial (Florax dan Folmer 1992, Elhorst
dan Freret 2007) atau mengadopsi model spasial Durbin tidak dibatasi dan kemudian
menguji apakah model ini dapat disederhanakan (Elhorst et al 2006;. Ertur dan Koch
2007). Model spasial Durbin tidak dibatasi dengan efek tetap spasial dengan bentuk
N

j 1

j 1

yit wij y jt x it wij x ijt i it ,

(C.2.5)

di mana , seperti , adalah (K,1) vektor tetap dari parameter yang tidak diketahui.
Hipotesis H0: = 0 dapat diuji untuk menyelidiki apakah model ini bisa disederhanakan
dengan model spasial lag dan hipotesis H0: + = 0 apakah dapat disederhanakan
dengan model error spasial.
C.2.3 Estimasi dari Model data Panel
Efek khusus spasial dapat diperlakukan sebagai efek tetap atau sebagai efek random.
Dalam model efek tetap, variabel dummy diperkenalkan untuk setiap Unit spasial,
sedangkan dalam model efek random, i diperlakukan sebagai variabel random yang
independen dan identik didistribusikan dengan mean nol dan 2 . Selanjutnya,
diasumsikan bahwa variabel acak i dan t yang independen satu sama lain.

(i) Model Efek Tetap


Jika efek spasial tertentu diperlakukan sebagai efek tetap, model di (C.2.1) dapat
diperkirakan dalam tiga langkah. Pertama, efek spasial tetap adalah mengeliminasi i
dari persamaan regresi dengan demeand variabel y dan x. Transformasinya berbentuk

1
*
1 T
y yit yit dan x it x it
T
T t 1
*
it

X* ' Y* dan

x
t 1

yit* x*it it*

Kedua, persamaan regresi yang berubah


X* ' X*

(C.2.6)

it

adalah estimasi OLS:

2 Y* X*' Y* X* NT N K . Estimator ini dikenal sebagai

estimator variabel dummy kuadrat (LSDV). Keuntungan utama dari prosedur demeand
ini adalah bahwa perhitungan melibatkan invers matriks (K, K) daripada (K + N, K +
N) seperti pada (C.2.1). Hal ini akan memperlambat perhitungan dan memperburuk
keakuratan estimasi untuk N besar.
Bisa juga diestimasi dengan menggunakan ML. Untuk fungsi log-likelihood dari
persamaan demeaned adalah
log L

Estimator

ML

dari

NT
1
log 2 2
2
2 2

dan

y
N

i 1 t 1

masing

*
it

x *it

masing

(C.2.7)
adalah

X* ' X*

X* ' Y* dan

2 Y* X*' Y* X* NT N K . Dengan kata lain, estimators ML dari sedikit berbeda


2

dengan estimator LSDV dalam hal ini tidak benar untuk derajat kebebasan. Asimtotik
dari parameter Matriks varians adalah (lihat Greene 2008, p. 519)

Asy.Var ,

12 X*'X*

0
NT

2 4

(C.2.8)

Akhirnya, efek spasial tetap dapat kembalikan dengan

1 T
yit xit ,
T t 1

i 1,, N

(C.2.9)

Perlu ditekankan bahwa efek spasial tetap hanya dapat diperkirakan konsisten ketika T
cukup besar, karena jumlah observasi tersedia untuk estimasi setiap i adalah T. Juga
catatan bahwa pengambilan sampel pengamatan lebih dalam domain cross-sectional ada

solusi untuk efisiensi waktu dalam pengamatan, karena jumlah parameter diketahui
maka N meningkat, situasi yang dikenal sebagai masalah insidental parameter.
Untungnya, ketidakkonsistenan dari i tidak menular ke penaksir koefisien kemiringan
dalam persamaan demeand , karena estimator ini bukan merupakan fungsi dari
estimasi i . Akibatnya, permasalahan tersebut tidak berpengaruh ketika adalah
koefisien penting dan i bukan merupakan efek spasial tetap , yang terjadi pada banyak
studi empiris. Dalam hal efek tetap spasial i , kesalahan standar dapat dihitung sebagai
akar kuadrat dari asymptotic mereka varians (lihat Greene 2008, hal. 196)

Asy.Var i

1 T

2 x it X*'X*
T
T t 1

1 T

x it '
T t 1

(C.2.10)

Formulasi alternatif dan setara (C.2.1) adalah untuk memperkenalkan sebuah mean dari
intercept , dengan bukti bahwa

0 .Kemudian efek tetap spasial i merupakan

penyimpangan i dari Unit spasial untuk rata-rata individu (lihat Hsaio 2003, hal. 33).
Anselin et Al. (2006) ditentukan dua pertama uji LM untuk panel spasial
LM

e' I

W Y / 2
J

dan LM e' I T W e /

2 2

(C.2.11)

T TW

di mana simbol menunjukkan produk Kronecker, IT menunjukkan matriks identitas


dan subscript nya adalah urutan matriks, dan e menunjukkan vektor residual dari model
regresi pooled tanpa efek spasial atau waktu tertentu pada model data panel dengan
periode spasial dan / atau waktu efek tetap. Akhirnya, J dan TW didefinisikan oleh
J

1
2

1
W X ' I NT XX' X X' I T W X TTW 2

(C.2.12)

TTW tr WW W 'W

(C.2.13)

mana "tr" menunjukkan trash dari matriks. Mengingat bahwa formula ini, merupakan
kekuataan perbandingan pada uji LM untuk panel spasial maka bentuknya menjadi,
robust LM

e' I

robust LM

e' I

W Y / 2 e' I T W e / 2
,
J TTW
2

(C.2.14)

W e / 2 TTW / J e' I T W Y / 2
,
TTW 1 TTW / J
2

(C.2.15)

Peneliti Terapan sering menemukan bukti yang lemah dalam mendukung efek interaksi
spasial pada waktu-waktu efek tetap juga diperhitungkan.

Sebagian besar variabel

cenderung meningkat dan menurun di unit spasial yang berbeda sepanjang evolusi
nasional dari variabel ini pada waktu ke waktu. Pada jangka panjang, setelah efek
guncangan telah diselesaikan, variabel kembali ke pada nilai-nilai ekuilibrium. Pada
ekuilibrium, nilai-nilai tetangga cenderung lebih mirip dari yang lainya, tapi efek
interaksi ini sering lemah dari waktu ke waktu. Penjelasan matematikanya adalah waktu
pada periode efek tetap identik dengan autokorelasi error spasial dengan matriks
pembobot spasial yang elemennya semua sama dengan 1/N, termasuk elemen diagonal.
Maka matriks pembobot spasial akan diperoleh
N

yit wij y jt yit


j 1

N
N
1 N
y jt dan x it wij x jt x it 1 x jt

N j 1
N j 1
j 1

(C.2.16)

yang setara dengan prosedur merendahkan dari Persamaan. (C.2.6) tetapi kemudian
untuk efek tetap dalam waktu. Meskipun matriks pembobot spasial dengan non-nol
elemen diagonal yang tidak biasa pada ekonometrik spasial, ekspresi ini menunjukkan
bahwa perhitungan untuk efek tetap pada waktu-waktu adalah salah satu cara untuk
mengoreksi efek interaksi spasial dengan error. Jika, selain waktu pada periode tetap
efek, spasial error dianggap matriks pembobot spasial dengan nol elemen diagonal,
besarnya efek spasial interaksi ini secara otomatis akan jatuh sebagai hasilnya.
Model dengan kontrol untuk efek tetap spasial yang memanfaatkan komponen timeseries dari data, sedangkan model tanpa kontrol untuk efek tetap spasial memanfaatkan
komponen cross-sectional dari data. Akibatnya, beberapa studi menyatakan bahwa
model dengan kontrol untuk efek tetap spasial cenderung memberikan perkiraan jangka
pendek dan model tanpa kontrol untuk efek tetap spasial cenderung memberikan
perkiraan jangka panjang (Baltagi 2005, hlm 200-201.; Partridge 2005).
Di sisi lain, jika satu atau lebih variabel penjelas yang relevan dihilangkan dari
persamaan regresi, ketika mereka harus dimasukkan, estimator koefisien dari variabelvariabel yang tersisa adalah bias dan tidak konsisten (Greene 2008, hlm. 133-134). Hal
ini juga berlaku untuk efek tetap spasial dan dikenal sebagai Bias regressor dihilangkan.
Untuk menguji apakah efek tetap spasial secara bersama-sama signifikan dengan

melakukan Ratio likelihood (LR) pada uji hipotesis H0: 1= ... = N= , di mana adalah
intercept. Uji statistik yang sesuai adalah -2s, di mana s-mengukur perbedaan antara
model log-likelihood dan model terbatas. Uji LR memiliki distribusi chi-kuadrat dengan
derajat kebebasan sama dengan sejumlah pembatasan yang harus dikenakan pada model
terbatas untuk mendapatkan model dibatasi, yang pada kasus ini adalah N -1. Berkat
ketersediaan log-likelihood yang dibatasi serta model terbatas, Uji LR bisa dilakukan
,atau di samping, uji F klasik ysng dijabarkan dalam Baltagi (2005, p. 13). Ini adalah
keuntungan lain dari memperkirakan model dengan ML.
(ii)

Model Efek Random

solusi untuk memanfaatkan lintas Komponen pada data sectional adalah model efek
acak. Model ini menghindari hilangnya derajat kebebasan yang dikeluarkan dalam
model efek tetap terkait dengan N relatif besar dan masalah bahwa koefisien variabel
waktu-invariant

tidak

dapat

diperkirakan.

Ketika

model

efek

random

diimplementasikan, unit obeservasi harus mewakili populasi yang lebih besar, dan
jumlah unit harus berpotensi dapat pergi ke infinity. Ada dua jenis asimtotik yang umum
digunakan dalam konteks pengamatan spasial: (a) isi struktur asimtotik, di mana sisasisa wilayah pengambilan sampel dibatasi sebagai N. Dalam hal ini lebih unit
informasi berasal dari observasi diambil dari

yang sudah diamati; dan (b)

meningkatnya domain struktur asymptotic di mana wilayah sampel tumbuh sebagai


N .Dalam hal ini ada jarak minimum yang memisahkan dua unit spasial untuk
semua N.
Menurut Lahiri (2003), ada juga dua jenis sampel desain: (a) Desain stochastic mana
unit spasial acak ditarik; dan (b) desain tetap di mana unit spasial terletak pada tempat
non random , mungkin tidak teratur spasi.
Tahap dua prosedur estimasi berulang dapat digunakan untuk mendapatkan estimator
ML dari model efek random (Breusch 1987). Perhatikan bahwa model efek random juga
konstan, sebagai akibat dari jumlah variabel independen adalah K+1. Log-Likelihood
model efek random dalam (C.2.1) adalah

10

log L

NT
N
1
log 2 2 log 2
2
2
2 2

y
N

i 1 t 1

*
it

x*it

(C.2.17)

di mana menunjukkan berat yang melekat pada komponen penampang data, dengan

0 2 2 / T 2 2 1 , dan simbol menandakan transformasi tergantung variabel

dependen
yit* yit 1

1 T
1 T
yit dan x*it x it 1 x it

T t 1
T t 1

(C.2.18)

Jika = 0, transformasi ini menyederhanakan prosedur merendahkan dari


Persamaan.(C.2.6) dan karenanya model efek random untuk model efek tetap.
Diberikan , dan 2 dapat diselesaikan dari orde pertama dengan memaksimalkan
Kondisi : X* ' X* 1 X* 'Y * dan 2 Y * X*
' Y * X*/ NT . Sebaliknya, dapat
diperkirakan dengan memaksimalkan fungsi log-likelihood terkonsentrasi sehubungan
dengan , diberikan dan 2
2
NT N T
1 T
1 T

N
yit 1 yit ' x it 1 x it ' log 2
LogL
2 i 1 t 1
T t '1
T t '1 2

(C.2.19 )
Penggunaan 2 bukannya memastikan bahwa kedua argumen log ( 2 ) dan ( 2 )
adalah Positif (lihat Magnus 1982 untuk rincian). Parameter matriks Varians yang
asymptotic adalah

12 X ' X

Asy.Var , , 2 0
0

N 1 12
2
N

N2
NT
2 4

(C.2.20)

Salah Satu yang dapat menguji apakah efek random spasial yang signifikan dengan uji
LR untuk hipotesis H0: =1. Uji Statistik ini memiliki distribusi chi kuadrat dengan satu
derajat kebebasan. Jika hipotesis adalah kembali diprojeksikan, efek random spasial
yang signifikan.

11

C.2.4 Estimasi Model Data Panel Spasial


Bagian ini menguraikan modifikasi yang diperlukan untuk memperkirakan model efek
tetap dan model efek random yang diperluas untuk mencakup spasial lag variabel
dependen atau autokorelasi error spasial. Diasumsikan bahwa W konstan dari waktu ke
waktu dan panel yang seimbang. Meskipun estimator dapat dimodifikasi untuk matriks
pembobot spasial yang perubahan dari waktu ke waktu, serta untuk panel tidak
seimbang, asimtotiknya penting, dalam hal panel tidak seimbang, dapat menjadi
bermasalah jika alasan mengapa data yang hilang tidak diketahui.
(i) Tetap Efek Model Spatial Lag
Menurut Anselin et al. (2006), perpanjangan model efek tetap dengan variabel dependen
spasial lag menimbulkan dua komplikasi. Pertama, yang endogeneity dari
melanggar asumsi regresif standar Model regresi bahwa E

w
j

ij

y jt

w y 0 . Dalam
j

ij

jt

it

estimasi model, keserentakan ini harus dipertanggungjawabkan. Kedua, ketergantungan


spasial antara observasi yang pada setiap titik waktu dapat mempengaruhi estimasi efek
tetap.
Pada bagian ini, kita memperoleh estimator ML untuk memperhitungkan yang
endogen dari

w
j

ij

y jt . Fungsi log-likelihood dari Model (C.2.2) jika spasial memeiliki

efek tertentu diasumsikan tetap adalah


N

NT
1 N T
LogL
log 2 2 T log I N W 2 yit wij y jt x it i
2
2 i 1 t 1
j 1

(C.2.21)
di mana kedua di sisi kanan merupakan transformasi Jacobian dari ke y dengan
memperhitungkan endogeneity dari

w
j

ij

y jt (Anselin 1988, p. 63).

Derivatif parsial dari log-likelihood sehubungan dengan i adalah

LogL
1
2
i

wij y jt x it i 0

it
t 1
j 1

i 1,, N

(C.2.22)

Ketika memecahkan i dari (C.2.22), diperoleh


12

1 T

wij y jt x it 0

it

T t 1
j 1

i 1,, N

(C.2.23)

Persamaan ini menunjukkan bahwa formula standar untuk menghitung efek tetap
spasial, persamaan (C.2.9), berlaku untuk efek tetap Model spasial lag dalam secara
langsung.
Solusi untuk i ke dalam fungsi log-likelihood, dan setelah menata ulang hal, yang
terkonsentrasi fungsi log-likelihood dengan , dan 2 diperoleh
*

NT
1 N T *
N

2
LogL
log 2 T log I N W 2 yit wij y jt x*it

2
2 i 1 t 1
i 1

(C.2.24)
di mana tanda bintang menunjukkan prosedur demeand diperkenalkan dalam Pers.
(C.2.6).
Prosedur estimasi ini juga dapat digunakan untuk memaksimalkan Fungsi loglikelihood (C.2.24) yang berhubungan dengan , dan 2 . Perbedaannya adalah bahwa
data yang diperpanjang dari penampang pengamatan N untuk panel pengamatan N T.
Prosedur estimasi ini dilihat pada langkah berikutnya.
Pertama, pengamatan sebagai lintas-bagian untuk t = 1, ..., T untuk mendapatkan
(NT, 1) vektor untuk Y* dan I T W Y * , dan matriks (NT, K) untuk X* dari variabel
direndahkan. Kedua, b0 dan b1 menyatakan estimator OLS dari berturut-turut regresi Y*
dan I T W Y * dari X* dan e0* dan e1* yang sesuai dengan residual. Kemudian estimator
ML dari diperoleh dengan memaksimalkan terkonsentrasi pada fungsi log-likelihood

LogL C

NT
log e0* e1* ' e0* e1* T log I N W ,
2

(C.2.25)

di mana C adalah konstanta tidak tergantung pada . Sayangnya, permasalahan


maksimal ini hanya dapat diselesaikan secara numerik, karena solusi bentuk tertutup
untuk tidak ada. Namun, karena terkonsentrasi fungsi log-likelihood cekung di
(Anselin dan Hudak 1992). Untuk mempercepat

komputasi dan untuk mengatasi

kesulitan secara numerik yang mungkin dihadapi ketika mengevaluasi I N W N - W

13

|, Pace dan Barry (1997) menyimpulkan untuk menghitung determinan ini sekali selama
batas nilai untuk parameter mulai dari 1/min untuk 1 sebelum di estimasi, asalkan W
dinormalisasi. Ini hanya membutuhkan penentuan karakter-terkecil dari W .
Ketiga, estimator dari dan 2 dihitung, diberikan estimasi dari

b0 b0 X*'X* X*' Y * I T W Y * ,
1

(C.2.26a)

1 *

e0 e0*
' e0* e0*
NT

(C.2.26b)

Selain variabel demeand,kita juga dapat menggunakan variabel asli Y dan X , pada Y*=
QX ,

I N W Y* QI N W Y dan

X*= QX , di mana Q menyatakan operator

demeand dalam bentuk matriks

Q IN

1
T 'T I N ,
T

(C.2.27)

dan T adalah vektor yang subscriptnya menunjukkan panjang dari vektor ini. Karena Q
adalah matriks idempoten simetris, penaksir dimulai dengan variabel asli juga dapat
ditulis sebagai
X' Q' QX X' Q' QY I N W Y X' QX XQY I N W Y
1

(C.2.28)

Anselin et al. (2006) telah menunjukkan bahwa estimator ini juga dapat dilihat sebagai
estimator GLS dari model regresi linier dengan gangguan matriks kovarian 2 Q , tetapi
kesulitan penafsiran ini adalah bahwa Q adalah singular. Kesimpulan mereka bahwa
singularitas dari Q juga membatasi kepraktisan Model ini telah dibantah oleh Hsaio
(2003, hal. 320), Magnus dan Neudecker (1988, pp. 271-273) dan Baltagi (1989) dengan
Q mungkin ditempatkan terbalik oleh bentuk umum,yang menghasilkan (C.2.28).
Matriks varians asimtotik dari parameter adalah untuk menghitung inferensi (kesalahan
standar, nilai t). matriks ini telah berikan oleh Elhorst dan Freret (2007) dan mengambil
bentuk (karena matriks ini simetris elemen diagonal atas yang tersisa samping)
1

X *' X *
2

~
~~ ~ ~
~ ~
Asy.Var , , 2 12 X *' I T W X * T *tr WW W 'W 12 ' X *' I T W 'W X *
~
T

0
tr W
2

NT
2 2

(C.2.29)

14

dimana

~
~
W W I T W '

. Perbedaan dengan matriks varians asymptotic model spasial

lag dalam pengaturan cross-sectional (lihat Anselin danBera 1998; Lee 2004) adalah
perubahan dimensi dari matriks X* dari N untuk N T pengamatan dan penjumlahan
atas T lintas-bagian yang melibatkan manipulasi dari (N,N) matriks pembobot spasial W.
Untuk nilai N yang besar penentuan unsur-unsur dari matriks varians dapat menjadi
perhitungan yang tidak mungkin.
(ii) Efek tetap Model Spasial error
Anselin dan Hudak (1992) menunjukkan bagaimana parameter , dan 2 dari model
regresi linear diperluas untuk mencakup autokorelasi error spasial terkait dapat
diperkirakan oleh ML dimulai dengan data cross-sectional. Prosedur estimasi ini
cenderung dapat menyertakan efek tetap spasial dari penampang observasi N ke panel
pengamatan N T . Model Fungsi log-likelihood (C.2.3) jika efek khusus spasial
diasumsikan tetap adalah
*
*
N
*
N

NT
1 N T *
2
LogL
log 2 T log I N W 2 yit wij y jt x it wij x jt

2
2 i 1 t 1
j 1

j 1

(C.2.30)
Mengingat , estimator ML dari dan 2 dapat diselesaikan dari orde pertama dengan
memaksimalkan kondisi, untuk mendapatkan

x *it I T W X * ' X* I T W X *

x
1

*
it

I T W X* ' Y * I T W Y *

(C.2.31a)

2
dimana

e ' e
NT

(C.2.31b)

e Y * I T W Y * X* I T W X* yang terkonsentrasi pada

fungsi log-likelihood dari mengambil bentuk


LogL

NT
loge ' e T log I N W
2

(C.2.32)

Memaksimalkan fungsi ini sehubungan dengan menghasilkan estimator ML dari ,


diberikan dan 2 . Sebuah prosedur iterasi dapat digunakan di mana kumpulan dari

15

parameter- dan 2 dan parameter secara bergantian diperkirakan sampai terjadi


konvergen. Matriks varians asymptotic dari parameter menjadi

Asy.Var , , 2

1 *' *
2 X X
~

~~
~ ~
~ ~
~
0
T * tr WW W ' W

~
~

T
0
tr W
2

NT
4
2

(C.2.33)

~
~
dimana W W I N W 1 . Efek tetap spasial akhirnya dapat diestimasi dengan dengan

1 T
yit xit
T t 1

i 1,, N .

(C.2.34)

(iii) Efek Random Model spasial Lag


Log-likelihood Model (C.2.2) jika efek spasial diasumsikan random

NT
1
LogL
log 2 2 T log I N W 2
2
2

*
N
*

y w y x *

ij jt it
it
i 1 t 1
i 1

(C.2.35)
di mana simbol menunjukkan transformasi diperkenalkan dalam Persamaan (C.2.18)
tergantung pada . Mengingat , fungsi log-likelihood ini identik dengan logging pada
fungsi likelihood dan efek tetap Model spasial lag dalam (C.2.24). Sehingga, prosedur
yang sama dapat digunakan untuk memperkirakan , dan 2 sebagai mana yang
dijelaskan di atas (Persamaan C.2.25, C.2.26a dan C.2.26b), tetapi superscript * harus
kembali ditempatkan oleh . Mengingat , dan 2 , dapat diestimasi dengan
memaksimalkan terkonsentrasi fungsi log-likelihood sehubungan dengan

LogL

NT
N
loge ' e log 2
2
2

(C.2.36)

di mana elemen khas e() adalah

e it yit 1

N

1 T
1 N
1 T
yit wij y jt 1 wij y jt x it 1 x it

T t 1
T j 1
T t 1
j 1

(C.2.37)

16

Sekali lagi prosedur iterasi dapat digunakan di mana set parameter , dan 2dan
parameter secara bergantian diperkirakan sampai konvergensi.
Matriks varians asymptotic parameter diberikan dengan bentuk

Asy.Var , , 2

X *' X *
2
1 '*
~
~~ ~ ~
~ ~
X I T W X * T * tr WW W ' W 12 ' X '* I T W ' W X *

~
0
12 tr W

~
T
0
tr W

N T 12

N
2

NT

2 4

(C.2.38)
(iv) Efek Random pada Model Spasial Error
Model Log-likelihood (C.2.3) jika efek spasial diasumsikan random adalah (Anselin
1988; Elhorst 2003; Baltagi 2005)

N
NT
1
1
1
1
1

2
log L
log 2 log V T 1 log B 2 e' I T T 'T V 1 e 2 I T T 'T B' Be
2
2
T
T
2
2 e'

i 1
(C.2.39)

di mana V = TIN +(B'B)-1 , B = IN-W dan e =Y-X . Matriks V yang mempersulit


estimasi model ini. Pertama, Pace dan Barry (1997) prosedur untuk mengatasi kesulitan
numerik mungkin dihadapi dalam mengevaluasi log |B| =log|IN-W| tidak dapat
digunakan untuk menghitung log |V| = log |TIN+ (B'B)-1|. Kedua, tidak ada expression
matematika sederhana untuk kebalikan dari V . Baltagi (2006) memecahkan masalah ini
dengan pertimbangan efek random model spasial error dengan bobot yang sama,
yaitu,matriks pembobot spasial W yang unsur-unsur non-diagonal semua sama dengan
1/(N-1).
Elhorst (2003) menyarankan untuk mengekspresikan log |V| sebagai fungsi dari
karakteristik akar dari W berdasarkan Griffith (1988, Tabel 3.1)
N

1
1
log V log TI N B' B T

1 i 2
i 1

(C.2.40)

Selanjutnya, ia menyarankan untuk mengadopsi transformasi

N
N
1 N

yit yit wij y jt pij 1 wij y jt


T t 1
j 1
j 1

(C.2.41)

17

dan sama untuk variabel x it , Di mana pit merupakan elemen dari (N,N) matrix P
sehingga P'P =V-1 . P bisa menjadi dekomposisi spektral V-1, P = -1/2R , di mana R
adalah Matriks (N,N) dari mana i kolom dengan karakteristik vektor ri dari V, yang
sama dengan vektor karakteristik dari bobot matriks pembobot spasial W (lihat Griffith
1988, Tabel 3.1), R ri ,, rN dan sebuah matriks diagonal NN dengan i elemen
diagonal yang sesuai karakteristik akar, ci T 11 i .
2

Untuk N besar pada determinan numerik pada P dapat menjadi masalah. Namun,
Hunneman et al. (2007) menemukan bahwa jika W simetris dengan menggunakan salah
satu alternatif normalisasi yang akan dibahas dalam Bagian C.2.2, prosedur ini bekerja
dengan baik dalam Jumlah waktu untuk nilai N hingga 4000.
Sebagai hasil dari (C.2.40) dan (C.2.41), fungsi log-likelihood menyederhanakan
untuk
LogL

N
NT
1 N
1
2
2
log 2 2 log 1 T 1 i T log 1 i 2 e 0' e 0
2
2 i 1
2
i 1

(C.2.42)
di mana e 0 Y 0 X 0 . dan 2 dapat diselesaikan dari orde pertama memaksimalkan

Kondisi: X 0 ' X 0

X 0Y 0 dan 2 Y 0 X0 ' Y 0 X0 / NT . Setelah dan 2

disubsitusikan dalam fungsi log-likelihood, yang terkonsentrasi logging Fungsi


likelihood dan diperoleh

LogL C

N
NT
1 N
2
2
loge , 'e , log 1 T 1 i T log1 i
2
2 i 1
i 1
(C.2.43)

di mana C adalah konstanta tidak tergantung pada dan dan elemen khas e(,) adalah
N
N
N
N
1 T
1 T

e , it yit wij y jt p , ij 1 i y jt xit wij x jt p , ij 1 i x jt


T t 1
T t 1
j 1
j 1
j 1
j 1

(C.2.44)
Notasi pij p , ij digunakan untuk menunjukkan bahwa unsur-unsur dari matriks P
tergantung pada dan . Iterasi antara dan 2 pada sisi satu , dan dan di sisi lain,

18

sampai konvergensi. Pada Estimator dari dan 2 . Diberikan dan , dapat diperoleh
dengan OLS regresi dari variabel Y0 berubah menjadi variabel X0. Namun, estimator dari
dan , diberikan dan 2 , Harus dicapai dengan metode numerik karena persamaan
tidak dapat diselesaikan secara analitis.
Elhorst (2008b) menunjukkan bahwa secara bersama-sama pemodelan serial dan
spasial hasil korelasi error dalam trade-off antara serial dan koefisien autokorelasi
spasial dan yang mengabaikan ini trade-off menyebabkan ineffisiensi dan menyebabkan
non-stasioneritas. Namun, jika Koefisien autokorelasi diatur ke nol, masalah ini
menghilang. Akibatnya, matriks varians asymptotic yang diperoleh jika serial koefisien
autokorelasi diatur ke nol sebenarnya yang terjadi menjadi matriks varians dari efek
random model spasial error.
Salah satu perbedaan adalah bahwa Baltagi et al. (2007) asumsi asymptotic varian
matriks , , dan 2 , Tapi dari , , 2 dan 2 . Matriks ini dapat ditulis sebagai
berikut

Asy.Var , , ,
2

12 X 0' X 0

T 1
2

tr 12 tr
2

T
2 2

T 1
2 2

tr V 1

T2
2 4

tr 21 2 tr
2

T2
2 4

tr V 1

tr V 1

2
1
T 1N tr
2 4
(C.2.45)

dimana =(WB+BW)(BB)-1 dan =V-1)(BB)-1.. Jika 2 2 varians asymptotic


dari dapat diperoleh dengan menggunakan rumus (mood et Al. 1974, p. 181)

var 2
var 2 , 2
var
var

2
2
2
2
2
2 2
2
2

(C.2.46)

Kesimpulannya, kita dapat mengatakan bahwa estimasi efek random Model spasial error
lebih rumit dari model spasial data panel lainnya. Spesifikasi spasial error juga tidak
memerlukan model teoritis untuk proses interaksi spasial atau sosial, tetapi khusus kasus
matriks non-bulat covariance error, dan model efek random dalam penelitian spasial

19

adalah kontroversial, efek random Model spasial error mungkin akan menjadi nilai
terbatas dalam penelitian empiris.
C.2.5 Model Perbandingan dan Prediksi
(i) Efek Random banding Efek Tetap
Model efek acak dapat diuji terhadap model efek tetap pada spesifikasi uji Hausman
(Baltagi 2005, hlm. 66-68). hipotesis sedang diuji adalah H0:h=0, di mana
h d' vard d,
1

d FE RE

2
var d RE
X *' X *

dan

2
FE
X *' X *

(C.2.47)

Catatan urutan terbalik dengan yang d dan var (d) dihitung. Uji statistik Ini memiliki
distribusi chi-kuadrat dengan derajat kebebasan K (jumlah variabel penjelas dalam
model, tidak termasuk konstanta). Uji spesifikasi Hausman juga dapat digunakan ketika
model

cenderung menyertakan autokorelasi error spasial atau spasial lag variabel

independen. Karena model spasial lag

memiliki satu variabel tambahan pada

penjelasannya , mungkin menghitung d dengan d ' ' FE ' ' RE untuk memperoleh
uji statistik yang memiliki distribusi chi-kuadrat dengan derajat bebas K+1
(ii) Goodness-of-Fit
Perhitungan ukuran goodness-of-fit dalam model spasial data panel sulit karena tidak
ada rekan yang tepat dari R2 dari Model regresi OLS dengan gangguan kovarians 2 I ke
model regresi umum dengan gangguan matriks kovarians 2 I . Kebanyakan
orang menggunakan
R 2 e, 1

e' e
e~' e~
atau R 2 e~ 1
(C.2.48)
Y Y ' Y Y
Y Y ' Y Y

di mana Y menunjukkan mean keseluruhan variabel dependen dalam sampel dan e


adalah vektor residual dari model. Atau, e'e dapat kembali ditempatkan oleh jumlah
e ' ~e .
kuadrat residual berubah residu ~
Ini adalah karena prosedur demeand hanya dimaksudkan untuk mempercepat
perhitungan waktu dan untuk meningkatkan akurasi estimasi . Jika R 2 adalah hasil

20

perhitungan setelah efek tetap spasial telah ditambahkan kembali ke model akan
memiliki sifat yang sama dengan R 2 dari model OLS.
Pengukuran alternatif goddness-of-fit yang memenuhi objektifikasi atas adalah
koefisien korelasi kuadrat antara nilai aktual dan dipasang (Verbeek 2000, hal. 21)

Y Y 'YY YY'YYYY' Y Y
2

corr Y , Y
2

(C.2.49)

di mana Y adalah (NT,1) vektor dari nilai-nilai berpasangan. Berbeda dengan R 2 ,


goodness- of-fit mengabaikan ukuran variasi yang dijelaskan oleh efek tetap spasial.
Perbedaan antara R 2 dan corr 2 menunjukkan berapa banyak variasi yang dijelaskan
oleh efek tetap, yang dalam banyak kasus cukup besar. Jenis argumen serupa berlaku
untuk spasial efek random.
Kesulitan lain adalah bagaimana mengatasi spasial pada variabel dependent. Jika
spasial lag dipandang sebagai variabel yang membantu untuk menjelaskan variasi dalam
variabel dependen, ukuran pertama ( R 2 ) seharusnya digunakan. Sebaliknya, jika spasial
lag tidak dilihat sebagai variabel yang membantu untuk menjelaskan variasi dalam
variabel dependen, hanya karena itu adalah sisi kiri variabel pada prinsipnya, ukuran
kedua ( corr 2 ) seharusnya digunakan.

Dalam notasi vektor, yang mengurangi bentuk

model spasial lag dalam Pers. (C.2.2) adalah


Y I NT I NT W X T I N
1

(C.2.50)

Tabel 1. Dua Langkah Goodness-Of-Fit Dari Empat Model Spasial Data Panel
R e, I N
2

Efek Tetap Model Spasial Lag


e Y I T WY X T I N

Corr 2

1
Corr Y* , I NT I T W X*

Efek Tetap Model Spasial Error


~
e Y I T WY X I T WX T I N
Corr Y* , X*

R ~e

Efek Random Model Spasial Lag


*
~

e Y I T WY* X*

Corr 2

R 2 ~e

Corr 2

1
Corr 2 Y, I NT I T W X

21

Efek Random Model Spasial Error


0
~
e Y X 0
Corr 2 Y, X

R ~e
2

Corr 2
di mana adalah (N,1) vektor efek tertentu spasial, = ( 1, ..., N)'.Dari persamaan ini
dapat dilihat bahwa koefisien korelasi kuadrat antara nilai aktual dan dipasang di model
spasial lag, tidak peduli apakah adalah tetap atau random, juga harus
memperhitungkan matriks multiplier spasial I NT I NT W .
1

(iii) Prediksi
Goldberger (1962) menunjukkan yang linear terbaik berisi prediktor (BLUP) untuk unit
cross-sectional dalam model regresi linier dengan matriks gangguan kovarians di
periode mendatang T + C diberikan oleh
YT C XT C ' 1e

(C.2.51)

mana = E(T+C ) adalah kovarians antara gangguan masa depan T+C dan gangguan
sampel , X meliputi variabel independen dari
Tabel 2. Rumus Prediksi dari Empat Model Data Panel Spasial

Y
T C

Efek Tetap Model Spasial Lag


1
1
I W X I W u

T C

Efek Tetap Model Spasial Error


Y
T C X T C u
Efek Random Model Spasial Lag

T
W 1 X I W 1 1 2 1 y 1t x1t

T C
N
T C
N
T t 1 y x
Nt
Nt

Efek Random Model Spasial Error


T
y x1t
1

YT C X T C V 1t

t 1 y Nt x Nt
adalah estimator dari , dan e menunjukkan vektor residual dari model. Baltagi dan Li

(2004) memperoleh rumus prediksi untuk model tetap efek dan efek random dengan
autokorelasi spasial.
Baltagi dan Li (2004) menunjukkan bahwa = 0 dalam model efek tetap,asalkan hal
kesalahan tidak serial berkorelasi dari waktu ke waktu. Koreksi 'e dalam model efek

22

random tidak nol. Dalam efek random Model spasial lag, istilah koreksi 'e identik
sama dengan mitranya pada Model efek random standar.
Sama seperti di efek random Model spasial lag, residual pada efek random model
spasial error rata-rata selama waktu (lihat Tabel 2). Namun, jumlah dari residual tidak
hanya dibagi dengan T , tapi premultiplied oleh V-1= [ T IN + (B'B)-1]-1 , Matriks yang
juga menyumbang untuk efek interaksi antara residual. Akhirnya, "rata-rata" residuals
dikalikan dengan , yang mengukur rasio antara 2 dan 2 .
Masalah prediktor berdasarkan model efek tetap atau efek random adalah seseorang
tidak memiliki informasi tentang efek tetap spasial atau rata- yang residual berusia unit
spasial di luar sampel.
C.2.6 Penutup
Pada literatur Ekonometrik spasial telah menunjukkan perkembangan di spesifikasi dan
estimasi hubungan ekonometrik berdasarkan panel spasial. Area dua lainnya dimana
banyak wawasan mengalami pertumbuhan dalam perkembangan model data panel
spasial dengan efek interaksi spasial adalah kemungkinan untuk menguji endogeneity
dari satu atau lebih variabel penjelas dan kemungkinan untuk memasukkan efek
dinamis. Fingleton dan LeGallo (2007) mempertimbangkan model termasuk endogenety
spasial lag, variabel endogen tambahan karena sistem umpan balik dan autoregressive
atau proses error rata-rata bergerak, dan menyarankan estimator IV/GMM berdasarkan
Kelejian dan Prucha (1998) dan Fingleton (2008). Elhorst, Blien and Wolf (2007)
menyajikan kerangka kerja untuk menentukan yang terbaik dari tiga estimator (2SLS,
efek tetap 2SLS dan pertama- Perbedaan 2SLS) terhadap potensi endogeneity
menggunakan dua Jenis uji statistik Hausman. Dengan menggunakan kerangka kerja ini,
mereka menyimpulkan bahwa pertama-perbedaan 2SLS adalah estimator yang disukai
dari kurva upah Jerman Timur, karena tingkat pengangguran regional, variabel penjelas
utama mampu dari tingkat upah, tidak ketat eksogen dan spesifik efek spasial tidak
berkorelasi dengan variabel penjelas.
Elhorst (2008a) mengadopsi penggunaan matriks eksponensial, sebuah transformasi
baru-baru ini diperkenalkan oleh Lesage dan Pace (2007): S eW q qW q!.

23

Transformasi ini berbeda dengan model spasial lag (C.2.2) atau model spasial error
dalam (C.2.3) dalam Jacobian adalah nol. Nol pada Jacobian ini membuka kesempatan
untuk menggunakan Metode estimasi sebagian berdasarkan pada IV dan sebagian
berdasarkan pada ML untuk mengendalikan endogen dari satu atau lebih dari variabel
penjelas.
Elhorst (2005a) berasal penaksir ML dan Su dan Yang (2007) kondisi keteraturan
sesuai yang dinamis model data panel diperluas untuk mencakup autokorelasi spasial
error. Elhorst (2005b), Korniotis (2005), Yu et al. (2007) dan Vrijburg et al. (2007)
perbandingan model data panel dinamis diperluas untuk mencakup spasial lag variabel
dependen.

24

C.5 Geografis Weighted Regression


David C. Wheeler dan Antonio Pez
C.5.1 Pendahuluan
Georaphically Weighted Regression (GWR) diperkenalkan ke literatur geografi oleh
Brunsdon et al. (1996) untuk mempelajari potensi

hubungan dalam sebuah model

regresi yang bervariasi dalam ruang geografis, atau yang disebut dengan stasioneritas
non parametrik. GWR didasarkan pada teknik non-parametrik pada lokasi regresi
terboboti yang dikembangkan dalam statistik untuk aplikasi kurva yang pantas dan lebih
baik, di mana parameter lokasi regresi diperkirakan menggunakan subset dari data
terdekat untuk estimasi model dalam ruang variabel.
Pada GWR, model regresi dapat digunakan di setiap lokasi pengamatan di dataset,
meskipun lokasi kalibrasi model tidak terbatas pada pengamatan lokasi.

Untuk setiap

lokasi kalibrasi model, i = 1, ..., n, model GWR adalah


p 1

yi i 0 ik xik i

(C.5.1)

k 1

dimana y i adalah nilai variabel dependen pada lokasi i, xik adalah nilai dari k kovariat
di lokasi i, i 0 adalah intersep, ik adalah koefisien regresi untuk k kovariat, p adalah
jumlah istilah regresi, dan i adalah kesalahan random pada lokasi i. Perbedaan antara
regresi dan koefisien regresi, di mana jumlah koefisien regresi adalah np. Perbedaan
pada model ini dan Model Ordinary Least Squares (OLS) adalah pada koefisien regresi
diperkirakan untuk setiap lokasi data, di mana ini adalah global, atau tetap untuk wilayah
studi, dalam model OLS.
C.5.2 Estimasi
Untuk memudahkan eksposisi, akan lebih mudah untuk mengekspresikan model GWR
dalam matriks

yi X i i i

(C.5.2)

25

dimana i adalah vektor kolom dari koefisien regresi dan X i adalah vektor baris dari
variabel penjelas di lokasi i. Vektor untuk mengestimasi koefisien regresi di lokasi i
adalah

1
i XT Wi X XT Wi Y

(C.5.3)

di mana Y adalah n x 1 vektor variabel dependen; X X1T , XT2 ,, XTn

adalah desain

matriks variabel penjelas, yang mencakup kolom terkemuka yang untuk intersep;

Wi diag Wi1 ,,Win adalah n x n matriks diagonal pembobot dihitung untuk setiap

T
lokasi kalibrasi i; dan i i 0 , i1 ,, ip1 adalah vektor dari p koefisien regresi lokal

di lokasi i untuk p-1 variabel penjelas dan intersep. Dengan Persamaan (C.5.3), GWR
dapat dilihat sebagai lokal terboboti model regresi kuadrat terkecil dimana pembobot
menghubungkan pasangan dari titik data, dan ada bobot untuk menghubungkan lokasi
kalibrasi model i dengan semua titik data , termasuk lokasi kalibrasi itu sendiri. Matriks
pembobot harus dihitung pada setiap lokasi sebelum koefisien regresi lokal diestimasi
dengan persamaan (C.5.3).
Pada GWR, matriks pembobot, Wi , dihitung dari fungsi kernel yang menempatkan
pembobot pada lokasi yang lebih dekat ke ruang lokasi kalibrasi dari ruang yang lebih
jauh. Oleh sebab itu, Pembobotan, mengikuti asumsi dari autokorelasi spasial, yang
diharapkan menghasilkan pola non-stasioner pada estimasi koefisien.

Ada dua jenis

dari fungsi kernel, tetap dan adaptif, di mana fungsi kernel adaptif mencoba untuk
menyesuaikan pada kepadatan titik data dan fungsi kernel tetap tidak. Sebagai contoh
dari perbedaan jenis kernel, fungsi kernel adaptif bisa menggunakan nomor observasi
yang sama di setiap kernel lokal, sementara fungsi kernel tetap menggunakan kisaran
spasial yang sama di setiap kernel lokal.
Beberapa contoh, kedua fungsi kernel tetap dan adaptif disediakan dibawah. Mungkin
kasus yang paling sederhana adalah, orang bisa menggunakan skema pembobotan biner
seperti

1
Wij
0

jika d ij d *
selainnya

(C.5.4)

26

dimana d ij adalah jarak antara pengamatan i dan j, dan d* adalah ambang batas jarak
yang mendefinisikan ukuran jendela. Fungsi kernel ini dapat menghasilkan pengamatan
lebih sedikit di set pembobot pada sebuah model titik kalibrasi yang terletak di daerah
jarang dibandingkan dengan daerah yang relatif padat. Atau, fungsi kernel dapat
didefinisikan sebagai
1
Wij
0

jika yij Yi N
selainnya

(C.5.5)

di mana Yi N adalah himpunan N pengamatan terdekat ke titik i, dan N adalah nilai


untuk Estimasi. Dalam hal ini, fungsi kernel menggunakan jumlah yang sama dari
pengamatan di setiap titik, tapi pengamatan ini dapat mencakup batas spasial yang
berbeda di setiap kasus.Sebagian besar aplikasi dari GWR mempunyai fungsi kontinu
yang menghasilkan bobot monoton menurun dengan jarak, seperti fungsi kernel
Gaussian

1 d ij
Wij exp
2

(C.5.6)

Dalam fungsi ini, bobot untuk pengamatan j relatif berubah pada pengamatan i sebagai
fungsi dari jarak d ij dan parameter kernel bandwidth bahwa kontrol jangkauan dan
kerusakan pada korelasi spasial. Sebuah fungsi kernel yang sama adalah sederhana
Fungsi eksponensial

d ij
Wij exp

(C.5.7)

yang menghilangkan kekuatan dan skala dari fungsi Gaussian, fungsi kernel tetap adalah
fungsi kernel bi-square .

d ij2
Wij exp 1 2

(C.5.8)

Beberapa fungsi kernel adaptif diusulkan untuk menyesuaikan diri dengan kepadatan
pengamatan di suatu daerah. Salah satu fungsi kernel seperti menggunakan tingkatan
kenaikan pada jarak dari jarak untuk menghitung bobot

27

Rij
Wij exp

(C.5.9)

dimana Rij adalah pangkat jarak d ij saat lokasi diurutkan dengan meningkatkan jarak
dari kalibrasi model lokasi i. Fungsi kernel adaptif yang memiliki Jenis berbeda dari
parameter bandwith adalah bi-Square tetangga kernel terdekat, di mana, jumlah tetangga
terdekat harus ditentukan agar perhitungannya bobot untuk mengestimasi koefisien
regresi lokal. Spesifikasai Kernel tersebut adalah

1 d ij / d iN 2
Wij

jika j adalah satu dari N jarak terdekat dari i

(C.5.10)

selainnya

dimana d iN adalah jarak ke N tetangga terdekat dari lokasi i. Fungsi ini memberikan
bobot nol sampai titik yang berada di luar jarak ke N tetangga terdekat dan bobot tidak
nol yang hilang pada jarak ke titik dalam ambang jarak.
Saat ini ada tiga pendekatan yang berbeda untuk mengestimasi eksogen kernel
bandwidth pada GWR, sebenarnya tugas dari jumlah bandwidth terdekat tetangga
(McMillen 1996), cross-validasi (Brunsdon et al 1996;. Farber dan Pez 2007), dan
Kriteria Informasi Akaike dikoreksi (AIC, Fotheringham et Al. 2002). Selain itu,
pendekatan untuk parameter estimasi kernel bandwidth yang telah diusulkan oleh Pez
et al. (2002a). Dari jumlah tersebut, pendekatan yang paling banyak digunakan dengan
sisa jarak cross-validasi.
Cross-validasi (CV) merupakan proses berulang yang mencari kernel bandwith yang
meminimalkan kesalahan prediksi dari semua y(s) menggunakan subset dari data untuk
prediksi. Jika bandwidth kernel adalah , CV diestimasi dengan menemukan yang
meminimalkan Root Mean Error Prediksi Squared (RMSPE)

arg min yi y i
n

(C.5.11)

i 1

dimana y i adalah nilai prediksi dari pengamatan i dengan lokasi kalibrasi i yang keluar
dari estimasi dataset. adalah kernel nilai bandwidth yang meminimalkan RMSPE.
Data titik i dihapus ketika mengestimasi y i untuk menghindari perkiraan sempurna.

28

Dalam fungsi kernel yang diuraikan di atas, kernel bandwidth adalah parameter global.
Parameter ini diterapkan untuk semua model lokal secara individual, baik dalam
estimasi kernel bandwidth dan koefisien regresi. Tersirat dalam Persamaan (C.5.11)
adalah model lokal untuk memperkirakan y i tanpa menggunakan data titik i dengan
estimasi koefisien regresi dalam persamaan (C.5.3) dan nilai dari , dan mengulang ini
untuk setiap lokasi.
Sebuah pendekatan untuk memperkirakan kernel bandwidth berdasarkan pada
prediksi variabel respon pada AIC, diadopsi dalam bentuk regresi pembobotan lokal ke
GWR. Hal ini bukan berdasarkan untuk meminimalkan kesalahan estimasi ulang pada
variabel respon. gabungan antara goodness-of-fit dari model dan kerumitan model,
hukum kriteria pada parameter bilangan efektif dalam model AIC untuk GWR adalah
n traceH

AICc 2n log n log 2 n


n 2 traceH

(C.5.12)

dimana adalah estimasi standar deviasi dari kesalahan, H adalah matriks topi, dan
trace dari suatu matriks adalah jumlah dari elemen diagonal matriks. Kernel bandwidth
digunakan dalam perhitungan dan H. Setiap baris dari matriks topi didefinisikan oleh

H i Xi XT Wi X

XT Wi

(C.5.13)

yang juga dapat dinyatakan sebagai

H i Xi A i

(C.5.14)

Diperkirakan varians kesalahan adalah


n

y
i 1

y i

n 2traceH traceH H
T

(C.5.15)

Seperti CV, untuk memperkirakan kernel bandwidth yang satu baik menggunakan
algoritma pencarian atau mengevaluasi fungsi tujuan selama rentang nilai .Objek dari
Fungsi AIC nilainya harus diminimalkan.
Setelah memperkirakan kernel bandwidth dengan baik CV atau AIC, hitung bobot
kernel di setiap lokasi kalibrasi model dengan menggunakan estimasi fungsi kernel dan

29

kemudian memperkirakan koefisien regresi lokal. Kemudian, memperkirakan variabel


respon dengan
y i X i i

(C.5.16)

Peta analis spasial mengestimasi koefisien regresi dan upaya untuk menafsirkan pola
spasial dari koefisien permasalahan penelitian. Dalam pengaturan frekuensi dari GWR,
uji signifikan pada statistik dari koefisien menggunakan varian dari estimasi koefisien
regresi. Menurut Fotheringham et al. (2002, p.55), varians dari koefisen regresi adalah

var i Ai AiT 2

(C.5.17)

Persamaan yang digunakan untuk koefisien kovarians lokal hanya pendekatan dengan
cross-validasi karena bobot kernel dihitung dari Data pertama sebelum koefisien regresi
diperkirakan dari data. Kernel bobot secara fungsi yang melekat dari Y, seperti koefisien
regresi, dan ekspresi yang benar untuk koefisien kovarians non-linear.
C.5.3 Isssu
Pada level fundamental, argumen bahwa GWR tidak mengusulkan basis model untuk
sumber variasi, dan dengan demikian lebih tepat dilihat sebagai Pendekatan heurastic.
Akibatnya, dapat dikatakan bahwa GWR tidak mempersatukan kerangka statistik karena
pada dasarnya sebuah ensemble dari geografis regresi lokal di mana ketergantungan
antara koefisien regresi pada data yang berbeda lokasi tidak ditentukan dalam model.
Hal ini menghasilkan model efek tetap dengan tidak ada penyatuan dalam estimasi.
Isu kedua adalah terkait dengan penggunaan berulang data untuk mengestimasi model
parameter di lokasi kalibrasi model yang berbeda, yang menyebabkan beberapa
perbandingan situasi. Dengan peningkatan jumlah estimasi model lokal, beberapa uji
individu akan signifikan, bahkan jika hanya secara kebetulan, juga akan meningkat.
Masalah dalam hal ini adalah terkait dengan trade-off antara jumlah informasi dan
kepercayaan, karena interval kepercayaan yang biasa digunakan untuk koefisien regresi
tidak lagi dapat diandalkan. Dalam rangka untuk memperhitungkan banyaknya, setiap
individu membutuhkan uji untuk melihat bagian dari eksperimen, dan yang sesuai
tingkat signifikansi perlu disesuaikan sehingga sesuai dengan tingkat kepercayaan.
Sebuah penyesuaian sederhana untuk mencapai tujuan ini didasarkan pada

30

ketidaksetaraan Bonferroni, di mana individu tingkat (disesuaikan) signifikansi /m


dengan menjadi tingkat nominal signifikansi dan m jumlah uji dalam keluarga.
Masalah lain dengan GWR yang secara langsung berkaitan dengan pemilihan kernel
bandwidth yang melibatkan variasi spasial tingkat tinggi dan kelancaran estimasi
koefisien regresi. Jika bandwidth seperti untuk menyertakan besar jumlah observasi,
akan ada relatif sedikit atau tidak ada variasi spasial dalam koefisien, dan jika bandwidth
kecil, maka akan berpotensi menjadi jumlah variasi besar. Kekhawatiran muncul ketika
beberapa variasi atau kehalusan dalam pola estimasi koefisien artifisial diperkenalkan
dengan teknik dan mungkin tidak mewakili efek regresi yang benar. Situasi ini adalah
inti dari diskusi tentang kegunaan GWR untuk inferensi pada koefisien regresi dan tidak
dijawab oleh pada statistik (Leung et al. 2000a) atau Monte Carlo (Fother- ingham et al.
2002) uji untuk variasi yang signifikan dari koefisien GWR karena uji ini tidak
mempertimbangkan sumber variasi. Hal ini penting karena salah satu sumber variabilitas
koefisien regresi di GWR dapat berasal dari kolinearitas, atau ketergantungan dalam
matriks desain kernel pembobot. Kolinearitas dikenal pada model linear untuk
mengembang varians dari koefisien regresi (Neter et al. 1996),dan GWR tidak terkecuali
(Griffith 2008). Kolinearitas telah ditemukan berdasarkan pengalaman pekerjaan yang
menjadi masalah dalam model GWR di tingkat lokal ketika ini tidak menunjukkan
dalam model regresi global dengan menggunakan data yang sama (Wheeler 2007).
Sebagai tambahan variasi besar diperkirakan koefisien regresi, hal ini menguatkan
ketergantungan pada koefisien GWR untuk istilah regresi yang berbeda, termasuk
intercep, setidaknya sebagian disebabkan kolinear. Wheeler dan Tiefelsdorf (2005)
menunjukkan dalam Studi simulasi bahwa koefisien GWR dapat dikorelasikan ketika
tidak ada variabel korelasi yang jelas, koefisien korelasi meningkatkan sistem semakin
kolinearitas.
Variasi koefisien regresi meningkat kolinearitas lokal di GWR sehingga
menyebabkan overestimates dari efek besaran kovariat dan koefisien pembalikan, yang
keduanya kemungkinan akan menyebabkan interpretasi yang salah dari relativitas
hubungan dalam model regresi.

31

Model GWR dengan jelas menghubungkan kolinearitas lokal untuk GWR koefisien
korelasi yang kuat dan peningkatan koefisien variasi untuk dua status ekonomi kovariat
di berbagai lokasi data dengan regresi positif kontra-intuitif tandakoefisien . Dalam
analisis apapun, diperkirakan koefisien GWR dari model lokal yang didiagnosis sebagai
bermasalah harus ditafsirkan dengan hati-hati dan Analisis tambahan harus dilakukan di
daerah-daerah untuk memahami sifat hubungan yang sedang dimodelkan.
Masalah lain dalam GWR adalah dengan kesalahan standar yang terkait dengan
estimasi koefisien regresi. Perhitungan error standar dalam GWR hanya memberikan
pendekatan dengan menggunakan kembali data untuk estimasi parameter di beberapa
lokasi (Congdon 2003; Lesage 2004) dan karena menggunakan data untuk
memperkirakan kedua kernel bandwidith dengan cross-validasi dan koefisien regresi
(Wheeler dan Calder 2007). Selain itu, seperti yang tersirat sebelumnya, kolinear lokal
dapat meningkatkan estimasi variansi koefisien regresi dalam pengaturan regresi umum
(Neter et al. 1996). Kesalahan standar menunjukkan bahwa interval kepercayaan untuk
memperkirakan koefisien GWR hanya perkiraan dan tidak persis terpercaya untuk
menunjukkan efek kovariat signifikan secara statistik dan pemilihan model.
Telah dikemukakan bahwa pada GWR, mengingat asal-teori dalam linear regresi
lokal (dikembangkan untuk memperkirakan variabel respon lokal), cocok untuk estimasi
dan prediksi variabel respon tetapi kurang berguna di statistik inferensi pada efek regresi
spasial yang bervariasi (Wheeler 2009). Mungkin pergeseran fokus utilitas dari GWR
terhadap interpolasi spasial menjadi berharga, dan ada bukti empiris untuk mendukung
langkah tersebut, dengan GWR akan menghasilkan perbandingan yang baik dalam
kaitannya dengan teknik interpolasi lainnya (Pez et al. 2008).
C.5.4 Alat Diagnostik
Ada beberapa terkenal alat diagnostik yang tersedia untuk regresi model OLS, termasuk
yang untuk memeriksa autokorelasi, berpengaruh pengamatan, dan kolinear. Sesuai
dengan hal ini, penggunaan regresi linier lebih rumit Model seperti GWR harus disertai
dengan alat diagnostik.

32

Metode untuk mengidentifikasi sisa autokorelasi spasial dalam model GWR telah
dikembangkan oleh Leung et al. (2000b), berdasarkan statistik yang baik pada
autokorelasi spasial termasuk Moran I dan Geary c. Pendekatan yang diusulkan oleh
Leung et al. (2000b) membandingkan setiap prediksi lokal dari variabel dependen untuk
nilainya diamati. Estimasi pada residu yang dapat digunakan untuk mendeteksi pola
peta. Penerapan statistik ini sangat mirip dengan applikasi yang ada pada statistik
autokorelasi, dan teori mendasarinya adalah pengujian hipotesis, mengingat bahwa
metode GWR adalah kumpulan model lokal yang bukan bagian dari kerangka kerja
terpadu. Akibatnya, tidak jelas bahwa sumber autokorelasi sebenarnya bisa
diidentifikasi.
Alat diagnostik ada pada literatur (Wheeler dan Tiefelsdorf 2005; Waller et al. 2007;
Wheeler dan Calder 2007; Griffith 2008) adanya korelasi kuat dalam set pada estimasi
koefisien GWR, yang bisa berasal dari kolinearitas lokal dalam model, analis harus
mempertimbangkan

menggunakan

alat

diagnostik

untuk

kolinearitas

untuk

memperkirakan koefisien GWR. Alat diagnostik yang bisa digunakan untuk


mengevaluasi apakah Efek kolinearitas substansial yang ada pada model GWR. Selain
menyebarkan plot koefisien regresi untuk pasangan regresi, peta dari perkiraan lokal
korelasi koefisien regresi (Wheeler dan Tiefelsdorf 2005), lokal faktor varians inflasi
(VIFs), salah satunya dengan menggunakan proporsi varians-dekomposisi dan kondisi
indeks yang terkait (Belsley 1991; Wheeler 2007). Keuntungan dari pendekatan
variance-dekomposisi lebih dari VIF, yang mengukur berapa banyak estimasi varians
dari koefisien regresi yang meningkatkan kolinearitas, adalah yang mengukur dan
menyampaikan sifat kolinearitas di antara semua regresi hal pada saat yang sama,
termasuk intercep.
Proporsi varians-dekomposisi dan indeks kondisi alat diagnostik diperkenalkan oleh
Belsley (1991) dan dimodifikasi untuk GWR oleh Wheeler (2007) menggunakan
dekomposisi nilai singular dari GWR kernel matriks pembobot untuk membentuk
Kondisi indeks dan proporsi varians-dekomposisi dari koefisen matriksi varians.
Proporsi varians-dekomposisi adalah persentase varians dari koefisien regresi yang
dijelaskan dengan salah satu komponen varians matriks dekomposisi. Ini berafiliasi pada

33

kondisi indeks, yang rasio dari nilai singular terbesar dan nilai singular terkecil pada
dekomposisi. Dekomposisi nilai singular (SVD) dari matriks desain di Kerangka GWR
adalah

Wi 1/ 2 X UDV T

(C.5.18)

di mana U dan V ortogonal n x p dan p x p matriks masing-masing; D adalah (p x p)


matriks diagonal dari nilai tunggal

Wi 1/ 2 X ,

penurunan nilai diagonal bawah; dan

mulai dari matriks unsur (1,1) dan

Wi 1/ 2 adalah

akar kuadrat matriks diagonal

pembobot untuk lokasi kalibrasi i menggunakan fungsi kernel dengan GWR


mengestimasi kernel bandwith. Melalui SVD, matriks varian-kovarian dari koefisien
regresi adalah

var i 2 VD 2 V T

(C.5.19)

dan varians dari lokal k koefisien regresi adalah

vkj
var ik 2 2
j 1 d j
p

(C.5.20)

Dimana v kj adalah elemen dari matriks V dan d j adalah nilai-nilai singular. Proporsi
Varians- dekomposisi untuk k lokal regresi dan komponen dekomposisi j adalah

kj

kj
k

(C.5.21)

dimana

kj

vkj2
d 2j

(C.5.22)

k kj

(C.5.23)

j 1

Kondisi indeks untuk komponen varians j=1,...,p adalah

d max
dj

(C.5.24)

Belsley (1991) memperkenalkan beberapa pedoman yang relevan dengan menggunakan


proporsi variance- dekomposisi dan kondisi indeks dalam pengaturan regresi OLS.

34

Belsley (1991) menunjukkan nilai konservatif tiga puluh sebagai ambang batas untuk
indeks kondisi yang menunjukkan kolinearitas, meskipun ambang batas bisa serendah
sepuluh jika proporsi variance-dekomposisi yang besar untuk dua atau lebih regresi pada
komponen varians yang sama. Pada umumnya, kolinearitas kuat ditunjukkan oleh indeks
kondisi yang lebih besar. Petunjuk lainnya adalah bahwa kehadiran dua atau lebih
proporsi varians-dekomposisi lebih besar dari 0,5 untuk komponen varians yang sama
menunjukkan adaanya kolinearitas antara istilah regresi. Salah satunya menerapkan
petunjuk yang sama untuk mendiagnosis kolinearitas pada GWR. Perlu ditekankan
bahwa proporsi varians-dekomposisi dan kondisi indeks alat diagnostik mengungkapkan
kolinearitas lokal di GWR pada Model kalibrasi lokasi dan karena itu memungkinkan
untuk membangun bidang nilai-nilai diagnostik dan menghubungkan mereka secara
eksplisit saat mengestimasi koefisien GWR untuk analisis visual dari setiap masalah
yang mungkin ada dalam model.
C.5.5 Ekstensi
Sejumlah model yang berbeda telah diusulkan untuk memperpanjang penerapan konsep
bobot geografis dalam analisis regresi. Tiga ekstensi seperti dibahas berikutnya.
Autoregressive GWR
Salah satu ekstensi pertama dengan konsep GWR adalah untuk mengakomodasi spasial
dependensi dalam struktur model (Brunsdon et al. 1998). Tantangan yang dihadapi
ketika bekerja dengan model yang mengandung komponen spasial autoregresif adalah
estimasi dari koefisien menggunakan leave-one-out-cross-validasion, karena ini
membutuhkan perhitungan determinan dari (N -1) x (n -1) matriks n . Pendekatan yang
berbeda untuk mendapatkan model spasial autoregressive lokal berdasarkan konsep
pembobot geografis adalah dari Pez et al. (2002b) dengan mengadopsi model varian
non-konstan, mampu mengestimasi parameter koefisien model termasuk kernel
bandwidth. Model alternatif yang telah diusulkan dalam literatur, termasuk estiamasi
spasial autoregresif lokal (SALE) Model progresif dari Pace dan Lesage (2004) yang
didasarkan pada estimasi matriks dekomposisi, dan model ZOOM dari Mur et al. (2008).
Constrained GWR
35

Masalah yang timbul dari kolinearitas dapat diatasi dengan membatasi jumlah variasi
koefisien regresi. Dalam kasus GWR, dua versi metode bahwa mencapai tujuan ini telah
diusulkan, yaitu regresi ridge geografis terboboti (GWRR, Wheeler 2007) dan secara
lasso geografis terboboti (GWL, Wheeler 2009). Sebagai yang tersirat bahwa, teknik ini
didasarkan pada regresi dan masing-masing lasso. Metode yang bekerja dengan
menggunakan hukum regresif yang membatasi jumlah variasi dalam koefisien. Pada
kedua kasus, kendala ukuran koefisien regresi diperkenalkan, tetapi dengan masingmasing batasan yang sedikit berbeda. Sementara koefisien regresi ridge meminimalkan
jumlah penalti pada ukuran koefisien kuadrat dan jumlah kuadrat sisa
2
p
p
n

R arg min y x 2

i
0
ik
k
k

k 1
k 1
i 1

(C.5.25)

koefisien lasso meminimalkan jumlah nilai absolut dari koefisien dan jumlah kuadrat
sisa
2
p
p
n

L arg min
yi 0 x ik k k

k 1
k 1

i 1

(C.5.26)

dimana adalah parameter yang mengontrol jumlah penyusutan dalam koefisien regresi.
Perbedaan spesifikasi dua model hasil potensial merupakan penyusutan dalam koefisien
lasso regresi, beberapa di antaranya mungkin menyusut ke nol. Pada regresi ridge dan
lasso, pada prakteknya untuk pemusatan variabel respon, dan skala variabel penjelas
untuk Unit varians karena metode skala yang dependent. Rumus untuk memperkirakan
koefisien GWRR menggunakan pemusatan pada variabel adalah

i X*T Wi X* I

X*T Wi y *

(C.5.27)

di mana X* adalah matriks variabel penjelas standar, y* adalah standar variabel respon,
dan ketentuan lainnya yang sebelumnya ditetapkan. Ada pilihan untuk jenis pemusatan
dan skala yang dapat dilakukan (lihat Wheeler 2007). Nilai absolut kendala pada
koefisien regresi di GWL membuat-masalah yang non-linear, tapi untungnya ada
algoritma efisien untuk memestimasi parameter (Wheeler 2009). Cross-validasi yang
digunakan dalam memperkirakan kernel bandwidth pada kedua versi yang dibatasi dari
GWR.
36

Model Logistik dan probit dengan bobot geografis


Selain kerangka regresi linear, gagasan menerapkan geografis terboboti telah diterapkan
untuk model untuk variabel nominal, termasuk geografis terboboti model logistik
dengan grafis. Atkinson et al. (2003) dan model probit dengan bobot geografis pada
Pez (2006). Model ini memperluas aplikasi dari GWR untuk situasi di geomorfologi
dan transportasi penelitian yang sering memerlukan analisis variabel dependen terbatas.
C.5.6 Model Hirarkis Bayesian sebagai alternatif untuk GWR
Dengan keuntungan kekuatan dan ketersediaan software komputasi, memungkinkan
untuk menggunakan model hirarkis Bayesian untuk memperkirakan spasial bervariasi
koefisien regresi sebagai pendekatan pergantian ke GWR. Model hirarkis Bayesian
adalah hirarkis dalam distribusi data yang ditentukan untuk parameter yang tidak
diketahui, yang distribusinya tergantung pada parameter lainnya. Selain itu, model ini
dapat menggabungkan parameter pada tingkat yang berbeda dari data, Misalnya baik di
tingkat individu dan kelompok, untuk model hubungan di berbagai sisi. Ada model
hirarkis Bayesian dengan efek random untuk kedua intercept dan efek kovariat, di mana
efek random dapat ditetapkan sebagai independen dalam sebelum dan meminjam
kekuatan di seluruh pengamatan secara global atau menjadi spesimen memiliki korelasi
spasial dan meminjam kekuatan lokal. Ada dua utama alternatif untuk GWR dalam kelas
ini model. Salah satu yang disebut model Bayesian spasial yang koefisiennya bervariasi
(SVC), mendefinisikan hubungan spasial di ulang pada koefisien regresi melalui
spesifikasi bersyarat sebelumnya dari koefisien yang menggunakan pengamatan yang
bertetangga. Yang lain disebut model spasial bervariasi Proses koefisien (SVCP) yang
sebelumnya menggunakan spesifikasi koefisien model korelasi dalam koefisien sebagai
proses spasial terus menerus. Dalam model Bayesian SVC, salah satu tujuannya adalah
untuk menggambarkan EYi f X si , nilai expektasi dari variabel respon di lokasi i
diberi fungsi kovariat terkait dengan lokasi. Model Bayesian SVC umum

Y , ~ ,1
i

(C.5.28)

dimana

37

i X i i

(C.5.29)

menetapkan variabel respon berarti di setiap lokasi data melalui vektor kovariat X i dan
vektor spasial bervariasi koefisien regresi i . Asumsi model dependen spasial dalam
koefisien regresi sebeum melalui distribusi untuk koefisien. Sebelumnya adalah
koefisien multivariat intrinsik autoregressive conditional (CAR), atau MCAR
sebelumnya, dan ditulis sebagai ~ MCAR . MCAR sebelumnya untuk vektor
spasial koefisien bervariasi di setiap lokasi i

pada data yang memiliki distribusi

bersyarat multivariat
i ( i ) 0 , ( i )1 ,, ( i ) p1 ~ p i , mi

dimana

i i 0 , i1 ,, ip 1 , ik jk ik lmi , i
T

(C.5.30)

adalah himpunan tetangga

lokasi untuk lokasi i , dan mi adalah jumlah tetangga untuk lokasi i. Elemen-elemen
diagonal dari matriks varians-kovarians adalah varians bersyarat dari k . A konjugat
sebelumnya untuk daerah, antara koefisien matriks varians-kovarians p x p distribusi
terbalik Wishart dan konjugasi untuk presisi kesalahan adalah gamma. Prior konjugat
digunakan untuk komputasi. MCAR sebelum memiliki keuntungan atas model proses
dibahas selanjutnya karena kurang komputasi. Ini juga merupakan perpanjangan dari
CAR sebelum yang umum digunakan untuk efek random spasial dalam model regresi
Bayesian (untuk lebih jelasnya lihat Besag et al. 1991; Besag dan Kooperberg 1995).
Untuk pengenalan lebih menyeluruh ke Model SVC, lihat Banerjee et al. (2004).
Adapun penerapan model Bayesian SVC ini, kita dapat menggunakan rantai Monte
Carlo (MCMC) simulasi di software WinBUGS (Spiegelhalter et Al. 2003) untuk
memberikan sampel nilai parameter model dari parameter sendi posterior distribusi
untuk inferensi. Daftar lingkungan adjacency diperlukan untuk yang MCAR sebelum
dapat dihasilkan dalam software GeoBUGS (Thomas et al. 2004). Biasanya,
menggunakan periode 'burn-in' sampel dan kemudian sejumlah berikutnya sampel
distribusi posterior bersama di MCMC untuk menghitung rata-rata posterior
mengestimasi nilai tengah untuk parameter model. Inferensi statistik pada parameter

38

berasal dari ringkasan dari distribusi posterior, seperti interval kredibel kita persentil
tertentu dari distribusi.
Sebuah alternatif untuk MCAR sebelumnya untuk koefisien regresi pada spesifikasi
utama pada geostatis dengan fungsi kovarians berdasarkan jarak (Gelfand et al. 2003).
Model SVCP ditentukan dengan notasi matriks sebagai

Y , ~ X
p

p T

, 2 I

(C.5.31)

di mana Y diasumsikan kondisi Gaussian pada parameter p dan 2 . p merupakan


vektor np x 1 dari parameter koefisien regresi; dan X p adalah diagonal blok n x np
T

dari kovariat mana setiap baris berisi satu baris dari (n,p) desain matriks X , bersama
dengan nol di tempat yang tepat [kovariat dari X dialihkan p tempat di setiap baris
berikutnya di X p ]. Superscript P adalah dimaksudkan untuk menunjukkan ukuran
T

yang berbeda dari matriks koefisien regresi dan matriks desain yang terkait dengan
model proses. I adalah matriks identitas n x n dan 2 adalah varians error. Distribusi
sebelumnya untuk parameter koefisien regresi ditentukan sebagai

, ~ I n1 ,

di mana vektor 0 ,, p

(C.5.32)

berisi istilah regresi. Operator produk Kronecker

(), mengalikan setiap elemen di I n1 dengan . Sebelumnya pada koefisien regresi


memperhitungkan kemungkinan ketergantungan spasial dalam koefisien melalui
kovarians, , yang memiliki bentuk dipisahkan dengan dua komponen yang berbeda,
satu untuk ketergantungan spasial di koefisien regresi dan satu untuk di situs
P
ketergantungan antara koefisien. Dipisahkan dalam bentuk matriks kovarians untuk

adalah
R T

(C.5.33)

dimana R adalah n x n matriks korelasi yang menangkap hubungan spasial antara n


lokasi menggunakan antar-titik jarak, adalah parameter spasial dependen yang tidak
diketahui, dan T adalah positif untuk matriks kovarians koefisien regresi p x p di lokasi
spasial apapun. Berbeda dengan aplikasi fungsi kernel spasial dalam GWR, matriks
39

kovarians np x np membentuk struktur covarian antara semua koefisien regresi secara


simultan. Dipisahkan pada matriks kovarians, masing-masing dari koefisien p diwakili
dalam kovarian yang diasumsikan memiliki struktur ketergantungan spasial yang sama.
Ini sejalan dengan asumsi dalam GWR rentang ruang yang sama bagi setiap istilah
regresi.
Spesifikasi model Bayesian SVCP lengkap dengan spesifikasi yang tersebut
distribusi sebelumnya untuk parameter lainnya. Sebuah konjugat sebelumnya untuk
koefisien yang mencukupi berarti adalah Gaussian. Sebuah konjugat sebelumnya untuk
dalam matriks kovarians adalah invers Wishart dan konjugat sebelumnya untuk varians
kesalahan invers gamma. Satu dapat menggunakan uniform atau gamma untuk
parameter ketergantungan spasial. Perbedaan pada model parameter dicapai dengan
MCMC dengan sampling dari gabungan paramerer distribusi posterior. Lihat Wheeler
dan Calder (2007) untuk Rincian pelaksanaan MCMC untuk model SVCP.
C.5.7 Contoh Pada kematian akibat kanker kandung kemih
Contoh ilustrasi yang direkomendasikan yang diterapkan dengan Pendekaan GWR,
analisis tingkat kematian kanker kandung kemih pria kulit putih di 506 wilayah
perekonomian (SEA) di Amerika Serikat dan yang berdekatan pada tahun 1970-1994
ditunjukkan pada dataset yang berasal dari the Atlas of Cancer mortality from national
Cancer Institute (Devesa et al. 1999) yang berisi tingkat kematian (100.000 orang per
tahun). Tingkat kematian diplot pada Gambar. C.5.1 untuk SEA. Variabel penjelas yang
menarik adalah kepadatan penduduk dan angka kematian kanker paru-paru. kepadatan
penduduk digunakan sebagai pengganti untuk perbedaan perilaku dan lingkungan
sehubungan dengan daerah perkotaan/pedesaan. Diperkirakan ,pada beberapa penelitian
menunjukkan, bahwa dengan peningkatan kepadatan penduduk, ada peningkatan dalam
tingkat kanker kandung kemih. Angka kematian kanker paru-paru digunakan sebagai
pengganti untuk perokok, yang merupakan faktor risiko yang diketahui mengakibatkan
kanker kandung kemih. Ada bukti bahwa gangguan kesehatan ketika ada peningkatan
dalam merokok dan menyebabkan risiko kanker kandung kemih, karena itu, diharapkan
adanya hubungan positif antara variabel-variabel ini. Ada juga bukti yang membenarkan

40

perkiraan merokok dengan kanker paru-paru, karena risiko yang timbul dari merokok
untuk kanker paru-paru lebih besar dari 80 persen dan risiko yang timbul dari merokok
untuk kanker kandung kemih lebih besar dari 55 persen (Mehnert et al. 1992).
Sebagai langkah awal dalam analisis, tradisional, atau model regresi global
Diperkirakan untuk kematian kanker kandung kemih. Model dasar adalah

yi 1 2 x1 i 3 x2 i i

(C.5.34)

mana yi adalah angka kematian kanker kandung kemih untuk laki-laki kulit putih
selama bertahun-tahun 1970 menjadi1994 untuk i pada SEA, x1 adalah angka kematian
kanker paru-paru untuk jangka waktu 1954-1969, dan x 2 adalah log alami kepadatan
penduduk. Sebuah pengganti rokok digunakan dari periode waktu sebelumnya untuk
mewakili periode induksi untuk kanker kandung kemih diberikan faktor risiko.
kepadatan penduduk adalah log alami berubah hubungan linear dengan kematian kanker
kandung kemih.
Koefisien determinasi untuk model global yang dipasang adalah 0,25 dan root mean
square error (RMSE) dari variabel respon diperkirakan adalah 1,06. Estimasi koefisien
regresi pada OLS adalah 1 =3.832 , 2 =0.029, 3 =0.277 dan p -values untuk semua
koefisien ini kurang dari 0.001. Kedua pengganti rokok faktor risiko dan kepadatan
penduduk log secara signifikan berhubungan positif dengan tingkat kematian kanker
kandung kemih, seperti yang diharapkan. Faktor varians inflasi pada dua koefisien
varianel penjelas kurang dari 1,6 dan korelasi global parameter regresi adalah cukup
negatif di -0,60, sedangkan korelasi dua variabel adalah 0,60. Hasil dari analisis awal
menunjukkan kolinearitas bukan masalah yang signifikan pada model data.

41

Gambar. C.5.1. Tingkat kematian Standar untuk kanker kandung kemih di kalangan laki-laki kulit putih dari 1970 untuk tahun 1990
di Negara Ekonomi Kawasan Amerika Serikat berdekatan.

Selanjutnya, model GWR dipasang menggunakan data kematian kanker kandung


kemih dalam Software R dengan kode custom. Perhatikan bahwa ada paket R gratis
untuk memperkirakan model parameter GWR, spGWR, ditulis oleh Roger Bivand (lihat
Bab A.3). Model GWR,
Y i 1 i 2 i x1 i 3 i x2 i i

(C.5.35)

dimana koefisien regresi sekarang bervariasi oleh SEA. Melalui cross-validasi, estimasi
kernel Bandwidth pada GWR adalah =1,27 . RMSE dari perkiraan variabel respon
untuk model GWR dengan estimasi bandwidth dan berhubungan dengan estimasi
koefisien regresi adalah 0,52, yang merupakan pengurangan tanda dari model OLS.
Koefisien regresi bervariasi dengan SEA menunjukkan peningkatan kematian kanker
kandung kemih. Biasanya, menggabungkan pengamatan yang penyadapan spesifik
dalam model akan memperbaiki model sehingga model jauh lebih dari pada model tetap.
Diperkirakan koefisien GWR yang digambarkan pada Gambar. C.5.2 untuk tiga
regresi. Estimasi koefisien variasi terlihat, dengan negara koefisien negatif terintuitive
di beberapa SEA untuk kedua proxy merokok dan kepadatan penduduk, meskipun ada
koefisien negatif bagi kepadatan penduduk . Wheeler dan Tiefelsdorf (2005)

42

merekomendasikan menggunakan scatterplot dari estimasi

koefisien GWR untuk

pasangan regresi yang memvisualisasikan sifat ketergantungan estimasi koefisien GWR.


Pada Gambar C.5.3 Memiliki tiga pasang scatterplot model regresi. Ada korelasi
discernable di koefisien di beberapa daerah, terutama untuk intercep dan proxy yang
merokok koefisien dan proxy merokok dan koefisien kepadatan penduduk. Koefisien
korelasi Pearson untuk koefisien GWR untuk pasang istilah regresi r12 =-0.36 , r13=-0.28,
r14=-0.74, Dimana subskrip menunjukkan istilah regresi. Tingkat korelasi dalam
koefisien untuk proxy merokok dan kepadatan penduduk adalah kekuatan utama pada
GWR dari model OLS. Keseluruhan tingkat korelasi dalam koefisien GWR ini bisa
menunjukkan tekanan dari kolinearitas lokal dalam model GWR yang dapat
menyebabkan masalah perbedaan pada koefisien GWR.

Gambar. C.5.2. Perkiraan koefisien GWR untuk

1 (intersep), 2 (Smoking proxy), 3 (Kepadatan populasi)

Untuk lebih mengeksplorasi ketergantungan pada koefisien regresi, proporsi variandekomposisi dan indeks kondisi alat diagnostik (Wheeler 2007) dijelaskan yang
sebelumnya telah diterapkan. GWR yang mengestmasi bandwidth yang terdapat pada
variabel tersebut dekomposisi dari kernel desain matriks pembobot untuk menilai
kolinearitas pada model GWR. Dari 506 SEA dalam dataset, tiga belas memiliki indeks
kondisi lebih besar dari tiga puluh, delapan puluh lima memiliki indeks kondisi lebih
dari dua puluh, dan 500 memiliki indeks kondisi lebih besar dari sepuluh untuk
komponen varians terbesar. Pada 436 catatan dalam data dengan proporsi varians besar
(lebih dari 0,5) untuk komponen varians terbesar, dengan komponen bersama menjadi
antara dua kovariat untuk beberapa catatan dan antara kovariat dan intercept untuk
lainnya. Dari catatan ini, 431 juga memiliki indeks kondisi lebih besar dari sepuluh

43

untuk komponen varians terbesar. Secara keseluruhan, proporsi varians-dekomposisi dan


nilai indeks kondisi menunjukkan adanya beberapa kolinearitas lokal yang substansial
dalam model GWR.

Gambar. C.5.3.

Perkiraan koefisien GWR untuk

2 Versus 1 (kiri), 3 Versus 1

(Tengah),

3 Versus 2

(kanan)

Selain melihat ringkasan dari alat diagnostik, hal ini berguna, terutama untuk tujuan
inferensial, untuk memvisualisasikan nilai-nilai diagnostik dengan link grafis untuk
koefisien GWR yang dipetakan untuk memeriksa letak koefisien (Wheeler 2008).
Gambar C.5.4 berisi peta dari koefisien GWR untuk intercept dan merokok proxy,
paralel koordinat plot-kondisi yang indeks dan proporsi varians untuk komponen varians
terbesar, dan histogram kondisi indeks. Garis paralel koordinat plot yang disorot adalah
pilihan satu set dari tiga puluh SEA dengan kondisi terbesar. SEA yang dipilih sama
disorot dengan penggarisan silang kuning di peta koefisien. Sebagian besar SEA yang
dipilih adalah yang perifer di Barat. ini jelas secara paralel koordinat plot yang sebagian
besar SEA yang dipilih memiliki proporsi yang besar untuk kedua intercept dan proxy
merokok pada komponenen variansi terbesar.
Tabel C.5.1. Indeks Kondisi dan varians-dekomposisi proporsi untuk komponen varians terbesar

31

32

32

39.5
37.0
36.2
35.8
33.6
33.5
33.0

0.97
0.97
0.97
0.96
0.95
0.97
0.93

0.99
0.99
0.98
0.98
0.99
0.99
0.98

0.27
0.18
0.07
0.05
0.28
0.31
0.18

44

32.7
32.6
31.1
31.0
30.5
30.3

0.96
0.99
0.93
0.59
0.73
0.93

0.98
0.99
0.98
1.00
0.98
0.98

0.07
0.12
0.18
0.37
0.21
0.20

proporsi varians-dekomposisi untuk intercept, proksi merokok, dan kepadatan penduduk


. Proporsi varians-dekomposisi dan kondisi indeks yang tercantum dalam Tabel C.5.1
untuk catatan dengan kondisi indeks lebih besar dari tiga puluh untuk komponen varians
terbesar. Seperti yang dibuktikan dalam tabel, sebagian besar catatan memiliki proporsi
varians hampir satu untuk intercept dan proxy merokok, yang berarti bahwa variabel
tersebut dari dua istilah regresi ini dijelaskan oleh salah satu komponen di lokasi ini.
Masalah dengan ketergantungan yang tinggi akan dicoba untuk menafsirkan pola spasial
dalam koefisien untuk individu, yaitu marginal inferensi, akan menyebabkan kesimpulan
yang bias.
Selain varians bersama intercept dan proxy efek merokok di beberapa SEA, ada SEA
lain dengan varians besar dekomposisi proporsi untuk kedua proxy merokok dan
kepadatan penduduk untuk variabel terbesar komponen. Gambar C.5.5 menunjukkan ini
dengan peta terkait dari GWR koefisien proxy merokok dan log kepadatan penduduk ,
Scatterplot dari variabel proporsi dekomposisi, dan histogram kondisi indeks. selektif
yang dalam semua grafis untuk SEA dengan varians proporsi yang lebih besar dari 0,6
untuk kedua istilah regresi. Sebagian besar indeks kondisi SEA ini melebihi sepuluh.
Sebagian besar SEA yang dipilih dengan komponen varians bersama untuk merokok
proxy dan kepadatan penduduk yang terletak di Midwest dan Timur Laut. ini adalah
daerah di mana koefisien GWR harus ditafsirkan dengan hati-hati.
Sebagai alternatif untuk GWR, model Bayesian juga dilengkapi SVCP. Estimasi
koefisien regresi diplot pada Gambar. C.5.6 side x side untuk GWR dan model SVCP
sebagai sarana perbandingan. kontras tertentu, seperti lebih banyak variasi dalam
koefisien GWR. Ada baik lebih rendah dan lebih tinggi koefisien untuk model GWR
dibandingkan dengan model SVCP untuk setiap regresi, meskipun dengan mencegat dan
kepadatan penduduk. Untuk menjadi lebih bervariasi, koefisien GWR spasial lebih halus
untuk proxy yang merokok daripada koefisien SVCP. Model SVCP yang lebih baik
45

membatasi koefisien di daerah di mana nilai-nilai diagnostik yang ditunjukkan masalah


dengan model lokal GWR, seperti di California untuk 1 dan 2 dan dalam area tengah
untuk 2 dan 2 . Seperti yang direkomendasikan oleh Pez dan Wheeler (2009),
penggunaan pendekatan komplementer menyediakan saling mendukung bukti non
stasioneritas dalam kasus kanker kandung kemih disajikan dalam bagian ini.

46

Gambar. C.5.4. Perkiraan koefisien GWR untuk intercept (atas) dan proxy merokok (Tengah), paralel koordinat plot untuk kondisi
indeks dan varians dekomposisi proporsional tions (kiri bawah), dan histogram kondisi indeks (kanan bawah) dengan satu set pilihan
untuk SES dengan tiga puluh indeks kondisi terbesar untuk komponen varians terbesar K

47

Gambar. C.5.5. Perkiraan koefisien GWR proxy merokok (atas) dan kepadatan penduduk (Tengah), scatter plot untuk proporsi
varians dekomposisi selama dua istilah regresi ini (Kiri bawah), dan histogram kondisi indeks (kanan bawah) dengan satu set pilihan
untuk SEA dengan kedua proporsi varians dekomposisi lebih besar dari 0,6 untuk variabel terbesar komponen

48

Gambar C.5.6. GWR koefisien (kiri) dan koefisien SVCP (kanan) untuk mencegat (atas),Proxy merokok (tengah), dan kepadatan
penduduk (bawah)

49