OLEH:
KELOMPOK 1
DEPARTEMEN STATISTIKA
UNIVERSITAS HASANUDDIN
2019
KATA PENGANTAR
Puji dan syukur kami panjatkan kehadirat Allah SWT karena atas segala rahmat dan
hidayah-Nya sehingga tugas ini dapat diselesaikan tepat pada waktunya guna memenuhi
salah satu tugas mata kuliah Analisis Data Spasial. Salam dan Shalawat juga kita haturkan
kepada junjungan kita Baginda Rasulullah SAW.
Selama penyusunan tugas ini, banyak pihak yang telah membantu dalam penyusunan.
Tanpa bantuan dari berbagai pihak tersebut, tidak mungkin kami dapat menyelesaikan tugas
ini. Untuk itu kami mengucapkan terima kasih kepada Allah SWT atas karunia-Nya yang tak
terhitung jumlahnya.
Dalam penyusunan tugas ini, kami menyadari bahwa terdapat kekurangan baik dari
segi fisik laporan ataupun sistematika penulisannya. Oleh karena itu, kami mengharapkan
bimbingan baik berupa kritik dan saran yang sifatnya membangun dari semua kalangan.
Akhir kata, semoga tugas ini bermanfaat bagi mahasiswa, khususnya Mahasiswa Fakultas
Matematika dan Ilmu Pengetahuan Alam, Perguruan tinggi dan Lembaga/Institusi maupun
masyarakat luas pada umumnya.
Penyusun
ii
DAFTAR ISI
iii
DAFTAR TABEL
iv
v
BAB I
PENDAHULUAN
1
BAB II
TINJAUAN PUSTAKA
2
b. Bandwdith adalah ukuran jarak fungsi pembobot dan sejauh mana pengaruh lokasi
terhadap lokasi lain. (Fotheringham, Brunsdon, dan Charlton, 2002).
c. Cross validation merupakan metode yang dapat digunakan untuk mendapatkan model
kurva regresi terbaik. Cross validation dapat mengestimasi prediksi error dari sebuah
model ( Fotheringham, Brunsdon, dan Charlton. 2002).
d. Jarak euclidean, yaitu jarak yang diukur berdasarkan euclidean (jarak dari satu obyek
ke obyek lain) atau berdasarkan usaha yang diperlukan untuk mencapai satu titik dari
titik lain.
3
2.4 Uji Asumsi Klasik
Apabila dalam analisis regresi tidak didasarkan pada asumsi residual, akan
mengakibatkan hasil pendugaan regresi tidak sesuai. Asumsi residual dalam model regresi
harus memenuhi kriteria identik, independen, dan berdistribusi normal (Algifari, 2000).
Pemodelan regresi klasik dengan Ordinary Least Square (OLS) sangat ketat terhadap
beberapa asumsi. Untuk melakukan analisis regresi diperlukan asumsi-asumi residual yang
harus dipenuhi di antaranya adalah :
1. Uji Normalitas
Uji normalitas dilakukan sebelum data diolah berdasarkan model-model penelitian
yang diajukan. Uji normalitas bertujuan untuk mendeteksi distribusi data dalam suatu
variabel yang akan digunakan dalam penelitian. Data yang baik dan layak untuk
membuktikan model-model penelitian tersebut adalah data yang memiliki distribusi
normal. Jika asumsi kenormalan tidak terpenuhi, estimasi OLS tidak dapat digunakan.
Ada bermacam-macam cara untuk mendeteksi normalitas distribusi data, salah satunya
menggunakan uji Kolmogorov-Smirnov.
a. Hipotesis untuk uji Kolmogorov-Smirnov adalah sebagai berikut :
𝐻0 : residual berdistribusi normal
𝐻1 : residual tidak berdistribusi normal
b. Statistik Uji
𝐷 = |𝑆(𝑥) − 𝐹0 (𝑥)| (2.3)
dengan :
𝐹0 (𝑥) : fungsi distribusi kumulatif teoritis
𝑆(𝑥) : fungsi distribusi kumulatif sampel
Pengambilan keputusan adalah tolak 𝐻0 jika |𝐷| > 𝑞(1 − 𝛼), dimana q adalah nilai
berdasarkan tabel Kolmogorov-Smirnov, artinya residual tidak berdistribusi normal
dan asumsi normal tidak terpenuhi. Pengambilan keputusan juga dapat dilihat dari
nilai 𝑝 − 𝑣𝑎𝑙𝑢𝑒, tolak 𝐻0 jika 𝑝 − 𝑣𝑎𝑙𝑢𝑒 < 𝛼.
2. Uji Multikolinieritas
Asumsi Multikolinearitas adalah asumsi yang menunjukkan adanya hubungan linier
yang kuat antara beberapa variabel prediktor dalam suatu model regresi linier berganda.
Model regresi yang baik memiliki variabel-variabel prediktor yang independen atau tidak
berkorelasi. Pada pengujian asumsi ini, diharapkan asumsi multikolinieritas tidak
terpenuhi. Penyebab terjadinya kasus multikolinieritas adalah terdapat korelasi atau
hubungan linier yang kuat diantara beberapa variabel prediktor yang diasumsikan ke
dalam model regresi, seperti variabel-variabel ekonomi yang kebanyakan terkait satu
dengan yang lain (intercorrelation). Ada beberapa cara untuk mendeteksi
multikolinieritas dalam model regresi linier, salah satunya melalui nilai Variance
Inflation Factor (VIF) (Rosadi, 2011). Nilai VIF didefinisikan sebagai berikut:
1
𝑉𝐼𝐹 = 1−𝑅2 (2.4)
𝑗
4
multikolinearitas dan kriteria keputusan gagal tolak 𝐻0 jika nilai 𝑉𝐼𝐹 < 10 yang artinya
tidak terdapat multikolinearitas.
3. Uji Heteroskedastisitas
Salah satu statistik uji yang dapat digunakan untuk menguji apakah ragam dari error
bersifat heteroskedastisitas atau tidak adalah Breusch-Pagan Test. Menurut Kutner, dkk
(2004), uji ini mengasumsikan bahwa komponen error adalah independen dan tersebar
normal. Hipotesisnya adalah sebagai berikut:
H0 : Tidak terjadi masalah heteroskedastisitas
H1 : Terjadi masalah heteroskedastisitas
Adapun statistik uji Breusch-Pagan sebagai berikut:
1
𝐵𝑃 = 2 (∑𝑛𝑖=1 𝑥𝑖 𝑓𝑖 )′ (∑𝑛𝑖=1 𝑥𝑖 𝑥𝑖 ′ )(∑𝑛𝑖=1 𝑥𝑖 𝑓𝑖 ) (2.5)
𝜀𝑖2 𝜀𝑖2
Dengan 𝑓𝑖 = ( − 1), 𝜀𝑖 = (𝑦𝑖 − 𝑦̂𝑖 ) dan 𝜎 2 = ∑𝑛𝑖=1 𝑛
𝜎2
2
Uji ini menyebar 𝒳𝑘−1 , dimana 𝑘 adalah banyaknya parameter regresi. Kriteria
pengujiannya sebagai berikut:
2
≤ 𝒳𝑘−1 , 𝑡𝑒𝑟𝑖𝑚𝑎 𝐻0
𝐵𝑃 = { 2
≥ 𝒳𝑘−1 , 𝑡𝑜𝑙𝑎𝑘 𝐻0
Pengambilan keputusan juga dapat dilihat dari nilai 𝑝 − 𝑣𝑎𝑙𝑢𝑒, tolak 𝐻0 jika 𝑝 −
𝑣𝑎𝑙𝑢𝑒 < 𝛼.
4. Uji Autokorelasi
Asumsi yang menyatakan bahwa antara serangkaian observasi yang diurutkan
menurut waktu tidak terjadi autokorelasi atau adanya kebebasan antar galat, dapat
dideteksi dengan pengujian empiris, yaitu uji Durbin-Watson dengan hipotesis sebagai
berikut:
𝐻0 : tidak terdapat autokorelasi antar galat
𝐻1 : terdapat autokorelasi antar galat
Tahapan pengujian Durbin-Watson, yaitu :
a. Mengestimasi model regresi dengan metode kuadrat terkecil untuk mendapat nilai
𝑒̂𝑖 , dimana 𝑒̂𝑖 = 𝑦𝑖 − 𝑦̂𝑖 .
b. Mencari nilai d yang dinyatakan dengan rumus:
∑𝑛
𝑖=2(𝑒̂ 𝑖 −𝑒̂ 𝑖−1 )
2
𝑑= ∑𝑛 2 (2.6)
𝑖=2 𝑒̂ 𝑖
c. Untuk ukuran sampel dan banyaknya variabel tertentu dapat dilihat pada tabel
Durbin-Watson (DW) mengenai pasangan nilai kritis.
d. Kriteria keputusan dalam uji DW adalah:
1) Jika 𝑑 < 𝑑𝐿 atau 𝑑 > 4 − 𝑑𝐿 , maka 𝐻0 ditolak yang artinya terjadi autokorelasi.
2) Jika 𝑑𝑈 < 𝑑 < 4 − 𝑑𝑈 , maka 𝐻0 gagal ditolak yang artinya tidak terjadi
autokorelasi.
3) Jika 𝑑𝐿 ≤ 𝑑 ≤ 𝑑𝑈 atau 4 − 𝑑𝑈 ≤ 𝑑 ≤ 4 − 𝑑𝐿 , maka tidak ada keputusan.
5
1. Uji Serentak (Uji Simultan)
Uji F-statistik ini dilakukan untuk menguji signifikansi pengaruh dari semua
variabel prediktor secara keseluruhan terhadap variabel respon.
a. Hipotesis
𝐻0 ∶ 𝛽1 = 𝛽2 = … = 𝛽𝑝 = 0 (tidak ada pengaruh variabel prediktor terhadap
variabel respon)
𝐻1 ∶ 𝛽𝑘 ≠ 0, 𝑘 = 1,2,3, … , 𝑝 (minimal ada satu pengaruh variabel prediktor
terhadap variabel respon)
b. Statistik Uji
𝐽𝐾𝑅 ⁄𝑝
𝐹ℎ𝑖𝑡 = 𝐽𝐾𝐺 ⁄(𝑛−𝑝−1) (2.7)
dengan:
𝐾 : banyaknya variabel bebas yang digunkanan dalam penelitian 𝑌̂𝑌̅.
𝑛
2
𝐽𝐾𝑅 = ∑(𝑌̂𝑖 − 𝑌̂)
𝑖=1
𝑛
2
𝐽𝐾𝐺 = ∑(𝑌𝑖 − 𝑌̂𝑖 )
𝑖=1
𝑛
6
dengan:
𝛽𝑘 : nilai koefisien pada pengamatan ke-k ; 𝑘 = 0, 1, 2, … , 𝑝
𝑠(𝛽𝑘) : standar error koefisien pada pengamatan ke-k, 𝑘 = 0, 1, 2, … , 𝑝
−1
√𝑐(𝑝+1) 𝑠 : unsur ke (𝑝 + 1) diagonal (𝑥𝑥)
𝑠 : akar dari kuadrat rata-rata galat
c. Daerah Kritis
Tolak 𝐻0 jika 𝑡ℎ𝑖𝑡 > 𝑡((𝑛−𝑝−1);𝛼⁄2)
7
(𝑢𝑖 ) merupakan matriks pembobot spasial lokasi ke-i (spatial weighting) yang nilai elemen-
elemen diagonalnya ditentukan oleh kedekatan pengamatan (lokasi) ke-i dengan lokasi
lainnya (lokasi ke-j). Semakin dekat lokasinya semakin besar nilai pembobot pada elemen
yang bersesuaian. Misalkan matriks pembobot pada titik lokasi pengamatan ke-i adalah (𝑢𝑖),
dapat dinyatakan sebagai berikut
𝑤𝑖1 0 ⋯ 0
0 𝑤𝑖2 ⋯ 0
𝑤(𝑢𝑖 , 𝑣𝑖 ) = [ ]
⋮ ⋮ ⋱ ⋮
0 0 0 𝑤𝑖𝑛
dengan :
𝑤(𝑢𝑖 , 𝑣𝑖 ) : Matriks diagonal [ n x n], setiap elemen diagonalnya merupakan pembobot untuk
masing-masing titik lokasi pengamatan (𝑢𝑖 , 𝑣𝑖 ) atau 𝑤𝑖𝑗 .
Penaksiran koefisien regresi pada GWR dilakukan dengan motode kuadrat terkecil
terboboti atau Wighted Least Square (WLS), yaitu metode kuadrat terkecil dengan
memberikan bobot berbeda pada setiap lokasi pengamatan. Pembobot tersebut berupa matriks
diagonal dimana elemen-elemen diagonalnya merupakan sebuah fungsi pembobot dari titik
lokasi pengamatan.
𝑦𝑖 = 𝛽0 (𝑢𝑖 , 𝑣𝑖 ) + ∑𝑝𝑘=1 𝛽𝑘 (𝑢𝑖 , 𝑣𝑖 )𝑋𝑖𝑘 + 𝜀𝑖 (2.13)
𝑝
𝜀𝑖 = 𝑦𝑖 − 𝛽0 + ∑𝑘=1 𝛽𝑘 (𝑢𝑖 , 𝑣𝑖 )𝑋𝑖𝑘 (2.14)
(dikalikan dengan matrik 𝑤𝑖𝑗 )
𝜀 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 ) =
𝑌 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑌 − 2𝛽 𝑇 (𝑢𝑖 , 𝑣𝑖 )𝑋 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑌 + 𝛽 𝑇 (𝑢𝑖 , 𝑣𝑖 )𝑋 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑋𝛽(𝑢𝑖 , 𝑣𝑖 ) (2.15)
Jumlah kuadrat error akan minimum dengan mendiferensiasikan persamaan terhadap
𝛽 ′ (𝑢𝑖 , 𝑣𝑖 ) seperti berikut ini :
𝜕
𝜀 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )𝜀 = 0 − 2𝑋 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑌 + 2𝑋 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑋𝛽̂ (𝑢𝑖 , 𝑣𝑖 ) = 0 (2.16)
𝜕𝛽𝑇 (𝑢 ,𝑣 )
𝑖 𝑖
0 − 2𝑋 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑌 + 2𝑋 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑋𝛽(𝑢𝑖 , 𝑣𝑖 ) = 0
−2𝑋 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑌 + 2𝑋 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑋𝛽(𝑢𝑖 , 𝑣𝑖 ) = 0
2𝑋 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑌 + 2𝑋 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑋𝛽̂ (𝑢𝑖 , 𝑣𝑖 )
𝑋 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑌 + 2𝑋 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑋𝛽̂ (𝑢𝑖 , 𝑣𝑖 ) (2.17)
𝑇 (𝑢
Untuk memperoleh nilai koefisien regresi 𝛽 𝑖 , 𝑣𝑖 ), kalikan kedua ruas dari sebelah
𝑇
kiri pada persamaan dengan invers 𝑋 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑥 sehingga:
[𝑋 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑋]−1 𝑋 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑋𝛽̂ (𝑢𝑖 , 𝑣𝑖 ) = [𝑋 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑋]−1 𝑋 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑌 (2.18)
[𝑋 𝑇 (𝑢 )] −1 𝑇 )𝑋
Dari persamaan di atas dengan 𝑖 , 𝑣𝑖 𝑋 𝑤(𝑢𝑖 , 𝑣𝑖 = 1, diperoleh :
𝑇 −1 𝑇
𝐼𝛽(𝑢𝑖 , 𝑣𝑖 ) = [𝑋 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑋] 𝑋 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑌 (2.19)
atau
𝛽̂ (𝑢𝑖 , 𝑣𝑖 ) = [𝑋 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑋]−1 𝑋 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑌 (2.20)
𝛽̂ (𝑢𝑖 , 𝑣𝑖 ) merupakan penaksiran yang bersifat tak bias, efisien dan konsisten bagian
𝛽(𝑢𝑖 , 𝑣𝑖 ). Misalkan 𝑥𝑖𝑇 = (1, 𝑥𝑖1 , 𝑥𝑖2 , … , 𝑥𝑖𝑝 ) adalah elemen baris ke-1 dari matriks x, nilai
taksiran Y pada titik lokasi pengamatan (𝑢𝑖 , 𝑣𝑖 ) adalah :
𝑌̂𝑖 = 𝑥𝑖𝑇 𝛽̂ (𝑢𝑖 , 𝑣𝑖 )
𝑌̂𝑖 = 𝑥𝑖𝑇 [𝑋 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑋]−1 𝑋 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑌 (2.21)
8
Misalkan 𝑥𝑖′ [𝑋 ′ (𝑢𝑖 , 𝑣𝑖 )𝑋]−1 𝑋 ′ 𝑤(𝑢𝑖 , 𝑣𝑖 ) adalah elemen ke-I dari matriks 𝑆𝐼 , sehingga
nilai matriks Y untuk n buah pengamatan menjadi;
𝑌̂𝑖 = 𝑆𝑖 𝑌 (2.22)
dengan nilai 𝑆𝑖 adalah :
𝑥1 [𝑋 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑋]−1 𝑋 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )
[𝑋 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑋]−1 𝑋 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )
𝑆𝑖 = 𝑥2 (2.23)
⋮
[ 𝑥𝑖 [𝑋 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )𝑋]−1 𝑋 𝑇 𝑤(𝑢𝑖 , 𝑣𝑖 )]
2.6.2 Bandwdith
Bandwidth adalah ukuran jarak fungsi pembobot dan sejauh mana pengaruh lokasi
terhadap lokasi lain. Secara teoritis bandwidth merupakan lingkaran dengan radius b dari titik
pusat lokasi, dimana digunakan sebagai dasar menentukan bobot setiap pengamatan terhadap
model regresi pada lokasi tersebut. Untuk pengamatan-pengamatan yang terletak dekat
dengan lokasi i maka akan lebih berpengaruh dalam membentuk parameter model pada
lokasi-𝑖.
Untuk mendapatkan bandwidth optimum, dapat dilakukan dengan menghitung cross
validation (CV). Jika nilai CV semakin kecil, maka didapatkan bandwidth yang optimum
dengan menggunakan rumus sebagai berikut:
𝐶𝑉 = ∑𝑛𝑖=1[𝑦𝑖 − 𝑦̂≠𝑖 (𝑏)]2 (3.37)
Dengan :
𝑖 = lokasi ke-i
𝑏 = bandwidth
𝑦̂≠𝑖 (𝑏) = nilai prediksi dari model regresi tanpa pengamatan ke-𝑖
Proses untuk mendapatkan bandwidth yang meminimumkan nilai CV bisa dilakukan
dengan menggunakan teknik Golden Section Search. Proses ini dilakukan dengan
mengevaluasi fungsi dengan tiga nilai yang berbeda misalnya a, b dan c dimana a < b < c, a
merupakan batas bawah nilai bandwidth yang mungkin dan c merupakan batas atas nilai
bandwidth yang mungkin. Nilai a diperoleh dari nilai minimum 𝑑𝑖𝑗 sedangkan c diperoleh
dari nilai maksimum 𝑑𝑖𝑗 . Nilai fungsi yang dihasilkan pada tiga titik tersebut adalah f(a), f(b)
dan f(c), yang disebut juga sebagai triplet. Fungsi tersebut dievaluasi lagi pada suatu nilai
baru d yang bisa ditentukan di antara a dan b atau b dan c, sehingga menghasilkan nilai fungsi
baru, yaitu f(d). Kemudian buang salah satu dari nilai a atau c untuk membentuk triplet baru.
Aturan yang digunakan pada teknik Golden Section Search adalah:
Jika f(b) < f(d) : triplet baru yang digunakan adalah a < b < d
Jika f(b) > f(d) : triplet baru yang digunakan adalah b < d < c
Proses tersebut berulang sampai dengan dua nilai f(d) yang dihasilkan mendekati
sama atau selisihnya lebih kecil daripada suatu nlai yang dibentukan misal 1 × 10−6 , atau
sampai suatu nilai interasi maksimum yang diperoleh (Caraka dan Yasin, 2017).
9
menggunakan beberapa metode yang berbeda. Terdapat beberapa literatur untuk menentukan
besarnya pembobot untuk masing-masing lokasi yang berbeda pada model GWR, diantaranya
dengan menggunakan fungsi kernel (kernel function). Fungsi kernel digunakan untuk
menduga parameter dalam model GWR jika fungsi jarak adalah fungsi yang kontinu dan
monoton turun (Chasco et al., 2007). Pembobot yang terbentuk dengan menggunakan fungsi
kernel adalah fungsi jarak Gaussian, fungsi Exponential, fungsi Bisquare, dan fungsi kernel
Tricube. Masing-masing fungsi pembobot dapat ditulis sebagai berikut:
1. Fungsi Kernel Gauss
Bentuk fungsi kernel gauss adalah
1 𝑑
𝑤𝑗 (𝑢𝑖 , 𝑣𝑖 ) = 𝑒𝑥𝑝 (− 2 ( 𝑏𝑖𝑗 )2 ) (2.24)
Fungsi kernel gauss akan memberi bobot yang akan semakin menurun mengikuti
fungsi gaussian ketika 𝑑𝑖𝑗 semakin besar.
2. Fungsi Kernel Exponensial
𝑑 2
𝑤𝑗 (𝑢𝑖 , 𝑣𝑖 ) = √𝑒𝑥𝑝 (− ( 𝑏𝑖𝑗 ) ) (2.25)
3. Fungsi Kernel Bi-square
Fungsi tersebut dapat dinotasikan sebagai berikut:
2 2
𝑑𝑖𝑗
[1 − ] , 𝑗𝑖𝑘𝑎 𝑑𝑖𝑗 < 𝑏
𝑤𝑗 (𝑢𝑖 , 𝑣𝑖 ) = { 𝑏 (2.26)
0, 𝑗𝑖𝑘𝑎 𝑑𝑖𝑗 ≥ 𝑏,
Fungsi kernel bi-square akan memberi bobot nol ketika lokasi j berada pada atau
diluar radius b dari lokasi i, sedangkan apabila lokasi j berada di dalam radius b maka
akan mendapat bobot yang mengikuti fungsi kernel bi-square.
4. Fungsi Kernel Tricube
𝑑 2 2
(1 − ( 𝑏𝑖𝑗 ) ) , 𝑗𝑖𝑘𝑎 𝑑𝑖𝑗 < 𝑏
𝑤𝑗 (𝑢𝑖 , 𝑣𝑖 ) = { (2.27)
0 , 𝑗𝑖𝑘𝑎 𝑑𝑖𝑗 ≥ 𝑏,
2 2
dengan 𝑑𝑖𝑗 = √(𝑢𝑖 − 𝑢𝑗 ) + (𝑣𝑖 − 𝑣𝑗 ) (2.28)
adalah jarak euclidean antara lokasi (𝑢𝑖 , 𝑣𝑖 ) ke lokasi (𝑢𝑗 , 𝑣𝑗 ) dan b adalah parameter
non negative yang diketahui dan biasanya disebut parameter peghalus (bandwidth).
10
𝑑𝑓1 =𝑛−𝑝−1
𝑆𝑆𝐸(𝐻1 ) = 𝑌 𝑇 (𝐼 − 𝑆)𝑇 (𝐼 − 𝑆)𝑌
𝑑𝑓2 = (𝑛 − 2𝑡𝑟(𝑆) + 𝑡𝑟(𝑆 𝑇 𝑆))
S adalah matriks proyeksi dari model GWR, yaitu matriks yang memproyeksikan nilai
y menjadi 𝑦̂ pada lokasi (𝑢𝑖 , 𝑣𝑖 ) pada rumus (2.23). S adalah matriks 𝑛 × 𝑛 dan I adalah
matriks identitas ordo n.
Jika 𝐹 ∗ lebih besar dari 𝐹𝑡𝑎𝑏𝑒𝑙 , maka diambil keputusan untuk tolak 𝐻0 , dengan kata
lain model GWR mempunyai goodness of fit lebih baik daripada model regresi global. 𝐹 ∗
mengikuti distribusi F dengan derajat bebas 𝑑𝑓1 dan 𝑑𝑓2 . Jika diberikan tingkat signifikansi
sebesar 𝛼, maka diambil keputusan dengan menolak 𝐻0 jika nilai 𝐹 ∗ > 𝐹𝛼;𝑑𝑓1 ,𝑑𝑓2 .
11
BAB III
METODOLOGI
3.1 Data
Data yang digunakan pada penelitian ini merupakan data sekunder yang diperoleh
dari data publikasi Badan Pusat Statistik (BPS) pada buku Statistik Indonesia 2018. Data
tersebut berupa data kepadatan penduduk, jumlah penduduk, laju pertumbuhan penduduk,
migrasi keluar, migrasi masuk, dan luas wilayah. Masing-masing data tersebut merupakan
data dari 34 provinsi yang ada di Indonesia pada tahun 2017.
12
h. Melakukan pengujian signifikansi parameter per titik sampling untuk
mengetahui parameter mana yang signifikan mempengaruhi variabel respon
secara parsial pada masing-masing lokasi.
6. Menarik kesimpulan dari hasil yang diperoleh.
13
BAB IV
HASIL DAN PEMBAHASAN
14
4.3.1 Uji Normalitas
Pada uji asumsi data harus berdistribusi normal. Untuk melakukan uji normalitas
dapat menggunakan berbagai uji, salah satunya dengan uji Kolmogorov-smirnov, dengan
menggunakan software R didapatkan hasil sebagai berikut.
Tabel 2. Hasil Uji Normalitas
D p-value
0.13797 0.09939
a. Hipotesis
H0 : Residual berdistribsi normal
H1 : Residual tidak berdistribusi normal
b. Tingkat signifikansi
α : 0.05
c. Daerah Kritis
p-value < α : 0.05, maka tolak H0 .
d. Keputusan
p-value = 0.09930 > α = 0.05, maka gagal tolak H0.
e. Kesimpulan
Berdasarkan dari hasil analisis yang telah dilakukan dengan menggunakan tingkat
kepercayaan 95% diperoleh keputusan bahwa gagal tolak H0 yang artinya residual
berdistribusi normal.
15
dalam model tidak sama konstan. Variansi galat harus bersifat homoskedastisitas atau
variansi galat bersifat identik tidak membentuk pola tertentu. Namun karena penelitian
menggunakan analisis GWR, keputusan yang diharapkan adalah model bersifat
heteroskedastisitas. Hasil analisis menggunakan uji Breusch-Pagan dapat dilihat pada tabel 3.
Tabel 4. Hasil Uji Heteroskedastisitas
BP df p-value
17.83 5 0.003168
a. Hipotesis
H0 : Tidak terjadi masalah heteroskedastisitas
H1 : Terjadi masalah heteroskedastisitas
b. Tingkat signifikansi
α : 0.05
c. Daerah Kritis
p-value < α : 0.05, maka tolak H0 .
d. Keputusan
p-value = 0.003168 < α = 0.05, maka tolak H0.
e. Kesimpulan
Berdasarkan dari hasil analisis yang telah dilakukan dengan menggunakan tingkat
kepercayaan 95% diperoleh keputusan bahwa tolak H0 yang artinya terjadi masalah
heteroskedastisitas.
a. Hipotesis
H0 : 𝜌 = 0 (tidak terdapat auotokorelasi)
H1 : 𝜌 ≠ 0 (terdapat auotokorelasi)
Tingkat signifikansi
α : 0.05
b. Daerah Kritis
p-value < α : 0.05, maka tolak H0 .
c. Keputusan
p-value = 0.5404 > α = 0.05, maka gagal tolak H0.
d. Kesimpulan
Berdasarkan dari hasil analisis yang telah dilakukan dengan menggunakan tingkat
kepercayaan 95% diperoleh keputusan bahwa gagal tolak H0 yang artinya tidak
terdapat autokorelasi.
16
4.4 Diagnostic Checking
Untuk keperluan pengujian kelayakan model pada analisis regresi berganda dilakukan
uji simultan dan uji parsial yang dapat dilihat sebagai berikut.
4.4.1 Uji Simultan
Uji F digunakan untuk melihat apakah variabel prediktor secara simultan atau bersama-
sama berpengaruh terhadap variabel respon. Dalam pengujian ini digunakan 𝛼 = 5%.
a. Hipotesis:
H0 : 𝛽1 = 𝛽3 = 𝛽4 = 𝛽6 = 0 (tidak ada hubungan linier)
H1 : 𝛽𝑗 ≠ 0 , 𝑗 = 1,2,3,4,5 (terdapat hubungan linier)
b. Kriteria pengujian:
Tolak H0 jika nilai nilai 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 > 𝐹𝑡𝑎𝑏𝑒𝑙
Terima H0 jika nilai 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 < 𝐹𝑡𝑎𝑏𝑒𝑙
Tabel 6. Hasil Uji F
Sumber Jumlah Kuadrat
DB F-Value F-Tabel(0.05)
Keragaman Kuadrat Tengah
Regresi 5 174129866 34825973
Residual 28 62619659 2236416 15.572222 2.5581275011
Total 33 236749525
c. Kesimpulan:
Berdasarkan tabel 4, terlihat bahwa 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 = 15.572 > 𝐹𝑡𝑎𝑏𝑒𝑙 = 2.558 sehingga H0
ditolak, yang berarti secara simultan variabel jumlah penduduk, laju pertumbuhan
penduduk, migrasi keluar, migrasi masuk dan luas wilayah berpengaruh terhadap
variabel kepadatan penduduk.
17
Luas Wilayah (𝑥5 ) -0.588 0.561 Tidak Signifikan
Dari tabel 5, dapat diambil keputusan bahwa terdapat tiga variabel prediktor yang
secara parsial berpengaruh signifikan terhadap variabel respon. Jadi, dapat disimpulakn
bahwa variabel yang mempengaruhi kepadatan penduduk di Indonesia secara signifikan,
yaitu jumlah penduduk, migrasi keluar dan migrasi masuk.
18
Kalimantan Selatan -318.624 -0.21524 0.001317 0.0019963 0.94325
Kalimantan Timur 159.1541 -0.05082 0.000433 0.0006431 0.63683
Kalimantan Utara 136.1596 -0.129486 0.000831 0.0013256 0.78581
Sulawesi Utara 210.3804 -0.511351 0.003121 0.0029336 0.95516
Sulawesi Tengah -591.1542 -0.371009 0.002146 0.0032072 0.93911
Sulawesi Selatan -494.2819 -0.314703 0.001997 0.0028198 0.96133
Sulawesi Tenggara -492.7724 -0.38248 0.002556 0.0029979 0.96836
Gorontalo -41.06629 -0.30535 0.00208 0.0024678 0.93272
Sulawesi Barat -501.1193 -0.301437 0.001836 0.002745 0.94055
Maluku -522.5317 -0.507182 0.00323 0.0031955 0.96972
Maluku Utara -45.75633 -0.322212 0.002127 0.0025848 0.93536
Papua Barat -639.4682 -0.417779 0.002531 0.0032816 0.96029
Papua -233.6844 -0.584189 0.004007 0.0029057 0.97316
Setiap lokasi memiliki model yang berbeda-beda. Sebagai contoh model yang terbentuk
untuk Provinsi Aceh adalah:
𝑦1 = 8,227222 − 0,393533𝑥1 + 0,00241𝑥3 + 0,0029076𝑥4
Adapun interpretasi dari persamaan tersebut, yaitu:
Jika variabel Banyak Penduduk (𝑥1 ) mengalami kenaikan satu satuan maka Kepadatan
Penduduk akan mengalami penurunan sebesar 0,393533 dengan menganggap variabel
lain konstan.
Jika variabel Banyak Imigrasi Keluar (𝑥3 ) mengalami kenaikan satu satuan maka
Kepadatan Penduduk akan mengalami kenaikan sebesar0,00241.
Jika variabel Banyak Imigrasi Masuk (𝑥4 ) mengalami kenaikan satu satuan maka
Kepadatan Penduduk akan mengalami kenaikan sebesar0,0029076.
𝐻0 : 𝛽𝑘 (𝑢𝑖 , 𝑣𝑖 ) = 𝛽𝑘
(tidak ada perbedaan yang signifikan antara model regresi liniear dan GWR)
𝐻1 : 𝛽𝑘 (𝑢𝑖 , 𝑣𝑖 ) ≠ 𝛽𝑘
19
(ada perbedaan yang signifikan antara model regresi liniear dan GWR)
Berdasarkan tabel diatas didapatkan nilai Fhitung = 9.0705> FTabel = 3.63308851, maka
tolak H0 artinya ada perbedaan yang signifikan antara model regresi liniear dan GWR atau
ada faktor pengaruh geografis pada model.
Untuk membandingkan model terbaik antara regresi global dan GWR dapat
menggunakan langkah , yaitu membandingkan nilai 𝑅 2 dan AIC. Model terbaik diperoleh
dengan kriteria nilai 𝑅 2 yang lebih besar dan nilai AIC yang lebih kecil, serta JKG yang lebih
kecil. Tabel diatas menunjukkan bahwa pemodelan Kepadatan Penduduk di Indonesia
menggunakan GWR memberikan hasil yang lebih baik dibandingkan dengan pemodelan
menggunakan regresi global. Hasil tersebut menunjukkan bahwa regresi linear hanya
memberikan nilai 𝑅 2 sebesar 0,6951 , AIC sebesar 598.5768 dan JKG sebesar 65631483
sedangkan model GWR mampu memaksimalkan nilai 𝑅 2 sebesar 0,9455598 , nilai AIC
sebesar 543.6952 dan JKG sebesar 12888686.
.
20
4.6 Faktor-Faktor Signifikan Setiap Wilayah
Analisis GWR dapat menghasilkan model yang berbeda-beda pada setiap daerah. Dari
lima faktor yang dinyatakan signifikan tersebut akan tetapi setiap daerah memilki faktor-
faktor yang berbeda dengan melihat signifikan pada setiap hasil wilayah, hal ini dapat dilihat
dari nilai statistik uji t jika variabel penjelas memiliki |t-hitung| > t0.05;11,657 = 2,228139.
21
Hipotesis yang digunakan sebagai berikut.
𝐻0 : 𝛽𝑘 (𝑢𝑖 , 𝑣𝑖 ) = 0
(tidak ada pengaruh signifikan dari variabel preditor 𝑥𝑘 terhadap titik sampling)
𝐻1 : 𝛽𝑘 (𝑢𝑖 , 𝑣𝑖 ) ≠ 0, atau minimal ada satu 𝛽𝑘 (𝑢𝑖 , 𝑣𝑖 ) yang berbeda.
(ada pengaruh signifikan dari variabel preditor 𝑥𝑘 terhadap titik sampling)
̂𝑘 (𝑢𝑖 , 𝑣𝑖 )
𝛽
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 =
𝑆𝐸(𝛽̂𝑘 (𝑢𝑖 , 𝑣𝑖 ))
Provinsi x1 x3 x4
Nanggroe Aceh signifikan signifikan signifikan
Darussalam
Sumatera Utara signifikan signifikan signifikan
Sumatera Barat signifikan signifikan signifikan
Riau tidak signifikan tidak signifikan tidak
signifikan
Jambi tidak signifikan tidak signifikan tidak
signifikan
Sumatera Selatan tidak signifikan tidak signifikan tidak
signifikan
Bengkulu tidak signifikan tidak signifikan tidak
signifikan
Lampung tidak signifikan tidak signifikan tidak
signifikan
Kep. Bangka Belitung tidak signifikan tidak signifikan tidak
signifikan
Kepulauan Riau signifikan signifikan signifikan
DKI Jakarta signifikan signifikan signifikan
Jawa Barat tidak signifikan tidak signifikan tidak
signifikan
Jawa Tengah tidak signifikan tidak signifikan tidak
signifikan
DI Yogyakarta (DIY) tidak signifikan tidak signifikan tidak
signifikan
Jawa Timur tidak signifikan tidak signifikan tidak
signifikan
22
Banten signifikan signifikan signifikan
Bali tidak signifikan tidak signifikan tidak
signifikan
Nusa Tenggara Barat signifikan signifikan signifikan
Nusa Tenggara Timur signifikan signifikan signifikan
Kalimantan Barat signifikan signifikan signifikan
Kalimantan Tengah signifikan signifikan signifikan
Kalimantan Selatan signifikan signifikan signifikan
Kalimantan Timur tidak signifikan tidak signifikan tidak
signifikan
Kalimantan Utara signifikan signifikan signifikan
Sulawesi Utara signifikan signifikan signifikan
Sulawesi Tengah signifikan signifikan signifikan
Sulawesi Selatan signifikan signifikan signifikan
Sulawesi Tenggara signifikan signifikan signifikan
Gorontalo signifikan signifikan signifikan
Sulawesi Barat signifikan signifikan signifikan
Maluku signifikan signifikan signifikan
Maluku Utara signifikan signifikan signifikan
Papua Barat signifikan signifikan signifikan
Papua signifikan signifikan signifikan
Pada Tabel terdapat 22 daerah yang signifikan dengan statistik uji thitung>ttabel dan
sebanyak 12 daerah tidak berpengaruh. Hal ini diduga karena ada variabel lain yang lebih
signifikan selain variabel Banyak penduduk, Imigrasi Keluar dan Imigrasi Masuk terhadap
Kepadatan Penduduk di Indonesia. Berikut peta daerah yang signifikan dengan uji thitung>ttabel.
Adapun daerah yang dipengaruhi oleh Banyak Penduduk, Imigrasi Keluar dan Imigrasi
Masuk adalah Nanggroe Aceh Darusaalam, Sumatera Utara, Sumatera Barat, Kepulauan
23
Riau, DKI Jakarta, Banten, Nusa Tenggara Barat, Nusa tenggara Timur, Kalimantan Barat,
Kalimantan Tengah, Kalimantan Selatan, Kalimantan Utara, Sulawesi Utara, Sulawesi
Tengah, Sulawesi Selatan, Sulawesi Tenggara, Gorontalo, Sulawesi Barat, Maluku, Maluku
Utara, Papua Barat, Papua. Berikut ini beberapa model GWR local untuk daerah yang
signifikan dengan variabel Banyak Penduduk, Imigrasi Keluar danImigrasi Masuk.
24
25