Anda di halaman 1dari 22

TUGAS MATA KULIAH

ANALISIS DATA SPASIAL PADA SIG


RANGKUMAN BUKU HANDBOOK OF APPLIED SPATIAL ANALYSIS
SUBBAB B2 ; EKSPLORASI ANALISIS DATA SPASIAL &
B3;AUTOKORELASI SPASIAL

DOSEN PENGAMPU
Prof. Dr. Ir. Henny Pramoedyo, MS

Oleh :
Ikin Sodikin (156090500111001)

PROGRAM STUDI STATISTIKA


PROGRAM PASCASARJANA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS BRAWIJAYA
MALANG
2016

DAFTAR ISI

DAFTAR ISI.........................................................................................................................................ii
B.2. Eksplorasi Analisis Data Spasial....................................................................................................1
B.2.1. Pendahuluan............................................................................................................................1
B.2.2 Plotting and Analisis Data Eksplorasi......................................................................................1
B.2.3 Geovisualisasi..........................................................................................................................3
B.2.4 Menjelajahi pola titik dan geostatistik......................................................................................4
B.2.5 Eksplorasi areal data................................................................................................................5
B.2.6 Penutup....................................................................................................................................7
B.3. Autokorelasi Spasial.......................................................................................................................8
B.3.1. Pendahuluan............................................................................................................................8
B.3.2 Atribut dan Penggunaan Konsep Autokorelasi Spasial...........................................................10
B.3.3 Representasi autokorelasi spasial...........................................................................................10
B.3.4Pengukuran dan Uji Autokorelasi Spasial...............................................................................12
B.3.5 Masalah dalam Penanganan Autokorelasi Spasial..................................................................19
B.3.6 Software Autokorelasi Spasial................................................................................................20

B.2. Eksplorasi Analisis Data Spasial


Oleh Roger S. Bivand

B.2.1. Pendahuluan

Eksplorasi analisis data spasial (ESDA) seperti yang digunakan dalam statistik spasial,
ekonometrik spasial dan geostatistik, dikembangkan dari analisis data eksplorasi

(EDA).
Bab ini akan menyajikan beberapa hal yang mendasari ESDA dan survei survey
beberapa outcome. Dan melibatkan penggunaan software (R-2.8.0 (Tim R
Pengembangan Inti 2008), karena sebagian besar EDA dan ESDA menggukanan teknik

dengan sumber daya komputasi dalam beberapa bentuk.


Chambers (2008, p.1) mengusulkan prinsip bahwa: "Misi kami, sebagai pengguna dan
pencipta perangkat lunak untuk analisis data, adalah untuk mendapat kemungkinan

yang terbaik dan paling menyeluruh dari eksplorasi data yang mungkin."
Cox dan Jones (1981), juga menyampaikan bahwa masalah penelitian substantif:
'Seperti John Tukey sering mengatakan, lebih baik menduga jawaban atas pertanyaan

yang tepat daripada jawaban yang tepat untuk pertanyaan yang salah'
Cressie (1993), dan Bailey dan Gatrell (1995), menunjukkan bahwa kedua EDA dan

ESDA telah lama memainkan peran penting dalam menemukan 'pertanyaan yang tepat'.
Masalah penelitian memfokuskan perhatian pada komponen variasi dalam variabel

respon, pada variabel atau lokasi spasial yang menjelaskan variabilitas yang diamati.
Dalam bab ini, akan bekerja dengan contoh untuk menunjukkan beberapa metode yang
tersedia yang dibangun melalui pendekatan EDA untuk analisis data. Contoh
menggunakan kumpulan data 'Moral Statistik' Perancis yang dibahas secara rinci oleh
Ramah (2007) dan diambil sehubungan dengan visualisasi geografis oleh Dykes dan
Brunsdon (2007).

B.2.2 Plotting and Analisis Data Eksplorasi


-

Cox dan Jones (1981, p.135) menjelaskan salah satu sikap dasar analisis data eksplorasi
sebagai: 'petakan/plot baik data maupun hasil analisis data' - menunjuk langsung

kepada grafik statistik.


Output untuk terminal pengguna interaktif begitu sulit, dengan pengecualian awal yang
pertama yaitu komputer Apple Macintosh, yang tersedia baik layar grafis monokrom
dan perangkat tunjuk.
1

Perangkat lunak visualisasi data yang lain telah memilih untuk menggunakan Java
sebagai platform virtual, seperti yang akan kita lihat dalam Bagian B.2.2 dalam kasus

Mondrian (Theus 2002).


Pengenalan ringkas untuk analisis data eksplorasi oleh Jacoby (1997) memberikan set
data yang pertama dan rincian dari lingkungan komputasi yang digunakan. S digunakan
untuk menunjukkan banyak teknik yang disajikan, dan mereka dapat diperbanyak

dengan menggunakan R.
Kumpulan data berisi kualitas skor program Medicaid pada 48 negara bagian US yang
bersebelahan tahun 1986, di sini disimpan secara eksternal dalam shapefile, dan

menjadi objek SpatialPolygonsDataFrame.


Sejumlah representasi grafis dari nilai-nilai yang diamati dari program nilai kualitas
(PQS), mulai dari yang sederhana tapi informatif seperti perhitungan batang dan daun,
stripchart jittered, dan boxplot dapat ditunjukkan Medicaid, serta plot rug di bagian

bawah sumbu menunjukkan nilai-nilai data.


Selain itu, plot fungsi distribusi kumulatif empiris dari nilai-nilai yang diamati dan

perhitungannya dapat dibandingkan dengan peringkat.


Dotchart yang terlampir menampilkan semua nilai yang diamati, dengan label negara

dan dikelompokkan oleh divisi statistik.


Terkait grafis dinamis. Identifikasi observasi secara interaktif, dan kelompok
pengamatan dengan karakteristik secara bersama, telah muncul sebagai alat eksplorasi

penting dalam analisis data.


Salah satu implementasi yang telah menjabat sebagai forum penelitian untuk
menjelajahi kemungkinan yang ditawarkan oleh multivariat terkait grafis secara

dinamis yaitu XGobi (Masak et al. 1996, 1997).


Cook and Swayne (2007) menunjukkan bagaimana kaitan grafis secara dinamis telah
dikembangkan dan matang, dan bagaimana manipulasi data dinamis, seperti 'terbang
melalui' awan titik data multivariat, dapat dikaitkan dengan statis tetapi direproduksi

dengan penampilan grafis.


Theus (2002) menjelaskan implementasi software Mondrian dari banyak grafis
multivariat yang terkait secara dinamis, termasuk tampilan peta.

B.2.3 Geovisualisasi
-

Geovisualisasi tidak terpisah dari eksplorasi analisis data spasial, melainkan merupakan
tulang punggung ESDA, bergabung dengan berbagai macam teknik yang diusulkan
untuk memeriksa data spasial dalam kerangka visualisasi bersama dan mudah
dipahami.
2

Monmonier (1989) memperkenalkan konsep brushing geografis, meminjam dari


brushing di dinamis terkait grafis, memilih pengamatan untuk terhubung dengan

representasi peta, paling sering memilih pengamatan dalam windows peta.


Banyak dari teknik ini yang diimplementasikan dalam perangkat lunak yang dijelaskan
oleh Haslett et al. (1991) dan Haslett (1992), dan diikuti oleh Dykes (1997, 1998)
dalam 'data kartografi Visualizer' pelaksanaan crossplatform. Kemajuan yang dibuat

pada 1990-an diringkas oleh Andrienko dan Andrienko (1999) dan Gahegan (1999).
Seperti Mondrian, GeoVISTA studio (Takatsuka dan Gahegan 2002) menggunakan
Java untuk mengintegrasikan kerangka lintas-platform yang menghubungkan tampilan

dinamis data spasial dengan dasar-dasar konseptual.


Perlakuan ontologi sebagai bagian integral dari perangkat lunak geovisualisasi

dikembangkan oleh MacEachren et al. (2004a, b).


Pendekatan yang diambil oleh GeoDa (Anselin et al. 2006) lebih sederhana,
menggabungkan grafis yang terkait secara dinamis, tampilan peta, dan teknik eksplorasi

numerik yang akan dibahas dalam Bagian B.2.5.


Kartografi tematik. Kartografi tematik merupakan bagian penting dari analisis data
eksplorasi dengan data spasial, serta memainkan peran penting dalam menyajikan
model. Hal ini juga penting dalam komunikasi hasil di antara dan di akhir penelitian,

baik di layar dalam aplikasi dan dokumen, dan pecetakan.


Dalam ulasan ini, kita akan menggunakan grafis R methodslargely didokumentasikan
dalam Bivand et al. (2008, pp.57-80), khususnya metode spplot untuk kasus yang
sesuai; argumen pertama di sini adalah objek, dan yang kedua, vektor variabel untuk

menampilkan interval kelas yang sama, di sini merupakan variabel tunggal.


Program menunjukkan tampilan peta variabel skor kualitas program; argumen sp.layout

memungkinkan komponen grafis tambahan yang akan ditambahkan ke output.


Peta terkondisi Choropleth. Menampilkan grafis Trellis yang dimaksudkan untuk
mengizinkan peneliti mengeksplorasi hubungan multivariat dengan pengkondisian pada
variabel yang menarik perhatian (Becker et al. 1996).

B.2.4 Menjelajahi pola titik dan geostatistik


-

Eksplorasi pola titik. paket spatstat untuk R menyediakan banyak cara untuk

mengeksplorasi pola titik .


Salah satu set data klasik dari R menunjukkan lokasi gempa bumi di dekat Fiji sejak
tahun 1964; titik-titik dalam koordinat geografis yang disertai dengan kedalaman
terdeteksi, besarnya magnitude, dan jumlah stasiun melaporkan hal itu.

Ini berarti bahwa kita dapat memperlakukannya sebagai pola titik yang telah ditandai,

misalnya menggunakan shringle tumpang tindih non overlapping.


Fungsi xyplot mengambil objek rumus sebagai argumen pertama - ini adalah ekspresi
simbolik dari model yang akan divisualisasikan, di sini dengan poin yang akan diplot

pada bujur dan lintang pada kondisi tertentu pada shingle dalam.
Ditunjukkan bagaimana magnitude juga dapat divisualisasikan pada scatterplots
dikondisikan melalui shingle lanjut, atau simbol berbayang. Di sini kita akan
mempertimbangkan bagaimana kita bisa mengekspresikan intensitas relatif dari pola

titik menggunakan kernel smoothing.


Untuk melakukan hal ini kita harus memproyeksikan koordinat geografis,
menggunakan set pendugaan dari parameter, di sini proyeksi Transverse Mercator
digunakan pada Fiji. Kami menggunakan kernel bisquare standar dengan tiga

bandwidth yang dipilih, dan menetapkan nilai-nilai kernel mendekati nol untuk NA.
Eksplorasi Geostatistik. Besar kemungkinan lebih eksplorasi analisis data spasial

dilakukan dalam geostatistik daripada di domain analisis data spasial;


interpolasi adalah hal yang krusial bergantung pada identifikasi model 'benar', dalam
hal pemilihan lokasi pengamatan, pemasangan model autokorelasi spasial, mendeteksi

kovariat yang berguna, dan memeriksa kesesuaian asumsi seperti isotropi.


Lloyd (2007) dan Muller (2007) memberikan pembahasan lebih lanjut dari teknik untuk
membuat baik penggunaan data secara langsung dan dari desain pola lokasi

pengambilan sampel untuk meningkatkan prediksi.


Di layar, simbol peta berwarna, untuk menarik lebih banyak perhatian pada pola spasial
kuartil dari variabel yang menarik. Kita tentu saja dapat mengkondisikan titik dari
koordinat lokasi pada shringle dari variabel yang menarik. Histogram overplotted
dengan garis kepadatan dan karpet petak menunjukkan bahwa data layak dieksplorasi
lebih, terutama jika trennya adalah mencampur distribusi nilai curah hujan bersamasama. Kecenderungan di sini digunakan sebagai nilai tengah dari data, tapi garis
menunjukkan bahwa tren spasial hadir, tentu saja di samping pengaruh stasiun elevasi,

yang belum disertakan di sini.


Diagnostik Lokasi. Harusnya kita mencoba untuk menambahkan tren spasial, atau
kovariat, kita harus memperhatikan peringatan yang diberikan oleh Unwin dan Wrigley
(1987) menggunakan alat diagnostik yang sama seperti pada latihan pemodelan lainnya.
Hal ini, seperti Gambar. B.2.10. menunjukkan, cukup sering terjadi bahwa beberapa
pengamatan mengerahkan lebih dari pengaruh proporsional pada fit model. Lingkaran
sebanding dengan pengaruh statistik Cook, dan menunjukkan bahwa stasiun yang
dibedakan seharusnya melihat dengan hati-hati, untuk melihat mengapa mereka
4

berbeda jauh dari tetangga dekat mereka. Perhatikan bahwa sebagian besar stasiun
dibedakan berada di tepi daerah studi.
Diagnostik variogram. Diagnostik variogram terkait dengan langkah-langkah lain yang

diambil dalam variabel di geostatistik (Pebesma 2004). Menggunakan representasi


spasial yang disajikan dalam Bivand et al. (2008), kita dapat meninjau beberapa alat
yang tersedia dalam paket gstat. Pertama, kita mengubah data curah hujan Swiss yang
diatur ke bentuk objek yang lebih sesuai, dan menunjukkan h-scatterplot dari nilai-nilai
yang diamati berdasarkan jarak, dinyatakan dalam argumen break untuk hscat. Rumus
interface yang digunakan di sini menempatkan variabel di sisi kiri dari persamaan.
Directionality. Akhirnya, kita mengikuti Bivand et al. (2008, pp.205-206) dalam

memeriksa kemungkinan anisotropi dalam kumpulan data. Menggunakan bin yang


sama seperti sebelumnya, kita tambahkan argumen ke fungsi variogram untuk membuat
objek untuk plotting.

B.2.5 Eksplorasi areal data


-

Sebagian besar literatur tentang ruang eksplorasi analisis data telah difokuskan pada

eksplorasi data areal sehubungan dengan asosiasi spasial.


Pada bagian ini, kita akan melihat indikator lokal asosiasi spasial, tetapi juga akan
mempertimbangkan bagaimana keteraturan skala yang lebih besar dapat terungkap

dengan menggunakan median smoothing Polandia dan pemetaan Moran vektor eigen.
diagnosa regresi untuk model regresi spasial (Haining 1994);
sedangkan pengguna tampaknya ingin standar error heteroskedastisitas-dikoreksi,
hanya sedikit yang menyadari bahwa salah spesifikasi bisa dibilang lebih baik
ditangani jika metode diagnostik telah digunakan (lihat juga Mur dan Lauridsen

2007).
Median smoothing polish. Cressie (1993, pp.46-48, pp.393-400) membahas secara
rinci bagaimana smoothing dapat digunakan untuk partisi variasi data ke halus dan

kasar.
Indikator

lokal

asosiasi

spasial

(LISA).

Sementara

pengukuran

global

memungkinkan kita untuk menguji pola spasial atas wilayah yang dipelajari, mungkin
kasus bahwa ada autokorelasi yang signifikan hanya ada dalam bagian yang lebih
kecil. Kedua statistik jarak (Getis dan Ord 1992, 1996; Ord dan Getis 1995), dan
indikator lokal asosiasi spasial yang diperoleh Anselin (1995), mirip melewati
windows bergerak di data, dan memeriksa ketergantungan dalam wilayah yang dipilih
untuk situs di mana windows berpusat. Spesifikasi untuk windows dapat bervariasi,
5

mungkin menggunakan kedekatan atau jarak di beberapa lag spasial dari zona atau
-

berdasarkan tempat.
Penggunaan statistik lokal yang telah dimasukkan adalah mengidentifikasi 'hot-spot',
untuk menilai stasioneritas sebelum penggunaan metode dengan asumsi bahwa data
telah sesuai dengan asumsi ini, dan pemeriksaan lainnya untuk heterogenitas dalam
seri data (Getis dan Ord 1996). Masalah pelik adalah bahwa indikator lokal yang
mengambil pola global hadir karena alasan apapun (Ord dan Getis 2001). Ukuran

autokorelasi spasial dibahas secara lebih rinci dalam Bab B.3.


Implementasi teknik LISA dapat ditemukan di GeoDa (Anselin et al 2006.), Di SAM
(Rangel et al 2006.), Dan dalam statistik spasial toolbox dari Arc GIS, serta versi R

dibahas di bawah (Bivand 2006; Bivand et al. 2008).


teknik LISA menekankan perlunya kehati-hatian dalam menarik kesimpulan, karena
hotspot jelas mungkin lebih mencerminkan kesalahan spesifikasi - misalnya kelalaian
dari model utama dari variabel atau pilihan bentuk fungsional yang tidak pantas,
karena membangun tes untuk set yang sangat kecil dari tetangga bahkan tanpa adanya
kesalahan spesifikasi (Tiefelsdorf 2000, 2002; Bivand et al 2009.), dan karena
beberapa masalah dan masalah uji kebebasan ( de Castro dan Singer 2006). Akhirnya,
Waller dan Gotway (2004, hal.239) menunjukkan, mungkin perlu untuk membuat tes
disesuaikan untuk mengakui bentuk variabel dependen, dalam kasus mereka

digunakan hipotesis risiko konstan.


Skala. Ada hubungan yang erat antara struktur grafik bobot spasial, dan struktur yang
terlihat dengan memeriksa fungsi eigen dari bobot matriks pusat (Griffith 2003;

Tiefelsdorf 2000), hubungan yang mendasari adalah pemahaman Moran I.


Pendekatan geografis yang terboboti. Non-stasioneritas merupakan sumber lebih
lanjut dari kesalahan spesifikasi, seperti variabel yang dihilangkan atau bentuk
fungsional yang tidak pantas. Ini mungkin didekati melalui pembobotan geografis,
melewati kernel dengan bandwidth yang diberikan atas peta titik data untuk
menghitung regresi tertimbang pada fit poin. Bobot sebanding dengan jarak antara
titik-titik data dan fit poin (Brunsdon et al 1998;. Fotheringham et al, 2002.).
Perubahan dukungan yang terlibat, karena poligon observasi digantikan oleh centroid

poligon, di sini baik untuk titik data dan fit poin.


Regresi geografis tertoboti. Memperluas pendekatan geografis tertoboti untuk regresi
geografis tertoboti, kita dapat menyesuaikan dengan model linier kami dengan
kovariat menggunakan bandwidth dan dukungan yang sama.

B.2.6 Penutup
-

EDA, geovisualisasi, serta alat dan teknik ESDA, sudah banyak diimplementasikan
dan tersedia. Namun masih ada dua masalah yang harus ditangani: kecenderungan
untuk analisis eksplorasi - mencari pertanyaan yang benar - meluncur ke kesimpulan,

baik itu formal atau tidak, tanpa mempertimbangkan implikasi.


Dalam beberapa kasus, dapat menyebabkan penyisipan semacam partikularisme
geografis ke dalam pemahaman kita tentang proses pembuatan data. Hal ini sangat
disayangkan, karena itu berarti bahwa pemahaman kita tentang fenomena yang
menarik didominasi oleh efek random spasial terstruktur (dan / atau tidak terstruktur),

autokorelasi spasial adalah pusat dari upaya kita.


Permasalahan dapat diatasi dengan membuat metode yang mudah digunakan, dengan

mendokumentasikan secara lebih baik, dan menawarkan pelatihan.


Mungkin itu adalah kasus yang menggunakan EDA dan ESDA mungkin tidak
mendapatkan kepemilikan dengan cepat, sampai ke pertanyaan yang tepat
membutuhkan waktu, keberuntungan, pengalaman, dan sering partisipasi dalam
komunitas ilmiah yang bersedia untuk berbagi wawasan dan saran.

B.3. Autokorelasi Spasial


Oleh Arthur Getis

B.3.1. Pendahuluan

Meninjau konsep autokorelasi spasial dan atributnya.


Menguraikan berbagai formulasi dan langkah-langkah hubungan autokorelasi spasial dan

untuk menunjukkan bagaimana konsep membantu menilai sifat spasial data georeferensi.
Menjelaskan secara singkat literatur sehingga konsep autokorelasi spasial dapat diakses
oleh mereka yang (i) baru untuk berurusan dengan data georeferensi dalam kerangka
penelitian atau (ii) telah bekerja dengan data geografis direferensikan sebelumnya tapi
tanpa pengetahuan eksplisit tentang bagaimana konsep dapat bermanfaat bagi mereka

dalam penelitian mereka.


Menjelaskan atribut konsep dan penggunaan di Section B.3.2.
Membahas matriks yang harus dibuat untuk menilai sebagian besar pengukuran dalam

konsep autokorelasi spasial.


Menguraikan berbagai formulasi autokorelasi spasial dalam Bagian B.3.4.
Diskusi singkat dari masalah dalam menerapkan konsep dalam situasi penelitian.
Memberikan penjelasan singkat dari yang tersedia software autokorelasi spasial. Daftar
referensi dapat berfungsi sebagai panduan untuk literature di daerah ini.

Definisi

Definisi paling sederhana dari konsep autokorelasi spasial adalah merepresentasikan


hubungan antara unit spasial berdekatan, seperti yang terlihat di peta, di mana setiap unit

dikodekan dengan realisasi variabel tunggal.


Menurut Hubert et al. (1981, p.224) : 'Mengingat satu set S yang mengandung n unit
geografis, autokorelasi spasial mengacu pada hubungan antara beberapa variabel yang
diamati dalam setiap n daerah dan ukuran kedekatan geografis didefinisikan untuk semua
n(n-1) pasangan dipilih dari S'

Pengembangan konsep

Dibesarkan di University of Washington di akhir 1950-an, terutama oleh Michael F. Dacey


Sebelumnya, sebuah literatur yang luas telah dikembangkan pada pokok kedekatan, yaitu,
efek kuat bahwa daerah terdekat memiliki satu sama lain dibandingkan pengaruh relatif
lemah dari daerah lebih jauh (misalnya, Ravenstein 1885; von Thnen 1826; Zipf 1949)
8

Notasi ini telah diringkas dengan baik oleh Hukum Pertama Tobler, 'Segala sesuatunya
berhubungan dengan sesuatu yang lain, tapi hal-hal yang dekat lebih terkait daripada halhal yang jauh' (Tobler 1970, p.234).
Sampai tahun 1964, dalam ilmu dan statistik sosial literatur, telah disebut 'ketergantungan

spasial,' 'asosiasi spasial,' 'interaksi spasial,' 'saling ketergantungan spasial,' di antara


istilah2 lainnya.
Tiga statistisian menata karakteristik matematika dari hubungan autokorelasi spasial,

meskipun mereka menggunakan istilah rasio kedekatan untuk menggambarkan pekerjaan


mereka. Moran (1948), Krishna-Iyer (1949), dan Geary (1954) mengembangkan
bergabung hitungan statistik yang didasarkan pada probabilitas yang bergabung unit

spasial yang dari jenis nominal yang sama (hitam atau putih)
Geary, membuat titik bahwa residual dipetakan dari analisis kuadrat regresi kuadrat biasa

harus menampilkan karakteristik kebebasan.


Dacey memperluas jumlah warna dipelajari dari dua sampai k, dan jelas menunjukkan

hubungan antara menggunakan data nominal dan selang


Di bidang geostatistik, Matheron (1963) menemukan correlogram (kebalikan dari
semivariogram), diciptakan untuk mewakili stasioneritas intrinsik, kesamaan penurunan
nilai variabel diasumsikan ada di antara unit spasial sebagaimana meningkatnya jarak satu
sama lain.
Monografi Autokorelasi Spasial oleh Cliff dan Ord (1973) menyoroti masalah model mis-

spesifikasi karena autokorelasi spasial dan menunjukkan statistik bagaimana seseorang


dapat menguji residual dari analisis regresi untuk keacakan spasial dengan menggunakan
statistik autokorelasi spasial.
Moment Distribusi Moran, yang disebut Moran I, dikembangkan oleh Cliff dan Ord (1973,

1981) di bawah berbagai asumsi sampling.

B.3.2 Atribut dan Penggunaan Konsep Autokorelasi Spasial

Konsep-konsep dasar analisis data georeferensi atau data spasial :

Pengujian pada model mis-spesifikasi.


Pengukuran kekuatan pengaruh spasial pada setiap variabel.
9

Pengujian asumsi stasioneritas spasial dan heterogenitas spasial.


Cara untuk mengidentifikasi kelompok/cluster spasial.
Cara untuk mengidentifikasi peran dimana peluruhan jarak atau interaksi spasial

mungkin terdapat pada model autoregressive spasial.


Cara untuk memahami pengaruh bahwa unit spasial geometri terdapat dalam variabel.
Pengujian pada hipotesis keberadaan hubungan spasial.
Cara menimbang pentingnya efek temporal.
Fokus pada efek unit spasial tunggal terhadap unit lain dan sebaliknya.
Cara untuk mengidentifikasi outlier, baik spasial dan non-spasial.
Bantuan dalam merancang sampel spasial yang tepat.
Daftar tersebut dapat diperluas, tetapi cukup untuk mengatakan di sini banyak
karakteristik autokorelasi spasial yang menambah kedalaman dan pemahaman untuk
setiap analisis spasial.

B.3.3 Representasi autokorelasi spasial

Cross-product Statistic
n

ij = W ij Y ij
i=1 j=1

(B.3.1)

dimana
: ukuran autokorelasi spasial untuk n pengamatan georeferensi.
W : matriks nilai-nilai yang mewakili hubungan spasial dari setiap lokasi i untuk
semua lokasi lain j (matriks bobot spasial)
Y : matriks menunjukkan hubungan non-spasial realisasi dari variabel Y di lokasi i
dengan semua realisasi lain di semua lokasi lainnya j.
-

Ketika W, dan Y, matriks variabel memiliki struktur yang sama [misalnya, keduanya
memiliki nilai yang tinggi di sel (i,j) sama dalam matriks mereka masing-masing dan
nilai-nilai rendah yang sel sama (i,j) dapat dikatakan bahwa ada derajat tinggi

autokorelasi spasial
Persamaan (B.3.1), seperti yang disajikan, bukan uji autokorelasi spasial, tetapi hanya

pengukuran.
Matriks W
- Hubungan spasial tertentu tergantung pada jarak, jika diasumsikan bahwa hubungan
spasial menurun dalam kekuatan sebagai jarak meningkat dari lokasi tertentu, maka
10

matriks W akan menunjukkan bahwa daerah-daerah terdekat berbobot lebih tinggi


-

dibandingkan lokasi yang jauh dari satu sama lain.


Matriks W memiliki elemen sbb:
a

W ij =d ij dengan 1

(B.3.2)

bobot dalam sel (i,j) merupakan kebalikan dari jarak d antara dua lokasi, i dan j,
diturunkan oleh eksponen .
-

Beberapa skema matriks bobot W (Getis dan Aldstadt 2004) :


Spatially Continguous Neighbors
Inverse Distance (fungsi penurunan jarak),
Lenghts of Shared Borders (pandangan geometris),
Bandwidth sebagai jarak n tetangga terdekat,
Ranked Distances (pendekatan non-Cartesian),
Semua centroid dalam jarak d,
n Nearest Neighbors,
Bandwidth Distance Decay (diperlukan untuk regresi geografis tertimbang),
Gaussian Distance Decline,
Derived spasial autocorelation.
W terdiri dari tetangga bersebelahan dan nol untuk selainnya, baik berupa data raster
atau vektor. Dengan konvensi, pengamatan ke-i tidak dianggap sebagai tetangga
sendiri. Matriks kontinguitas W sering berupa standarisasi baris, yaitu, setiap jumlah
baris dalam matriks dibuat sama dengan satu, nilai-nilai individu Wij terwakili secara

proporsional.
Pengembangan model spasial mempertimbangkan matriks bobot spasial menjadi salah
satu dari tiga jenis representasi berikut:
i.
gagasan teoritis asosiasi spasial, seperti penurunan fungsi jarak,
ii.
indikator geometris kedekatan spasial, seperti representasi unit spasial yang
iii.

berdekatan,
beberapa ekspresi deskriptif asosiasi spasial yang sudah ada dalam satu set

data.
Sifat dari variabel sedang dipelajari untuk efek spasial adalah kunci untuk W yang
tepat. Skala karakteristik data merupakan elemen penting dalam penyusunan W.
Semakin besar suatu unit spasial, maka ketergantungan spasial antar unit cenderung

menurun (Can 1996).


Matriks Y
- Matriks non-spasial Y realisasi dari variabel yang berhubungan satu sama lainnya.
Y merupakan interaksi antar elemen yij. Mereka dapat berinteraksi dengan proses

11

aditif (yi + yj), perkalian (yiyj), pengurangan (yi - yj), atau pembagian (yi / yj). Tipe
y y ) ( y j y )
matriks perkalian yang berguna adalah matriks kovarians ( i
.

B.3.4Pengukuran dan Uji Autokorelasi Spasial

Pengukuran dan uji autokorelasi spasial dapat dibedakan dari lingkup atau skala analisis.

Secara tradisional, mereka dipisahkan menjadi kategori 'global dan ' lokal '.
a) Pengukuran dan Uji Global
Global yang menyiratkan bahwa semua elemen dalam matriks W dan Y yang diambil
bersama-sama dibawa untuk menhasilkan penilaian autokorelasi spasial, yaitu, semua
asosiasi-asosiasi unit spasial satu dengan yang lain termasuk dalam perhitungan autokorelasi
spasial.

Gamma (). Semua pengukuran dan uji autokorelasi spasial adalah terstruktur. Sebuah uji
terhadap signifikansi statistik dari dibuat praktis dengan mengacak nilai-nilai Y dalam
sejumlah simulasi. teramati kemudian dapat dibandingkan dengan sampul yang
diciptakan oleh hasil simulasi. Signifikansi statistik menunjukkan bahwa terdapat

autokorelasi spasial.
Joint-count. Tujuannya adalah untuk mengidentifikasi untuk klasifikasi nominal yang
lengkap dari unit spasial, seperti untuk jenis penggunaan lahan Perumahan (A), industry
(B), komersial (C)- apakah terdapat sejumlah hubungan spasial yang signifikan secara
statistik dari kejadian AA, AB, AC, BB, BC, dan / atau CC. Di sini kita menggunakan uji
free sampling (Cliff dan Ord 1981).
- Nilai harapan gabungan tipe yang sama adalah
n

E ( J )=

1
W p2
2 i=1 j=1 ij r

(B.3.3)

Untuk jenis yang berbeda, harapannya adalah


n

E ( J )= W ij pr ps
i=1 j=1

12

(B.3.4)

Nilai-nilai p biasanya diperkirakan dari data (nr/n). Matriks W terdiri dari satu dan
nol mewakili unit spasial gabungan (satu) dan bukan unit spasial gabungan (nol).
Serta serangkaian matriks Y, satu untuk setiap uji, di mana masing-masing terdiri dari
satu dan nol mewakili jenis tertentu dari unit spasial terkait (misalnya, AB adalah satu
dan non-AB adalah nol) dan diringkas sebagai probabilitas kejadian dari A dan B (pr
dan ps). Dalam rangka untuk melakukan tes pada autokorelasi spasial, varians harus
diketahui dan asumsi dipanggil dari sebuah frekuensi sel berdistribusi normal

asimtotik (lihat Cliff dan Ord 1981 untuk rincian).


Morans I. Statistik ini disusun sebagai koefisien korelasi moment product Pearson.
n

I=

W ij ( y i y )( y j y )

n
n

i=1 j=1

i j

W ij

( y i y )

i=1 j=1

(B.3.7)

i=1

nilai harapannya adalah E(I) = -1 /(n - 1)


Dapat dituliskan sebagai berikut :
I=

n
n

W ij

T W
T

(B.3.8)

i=1 j=1

dimana adalah vektor residual OLS dan T adalah matriks transpose.

Gearys c. Dalam kasus Moran I, hipotesis nol didasarkan pada struktur kovarians, yaitu
harapan bahwa tetangga terkait bervariasi sekali dalam cara yang tidak konsisten. Untuk
Geary c, hipotesis nol adalah bahwa unit spasial terkait tidak berbeda satu sama lain.
Implikasi dari hipotesis ini adalah bahwa tidak ada konsistensi untuk perbedaan antara
tetangga; kadang-kadang perbedaan besar dan kadang-kadang kecil. Dengan demikian,
kita memiliki
n

( n1 ) W ij ( y i y j )2
c=

i=1 j=1
n

2 W W ij ( y i y )
i=1

13

i j
2

(B.3.9)

Dalam pengujian, nilai-nilai kurang dari satu menunjukkan autokorelasi spasial positif
(perbedaan kecil) dan nilai lebih besar dari satu berarti autokorelasi spasial negatif

(perbedaan secara konsisten besar). Geary c berhubungan negatif dengan Moran I.


Variogram. Inti dari bidang geostatistik adalah semivariogram. Semivariogram adalah
distribusi perbedaan antara spasial unit terkait dan oleh karena itu terkait dengan Geary c.
Perbedaan utamanya adalah pada hipotesis semivariogram bahwa perbedaan menurun
dengan jarak satu sama lain dengan cara yang sistematis. Sebuah semivariogram khas
memiliki bentuk distribusi eksponensial positif, di mana jarak dekat menampilkan
perbedaan-perbedaan kecil dan variasi rendah, dan jarak jauh tidak dipengaruhi oleh efek
jarak sedemikian rupa bahwa ketika semua perbedaan diambil bersama nilai varians global
yang diperoleh. Semivariogram memiliki bentuk
n

1
2
( ad )= W ij ( y i y j )
2 i=1 j=1

(B.3.10)

Tampilan dari autokorelasi spasial disebut correlogram, sebuah fungsi yang menurun
dengan jarak hingga kisaran tercapai. Kisaran merepresentasikan jarak di mana
varians global tidak terpengaruh oleh efek jarak. Skala semivariogram, 1/2, adalah
pengenalan bahwa ada penghitungan ganda, perbedaan antara i dan j adalah sama
seperti antara j dan i. Cressie (1993) memberikan perlakuan yang komprehensif dari
geostatistik, dan Rosenberg et al. (1999) menekankan aspek analisis autokorelasi

spasial.
Fungsi Ripley K.
- Menekankan hanya lokasi dan bukan atribut lainnya dari suatu variabel acak. Jadi di
sini kita dibatasi pada pola titik berdasarkan sejumlah pasangan titik-titik yang
-

ditemukan pada serangkaian jarak dari masing-masing titik ke-i.


tujuannya adalah untuk menghitung semua pasangan titik di setiap jarak. Jika ada
lebih banyak pasangan titik dari peluang acak spasial (distribusi spasial Poisson) akan
memilikinya, terdapat pengelompokan signifikan secara statistik; sepasang titik yang
lebih sedikit menyiratkan dispersi titik signifikan secara statistik, kebalikan dari

clustering.
Hipotesis nol diperoleh ketika ada sekitar banyak pasang titik sebagai salah satu yang

mungkin ditemukan dalam distribusi titik yang tersususn oleh proses acak.
Statistik diperkirakan dengan cara berikut

14

n
n
W
R
^
K ( d )= 2 ij i j
n i=1 j=1 eij

(B.3.11)

Koefisien autokorelasi spasial.


- Dalam model regresi di mana estimasi didasarkan pada data georeferensi, itu adalah
wajib bahwa setiap efek spasial signifikan secara statistik harus diperhitungkan dalam
-

model.
Efek spasial dapat didiagnosis melalui uji Morans I pada residual atau terhadap

variabel yang akan dimasukkan dalam model.


Dependensi spasial dapat dimasukkan dengan menciptakan model autoregressive
spasial dari satu jenis atau yang lain. Dua model autoregressive populer adalah (i)
Model autoregressive spasial campuran, sering disebut model spasial lag,
y= Wy + X +

(B.3.13)

dan (ii) regresi linear dengan error autoregressive spasial, atau Model autoregressive
simultan (SAR), sering disebut spasial error model
y= X+ ( I W )1

(B.3.14)

dalam kedua kasus ini, parameter yang mewakili efek spasial, dan harus
ditentukan.
-

Pada intinya, koefisien mengungkapkan kekuatan atau pengaruh yang dari matriks W.
Koefisien autokorelasi spasial; nilai-nilai positif atau negatif yang tinggi merupakan
efek spasial yang kuat dan yang rendah sebaliknya. Ketika , adalah nol, tidak ada
efek spasial. Hal ini berlaku selama error dan

masing-masing didistribusikan

secara acak dalam ruang. Jika, dalam estimasi model, kesalahan secara spasial

berkorelasi, model tidak dapat ditentukan.


Selain itu Uji regresi residual Morans I, uji khusus seperti Uji Kelejian dan Robinson
(KR) (1993), atau Wald, Kemungkinan Ratio, dan Uji multiplier Lagrange digunakan
untuk mengidentifikasi autokorelasi spasial dalam lag spasial atau jenis spasial error
model (Anselin 2006).

b) Pengukuran dan Pengujian Lokal

15

Pengukuran lokal terfokus, bahwa penilaian autokorelasi spasial terkait dengan satu unit
spasial tertentu. Dengan demikian, hanya satu baris dari W dan baris yang cocok dari Y
matriks merefleksikan pengukuran autokorelasi spasial meskipun interaksi semua elemen

'dapat digunakan sebagai skalar.


Diantara para analis spasial, selalu ada minat pada pengukuran terfokus, yaitu, keinginan

untuk menggambarkan 'situasi' atau karakteristik kedekatan lokasi tertentu.


Dasar untuk pengukuran dan uji lokal dari autokorelasi spasial berasal dari statistik cross
product. Kali ini bentuk strukturalnya adalah
n

i= W ij Y ij i j

(B.3.15)

j=1

Perhatikan bahwa di sini kita menemukan interaksi antara bobot spasial hanya pada vector
ke-i dan nilai-nilai y pada vector ke-i dari Y. i memungkinkan untuk membandingkan
autokorelasi antara dua vektor untuk lokasi tertentu i.

Statistik lokal Getis dan Ord. Statistik ini merupakan tambahan, fokusnya adalah pada
jumlah nilai-nilai j di sekitar i. Fakta bahwa ada dua statistik,

Gi

memungkinkan peneliti untuk memilih hipotesis berdasarkan kedekatan (

pengelompokan ( Gi ). Gi

dan

Gi ,

Gi

) atau

ditulis sebagai
n

Gi ( d )=

W ij ( d ) y j W i y
j =1

s [ ( n S ) W

1i

2
i

1 /2

] /(n1)}

untuk semua j

(B.3.16a)

dimana
n

W =W i +W ii dan S = W ij untuk semua j

dan

1i

j=1

dan s masing-masing adalah rataan dan standar deviasi.

Indikator lokal asosiasi spasial-LISA.

16

(B.3.16b)

Statistik LISA diciptakan oleh Anselin (1995), yang motivasinya adalah untuk
menguraikan statistik global seperti Morans I dan Geary c ke dalam komponen lokal

untuk tujuan mengidentifikasi pengamatan berpengaruh dan outlier.


Lokal Morans Ii didefinisikan sebagai
Ii =

y i y
n

1
2
( y i y )
n
i=1

W ij( yi y j )i j ,untuk jdalam d dari i


j=1

(B.3.17)

dan faktor proporsionalitas adalah


n

1
2
W ij ( y i y j )

n i=1 j=1

(B .3.18)

nilai harapannya
n

E ( Ii ) =

1
W
n1 j=1 ij

(B.3.19)

Lokal Geary c, didefinisikan sebagai


c i=

1
n

W ij [ ( y i y ) ( y j y ) ]

1
i=1
( y y )2
n i=1 i

(B.3.20)

Berikut faktor proporsionalitas


n

2n
=
W
(n1) i=1 j=1 ij

(B.3.21)

Statistik LISA sangat berguna untuk mengidentifikasi kelompok spasial. Nilai-nilai

autokorelasi spasial tinggi menunjukkan kelompok nilai tinggi atau rendah.


Regresi geografis tertimbang.
- Sebuah versi lokal dari analisis regresi OLS telah diusulkan oleh Fotheringham et al.
-

(1995).
Poin regresi geografis tertimbang (GWR) adalah bahwa parameter regresi tidak
konstan atas ruang yang ditandai dengan model regresi tradisional dan variasi yang

dapat secara eksplisit dimodelkan.


Bentuk GWR dapat ditulis sebagai
17

Y =( X ) 1+

(B.3.22)

di mana operator logis (produk Kronecker) mengharuskan elemen yang


-

berhubungan di setiap matriks dikalikan dengan satu sama lain.


Setiap matriks memiliki dimensi n x (k+1), di mana jumlah variabel independen
adalah k, vektor dengan dimensi (k+1) x 1 menghasilkan matriks nx1 yang diperlukan
untuk Y. Hal ini memungkinkan terdiri dari n set parameter lokal. Setiap set berisi

slope dan intersep untuk masing-masing variabel independen untuk setiap lokasi i.
Beta diperkirakan dengan penggunaan W untuk setiap i. d untuk semua W adalah
yang dipilih diawal atau diperkirakan dari data. Matriks W khusus didasarkan pada
pra-pemilihan bandwidth b jarak terluar :

{[

( )]

d ij 2
1
jika d ij <b
W ij =
b
0 selainnya

(B.3.23)

Hasil dari GWR adalah peta yang disebut 'ruang parameter.' Daerah dengan nilai
parameter tinggi menunjukkan hubungan korelatif sangat kuat antara regressor dan
respon variabel, tetapi parameter tidak secara langsung menunjukkan autokorelasi
spasial. Karena nilai-nilai beta meruapakan fungsi dari skema pembobotan spasial,
sejauh W menangkap efek autokorelasi spasial dalam setiap variabel, adalah wajar
untuk mengatakan bahwa nilai-nilai beta tinggi merefleksikan pola autokorelasi

spasial dalam sistem.


Implikasinya adalah bahwa satu atau lebih peta autikorelasi spasial dapat diproduksi

untuk setiap persamaan dalam sistem.


Pengujian O oleh Ord dan Getis (2001) memberikan pengujian, yang disebut O, yang
mencakup informasi yang terpisah dari pengamatan dalam d dari i ( daerah teratur atau
tidak teratur) merepresentasikan hipotesis hotspot, dan pada observasi langsung di luar hot
spot.
- Statistiknya adalah
Oi ( d ) =Y d Y 0

18

(B.3.24)


di mana Y d

adalah rata-rata dari observasi n(d) dalam d dan Y 0 adalah rata-rata

dari pengamatan m = M - n(d), dimana M menjadi satu set dipartisi secara regional
dari observasi yang menampilkan 'homogenitas relatif. M harus jauh lebih besar dari
n(d) [setidaknya 10 kali lipat] tapi jauh lebih kecil dari semua n pengamatan di daerah
penelitian. M dapat dipilih untuk memasukkan semua pengamatan dari i [(kecuali
n(d)] hingga rentang (dalam arti geostatistik) berasal dari semua pengamatan. Ide
statistiknya adalah untuk membandingkan karakteristik data pada dua skala spasial;
E[Oi(d)] = 0.

B.3.5 Masalah dalam Penanganan Autokorelasi Spasial

Autokorelasi spasial tdk dapat didefinisikan tidak selalu jelas apakah berbagai langkah dan

tes benar-benar dapat menemukan autokorelasi spasial dalam data georeferensi.


Lebih baik atau lebih buruk tergantung pada cara di mana W dan Y yang ditentukan.
Apa yang bertanggung jawab atas autokorelasi spasial yang muncul dalam suatu set data
tertentu? Apakah dengan cara batas-batas unit spasial ditarik (geometri dan / atau skala

unit spasial yang diteliti) atau apakah berupa fungsi dari sifat variabel yang diteliti?
Ketika autokorelasi spasial tertanam dalam variabel, apakah itu karena geometri dari unit

spasial atau sesuatu yang lain?


Terutama dalam statistik lokal, biasanya terdapat uji-uji pada autokorelasi spasial untuk
setiap lokasi data. Hal ini menyebabkan jumlah yang sangat besar dari uji yang sebenarnya

tergantung pada satu sama lain.


Banyak dari pengamatan digunakan untuk menemukan ukuran lokal autokorelasi spasial

akan digunakan lagi untuk uji difokuskan pada pengamatan tetangga.


Beberapa upaya untuk mengatasi masalah ini secara simultan, uji dependen (Getis dan Ord

2000; Castro dan Singer 2006; Benjamini dan Hochberg 1995).


Peneliti harus sadar interval kepercayaan jenis Bonferroni ketika mereka memilih

perangkat diagnostik dan pengujian mereka.


Banyak pengujian tradisional memerlukan asumsi stasioneritas. GWR, ketika mencoba
untuk mengatasi masalah ini, terbentur pada masalah ukuran sampel (membutuhkan kecil

untuk perkiraan Yi) dan untuk masalah uji tumpang tindih.


Bagaimana efek dari batas-batas pada tingkat kepercayaan? Ukuran sampel dan dengan

demikian jumlah derajat kebebasan dipengaruhi oleh tingkat spasial daerah studi.
Apakah jarak d mencakup jumlah pengamatan yang sesuai yang memungkinkan untuk
tingkat kepercayaan yang dapat diterima dalam hasil?

19

Bagaimana d dipilih? Perhatian khusus harus diberikan kepada pengaruh berbagai d pada
hasil. Sebuah teknik yang menjanjikan analisis, spasial filtering, mungkin sangat berguna
dalam menjawab banyak pertanyaan-pertanyaan ini (Getis 1990, 1995; Griffith 1996,
2003; Griffith 2002).

B.3.6 Software Autokorelasi Spasial


Pengukuran dan pengujian autokorelasi spasial tersedia di sejumlah paket perangkat
lunak :

GeoDa.
Paket R.
PPA (Analisis Pola Titik).
SANET
STARS (Space-Time Analysis of Regional System)
ArcGIS.
ClusterSeer2
Le Sage Ekonometrika Spasial Toolbox
Statistik Spasial dan SAS

20