Alat Histogram menyediakan deskripsi univariat (satu variabel) dari data Anda. Kotak dialog
tool menampilkan distribusi frekuensi untuk kumpulan data yang menarik dan menghitung
ringkasan statistik.
Distribusi frekuensi
Distribusi frekuensi adalah grafik batang yang menampilkan seberapa sering nilai yang diamati
jatuh dalam interval atau kelas tertentu. Anda dapat menentukan jumlah kelas dengan lebar
yang sama yang digunakan dalam histogram. Proporsi relatif data yang jatuh di setiap kelas
ditunjukkan oleh tinggi masing-masing batang. Misalnya, histogram di bawah ini menunjukkan
distribusi frekuensi (10 kelas) untuk dataset.
Ringkasan statistik
Fitur penting dari distribusi dapat diringkas dengan statistik yang menggambarkan lokasinya,
menyebar, dan bentuknya.
Ukuran lokasi
Ukuran lokasi memberi Anda gambaran tentang pusat dan bagian distribusi lainnya.
Rata-rata adalah rata-rata aritmatika data. Rata-rata memberikan ukuran pusat
distribusi.
Nilai median sesuai dengan proporsi kumulatif 0,5. Jika data disusun secara meningkat,
50 persen nilai akan berada di bawah median, dan 50 persen nilai akan berada di atas
median. Median memberikan ukuran lain dari pusat distribusi.
Ukuran penyebara
Penyebaran poin di sekitar nilai rata-rata adalah karakteristik lain dari distribusi frekuensi yang
ditampilkan.
Perbedaan data adalah deviasi kuadrat rata-rata dari semua nilai dari mean. Karena
melibatkan perbedaan kuadrat, varians yang dihitung sensitif terhadap nilai yang tinggi
atau rendah. Perbedaannya diperkirakan dengan menjumlahkan penyimpangan kuadrat
dari mean dan membagi jumlah dengan (N-1).
Deviasi standar adalah akar kuadrat dari varians, dan ini menggambarkan penyebaran
data tentang mean. Semakin kecil varians dan standar deviasi, semakin erat cluster
pengukuran tentang nilai mean.
Diagram di bawah ini menunjukkan dua distribusi dengan standar deviasi yang berbeda.
Distribusi frekuensi yang diwakili oleh garis hitam lebih bervariasi (spread lebih luas)
dibanding distribusi frekuensi yang ditunjukkan oleh garis merah. Perbedaan dan standar
deviasi untuk distribusi frekuensi hitam lebih besar daripada distribusi frekuensi merah
Plot Normal QQ
Bagaimana plot Normal QQ dibangun ?
Pertama, nilai data diurutkan dan nilai distribusi kumulatif dihitung sebagai (i - 0,5) / n untuk
nilai pesanan dari total nilai n (ini memberikan proporsi data yang berada di bawah nilai
tertentu). Grafik distribusi kumulatif dihasilkan dengan merencanakan data yang dipesan
versus nilai distribusi kumulatif (grafik di kiri atas pada gambar di bawah). Proses yang sama
dilakukan untuk distribusi normal standar (distribusi Gaussian dengan rata-rata 0 dan deviasi
standar 1, yang ditunjukkan pada grafik di kanan atas gambar di bawah). Setelah dua grafik
distribusi kumulatif ini dihasilkan, nilai data yang sesuai dengan quantiles spesifik dipasangkan
dan diplot dalam plot QQ (grafik bawah pada gambar di bawah).
General QQ plot
Bagaimana plot QQ umum dibangun ?
Umum plot QQ digunakan untuk menilai kemiripan distribusi dua dataset. Plot ini dibuat
mengikuti prosedur serupa seperti yang dijelaskan untuk plot Normal QQ, namun alih-alih
menggunakan distribusi normal standar sebagai dataset kedua, kumpulan data apapun dapat
digunakan. Jika dua dataset memiliki distribusi yang sama, poin dalam plot QQ umum akan
jatuh pada garis lurus (45 derajat).
General QQ plot example
Meneliti distribusi data menggunakan plot QQ
Poin pada plot Normal QQ memberikan indikasi normalitas univariat dataset. Jika data
terdistribusi normal, titik-titik tersebut akan jatuh pada garis referensi 45 derajat. Jika datanya
tidak terdistribusi normal, titik-titiknya akan menyimpang dari garis referensi.
Pada diagram di bawah ini, nilai kuantil dari distribusi normal standar diplot pada sumbu x di
plot Normal QQ, dan nilai kuantil yang sesuai dari dataset diplot pada sumbu y. Anda dapat
melihat bahwa titik-titik tersebut berada dekat dengan garis referensi 45 derajat. Keberangkatan
utama dari garis ini terjadi pada nilai konsentrasi ozon yang tinggi.
Alat Plot Normal QQ memungkinkan Anda untuk memilih titik-titik yang tidak dekat dengan
garis referensi. Lokasi titik yang dipilih kemudian disorot dalam tampilan data ArcMap. Seperti
yang terlihat di bawah, mereka terkonsentrasi di sekitar area San Francisco Bay (titik-titik
berbayang merah muda pada peta di bawah).
QQ Plot Map
Contoh penggunaan transformasi data
Sebuah plot Normal QQ dari dataset contoh disajikan di sini :
Standard normal distribution: QQ Plot transformed
Perhatikan bagaimana poin menyimpang dari garis lurus.
Namun, seperti dapat dilihat pada gambar di bawah ini, ketika transformasi log diterapkan ke
dataset, titik-titiknya mengarah lebih dekat ke garis referensi 45 derajat.
TREND ANALYSIS
Anda mungkin tertarik untuk memetakan tren, atau Anda mungkin ingin menghapus tren dari
kumpulan data saat menggunakan kriging. Alat Analisis Trend dapat membantu
mengidentifikasi tren dalam dataset input.
Alat Analisis Trend memberikan perspektif tiga dimensi data. Lokasi titik sampel diplot pada
bidang x, y. Di atas setiap titik sampel, nilai diberikan oleh tinggi tongkat pada dimensi z. Fitur
unik dari alat Analisis Trend adalah bahwa nilai kemudian diproyeksikan ke bidang x, z dan
bidang y, z sebagai scatterplots. Hal ini dapat dianggap sebagai pandangan menyamping
melalui data tiga dimensi. Polinomial kemudian cocok melalui scatterplots pada pesawat yang
diproyeksikan.
VORONOI MAPS
Peta Voronoi dibangun dari serangkaian poligon yang terbentuk di sekitar lokasi titik sampel.
Poligon Voronoi dibuat sedemikian rupa sehingga setiap lokasi dalam poligon lebih mendekati
titik sampel dalam poligon itu daripada titik sampel lainnya. Setelah poligon diciptakan,
tetangga titik sampel didefinisikan sebagai titik sampel lain yang poligonnya berbatasan
dengan titik sampel yang dipilih. Misalnya, pada gambar berikut, titik sampel hijau terang
ditutupi oleh poligon, yang telah disorot dengan warna merah. Setiap lokasi di dalam poligon
merah lebih dekat ke titik sampel hijau terang daripada titik sampel lainnya (diberi titik biru
kecil yang kecil). Poligon biru semua berbagi perbatasan dengan poligon merah, jadi titik
sampel di dalam poligon biru adalah tetangga titik sampel hijau terang.
Peta Voronoi
Dengan menggunakan definisi tetangga ini, berbagai statistik lokal dapat dihitung. Misalnya,
mean lokal dihitung dengan mengambil rata-rata titik sampel dalam poligon merah dan biru.
Rata-rata ini kemudian ditugaskan ke poligon merah. Proses ini diulang untuk semua poligon
dan tetangganya, dan hasilnya ditunjukkan dengan menggunakan rawa warna untuk membantu
memvisualisasikan daerah dengan nilai lokal yang tinggi dan rendah.
Alat Peta Voronoi menyediakan metode berikut untuk menetapkan atau menghitung nilai untuk
poligon.
Simple: Nilai yang diberikan pada poligon adalah nilai yang tercatat pada titik sampel
di dalam poligon itu.
Mean: Nilai yang diberikan pada poligon adalah nilai rata-rata yang dihitung dari
poligon dan tetangganya.
Mode: Semua poligon dikategorikan menggunakan lima interval kelas. Nilai yang
ditetapkan ke poligon adalah mode (kelas yang paling sering terjadi) dari poligon dan
tetangganya.
Cluster: Semua poligon dikategorikan menggunakan lima interval kelas. Jika interval
kelas poligon berbeda dari masing-masing tetangganya, poligon berwarna abu-abu dan
dimasukkan ke kelas enam untuk membedakannya dari tetangganya.
Entropi: Semua poligon dikategorikan menggunakan lima kelas berdasarkan
pengelompokan data nilai alami (smart quantiles). Nilai yang diberikan pada poligon
adalah entropi yang dihitung dari poligon dan tetangganya - yaitu,
Entropy = - Σ (pi * Log pi),
dimana pi adalah proporsi poligon yang ditugaskan ke setiap kelas. Misalnya, pertimbangkan
poligon yang dikeliling
i oleh empat tetangga (total lima poligon). Nilai ditempatkan ke kelas yang sesuai:
Class Frequency Pi
1 3 3/5
2 0 0
3 1 1/5
4 0 0
5 1 1/5
Entropy class/frequency
Minimum entropy occurs when the polygon values are all located in the same class. Then,
Emax = -[0.2 * log2 (0.2) + 0.2 * log2 (0.2) + 0.2 * log2 (0.2) + 0.2 * log2 (0.2) + 0.2 * log2 (0.2)]
= 2.322
Median: Nilai yang ditetapkan pada poligon adalah nilai median yang dihitung dari
distribusi frekuensi poligon dan tetangganya.
Deviasi Standar: Nilai yang diberikan pada poligon adalah standar deviasi yang
dihitung dari poligon dan tetangganya.
Rentang interkuartil: Kuartil pertama dan ketiga dihitung dari distribusi frekuensi
poligon dan tetangganya. Nilai yang ditetapkan pada poligon adalah kisaran interkuartil
yang dihitung dengan mengurangkan nilai kuartil pertama dari nilai kuartil ketiga.
Statistik Voronoi dapat digunakan untuk tujuan yang berbeda dan dapat dikelompokkan ke
dalam kategori fungsional umum berikut ini:
Pada ilustrasi di atas, setiap titik merah menunjukkan nilai semivariogram empiris (perbedaan
kuadrat antara nilai dua titik data yang membentuk pasangan) yang diplot terhadap jarak yang
memisahkan dua titik. Anda bisa menyikat titik-titik dan melihat pasang pasang poin di
ArcMap.
CLOUD CROSSCOVARIANCE
Cloud crosscovariance menunjukkan crosscovariance empiris untuk semua pasang lokasi
antara dua dataset dan plotkannya sebagai fungsi jarak antara dua lokasi, seperti pada contoh
di bawah ini:
Crosscovariance cloud illustration
Cloud crosscovariance dapat digunakan untuk menguji karakteristik korelasi spasial lokal
antara dua dataset, dan dapat digunakan untuk mencari pergeseran spasial dalam korelasi antara
dua dataset. Sebuah awan crosscovariance terlihat seperti ini: