Anda di halaman 1dari 10

HISTOGRAM

Alat Histogram menyediakan deskripsi univariat (satu variabel) dari data Anda. Kotak dialog
tool menampilkan distribusi frekuensi untuk kumpulan data yang menarik dan menghitung
ringkasan statistik.
Distribusi frekuensi
Distribusi frekuensi adalah grafik batang yang menampilkan seberapa sering nilai yang diamati
jatuh dalam interval atau kelas tertentu. Anda dapat menentukan jumlah kelas dengan lebar
yang sama yang digunakan dalam histogram. Proporsi relatif data yang jatuh di setiap kelas
ditunjukkan oleh tinggi masing-masing batang. Misalnya, histogram di bawah ini menunjukkan
distribusi frekuensi (10 kelas) untuk dataset.

Ringkasan statistik
Fitur penting dari distribusi dapat diringkas dengan statistik yang menggambarkan lokasinya,
menyebar, dan bentuknya.
Ukuran lokasi
 Ukuran lokasi memberi Anda gambaran tentang pusat dan bagian distribusi lainnya.
Rata-rata adalah rata-rata aritmatika data. Rata-rata memberikan ukuran pusat
distribusi.
 Nilai median sesuai dengan proporsi kumulatif 0,5. Jika data disusun secara meningkat,
50 persen nilai akan berada di bawah median, dan 50 persen nilai akan berada di atas
median. Median memberikan ukuran lain dari pusat distribusi.

Ukuran penyebara
Penyebaran poin di sekitar nilai rata-rata adalah karakteristik lain dari distribusi frekuensi yang
ditampilkan.
 Perbedaan data adalah deviasi kuadrat rata-rata dari semua nilai dari mean. Karena
melibatkan perbedaan kuadrat, varians yang dihitung sensitif terhadap nilai yang tinggi
atau rendah. Perbedaannya diperkirakan dengan menjumlahkan penyimpangan kuadrat
dari mean dan membagi jumlah dengan (N-1).
 Deviasi standar adalah akar kuadrat dari varians, dan ini menggambarkan penyebaran
data tentang mean. Semakin kecil varians dan standar deviasi, semakin erat cluster
pengukuran tentang nilai mean.
Diagram di bawah ini menunjukkan dua distribusi dengan standar deviasi yang berbeda.
Distribusi frekuensi yang diwakili oleh garis hitam lebih bervariasi (spread lebih luas)
dibanding distribusi frekuensi yang ditunjukkan oleh garis merah. Perbedaan dan standar
deviasi untuk distribusi frekuensi hitam lebih besar daripada distribusi frekuensi merah

Measures of spread diagram


Ukuran bentuk
Distribusi frekuensi juga ditandai dengan bentuknya.
Koefisien kemiringan adalah ukuran simetri distribusi. Untuk distribusi simetris, koefisien
kemiringan adalah nol. Jika distribusi memiliki ekor yang panjang dengan nilai yang besar, itu
miring secara positif, dan jika memiliki ekor kiri yang panjang dengan nilai kecil, maka hal itu
miring secara negatif. Rata-rata lebih besar daripada median untuk distribusi miring positif dan
sebaliknya untuk distribusi miring negatif. Gambar di bawah menunjukkan distribusi yang
miring secara positif.
Positively skewed distribution example

Plot Normal QQ
Bagaimana plot Normal QQ dibangun ?
Pertama, nilai data diurutkan dan nilai distribusi kumulatif dihitung sebagai (i - 0,5) / n untuk
nilai pesanan dari total nilai n (ini memberikan proporsi data yang berada di bawah nilai
tertentu). Grafik distribusi kumulatif dihasilkan dengan merencanakan data yang dipesan
versus nilai distribusi kumulatif (grafik di kiri atas pada gambar di bawah). Proses yang sama
dilakukan untuk distribusi normal standar (distribusi Gaussian dengan rata-rata 0 dan deviasi
standar 1, yang ditunjukkan pada grafik di kanan atas gambar di bawah). Setelah dua grafik
distribusi kumulatif ini dihasilkan, nilai data yang sesuai dengan quantiles spesifik dipasangkan
dan diplot dalam plot QQ (grafik bawah pada gambar di bawah).

Normal QQ plot example

General QQ plot
Bagaimana plot QQ umum dibangun ?
Umum plot QQ digunakan untuk menilai kemiripan distribusi dua dataset. Plot ini dibuat
mengikuti prosedur serupa seperti yang dijelaskan untuk plot Normal QQ, namun alih-alih
menggunakan distribusi normal standar sebagai dataset kedua, kumpulan data apapun dapat
digunakan. Jika dua dataset memiliki distribusi yang sama, poin dalam plot QQ umum akan
jatuh pada garis lurus (45 derajat).
General QQ plot example
Meneliti distribusi data menggunakan plot QQ
Poin pada plot Normal QQ memberikan indikasi normalitas univariat dataset. Jika data
terdistribusi normal, titik-titik tersebut akan jatuh pada garis referensi 45 derajat. Jika datanya
tidak terdistribusi normal, titik-titiknya akan menyimpang dari garis referensi.
Pada diagram di bawah ini, nilai kuantil dari distribusi normal standar diplot pada sumbu x di
plot Normal QQ, dan nilai kuantil yang sesuai dari dataset diplot pada sumbu y. Anda dapat
melihat bahwa titik-titik tersebut berada dekat dengan garis referensi 45 derajat. Keberangkatan
utama dari garis ini terjadi pada nilai konsentrasi ozon yang tinggi.
Alat Plot Normal QQ memungkinkan Anda untuk memilih titik-titik yang tidak dekat dengan
garis referensi. Lokasi titik yang dipilih kemudian disorot dalam tampilan data ArcMap. Seperti
yang terlihat di bawah, mereka terkonsentrasi di sekitar area San Francisco Bay (titik-titik
berbayang merah muda pada peta di bawah).

QQ Plot Map
Contoh penggunaan transformasi data
Sebuah plot Normal QQ dari dataset contoh disajikan di sini :
Standard normal distribution: QQ Plot transformed
Perhatikan bagaimana poin menyimpang dari garis lurus.
Namun, seperti dapat dilihat pada gambar di bawah ini, ketika transformasi log diterapkan ke
dataset, titik-titiknya mengarah lebih dekat ke garis referensi 45 derajat.

Standard normal distribution: QQ log transformation


Transformasi Box-Cox dan arcsine juga dapat diterapkan pada data dalam alat Normal QQ Plot
untuk menilai pengaruhnya terhadap normalitas distribusi.

TREND ANALYSIS
Anda mungkin tertarik untuk memetakan tren, atau Anda mungkin ingin menghapus tren dari
kumpulan data saat menggunakan kriging. Alat Analisis Trend dapat membantu
mengidentifikasi tren dalam dataset input.
Alat Analisis Trend memberikan perspektif tiga dimensi data. Lokasi titik sampel diplot pada
bidang x, y. Di atas setiap titik sampel, nilai diberikan oleh tinggi tongkat pada dimensi z. Fitur
unik dari alat Analisis Trend adalah bahwa nilai kemudian diproyeksikan ke bidang x, z dan
bidang y, z sebagai scatterplots. Hal ini dapat dianggap sebagai pandangan menyamping
melalui data tiga dimensi. Polinomial kemudian cocok melalui scatterplots pada pesawat yang
diproyeksikan.

VORONOI MAPS
Peta Voronoi dibangun dari serangkaian poligon yang terbentuk di sekitar lokasi titik sampel.
Poligon Voronoi dibuat sedemikian rupa sehingga setiap lokasi dalam poligon lebih mendekati
titik sampel dalam poligon itu daripada titik sampel lainnya. Setelah poligon diciptakan,
tetangga titik sampel didefinisikan sebagai titik sampel lain yang poligonnya berbatasan
dengan titik sampel yang dipilih. Misalnya, pada gambar berikut, titik sampel hijau terang
ditutupi oleh poligon, yang telah disorot dengan warna merah. Setiap lokasi di dalam poligon
merah lebih dekat ke titik sampel hijau terang daripada titik sampel lainnya (diberi titik biru
kecil yang kecil). Poligon biru semua berbagi perbatasan dengan poligon merah, jadi titik
sampel di dalam poligon biru adalah tetangga titik sampel hijau terang.
Peta Voronoi
Dengan menggunakan definisi tetangga ini, berbagai statistik lokal dapat dihitung. Misalnya,
mean lokal dihitung dengan mengambil rata-rata titik sampel dalam poligon merah dan biru.
Rata-rata ini kemudian ditugaskan ke poligon merah. Proses ini diulang untuk semua poligon
dan tetangganya, dan hasilnya ditunjukkan dengan menggunakan rawa warna untuk membantu
memvisualisasikan daerah dengan nilai lokal yang tinggi dan rendah.
Alat Peta Voronoi menyediakan metode berikut untuk menetapkan atau menghitung nilai untuk
poligon.
 Simple: Nilai yang diberikan pada poligon adalah nilai yang tercatat pada titik sampel
di dalam poligon itu.
 Mean: Nilai yang diberikan pada poligon adalah nilai rata-rata yang dihitung dari
poligon dan tetangganya.
 Mode: Semua poligon dikategorikan menggunakan lima interval kelas. Nilai yang
ditetapkan ke poligon adalah mode (kelas yang paling sering terjadi) dari poligon dan
tetangganya.
 Cluster: Semua poligon dikategorikan menggunakan lima interval kelas. Jika interval
kelas poligon berbeda dari masing-masing tetangganya, poligon berwarna abu-abu dan
dimasukkan ke kelas enam untuk membedakannya dari tetangganya.
 Entropi: Semua poligon dikategorikan menggunakan lima kelas berdasarkan
pengelompokan data nilai alami (smart quantiles). Nilai yang diberikan pada poligon
adalah entropi yang dihitung dari poligon dan tetangganya - yaitu,
Entropy = - Σ (pi * Log pi),
dimana pi adalah proporsi poligon yang ditugaskan ke setiap kelas. Misalnya, pertimbangkan
poligon yang dikeliling
i oleh empat tetangga (total lima poligon). Nilai ditempatkan ke kelas yang sesuai:

Class Frequency Pi

1 3 3/5

2 0 0

3 1 1/5

4 0 0

5 1 1/5

Entropy class/frequency

The entropy assigned to the polygon will be

E = -[0.6*log2 (0.6) + 0.2* log2 (0.2) + 0.2* log2 (0.2)] = 1.371

Minimum entropy occurs when the polygon values are all located in the same class. Then,

Emin = -[1 * log2 (1)] = 0


Maximum entropy occurs when each polygon value is located in a different class interval.
Then,

Emax = -[0.2 * log2 (0.2) + 0.2 * log2 (0.2) + 0.2 * log2 (0.2) + 0.2 * log2 (0.2) + 0.2 * log2 (0.2)]
= 2.322

 Median: Nilai yang ditetapkan pada poligon adalah nilai median yang dihitung dari
distribusi frekuensi poligon dan tetangganya.
 Deviasi Standar: Nilai yang diberikan pada poligon adalah standar deviasi yang
dihitung dari poligon dan tetangganya.
 Rentang interkuartil: Kuartil pertama dan ketiga dihitung dari distribusi frekuensi
poligon dan tetangganya. Nilai yang ditetapkan pada poligon adalah kisaran interkuartil
yang dihitung dengan mengurangkan nilai kuartil pertama dari nilai kuartil ketiga.

Statistik Voronoi dapat digunakan untuk tujuan yang berbeda dan dapat dikelompokkan ke
dalam kategori fungsional umum berikut ini:

Functional category Voronoi statistics

Local Smoothing Mean, Mode, Median

Local Variation Standard deviation, Interquartile range, Entropy

Local Outliers Cluster

Local Influence Simple

General functional categories

SEMIVARIOGRAM / COVARIANCE CLOUD


Alat Semivariogram / Covariance Cloud menunjukkan nilai semivariogram dan kovarians
empiris untuk semua pasang lokasi dalam dataset dan memplotkannya sebagai fungsi jarak
yang memisahkan dua lokasi, seperti pada contoh di bawah ini:
Semivariogram covariance cloud illustration
Alat Semivariogram / Covariance Cloud dapat digunakan untuk memeriksa karakteristik lokal
autokorelasi spasial dalam dataset dan mencari outlier lokal. Semivariogram awan terlihat
seperti berikut:

Semivariogram cloud example

Pada ilustrasi di atas, setiap titik merah menunjukkan nilai semivariogram empiris (perbedaan
kuadrat antara nilai dua titik data yang membentuk pasangan) yang diplot terhadap jarak yang
memisahkan dua titik. Anda bisa menyikat titik-titik dan melihat pasang pasang poin di
ArcMap.

CLOUD CROSSCOVARIANCE
Cloud crosscovariance menunjukkan crosscovariance empiris untuk semua pasang lokasi
antara dua dataset dan plotkannya sebagai fungsi jarak antara dua lokasi, seperti pada contoh
di bawah ini:
Crosscovariance cloud illustration
Cloud crosscovariance dapat digunakan untuk menguji karakteristik korelasi spasial lokal
antara dua dataset, dan dapat digunakan untuk mencari pergeseran spasial dalam korelasi antara
dua dataset. Sebuah awan crosscovariance terlihat seperti ini:

Crosscovariance cloud example


Pada ilustrasi di atas, setiap titik merah menunjukkan crosscovariance empiris antara sepasang
lokasi, dengan atribut satu titik yang diambil dari kumpulan data pertama dan atribut titik kedua
yang diambil dari kumpulan data kedua. Anda bisa menyikat titik dan melihat pasangan yang
terhubung di ArcMap. (Untuk membedakan mana dari pasangan yang berasal dari dataset
mana, tetapkan warna pilihan yang berbeda di kotak dialog Properties pada setiap dataset.)

Anda mungkin juga menyukai