Data nominal adalah data yang diberikan pada obyek atau kategori yang tidak
menggambarkan kedudukan obyek tersebut, tetapi hanya sekedar label/kode. Data
ini mempunyai ciri bersifat saling lepas atau tidak berhubungan satu sama lain.
Contoh:
•Data jenis kelamin siswa dikategorikan menjadi ’laki-laki’ yang diwaliki angka 1 dan
’perempuan’ yang diwakili angka 2. Konsekuensi dari data nominal adalah tidak
mungkin seseorang memiliki dua kategori sekaligus dan angka yang digunakan di
sini hanya sebagai kode/simbol saja sehingga tidak dapat dilakukan operasi
matematika.
•Mengelompokan pertandingan menjadi “basket” yang diwakili dengan huruf A,
kemudian “footsal” diwakili dengan huruf B dan “bolavoli” diwakili oleh huruf C.
DATA ORDINAL
•Data ordinal adalah data yang penomoran obyek atau kategorinya disusun menurut
besarnya yatu dari tingkat terendah ke tertinggi atau sebaliknya dengan jarak/rentang tidak
harus sama. Data ini memiliki ciri yaitu kategori data dapat disusun berdasarkan urutan logis
dan sesuai dengan besarnya karateristik yang dimiliki.
Contoh:
•Mengenai tingkat pendidikan yang dikategorikan menjadi ’SD’ yang diwakili angka 1, ’SMP’
yang diwakili angka 2, ’SMA’ yang diwakili angka 3, ’Diploma’ yang diwakili angka 4, dan
’Sarjana’ yang diwakili angka 5. Sama halnya dengan data nominal, meskipun tingkatannya
lebih tinggi, data ordinal tetap tidak dapat dilakukan operasi matematika. Angka yang
digunakan hanya sebagai kode/simbol saja, dalam contoh tadi tingkat pendidikan tertinggi
adalah ’Sarjana’ dan terendah adalah ’SD’ (Sarjana > Diploma > SMA > SMP > SD).
•Suatu peringkat ranking disuatu kelas misalkan Ihsan ranking 1 dan udin ranking 2 berarti
ihsan lebih pintar dari pada udin.
•Penghitungan suara dalam pemilu, misalkan total suara Demokrat 60%, PDI 30%, Golkar 20%
berarti suara tertinggi di pegang oleh demokrat sebagai peringkat 1, sehinnga menjadi
pemenang dalam pemilu tersebut.
•Pada tingkatan Taekwondo memiliki beberapa tahapan sabuk misalkan dari awal sabuk
putih,kuning, hijau, biru, merah dan yang terakhir hitam.
DATA INTERVAL
•Data interval adalah data dimana obyek/kategori dapat diurutkan berdasarkan
suatu atribut yang memberikan informasi tentang interval antara tiap
obyek/kategori sama. Data ini dicirikan dengan urutan kategori tidak mempunyai
jarak yang sama tetapi tidak memiliki nilai nol mutlak/absolut.
Contoh:
•Rata – rata tinggi badan berdasarkan usia, untuk anak – anak yang berusia 6 – 12
memiliki rata – rata tinggi badan 130 – 145 cm, untuk remaja yang berusia 13 – 18
memilikirata – rata tinggi badan 146 – 160 cm, dan untuk dewasa yang berusia 19 –
26 cm memiliki rata – rata tinggi badan 161 – 199 cm.
•Pengiriman barang ke berbagai tempat, seperti contoh diatas Sintamengirimkan
barang dari Bandung ke Jakarta dengan harga Rp. 10.000,- /kg, dan Santi
mengirimkan dari bandung ke Yogyakarta dengan harga Rp. 20.000,- /kg sedangkan
Santamengirimkan barang dari Bandung ke Surabaya dengan harga Rp. 30.000,- /kg.
DATA RASIO
•Data rasio adalah data yang jaraknya sama dan mempunyai nilai nol absolut. Jadi
kalau data nol berarti tidak memiliki arti apapun.
Contoh:
1.Nilai raport siswa SMA dimana masing – masing siswa memiliki nilaiyang berbeda
yaitu Muiz mendapatkan nilai 100 (A), Cinta 80 (B), dan Putri 60 (C) jika dilihat
dariskala rasio nilai Muiz memiliki nilai lebih 20 dari pada nilai Cinta, Cinta memiliki
nilai lebih 20dari pada nilai Putri, dan nilai putri kurang 40 untuk sama dengan Muiz.
2.Berat bayi dimana bayi A beratnya adalah 3, B adalah 2, dan C adalah 1, jika dilihat
menggunakan skala rasio berat badan bayi A tiga kali lipat dari berat badan bayi C,
berat badan bayi B dua kalilipat dari C.
3.Pekerjaan dan penghasilan bulanan, dimana gajinya bermacam – macam, jika
dilihat berdasarkan skala rasio gaji Ichsan lebih besar dari pada gaji Kosim sebagai
karyawan, dan gaji Udin lebih lebih kecil dari pada gaji Kosim.
STATISTIK DESKRIPTIF STATISTIK PERENCANAAN
TUJUAN
❖ Memahami pengertian dasar dari Data
❖ Memahami pengertian dasar dari Objek, Variabel, dan Skala Pengukuran Data
❖ Mengetahui konsep dasar dari analisis dalam statistik (Statistik Deskriptif) dan
aplikasinya dalam bidang perencanaan wilayah dan kota
INTRO
Apa yang anda lakukan jika diminta untuk mendeskripsikan data dengan obyek lebih dari
100 unit (responden/ kecamatan/ rumah tangga/ dll) pada variabel tunggal, seperti pada
tabel di bawah ini?
INTRO
Perlu metode yang dapat mendesain data tersebut menjadi lebih ringkas dan mudah
dideskripsikan
Metode tsb disebut Metode Analisis Reduksi Data/Statistik Deskriptif →
melibatkan penggunaan sejumlah kecil angka, tabel atau grafik untuk menyimpulkan
atau membantu menyampaikan sederet angka yang berjumlah banyak yang
dihasilkan pada pengamatan awal, tanpa mengurangi informasi penting pada data
tersebut
Bagian dari Metode Analisis Reduksi Data/Statistik Deskriptif:
Distribusi frekuensi
Kecenderungan memusat (central tendency) – ukuran pemusatan data
Variasi – ukuran penyebaran data
DISTRIBUSI FREKUENSI
Merupakan tipe analisis statistik yang paling dasar (basic)
Mendeskripsikan secara sederhana seberapa sering masing-masing nilai dari suatu
variabel terjadi pada sejumlah obyek yang diobservasi
Data diringkas kedalam bentuk yang semakin kompak (compact) dan mudah
diinterpretasikan (interpretable)
Penyajian distribusi frekuensi dalam bentuk:
Tabel
Presentasi grafik
Diagram lingkaran (Pie Charts)
DISTRIBUSI FREKUENSI
PENYAJIAN TABEL
Tabel distribusi frekuensi disusun bila jumlah data yang akan disajikan cukup banyak,
sehingga jika disajikan dalam bentuk tabel biasa menjadi tidak efisien dan tidak komunikatif
Penyusunan tabel dimulai dari nilai variabel yang paling kecil ke yang paling besar, atau
sebaliknya.
Kemudian dibuat turus/penjumlahan terhadap kejadian masing-masing nilai variabel pada
sejumlah obyek yang diobservasi → menunjukkan nilai frekuensi dari setiap nilai variabel
Beberapa istilah yang perlu dipahami:
Frekuensi relatif: mengubah nilai frekuensi menjadi persen (%) berdasarkan jumlah total obyek yang
diobservasi
Frekuensi kumulatif: menjelaskan berapa banyak obyek yang diobservasi berada pada batas atas
atau bawah dari suatu nilai variabel tertentu
Frekuensi relatif kumulatif: menjelaskan berapa persentase (%) obyek yang diobservasi berada pada
batas atas atau bawah dari suatu nilai variabel tertentu
DISTRIBUSI FREKUENSI
PENYAJIAN TABEL
Deskripsi:
Sebagian besar umur siswa SD yang diobservasi adalah 9 tahun, yaitu sebanyak 30% atau 60
siswa dari jumlah total 200 siswa
Sebagian besar siswa SD yang diobservasi berumur ≤ 9 tahun, yaitu 65% atau 130 siswa dari
jumlah total 200 siswa
Lainnya?
DISTRIBUSI FREKUENSI
PENYAJIAN TABEL
Apa yang perlu dilakukan jika nilai variabel memiliki rentang yang sangat
besar? Misalnya data mengenai umur penduduk yang kisaran nilainya adalah
5 tahun hingga 60 tahun
Melalui grafik, penyajian informasi dari suatu data lebih formal, komunikatif, dan
estetis (menarik)
Ada 2 macam grafik: grafik garis (polygon) dan grafik batang (histogram/bar
charts)
Grafik garis biasanya dibuat untuk menunjukkan perkembangan suatu keadaan
Grafik batang biasanya dibuat untuk menunjukkan perbandingan frekuensi masing-
masing nilai variabel dan perkembangannya
Dalam grafik, garis vertikal (axis) menunjukkan jumlah (frekuensi) dan garis horisontal
(ordinat) menunjukkan periode waktu
DISTRIBUSI FREKUENSI
PENYAJIAN GRAFIK
Produksi Padi Tahun 1990-2010
18000
16000
14000
Produksi (Ton)
12000
10000
8000
6000
4000
2000
0
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
Tahun
Produksi Padi
18000
16000
Jumlah (Jiwa)
14000
12000
10000
8000
6000
`
4000
2000
0
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
Tahun
Pria Wanita
DISTRIBUSI FREKUENSI
PENYAJIAN DIAGRAM LINGKARAN ( PIE CHART )
Penyajian ini digunakan untuk membandingkan data dari berbagai kelompok
Sangat mudah untuk mendeskripsikan frekuensi relatif (persentase) dari setiap
nilai variabel (kelompok)
2% 3% 4%
5%
15% 6%
14% 8%
13%
11% 10%
9%
Merah Kuning Hijau Hitam Pink Biru Ungu Abu-abu Pink Oranye Coklat Putih
DISTRIBUSI FREKUENSI
BENTUK
Distribusi seragam (uniform atau rectangular) →
setiap nilai variabel terjadi pada jumlah/frekuensi
yang sama. Bentuk distribusi ini memang kurang
umum. Contoh bentuk distribusi ini adalah distribusi
umur penduduk pada negara-negara maju (well-
developed nations) dimana tingkat kelahiran dan
kematian relatif stabil
Distribusi U → polarisasi nilai variabel pada
frekuensi tertentu, cenderung nilainya sangat tinggi
atau sangat rendah.
Distribusi J terbalik (reverse J-shaped) → contohnya
distribusi umur penduduk pada negara berkembang
Distribusi lonceng (bell-shaped) → distribusi yang
paling umum, biasanya selalu dikaitkan dengan
distribusi normal
Distribusi skewed → bentuk yang tidak simetris
dimana ekor distribusi panjang di bagian kanan
atau di bagian kiri
KECENDERUNGAN MEMUSAT
( CENTRAL TENDENCY )
Data yang dideskripsikan hanya melalui distribusi frekuensi tidak menjelaskan banyak (say
nothing) mengenai nilai numerik yang spesifik menjelaskan data tersebut
Pengukuran kecenderungan memusat menghasilkan nilai ringkas tunggal yang
menjelaskan/mendeskripsikan dimana nilai-nilai dari suatu variabel tsb cenderung memusat
Pengukuran ini mungkin akan menghilangkan banyak informasi dari data dibandingkan
dengan pengukuran distribusi frekuensi
Namun, hasil pengukuran kecenderungan memusat ini akan semakin kaya mendeskripsikan
suatu data jika dihubungkan dengan distribusi frekuensi
Bagian dari pengukuran kecenderungan memusat:
Modus (nilai yang sering muncul)
Median (nilai tengah)
Mean (rata-rata)
KECENDERUNGAN MEMUSAT
( CENTRAL TENDENCY ) - MODUS
Median: nilai variabel dari obyek yang mempunyai setengah jumlah obyek di
atasnya dan setengah jumlah obyek di bawahnya setelah semua nilai variabel
obyek diurutkan dari yang terkecil sampai yang terbesar, atau sebaliknya dari yang
terbesar sampai yang terkecil
Penggunaan lebih tepat untuk tipe skala pengukuran ordinal (optional untuk skala
pengukuran interval/rasio)
KECENDERUNGAN MEMUSAT
( CENTRAL TENDENCY ) - MEDIAN
Data Ordinal • Data Rasio
Median = Sedang
KECENDERUNGAN MEMUSAT
( CENTRAL TENDENCY ) - MEAN
Mean: rata-rata hitung nilai varibel yang dimiliki seluruh obyek= jumlah nilai variabel seluruh obyek
dibagi jumlah obyek/kasus.
Jika sejumlah n obyek dengan variabel x maka rata-ratanya adalah:
n
x
Mean = i =1
n
Mean yang mendeskripsikan sampel biasanya dinotasikan dengan ,sedangkan yang mendeskripsikan
populasi adalah → pembedaan ini digunakan untuk analisis statistik inferensi
Idealnya, nilai mean (rata-rata) merepresentasikan nilai yang seimbang (balance point), atau pusat
gravitasi terhadap jumlah jarak ke observasi di bawahnya dan jumlah jarak ke observasi di atasnya
Nilai Mean
KECENDERUNGAN MEMUSAT
( CENTRAL TENDENCY ) - MEAN
Hati-hati penggunaan rata-rata pada data dengan beberapa nilai variabel yang ekstrim
(satu atau dua outlier)
Contoh: rata-rata dari nilai variabel 5,6,7,8,9 adalah 7. Namun rata-ratanya berubah
menjadi 11,2 jika nilai variabel adalah 5,6,7,8,30. Dalam kasus ini, penggunaan nilai median
menjadi lebih tepat
Formula Mean pada data berkelompok adalah:
Mean =
fx i i
f i
dimana fi adalah frekuensi kelas interval tertentu, xi adalah rata-rata dari nilai terendah dan
tertinggi kelas interval tertentu
VARIASI (VARIATION)
Teknik ini untuk menjelaskan keragaman atau dispersi dari suatu nilai variabel yang
diobservasi.
Merupakan ukuran dari serangkaian atau sekelompok data yang menunjukkan
seberapa jauh nilai-nilai dari sekelompok data tersebut menyimpang dari nilai rata-
ratanya.
Tingkat variasi kelompok data dapat dilihat melalui:
Rentang Data (Range)
Simpangan rata-rata absolut (Mean Absolute Deviation)
Simpangan baku (standar deviasi)
Variansi
VARIASI ( VARIATION )
RENTANG DATA ( RANGE )
Rentang Data (Range) adalah pengurangan nilai variabel yang tertinggi dengan yang terendah
Nilai Rentang Data ini dapat diinterpretasikan jika dilakukan perbandingan dua atau lebih kelompok
data, semakin kecil rentangnya semakin kecil tingkat variasi datanya dan sebaliknya.
Contoh:
Nilai UTS kelas A: 20,30,40,75,80,95
Nilai UTS kelas B: 50,60,70,80,90,95
Rentang Nilai UTS kelas A = 95-20 = 75; Rentang Nilai UTS kelas B = 95-50 = 45
Artinya, nilai UTS di kelas A lebih bervariasi dibandingkan dengan nilai UTS di kelas B
Kelemahan: tidak mampu menunjukkan variasi internal dari distribusi data. Contoh:
Nilai variabel A: 7,10,12,15,16,16,19,20,25,29
Nilai variabe B: 7,14,15,15,16,16,17,18,22,29
A dan B memiliki nilai rentang (22) dan rata-rata yang sama (16,9), namun nilai variabel A jauh lebih bervariasi
terhadap rata-rata dibandingkan nilai variabel B
VARIASI ( VARIATION )
SIMPANGAN RATA-RATA ABSOLUT
( MEAN ABSOLUTE DEVIATION )
Menunjukkan seberapa besar simpangan nilai variabel terhadap rata-ratanya
Formula:
M . A.D =
x −xi
n
Interpretasinya mirip dengan teknik rentang data (range), semakin kecil nilainya
semakin kecil variasi datanya dan sebaliknya
Contoh:
VARIASI ( VARIATION )
VARIANSI DAN STANDAR DEVIASI
Alternatif lain untuk melihat keragaman atau dispersi data adalah mengkuadratkan
nilai simpangan untuk diperoleh nilai absolut
Pada M.A.D diperoleh rata-rata simpangan, pada Variansi diperoleh rata-rata
simpangan kuadrat
(x − )
2
Formula variansi untuk populasi: 2
= i
(x − x)
2
Formula variansi untuk sampel:
s 2
= i
n −1
VARIASI ( VARIATION )
VARIANSI DAN STANDAR DEVIASI
Akar dari variansi disebut Standar Deviasi (SD) atau simpangan baku
Formula SD untuk populasi:
(x − )
2
= i
(x − x )
2
Formula SD untuk sampel:
s= i
n −1
Dalam mendeskripsikan suatu data, akan semakin komprehensif jika dideskripsikan keragaman (dispersi)
dari distribusi data tersebut, tidak hanya mendeskripsikan nilai kecenderungan memusatnya. Dalam
kasus tertentu, rata-rata dari dua kelompok data bisa sama namun standar deviasinya berbeda
Contoh Perhitungan Variansi dan Simpangan Baku (Sampel)
s 2
=
( x − x)
i
2
=
9543.2
= 23858
. 2
=
( x − )
i
2
=
9543.2
= 1908.64
5−1 4 5 5
s = 23858
. = 48.84 = 1908.2 = 43.69
SAMPEL POPULASI
APLIKASI JENIS ANALISIS BERDASARKAN SKALA PENGUKURAN DATA
1 Pria 11
2 Wanita 14
Total 25
Sumber: Survey Primer, 2015
ANALISIS DATA DENGAN STATISTIK DESKRIPTIF
Ukuran pemusatan data
Mean atau rata-rata tinggi badan
adalah 170,12 cm
Median atau titik tengah data jika
semua data diurutkan dan dibagi 2
sama besar. Angka median 170,20 cm
menunjukkan bahwa 50% tinggi badan
adalah 170,20 cm ke atas, dan 50%-
nya 170,20 cm ke bawah
ANALISIS DATA DENGAN STATISTIK DESKRIPTIF
Ukuran penyebaran data