BAB II
STATISTIKA DESKRIPTIF
Tujuan Pembelajaran:
1. Dapat menjelaskan konsep statistik deskriptif
2. Dapat menjelaskan penyajian data
3. Dapat menjelaskan ukuran pemusatan data
4. Dapat menjelaskan ukuran penyebaran data
5. Dapat menghitung statistik deskriptif menggunakan program eviews
berkepentingan dengan data tersebut dan data sekunder adalah data yang tidak
secara langsung dikumpulkan oleh orang yang berkepentingan dengan data
tersebut.
Statistik deskriptif hanya berhubungan dengan hal menguraikan atau
memberikan keterangan-keterangan mengenai suatu data atau keadaan atau
fenomena. Dengan kata lain, statistik deskriptif berfungsi menerangkan
keadaan, gejala, atau persoalan. Penarikan kesimpulan pada statistik deskriptif
(jika ada) hanya ditujukan pada kumpulan data yang ada.
Didasarkan pada ruang lingkup bahasannya statistik deskriptif mencakup :
Distribusi frekuensi beserta bagian-bagiannya seperti :
a. Grafik distribusi (histogram, poligon frekuensi, dan ogif);
b. Ukuran nilai pusat (rata-rata, median, modus, kuartil dan sebagainya);
c. Ukuran dispersi (jangkauan, simpangan rata-rata, variasi, simpangan baku,
dan sebagianya);
d. Kemencengan dan keruncingan kurva
e. Angka indeks
f. Times series/deret waktu atau berkala
g. Korelasi dan regresi sederhana.
Kegiatan memeriksa sifat-sifat penting dari data yang ada itu disebut
analisis data secara pemerian (deskripsi). Karenanya bagian statistika demikian
dinamakan Statistika Deskriptif atau Statistika Perian. Penyusunan tabel,
diagram, modus, kuartil, simpangan baku termasuk dalam kategori statistika
deskriptif. Kegiatan itu dilakukan melalui:
a. Pendekatan aritmetika yaitu pendekatan melalui pemeriksaan rangkuman
nilai atau ukuran-ukuran penting dari data. Yang dimaksud rangkuman nilai
di sini ialah penyederhanaan kumpulan nilai data yang diamati ke dalam
bentuk nilai-nilai tertentu. Setiap rangkuman nilai ini disebut statistik. Jadi,
statistik menerangkan sifat kumpulan data dalam bentuk nilai yang mudah
dipahami, sedangkan statistika adalah suatu ilmu tentang sekumpulan
konsep serta metode yang dapat digunakan untuk mengumpulkan,
menyajikan dan menganalisis data serta menarik kesimpulan berdasar hasil
analisis data tersebut.
21
grafik yang sering digunakan antara lain grafik garis, grafik batang, diagram
lingkaran, dan grafik gambar
1. Grafik Garis (Polygon)
Poligon menggunakan garis yang menghubungkan titik-titik yang
merupakan koordinat antara nilai tengah kelas dengan jumlah frekuensi
pada kelas tersebut. Titik tengah kelas merupakan representasi dari
karakter kelas dan nilai tengah ini menggantikan posisi interval kelas pada
ddiagram histogram. (Purwanto S.K., 2012)
2. Grafik Batang
Cara lain untuk menyajikan data hasil penelitian adalah dengan diagram
lingkaran atau piechart. Diagram lingkaran digunakan untuk membandingkan
data dari berbagai kelompok. Gambar 3.3 merupakan contoh penyajian data
dengan diagram lingkaran.
b. Modus (Mode)
Modus merupakan salah satu ukuran pemusatan di sampling rata-rata
hitung dan median. Modus adalah suatu nilai pengamatan yang paling sering
muncul. (Purwanto S.K., 2012)
Bedasarkan data tersebut, maka modus atau nilai yang paling sering
muncul adalah 20 menit. Karena munculnya sebanyak 3 kali atau frekuensinya 3.
Jadi dapat dikatakan bahwa waktu layanan ke pelanggan di Perusahaan X
terbanyak adalah 20 menit.
c. Median
Median merupakan salah satu ukuran pemusatan. Median merupakan suatu
nilai yang berada di tengah-tengah data, setelah data tersebut diurutkan.
(Purwanto S.K., 2012) Menghitung median:
Jika jumlah data ganjil, maka median adalah nilai tengah dari urutan data
Jika jumlah data genap maka untuk menentukan mediannya diambil 2 data
tengah dijumlah, kemudian dibagi 2
25
Berdasarkan data di atas, maka nilai tengah dari kelompok data tersebut
adalah urutan ke 5 dan 6 dibagi 2 yaitu 20. Jadi mediannya = 20. Median
sebesar 20 menit artinya terdapat 5 hari dengan waktu layanan kurang atau sama
dengan 20 menit, dan terdapat 5 hari dengan waktu layanan lebih besar atau
sama dengan 20 menit.
d. Mean
Mean merupakan nilai yang diperoleh dengan menjumlahkan semua nilai
data dan membaginya dengan jumlah data. Mean merupakan nilai yang
menunjukkan pusat dari nilai data dan merupakan nilai yang dapat mewakili
keterpusatan data. (Purwanto S.K., 2012) Hal ini dapat dirumuskan sebagai
berikut ini.
Me = (2.1)
Di mana:
Me = Mean (rata-rata)
∑ = Epsilon (baca jumlah) Xi = Nilai x ke i sampai ke n
n = Jumlah individu
Contoh:
Me = = 19,1
Walaupun dari data diatas tidak ada waktu layanan selama 19,1 atau 19
menit, akan tetapi dengan mengetahui bahwa rata-rata waktu layanan adalah
selama 19 menit, maka dapat digunakan untuk perencanaan operasional harian
perusahaan.
yang paling banyak digunakan adalah rentang (range), variansi (variance), dan
simpangan baku (standart deviation).
Contoh:
Untuk menganalisa lebih jauh tentang waktu layanan ke pelanggan selama
10 hari, maka kita dapat menggunakan rentang data. Setelah data diurutkan
(tabel 3. ) dan dengan mengunakan rumus di atas, maka diperoleh rentang data:
R = xt – xr = 35-10 = 25 menit
Rentang data sebesar 25 menit ini mengindikasikan bahwa perbedaan
terbesar waktu layanan ke pelanggan antara hari keberapa saja adalah 25 menit.
Rumus variansi:
(2.3)
(2.4)
(2.5)
Di mana:
= Variabel populasi = Simpangan baku populasi
s2 = Varians sampel s = Simpangan baku sampel
n = Jumlah sampel
3 65 -6 36
4 80 9 91
5 70 -1 1
6 65 -6 36
7 75 6 16
8 80 9 81
9 70 -1 1
10 75 4 16
∑ 710 0 390
Varians (s2)
Standar deviasi =
e. Menghitung rata-rata
(2.7)
Dengan menggunakan nilai jumlah (1) diatas, maka:
29
g. Menghitung range
Range = 65.000.000 - 25.750.000
= 39.250.000
S
=
Maka: Varians =
Standard Deviasi =
sebesar 0.33 > 0,05 maka dapat disimpulkan bahwa residual terdistribusi normal
yang artinya asumsi klasik mengenai kenormalan telah terpenuhi.
Hitungan yang digunakan oleh eviews untuk menampilkan angka-angka diatas
adalah sebagai berikut:
Mean adalah rata-rata data diperoleh dengan menjumlahkan seluruh data
dan membanginya dengan cacah data
Median adalah nilai tengah (rata-rata dua nilai tengah bila datanya genap)
bila datanya diurutkan dari yang trekecil hingga ynag terbesar. Median
merupakan ukuran tengah yang tidak mudah terpengaruh oleh outlier,
terutama bila dibanding dengan mean.
Max dan Min adalah nilai paling besar dan nilai paling kecil dari data.
Std. Dev (standard deviation) adalah ukuran dispersi atau penyebaran data.
Rumus yang digunakan adalah:
s= √ ¿ ¿ ¿ (2.8)
Dengan N adalah banyaknya observasi dan ý adalah mean dari data/
Skewness adalah ukuran asimetri distribusi data di sekitar mean. Skewness
diukur dengan rumus :
n
1 y − ý
s= ∑ ( i ) (2.9)
N i=1 σ^
Dengan σ^ adalah estimator deviasi standar yang dihitung berdasarkan
rumus :
σ^ =s √( N−1)/ N. (2.10)
Skewness dari suatu distribusi simetris (distribusi normal) adalah nol.
Positif skewness menunjukkan bahwa disbtribusi datanya memiliki ekor
panjjang di sisi kanan dan negative skweness memiliki ekor panjang di
kiri.
Kurtosis mengukur ketinggian suatu distribusi. Kuortis dihitung dengan
n
1
rumus : K= ∑ ¿¿ (2.11)
N i=t
Dengan σ^ adalah estimator bias terhadap varians. Kuortis suatu data
berdistribusi normal adlah 3. Bila kuortis melibihi 3, maka distribusi data
33
2
N−k 2 ( K −3 )
digunakan adalah Jarque−Bera= (S + ) (2.12)
6 4
Dimana: