STATISTIK DESKRIPTIP
Tujuan :
mempelajari cara penyajian data secara numerik dan grafik : rata-rata, median, modus
dan varian sampel, histogram, distribusi frekuensi..
Analisis statistika :
dimulai dari deskripsi fakta, analisis dan membuat kesimpulan (dasar
pembuatan keputusan)
in 1 X i w i
Xw =
in 1 w i
16
n = f1 + f2 + f3+ + fk , jumlah observasi.
mi = titik tengah interval kelas
fi = frekuensi kelas
k = jumlah kelas.
Median
Pengukutan data sampel dengan cara membagi data kedalam dua bagian
yang sama dinamakan median. Untuk menentukan ukuran median, data sampel
diurutkan dari nilai data terkecil sampai dengan nilai data terbesar. Misalkan
X(1), X(2) , …, X(n) adalah data yang telah diurutkan, maka median diberikan
dengan cara sebagai berikut :
X (n 1)/2 n ganjil
M = X n/2 X (n/2)1
n genap
2
Jika ukuran sampel n adalah ganjil, maka median diambil dari data pada posisi
yang ditengah. Sedangkan, jika ukuran sampel n adalah genap, maka
median diambil dari rata-rata dua data pada posisi yang ditengah.
Contoh 3.1. Diberikan data rata-rata suhu udara di Kota Semarang per-hari
pada Oktober 2002, seperti pada Data 3.1.
17
Data 3.1. Suhu udara di Kota Semarang per-hari
pada Oktober 2002.
Tanggal Suhu Tanggal Suhu Tanggal Suhu
1 28,4 11 28,6 21 30,0
2 30,5 12 29,4 22 28,2
3 28,3 13 28,9 23 27,9
4 28,7 14 29,9 24 28,3
5 29,4 15 29,3 25 29,.2
6 28,2 16 31,4 26 29,1
7 28,8 17 30,3 27 29,4
8 28,3 18 30,9 28 28,9
9 29,5 19 29,3 29 28,2
10 29,0 20 29,1 30 29,3
31 28,5
Sumber : BMG Semarang, 2003.
1
n
X = n i 1
Xi
1
= ( 28,4 30,5 ... 29,3 28,5) =903,20/31 = 29,14
31
Contoh 3.5. Diberikan data rata-rata suhu udara di Kota Semarang per-hari
pada Oktober 2002, seperti pada Data 3.1.
Untuk menghitung median dari Data 3.1, maka data diurutkan dahulu dari
terkecil sampai yang terbesar. Pengurutan data dapat dilakukan dengan
program EXCEL, yang hasilnya diberikan pada Data 3.5.
Data 3.5. Suhu udara di Kota Semarang per-hari pada Oktober 2002
yang telah diurutkan..
18
No. Urut Suhu No. Urut Suhu No. Urut Suhu
1 27,9 11 28,7 21 29,3
2 28,2 12 28,8 22 29,4
3 28,2 13 28,9 23 29,4
4 28,2 14 28,9 24 29,4
5 28,3 15 29,0 25 29,5
6 28,3 16 29,1 26 29,9
7 28,3 17 29,1 27 30,0
8 28,4 18 29,2 28 30,3
9 28,5 19 29,3 29 30,5
10 28,6 20 29,3 30 30,9
31 31,4
Berdasarkan data yang telah diurutkan seperti pada Data 352, dan karena jumlah
data adalah ganjil, maka median adalah nilai data pada urutan ke (31+1)/2 = 16,
yaitu
Median = X16 = 29,1.
Modus
Pengukuran data sampel dengan mengambil nilai data sampel yang
paling banyak muncul dinamakan modus. Pemunculan banyaknya data dengan
nilai yang sama dinamakan frekuensi. Sehingga, modus adalah nilai data yang
mempunyai frekuensi terbanyak. Karena dapat dimungkinkan suatu data
sampel mempunyai frekuensi terbanyak lebih dari satu, maka modus dapat
mempunyai nilai lebih dari satu.
Contoh 3.7. (Meneruskan Contoh 3.1) Diberikan data rata-rata suhu udara di
Kota Semarang per-hari pada Oktober 2002, seperti pada Data 3.1.
Untuk menghitung modus dari Data 3.1, pada Contoh 3.1, maka dihitung
dahulu fekuensi pada nilai data, dengan cara mengurutkan data seperti pada
Data 3.5. Berdasarkan Data 3.5, maka data yang frekuensi paling tinggi ada
empat buah data berjumlah 3 buah, yaitu :
28,2 ; 28,3 ; 29,3 ; dan 29,4
Sehingga ukuran modus adalah 28,2 ; 28,3 ; 29,3 ; dan 29,4.
Untuk data yang telah dikelompokkan, modus dapat dihitung dengan rumus :
19
i f -f
1 -1
Mo = Xo + 2 2f f f
o 1 -1
dimana
Xo = titik tengah kelas modus
i = interval kelas.
fo = frekuensi kelas modus
fi = frekuensi kelas sesudah modus
f-1 = frekuensi kelas sebelum modus
Contoh 3.8. Diberikan data Distribusi frekuensi hasil produksi padi kering
perhektar dalam kuintal di 100 desa, seperti pada Data 3.3. Berdasarkan rumus
modus untuk data yang telah dikelompokkan, diperoleh :
15 20 - 24
Mo = 57 +
2 2(27) 20 - 24
= 57 + 7,5 x –0,4
= 57 – 3 = 54.
Cara lain untuk menghitung modus dengan rumus Croxton dan Cowden, yaitu
f -f
o -1
Mo = B + (f f ) (f f )
xi
o -1 o 1
dimana
Xo = tepi tengah bawah kelas modus
i = interval kelas.
fo = frekuensi kelas modus
fi = frekuensi kelas sesudah modus
f-1 = frekuensi kelas sebelum modus
Berdasarkan rumus modus diatas dan dengan menggunakan Tabel 3.2 berikut,
diperoleh :
27 - 24
Mo = 49,5 + x 15
(27 24) (27 20)
= 49,5 + 4,5 = 54
Tabel 3.2. Distribusi frekuensi hasil produksi padi kering
perhektar dalam kuintal di 100 desa.
Hasil produksi F Tepi kelas
20
(dalam kuintal)
19,5
20 – 34 8
34,5
35 – 49 24
49,5
50 – 64 27
64,5
65 – 79 20
79,5
80 – 94 8
94,5
95 – 109 8
109,5
110-124 4
124,5
125-139 1
139,5
100
Varian sampel
Diberikan data sampel random X1, X2 , …, Xn , dengan ukuran sampel n.
Varian sampel diberikan dengan
1
n
S2 = i 1
(X i - X ) 2 (3.1)
n
1 1
=
n
i 1
X i2 -
n
i 1
Xi 2
n n
Standar deviasi
Standar deviasi merupakan rata-rata variasi dari semua data terhadap
nilai tengah (rata-rata), yang nilainya adalah akar dari varian, yaitu S.
21
Jika varian dengan rumus (3.1) digunakan untuk memperkirakan
(estimasi) varian populasi, maka pengukuran varian (3.1) memberikan hasil
yang bias. Untuk menjadikan varian sampel sebagai varian yang tak bias
terhadap varian populasi, digunakan rumus :
1
n
S2 = i 1
(X i - X ) 2 (3.2)
n -1
Dengan menggunakan rumus (3.2), maka estimasi dari varian sampel sama
dengan nilai varian populasi, atau ditulis E(S 2) = 2 . Artinya, bahwa nilai
harapan dari varian sampel sama S2 dengan varian populasi 2.
Contoh 3.9. (Meneruskan Contoh 3.1. Diberikan data rata-rata suhu udara di
Kota Semarang per-hari pada Oktober 2002, seperti pada Data 3.1.
Varian sampel dihitung dengan rumus 3.1, yaitu :
1
n
S2 = i 1
(X i - X ) 2
n
= 0,704
Sehingga standar deviasi dari data pada Contoh 3.1 adalah S = ( 0,704) = 0,839.
22
Menghitung arameter statistika dengan SPSS
Untuk menghitung rata-rata hitung, varian atau standar deviasi, median dan
lainnya dapat menggunakan program SPSS, sperti pada Output SPSS11 berikut.
Program SPSS11
Input : Data 3.1.
23
grafik adalah membuat deskripsi data dalam bentuk yang menarik, mudah
untuk dimengerti, dan menggambarkan distribusi pola data yang sebenarnya.
Berikut akan diberikan penyajian data dalam bentuk distribusi frekuensi
berupa kurva frekuensi. Distribusi frekuensi merupakan penyebaran data yang
diatur berdasarkan frekuensi ke dalam kelompok kelas-kelas berurutan.
Frekuensi adalah jumlah pemunculan data yang sama atau dalam satu
kelompok kelas. Kurva frekuensi ini dapat digunakan untuk estimasi fungsi
distribusi probabilita pemunculan data sebenarnya (populasi).
24
Setelah batas interval terendah dan tertinggi ditentukan, selanjutnya
membuat batas pada setiap kelas, yang berfungsi sebagai pembatas kelas
untuk memisahkan dua kelas yang berdampingan. Batas kelas terendah
merupakan batas terendah dari kelas pertama, dan batas kelas tertinggi
merupakan batas kelas tertinggi. Batas kelas terendah (tidak harus nilai data
terkecil) harus memuat nilai data terkecil pada kelas pertama, dan batas kelas
tertinggi (tidak harus nilai data terbesar) harus memuat nilai data terbesar
pada kelas terakhir.
10
Histogram
8
6
Kurva distribusi
4 frekuensi
f
2
0
27.88 28.63 29.38 30.13 30.88 31.63
SUHU
25
Gambar 3.1. Histogram dan kurva distribusi frekuensi
rata-rata suhu udara Bulan Oktober 2002
Dari data pada Contoh 3.12. dengan jumlah data n = 60, diperoeh :
Jumlah kelas k = 1 + 3,322 log (601) = 1 + 3,322 x 1.778 = 6,907 7
Ukuan data terkecil = 0 dan ukuran data terbesar = 8
Karena data disktrit, dengan data terkecil 0 dan terbesar 8, maka jumlah kelas
dapat disesuaikan dengan batas-batas kelas tersebut, sehingga diambil jumlah
kelas diambil sebesar 9. Selanjutnya diambil batas kelas terkecil –0,5 dan batas
kelas terbesar 8,5, yaitu untuk membuat nilai telah kelas pada setiap kelas
berupa bilangan bulat, dari yang terecil 0 sampai terbesar 8. Dengan SPSS,
histogram diberikan pada Gambar 3.2.
26
20
Histogram
10
0
0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0
KAPAL
27