Bab 3 Stat Deskriptif

BAB 3
STATISTIK DESKRIPTIP
Tujuan :
mempelajari cara penyajian data secara numerik dan grafik : rata-rata, median, modus
dan varian sampel, histogram, distribusi frekuensi..
Analisis statistika :
dimulai dari deskripsi fakta, analisis dan membuat kesimpulan (dasar
pembuatan keputusan)
Pengukuran kecenderungan pusat

Rata-rata hitung (arithmetic mean)
Diberikan data sampel random X1, X2 , …, Xn , dimana n adalah ukuran sampel.
Rata-rata hitung :
1

n
X = n i 1
Xi
Rata-rata tertimbang (wigthtd arithmetic mean)

Jika data sampel random X1, X2 ,…, Xn, masing-masing mempunyai
timbangan (bobot) w1, w2 ,…, wn, n adalah ukuran sampel.
Rata-rata hitung tertimbang :
 in 1 X i w i
Xw =
 in 1 w i
Rata-rata hitung untuk data yang telah dikelompokkan (grouped data)

Jika data yang tersedia merupakan data yang telah dikelompokkan dalam
kelas-kelas berurutan, maka rata-rata hitung dapat dihitung dengan
rumus :
m f  m f   m f
1 1 2 2 k k
X = f  f f
1 2 k
1 k
=  mi fi
n i 1
dimana
16
n = f1 + f2 + f3+ + fk , jumlah observasi.
mi = titik tengah interval kelas
fi = frekuensi kelas
k = jumlah kelas.
Rata-rata hitung dari beberapa sampel

Diberikan data sampel random dari beberapa kelompok :
Sampel 1 : X11, X12 ,…, X 1 n , 1 n1 adalah ukuran sampel 1,
Sampel 2 : X21, X22 ,…, X 2 n , 2 n2 adalah ukuran sampel 2,
........
Sampel k : Xk1, Xk2 ,…, X k n , k nk adalah ukuran sampel k,
Rata-rata hitung dari k sampel (kelompok observasi) dapat diberikan dengan:
n X1  n X 2      n X k )
1 2 k
X =
n  n  n
1 2 k
Median
Pengukutan data sampel dengan cara membagi data kedalam dua bagian
yang sama dinamakan median. Untuk menentukan ukuran median, data sampel
diurutkan dari nilai data terkecil sampai dengan nilai data terbesar. Misalkan
X(1), X(2) , …, X(n) adalah data yang telah diurutkan, maka median diberikan
dengan cara sebagai berikut :
X (n 1)/2 n ganjil

M =  X n/2  X (n/2)1
 n genap
 2
Jika ukuran sampel n adalah ganjil, maka median diambil dari data pada posisi
yang ditengah. Sedangkan, jika ukuran sampel n adalah genap, maka
median diambil dari rata-rata dua data pada posisi yang ditengah.
Contoh 3.1. Diberikan data rata-rata suhu udara di Kota Semarang per-hari
pada Oktober 2002, seperti pada Data 3.1.
17
Data 3.1. Suhu udara di Kota Semarang per-hari
pada Oktober 2002.
Tanggal Suhu Tanggal Suhu Tanggal Suhu
1 28,4 11 28,6 21 30,0
2 30,5 12 29,4 22 28,2
3 28,3 13 28,9 23 27,9
4 28,7 14 29,9 24 28,3
5 29,4 15 29,3 25 29,.2
6 28,2 16 31,4 26 29,1
7 28,8 17 30,3 27 29,4
8 28,3 18 30,9 28 28,9
9 29,5 19 29,3 29 28,2
10 29,0 20 29,1 30 29,3
31 28,5
Sumber : BMG Semarang, 2003.
Rata-rata hitung suhu di Kota Semarang pada bulan Oktober adalah :
1

n
X = n i 1
Xi
1
= ( 28,4  30,5  ...  29,3  28,5) =903,20/31 = 29,14
31
Contoh 3.5. Diberikan data rata-rata suhu udara di Kota Semarang per-hari
pada Oktober 2002, seperti pada Data 3.1.
Untuk menghitung median dari Data 3.1, maka data diurutkan dahulu dari
terkecil sampai yang terbesar. Pengurutan data dapat dilakukan dengan
program EXCEL, yang hasilnya diberikan pada Data 3.5.
Data 3.5. Suhu udara di Kota Semarang per-hari pada Oktober 2002
yang telah diurutkan..
18
No. Urut Suhu No. Urut Suhu No. Urut Suhu
1 27,9 11 28,7 21 29,3
2 28,2 12 28,8 22 29,4
3 28,2 13 28,9 23 29,4
4 28,2 14 28,9 24 29,4
5 28,3 15 29,0 25 29,5
6 28,3 16 29,1 26 29,9
7 28,3 17 29,1 27 30,0
8 28,4 18 29,2 28 30,3
9 28,5 19 29,3 29 30,5
10 28,6 20 29,3 30 30,9
31 31,4
Berdasarkan data yang telah diurutkan seperti pada Data 352, dan karena jumlah
data adalah ganjil, maka median adalah nilai data pada urutan ke (31+1)/2 = 16,
yaitu
Median = X16 = 29,1.
Modus
Pengukuran data sampel dengan mengambil nilai data sampel yang
paling banyak muncul dinamakan modus. Pemunculan banyaknya data dengan
nilai yang sama dinamakan frekuensi. Sehingga, modus adalah nilai data yang
mempunyai frekuensi terbanyak. Karena dapat dimungkinkan suatu data
sampel mempunyai frekuensi terbanyak lebih dari satu, maka modus dapat
mempunyai nilai lebih dari satu.
Contoh 3.7. (Meneruskan Contoh 3.1) Diberikan data rata-rata suhu udara di
Kota Semarang per-hari pada Oktober 2002, seperti pada Data 3.1.
Untuk menghitung modus dari Data 3.1, pada Contoh 3.1, maka dihitung
dahulu fekuensi pada nilai data, dengan cara mengurutkan data seperti pada
Data 3.5. Berdasarkan Data 3.5, maka data yang frekuensi paling tinggi ada
empat buah data berjumlah 3 buah, yaitu :
28,2 ; 28,3 ; 29,3 ; dan 29,4
Sehingga ukuran modus adalah 28,2 ; 28,3 ; 29,3 ; dan 29,4.
Untuk data yang telah dikelompokkan, modus dapat dihitung dengan rumus :
19
i f -f
1 -1
Mo = Xo + 2 2f  f  f
o 1 -1
dimana
Xo = titik tengah kelas modus
i = interval kelas.
fo = frekuensi kelas modus
fi = frekuensi kelas sesudah modus
f-1 = frekuensi kelas sebelum modus
Contoh 3.8. Diberikan data Distribusi frekuensi hasil produksi padi kering
perhektar dalam kuintal di 100 desa, seperti pada Data 3.3. Berdasarkan rumus
modus untuk data yang telah dikelompokkan, diperoleh :
15 20 - 24
Mo = 57 +
2 2(27)  20 - 24
= 57 + 7,5 x –0,4
= 57 – 3 = 54.
Cara lain untuk menghitung modus dengan rumus Croxton dan Cowden, yaitu
f -f
o -1
Mo = B + (f f )  (f f )
xi
o -1 o 1
dimana
Xo = tepi tengah bawah kelas modus
i = interval kelas.
fo = frekuensi kelas modus
fi = frekuensi kelas sesudah modus
f-1 = frekuensi kelas sebelum modus
Berdasarkan rumus modus diatas dan dengan menggunakan Tabel 3.2 berikut,
diperoleh :
27 - 24
Mo = 49,5 + x 15
(27  24)  (27  20)
= 49,5 + 4,5 = 54
Tabel 3.2. Distribusi frekuensi hasil produksi padi kering
perhektar dalam kuintal di 100 desa.
Hasil produksi F Tepi kelas
20
(dalam kuintal)
19,5
20 – 34 8
34,5
35 – 49 24
49,5
50 – 64 27
64,5
65 – 79 20
79,5
80 – 94 8
94,5
95 – 109 8
109,5
110-124 4
124,5
125-139 1
139,5
100
3.2. Pengukuran dispersi

Kecenderungan pusat data berupa rata-rata hitung tidak selalu
memberikan cukup informasi, karena adanya variabilitas dari data yang diambil.
Untuk dapat mengukur tingkat perbedaan ukuran data antara satu dengan
lailnya, perlu diketahui adanya dispersi atau variasi data, yang nilainya dapat
dinyatakan dalam bentuk standar deviasi sebagai akar dari varian.
Varian sampel
Diberikan data sampel random X1, X2 , …, Xn , dengan ukuran sampel n.
Varian sampel diberikan dengan
1

n
S2 = i 1
(X i - X ) 2 (3.1)
n
dimana X adalah rata-rata hitung. Varian dengan rumus (3.1) dapat

disederhanakan dalam bentuk :
1
  X i2  n X - 2 X i 1 X i 
n 2 n
S2 = i 1
n
1 1
=  
n
i 1
X i2 -  
n
i 1
Xi 2 
n n
Standar deviasi
Standar deviasi merupakan rata-rata variasi dari semua data terhadap
nilai tengah (rata-rata), yang nilainya adalah akar dari varian, yaitu S.
21
Jika varian dengan rumus (3.1) digunakan untuk memperkirakan
(estimasi) varian populasi, maka pengukuran varian (3.1) memberikan hasil
yang bias. Untuk menjadikan varian sampel sebagai varian yang tak bias
terhadap varian populasi, digunakan rumus :
1

n
S2 = i 1
(X i - X ) 2 (3.2)
n -1
Dengan menggunakan rumus (3.2), maka estimasi dari varian sampel sama
dengan nilai varian populasi, atau ditulis E(S 2) = 2 . Artinya, bahwa nilai
harapan dari varian sampel sama S2 dengan varian populasi 2.
Contoh 3.9. (Meneruskan Contoh 3.1. Diberikan data rata-rata suhu udara di
Kota Semarang per-hari pada Oktober 2002, seperti pada Data 3.1.
Varian sampel dihitung dengan rumus 3.1, yaitu :
1

n
S2 = i 1
(X i - X ) 2
n
= (1/31) ((28,4 – 29,14) 2 + (30,5 – 29,14) 2 … + (28,5 – 29,14) 2
= 0,704
Sehingga standar deviasi dari data pada Contoh 3.1 adalah S = ( 0,704) = 0,839.
Varian dari data yang telah dikelompokkan.

Jika data yang tersedia merupakan data yang telah dikelompokkan dalam
kelas-kelas berurutan, maka varian sampel dapat dihitung dengan rumus :
1

k
S2 = i 1
(mi - X) 2 f i
n
dimana X adalah rata-rata sampel :
1 k
X =  m f
n i 1 i i
n = f1 + f2 + f3+ + fk , jumlah observasi.
mi = titik tengah interval kelas
fi = frekuensi kelas
k = jumlah kelas.
Contoh 3.10. Diberikan data Distribusi frekuensi hasil produksi padi kering
perhektar dalam kuintal di 100 desa, seperti pada Data 3.3.
Cara menghitung varian untuk data yang telah dikelompokkan, dibuat Tabel
berikut.
22
Menghitung arameter statistika dengan SPSS
Untuk menghitung rata-rata hitung, varian atau standar deviasi, median dan
lainnya dapat menggunakan program SPSS, sperti pada Output SPSS11 berikut.
Program SPSS11
Input : Data 3.1.
Anayze - Descriptive Statistics – Descriptives

Output :
Descriptive Statistics
N Minimum Maximum Sum Mean Std. Deviation Variance
SUHU 31 27.90 31.40 903.20 29.1355 .83926 .704
Valid N 31
(listwise)
Anayze - Descriptive Statistics – Explore

Descriptives
Statistic Std. Error
SUHU Mean 29.1355 .15074
95% Confidence Lower Bound 28.8276
Interval for Mean
Upper Bound 29.4433
5% Trimmed Mean 29.0823
Median 29.1000
Variance .704
Std. Deviation .83926
Minimum 27.90
Maximum 31.40
Range 3.50
Interquartile 1.0000
Range
Skewness .928 .421
Kurtosis .690 .821
3.2. Penyajian data secara grafik

Setelah data sampel diperoleh, selanjutnya dapat disajikan deskripsi data
dalam bentuk tabel dan grafik. Prinsip dasar dalam membuat tabel maupun
23
grafik adalah membuat deskripsi data dalam bentuk yang menarik, mudah
untuk dimengerti, dan menggambarkan distribusi pola data yang sebenarnya.
Berikut akan diberikan penyajian data dalam bentuk distribusi frekuensi
berupa kurva frekuensi. Distribusi frekuensi merupakan penyebaran data yang
diatur berdasarkan frekuensi ke dalam kelompok kelas-kelas berurutan.
Frekuensi adalah jumlah pemunculan data yang sama atau dalam satu
kelompok kelas. Kurva frekuensi ini dapat digunakan untuk estimasi fungsi
distribusi probabilita pemunculan data sebenarnya (populasi).
Cara membuat distribusi frekuensi :

1. Menentukan jumlah kelas :
Langkah pertama dalam membuat distribusi frekuensi, data sampel dibagi
menjadi beberapa kelas (range) data dalam bentuk interval yang disebut
interval kelas. Jumlah interval kelas tergantung pada banyaknya observasi
dan dispersi data. Banyaknya interval kelas ditentukan sedemikian sehingga
kurva frekuensi yang dibentuk dapat menggambarkan kurva distribusi
sebenarnya. Penentuan banyaknya kelas dapat ditentukan dengan rumus :
k = 1 + 3,322 log(n)
dimana k adalah jumlah kelas, dan n adalah jumlah observasi (ukuran
sampel). Beberapa pertimbangan harus digunakan dalam pemilihan jumlah
interval kelas, agar memberikan pola distribusi yang signifikan.
2. Menentukan interval kelas (panjang kelas) :

Setelah banyaknya kelas ditentukan, selanjutnya menentukan interval kelas
atau panjang kelas. Interval kelas dapat ditentukan dengan cara :
Interval kelas = (B - R) / k
B = nilai data terbesar (maksimum).
R = nilai data terrendah (minimum).
k = jumlah kelas
Batas kelas terendah dan tertinggi tidak mutlak harus menggunakan nilai
data terendah dan tebesar. Batas kelas tersebut dapat disesuaikan, dengan
syarat bahwa batas kelas terendah harus memuat data terkecil, dan batas
kelas tertinggi harus memuat data terbesar.
3. Menentukan batas setiap kelas kelas :
24
Setelah batas interval terendah dan tertinggi ditentukan, selanjutnya
membuat batas pada setiap kelas, yang berfungsi sebagai pembatas kelas
untuk memisahkan dua kelas yang berdampingan. Batas kelas terendah
merupakan batas terendah dari kelas pertama, dan batas kelas tertinggi
merupakan batas kelas tertinggi. Batas kelas terendah (tidak harus nilai data
terkecil) harus memuat nilai data terkecil pada kelas pertama, dan batas kelas
tertinggi (tidak harus nilai data terbesar) harus memuat nilai data terbesar
pada kelas terakhir.
4. Memasukan data-data kedalam kelas :

Setelah setiap interval kelas ditentukan, langkah selanjutnya adalah
memasukan semua data kedalam kelas-kelas sesuai dengan nilai atau ukuran
data. Setiap data harus masuk dalam satu kelas, tidak boleh ada data yang
masuk kedalam dua kelas.
Contoh 3.11. (data kontinyu).

Meneruskan Contoh 3.1., diberikan data rata-rata suhu udara di Kota Semarang
per-hari pada Oktober 2002, seperti pada Data 3.1.
Dari data pada Data 3.1 diperoleh :

Jumlah kelas k = 1 + 3,322 log (31) = 1 + 3,322 x 1.49 = 5,81  6
Ukuan data terkecil = 27,9 dan ukuran data terbesar = 31,4
Tanpa mengubah jumlah kelas, batas batas kelas terkecil digeser kekiri menjadi
27,5 dan batas kelas terbesar digeser kekanan menjadi 32,0. Penggambaran
histogram dan kurva histogram dapat menggunakan SPSS, yang hasilnya
diberikan pada Gambar 3.1.
12
10
Histogram
8
6
Kurva distribusi
4 frekuensi
f
2
0
27.88 28.63 29.38 30.13 30.88 31.63
SUHU
25
Gambar 3.1. Histogram dan kurva distribusi frekuensi
rata-rata suhu udara Bulan Oktober 2002
Contoh 3.12. (data diskrit)

Diberikan data jumlah kunjungan kapal di Dermaga Nusantara tahun 1990,
sebagai berikut.
Data 3.6. Jumlah kunjungan kapal di Dermaga Nusantara tahun 1990

Bulan Sampel (dalam hari)
1 2 3 4 5
Januari 3 2 4 3 2
Pebruari 3 3 3 4 2
Maret 0 4 1 3 1
April 2 2 5 1 1
Mei 4 0 8 2 1
Juni 1 2 3 2 2
Juli 3 3 2 4 1
Agustus 3 6 4 0 2
September 2 1 3 3 6
Oktober 5 3 2 2 4
Nopember 1 5 7 1 3
Desember 3 4 0 2 3
Jumlah 160
Dari data pada Contoh 3.12. dengan jumlah data n = 60, diperoeh :
Jumlah kelas k = 1 + 3,322 log (601) = 1 + 3,322 x 1.778 = 6,907  7
Ukuan data terkecil = 0 dan ukuran data terbesar = 8
Karena data disktrit, dengan data terkecil 0 dan terbesar 8, maka jumlah kelas
dapat disesuaikan dengan batas-batas kelas tersebut, sehingga diambil jumlah
kelas diambil sebesar 9. Selanjutnya diambil batas kelas terkecil –0,5 dan batas
kelas terbesar 8,5, yaitu untuk membuat nilai telah kelas pada setiap kelas
berupa bilangan bulat, dari yang terecil 0 sampai terbesar 8. Dengan SPSS,
histogram diberikan pada Gambar 3.2.
26
20
Histogram
10
0
0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0
KAPAL
Gambar 3.2. Histogram frekuensi jumlah kedatangan kapal
27

Bab 3 Stat Deskriptif

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Bab 3 Stat Deskriptif

Diunggah oleh

Hak Cipta:

Format Tersedia

BAB 3

Pengukuran kecenderungan pusat

Rata-rata tertimbang (wigthtd arithmetic mean)

Rata-rata hitung untuk data yang telah dikelompokkan (grouped data)

Rata-rata hitung dari beberapa sampel

Rata-rata hitung suhu di Kota Semarang pada bulan Oktober adalah :

3.2. Pengukuran dispersi

dimana X adalah rata-rata hitung. Varian dengan rumus (3.1) dapat

= (1/31) ((28,4 – 29,14) 2 + (30,5 – 29,14) 2 … + (28,5 – 29,14) 2

Varian dari data yang telah dikelompokkan.

Anayze - Descriptive Statistics – Descriptives

Anayze - Descriptive Statistics – Explore

3.2. Penyajian data secara grafik

Cara membuat distribusi frekuensi :

2. Menentukan interval kelas (panjang kelas) :

3. Menentukan batas setiap kelas kelas :

4. Memasukan data-data kedalam kelas :

Contoh 3.11. (data kontinyu).

Dari data pada Data 3.1 diperoleh :

Contoh 3.12. (data diskrit)

Data 3.6. Jumlah kunjungan kapal di Dermaga Nusantara tahun 1990

Gambar 3.2. Histogram frekuensi jumlah kedatangan kapal

Anda mungkin juga menyukai