UKURAN DISPERSI/PENYIMPANGAN
Tujuan Umum
Pada bab ini akan dibahas beberapa pengukuran yang menjelaskan dispersi atau
penyimpangan, keragaman (variability) atau penyebaran (spread) data.
Ukuran dispersi yang akan dibahas adalah jarak atau rentang (range), rata-rata
simpangan , varians (variance), simpangan baku (standar deviasi), rentang antar kuartil,
simpangan kuartil (quartile deviation), angka baku, koefisien variasi.
Tujuan Khusus
Setelah mempelajari bab ini, mahasiswa diharapkan mampu :
menghitung berbagai ukuran dispersi untuk data mentah,
menghitung berbagai ukuran dispersi untuk data yang disusun dalam suatu tabel
distribusi frekuensi,
menjelaskan karakteristik, kegunanaan, keuntungan dan kerugian dari setiap ukuran
dispersi,
menghitung dan menjelaskan kegunaan koefisien variasi dan angka baku.
5. 1 Dispersi/Penyimpangan
Suatu ukuran rata-rata, baik itu rata-rata hitung, maupun median hanya dapat
menunjukkan titik tengah data yang memberikan informasi pemusatan data tetapi tidak
memberikan informasi mengenai penyebaran data.
Jika ukuran dispersi bernilai kecil, maka data mengumpul pada suatu kelompok (cluster)
atau data berada di sekitar rata-rata hitungnya. Ini berarti rata-rata hitung sangat baik mewakili
data. Sebaliknya jika ukuran dispersi bernilai besar, maka rata-rata hitung tidak dapat
diandalkan. Atau dapat dikatakan bahwa rata-rata hitung tidak mewakili data.
Pengukuran dispersi dapat digunakan untuk mengevaluasi keterandalan (reliability) dua
rata-rata atau lebih.
Deviasi rata-rata adalah rata-rata hitung nilai absolut deviasi dari rata-rata hitungnya.
Hasil ujian mata pelajaran Statistik yang diikuti oleh 10 siswa diperoleh sebagai berikut
65 , 95 , 88 , 54 , 38 , 77 , 68 , 61 , 70 , 92
Tentukan !
Kelemahan dari deviasi rata-rata adalah adanya nilai absolut yang sulit dijelaskan,
sehingga deviasi rata-rata jarang digunakan dalam ukuran dispersi dibandingkan deviasi
standar.
Rumus untuk Varians popilasi dan varians sampel agak berbeda. Rumus varians populasi
untuk data yang tidak dikelompokkan (tidak ditabulasikan ke dalam distribusi frekuensi)
adalah sebagai berikut :
( X i ) 2
2
N
dengan :
2: simbol varians populasi ( dibaca teta)
Xi : nilai setiap pengamatan
: rata-rata hitung populasi
N : jumlah total pengamatan
Untuk menentukan varians populasi terutama digunakan untuk memperlihatkan bahwa
varians didasarkan pada deviasi kuadrat rata-rata hitung populasi. Rumus deviasi standar untuk
data yang berukuran besar digunakan nilai aktualnya adalah sebagai berikut :
Xi
2
Xi 2
2
( )
N N
Selain Jarak dan Deviasi rata-rata, maka Varians dapat juga digunakan untuk mem-
bandingkan dispersi dua kelompok pengamatan atau lebih. Jarak adalah perbedaan data yang
terbesar dengan data yang terkecil dari suatu kelompok data, sedangkan deviasi rata-rata
adalah rata-rata hitung deviasi setiap pengamatan terhadap rata-rata hitungnya.
( X ) 2
2
x
2
x ( 2
)
s
2 n
n 1
Jawab :
Cara 1 :
Xi Xi - X (Xi- X )2
4 0,3 0,09
2 -1,7 2,89
5 1,3 1,69
4 0,3 0,09
5 1,3 1,69
2 -1,7 2,89
Jadi, s2 = 1,868
Cara 2 :
Xi Xi2
4 16
2 4
5 25
4 16
5 25
2 4
f i .X i 2
f i .X i (
2
)
s n
n 1
Jadi, rumus deviasi standar untuk data yang dikelompokan didefinisikan dengan hanya
mengganti nilai X pada rumus Deviasi Standar untuk data yang tidak dikelompokan
(ungroup) dengan fi.Xi dan X2i dengan fi.X2i .
Dimana :
S : simbol deviasi standar sampel
Xi : titik tengah kelas
fi : frekuensi kelas
n : jumlah total pengamatan sampel
Deviasi Standar untuk data yang dikelompokan digunakan untuk membandingkan
penyebaran 2 kelompok pengamatan atau lebih. Sebagai contoh deviasi standar dari dana
yang diinvestasikan per bulan di 2 wilayah daerah ( utara dan selatan ), masing-masing adalah
7,51 dan 10,47. Dari kedua nilai tersebut dapat dilihat bahwa jumlah dana yang diinvestasikan
Contoh :
Suatu sampel pengeluaran untuk suatu keperluan makanan per bulan dari suatu keluarga
di suatu daerah mendekati distribusi simetrik dan berbentuk lonceng. Nilai rata-rata hitung
sampel adalah Rp 3.500.000,00 dan nilai simpangan baku (deviasi standar) adalah Rp
700.000,00. Dengan menggunakan hukum empirik :
a. sekitar 68% pengeluaran untuk makanan per bulan berada diantara kedua nilai
tersebut berapa ?
b. sekitar 95% pengeluaran untuk makanan per bulan berada diantara kedua nilai
tersebut berapa ?
c. hampir semua pengeluaran untuk makanan per bulan berada diantara kedua nilai
tersebut berapa ?
Jawab :
a. 3.500.000 700.000
diantara 2.800.000 dan 4.200.000
b. 3.500.000 2(700.000)
diantara 2.100.000 dan 4.900.000
c. 3.500.000 3(700.000)
diantara 1.400.000 dan 5.600.000
Jika nilai median memisahkan 50% pengamatan yang berada di atas dengan 50%
pengamatan yang berada di bawah. Maka Kuartil pertama (K1) menyatakan 25% pengamatan
berada di bawah K1. Kuartil ketiga (K3) menyatakan 25% pengamatan berada di atas K3. Jadi
dalam hal ini dapat dikatakan bahwa terdapat 25% observasi berada di bawah K1 dan sekitar
75% observasi berada di bawah K3. Sehingga ukuran (K3–K1) atau jarak Interkuartil
memeberikan penyebaran data kuartil ketiga dengan kuartil pertama.
Rumus untuk K1 :
n
F
K 1 Bb p ( 4 ).
f
dimana :
Bb : tepi batas bawah kelas dimana kuartil pertama berada.
n : jumlah total (frekuensi)
F : frekuensi kumulatif sebelum kelas kuartil
f : frekuensi kelas kuartil
p : panjang kelas
3n
F
K 3 Bb p( 4 ).
f
Contoh :
- Jika diketahui K3 = Rp 125.000,00 maka interpretasinya adalah bahwa 25%
pengamatan lebih besar dari Rp 125.000,00 dan 75% akan lebih kecil dari Rp Rp
125.000,00.
- Jika diketahui nilai K1= Rp 125.000,00 maka K3-K1= 25.000 memberikan interpretasi
bahwa setengah dari data terletak diantara Rp 100.000,00 dan Rp 125.000,00 dengan
perbedaan jarak kedua kuartil Rp 25.000,00. Jarak Inter Kuartil dapat juga digunakan
untuk membandingkan penyebaran diantara 2 distribusi atau lebih.
K 3 K1
SK
2
Untuk menduga kuartil pertama dan kuartil ketiga dapat digunakan dari poligon
frekuensi kumulatif.
5.4.3 Persentil
Dalam Statistika terdapat 3 kuartil yaitu K1,K2 dan K3. Ketiganya membagi Distribusi
kedalam 4 bagian. Sedangkan persentil 99 membagi distribusi kedalam 100 bagian. Jarak
persentil 20 sampai 90 merupakan beda persentil ke-20 dan ke-90. P10 menyatakan persentil
ke –10. Rumus persentil secara umum adalah sebagai berikut (jika i=1,2 ... 99)
i
nF
Pi Bb p( 100
)
f
Jika diketahui P10=40,9 dan P90=60,6. Jarak persentil adalah perbedaan jarak ke-90 dan
ke-10 nilainya adalah 19,7 . Interpretasinya adalah kira-kira 80% data berada diantara nilai
40,9 dan 60,6 atau secara total 20% pengamatan berada di bawah 40,9 atau di atas 60,6.
Rata-rata
Median
Modus
MoMe X
X Me Mo
Karl Pearson mengembangkan suatu ukuran yang menjelaskan koefisien kemenjuluran
(Sk). Rumusnya dinyatakan sebagai berikut
10 - 19 15 25
20 – 29 20 20
30 – 39 20 20
40 - 49 15 30
50 - 59 14 15
60 – 69 10 10
70 – 79 6 5
Jumlah 100 125
Pertanyaan:
a) Hitunglah rata-rata hitung gaji karyawan per bulan perusahaan A dan perusahaan B!
b) Hitung simpangan baku gaji karyawan masing-masing perusahaan tersebut!
c) Carilah rentang antar kuartil gaji karyawan perusahaan A!
d) Dari kedua perusahaan tersebut, perusahaan manakah yang gajinya lebih merata?