Anda di halaman 1dari 12

BAB V

UKURAN DISPERSI/PENYIMPANGAN

Tujuan Umum

Pada bab ini akan dibahas beberapa pengukuran yang menjelaskan dispersi atau
penyimpangan, keragaman (variability) atau penyebaran (spread) data.
Ukuran dispersi yang akan dibahas adalah jarak atau rentang (range), rata-rata
simpangan , varians (variance), simpangan baku (standar deviasi), rentang antar kuartil,
simpangan kuartil (quartile deviation), angka baku, koefisien variasi.

Tujuan Khusus
Setelah mempelajari bab ini, mahasiswa diharapkan mampu :
 menghitung berbagai ukuran dispersi untuk data mentah,
 menghitung berbagai ukuran dispersi untuk data yang disusun dalam suatu tabel
distribusi frekuensi,
 menjelaskan karakteristik, kegunanaan, keuntungan dan kerugian dari setiap ukuran
dispersi,
 menghitung dan menjelaskan kegunaan koefisien variasi dan angka baku.

5. 1 Dispersi/Penyimpangan
Suatu ukuran rata-rata, baik itu rata-rata hitung, maupun median hanya dapat
menunjukkan titik tengah data yang memberikan informasi pemusatan data tetapi tidak
memberikan informasi mengenai penyebaran data.
Jika ukuran dispersi bernilai kecil, maka data mengumpul pada suatu kelompok (cluster)
atau data berada di sekitar rata-rata hitungnya. Ini berarti rata-rata hitung sangat baik mewakili
data. Sebaliknya jika ukuran dispersi bernilai besar, maka rata-rata hitung tidak dapat
diandalkan. Atau dapat dikatakan bahwa rata-rata hitung tidak mewakili data.
Pengukuran dispersi dapat digunakan untuk mengevaluasi keterandalan (reliability) dua
rata-rata atau lebih.

Statistika Bisnis untuk Program Studi Administrasi Bisnis 5-1


5. 2 Ukuran Dispersi untuk Data yang Tidak Terkelompok
Beberapa ukuran dispersi yang digunakan dalam mengolah data mentah :
a. jarak (Range),
b. simpangan rata-rata,
c. varians dan deviasi standar (simpangan baku),
d. variansi sampel,
e. deviasi standar (simpangan-baku) sampel.

5.2.1 Jarak (Range)


Ukuran dispersi yang paling mudah dan sederhana untuk menghitung dan menginter-
pretasikan data adalah jarak (range).
Jarak = nilai terbesar – nilai terkecil

5.2.2 Simpangan Rata-rata


Kelemahan dari ukuran dispersi jarak (range) adalah hanya didasarkan pada dua hal,
yaitu nilai terbesar dan nilai terkecil, jadi tidak memperhatikan nilai-nilai lain dalam data.
Sedangkan deviasi rata-rata mengukur besarnya variasi setiap nilai dalam populasi atau sampel
dari rata-rata hitungnya.

Deviasi rata-rata adalah rata-rata hitung nilai absolut deviasi dari rata-rata hitungnya.

Deviasi rata-rata dirumuskan sebagai berikut


 ! X i - X!
SR 
n
dimana : SR : Mean deviation /deviasi rata-rata
Xi : nilai setiap pengamatan
X : rata-rata hitung tiap pengamatan
n : banyaknya pengamatan dalam suatu sampel
Contoh :

Hasil ujian mata pelajaran Statistik yang diikuti oleh 10 siswa diperoleh sebagai berikut

65 , 95 , 88 , 54 , 38 , 77 , 68 , 61 , 70 , 92

Tentukan !

a. Nilai rata-rata hitung


b. Berapa deviasi rata-rata
c. Berikan komentar dari hasil (b)

Statistika Bisnis untuk Program Studi Administrasi Bisnis 5-2


Jawab :

Deviasi rata-rata mempunyai keunggulan yakni perhitungan deviasi rata-rata


menggunakan setiap nilai suatu kelompok data dalam pengolahannya.

Kelemahan dari deviasi rata-rata adalah adanya nilai absolut yang sulit dijelaskan,
sehingga deviasi rata-rata jarang digunakan dalam ukuran dispersi dibandingkan deviasi
standar.

5.2.3 Varians dan Deviasi Standar (Simpangan Baku)


Varians dan Deviasi Standar didasarkan pada deviasi setiap pengamatan terhadap rata-
rata hitungnya.

Varians adalah deviasi kuadrat setiap pengamatan terhadap rata-rata hitungnya.

Deviasi Standar adalah akar kuadrat positif dari varians

Rumus untuk Varians popilasi dan varians sampel agak berbeda. Rumus varians populasi
untuk data yang tidak dikelompokkan (tidak ditabulasikan ke dalam distribusi frekuensi)
adalah sebagai berikut :

( X i   ) 2
2 
N

dengan :
2: simbol varians populasi ( dibaca teta)
Xi : nilai setiap pengamatan
 : rata-rata hitung populasi
N : jumlah total pengamatan
Untuk menentukan varians populasi terutama digunakan untuk memperlihatkan bahwa
varians didasarkan pada deviasi kuadrat rata-rata hitung populasi. Rumus deviasi standar untuk
data yang berukuran besar digunakan nilai aktualnya adalah sebagai berikut :

 Xi
2
 Xi 2
 
2
( )
N N
Selain Jarak dan Deviasi rata-rata, maka Varians dapat juga digunakan untuk mem-
bandingkan dispersi dua kelompok pengamatan atau lebih. Jarak adalah perbedaan data yang
terbesar dengan data yang terkecil dari suatu kelompok data, sedangkan deviasi rata-rata
adalah rata-rata hitung deviasi setiap pengamatan terhadap rata-rata hitungnya.

Statistika Bisnis untuk Program Studi Administrasi Bisnis 5-3


Deviasi standar mempunyai satuan yang sama dengan data asal. Akar kuadrat dari
varians disebut Deviasi Standar Populasi. Ukuran jarak dan Deviasi rata-rata mudah
diinterpretasikan.
Jarak adalah perbedaan antara nilai terbesar dan nilai terkecil dari suatu kelompok data,
sedangkan deviasi rata-rata adalah rata-rata hitung deviasi setiap pengamatan terhadap rata-rata
hitungnya. Namun varians sulit diinterpretasikan, tetapi kita dapat menentukan akar kuadrat
dari varians tersebut sebagai nilai Deviasi Standar populasi yang rumusnya digunakan untuk
data yang tidak dikelompokan adalah sebagai berikut
X2 X 2
2= ( )
N N
atau dapat juga dinyatakan dengan rumus berikut

( X   ) 2
  2

5.2.4 Variansi Sampel

Rumus rata-rata hitung sampel dan rata-rata hitung populasi adalah



 Xi  Xi
X  dan 
n N
Jadi, hanya mengganti n dengan N.
Tidak demikian halnya denagn varians sampel. Adapun rumus untuk varians sampel
dari data yang tidak dikelompokkan adalah sebagai berikut

( X i  X)
s2 
n 1
rumus ini digunakan sebagai estimator variansi populasi, dimana :
s2 : simbol varians sampel
Xi : Nilai pengamatan suatu sampel
X : rata-rata hitung sampel
n : total banyaknya pengamatan suatu sampel
atau dapat ditulis dalam rumus sebagai berikut :

x
2

x ( 2
)
s 
2 n
n 1

Statistika Bisnis untuk Program Studi Administrasi Bisnis 5-4


Contoh :
Diketahui data suatu sampel adalah sebagai berikut : 4, 2, 5, 4, 5, 2
Tentukan berapa varians sampelnya dengan 2 cara !

Jawab :
Cara 1 :

Xi Xi - X (Xi- X )2
4 0,3 0,09
2 -1,7 2,89
5 1,3 1,69
4 0,3 0,09
5 1,3 1,69
2 -1,7 2,89

Jadi, s2 = 1,868

Cara 2 :
Xi Xi2
4 16
2 4
5 25
4 16
5 25
2 4

Jadi, s2= (90 –(22/6))/5=1,868

5.2.5 Deviasi Standar (simpangan-baku) Sampel


Deviasi Standar sampel digunakan sebagai estimator deviasi standar populasi. Deviasi
standar sampel adalah akar kuadrat variansi sampel . Rumus Deviasi standar sampel untuk
data yang tidak dikelompokan adalah sebagai berikut :
 
2
s
( X i  X) atau s
( X i  X )2
n 1 n

Statistika Bisnis untuk Program Studi Administrasi Bisnis 5-5


5.3 Unsur-unsur Dispersi untuk data yang dikelompokan dalam Distribusi Frekuensi
Unsur-unsur Dispersi untuk data yang dikelompokan dalam Distribusi Frekuensi terdiri
atas rentang (range), dan deviasi standar.

5.3.1 Rentang (Range)


Jarak didefinisikan sebagai perbedaan nilai terbesar dan nilai terkecil. Untuk menentukan
jarak dari data distribusi frekuensi adalah dengan menentukan batas atas dari kelas terbesar
dikurangi batas bawah kelas terkecil.
Contoh :
Jarak tempuh (mil) Banyak ban
25.000 - 30.000 16
31.000 - 35.000 45
36.000 - 40.000 21

Jarak = 40.000 – 25.000 = 15.000

5.3.2 Deviasi Standar


Untuk data yang dikelompokan dalam Distribusi Frekuensi, maka rumus Deviasi Standar
sampel dirumuskan :

 f i .X i 2
 f i .X i  (
2
)
s n
n 1

Jadi, rumus deviasi standar untuk data yang dikelompokan didefinisikan dengan hanya
mengganti nilai X pada rumus Deviasi Standar untuk data yang tidak dikelompokan
(ungroup) dengan fi.Xi dan X2i dengan fi.X2i .
Dimana :
S : simbol deviasi standar sampel
Xi : titik tengah kelas
fi : frekuensi kelas
n : jumlah total pengamatan sampel
Deviasi Standar untuk data yang dikelompokan digunakan untuk membandingkan
penyebaran 2 kelompok pengamatan atau lebih. Sebagai contoh deviasi standar dari dana
yang diinvestasikan per bulan di 2 wilayah daerah ( utara dan selatan ), masing-masing adalah
7,51 dan 10,47. Dari kedua nilai tersebut dapat dilihat bahwa jumlah dana yang diinvestasikan

Statistika Bisnis untuk Program Studi Administrasi Bisnis 5-6


di wilayah utara tidak terlalu menyebar dibandingkan dengan wilayah selatan , karena 7,51 <
10,47, sedangkan di wilayah utara dana yang diinvestasikan mengelompok di sekitar rata-rata
hitungnya.
Hukum empirik atau disebut juga hukum Normal menyatakan bahwa untuk distribusi
simetrik dengan distribusi frekuensi berbentuk lonceng diperkirakan :
68 % pengamatan data terletak dalam X   ( rata-rata hitung  satu kali deviasi standar).
95% pengamatan data terletak dalam X  2 (rata-rata hitung  dua kali deviasi standar).
99,7% pengamatan data terletak dalam X  3 (rata-rata hitung  tiga kali deviasi standar).
Secara grafis ditunjukkan sebagai berikut :

Contoh :
Suatu sampel pengeluaran untuk suatu keperluan makanan per bulan dari suatu keluarga
di suatu daerah mendekati distribusi simetrik dan berbentuk lonceng. Nilai rata-rata hitung
sampel adalah Rp 3.500.000,00 dan nilai simpangan baku (deviasi standar) adalah Rp
700.000,00. Dengan menggunakan hukum empirik :
a. sekitar 68% pengeluaran untuk makanan per bulan berada diantara kedua nilai
tersebut berapa ?
b. sekitar 95% pengeluaran untuk makanan per bulan berada diantara kedua nilai
tersebut berapa ?
c. hampir semua pengeluaran untuk makanan per bulan berada diantara kedua nilai
tersebut berapa ?
Jawab :
a. 3.500.000  700.000
diantara 2.800.000 dan 4.200.000
b. 3.500.000  2(700.000)
diantara 2.100.000 dan 4.900.000
c. 3.500.000  3(700.000)
diantara 1.400.000 dan 5.600.000

Statistika Bisnis untuk Program Studi Administrasi Bisnis 5-7


5.4 Ukuran Dispersi lainnnya
Beberapa ukuran dispersi lainnya adalah
1. Rentang antar kuartil,
2. Simpangan kuartil,
3. Persentil,
4. Koefisien variasi,
5. Kemenjuluran ( Skewness).

5.4.1 Rentang Antar Kuartil


Rentang antar kuartil adalah beda antara kuartil ketiga dengan kuartil pertama.
Definisi rentang antar kuartil adalah kuartil ketiga dikurangi kuartil pertama atau di
rumuskan sebagai berikut :

Jarak Inter Kuartil = K3 – K1

Jika nilai median memisahkan 50% pengamatan yang berada di atas dengan 50%
pengamatan yang berada di bawah. Maka Kuartil pertama (K1) menyatakan 25% pengamatan
berada di bawah K1. Kuartil ketiga (K3) menyatakan 25% pengamatan berada di atas K3. Jadi
dalam hal ini dapat dikatakan bahwa terdapat 25% observasi berada di bawah K1 dan sekitar
75% observasi berada di bawah K3. Sehingga ukuran (K3–K1) atau jarak Interkuartil
memeberikan penyebaran data kuartil ketiga dengan kuartil pertama.

Rumus untuk K1 :

n
F
K 1  Bb  p ( 4 ).
f
dimana :
Bb : tepi batas bawah kelas dimana kuartil pertama berada.
n : jumlah total (frekuensi)
F : frekuensi kumulatif sebelum kelas kuartil
f : frekuensi kelas kuartil
p : panjang kelas

Statistika Bisnis untuk Program Studi Administrasi Bisnis 5-8


Rumus untuk K3 :

3n
F
K 3  Bb  p( 4 ).
f
Contoh :
- Jika diketahui K3 = Rp 125.000,00 maka interpretasinya adalah bahwa 25%
pengamatan lebih besar dari Rp 125.000,00 dan 75% akan lebih kecil dari Rp Rp
125.000,00.
- Jika diketahui nilai K1= Rp 125.000,00 maka K3-K1= 25.000 memberikan interpretasi
bahwa setengah dari data terletak diantara Rp 100.000,00 dan Rp 125.000,00 dengan
perbedaan jarak kedua kuartil Rp 25.000,00. Jarak Inter Kuartil dapat juga digunakan
untuk membandingkan penyebaran diantara 2 distribusi atau lebih.

5.4.2 Simpangan Kuartil


Simpangan kuartil adalah setengah jarak anatara kuartil ketiga (K3) dan kuartil kesatu
(K1) . Rumus simpangan kuartil (deviasi kuartil) adalah sebagai berikut

K 3  K1
SK 
2
Untuk menduga kuartil pertama dan kuartil ketiga dapat digunakan dari poligon
frekuensi kumulatif.

5.4.3 Persentil
Dalam Statistika terdapat 3 kuartil yaitu K1,K2 dan K3. Ketiganya membagi Distribusi
kedalam 4 bagian. Sedangkan persentil 99 membagi distribusi kedalam 100 bagian. Jarak
persentil 20 sampai 90 merupakan beda persentil ke-20 dan ke-90. P10 menyatakan persentil
ke –10. Rumus persentil secara umum adalah sebagai berikut (jika i=1,2 ... 99)
i
nF
Pi  Bb  p( 100
)
f
Jika diketahui P10=40,9 dan P90=60,6. Jarak persentil adalah perbedaan jarak ke-90 dan
ke-10 nilainya adalah 19,7 . Interpretasinya adalah kira-kira 80% data berada diantara nilai
40,9 dan 60,6 atau secara total 20% pengamatan berada di bawah 40,9 atau di atas 60,6.

Statistika Bisnis untuk Program Studi Administrasi Bisnis 5-9


5.4.4 Koefisien Variasi
Koefisien variasi (KV) digunakan untuk melihat keseragaman/kemerataan/keuniforman/
kestabilan data. Koefisien variasi makin kecil berarti data makin stabil/merata/seragam.
Definisi koefisien variasi adalah rasio deviasi standar terhadap rata-rata hitung yang
dinyatakan dalam persentase.
s
KV  
(100%)
X
5.4.5 Kemenjuluran ( Skewness)
Karakteristik lain yang dapat diukur dari suatu kelompok pengamatan adalah
kemenjuluran (Skewness). Untuk distribusi frekuensi yang bersifat simetrik, maka
kemenjulurannya bernilai nol.
Jika satu pengamatan atau lebih mempunyai nilai rata-rata hitung distribusi lebih besar
dari median dan modus, maka distribusi tersebut dikatakan menjulur positif. Sebaliknya jika
satu pengamatan atau lebih mempunyai nilai rata-rata hitung lebih kecil dibandingkan ukuran
pemusatan lainnya, maka distribusi demikian dikatakan menjulur negatif.

Bentuk Poligon Frekuensi (Simetrik)

Rata-rata
Median
Modus

Bentuk Poligon Frekuensi menjulur positif

MoMe X

Statistika Bisnis untuk Program Studi Administrasi Bisnis 5 - 10


Bentuk Poligon Frekuensi menjulur negatif

X Me Mo
Karl Pearson mengembangkan suatu ukuran yang menjelaskan koefisien kemenjuluran
(Sk). Rumusnya dinyatakan sebagai berikut

3(rata  ratahitung  median)


Sk 
deviasi standar

Koefisien kemenjuluran nilainya berkisar antara –3 dan 3.


Contoh :
Suatu sampel yang terdiri dari mahasiswa jurusan Administrasi Bisnis menunjukkan
bahwa rata-rata hitung kecepatan pengetikan pada mata kuliah pengetikan adalah 87 kata
per menit dan mediannya adalah 73 kata per menit. Deviasi standarnya adalah 16,9 kata
per menit. Berapa koefisien skewnessnya (Sk) ?
Jawab :
3(87  73)
Sk   2,49
16,9

Kesimpulan : Dari hasil perhitungan di atas diperoleh bahwa distribusi kecepatan


mengetik mahasiswa cenderung menjulur positif. Terdapat mahasiswa
yang mengetik sangat cepat dan menyebabkan rata-rata hitung lebih
besar dari median atau modus.

5.5 Latihan Soal


1. Ada tiga calon masing-masing datang dari tiga sekolah tingkat akhir yang berbeda.
Disekolahnya masing-masing calon A mendapat nilai Matematika 83 sedangkan rata-
rata kelasnya 62 dan simpangan baku 16. Calon B mendapat nilai 97 dengan rata-rata
kelas 83 dan simpangan baku 23, sedangkan calon C mendapat nilai 87 dengan rata-rata
kelas 65 dan simpangan baku 14. Salah satu calon ini dipilih berdasarkan sistem
dengan rata-rata 500 dan simpangan baku 100, calon mana sebaiknya yang didahulukan
diterima.

Statistika Bisnis untuk Program Studi Administrasi Bisnis 5 - 11


2. Di bawah ini disajikan data mengenai gaji karyawan per bulan pada dua perusahaan di
kota Bandung, yaitu:

Gaji/bulan Banyak Karyawan Banyak Karyawan


(ratusan ribu rupiah) Perusahaan A Perusahaan B

10 - 19 15 25
20 – 29 20 20
30 – 39 20 20
40 - 49 15 30
50 - 59 14 15
60 – 69 10 10
70 – 79 6 5
Jumlah 100 125

Pertanyaan:
a) Hitunglah rata-rata hitung gaji karyawan per bulan perusahaan A dan perusahaan B!
b) Hitung simpangan baku gaji karyawan masing-masing perusahaan tersebut!
c) Carilah rentang antar kuartil gaji karyawan perusahaan A!
d) Dari kedua perusahaan tersebut, perusahaan manakah yang gajinya lebih merata?

Statistika Bisnis untuk Program Studi Administrasi Bisnis 5 - 12

Anda mungkin juga menyukai