Anda di halaman 1dari 19

Bab 4.

UKURAN DISPERSI
Dr. Ir. SUGIYONO A.B., M.Kes.

Daftar Isi:
4.1 Range – rentang
4.2 Mean deviasi
4.3 Varian dan Standar Deviasi
4.4 Skewness dan Kurtosis
4.5 Box Plots
Dispersi (dispersion) atau sebaran juga disebut variasi (variation).
Dispersi adalah seberapa jauh suatu data numerik tersebar di sekitar nilai
rerata. Ukuran dispersi bermacam-macam antara lain rentang (range), nilai
tengah deviasi, rerata deviasi (mean deviation), simpangan baku, deviasi
standar (standard deviation). Ukuran dispersi merujuk pada ringkasan data
tentang variabilitas atau banyaknya fluktuasi di sekitar rerata. Jadi ukuran
dispersi adalah bilangan tunggal yang menggambarkan sekumpulan data
dengan menunjukkan seberapa menyebar data observasi tersebut di
sepanjang garis bilangan riil.

4.1 Range - rentang


Pengertian ukuran variabilitas atau dispersi dari sekumpulan data finit atau
terbatas adalah perbedaan antara nilai terbesar dan nilai terkecil dalam set
data tersebut. Perbedaan ini disebut range atau rentang, yang dapat dihitung
menggunakan rumus sebagai berikut.

Range = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛

Keterangan:
𝑥𝑚𝑎𝑥 : nilai data maksimum atau terbesar
𝑥𝑚𝑖𝑛 : nilai data minimun atau terkecil

Range adalah ukuran dispersi paling sederhana dan paling mudah


untuk menghitungnya. Kadang-kadang perlu digunakan midrange yaitu
range dibagi dua. Range dapat digunakan sebagai ukuran sebaran terutama
untuk sekumpulan data yang sedikit. Keunggulan utamanya adalah
sederhana penghitungannya, sehingga mudah dijelaskan kepada seseorang
yang kurang menyukai statistik.

2 Bab 4. Ukuran Dispersi


4.2 Mean deviasi
Salah satu pendekatan untuk memasukkan setiap observasi dalam
pengukuran dispersi adalah dengan mempertimbangkan seberapa jauh
setiap observasi 𝑥𝑖 dari titik referensi seperti 𝑥̅ . Perbedaan 𝑥𝑖 − 𝑥̅ , dapat
dihitung untuk setiap observasi, disebut sebagai deviasi dari mean, atau
terkadang hanya disebut deviasi saja. Semakin besar dispersi atau semakin
besar variabilitas dalam sekumpulan data, semakin besar pula nilai absolut
deviasi dari mean ini.
Untuk ukuran dispersi, ciri deviasi yang relevan dari mean adalah
nilai absolutnya, dengan mengabaikan tanda. Tanda memberi indikasi arah
dari deviasi (di bawah atau di atas mean) tetapi hanya ukuran deviasi yang
relevan dalam ukuran dispersi. Mean aritmatika dari nilai absolut deviasi
dari mean adalah ukuran dispersi yang disebut mean deviasi, diformulakan
sebagai berikut.
Mean deviasi sampel:

∑𝑛𝑖=1|𝑥𝑖 − 𝑥̅ |
MD =
𝑛

Keterangan:
MD : Mean deviasi
𝑥𝑖 : nilai observasi ke-i
𝑥̅ : mean aritmatika
𝑛 : banyaknya observasi dalam sampel

Mean deviasi populasi:

∑𝑁
𝑖=1|𝑥𝑖 − 𝜇|
MD =
𝑁

Keterangan:
MD : Mean deviasi
𝑥𝑖 : nilai observasi ke-i
𝜇 : mean populasi
𝑁 : banyaknya observasi dalam populasi

Bab 4. Ukuran Dispersi 3


Contoh 2.1
Sepuluh ruang kos mahasiswa pria dipilih secara random di kampus, dan
dicatat banyak poster yang terpajang di dalam ruangan, hasilnya berturut-
turut sebagai berikut: 8, 1, 7, 5, 1, 8, 2, 1, 2, 18. Mean deviasi dapat dihitung
menggunakan tabel pertolongan sebagai berikut.

Jml.poster Deviasi Absolut deviasi


𝑥𝑖 𝑥𝑖 − 𝑥̅ |𝑥𝑖 − 𝑥̅ |
8 2.7 2.7
1 -4.3 4.3
7 1.7 1.7
5 -0.3 0.3
1 -4.3 4.3
8 2.7 2.7
2 -3.3 3.3
1 -4.3 4.3
2 -3.3 3.3
18 12.7 12.7

∑ 𝑥𝑖 = 53 ∑ 𝑥𝑖 − 𝑥̅ = 0 ∑|𝑥𝑖 − 𝑥̅ | = 39.6

53 39.6
𝑥̅ = = 5.3 MD = = 3.96
10 10

Mean deviasi kira-kira 4,0. Ini memberitahu kita bahwa meskipun beberapa
ruangan berbeda dari mean, beberapa lebih dari 4 poster dan beberpa kurang
dari 4 poster.

4.3 Varian dan Standar Deviasi


Standar deviasi paling umum digunakan dalam statistik dan juga varian.
Seperti mean deviasi, pengukuran ini didasarkan pada nilai deviasi dari
mean, yang menunjukkan sejauh mana setiap observasi 𝑥𝑖 jauhnya dari
mean. Namun, standar deviasi dan varian dibedakan dari mean deviasi
dengan menggunakan deviasi kuadrat daripada nilai absolut untuk
menghilangkan tanda-tanda deviasi.

4 Bab 4. Ukuran Dispersi


Varian – variance
Tidak relevan dengan ukuran dispersi apakah di atas atau di bawah mean,
yang penting adalah seberapa jauh dari mean, bukan arahnya. Operasi ini
mempertahankan informasi penting yang terkandung dalam deviasi dimana
deviasi kuadrat tetap mencerminkan jarak data dari mean. Semakin besar
jarak antara observasi dan mean, semakin besar pula nilai deviasi
kuadratnya. selain itu observasi yang jaraknya sama dari mean diubah
menjadi deviasi kuadrat yang sama, misalnya deviasi -3 dan +3 bernilai 9
sebagai deviasi kuadrat. Jadi, deviasi kuadrat dapat menjadi dasar untuk
ukuran dispersi.
Varian populasi biasanya didefinisikan sebagai mean dari deviasi
kuadrat dari mean. Varian populasi diberi simbol 𝜎 2 (baca “sigma kuadrat”).
Oleh karena itu untuk banyaknya observasi populasi 𝑁 dari setiap observasi
𝑥𝑖 dengan mean 𝜇 diformulasikan sebagai berikut.

∑𝑁
𝑖=1(𝑥𝑖 − 𝜇)
2
𝜎2 =
𝑁

Dalam praktiknya, lebih sering dijumpai data sampel daripada data


populasi, dan data sampel memerlukan rumus yang sedikit berbeda. Varian
sampel dari 𝑛 observasi dilambangkan dengan simbol 𝑠 2 dan didefinisikan
sebagai berikut.

2
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝑠 =
𝑛−1

Perhatikan pembagi dalam rumus varian adalah 𝑛 − 1 bukan 𝑛. Alasan


penyesuaian ini terkait dengan penggunaan varian sampel 𝑠 2 dalam statistik
inferensial. Pembagian oleh 𝑛 dalam rumus varian sampel akan cenderung
rerata untuk mengabaikan varian populasi 𝜎 2 dengan faktor (𝑛 − 1)⁄𝑛,
memberikan estimasi bias dari 𝜎 2 . Jadi varian sampel didefinisikan dengan
suatu pembagi 𝑛 − 1, sehingga 𝑠 2 akan menjadi estimasi takbias dari 𝜎 2 .
(estimasi takbias suatu parameter adalah yang tidak meremehkan atau

Bab 4. Ukuran Dispersi 5


melebihkan parameter rerata, meskipun belum tentu pasti benar). Meskipun
demikian kita masih dapat menganggap varian sebagai semacam rata-rata
deviasi kuadrat.

Contoh 3.1
Melanjutkan contoh 2.1, kita hitung varian sampel dari jumlah poster yang
dipajang di 10 kamar tempat tinggal. Perhitungannya dapat diringkas
sebagai tabel sebagai berikut.
Jml.poster Deviasi Deviasi kuadrat
𝑥𝑖 𝑥𝑖 − 𝑥̅ (𝑥𝑖 − 𝑥̅ )2
8 2.7 7.29
1 -4.3 18.49
7 1.7 2.89
5 -0.3 0.09
1 -4.3 18.49
8 2.7 7.29
2 -3.3 10.89
1 -4.3 18.49
2 -3.3 10.89
18 12.7 161.29

∑ 𝑥𝑖 = 53 ∑ 𝑥𝑖 − 𝑥̅ = 0 ∑(𝑥𝑖 − 𝑥̅ )2 = 256.10

53 256.10
𝑥̅ = = 5.3 𝑠2 = = 28.46
10 10 − 1

Varian sampel 𝑠 2 = 28.46 tidak cocok untuk interpretasi karena merupakan


satuan kuadrat. Varian memberi tahu kita bahwa rata-rata deviasi kuadrat
adalah sekitar 28 untuk data tersebut, tetapi kita perlu menyatakan nilai ini
dalam bentuk yang berbeda untuk lebih memahami apa yang dikatakan
tentang data tersebut.
Varian memiliki banyak kegunaan dalam statistik inferensial.
Namun, kegunaannya dalam statistik deskriptif dibatasi oleh kenyataan
bahwa nilainya tidak dalam satuan yang sama dengan observasi itu sendiri,

6 Bab 4. Ukuran Dispersi


melainkan dalam satuan kuadrat. Ukuran dispersi yang lebih mudah
diinterpretasikan adalah standar deviasi.

Standar deviasi – standard deviation


Standar deviasi adalah nilai numerik dalam satuan nilai observasi yang
mengukur kecenderungan penyebaran data. Standar deviasi yang besar
menunjukkan variabilitas data yang lebih besar daripada standar deviasi
yang kecil. Standar deviasi dapat diformulasikan sebagai berikut.

∑𝑛 (𝑥𝑖 − 𝑥̅ )2
𝑠 = √ 𝑖=1
𝑛−1

Keterangan:
𝑠 : standar deviasi sampel
𝑥𝑖 : nilai observasi
𝑥̅ : mean, rerata
𝑛 : banyaknya observasi

Tabel : Analisis Standar Deviasi


𝑥𝑖 𝑥𝑖 − 𝑥̅ (𝑥𝑖 − 𝑥̅ )2
3.2 +0.2 0.04
2.9 -0.1 0.01
3.0 0.00 0.00
2.9 -0.1 0.01
3.1 +0.1 0.01
2.9 -0.1 0.01
𝑥̅ = 3.0 Σ=0 Σ = 0.08

Tabel tersebut di atas akan digunakan untuk menjelaskan konsep standar


deviasi. Kolom pertama (𝑥𝑖 ) memberikan 6 nilai observasi dalam satuan
kilogram, dan dari nilai-nilai ini diperoleh rerata 𝑥̅ = 3.0. Kolom yang
kedua 𝑥𝑖 − 𝑥̅ adalah deviasi nilai observasi individu terhadap mean. Jika
kita jumlahkan deviasi jawabnya adalah 0, yang selalu nol, tetapi itu bukan
mengarah pada ukuran dispersi. Namun jika deviasi dikuadratkan,

Bab 4. Ukuran Dispersi 7


semuanya akan positif dan jumlahnya akan lebih besar dari nol.
Perhitungannya ditampilkan di kolom ketiga (𝑥𝑖 − 𝑥̅ )2 dengan hasil
penjumlahan 0,08 yang akan bervariasi tergantung pada nilai yang
diobservasi. Rata-rata deviasi kuadrat dapat diperoleh dengan membaginya
dengan 𝑛. Namun berdasarkan alasan teoritis tidak dibagi dengan 𝑛 tetapi
dibagi dengan 𝑛 − 1. Jadi hasilnya adalah sebagai berikut.

∑(𝑥𝑖 − 𝑥̅ )2 0,08 0,08


𝑠= = = = 0,016 kg 2
𝑛−1 6−1 5

yang memberikan jawaban yang satuannya kuadrat. Hasil ini tidak dapat
diterima sebagai ukuran dispersi, tetapi berguna sebagai ukuran variabilitas.
Ini disebut varian dan diberi simbol 𝑠 2 . Jika kita lakukan akar kuadrat,
jawabnya akan berbeda dalam satuan yang sama dengan nilai observasi.
Perhitungannya adalah sebagai berikut.

∑(𝑥𝑖 − 𝑥̅ )2 0,08 0,08


𝑠=√ =√ =√ = 0,13 kg
𝑛−1 6−1 5

Rumus tersebut untuk penjelasan, bukan untuk perhitungan. Karena bentuk


data observasi dapat dikelompokkan menjadi ungrouped data atau grouped
data, hal itu berpengaruh terhadap teknik penghitungannya.

1. Ungrouped data
Rumus yang digunakan dalam standar deviasi dapat digunakan untuk
data yang tidak dikelompokkan. Namun, rumus alternatif lebih cocok
untuk tujuan perhitungan, sebagai berikut.

2
𝑛 ∑𝑛 𝑥 2 − (∑𝑛𝑖=1 𝑥𝑖 )
𝑠 = √ 𝑖=1 𝑖
𝑛(𝑛 − 1)

Contoh 3.2
Tentukan standar deviasi kadar air dari gulungan kertas kraft. Hasil dari
enam pembacaannya adalah 6.7, 6.0, 6.4, 6.4, 5.9, dan 5.8 persen.

8 Bab 4. Ukuran Dispersi


Penyelesaian:
2
𝑛 ∑𝑛𝑖=1 𝑥𝑖2 − (∑𝑛𝑖=1 𝑥𝑖 )
𝑠=√
𝑛 (𝑛 − 1)

6(231,26) − (37,2)2
𝑠=√ = √0,124 = 0,35 %
6(6 − 1)

Perhitungannya dapat diselesaikan menggunakan kalkulator.

2. Grouped data
Jika data telah dikelompokkan ke dalam distribusi frekuensi, maka
teknik berikut ini dapat digunakan. Rumus standar deviasi dari data
yang dikelompokkan adalah sebagai berikut.

2
𝑛 ∑ℎ𝑖=1(𝑓𝑖 𝑥𝑖2 ) − (∑ℎ𝑖=1 𝑓𝑖 𝑥𝑖 )
𝑠=√
𝑛(𝑛 − 1)

Keterangan:
𝑠 : standar deviasi
𝑛 : banyaknya observasi
ℎ : banyaknya kelas
𝑓𝑖 : frekuensi kelas ke-i
𝑥𝑖 : nilai observasi ke-i

Contoh 3.3
Hasil observasi terhadap kecepatan mobil penumpang dalam satuan
km/jam selama 15 menit di suatu tempat tertentu, disajikan dalam tabel
sebagai berikut. Tentukan mean dan standar deviasi !
midpoint frekuensi komputasi
kelas
𝑥𝑖 𝑓𝑖 𝑓𝑖 𝑥𝑖 𝑓𝑖 𝑥𝑖2
72.6 – 81.5 77.0 5 385 29.645
81.6 – 90.5 86.0 19 1634 140.524
90.6 – 99.5 95.0 31 2945 279.775
99.6 – 108.5 104.0 27 2808 292.032
108.6 – 117.5 113.0 14 1582 178.766
𝑛 = 96 Σ = 9354 Σ = 920.742

Bab 4. Ukuran Dispersi 9


Penyelesaian:

∑ℎ𝑖=1 𝑓𝑖 𝑥𝑖 9354
𝑥̅ = = = 97,4 km/jam
𝑛 96

2
𝑛 ∑ℎ (𝑓𝑖 𝑥𝑖2 ) − (∑ℎ𝑖=1 𝑓𝑖 𝑥𝑖 ) 96(920.742) − (9354)2
𝑠 = √ 𝑖=1 =√
𝑛(𝑛 − 1) 96(96 − 1)

96(920.742) − (9354)2
=√ = 9,9 km/jam
96(96 − 1)

Jangan membulatkan ∑ 𝑓𝑖 𝑥𝑖 atau ∑ 𝑓𝑖 𝑥𝑖2 karena tindakan ini akan


mempengaruhi akurasi. Penghitungannya dapat menggunakan kalklator
yang sesuai dengan kebutuhan.
Standar deviasi adalah nilai referensi yang mengukur sebaran data.
Semakin kecil nilai standar deviasi semakin baik kualitasnya, karena
distribusi lebih merapat di sekitar nilai sentral. Juga standar deviasi
dapat membantu menentukan populasi.

4.4 Skewness dan Kurtosis


Mean dan varian kurang cukup baik untuk menggambarkan distribusi data
terutama untuk menggambarkan sifat distribusi data. Karakteristik dari
suatu distribusi data dapat digunakan konsep-konsep dari skewness
(kemiringan) dan kurtosis (keruncingan). Masing-masing akan dijelaskan
sebagai berikut.

Skewness (kemiringan)
Skewness atau kemiringan artinya ketidaksimetrisan suatu distribusi data.
Sebuah set data dikatakan simetris apabila nilai-nilainya tersebar merata di
sekitar nilai mean. Rumus yang digunakan adalah sebagai berikut.

10 Bab 4. Ukuran Dispersi


∑ℎ𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )3 ⁄𝑛
𝑎3 =
𝑠3

Keterangan:
𝑎3 : koefisien kemiringan
𝑓𝑖 : frekuensi observasi ke-i
𝑥𝑖 : nilai observasi data ke-i
𝑥̅ : mean atau rerata data observasi
𝑠 : standar deviasi
𝑛 : banyaknya observasi

Skewness adalah angka yang ukurannya menunjukkan sejauh mana


penyimpangannya dari simetri. Jika nilai 𝑎3 adalah 0, maka datanya
simetris; jika 𝑎3 lebih besar dari 0 (positif), maka datanya miring ke kanan,
yang berarti bahwa ekor panjang ke arah kanan, dan jika kurang dari 0
(negatif), data miring ke kiri, yang berarti bahwa ekor panjang ke kiri. Nilai
+1 atau −1 menyiratkan distribusi tidak simetris yang kuat. Representasi
grafis dari kemiringan seperti disajikan pada gambar sebagai berikut.

Contoh 4.1
Berikut ini data ilustrasi untuk skewness dan kurtosisi.

𝑥𝑖 𝑓𝑖 𝑥𝑖 − 𝑥̅ 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )3 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )4
1 1 (1-7) = -6 1(-6)3 = -216 1(-6)4 = 1296

4 6 (4-7) = -3 6(-3)3 = -162 6(-3)4 = 486

7 16 (7-7) = 0 16(0)3 = 0 16(0)4 = 0


10 8 (10-7) = +3 8(+3)3 = +216 8(+3)4 = 648

Σ = −162 Σ = 2430

Bab 4. Ukuran Dispersi 11


Hitunglah skewness, jika diketahui mean, 𝑥̅ = 7.0 dan sandar deviasi
sampel, 𝑠 = 2,32.
Penyelesaian:

∑ℎ𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )3 ⁄𝑛 −162/31


𝑎3 = = = −0,42
𝑠3 2,323

Nilai skewness (kemiringan) adalah −0,42 ini menunjukkan bahwa


data cukup miring ke kiri. Pemeriksaan visual pada kolom 𝑥𝑖 dan 𝑓𝑖 atau
suatu histogram akan menunjukkan informasi yang sama.
Untuk menggunakan nilai skewness, nilai 𝑛 harus besar, katakanlah
setidaknya 100. Juga distribusi harus unimodal. Nilai skewness memberikan
informasi tentang bentuk distribusi, misalnya distribusi normal memiliki
nilai kemiringan nol, 𝑎3 = 0.
Jika menggunakan hasil analisis dengan SPSS, pada output akan
muncul nilai Skewness dan Std. Error of Skewness, maka untuk mengetahui
kemiringan distribusi, misalnya data normal atau tidak, maka menggunakan
rumus sebagai berikut.

nilai Skewness
Rasio Skewness =
Std. Error of Skewness

Pengambilan keputusan atau interpretasi hasil perhitungan rasio skewness


adalah: jika −2 ≤ rasio skewness ≤ +2 maka distribusinya simetris atau
distribusi datanya normal.

Kurtosis (keruncingan)
Kurtosis untuk mengukur keruncingan distribusi data. Rumus yang
digunakan adalah sebagai berikut.

∑ℎ𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )4 ⁄𝑛
𝑎4 =
𝑠4

12 Bab 4. Ukuran Dispersi


Keterangan:
𝑎4 : koefisien keruncingan
𝑓𝑖 : frekuensi observasi ke-i
𝑥𝑖 : nilai observasi data ke-i
𝑥̅ : mean atau rerata data observasi
𝑠 : standar deviasi
𝑛 : banyaknya observasi

Kurtosis adalah nilai tak berdimensi yang digunakan sebagai ukuran


perbandingan ketinggian puncak dalam dua distribusi. Ada tiga bentuk
utama dalah distribusi kurtosis, yaitu leptokurtik, mesokurtik, dan
platikurtik. Distribusi leptokurtik bentuknya runcing, distribusi mesokurtik
bentuk normal sehingga disebut distribusi nirmal, sedang platikurtik
bentuknya data. Berikut ini disajikan gambar untuk merepresentasikan
grafik kurtosis.

Contoh 4.2
Tentukan nilai kurtosis dari distribusi frekuensi yang tersajikan pada tabel
Contoh 4.1 yang memiliki 𝑥̅ = 7,0 dan 𝑠 = 2,32.

Penyelesaian:

∑ℎ𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )4 ⁄𝑛 2430 ⁄31


𝑎4 = = = 2,70
𝑠4 2,324
Bab 4. Ukuran Dispersi 13
Nilai kurtosis 2,70 tidak memberikan informasi apapun dengan
sendirinya, itu harus dibandingkan dengan distribusi lain. Penggunaan nilai
kurtosis sama dengan skewness yang memerlukan ukuran sampel, 𝑛 yang
besar dan distribusinya unimodal. Kurtosis memberikan informasi
mengenai bentuk distribusi. Sebagai contoh, distribusi normal mesokurtik
memiliki nilai kurtosis 3, 𝑎4 = 3. Jika 𝑎4 > 3, maka ketinggian distribusi
lebih memuncak dari normal yaitu bentuk leptokurtik, dan jika 𝑎4 < 3,
maka ketinggian distribusinya kurang memuncak dari normal yaitu bentuk
platykurtik.
Konsep skewness dan kurtosis berguna karena memberikan beberapa
informasi tentang bentuk distribusi.

4.5 Box Plots

Boxplots merupakan metode grafis yang sederhana namun sangat informatif


telah dirancang oleh John W. Tukey, untuk meringkas lokasi dan dispersi
sekumpulan data dan mengidentifikasi observasi yang tidak biasa yang
mungkin memerlukan pertimbangan khusus. Ringkasan grafis yang
dihasilkan disebut box plot atau dalam terminologi aslinya dari Tukey
disebut box-and-whisker plot. Ukuran lokasi yang ditunjukkan pada plot
tersebut adalah median, dan ukuran dispersi didasarkan pada kuartil.

Ukuran Dispersi Kuantil


Kita tahu bahwa extremes adalah anggota rumpun quantile. Sehingga range
yang didefinisikan sebagai perbedaan antara nilai maksimum dan nilai
minimum dalam suatu set observasi, mungkin dapat dianggap sebagai
ukuran dispersi kuantil yang paling sederhana. Namun, ukuran dispersi ini
tidak stabil, karena tergantung pada dua nilai observasi ekstrem.

14 Bab 4. Ukuran Dispersi


Kita dapat meningkatkan stabilitasnya dengan mengganti nilai
ekstrem dengan kuartil pertama (𝑄1 ) dan kuartil ketiga (𝑄3 ) untuk
memperoleh interquatile range (IQR), sebagai berikut.

Interquartile range (IQR) = 𝑄3 − 𝑄1

Interquartile range menggunakan 50% data observasi yang ditengah.


Kita bisa memperoleh alternatif ukuran dispersi menggunakan
setengah dari interquatile range (IQR). Ukuran tersebut disebut semi-
interquartle range atau quartile deviation (deviasi kuartil), dirumuskan
sebagai berikut.

𝑄3 − 𝑄1 IQR
Quartile deviation = =
2 2

Quartile deviation (semi-interquartile range) berbeda dari midquartile range.


Semi-interquartile range adalah setengah dari perbedaan antara kuratil
pertama (𝑄1 ) dan kuartil ketiga (𝑄3 ). Sedangkan midquartile range adalah
nilai numerik di tengah-tengah antara kuratil pertama (𝑄1 ) dan kuartil ketiga
(𝑄3 ), merupakan setengah dari jumlah kuratil pertama (𝑄1 ) dan kuartil
ketiga (𝑄3 ), dihitung menggunakan rumus sebagai berikut.

𝑄3 + 𝑄1
Mid quartile range =
2

Contoh 5.1
Sepuluh siswa diminta untuk menuliskan umur mereka dalam satuan bulan.
Kemudian kesepuluh siswa mengumpulkan catatan umur mereka, dan
dirangkum hasilnya. Hasil rangkuman umur (dalam bulan) kesepuluh siswa
tersebut adalah sebagai berikut.
131 132 130 136 150 137 142 147 138 134
Hitunglah (a) Nilai semi-interquatile range !, dan

(b) Nilai mid-quartile range !


Penyelesaian:
Data tersebut dibuat array dengan disorting dahulu.

Bab 4. Ukuran Dispersi 15


130 131 132 134 136 137 138 142 147 150
1 2 3 4 5 6 7 8 9 10

𝑛+1 10 + 1 11
𝑄1 = ( )1 = ( ) 1 = ( ) 1 = 2,75
4 4 4
Jadi 𝑄1 adalah data urutan ke-2 (= 131) +(0,75(132 − 131) = 0,75)
𝑄1 = 131 + 0,75 = 131,75

𝑛+1 10 + 1 11
𝑄3 = ( )3 = ( ) 3 = ( ) 3 = (2,75)3 = 8,25
4 4 4
Jadi 𝑄3 adalah urutan ke-8 (= 142) (+0,25(147 − 142) = 1,25)
𝑄3 = 142 + 1,25 = 143,25

Nilai semi-interquartile range (quartile deviation):


𝑄3 − 𝑄1 143,25 − 131,75 11,5
Quartile deviation = = = = 5,75
2 2 2
Jadi quartile deviation pada urutan ke-5 (= 136) + 0,75 (137-136)

Nilai mid-quartile range:


𝑄3 + 𝑄1 143,25 + 131,75 275
Mid quartile range = = = = 137,5
2 2 2

Membuat Box & Whisker Plot


Tahapan-tahapan membuat Box and Whisker Plot, sebagai berikut.
1) Data diurutkan (array) dari terkecil hingga terbesar.
2) Temukan nilai terkecil (lower extreme).
3) Temukan nilai terbesar (upper extreme).
4) Hitung kuartil ke-1, 𝑄1
5) Hitung kuartil ke-3, 𝑄3
6) Temukan nilai median (kuartil ke-2), 𝑄2
7) Hitung Interquartail Range (IQR)
8) Gambar Box and Whisker Plot berdasarkan informasi tersebut.

16 Bab 4. Ukuran Dispersi


Contoh 5.2
Sebelas siswa diminta untuk menuliskan umur mereka dalam satuan bulan.
Kemudian kesebelas siswa mengumpulkan catatan umur mereka, dan
dirangkum hasilnya. Hasil rangkuman umur (dalam bulan) kesebelas siswa
tersebut adalah sebagai berikut.
131 132 130 136 150 137 142 147 138 134 162

Penyelesaian:
1) Urutkan data dari terkecil sampai terbesar:
130 131 132 134 136 137 138 142 147 150 162
1 2 3 4 5 6 7 8 9 10 11
2) Temukan nilai terkecil (lower extreme).
Nilai minimum = 130
3) Temukan nilai terbesar (upper extreme).
Nilai maksimum = 162
4) Hitung kuartil ke-1, 𝑄1
Nilai kuartil ke-1 (Percentiles 25), 𝑄1 = 132
5) Hitung kuartil ke-3, 𝑄3
Nilai kuartil ke-3 (Persentiles 75), 𝑄3 = 147
6) Temukan nilai median (kuartil ke-2), 𝑄2
Nilai median (kuartil ke-2), 𝑄2 = 137 → diberi tanda kotak merah.
7) Hitung Interquartail Range (IQR)
Nilai IQR = 𝑄3 − 𝑄1 = 147 − 132 = 15 → ini adalah Box-nya.
8) Gambar Box and Whisker Plot berdasarkan informasi tersebut.

Bab 4. Ukuran Dispersi 17


Komponen Box & Whisker Plot
Bagian-bagian atau komponen dari Box and Whisker Plot sebagai berikut.

Penjelasan masing-masing komponen sebagai berikut.


1) Box (bingkai hijau, blok merah) adalah merupakan bagian yang
menyajikan interquartile range (IQR), dimana 50% dari data observasi
terletak di Box ini.
a. Panjang/tinggi box sesuai dengan range kuartil dalam (Inner
Quartile Range, IQR). Besarnya IQR menggambarkan ukuran
sebaran data, semakin panjang bidang IQR menunjukkan bahwa
data semakin menyebar.
b. 𝑄1 (kuartil ke-1, Lower hinge) ada di garis bawah Box, dimana 25%
data observasi dengan nilai lebih kecil atau sama dengan nilai 𝑄1 .
c. 𝑄3 (kuartil ke-3, Upper hinge) ada di garis atas Box, dimana 75%
data observasi dengan nilai lebih kecil atau sama dengan nilai 𝑄3 .
d. 𝑄2 (kuartil ke-2) yaitu median. Dimana 50% data observasi lebih
kecil atau sama dengan 𝑄2 .

18 Bab 4. Ukuran Dispersi


2) Whisker (garis berwarna biru, atas dan bawah box) adalah garis
perpanjangan dari Box (baik ke arah atas/kanan maupun ke arah
bawah/kiri).
a. Whisker atas menunjukkan nilai yang lebih tinggi dari set data yang
berada dalam IQR.
b. Whisker bawah menunjukkan nilai yang lebih rendah dari set data
yang berada dalam IQR
c. Panjang whisker adalah ≤ 1,5 × IQR. Masing-masing garis whisker
dimulai dari ujung box IQR, dan berakhir pada nilai data yang
dikategorikan bukan sebagai outlier, garis itu adalah garis Upper
Inner Fence (UIF) yang rumusnya: UIF = 𝑄3 + 1,5 × IQ. untuk
yang atas. Sedang yang bawah, yaitu Lower Inner Fence (LIF)
rumusnya: LIF = 𝑄1 − 1,5 × IQR.
3) Nilai di atas dan di bawah Whisker disebut nilai outlier atau extreme.
a. Outlier adalah nilai data yang berada di luar 1,5 × IQR, yaitu:
• 𝑄3 + (1,5 × IQR) < outlier atas ≤ 𝑄3 + (3 × IQR)
• 𝑄1 − (1,5 × IQR) < outlier bawah ≤ 𝑄1 − (3 × IQR)
b. Extrem adalah nilai data yang berada di luar 3 × IQR, yaitu:
• Extrem atas nilainya > 𝑄3 + (3 × IQR)
• Extrem bawah nilainya < 𝑄1 − (3 × IQR)
4) Nilai adjacent, terdapat dua nilai adjacent yaitu upper adjacent dan
lower adjacent.
• Upper adjacent value (UAV), adalah nilai observasi terbesar yang
kurang dari atau sama dengan upper inner fence (UIF), rumusnya:
AUV ≤ 𝑄3 + (1,5 × IQR).
• Lower adjacent value (LAV), adalah nilai observasi terkecil yang
lebih besar dari atau sama dengan lower inner fence (LIF),
rumusnya: LAV = 𝑄1 − (1,5 × IQR)
Boxplots dapat membantu untuk memahami karakteristik suatu distribusi
data. Berdasarkan tinggi/panjangnya Boxplots dapat untuk melihat sebaran
data. Berdasarkan letak 𝑄2 dapat digunakan untuk menilai kesimitrisan
sebaran data.

Bab 4. Ukuran Dispersi 19

Anda mungkin juga menyukai