Terdapat 5 ukuran statistic yang bisa kita baca dari boxplot, yaitu :
Dari gambar di atas, sepintas kita bisa menentukan beberapa ukuran statistik, meskipun
tidak peris sekali. Nilai statistik pada badan Boxplot: Nilai median ≈ 76, Nilai Q1≈ 69,
nilai Q3 ≈ 87, nilai maksimum ≈ 99, nilai minimum 48, serta nilai-nilai di luar badan
Boxplot yang merupakan nilai outlier berturut-turut sekitar 36, 38 dan 43. Sebaran data
tidak simetris, tapi menjulur ke arah kiri (negatively skewness). Darimana kita bisa
menentukan ukuran statistik dan interpretasi tersebut??
Untuk mengetahui perkiraan nilai tersebut, sebelumnya kita harus mengenal dulu bagian-
bagian dari boxplot. Di bawah ini diperlihatkan rincian detail boxplot beserta cara
penentuan batas-batasnya.
Gambar 8. Penjelasan Boxplot
A. Bagian utama boxplot adalah kotak berbentuk persegi (Box) yang merupakan bidang
yang menyajikan interquartile range (IQR), dimana 50 % dari nilai data pengamatan
terletak di sana.
1. Panjang kotak sesuai dengan jangkauan kuartil dalam (inner Quartile Range, IQR)
yang merupakan selisih antara Kuartil ketiga (Q3) dengan Kuartil pertama (Q1).
IQR menggambarkan ukuran penyebaran data. Semakin panjang bidang IQR
menunjukkan data semakin menyebar. Pada Gambar, IQR = UQ – LQ = Q3 – Q1
2. Garis bawah kotak (LQ) = Q1 (Kuartil pertama), dimana 25% data pengamatan
lebih kecil atau sama dengan nilai Q1
3. Garis tengah kotak = Q2 (median), dimana 50% data pengamatan lebih kecil atau
sama dengan nilai ini
4. Garis atas kotak (UQ) = Q3 (Kuartil ketiga) dimana 75% data pengamatan lebih
kecil atau sama dengan nilai Q1
5. Garis yang merupakan perpanjangan dari box (baik ke arah atas ataupun ke arah
bawah) dinamakan denganwhiskers.
6. Whiskers bawah menunjukkan nilai yang lebih rendah dari kumpulan data yang
berada dalam IQR
7. Whiskers atas menunjukkan nilai yang lebih tinggi dari kumpulan data yang
berada dalam IQR
8. Panjang whisker ≤ 1.5 x IQR. Masing-masing garis whisker dimulai dari ujung
kotak IQR, dan berakhir pada nilai data yang bukan dikategorikan sebagai outlier
(Pada gambar, batasnya adalah garis UIF dan LIF). Dengan demikian, nilai
terbesar dan terkecil dari data pengamatan (tanpa termasuk outlier) masih
merupakan bagian dari Boxplot yang terletak tepat di ujung garis tepi whiskers.
B. Nilai yang berada di atas atau dibawah whisker dinamakan nilai outlier atau ekstrim
1. Nilai outlier adalah nilai data yang letaknya lebih dari >1.5 x panjang kotak
(IQR),. Pada Gambar di atas, ada 2 data pengamatan yang merupakan outlier,
yaitu data pada case 33 dan case 55 (ada pada baris ke 33 dan baris 35)
a. Q3 + (1.5 x IQR) < outlier atas ≤ Q3 + (3 x IQR)
b. Q1 – (1.5 x IQR) > outlier bawah ≥ Q1 – (3 x IQR)
2. Nilai ekstrim adalah nilai-nilai yang letaknya lebih dari > 3 x panjang kotak
(IQR),. Pada gambar di atas, ada 1 data yang merupakan nilai ekstem, yaitu data
pada case 15.
a. Ekstrim bagian atas apabila nilainya berada di atas Q3 + (3 x IQR) dan
b. Ekstrim bagian bawah apabila nilainya lebih rendah dari Q1 – (3 x IQR)
Boxplots dapat membantu kita dalam memahami karakteristik dari distribusi data.
Selain untuk melihat derajat penyebaran data (yang dapat dilihat dari tinggi/panjang
boxplot) juga dapat digunakan untuk menilai kesimetrisan sebaran data. Panjang
kotak menggambarkan tingkat penyebaran atau keragaman data pengamatan,
sedangkan letak median dan panjang whisker menggambarkan tingkat
kesimetrisannya.
1. Garis median akan berada di tengah box dan whisker bagian atas dan bawah akan
memiliki panjang yang sama serta tidak terdapat nilai outlier ataupun nilai
ekstrim.
2. Diharapkan nilai-nilai pengamatan yang berada di luar whiskers tidak lebih dari
1%.
ii. Jika data tidak simetris (miring), median tidak akan berada di tengah box dan
salah satu dari whisker lebih panjang dari yang lainnya.
1. Adanya outlier di bagian atas boxplot yang disertai dengan whisker bagian atas
yang lebih panjang, menunjukkan bahwa distribusi data cenderung menjulur ke
arah kanan (positive skewness).
Gambar 9. Kemiringan (Skewness)
2. Sebaliknya, adanya outlier di bagian bawah boxplot yang disertai dengan whisker
bagian bawah yang lebih panjang, menunjukkan bahwa distribusi data cenderung
menjulur ke arah kiri (negatif skewness).
Keunggulan Boxplots dibanding dengan Histogram, dotplot, dan stemplot sangat
terasa pada saat kita ingin membandingkan sebaran beberapa kelompok data
secara bersamaan. Sebagai contoh, perhatikan gambar berikut:
Gambar 10. Box-Plot Grup Data
Dari Box-Plot Grup Data daiatas kita bisa mengetahui beberapa gambaran
informasi dari gambar tersebut. Nilai median untuk tiga kelompok data adalah
sama.
Stem width: 10
Each leaf: 1 case(s)
Prosedur Pembuatan Stem-and-Leaf-Plot:
Contoh:
Buat stem-and-leaf plot untuk data berikut ini:
23 26 26 30 32 36 38 43 44 44 45 48 49 53 57 58 65 66 99
Penjelasan:
Angka pertama: 23 kita pisahkan menjadi 2 (stem) dan 3 (leaf)
2|3
(keterangan: Angka 2 adalah puluhan sehingga dijadikan stem,
dan angka 3 adalah satuan, sehingga dijadikan leaf)