dan kesimetrisan data pengamatan. Penyajian grafis lainnya yang bisa merangkum informasi lebih detail
mengenai distribusi nilai-nilai data pengamatan adalah Box and Whisker Plots atau lebih sering disebut
dengan BoxPlot atau Box-Plot (kotak-plot) saja. Seperti namanya, Box and Whisker, bentuknya terdiri
dari Box (kotak) dan whisker. Pada gambar di bawah, Box adalah kotak berwarna hijau dan whisker garis
berwarna biru.
Gambar Box-Plot
Boxplot merupakan ringkasan distribusi sampel yang disajikan secara grafis yang bisa menggambarkan
bentuk distribusi data (skewness), ukuran tendensi sentral dan ukuran penyebaran (keragaman) data
pengamatan.
Terdapat 5 ukuran statistik yang bisa kita baca dari boxplot, yaitu:
Selain itu, boxplot juga dapat menunjukkan ada tidaknya nilai outlier dan nilai ekstrim dari data
pengamatan.
Dari gambar di atas, sepintas kita bisa menentukan beberapa ukuran statistik, meskipun tidak peris
sekali. Nilai statistik pada badan Boxplot: Nilai median 76, Nilai Q1 69, nilai Q3 87, nilai maksimum
99, nilai minimum 48, serta nilai-nilai di luar badan Boxplot yang merupakan nilai outlier berturut-turut
sekitar 36, 38 dan 43. Sebaran data tidak simetris, tapi menjulur ke arah kiri (negatively skewness).
Darimana kita bisa menentukan ukuran statistik dan interpretasi tersebut??
Ok, untuk mengetahui perkiraan nilai tersebut, sebelumnya kita harus mengenal dulu bagian-bagian dari
boxplot. Di bawah ini diperlihatkan rincian detail boxplot beserta cara penentuan batas-batasnya.
Bagian utama boxplot adalah kotak berbentuk persegi (Box) yang merupakan bidang yang
menyajikan interquartile range (IQR), dimana 50 % dari nilai data pengamatan terletak di sana.
o Panjang kotak sesuai dengan jangkauan kuartil dalam (inner Quartile Range, IQR) yang
merupakan selisih antara Kuartil ketiga (Q3) dengan Kuartil pertama (Q1). IQR
menggambarkan ukuran penyebaran data. Semakin panjang bidang IQR menunjukkan
data semakin menyebar. Pada Gambar, IQR = UQ LQ = Q3 Q1
o Garis bawah kotak (LQ) = Q1 (Kuartil pertama), dimana 25% data pengamatan lebih kecil
atau sama dengan nilai Q1
o Garis tengah kotak = Q2 (median), dimana 50% data pengamatan lebih kecil atau sama
dengan nilai ini
o Garis atas kotak (UQ) = Q3 (Kuartil ketiga) dimana 75% data pengamatan lebih kecil atau
sama dengan nilai Q1
Garis yang merupakan perpanjangan dari box (baik ke arah atas ataupun ke arah bawah)
dinamakan dengan whiskers.
o Whiskers bawah menunjukkan nilai yang lebih rendah dari kumpulan data yang berada
dalam IQR
o Whiskers atas menunjukkan nilai yang lebih tinggi dari kumpulan data yang berada
dalam IQR
o Panjang whisker 1.5 x IQR. Masing-masing garis whisker dimulai dari ujung kotak IQR,
dan berakhir pada nilai data yang bukan dikategorikan sebagai outlier (Pada gambar,
batasnya adalah garis UIF dan LIF). Dengan demikian, nilai terbesar dan terkecil dari
data pengamatan (tanpa termasuk outlier) masih merupakan bagian dari Boxplot yang
terletak tepat di ujung garis tepi whiskers.
Nilai yang berada di atas atau dibawah whisker dinamakan nilai outlier atau ekstrim.
o Nilai outlier adalah nilai data yang letaknya lebih dari 1.5 x panjang kotak (IQR), diukur
dari UQ (atas kotak) atau LQ (bawah kotak). Pada Gambar di atas, ada 2 data
pengamatan yang merupakan outlier, yaitu data pada case 33 dan case 55 (ada pada
baris ke 33 dan baris 35)
o Nilai ekstrim adalah nilai-nilai yang letaknya lebih dari 3 x panjang kotak (IQR), diukur
dari UQ (atas kotak) atau LQ (bawah kotak). Pada gambar di atas, ada 1 data yang
merupakan nilai ekstem, yaitu data pada case 15.
o garis median akan berada di tengah box dan whisker bagian atas dan bawah akan
memiliki panjang yang sama serta tidak terdapat nilai outlier ataupun nilai ekstrim.
o diharapkan nilai-nilai pengamatan yang berada di luar whiskers tidak lebih dari 1%.
Jika data tidak simetris (miring), median tidak akan berada di tengah box dan salah satu dari
whisker lebih panjang dari yang lainnya.
o Adanya outlier di bagian atas boxplot yang disertai dengan whisker bagian atas yang
lebih panjang, menunjukkan bahwa distribusi data cenderung menjulur ke arah kanan
(positive skewness).
o Sebaliknya, adanya outlier di bagian bawah boxplot yang disertai dengan whisker bagian
bawah yang lebih panjang, menunjukkan bahwa distribusi data cenderung menjulur ke
arah kiri (negatif skewness).
Kemiringan (Skewness)
Keunggulan Boxplots dibanding dengan Histogram, dotplot, dan stemplot sangat terasa pada saat kita
ingin membandingkan sebaran beberapa kelompok data secara bersamaan. Sebagai contoh, perhatikan
gambar berikut:
Box-Plot Grup Data
Kita bisa mengetahui beberapa gambaran informasi dari gambar tersebut. Nilai median untuk tiga
kelompok data adalah sama. Selanjutnya,. bagaimana mengenai penyebaran (keragaman) dan
kesimetrisannya?? Silahkan Anda interpretasi sendiri, sebagai latihan. lihat panduan pada uraian
di atas
(catatan: Interpretasi pada perbandingan ketiga boxplot di atas, tidak memperhatikan asumsi distribusi
statistik. Ingat, ukuran pusat yang digunakan adalah median bukan mean! Grafik boxplot di atas
merupakan analisis non-parametrik)
Terdapat sedikit perbedaan bentuk Box-plot yang di generate beberapa software statistik, baik dalam
bentuknya (tepi whisker, median), ukuran pusat yang digunakan (median atau mean), maupun arah
penggambarannya (ada yang digambarkan secara horizontal dan ada yang vertical). Namun pada
prinsipnya sama. Box-plot pada contoh di atas dibuat dengan menggunakan Software SPSS. Software
Statistica (Statsoft), misalnya, memperbolehkan kita memilih antara median atau rata-rata untuk dasar
pembuatan Box-Plot-nya. Apabila nilai mean yang digunakan pada Box-plotnya, maka whisker dan batas
untuk outlier/ekstrimnya menggunakan nilai Standar Deviasi (SD) bukan IQR.