Anda di halaman 1dari 11

BAB V

BOXPLOT DAN STEMPLOT (STEAM-AND-LEAF PLOT)

5.1 Boxplot (SPSS)


Boxplot merupakan ringkasan distribusi sampel yang disajikan secara grafis yang bisa
menggambarkan bentuk distribusi data , ukuran tendensi sentral dan ukuran penyebaran
(keragaman) data pengamatan.

Gambar 7. Boxplot spss

Terdapat 5 ukuran statistic yang bisa kita baca dari boxplot, yaitu :

1. nilai minimum : nilai observasi terkecil


2. Q1 : kuartil terendah atau kuartil pertama
3. Q2 : median atau nilai pertengahan
4. Q3 : kuartil tertinggi atau kuartil ketiga
5. nilai maksimum : nilai observasi terbesar.

Selain itu, boxplot juga dapat menunjukkan ada tidaknya nilai outlier dan
nilai ekstrim dari data pengamatan.

Dari gambar di atas, sepintas kita bisa menentukan beberapa ukuran statistik, meskipun
tidak peris sekali. Nilai statistik pada badan Boxplot: Nilai median ≈ 76, Nilai Q1≈ 69, nilai
Q3 ≈ 87, nilai maksimum ≈ 99, nilai minimum 48, serta nilai-nilai di luar badan Boxplot
yang merupakan nilai outlier berturut-turut sekitar 36, 38 dan 43. Sebaran data tidak
simetris, tapi menjulur ke arah kiri (negatively skewness). Darimana kita bisa menentukan
ukuran statistik dan interpretasi tersebut??

Untuk mengetahui perkiraan nilai tersebut, sebelumnya kita harus mengenal dulu bagian-
bagian dari boxplot. Di bawah ini diperlihatkan rincian detail boxplot beserta cara
penentuan batas-batasnya.
Gambar 8. Penjelasan Boxplot

A. Bagian utama boxplot adalah kotak berbentuk persegi (Box) yang merupakan bidang yang
menyajikan interquartile range (IQR), dimana 50 % dari nilai data pengamatan terletak di
sana.

1. Panjang kotak sesuai dengan jangkauan kuartil dalam (inner Quartile Range, IQR)
yang merupakan selisih antara Kuartil ketiga (Q3) dengan Kuartil pertama (Q1).
IQR menggambarkan ukuran penyebaran data. Semakin panjang bidang IQR
menunjukkan data semakin menyebar. Pada Gambar, IQR = UQ – LQ = Q3 – Q1
2. Garis bawah kotak (LQ) = Q1 (Kuartil pertama), dimana 25% data pengamatan
lebih kecil atau sama dengan nilai Q1
3. Garis tengah kotak = Q2 (median), dimana 50% data pengamatan lebih kecil atau
sama dengan nilai ini
4. Garis atas kotak (UQ) = Q3 (Kuartil ketiga) dimana 75% data pengamatan lebih
kecil atau sama dengan nilai Q1
5. Garis yang merupakan perpanjangan dari box (baik ke arah atas ataupun ke arah
bawah) dinamakan denganwhiskers.
6. Whiskers bawah menunjukkan nilai yang lebih rendah dari kumpulan data yang
berada dalam IQR
7. Whiskers atas menunjukkan nilai yang lebih tinggi dari kumpulan data yang berada
dalam IQR
8. Panjang whisker ≤ 1.5 x IQR. Masing-masing garis whisker dimulai dari ujung
kotak IQR, dan berakhir pada nilai data yang bukan dikategorikan sebagai outlier
(Pada gambar, batasnya adalah garis UIF dan LIF). Dengan demikian, nilai
terbesar dan terkecil dari data pengamatan (tanpa termasuk outlier) masih
merupakan bagian dari Boxplot yang terletak tepat di ujung garis tepi whiskers.
B. Nilai yang berada di atas atau dibawah whisker dinamakan nilai outlier atau ekstrim
1. Nilai outlier adalah nilai data yang letaknya lebih dari >1.5 x panjang kotak
(IQR),. Pada Gambar di atas, ada 2 data pengamatan yang merupakan outlier,
yaitu data pada case 33 dan case 55 (ada pada baris ke 33 dan baris 35)
a. Q3 + (1.5 x IQR) < outlier atas ≤ Q3 + (3 x IQR)
b. Q1 – (1.5 x IQR) > outlier bawah ≥ Q1 – (3 x IQR)
2. Nilai ekstrim adalah nilai-nilai yang letaknya lebih dari > 3 x panjang kotak
(IQR),. Pada gambar di atas, ada 1 data yang merupakan nilai ekstem, yaitu data
pada case 15.
a. Ekstrim bagian atas apabila nilainya berada di atas Q3 + (3 x IQR) dan
b. Ekstrim bagian bawah apabila nilainya lebih rendah dari Q1 – (3 x IQR)
Boxplots dapat membantu kita dalam memahami karakteristik dari distribusi data.
Selain untuk melihat derajat penyebaran data (yang dapat dilihat dari tinggi/panjang
boxplot) juga dapat digunakan untuk menilai kesimetrisan sebaran data. Panjang kotak
menggambarkan tingkat penyebaran atau keragaman data pengamatan, sedangkan
letak median dan panjang whisker menggambarkan tingkat kesimetrisannya.

i. Jika data simetris (berasal dari distribusi normal):

1. Garis median akan berada di tengah box dan whisker bagian atas dan bawah akan
memiliki panjang yang sama serta tidak terdapat nilai outlier ataupun nilai
ekstrim.

2. Diharapkan nilai-nilai pengamatan yang berada di luar whiskers tidak lebih dari
1%.

ii. Jika data tidak simetris (miring), median tidak akan berada di tengah box dan
salah satu dari whisker lebih panjang dari yang lainnya.

1. Adanya outlier di bagian atas boxplot yang disertai dengan whisker bagian atas
yang lebih panjang, menunjukkan bahwa distribusi data cenderung menjulur ke
arah kanan (positive skewness).
Gambar 9. Kemiringan (Skewness)

2. Sebaliknya, adanya outlier di bagian bawah boxplot yang disertai dengan whisker
bagian bawah yang lebih panjang, menunjukkan bahwa distribusi data cenderung
menjulur ke arah kiri (negatif skewness).
Keunggulan Boxplots dibanding dengan Histogram, dotplot, dan stemplot sangat
terasa pada saat kita ingin membandingkan sebaran beberapa kelompok data secara
bersamaan. Sebagai contoh, perhatikan gambar berikut:

Gambar 10. Box-Plot Grup Data


Dari Box-Plot Grup Data daiatas kita bisa mengetahui beberapa gambaran
informasi dari gambar tersebut. Nilai median untuk tiga kelompok data adalah
sama.

5.2.Stemplot (Steam-And-Leaf Plot)


Penyajian lain yang mirip dengan histogram adalah Stemplot. Stemplot juga dikenal
sebagai stem-and-leaf plotatau apabila diterjemahkan ke dalam bahasa indonesia berarti plot
batang dan daun. Di dalam statistik, stemplot merupakan alat untuk menyajikan data kuantitatif
dalam format grafis, mirip dengan histogram, yaitu untukmembantu dalam memvisualisasikan
bentuk distribusi data yang sering digunakan dalam analisis eksplorasi. Stemplot
diperkenalkan oleh Arthur Bowley di awal tahun 1900-an. Namun penggunaannya secara
umum baru dimulai pada tahun 1980 setelah John Tukey’s mempublikasikan Exploratory Data
Analysis pada tahun 1977.
Stem-and-leaf plot memberikan informasi lebih banyak tentang nilai yang sebenarnya
dibanding histogram. Seperti dalam histogram, panjang setiap batang sesuai dengan jumlah
kejadian yang jatuh ke dalam interval tertentu. Pada Histogram. kita hanya bisa melihat nilai
frekuensi dari data namun kita tidak tahu berapa nilai angka sebenarnya. Berbeda dengan
histogram, pada SLP selain kita bisa mengetahui nilai frekuensinya, kita pun bisa tau berapa
nilai data sebenarnya. Hal ini dilakukan dengan membagi nilai-nilai yang diamati menjadi dua
komponen, stem dan leaf.
Stem-and-leaf plot menggambarkan/menyajikan data dengan cara memisahkan setiap nilai
menjadi dua bagian: bagian batang (stem) yaitu digit angka paling kiri dan diikuti dengan
angka berikutnya, yaitu daun (leaf), digit angka paling kanan.
Tujuan utama Stem-and-leaf plot adalah untuk hal berikut ini:
 Apakah pola pengamatan simetris.
 Penyebaran atau variasi dari data pengamatan.
 Apakah terdapat pencilan (outlier, nilai-nilai yang berada jauh dari yang lainnya).
 Titik pemusatan data.
 Ada Lokasi yang merupakan gap (kesenjangan dalam data)
Ilustrasi di di bawah menunjukkan Stem-and-leaf plot untuk Nilai Ujian 80 mahasiswa.
Tabel 14. Data steam and leaf plot
79 49 48 74 81 98 87 80
80 84 90 70 91 93 82 78
70 71 92 38 56 81 74 73
68 72 85 51 65 93 83 86
90 35 83 73 74 43 86 88
92 93 76 71 90 72 67 75
80 91 61 72 97 91 88 81
70 74 99 95 80 59 71 77
63 60 83 82 60 67 89 63
76 63 88 70 66 88 79 75
Berikut adalah Stem-and-Leaf Plot yang digenerate SPSS untuk data Nilai Ujian di atas.
Stem-and-leaf of Nilai Ujian N = 80
Leaf Unit = 1.0
2 3 58
5 4 389
8 5 169
19 6 00133356778
(24) 7 000011122233444455667899
37 8 0000111223334566788889
15 9 000111223335789
^ ^ ^
f stem | leaf
Apabila kita lihat output dari software Minitab ada 3 bagian, yaitu f, stem, leaf. Bagian pertama
adalah nilai frekuensinya (f) yang diletakkan diletakkan paling kiri, selanjutnya diikuti dengan
stem (ditengah) dan terakhir leaf (dibagian kanan).
Nilai ujian pada stem dan leaf plot sudah diurutkan dengan urutan meningkat, dimulai dari
nilai terkecil, 35, 38, 43, 48, …., 97, 98, 99.
Sangat mudah untuk melihat bagaimana nilai pertama, 35, dipisahkan menjadi dua bagian
terpisah, 3 dimasukkan ke dalam stem, dan 5 dimasukkan ke dalam leaf. Demikian juga nilai
ujian 38, 3 (stem) dan 8 (leaf). Karena angka 35 dan 38 memiliki angka puluhan yang sama
(yaitu angka 3), maka kedua nilai tersebut ditempatkan pada stem yang sama, dan satuannya
digrupkan pada leaf yang sama (perhatikan angka 58).
Pada stem 3 hanya ada 2 leaf, yaitu angka 5 dan 8 yang berarti bahwa pada stem 3 frekuensinya
ada 2. Pada Minitab, angka 2 tersebut bisa dilihat di baris sebelah kiri stem.
Interpretasi:
 Sebaran data tidak simetris (normal) tapi miring/menjulur ke arah kiri
 Modus terjadi pada Nilai Ujian 70-an yaitu sebanyak 24 buah yang merupakan titik
pemusatan data
 Nilai ujian 35, 38 mungkin merupakan pencilan
Tambahan:
Output komputer Nilai Ujian dengan menggunakan software SPSS:
Nilai Ujian Stem-and-Leaf Plot

Frequency Stem & Leaf

3.00 Extremes (=<43)


2.00 4 . 89
3.00 5 . 169
11.00 6 . 00133356778
24.00 7 . 000011122233444455667899
22.00 8 . 0000111223334566788889
15.00 9 . 000111223335789

Stem width: 10
Each leaf: 1 case(s)
Prosedur Pembuatan Stem-and-Leaf-Plot:
Contoh:

Buat stem-and-leaf plot untuk data berikut ini:


23 26 26 30 32 36 38 43 44 44 45 48 49 53 57 58 65 66 99

Untuk membangun sebuah batang plot, data pengamatan terlebih dulu


harus diurutkan dalam urutan menaik.
Data di atas sudah diurutkan secara menaik.
Selanjutnya, kita buat angka di atas menjadi dua komponen/bagian/kolom,
yaitu stem dan leaf.
Angka puluhan untuk stem (batang) dan angka satuan untuk leaf (daun).
Kemudian kita pisahkan Angka puluhan dan Angka satuan
dengan tanda "|"
23 26 26 30 32 36 38 43 44 44 45 48 49 53 57 58 65 66 99
Contoh untuk tiga angka pertama, 23 26 dan 26
Angka puluhannya sama, yaitu 2 sehingga angka tersebut
ditempatkan pada stem (batang) yang sama dan
angka satuannya, 3, 6, 6 ditempatkan pada leaf yang sama
sehingga membentuk leaf 366.
Apabila kita masukkan ke dalam bentuk Stem-and-leaf-plot:
2 | 366

Stem dan leaf plot selengkapnya:


-------------------------------------------------------
Stem (puluhan) | leaf (satuan)
-------------------------------------------------------
2 | 366 (nilai = 23 26 26)
3 | 0268 (nilai = 30 32 36 38)
4 | 344589 (nilai = 43 44 44 45 48 49)
5 | 378 (nilai = 53 57 58)
6 | 56 (nilai = 65 66)
7 | (tidak ada nilai)
8 | (tidak ada nilai)
9 |9 (nilai = 99)
-------------------------------------------------------

Penjelasan:
Angka pertama: 23 kita pisahkan menjadi 2 (stem) dan 3 (leaf)
2|3
(keterangan: Angka 2 adalah puluhan sehingga dijadikan stem,
dan angka 3 adalah satuan, sehingga dijadikan leaf)

Angka kedua : 26 kita pisahkan menjadi 2 (stem) dan 6 (leaf)


Angka ketiga : 26 kita pisahkan menjadi 2 (stem) dan 6 (leaf)
(keterangan: tiga angka pertama: 23, 26, dan 26
memiliki stem yang sama, yaitu 2 sehingga angka satuannya
ditempatkan pada baris leaf yang sama,
lihat angka 366 (leaf) pada gambar di bawah)
dst
Interpretasi:
- Tidak simetris, data miring (menjulur) ke arah kanan
- Angka 99 merupakan outlier
- Gap (kekosongan/kesenjangan data) terdapat pada stem: 7 dan 8
- Pemusatan data terjadi pada stem 4, sekitar 4 puluhan.
Ref:
Wild, C. and Seber, G. (2000) Chance Encounters: A First Course in Data Analysis and
Inference pp. 49-54 John Wiley and Sons. ISBN 0-471-32936-3

Anda mungkin juga menyukai