n
x x
s
n
i
i
x
Dalam statistik deskriptif , boxplot adalah cara yang nyaman untuk
grafis menggambarkan kelompok data numerik melalui kuartil mereka.
kuartil merupakan serangkaian peringkat nilai-nilai data yang membagi
kumpulan data menjadi empat kelompok yang sama.
first quartile (designated Q
1
) = lower quartile = 25th percentile (splits
off the lowest 25% of data from the highest 75%)
second quartile (designated Q
2
) = median = 50th percentile (cuts data
set in half)
third quartile (designated Q
3
) = upper quartile = 75th percentile (splits
off the highest 25% of data from the lowest 75%)
The difference between the upper and lower quartiles is called the
interquartile range (IQR)
Box Plot (Diagram Kotak Box and
Whisker plot)
Peringkasan data
menggunakan diagram
kotak untuk
menggambarkan apakah
data mempunyai outlier
(data ekstrim) atau tidak
Untuk membuat Box Plot, ada beberapa hal yang
harus diketahui :
- Nilai minimum
- Nilai maksimum
- Median (Q
2
= kuartil ke-2)
- Lower Quartile (Q
1
= kuartil ke-1)
- Upper Quartile (Q
3
= kuartil ke-3)
- IQR (Inter Quartile Range ) = Q
3
-Q
1
- LIF (Lower Inner Fence) = Q
1
1,5 IQR
- UIF (Upper Inner Fence) = Q
3
+ 1,5 IQR
- LOF (Lower Outer Fence) = Q
1
3 IQR
- UOF (Upper Outer Fence) = Q
3
+ 3 IQR
Contoh
Misalkan dimiliki data berikut :
5,3 4,0 12,5 3,0 3,9 6,4 5,2 2,6 15,8, 6,2 4,0
7,1 3,4 4,4 3,5 3,4 3,2 5,6 3,2 3,4 8,6 3,1
n = 22, nilai minimum = 2,6, nilai maksimum = 15,8
Data terurut :
2,6 3,0 3,1 3,2 3,2 3,4 3,4 3,5 3,7 3,9 4,0
4,0 4,4 5,2 5,3 5,6 6,2 6,4 7,1 8,6 12,5 15,8
Lokasi Median : (n+1)/2 = 23/2 = 11,5
Median (4,0 + 4,0)/2 = 4,0
Mean = 5,4
Lokasi Q
1
:
(lokasi median dibulatkan ke bawah + 1)/2
yaitu lokasi ke 6 dari nilai minimum
Q
1
= 3,4
Lokasi Q
3
:
(lokasi median dibulatkan ke bawah + 1)/2
yaitu lokasi ke 6 dari nilai maksimum
Q
3
= 6,2
IQR = Q
3
-Q
1
= 6,2 3,4 = 2,8
LIF = Q
1
- 1,5 IQR = 3,4 1,5 (2,8) = - 0,8
UIF = Q
3
+ 1,5 IQR = 6,2 + 1,5 (2,8) = 10,4
LOF = Q
1
- 3 IQR = 3,4 3 (2,8) = - 5
UOF = Q
3
+ 3 IQR = 6,2 + 3 (2,8) = 14,6
Data yang terletak antara LIF dan UIF bukan outlier
Data yang terletak di luar LIF dan UIF adalah
outlier yang dibedakan menjadi 2 yaitu mild
outlier dan extrem outlier
Boxplot - Contoh
Bila semua data terletak terletak
antara LIF dan UIF maka data
tidak memiliki outlier
Data terletak antara IF dan OF
disebut mild outlier (tanda
bulat)
Data terletak di luar OF disebut
extreme outlier (tanda bintang)