Anda di halaman 1dari 17

BOX PLOT

Pengertian dan Penggunaannya




Paul B Timotiwu
Mengapa Anda belajar Pengenalan Komputer?

Apakah yang menjadi tujuan dari Mata Kuliah ini?

Apakah manfaat dari Mata Kuliah ini?
PERTANYAAN

Sebelum masuk dalam materi terlebih dahulu mengerti istilah sebagai
berikut:
1. Mean: sekelompok angka atau jumlah dari keseluruhan angka
dibagi dengan banyaknya angka tersebut
2. Median: adalah nilai yang berada ditengah-tengah data setelah
diurutkan dari yang terkecil sampai terbesar. Atau Median
merupakan skor yang membagi distribusi frekuensi menjadi dua
sama besar ( 50 % sekelompok objek yang diteliti terletak di bawah
median, dan 50 % yang lainnya terletak di atas median ).
Md = Bb + (i/fm) ( N fkb )
Ketengan :
Md = median
Bb = batas bawah kelas interval yang mengandung median
i = interval kelompok
fm = frekuensi kelas interval yang mengandung
nilai median yang diduga.
N = jumlah frekuensi
f kb = frekuensi komulatif sebelum atau di bawah kelas interval
yang mengandung median
Kelompok yang mengandung Median adalah kelompok yang
frekuensi komulatifnya mangandung angka N
Selanjutnya, kita lihat contoh dari sebuah kumpulan data sebagai berikut:
x fm fk
95 99 0 0
90 94 1 1
85 89 3 4
80 84 3 7
75 79 8 15
70 74 13 28
65 69 19 47
60 64 12 59
55 59 10 69
50 54 4 73
45 49 2 75
40 44 0 75
Kelompok median yang didapat=
N = 37,5
Nilai tersebut berada pada frekuensi
kelompok
2847, sedangkan nilai mediannya
berada pada nilai antara 6574. Kita
tidak tahu nilai median sebenarnya.
Nah, kita masukkan ke dalam rumus.
Didapat angka sbb:
Median = 65 + (5/19)(37,5-28) = 67,5
Contoh lain

Bila data seperti ini, N=9, 13,13,13,13,14,14,16, 18, 21; maka
mediannya adalah 14

Median cocok digunakan bila data yang kita miliki tidak menyebar
normal atau memiliki nilai yang berbeda-beda secara signifikan.
3. Modus adalah skor yang mempunyai frekuensi terbanyak dalam
sekumpulan distribusi skor. Dengan kata lain, Modus dianggap sebagai
nilai yang menunjukan nilai nilai yang lain terkonsentrasi.
X f
5 2
4 6
3 4
2 2
1 1
Contoh Modus:
Angka yang paling
banyak
Muncul adalah 4
yaitu sebanyak
6 kali (frekuensi)
tidak seluruh
distribusi mempunyai
Modus, disebabkan
Modus distribusinya
frekuensinya hanya
satu
X f
8 1
9 1
7 1
4 1
6 1
5 1
X F
90 3
85 5
70 6
65 6
60 6
55 4
50 1
45 1
Bagaimana dengan data ini?
Berapa modusnya?
Variansi dan standar deviasi adalah salah satu penggunaan pengukuran
dari variabel. Keduanya berdasar pada selisih dari setiap nilai dengan
rata-rata distribusinya.
Varians adalah jumlah kuadrat semua deviasi nillai-nilai individual
terhadap rata-rata kelompok. Akar dari varians disebut standar deviasi
atau simpangan baku varians dari populasi diberi simbol dan standar
deviasi adalah sedangkan varian untuk sampel diberi simbol s
2
dan
standar deviasi sampel diberi simbol s.
1
) (
1
2

n
x x
s
n
i
i
x
Dalam statistik deskriptif , boxplot adalah cara yang nyaman untuk
grafis menggambarkan kelompok data numerik melalui kuartil mereka.

kuartil merupakan serangkaian peringkat nilai-nilai data yang membagi
kumpulan data menjadi empat kelompok yang sama.

first quartile (designated Q
1
) = lower quartile = 25th percentile (splits
off the lowest 25% of data from the highest 75%)
second quartile (designated Q
2
) = median = 50th percentile (cuts data
set in half)
third quartile (designated Q
3
) = upper quartile = 75th percentile (splits
off the highest 25% of data from the lowest 75%)
The difference between the upper and lower quartiles is called the
interquartile range (IQR)

Box Plot (Diagram Kotak Box and
Whisker plot)
Peringkasan data
menggunakan diagram
kotak untuk
menggambarkan apakah
data mempunyai outlier
(data ekstrim) atau tidak
Untuk membuat Box Plot, ada beberapa hal yang
harus diketahui :
- Nilai minimum
- Nilai maksimum
- Median (Q
2
= kuartil ke-2)
- Lower Quartile (Q
1
= kuartil ke-1)
- Upper Quartile (Q
3
= kuartil ke-3)
- IQR (Inter Quartile Range ) = Q
3
-Q
1

- LIF (Lower Inner Fence) = Q
1
1,5 IQR
- UIF (Upper Inner Fence) = Q
3
+ 1,5 IQR
- LOF (Lower Outer Fence) = Q
1
3 IQR
- UOF (Upper Outer Fence) = Q
3
+ 3 IQR


Contoh
Misalkan dimiliki data berikut :
5,3 4,0 12,5 3,0 3,9 6,4 5,2 2,6 15,8, 6,2 4,0
7,1 3,4 4,4 3,5 3,4 3,2 5,6 3,2 3,4 8,6 3,1

n = 22, nilai minimum = 2,6, nilai maksimum = 15,8

Data terurut :

2,6 3,0 3,1 3,2 3,2 3,4 3,4 3,5 3,7 3,9 4,0
4,0 4,4 5,2 5,3 5,6 6,2 6,4 7,1 8,6 12,5 15,8
Lokasi Median : (n+1)/2 = 23/2 = 11,5
Median (4,0 + 4,0)/2 = 4,0
Mean = 5,4
Lokasi Q
1
:
(lokasi median dibulatkan ke bawah + 1)/2
yaitu lokasi ke 6 dari nilai minimum
Q
1
= 3,4
Lokasi Q
3
:
(lokasi median dibulatkan ke bawah + 1)/2
yaitu lokasi ke 6 dari nilai maksimum
Q
3
= 6,2

IQR = Q
3
-Q
1
= 6,2 3,4 = 2,8
LIF = Q
1
- 1,5 IQR = 3,4 1,5 (2,8) = - 0,8
UIF = Q
3
+ 1,5 IQR = 6,2 + 1,5 (2,8) = 10,4
LOF = Q
1
- 3 IQR = 3,4 3 (2,8) = - 5
UOF = Q
3
+ 3 IQR = 6,2 + 3 (2,8) = 14,6
Data yang terletak antara LIF dan UIF bukan outlier
Data yang terletak di luar LIF dan UIF adalah
outlier yang dibedakan menjadi 2 yaitu mild
outlier dan extrem outlier



Boxplot - Contoh
Bila semua data terletak terletak
antara LIF dan UIF maka data
tidak memiliki outlier
Data terletak antara IF dan OF
disebut mild outlier (tanda
bulat)
Data terletak di luar OF disebut
extreme outlier (tanda bintang)

Anda mungkin juga menyukai