Cara menuliskan five number summar adalah sesuai dengan buku tukey hanya dalam perkuliahan
selanjutnya ketika nilai hinges atau median berada ditengah dua data, seperti di antara data ke-7
dan ke-8, dalam buku tukey dituliskan M7h namun dalam perkuliahan untuk memudahkan biasanya
dituliskan M7,8
A. BOX PLOT
a. Pengertian
Box plot atau diagram kotak merupakan ringkasan distribusi sampel yang disajikan secara grafis
yang bisa menggambarkan bentuk distribusi data, ukuran tendensi sentral, dan ukuran penyebaran
data pengamatan
b. Bagian-bagian Box plot
1. Box
Panjang box: IQR=Q 3 −Q 1
2. Whisker: merupakan garis perpanjangan dari box yang panjangnya ≤ 1,5. IQR
Terdapat dua macam whisker:
a. Whisker atas: berisi kumpulan data yang nilainya lebih besar daripada nilai yang berada
di IQR
b. Whisker bawah: berisi kumpulan data yang nilainya lebih kecil daripada nilai yang berada
di IQR
3. Outlier
Ada 2 macam outlier:
1. Outlier atas ¿ nilai >Q 3 + ( 1,5× IQR )
2. Outlier bawah ¿ nilai >Q 1−( 1,5 × IQR )
c. Kegunaan
1. Mengetahui 5 number summary
2. Mendeteksi ada atau tidaknya outlier
3. Memahami karakteristik data, dengan cara:
1) Panjang kotak menunjukkan penyebaran atau keragaman suatu data
2) Letak median dan panjang whiskernya menunjukan kesimetrisan data tersebut
d. Interpretasi (dengan melihat garis median)
POPULASI 50 NEGARA
1*
2 3,9
3 9,3
4 5,
5*
6 3,7,7,1,3,8
7 6,
8 9,
9* 7,5
1** 30,79,74,41,77,86
2 54,76,18,18,33,38,85
3 27,94,04,26,10,41,57,97,95
4 95,66,32,56
5** 15,
6 07,
7 82,
8
9** 71,58
1**** 572,008,678,132
2
400
350
300
250
200
150
100
50
0
1
Kita sekarang perlu melihat lebih keras pada kelebihan dan kekurangan plot skematik. Mari kita
mulai dengan contoh yang menunjukkan kelemahan dan kekuatan mereka. Selama musim dingin
1893-94, Lord Rayleigh sedang menyelidiki kepadatan nitrogen dari berbagai sumber. Dia
sebelumnya telah menemukan indikasi ketidaksesuaian antara kepadatan nitrogen yang dihasilkan
dengan mengeluarkan oksigen dari udara dan nitrogen yang dihasilkan oleh penguraian senyawa
kimia. Hasil 1893-94 membuktikan perbedaan ini dengan kepastian yang hebat, dan membawanya
untuk menyelidiki lebih lanjut komposisi udara yang dibebaskan secara kimia dari oksigen. Ini
mengarah pada penemuan argon, elemen gas baru.
gambar menunjukkan titik dan plot skematik untuk 15 bobot nitrogen Rayleigh yang diperlakukan
sebagai satu kesatuan. Di sini masalah utamanya adalah pemisahan yang begitu tajam menjadi dua
subkelompok yang cukup terisolasi. Hal ini jelas diperlihatkan melalui nilai-nilai dari plot titik yang
hampir sepenuhnya ditutupi oleh schematic plot. (Hanya hampir, karena pengamat yang
berpengalaman menemukan kumis begitu pendek dibandingkan dengan panjang kotak dan
membuatnya cenderung untuk mengamati lebih detail. Oleh karena itu, Jelas kita tidak bisa
mengandalkan schematic plot untuk meberikan perhatian kita yang lebih untuk membuat struktur
yang dekan dengan pusat dari sekumpulan data; kita harus menggunakan beberapa pendekatan lain
jika dibutuhkan. (Entah dot plot atau tampilan batang-dan-Ieaf akan berfungsi.)
GAMBAR DI BAWAH INI MENUNJUKKAN KEANEHAN DALAM HAL DATANAY HANYA BERKUMPUL
DI SUATU TITIK
penggunaan yang lebih baik
<> kecenderungan ringan dari "sumber lain" bobot untuk bergerak ke atas - terlihat, tetapi tidak
memperlihatkan nilai dasar untuk menjelaskan perbedaan mereka dari nilai udara.
<> kemungkinan variabilitas yang lebih besar dari "sumber lain" bobot, lebih dan
di luar kesulitan ini. Variabilitas adalah derajat penyebaran nilai-nilai variabel dari suatu tendensi sentral
dalam suatu distribusi. Variabilitas disebut juga sebagai dispersi. Jika dua distribusi, misalnya distribusi A
dan B diperbandingkan. Distribusi A menunjukkan penyebaran nilai-nilai yang lebih besar dari distribusi B,
maka dikatakan distribusi A mempunyai variabilitas yang lebih besar dari distribusi B.
GAMBAR DI BAWAH MENUNJUKKAN BAHWA UNTUK MEMUDAHKAN ANALISIS, KITA DAPAT
MEMISAHKAN DATA-DATA YANG BERKUMPUL PADA SUATU TITIK MENJADI BEBERAPA BAGIAN SESUAI
LETAK DIMANA DATA TERSEBUT BERKUMPUL. ARTINYA, BOX PLOT BOLEH DIPISAH KETIKA DATA
CENDERUNG BERPUSAT PADA SATU/2 LEBIH TITIK
NAMUN, KENYATAANNYA GAMBAR YANG DINILAI DAPAT MEMBANTU INI TERNYATA JUSTRU
MEMBUAT ANALSIS MENJADI RUMIT ATAU GAGAL. HAL INI DISEBABKAN OLEH DATANYA YANG
DIANGGAP HOMOGEN.
Jelas, kita dapat menggunakan SCHEMATIC PLOT dalam membandingkan tiga, empat, atau lebih
dalam sejumlah kumpulan data (Ketika jumlah kumpulan data menjadi besar,kita mungkin ingin
membuat diagram batang untuk memudahkan atau bisa juga dengan garis putus-putus. Sebagai
pendekatan visual untuk sebagian besar perbandingan, terutama ketika ditambahkan dengan
melihat lebih rinci residu, plot ini bekerja dengan sangat baik yang sering memberikan perbandingan
yang sangat efektif. Membandingkan lebih dari beberapa adalah sesuatu yang tidak bisa dilakukan
oleh stem-and-leaf dengan baik. Tampilan yang melibatkan lebih dari dua - atau mungkin tiga - stem-
and-leaf cenderung meninggalkan kita tanpa penjelasan yang jelas.
<> memusatkan perhatian di tempat/kumpulan data yang dinilai paling mungkin berguna.