Anda di halaman 1dari 7

Sebelum masuk ke box plot, baiknya kita mengingat terlebih dahulu tentang five number summary.

Cara menuliskan five number summar adalah sesuai dengan buku tukey hanya dalam perkuliahan
selanjutnya ketika nilai hinges atau median berada ditengah dua data, seperti di antara data ke-7
dan ke-8, dalam buku tukey dituliskan M7h namun dalam perkuliahan untuk memudahkan biasanya
dituliskan M7,8

A. BOX PLOT
a. Pengertian
Box plot atau diagram kotak merupakan ringkasan distribusi sampel yang disajikan secara grafis
yang bisa menggambarkan bentuk distribusi data, ukuran tendensi sentral, dan ukuran penyebaran
data pengamatan
b. Bagian-bagian Box plot
1. Box
Panjang box: IQR=Q 3 −Q 1
2. Whisker: merupakan garis perpanjangan dari box yang panjangnya ≤ 1,5. IQR
Terdapat dua macam whisker:
a. Whisker atas: berisi kumpulan data yang nilainya lebih besar daripada nilai yang berada
di IQR
b. Whisker bawah: berisi kumpulan data yang nilainya lebih kecil daripada nilai yang berada
di IQR
3. Outlier
Ada 2 macam outlier:
1. Outlier atas ¿ nilai >Q 3 + ( 1,5× IQR )
2. Outlier bawah ¿ nilai >Q 1−( 1,5 × IQR )
c. Kegunaan
1. Mengetahui 5 number summary
2. Mendeteksi ada atau tidaknya outlier
3. Memahami karakteristik data, dengan cara:
1) Panjang kotak menunjukkan penyebaran atau keragaman suatu data
2) Letak median dan panjang whiskernya menunjukan kesimetrisan data tersebut
d. Interpretasi (dengan melihat garis median)

e. Cara menggambar box plot


Dalam buku Statistics The Exploration & Analysis of Data yang ditulis oleh Roxy Peck dan Jay L.
Devore langkah-langkah dalam membangun box plot sebagai berikut :
1) Urutkan data dari yang terkecil
2) Tentukan Q 1 ,Q 2 , dan Q 3
3) menggambarkan skala pengukuran horizontal atau vertikal.
4) menggambarkan kotak persegi panjang dengan panjang kotak adalah iqr.
5) menggambarkan segmen garis vertikal (atau horizontal) di dalam kotak di lokasi dari median.
6) Perpanjang segmen garis horizontal (atau vertikal), yang disebut whiskers, dari masing-
masing ujung kotak untuk pengamatan terkecil dan terbesar dalam kumpulan data.

CONTOH SOAL EXHIBIT 4 CHAPTER 2 (halaman 39)

POPULASI 50 NEGARA

1*
2 3,9
3 9,3
4 5,
5*
6 3,7,7,1,3,8
7 6,
8 9,
9* 7,5

1** 30,79,74,41,77,86
2 54,76,18,18,33,38,85
3 27,94,04,26,10,41,57,97,95
4 95,66,32,56
5** 15,
6 07,
7 82,
8
9** 71,58

1**** 572,008,678,132
2

FIVE NUMBER SUMMARY

50 populasi dalam puluhan ribu


GAMBAR BOX PLOT
450

400

350

300

250

200

150

100

50

0
1

PROS AND CONS

Kita sekarang perlu melihat lebih keras pada kelebihan dan kekurangan plot skematik. Mari kita
mulai dengan contoh yang menunjukkan kelemahan dan kekuatan mereka. Selama musim dingin
1893-94, Lord Rayleigh sedang menyelidiki kepadatan nitrogen dari berbagai sumber. Dia
sebelumnya telah menemukan indikasi ketidaksesuaian antara kepadatan nitrogen yang dihasilkan
dengan mengeluarkan oksigen dari udara dan nitrogen yang dihasilkan oleh penguraian senyawa
kimia. Hasil 1893-94 membuktikan perbedaan ini dengan kepastian yang hebat, dan membawanya
untuk menyelidiki lebih lanjut komposisi udara yang dibebaskan secara kimia dari oksigen. Ini
mengarah pada penemuan argon, elemen gas baru.

Date Source of “nitrogen” Weight


origin Purifying agent
29 Nov. ‘93 NO Hot iron 2,30143
5 Dec. ‘93 “ “ 2,29816
6 Dec. ‘93 “ “ 2,30182
8 Dec. ‘93 “ “ 2,29890
12 Dec. ‘93 Air “ 2,31017
14 Dec. ‘93 “ “ 2,30986
19 Dec. ‘93 “ “ 2,31010
22 Dec. ‘93 “ “ 2,31001
26 Dec. ‘93 N2O “ 2,29889
28 Dec. ‘93 “ “ 2,29940
9 Jan. ‘94 NH4NO2 “ 2,29849
13 Jan. ‘94 “ “ 2,29889
27 Jan. ‘94 Air Ferrous hydrate 2,31024
30 Jan. ‘94 “ “ 2,31030
1 Feb. ‘94 “ “ 2,31028

DOT AND SCHEMATIC PLOTS

gambar menunjukkan titik dan plot skematik untuk 15 bobot nitrogen Rayleigh yang diperlakukan
sebagai satu kesatuan. Di sini masalah utamanya adalah pemisahan yang begitu tajam menjadi dua
subkelompok yang cukup terisolasi. Hal ini jelas diperlihatkan melalui nilai-nilai dari plot titik yang
hampir sepenuhnya ditutupi oleh schematic plot. (Hanya hampir, karena pengamat yang
berpengalaman menemukan kumis begitu pendek dibandingkan dengan panjang kotak dan
membuatnya cenderung untuk mengamati lebih detail. Oleh karena itu, Jelas kita tidak bisa
mengandalkan schematic plot untuk meberikan perhatian kita yang lebih untuk membuat struktur
yang dekan dengan pusat dari sekumpulan data; kita harus menggunakan beberapa pendekatan lain
jika dibutuhkan. (Entah dot plot atau tampilan batang-dan-Ieaf akan berfungsi.)

GAMBAR DI BAWAH INI MENUNJUKKAN KEANEHAN DALAM HAL DATANAY HANYA BERKUMPUL
DI SUATU TITIK
penggunaan yang lebih baik

Gambar di bawah menggunakan schematic plot untuk membandingkan 2 sekumpulan data. Di


dalamnya, dua batch Bobot Rayleigh, satu untuk "nitrogen" dari udara, yang lain untuk "nitrogen"
dari sumber lain, ditetapkan dan dibandingkan. Informasi yang sangat jelas didapatkan dari gambar
di bawah ini adalah:

<> perbedaan yang relatif besar antara batch.

<> kecenderungan ringan dari "sumber lain" bobot untuk bergerak ke atas - terlihat, tetapi tidak
memperlihatkan nilai dasar untuk menjelaskan perbedaan mereka dari nilai udara.

<> kemungkinan variabilitas yang lebih besar dari "sumber lain" bobot, lebih dan

di luar kesulitan ini. Variabilitas adalah derajat penyebaran nilai-nilai variabel dari suatu tendensi sentral
dalam suatu distribusi. Variabilitas disebut juga sebagai dispersi. Jika dua distribusi, misalnya distribusi A
dan B diperbandingkan. Distribusi A menunjukkan penyebaran nilai-nilai yang lebih besar dari distribusi B,
maka dikatakan distribusi A mempunyai variabilitas yang lebih besar dari distribusi B.
GAMBAR DI BAWAH MENUNJUKKAN BAHWA UNTUK MEMUDAHKAN ANALISIS, KITA DAPAT
MEMISAHKAN DATA-DATA YANG BERKUMPUL PADA SUATU TITIK MENJADI BEBERAPA BAGIAN SESUAI
LETAK DIMANA DATA TERSEBUT BERKUMPUL. ARTINYA, BOX PLOT BOLEH DIPISAH KETIKA DATA
CENDERUNG BERPUSAT PADA SATU/2 LEBIH TITIK

BENTUK LAIN YANG DIANGGAP BISA MEMUDAHKAN ANALISIS

NAMUN, KENYATAANNYA GAMBAR YANG DINILAI DAPAT MEMBANTU INI TERNYATA JUSTRU
MEMBUAT ANALSIS MENJADI RUMIT ATAU GAGAL. HAL INI DISEBABKAN OLEH DATANYA YANG
DIANGGAP HOMOGEN.
Jelas, kita dapat menggunakan SCHEMATIC PLOT dalam membandingkan tiga, empat, atau lebih
dalam sejumlah kumpulan data (Ketika jumlah kumpulan data menjadi besar,kita mungkin ingin
membuat diagram batang untuk memudahkan atau bisa juga dengan garis putus-putus. Sebagai
pendekatan visual untuk sebagian besar perbandingan, terutama ketika ditambahkan dengan
melihat lebih rinci residu, plot ini bekerja dengan sangat baik yang sering memberikan perbandingan
yang sangat efektif. Membandingkan lebih dari beberapa adalah sesuatu yang tidak bisa dilakukan
oleh stem-and-leaf dengan baik. Tampilan yang melibatkan lebih dari dua - atau mungkin tiga - stem-
and-leaf cenderung meninggalkan kita tanpa penjelasan yang jelas.

Keuntungan utama dari schematic plot adalah:

<> memusatkan perhatian di tempat/kumpulan data yang dinilai paling mungkin berguna.

<> mengurangi "kesibukan" ke titik di mana banyak batch dapat dibandingkan.

Anda mungkin juga menyukai