Anda di halaman 1dari 15

# MODUL

BIOSTATISTIK

STATISTIK DESKRIPTIF
(Box Plot dan Scatter Plot)

## Prof. Dr. Hj. Dewi Laelatul Badriah, M.Kes.,AIFO

Cecep Heriana, S.KM.,MPH

## PROGRAM MAGISTER KESEHATAN MASYARAKAT

SEKOLAH TINGGI ILMU KESEHATAN KUNINGAN
GARAWANGI JAWA BARAT
2020
DAFTAR ISI

DAFTAR ISI ................................................................................................................................ V

## 1.1 BOX PLOT ......................................................................................................................... 7

1.2 SCATTER PLOT ................................................................................................................. 13
1.2.1 KEERATAN HUBUNGAN ............................................................................................. 14
1.2.2 HUBUNGAN POSITIF ................................................................................................. 14
1.2.3 HUBUNGAN NEGATIF ................................................................................................ 15
1.2.4 HUBUNGAN YANG RENDAH ........................................................................................ 15
1.2.5 HUBUNGAN NON-LINER ............................................................................................ 16
1.2.6 PENYEBARAN DATA .................................................................................................. 16
1.2.7 OUTLIER ................................................................................................................. 17
DAFTAR GAMBAR

## Gambar 1. Box plot .................................................................................................. 8

Gambar 2. Contoh Boxplot ...................................................................................... 8
Gambar 3. Komposisi Boxplot ................................................................................ 9
Gambar 4. Kemiringan (Skewness) ....................................................................... 12
Gambar 5. Box-Plot Grup Data ............................................................................. 12
Gambar 6. Scatter Plot ........................................................................................... 13
Gambar 7. Keeratan hubungan Scatter Plot .......................................................... 14
Gambar 8. Satter Plot Hubungan Positif ................................................................ 14
Gambar 9. Scatter Plot Hubungan Negatif ............................................................ 15
Gambar 10. Scatter plot hubungan rendah............................................................. 15
Gambar 11. Scatter Plot hubungan linier ............................................................... 16
Gambar 12. Data menyebar.................................................................................... 16
Gambar 13. Data mengumpul di suatu area ........................................................... 17
Gambar 14. Outlier ................................................................................................ 17
BAB I
STATISTIK FESKRIPTIF
Pokok Bahasan
1. Box Plot
2. Scatter Plot

## 1.1 Box Plot

1.1.1 Definisi
Baik histogram dan stem-and-leaf plots berguna untuk memberikan gambaran ukuran
tendensi sentral dan kesimetrisan data pengamatan. Penyajian grafis lainnya yang bisa
merangkum informasi lebih detail mengenai distribusi nilai-nilai data pengamatan adalah Box
and Whisker Plots atau lebih sering disebut dengan BoxPlot atau Box-Plot (kotak-plot) saja.
Seperti namanya, Box and Whisker, bentuknya terdiri dari Box (kotak) dan whisker. Box plot
merupakan salah satu bentuk penyajian data yang mudah digunakan dan diinterpretasikan
untuk mendeskripsikan suatu variabel. Informasi yang didapatkan dari box plot yaitu nilai rata-
rata (mean), range, nilai tengah (median), normalitas data, serta kemiringan/kemencengan
(skewness/kurtosis) sebaran data. Boxplot merupakan ringkasan distribusi sampel yang
disajikan secara grafis yang bisa menggambarkan bentuk distribusi data (skewness), ukuran
tendensi sentral dan ukuran penyebaran (keragaman) data pengamatan.Selain itu box plot juga
dapat memberikan informasi adanya nilai outlier.
Box plot dapat disajikan dalam bentuk vertikal dan horizontal. Dalam bentuk vertikal
data terkecil terletak paling bawah dan data terbesar terletak paling atas. Jika box plot dalam
bentuk horizontal, data terkecil berada pada sebelah kiri sedangkan data terbesar terletak pada
sebelah kanan. Box plot terdiri dari bagian-bagian yaitu: garis horizontal pada bagian bawah
box menujukan kuartil pertama (Q1) dan garis horizontal pada bagian atas menujukan kuartil
ketiga (Q3). Bidang bagian dalam dari box merupakan jarak antar kuartil (IQR), sedangkan
garis horizontal pada bagian tengah box menujukan nilai tengah (median). Garis vertikal yang
berada diatas dan dibawah box dinamakan whiskers. Garis ini menujukan nilai-nilai yang lebih
tinggi atau lebih rendah dari sekumpulan data yang berada dalam box. Adapun nilai-nilai yang
berada di atas atau dibawah garis whiskers dinamakan nilai ekstrim.
Gambar 1. Box plot

## 1.1.2 Ukuran statistic Box Plot

Terdapat 5 ukuran statistik yang bisa kita baca dari boxplot, yaitu:
a. nilai minimum: nilai observasi terkecil
b. Q1: kuartil terendah atau kuartil pertama
c. Q2: median atau nilai pertengahan
d. Q3: kuartil tertinggi atau kuartil ketiga
e. nilai maksimum: nilai observasi terbesar.
f. Selain itu, boxplot juga dapat menunjukkan ada tidaknya nilai outlier dan
nilai ekstrim dari data pengamatan.

## Gambar 2. Contoh Boxplot

Dari gambar di atas, sepintas kita bisa menentukan beberapa ukuran statistik, meskipun
tidak persis sekali. Nilai statistik pada badan Boxplot: Nilai median ≈ 76, Nilai Q1≈ 69, nilai
Q3 ≈ 87, nilai maksimum ≈ 99, nilai minimum 48, serta nilai-nilai di luar badan Boxplot yang
merupakan nilai outlier berturut-turut sekitar 36, 38 dan 43. Sebaran data tidak simetris, tapi
menjulur ke arah kiri (negatively skewness). Darimana kita bisa menentukan ukuran statistik
dan interpretasi tersebut?
1.1.3 Bentuk Box Plot

Keterangan :
IQR=Inner Quartile Range UIF=Upper Inner Fence
UQ=Upper Quartile LIF=Lower Inner Fence
LQ=Lower Quartile

## Gambar 3. Komposisi Boxplot

a. Box
Bagian utama boxplot adalah kotak berbentuk persegi (Box) yang merupakan bidang
yang menyajikan interquartile range (IQR), dimana 50 % dari nilai data pengamatan terletak
di sana.
Panjang kotak sesuai dengan jangkauan kuartil dalam (inner Quartile Range, IQR) yang
merupakan selisih antara Kuartil ketiga (Q3) dengan Kuartil pertama (Q1). IQR
menggambarkan ukuran penyebaran data. Semakin panjang bidang IQR menunjukkan data
semakin menyebar. Pada Gambar, IQR = UQ – LQ = Q3 – Q1
Garis bawah kotak (LQ) = Q1 (Kuartil pertama), dimana 25% data pengamatan lebih
kecil atau sama dengan nilai Q1
Garis tengah kotak = Q2 (median), dimana 50% data pengamatan lebih kecil atau sama
dengan nilai ini
Garis atas kotak (UQ) = Q3 (Kuartil ketiga) dimana 75% data pengamatan lebih kecil
atau sama dengan nilai Q1
b. Whiskers
Garis yang merupakan perpanjangan dari box (baik ke arah atas ataupun ke arah
bawah) dinamakan dengan whiskers. Whiskers bawah menunjukkan nilai yang lebih rendah
dari kumpulan data yang berada dalam IQR. Whiskers atas menunjukkan nilai yang lebih tinggi
dari kumpulan data yang berada dalam IQR
Panjang whisker ≤ 1,5 x IQR. Masing-masing garis whisker dimulai dari ujung kotak
IQR, dan berakhir pada nilai data yang bukan dikategorikan sebagai outlier (Pada gambar,
batasnya adalah garis UIF dan LIF). Dengan demikian, nilai terbesar dan terkecil dari data
pengamatan (tanpa termasuk outlier) masih merupakan bagian dari Boxplot yang terletak tepat
di ujung garis tepi whiskers. Nilai yang berada di atas atau dibawah whisker dinamakan
nilai outlier atau ekstrim.

## c. Outlier dan Ekstrim

Nilai outlier adalah nilai data yang letaknya lebih dari 1,5 x panjang kotak (IQR),
diukur dari UQ (atas kotak) atau LQ (bawah kotak). Pada Gambar di atas, ada 2 data
pengamatan yang merupakan outlier, yaitu data pada case 33 dan case 55 (ada pada baris ke
33 dan baris 35)
a. Q3 + (1.5 x IQR) < outlier atas ≤ Q3 + (3 x IQR)
b. Q1 – (1.5 x IQR) > outlier bawah ≥ Q1 – (3 x IQR)
Nilai ekstrim adalah nilai-nilai yang letaknya lebih dari 3 x panjang kotak (IQR),
diukur dari UQ (atas kotak) atau LQ (bawah kotak). Pada gambar di atas, ada 1 data yang
merupakan nilai ekstem, yaitu data pada case 15.
a. Ekstrim bagian atas apabila nilainya berada di atas Q3 + (3 x IQR) dan
b. Ekstrim bagian bawah apabila nilainya lebih rendah dari Q1 – (3 x IQR)
1.1.4 Tujuan Box Plot
Boxplots dapat membantu kita dalam memahami karakteristik dari distribusi data.
Selain untuk melihat derajat penyebaran data (yang dapat dilihat dari tinggi/panjang boxplot)
juga dapat digunakan untuk menilai kesimetrisan sebaran data. Panjang kotak menggambarkan
tingkat penyebaran atau keragaman data pengamatan, sedangkan letak median dan panjang
whisker menggambarkan tingkat kesimetrisannya.
a. Jika data simetris (berasal dari distribusi normal):
a) garis median akan berada di tengah box dan whisker bagian atas dan bawah akan
memiliki panjang yang sama serta tidak terdapat nilai outlier ataupun nilai ekstrim.
b) diharapkan nilai-nilai pengamatan yang berada di luar whiskers tidak lebih dari 1%.
b. Jika data tidak simetris (miring), median tidak akan berada di tengah box dan salah satu
dari whisker lebih panjang dari yang lainnya.
a) Adanya outlier di bagian atas boxplot yang disertai dengan whisker bagian atas yang
lebih panjang, menunjukkan bahwa distribusi data cenderung menjulur ke arah kanan
(positive skewness).
b) Sebaliknya, adanya outlier di bagian bawah boxplot yang disertai dengan whisker
bagian bawah yang lebih panjang, menunjukkan bahwa distribusi data cenderung
menjulur ke arah kiri (negatif skewness).
Gambar 4. Kemiringan (Skewness)
Keunggulan Boxplots dibanding dengan Histogram, dotplot, dan stemplot sangat terasa
pada saat kita ingin membandingkan sebaran beberapa kelompok data secara bersamaan.
Sebagai contoh, perhatikan gambar berikut:

## Gambar 5. Box-Plot Grup Data

Kita bisa mengetahui beberapa gambaran informasi dari gambar tersebut. Nilai median
untuk tiga kelompok data adalah sama. (Dengan catatan “ Interpretasi pada perbandingan
ketiga boxplot di atas, tidak memperhatikan asumsi distribusi statistik. Ingat, ukuran pusat
yang digunakan adalah median bukan mean! Grafik boxplot di atas merupakan analisis non-
parametrik)
Terdapat sedikit perbedaan bentuk Box-plot yang di generate beberapa software
statistik, baik dalam bentuknya (tepi whisker, median), ukuran pusat yang digunakan (median
atau mean), maupun arah penggambarannya (ada yang digambarkan secara horizontal dan ada
yang vertical). Namun pada prinsipnya sama. Box-plot pada contoh di atas dibuat dengan
menggunakan Software SPSS. Software Statistica (Statsoft), misalnya, memperbolehkan kita
memilih antara median atau rata-rata untuk dasar pembuatan Box-Plot-nya. Apabila nilai mean
yang digunakan pada Box-plotnya, maka whisker dan batas untuk outlier/ekstrimnya
menggunakan nilai Standar Deviasi (SD) bukan IQR.

## 1.2 Scatter Plot

Scatter plot adalah suatu bentuk penyajian data yang menampilkan satu variabel pada
sumbu horizontal (x) dan variabel lain pada sumbu vertikal (y). Scatterplot berguna untuk
melihat pola hubungan antara dua variabel. Sekaligus melihat kuat lemahnya hubungan dengan
syarat data variabel bersifat interval atau ratio. Selain itu dengan scatterplot kita juga dapat
melihat penyebaran data dan ada tidaknya nilai ekstrim. Scatter plot adalah sebuah grafik yang
biasa digunakan untuk melihat suatu pola hubungan antara 2 variabel. Untuk bisa
menggunakan scatter plot, skala data yang digunakan haruslah skala interval dan rasio.
Hubungan antara dua variabel secara umum dibedakan menjadi tiga yaitu hubungan
positif, hubungan negatif dan tidak ada hubungan. Disebut sebagai hubungan positif jika
kenaikan nilai pada satu variabel akan diikuti oleh kenaikan nilai pada variabel yang lain.
Hubungan negatif menggambarkan penurunan satu nilai pada suatu variabel akan diikuti
kenaikan nilai pada variabel yang lain. Dikatakan tidak ada hubungan apabila kenaikan atau
penurunan nilai suatu variabel tidak menyebabkan kenaikan atau penurunan pada variabel yang
lain.
4000
3500

BBL
3000

2500

2000

20 22 24 26 28
LILA

Gambar 6. Scatter Plot
Berdasarkan grafik diatas dapat kita lihat bahwa kenaikan nilai pada variabel Lingkar
Lengan Atas (LILA) diikuti kenaikan nilai variabel Berat Bayi Lahir (BBL).

1.2.1 Keeratan Hubungan
Hubungan yang membentuk garis lurus biasa disebut dengan hubungan linier.
Hubungan linier bisa bisa membentuk hubungan yang positif dan negatif.

## 1.2.2 Hubungan Positif

Jika plot yang terjadi seperti pada gambar 8, maka variabel 1 dan variabel 2
menunjukkan hubungan yang positif. Peningkatan yang terjadi pada variabel 1 juga diikuti
peningkatan pada variabel 2. Dan jika variabel 1 mengalami penurunan, variabel 2 juga
mengalami penurunan. Bahasa mudahnya adalah kalau naik ya naik semua dan kalau turun ya
turun semua.

## Gambar 8. Satter Plot Hubungan Positif

1.2.3 Hubungan Negatif

## Gambar 9. Scatter Plot Hubungan Negatif

Jika plot yang terjadi seperti pada gambar 9, maka variabel 1 dan variabel 2
menunjukkan hubungan yang negatif. Peningkatan yang terjadi pada variabel 1 diikuti
penurunan oleh variabel 2. Dan jika variabel 1 mengalami penurunan, variabel 2 akan
mengalami peningkatan. Bahasa mudahnya adalah kalau satunya naik yang lain turun dan kalau
satunya turun maka yang lain akan naik.

## Gambar 10. Scatter plot hubungan rendah

Jika plotnya menyebar seperti pada gambar 10, maka bisa disimpulkan bahwa
hubungan antara variabel 1 dengan variabel 2 sangatlah kecil Atau tidak ada hubungan.

1.2.5 Hubungan non-liner

Selain hubungan linier, kita juga bisa melihat hubungan yang lain seperti hubungan non linier.

## Gambar 11. Scatter Plot hubungan linier

Jika plot yang terjadi membentuk curva seperti gambar 11, maka diindikasikan terjadi
hubungan non linier antara 2 variabel.

## 1.2.6 Penyebaran Data

Scatter plot juga bisa digunakan untuk melihat penyebaran data. Apakah data menyebar
ataukah mengumpul disuatu area.

## Gambar 12. Data menyebar

Gambar 13. Data mengumpul di suatu area

1.2.7 Outlier
Scatter plot juga bisa menunjukkan kita adanya outlier. Outlier adalah data yang ekstrim
yang kemungkinan dihasilkan dari situasi yang tidak normal. Kebanyakan peneliti akan
mengambil data outlier ini untuk diteliti lebih lanjut.

REFERENSI

## 1. Rosner, B. (2015). Fundamentals of biostatistics. Nelson Education.

2. Keim, D. A., Hao, M. C., Dayal, U., Janetzko, H., & Bak, P. (2010). Generalized scatter
plots. Information Visualization, 9(4), 301-311.
3. McGill, R., Tukey, J. W., & Larsen, W. A. (1978). Variations of box plots. The American
Statistician, 32(1), 12-16.
4. Potter, K., Hagen, H., Kerren, A., & Dannenmann, P. (2006). Methods for presenting
statistical information: The box plot. Visualization of large and unstructured data sets, 4,
97-106.
5. Pfannkuch, M. (2006). Comparing box plot distributions: A teacher’s reasoning. Statistics
Education Research Journal, 5(2), 27-45.
6. Prasetyowijay, 2019. Penjelasan Scatter Plot
https://www.prasetyowijaya.com/2009/02/scatter-plot.html