Anda di halaman 1dari 10

Chapter 4 Describing data : Displaying and Exploring data

Dot Plots

- Dot plots digunakan untuk melihat data apakah lebih baik / buruk atau data homogen /
heterogen
- Contoh :

Dot Plots :

Measures of Position

Measures of Position juga menggambarkan bentuk distribusi dan dapat dinyatakan sebagai persentil

 Kuartil membagi satu set pengamatan menjadi empat bagian yang sama. Jangkauan antarkuartil
adalah selisih antara kuartil ketiga dan kuartil pertama
 Desil membagi satu set pengamatan menjadi 10 bagian yang sama
 Persentil membagi satu set pengamatan menjadi 100 bagian yang sama

Contoh :

$ 1.460, $ 1.471, $ 1.637, $ 1.721 , $ 1.758 , $ 1.787, $ 1.940 , $ 2.038, $ 2.047 , $ 2.054 , $ 2.097 ,
$ 2.205 , $2.287 , $ 2.311 , $ 2.406

Median :

50
L50 = ( 15 + 1) = 8 (Sehingga median = $ 2.038 atau data ke 8)
100
Quartiles 1 :
25
L25 = ( 15 + 1) = 4 (Sehingga Quartiles 1 = $ 1.721 atau data ke 4)
100
Quartiles 3 :

75
L75 = ( 15 + 1) = 12 (Sehingga Quartiles 3 = $ 2.205 atau data ke 12)
100

Contoh :

Terdapat data : 43, 61, 75, 91, 101, dan104.

Quartiles 1 :

25
L25 = ( 6 + 1) = 1,75
100
Sehingga Quartiles 1 = 43 + [ 0,75 × (61 – 43) ] = 56,5

SEL REF 4-1

a. Max = 105 (paling kanan), min = 79 (paling kiri)


b. 15 (based from the graph, there are 15 dots in 91)
c. Dari 88 sampai 97
a. 7.69 ; 7.72 ; 7.80 ; 7.86 ; 7.90 ; 7.94 ; 7.97 ; 8.06 ; 8.09
Median :

50
L50 = ( 9 + 1) = 5 (Sehingga median = 7,90 atau data ke 5)
100
b. Quartiles 1 :
25
L25 = ( 9 + 1) = 2,5
100
Q1 = 7.72 + [ 0,5 × ( 7.80 – 7.72 )
Q1 = 7.76
Quartiles 3 :
75
L75 = ( 9 + 1) = 7,5
100
Q3 = 7.97 + [ 0,5 × ( 8.06 – 7.97 )]
Q3 = 8,015

a. Min = 4 (paling kiri ) , Max = 19 (Paling kanan)


b. The number of cell phone tend to cluster at 11

a. Quartiles 1 :
25
L25 = ( 30 + 1) = 7,75
100
Q1 = 31 + [ 0,75 × ( 34 – 31 )
Q1 = 33.25
Quartiles 3 :
75
L75 = ( 30 + 1) = 23,25
100
Q3 = 50 + [ 0,25 × ( 51 – 50 )]
Q3 = 50,25
b. Decile 2
20
L20 = ( 30 + 1) = 6,2
100
L20 = 27 + [ 0,2 × ( 31 - 27 )
L20 = 27,8
Decile 8
80
L80 = ( 30 + 1) = 24,8
100
L80 = 51 + [ 0,8 × ( 53 - 51 )
L80 = 52,6
c. 67 Precentile
67
L67 = ( 30 + 1) = 20.77
100
L67 = 47 + [ 0,77 × ( 47 - 47 )
L67 = 47

a. Median :
50
L50 = ( 40 + 1) = 20,5
100
Median = 57 + [ 0,5 × (59 – 57)] = 58
b. Quartiles 1 :
25
L25 = ( 40 + 1) = 10,25
100
Q1 = 51 + [ 0,25 × ( 52 – 51 )
Q1 = 51.25
Quartiles 3 :
75
L75 = ( 40 + 1) = 30,75
100
Q3 = 66 + [ 0,75 × ( 66 - 66)
Q3 = 66
c. Decile 1
10 Jadi, 10% dari jumlah profesor yang mengunjungi
L10 = ( 40 + 1) = 4,1 minggu lalu ≤ 453 orang
100
D1 = 45 + [ 0,2 × ( 48 - 45) Jadi, 90% dari jumlah profesor yang mengunjungi
D1 = 45,3 minggu lalu ≤ 764 orang
Decile 9
90 Jadi, 33% dari jumlah profesor yang mengunjungi
L90 = ( 40 + 1) = 36,9 minggu lalu ≤ 63,53 orang
100
D9 = 71 + [ 0,9 × ( 77 -71 )]
D9 = 76,4
d. 33 Precentile
33
L33 = ( 40 + 1) = 13,53
100
P33 = 53 + [ 0,53 × ( 54 - 53 )
P33 = 53,53

BOX PLOT

Tampilan grafik yang menunjukkan bentuk umum dari distribusi variabel. Ini didasarkan pada lima
statistik deskriptif: nilai maksimum, Nilai minimum, kuartil 1, kuartil 3, dan median.

Rentang interkuartil : Q3 – Q1

Contoh :

Alexander's Pizza menawarkan pengiriman pizza gratis dalam jarak 15 mil. Berapa lama pengiriman
biasa? Dalam rentang berapa sebagian besar pengiriman akan diselesaikan?

Menggunakan sampel 20 pengiriman, Alexander menentukan hal berikut:

 Nilai minimum = 13 menit


 Q1 = 15 menit
 Median = 18 menit
 Q3 = 22 menit
 Nilai maksimum = 30 menit

Kembangkan plot kotak untuk waktu pengiriman :

Menceng ke kanan (Positif)

OUTLIER Sebuah titik data yang sangat jauh dari yang lain (berada di luar area / ekstrim). Aturan
yang diterima adalah untuk mengklasifikasikan pengamatan sebagai outlier jika :

Outlier Tinggi : Outlier Rendah :


 Nilai terkecil = 10
 Nilai terbesar = 85
 kuartil 1 = 25
 Kuartil 3 = 60.
 Nilai median = 40.
 Kemencengan ke kanan (positif)
 Outlier atas : 60 + 1.5 (60-25) = 112,5
 Outlier bawah : 25 - 1.5 (60-25) = -27,5
 Tidak ada outlier. Karena nilai minimum (10) masih diatas outlier bawah (27,5) , dan nilai
maksimum (85) masih di bawah outlier atas (112,5)

Common Shapes of Data

Rumus untuk menentukan koefisien kemiringan :


Jika + maka kemiringannya positif (positively skewed)

Jika - maka kemiringannya negatif (negatively skewed)

Jika 0 atau mendekati 0 maka kemiringannya relative symmetric

Contoh :

Berikut adalah laba per saham untuk sampel 15 perusahaan perangkat lunak untuk tahun 2018. Laba
per saham disusun dari yang terkecil hingga terbesar.

Positively skewed

405
a. x = 5 = 81.4,


s = 923,2 =¿ ¿15.19
5−1
Median = 84
3(81.4−84)
b. sk = = −0.51
15.19
5
c. sk = ( 4)(3) [−1.3154] = −0.5481
d. The distribution is somewhat negatively skewed.
Scatter Diagrams
Y dipengaruhi variabel x.
contoh : biaya maintenance itu dipengaruhi oleh usia mobil (usia mobil mempengaruhi
biaya maintenance) sehingga x = usia mobil, y = biaya maintenance
Bus maintenance Cost termasuk
slope positif sehingga: Seiring
bertambahnya usia bus, biaya
pemeliharaan tahunan juga
meningkat.
Correlation Coefficient

 Sebuah statistik yang disebut koefisien korelasi dapat dihitung untuk mengukur arah dan
kekuatan hubungan antara dua variabel
 Dapat berkisar dari -1.0 hingga +1.0
 Semakin dekat koefisiennya dengan + 1.0 atau -1,0, semakin kuat hubungannya
 Jika r mendekati 0 kita dapat mengatakan bahwa tidak ada hubungan antara variabel

n = jumlah data x dan y


Contingency Tables
TABEL KONTINGENSI Sebuah tabel yang digunakan untuk mengklasifikasikan pengamatan
menurut dua karakteristik yang dapat diidentifikasi.
Kedua variabel hanya perlu nominal atau ordinal
Contoh :
Perbandingan keuntungan Applewood Auto Group
90 dari 180 mobil yang terjual memiliki keuntungan di atas median dan setengahnya di
bawah. Ini memenuhi definisi median.
Persentase keuntungan di atas median adalah
25
Kane : × 100% = 48%,
52
20
Olean : × 100% = 50%,
40
19
Sheffield : × 100% = 42% ,
45
26
Tionesta : × 100% = 60%
43
EXERCISE

Karena Correlation Coefficientnya o,86 (mendekati 0 maka hubungannya kuat dan positif sehingga
jika x bertambah y juga ikut bertambah)
a. Nominal karena data hanya bisa diklasifikasikan dan dihitung tidak ada urutan
b. Tabel Contigency karena menunjukkan hubungan antara makanan penutup yang dipesan
pada waktu yang berbeda dalam sehari
c. Iya, karena total diakhir adalah 117 yang memilih yes > 83 yang memilih no
32
d. Tidak karena hanya ×100 %=¿ 32 % orang yang memilih yes
100
85
e. Iya, karena yang memilih yes sebanyak ×100 %=¿ 85 %
100

a. Opinion : Ordinal, Number of Shares Held : Rasio


b. Contingency Table
c. Grup yang memiliki opini oppered adalah stokeholders yang punya shares over 1000
yaitu sebanyak 12 dari 26 opini atau 46,154%

Anda mungkin juga menyukai