Anda di halaman 1dari 44

Modul 2

Descriptive Statistics

Tujuan Pembelajaran
Menjelaskan bagaimana mengumpulkan dan mengorganisasi data
mentah ke dalam suatu susunan dan bagaimana membuat dan
menginterpretasikan sebuah distribusi frekuensi
Menyajikan data secara grafis dalam bentuk histogram, poligon
frekuensi, diagram batang, diagram garis, pie charts, piktogram, dll
Menghitung ukuran-ukuran pemusatan dan penyebaran

Pokok Bahasan
Pengumpulan, Pengorganisasian, dan
Penyajian Data
Distribusi Frekuensi dan Presentasi Grafik
Ukuran Pemusatan
Ukuran Penyebaran

Pengumpulan, Pengorganisasian, dan

Penyajian Data

Pengumpulan data

Pengumpulan, Pengorganisasian, dan

Penyajian Data

Pengorganisasian data

Data Mentah (Raw data)


Data terkumpul yang belum diorganisasikan secara
numerik
Tidak memberi banyak arti bagi yang membaca terlebih
lagi untuk dapat menyimpulkan informasi apa yang bisa
diperoleh
Jajaran Data (Data Array)
Sebuah jajaran data merupakan susunan dari data mentah
menurut urutan besar nilai numeriknya secara:
menaik (ascending) dari nilai yang terkecil sampai
terbesar
menurun (descending) dari yang terbesar sampai
terkecil

Pengumpulan, Pengorganisasian, dan

Penyajian Data

Contoh :

Data mentah jika dibuat disusun menjadi jajaran data dengan urutan menaik
(ascending) adalah sebagai berikut:
923

1051

1090

1141

1162

1196

1225

1264

1302

1368

924

1051

1094

1146

1163

1197

1231

1270

1303

1393

931

1055

1095

1146

1170

1200

1233

1273

1312

1399

939

1055

1106

1150

1171

1205

1233

1273

1314

1406

1020

1058

1110

1152

1175

1208

1235

1274

1316

1416

1021

1062

1124

1152

1181

1209

1246

1275

1327

1437

1028

1065

1133

1156

1185

1216

1249

1285

1333

1449

1040

1077

1136

1158

1185

1217

1250

1289

1338

1464

1042

1081

1141

1160

1186

1218

1254

1290

1341

1482

1042

1083

1141

1161

1192

1218

1258

1298

1361

1492

Pengumpulan, Pengorganisasian, dan

Penyajian Data

Penyajian data
Tabel-tabel dan
diagram statistik
digunakan untuk
menyajikan data
yang sudah
teringkas,
menyingkapkan
hubungan-hubungan
antar variabel, dan
mengkomunikasikan
fakta-fakta angka
kepada pihak yang
membutuhkannya

Distribusi Frekuensi
Distribusi frekuensi
Susunan data yang terbentuk dengan mengelompokkan jajaran
data ke dalam kelas-kelas/kategori-kategori yang jumlahnya
relatif tidak banyak, dan kemudian menentukan jumlah data
yang termasuk dalam masing-masing kelas (frekuensi kelas)
Jika frekuensi kelas dinyatakan dalam prosentase terhadap
banyaknya seluruh data, maka disebut distribusi frekuensi
relatif.
Breaking
Stress (kN/m2)
900
1000
1100
1200
1300
1400

999
1099
1199
1299
1399
1499

Total (n)

Jumlah
Spesimen
(f)

Prosentase
[f/n x
100(%)]

4
19
29
28
13
7

4
19
29
28
13
7

100

100 %

Interval Kelas (Class


Interval) dan Batas
Kelas (Class Limit)
Batas Nyata Kelas
(Class Boundary)
Lebar Interval Kelas
(Width of Interval
Class)
Nilai Tengah Kelas
(Class Midpoint/Class
Mark)

Distribusi Frekuensi
Pertimbangan penyusunan distribusi frekuensi
Interval kelas :
seluruh data (terkecil s/d terbesar ) terikut-sertakan
setiap unit data hanya dimasukkan sekali dan hanya
pada satu kelas interval
Jumlah interval kelas (k) antara 5 sampai 20
Lebar setiap interval kelas (c) sama
Rumus empiris:
R
- data sedikit:
R range
c

k
k 1 3,33log n

n jumlah data

- data banyak:
Kelas terbuka (open class interval) dihindari
Nilai tengah kelasnya (midpoint) bersesuaian dengan nilai
dimana data aktual terkonsentrasi

Presentasi Grafik
Histogram
grafik batang (bar graph) yang menggambarkan distribusi data dari
sebuah distribusi frekuensi
Karakteristik Histogram:
dasarnya pada sumbu horizontal (sumbu-x) mempunyai panjang
sama dengan lebar interval kelas
luasnya proporsional terhadap frekuensi interval kelas yang
bersangkutan:
jika interval kelas memiliki lebar yang sama, maka ketinggian
batang proporsional terhadap frekuensi interval kelas
jika ada interval kelas yang lebarnya tidak sama maka
ketinggiannya harus disesuaikan

Presentasi Grafik
Contoh Histogram Dengan Interval Sama
Distribusi frekuensi dari tegangan rusak pada contoh sebelumnya memiliki
interval kelas yang sama lebarnya. Maka histogramnya dapat digambarkan
sebagai berikut:
Pengujian Tegangan Rusak
(Breaking stress) Logam X

900
1000
1100
1200
1300
1400

999
1099
1199
1299
1399
1499

Total

Frekuensi
(f)

4
19
29
28
13
7

25

Jumlah spesimen (f)

Breaking
Stress (kN/m2)

30

20

15

10

100
900

1000

1100

1200

1300

1400

Breaking Stress (kN/m2)

1500

Presentasi Grafik
Contoh Histogram Dengan Interval Tidak Sama
Suatu distribusi frekuensi dari waktu diam pabrik perbulan sejumlah 70
buah mesin produksi suatu seperti yang ditunjukkan dalam tabel di bawah
Pengujian Tegangan Rusak
(Breaking stress) Logam X
Waktu diam
(jam)

(f)

50-59
60-69
70-79
80-89
90-99
100-119
120-179

8
10
16
15
10
8
3

Total

70

25

Frekuensi

20

15

10

50

60

70

80

90

100

120

Waktu Diam (jam)

180

Presentasi Grafik
Poligon Frekuensi
Grafik garis dari frekuensi interval kelas yang diplot pada nilai
tengah-nilai tengahnya
Poligon bisa didapat dengan menghubungkan titik tengah dari sisi
atas batang-batang histogram

Jumlah spesimen (f)

30

Poligon frekuensi

25
20
15
10
5

900

1000

1100

1200

Breaking
(kN/m2)

1300

1400

Stress

1500

Presentasi Grafik
Distribusi Frekuensi Kumulatif
DFK kurang dari, disusun dengan menjumlahkan seluruh frekuensi
dari semua nilai yang kurang dari batas atas nyata interval kelas
(upper class boundary)
DFK lebih dari, disusun dengan menjumlahkan seluruh frekuensi
dari semua nilai yang lebih dari atau sama dengan batas bawah
nyata interval kelas (lower class boundary)
distribusi frekuensi kumulatif direpresentasikan dalam grafik yang
disebut ogive
Jika banyaknya data dalam distribusi tersebut dinyatakan dalam
prosentase terhadap banyaknya seluruh data disebut distribusi
frekuensi kumulatif relatif

Presentasi Grafik
Contoh Distribusi Frekuensi Kumulatif

Breaking Stress
(kN/m2)

< 899,5
< 999,5
<1099,5
<1199,5
< 1299,5
< 1399,5
< 1499,5

Jumlah
(fc)

0
4
23
52
80
93
100

100

Jumlah kumulatif (fc)

Pengujian
Tegangan
Rusak
(Breaking stress) Logam
X

80

60

40

20

899,5

999,5

1099,5

1199,5

1299,5

Breaking Stress (kN/m2)

1399,5

1499,5

Presentasi Grafik
Kurva Frekuensi

Ukuran Pemusatan
Ukuran Pemusatan (Central Tendency)
Data sering menunjukkan kecenderungan berkumpul di sekitar
suatu nilai pusat
data tak terkelompok (ungrouped data)
data terkelompok (grouped data)
Dalam rumusannya juga dibedakan antara ukuran yang
menunjukkan karakteristik populasi (parameter) maupun sampel
(statistik)

Ukuran Pemusatan
Rata-rata (Average)
1. Mean Aritmatika
a. Data Tak Terkelompok
n

xi
i 1

(untuk suatu sampel)

xi
i 1

(untuk suatu populasi)

dimana: x = mean aritmatika dari suatu sampel


X = mean aritmatika dari suatu populasi
xi = nilai dari data (variabel x)
n = banyaknya data x dalam suatu sampel
N = banyaknya data x dalam suatu populasi

Ukuran Pemusatan
Rata-rata (Average)
1. Mean Aritmatika
b. Data Terkelompok
k

fi xm ,i
i 1

fi

fi xm,i

i 1

(untuk suatu sampel)

i 1
K

fi xm ,i
i 1

fi

f i xm , i
i 1

(untuk suatu populasi)

i 1

dimana: x = mean aritmatika dari suatu sampel


X = mean aritmatika dari suatu populasi
f i = frekuensi atau jumlah pengamatan dalam sebuah interval kelas
xm ,i = nilai tengah dari interval kelas
k = jumlah interval kelas dalam suatu sampel
K = jumlah interval kelas dalam suatu populasi
n = banyaknya data x dalam suatu sampel
N = banyaknya data x dalam suatu populasi

Ukuran Pemusatan
Contoh 2.3:
Mean aritmatika dari data sampel tegangan rusak yang terdiri
dari 100 data yang belum terkelompokkan adalah:
n

100

xi xi
i 1

i 1

100

1171 1186 1264 ... 1090


1198,5
100

Contoh 2.4:
Mean aritmatika dari data sampel tegangan rusak yang terdiri
dari 100 data yang sudah terkelompokkan adalah:
k

fi xm,i fi xm,i
i 1

fi
i 1

i 1

fi
i 1

(4)(949,5) (19)(1049,5) ... (7)(1449,5)


1197,5
4 19 ... 7

Ukuran Pemusatan
Rata-rata (Average)
2. Mean Aritmatika Terbobot
Pemberian suatu pembobotan terhadap suatu nilai untuk
menunjukkan signifikansi atau kepentingan/keutamaan relatif dari
nilai tersebut
Mean aritmatika yang diperoleh dari nilai yang diberi pembobotan
itu disebut mean aritmatika terbobot

xw

wi xi
i 1
n

wi
i 1

xw
= mean aritmatika
terbobot
wi = faktor pembobotan

Ukuran Pemusatan
Contoh 2.5:
Jika dalam suatu nilai akhir mata kuliah statistik nilai ujian
akhir berbobot 3 kali daripada ujian tengah semester dan
tugas, maka seorang mahasiswa yang memperoleh nilai ujian
akhir 85 dan ujian tengah semester 70 dan tugas 90 akan
memperoleh nilai:
n

wi xi

(3)(85) (1)(70) 1(90) 415


xw

83
3 11
5
w
i
i 1
n

i 1

Ukuran Pemusatan
Median
Posisi tengah dari nilai data terjajar (data array)
Nilai dari absis-x yang bertepatan dengan garis vertikal yang
membagi sebuah histogram (atau daerah di bawah poligon)
menjadi dua daerah yang luasnya sama
a. Data Tak Terkelompok
Nilai tengah atau mean aritmatika dari dua nilai tengah suatu jajaran
data (array)

b. Data Terkelompok (Prinsip Interpolasi)


n

2 ( f )l
Median x% Ll
c
f
median

Ll
n

= batas nyata kelas bawah dari kelas median (kelas yang memuat median)
= banyaknya data (jumlah seluruh frekuensi)
( f )l
= jumlah frekuensi seluruh kelas yang lebih rendah dari kelas median
fmedian = frekuensi kelas median
c
= lebar interval kelas median

Ukuran Pemusatan
Contoh 2.5:
Median dari jajaran data sampel tegangan rusak yang terdiri
dari 100 data yang belum terkelompokkan adalah nilai tengah
data ke-50 dan ke-51:
Median x%

1192 1196
1194
2

Contoh 2.6:
Median dari data sampel tegangan rusak yang terdiri dari 100
data yang sudah terkelompokkan adalah:
n

100

(
f
)
2 l
2 23
Median x% Ll
c 1099,5
100 1192, 6
f median
29

Ukuran Pemusatan
Modus
Nilai yang paling sering muncul atau yang frekuensinya terbesar
dalam suatu kumpulan nilai data
Modus ini mungkin ada mungkin juga tidak, dan kalaupun ada
tidak selalu unik (tunggal)

a. Data Tak Terkelompok


Nilai data yang paling sering muncul (frekuensinya paling
besar)
b. Data Terkelompok (Prinsip Interpolasi)

1
Modus x Ll
c
1 2
Ll
1
2
c

= batas nyata kelas bawah dari kelas modus (kelas yang frekuensinya terbesar)
= selisih frekuensi kelas modus dengan kelas sebelumnya
= selisih frekuensi kelas modus dengan kelas sesudahnya
= lebar interval kelas median

Ukuran Pemusatan
Contoh 2.7:
Modus dari jajaran data sampel tegangan rusak yang terdiri
dari 100 data yang belum terkelompokkan adalah
Modus 1141

(frekuensi = 3)

Contoh 2.8:
Modus dari data sampel tegangan rusak yang terdiri dari 100
data yang sudah terkelompokkan adalah:

1
10
c

1099,5

100 1190, 4
10 1
1 2

Modus x Ll

Ukuran Pemusatan
Kuantil: kuartil, desil dan persentil
Nilai-nilai yang membagi menjadi bagian-bagian yang sama suatu
jajaran data (data array)
Menjadi dua bagian median
Menjadi empat bagian kuartil (Q1 , Q2 , Q3)
Menjadi sepuluh bagian desil (D1 , D2 , D3 , D9)
Menjadi seratus bagian persentil (P1 , P2 , P , P99)
Dengan pengertian di atas, maka: median = Q2 = D5 = P50

a. Data Tak Terkelompok Prinsip menentukan median


b. Data Terkelompok Prinsip interpolasi

Ll,i = batas nyata kelas bawah dari kelas kuantil ke-i


i

(
f
)
l ,i
r
r = konstanta (untuk kuartil r = 4, desil r = 10, persentil r

c = 100)
K i Ll ,i
f kuantil ,i

( f ) = jumlah frekuensi seluruh kelas yang lebih rendah

dari kelas kuantil ke-i


l

fkuantil,i = frekuensi kelas kuantil ke-i


c
= lebar interval kelas median

Ukuran Pemusatan
Contoh 2.9:
Beberapa kuantil dari data pada sampel yang terdiri dari 100
data yang telah terkelompokkan adalah sebagai berikut:
1

100
n

(
f
)

l
,1
4

2 23
Q1 Ll ,1
c 1099,5
100 1192, 6
f kuartil ,1
29

100

(
f
)

23

l ,7

D7 L1 10
c

1099,5

100 1192, 6
f desil ,7
29

Ukuran Penyebaran
Ukuran Penyebaran (Dispersion)
Ukuran penyebaran (dispersion) menunjukkan seberapa jauh data
menyebar dari nilai rata-ratanya (variabilitas data)
Alasan pentingnya meninjau ukuran penyebaran suatu kumpulan
nilai data:
Penilaian mengenai seberapa baik suatu nilai rata-rata (ukuran
pemusatan) menggambarkan data
Agar langkah-langkah untuk mengendalikan variasi yang ada
dapat dilakukan

Ukuran Penyebaran
Jangkauan/kisaran (range)

R xmax xmin
Jangkauan/kisaran (range) Persentil 10-90

RP1090 P90 P10


Simpangan Kuartil

Q3 Q1
Qd
2

Ukuran Penyebaran
Simpangan mutlak rata-rata (mean deviation)
a. Data Tak Terkelompok
n

Mean Deviation MDx

xi x
i 1

b. Data Terkelompok
k

Mean Deviation MDx

fi
i 1

xm,i x
k

fi

fi
i 1

xm,i x
n

i 1

MDx = Simpangan mutlak rata-rata


x = mean aritmatika dari suatu sampel )
f = frekuensi atau jumlah pengamatan dalam sebuah interval kelas
xm ,ii
= nilai tengah dari interval kelas
k = jumlah interval kelas dalam suatu sampel
n = banyaknya data x dalam suatu sampel

Ukuran Penyebaran
Contoh 2.10:
Simpangan mutlak rata-rata dari jajaran data pada sampel yang
terdiri dari 100 data belum terkelompokkan dengan rata-rata
x
1198,5
adalah:
n
xi x
MDx

i 1

n
923 1198,5 924 1198,5 ... 1482 1198,5 1492 1198, 5
100

98, 4

Ukuran Penyebaran
Contoh 2.11:
Simpangan mutlak rata-rata dari jajaran data pada sampel yang
terdiri dari 100 data telah terkelompokkan dengan rata-rata
x
1197,5
adalah:
Breaking Stress
(x)
900 1000 1100 1200 1300 1400-

999
1099
1199
1299
1399
1499

(fi)

xm,i

xm ,i x

f i xm ,i x

4
19
29
28
13
7
100

949,5
1049,5
1149,5
1249,5
1349,5
1449,5

248
148
48
52
152
252

992
2812
1392
1456
1976
1764
10392

MDx

fi
i 1

xm ,i x
k

fi
i 1

10392
103,92
100

Ukuran Penyebaran
Deviasi standard/simpangan baku
a. Data Tak
Terkelompok

sx

xi x
i 1

n 1

b. Data
Terkelompok

xi x
i 1

N
k

sx

n x xi
i 1 i 1
n(n 1)

i 1

fi xm,i x
N

i 1

xi2

x
k

i 1

2
i

n 1

i 1

fi xm,i x
K

(sampel)

(populasi)

f x f i xm,i
i 1
n(n 1)

2
i m ,i

i 1

fi xm2 ,i
N

(sampel)

(populasi)

Ukuran Penyebaran
Contoh 2.12:
Deviasi standard dari jajaran data pada sampel yang terdiri dari
x 1198,5
100 data belum terkelompokkan dengan rata-rata
adalah:
n

sx

xi x
i 1

n 1

(923 1198,5) 2 (924 1198,5) 2 ... (1482 1198,5) 2 (1492 1198,5) 2

100 1

1540469
124, 7
99

Ukuran Penyebaran
Contoh 2.13:
Standard deviasi dari jajaran data pada sampel yang terdiri dari
100 data telah terkelompokkan dengan rata-rata
x 1197,5
adalah:

xm,i x

Breaking
Stress (x)

(fi)

xm,i

900 - 999
1000 - 1099
1100 - 1199
1200 - 1299
1300 - 1399
1400 1499

4
19
29
28
13
7
100

949,5
1049,5
1149,5
1249,5
1349,5
1449,5

sx

fi xm,i x
i 1

n 1

61540
21904
2304
2704
23104
63504

f i xm ,i x
246016
416176
66816
75712
300352
444528
1549600

1549600
125,1
100 1

Ukuran Penyebaran
Varians
Varians merupakan kuadrat dari deviasi standard, sehingga untuk
2
sampel dinyatakan
dan untuk
sebagai
.
xpopulasi
s 2 sebagai
x

Koefisien Variasi

Penyebaran mutlak
Penyebaran relatif
nilai rata rata
Koefisien Variasi : Vx

sx
x

(sampel)

x
x

(populasi)

Moment
Moment
a.

Data Tak Terkelompok


Jika x1, x2, , xn adalah n buah nilai variabel x, maka dapat
didefinisikan kuantitas :
n
xir

r
r
r
- moment ke-r :
x x2 ... xn i 1
xr 1

n
n
n

r
- momen ke-r simpangan terhadap mean
xi x
mr , x i 1
n

r
- momen ke-r simpangan terhadap sembarang
xi A
mr, x i 1
n

Moment
Moment
b. Data Terkelompok
- momen ke-r simpangan terhadap sembarang
k

x
r

r
1 m ,1

fx

i 1

fi xm ,i x

fi
k

mr, x

... f x

r
k m,k

f1 f 2 ... f k
k

mr , x

f x

r
2 m ,2

i 1

fi xm,i A
i 1

fi
i 1

i 1

i 1

fi

fi xm ,i x

fi xm,i A
i 1

fx

i 1

r
i m ,i

i 1

f i xmr ,i
n

Moment
Moment
Hubungan Antar Moment

m2, x m2, x m1,2x


m3, x m3, x 3m1, x m2, x 2m1,3x
m4, x m4, x 4m1, x m3, x 6m1,2x m2, x 3m1,4x
Perlu dicatat bahwa m1, x x A
Moment Dalam Bentuk Tidak Berdimensi

ar , x

mr , x
s

mr , x
m2, x

mr , x
m2,r x

Skewness (Kemencengan)
Skewness
Derajat ketidak simetrisan, atau penyimpangan dari kesimetrisan
suatu distribusi
menceng ke kanan atau kemencengan positif (positive
skewnes)
menceng ke ke kiri atau kemencengan negatif (negative
skewness)

Skewness (Kemencengan)
Koefisien Skewness
Terdapat beberapa koefisien yang bisa dijadikan koefisien
kemencengan (skewness factor/coefficient)

S f ,x

x x

S f ,x

3 x x%

S f ,Qd

(Q3 Q2 ) (Q2 Q1 ) Q3 2Q2 Q1

Q3 Q1
Q3 Q1

S f , p1090

( P90 P50 ) ( P50 P10 ) P90 2 P50 P10

P90 P10
P90 P10

Dalam kebanyakan aplikasi teknik

Skewness factor a3, x

m3, x
s

m3, x
m2, x

m3, x
m2,3 x

Kurtosis (Keruncingan)
Kurtosis
Derajat keruncingan (peakedness) atau keceperan (flatness) dari
suatu distribusi relatif terhadap distribusi normal
puncak relatif tinggi disebut kurva leptokurtik
puncaknya ceper/rata (flat-topped) disebut platykurtic
tidak terlalu runcing atau terlalu ceper disebut kurva
mesokurtic

Skewness (Kemencengan)
Koefisien Kurtosis
Sebuah ukuran kurtosis menggunakan momen simpangan
terhadap mean keempat dalam bentuk tidak berdimensi

Untuk suatu distribusi normal, b2,x = a4,x = 3


Dengan alasan ini kurtosis kadang-kadang didefinisikan dengan
(b2,x 3) yang nilainya:

positif untuk distribusi leptokurtic


negatif untuk distribusi platykurtic s
nol untuk distribusi normal (gaussian)

Ukuran lainnya

1 Q Q
3
1
Qd
2

P90 P10
P90 P10