Statistik
Deskriptif
Data diurut dari kecil ke besar, dan menentukan nilai minimum dan
maksimumnya.
Menghitung frekuensi data berdasar jumlah data yang memenuhi interval klas.
1 n
xi
n i 1
Dimana :
Min (x1, ....., xn) max (x1, ....., xn)
xi = besaran data ke i sampai dengan data ke n yaitu xn
n = jumlah data
Bila data tidak membentuk kurva probabilitas yang sederhana maka besaran mean
dapat digunakan secara variatif sebagaimana tabel 2.1.
Tabel 2.1. Nilai mean
Mean
Nilai
Contoh
Hasil
2*(3*4) /(3+4)
3.43
(3*4)^0,5
3.46
(3+4)/2
3.50
Root-mean-square (RMS)
((3^2+4^2)/2)^0,5
3.54
Mode
Merupakan nilai x pada posisi P(Xx) maksimum atau berupa nilai x yang paling
sering muncul.
Bila mean dan mode berimpitan menghasilkan bentuk kurva simetris dikenal sebagai
Distribusi normal Gaussian
Contoh : data asli random 1, 2, 2, 3, 4, 7, 9 maka besaran mode = 2
Skewness (= X)
Merupakan ukuran dari derajat ketidak simetrian bentuk distribusi dibanding bentuk
distribusi normal, atau dapat diartikan sebagai perbedaan posisi Mean dan Mode.
Atau X =
n
n
( X i X )3
3
(n 1) * (n 2) * X i 1
Kurtosis excess
Skewness
Bernoulli distribution
beta distribution
binomial distribution
chi-squared distribution
exponential distribution
Fisher-Tippett distribution
gamma distribution
geometric distribution
half-normal distribution
Laplace distribution
Poisson distribution
Student's t-distribution
continuous uniform
distribution
discrete uniform distribution
Kurtosis
Merupakan derajat kelancipan dari bentuk puncak kurva terhadap kurva normal.
Kurtosis berdasar software SPSS, Excel dan beberapa software lain atau berdasar
Sheskin (2000) disajikan dalam rumus x, bila x = 0 berarti distribusi normal, bila x >
0 kurva berbentuk lancip bila hasilnya negatif berarti puncak kurva lebih rendah atau
datar dibanding Normal.
X = (
n.(n 1)
(n 1) * (n 2) * (n 3) * X
3(n 1) 2
(Xi X ) )
(n 2)(n 3)
i 1
n
Gambar 2.2. Besaran Kurtosis untuk beberapa bentuk distribusi dengan penjelasan
sebagai berikut:
10
Momen
Merupakan besaran selisih antara posisi data dengan mean data, jadi pada data ke n
besaran central momen dari distribusi probabilitas random dengan variabel X sebesar:
dalam hal ini nilainya = 0.
Variance
Merupakan nilai yang menunjukkan penyebaran dari kurva probabilitas, juga
menunjukkan lebar atau sempitnya kurva. Disimbolkan sebagai X2 atau besaran
standard deviasi dikuadratkan.
Covariance (coefficient of variation) = Cv
Merupakan ukuran mean dan variance untuk mendiskripsikan keterkaitan antara satu
kurva dengan lainnya. Jadi covariance digunakan untuk membandingkan 2 kurva
probabilitas yang menghasilkan juga suatu angka korelasi koefisien dan merupakan
bilangan tanpa satuan.
11
Median =
Percentile untuk 50% data prosentase kumulatif, tenth percentile = P 10 = D1, P20 =
D2, P25 = Q1, P30 = D3, P40 = D4, P50 = D5 = Q2 = median, P60 = D6, P70 = D7,
P75 = Q3, P80 = D8, P90 = D9, P100 = D10 = Q4.
Jadi untuk mendapatkan besaran ke p-percentile dari N nilai data terurut maka
pertama dihitung posisi rangkingnya yaitu
lalu dibulatkan ke
bilangan terdekat dan ambil besaran yang terkait dengan rangking tersebut.
Atau cara lain dengan mengurut nilai N data v1, v2, v3,...,vN , dari kecil ke besar lalu
tentukan percentile terkait nilai ke n sebesar
Contoh : N = 5 nilai terkait percentile ketiga sebesar
artinya p3 adalah median dari data atau setara 50 percentile = Q2.
Proses perhitungan : susun data terurut, hitung data kumulatifnya, dan tentukan
percentile berdasar interpolasi dari klas data yang digunakan.
Contingency table
Digunakan untuk mencatat dan menganalisa hubungan antara 2 variabel data
categorical (discrete) meskipun keduanya kadang tidak saling berhubungan.
Contoh dalam tabel dibawah. menunjukkan antar variabel dalam tabel yang tidak
dapat diinterpolasi.
Tangan Kanan Tangan Kidal
Total
Laki-laki
43
52
Perempuan
44
48
12
87
13
100
13
68
75
77
80
74
64
65
67
68
72
76
82
87
63
82
65
70
73
68
Standard Deviasi X
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
60
68
75
77
80
74
64
65
67
68
72
76
82
87
63
82
65
70
73
68
71.8
n
1
( X i X )2
(n 1) i 1
X-
(11.8)
(3.8)
3.2
5.2
8.2
2.2
(7.8)
(6.8)
(4.8)
(3.8)
0.2
4.2
10.2
15.2
(8.8)
10.2
(6.8)
(1.8)
1.2
(3.8)
(X -
139.2
14.4
10.2
27.0
67.2
4.8
60.8
46.2
23.0
14.4
0.0
17.6
104.0
231.0
77.4
104.0
46.2
3.2
1.4
14.4
1,007.2
= 7,3
(X -
(1,643.0)
(54.9)
32.8
140.6
551.4
10.6
(474.6)
(314.4)
(110.6)
(54.9)
0.0
74.1
1,061.2
3,511.8
(681.5)
1,061.2
(314.4)
(5.8)
1.7
(54.9)
2,736.5
(X -
19,387.78
208.51
104.86
731.16
4,521.22
23.43
3,701.51
2,138.14
530.84
208.51
0.00
311.17
10,824.32
53,379.48
5,996.95
10,824.32
2,138.14
10.50
2.07
208.51
115,251.4
b) Skewness
X =
n
n
( X i X )3
3
(n 1) * (n 2) * X i 1
c) Kurtosis = X = (
= 0.41
3(n 1) 2
(n 2)(n 3)
n.(n 1)
(n 1) * (n 2) * (n 3) * X
(X i X )4 )
i 1
14
15
II. Terdapat data hasil pengukuran CBR di berbagai ruas jalan dan di Jawa Timur,
sebagai berikut:
1
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
12
18
20
22
27
28
30
31
33
36
37
44
44
45
42
46
48
44
55
62
61
64
63
12
15
20
27
27
30
30
35
33
36
37
47
45
45
42
46
47
44
49
62
65
64
64
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
65
66
68
65
65
70
71
72
73
77
74
75
75
76
77
82
88
84
91
92
99
99
89
84
77
65
66
68
65
65
70
73
73
73
77
74
74
75
76
78
82
80
85
90
92
99
97
92
88
84
20.0
87.5
Jumlah
5
5
11
2
16
8
3
50
P25
P75
Frekuensi
10%
10%
22%
4%
32%
16%
6%
100%
37.2
74.7
Kumulatif
10%
20%
42%
46%
78%
94%
100%
63.8
57.9
8
Frequency
Row
CBRJATIM
CBR
Row
CBRJATIM
CBR
20
40
60
CBR JATIM
80
16
100
17
Ro
w
Lalu
lint
as
CB
R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
8
7
12
18
20
22
27
28
30
31
33
36
37
44
44
45
42
46
48
44
55
62
61
64
63
7
7
12
15
20
27
27
30
30
35
33
36
37
47
45
45
42
46
47
44
49
62
65
64
64
36
100
CBR (%)
80
80
60
40
20
0
0
10
20
30
Umur (bulan)
40
50
60
Umu
r
Prks
n
2
5
6
6
10
12
12
15
13
15
14
16
16
20
20
17
12
15
20
18
25
36
38
32
34
Ro
w
Lalu
lint
as
CB
R
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
65
66
68
65
65
70
71
72
73
77
74
75
75
76
77
82
88
84
91
92
99
99
89
84
77
65
66
68
65
65
70
73
73
73
77
74
74
75
76
78
82
80
85
90
92
99
97
92
88
84
18
Umu
r
Prks
n
35
36
38
35
40
40
40
41
42
43
44
43
45
46
48
50
53
54
56
54
60
60
55
48
54
25
50
100
100
50
CBR
80
0
50
25
60
CBR
Umur
40
0
20
2
angka
1
0
50
100
Angka = kondisi lalu lintas Ringan (1), Sedang (2) , Berat (3)
15
30
Umur
45
60
angka
Gambar2.4. Hubungan CBR, umur perkerasan dan lalu lintas (=angka 1,2,3)
3. Marginal Plot : Sama dengan scatterplot, tetapi ditambah histogram, dotplot,
atau boxplot pada setiap variablenya diletakkan pada sela-sela gambar atau
grafik. Penambahan grafik yang menempel dapat dipilih sesuai keperluan dari
masing-masing kajian statistik. Software MINITAB menyediakan aplikasi ini
sebagai contoh gambar 2.3. dapat dirubah menjadi tampilan gambar 2.5
dengan tambahan histogram.
Marginal Plot of CBR vs Umur
100
CBR
80
60
40
20
0
0
10
20
30
Umur
40
50
60
Gambar 2.5. Hubungan CBR dengan umur perkerasan dan lalu lintas
4. Histogram Menampilkan bentuk kurva (probabilitas) kejadian. Sumbu x
berupa variabel data yang ingin ditampilkan dan sumbu y berupa jumlah data
asli atau hitungan prosentase frekuensi. Pada SPSS dan Minitab tersedia
hitungan frekuensi dan pembagian kelas data serta tampilan histogram secara
Jurusan Teknik Sipil FTSP ITS
19
beberapa bentuk
Histogram of CBR
Normal
Mean
StDev
N
12
57.94
24.95
50
Frequency
10
8
6
4
2
0
20
40
60
CBR
80
100
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
Jumlah data
Dotplot of CBR
14
28
42
56
CBR (%)
70
84
20
98
data
yang
dipilih
dan
langsung
dapat
digunakan
untuk
memperkirakan nilai statistik yang tidak terlihat dari data aslinya, terutama
median (atau nilai tengah dari data), percentile, dan quartile serta
menunjukkan perkiraan bentuk kurvanya. Pada data yang genap bisa diambil
dari data 1 angka diatas atau dibawah ranking data tengah. Stem berupa digit
pertama atau kedua dan seterusnya sedang leaf adalah digit terakhir dibelakang
koma. Dalam gambar 2.8 median adalah (65 + 65)/2 = 65 berasal dari data ke
25 dan 26. Lef unit =1, Stem unit = 10. Angka juga boleh dibulatkan, dan
memuat angka negatif.
Data outlier : nilai data yang extreme atau berbeda jauh dari data lainnya.
Outlier dapat diplot dengan meletakkan beda baris, atau mengabaikan data
tersebut.
Jumlah
Data
2
2
3
6
8
9
10
5
5
50
Stem
Leaf
0
1
2
3
4
6
7
8
9
7
2
0
0
2
2
0
0
0
7
5
7
0
4
4
3
2
2
7
3
5
4
3
4
2
5
5
5
3
5
7
6
6
5
4
8
9
7
7
5
4
7
5
5
9
6
6
8
7
21
Mean
StDev
N
AD
P-Value
95
90
57.94
24.95
50
0.795
0.037
Percent
80
70
60
50
40
30
20
10
5
25
50
CBR
75
100
125
Normal
Exponential
100
Persentase Kumulatif (%)
100
Mean 57.94
StDev 24.95
N
50
80
60
40
20
0
0
20
40
60
CBR (%)
80
100
120
Mean
N
80
60
40
20
15
25
35
45
55
CBR (%)
65
75
85
22
95
57.94
50
CBRJATIM
100
80
65
64.5
60
40
20
Data
60
58
57.62
57.94
56
54
52
50
CBRJATIM
CBR
23
11. Individual Value Plot Mempelajari dan membandingkan nilai tiap data.
Dengan menggunakan tampilan ini dapat dipelajari akurasi hasil pengamatan,
dan pola data secara umum, lihat gambar 2.13.
Individual Value Plot of CBRJ ATIM; CBR
100
80
Data
60
64.5
65
57.62
57.94
40
20
0
CBRJATIM
CBR
Perempuan
1500
1000
500
Kelompok
24
Gambar 2.15. Contoh 2 jenis tampilan Pie chart dari data yang sama
14. Time Series Plot untuk data yang dikumpulkan dengan interval waktu yang
sama dan dalam urutan kronologis atau sejarah kejadian, contoh gambar 2.16
menunjukkan produksi tangkapan ikan laut yang didaratkan di Surabaya.
Beberapa variable dengan nilai salah satu sumbu sama dapat ditampilkan
dalam 1 grafik.
Time Series Plot of Produksi I kan
9400
9200
9000
8800
8600
8400
8200
8000
7800
2001
2002
2003
Year
2004
2005
25
Variable
Produksi Ikan
Kerang
10000
Data
8000
6000
4000
2000
0
2001
2002
2003
Year
2004
2005
Gambar 2.17. Perbandingan tampilan area graph pada data Produksi tangkapan ikan
di Surabaya
16. Contour Plot Memetakan nilai pengukuran sebagai fungsi dari dua
variables lain yang dapat ditampilkan dalam beberapa bentuk tampilan grafis.
Variabel yang dapat ditampilkan minimal 3 jenis, tidak harus berupa data
historis, contoh gambar 2.18.
Produksi I kan
< 8000
8000 - 8200
8200 - 8400
8400 - 8600
8600 - 8800
8800 - 9000
9000 - 9200
> 9200
1450
Kerang
1400
1350
1300
1250
2001
2002
2003
Tahun
2004
2005
Gambar 2.18. Perbandingan tampilan contour plot pada data Produksi tangkapan
ikan di Surabaya
17. 3D Scatterplot Memplotkan hasil tiap hasi observasi individual dalam 3
dimensi yang didefinisikan oleh variabel yang tertuang dalam sumbu x-, y-,
dan z. Pemakaian grafik ini kurangcocok untuk data serie menjadikan kurang
jelas (contoh gambar 2.19 kiri), sedang pada contoh data CBR (non data serie)
tampak lebih cocok dan mudah ditinjau (contoh gambar 2.19 kanan).
26
100
9200
8800
Produksi I kan
CBR
8400
8000
50
60
1500
1400
2001.0
2002.5
Tahun
1300
2004.0
2005.5
40
Kerang
1200
2
angka
20
3
Umur
Gambar 2.19. 3 D Scatterplot pada data seri (kiri) dan non seri.
18. 3D Surface Plot Seperti untuk 3D scatterplot tetapi menampilkan
permukaan yang menerus atau grid disamping titik pada tiap individu data,
dan tampilan ini juga lebih sesuai untuk non data serie, lihat gambar 2.20.
100
CBR
50
60
40
0
1
2
angka
20
3
Umur
27
Kegunaan tampilan
Mencari hubungan antara sepasang
variable
Pilihan
Scatterplot Menunjukkan hubungan
antara dua variabel.
Matrix Plot Menunjukkan hubungan
antara beberapa pasang variable sekaligus.
28
Kegunaan tampilan
Membandingkan ringkasan atau
masing-masing variable nilai
individual
Pilihan
Boxplot Membandingkan sample
dari karakteristik dan cirri terpilih lainnya
pada distribusi.
Interval Plot Membandingkan ratarata dan confidence intervalnya.
Individual Value Plot Mempelajari
dan membandingkan nilai tiap data.
Bar Chart Membandingkan
ringkasan statistic, misalnya mean dari
semua kelompok data.
29
Kegunaan tampilan
Menunjukkan hubungan antara tiga
variabel
Pilihan
Contour Plot Memetakan nilai
pengukuran sebagai fungsi dari dua
variables lain.
3D Scatterplot Memplotkan hasil
tiap hasi observasi individual dalam 3
dimensi yang didefinisikan oleh variabel
yang tertuang dalam sumbu x-, y-, dan z.
3D Surface Plot Seperti untuk 3D
scatterplot tetapi menampilkan permukaan
yang menerus atau grid disamping titik
pada tiap individu data.
30