Statistika Deskriptif
Bidang statistika yang membahas cara atau
metode mengumpulkan, menyederhanakan dan
menyajikan data sehingga bisa memberikan
Statistika
informasi yang berarti
Statistika Inferensial
Bidang statistika yang membahas cara-cara atau
metode menarik kesimpulan dan mengukur
keandalan kesimpulan tentang suatu populasi
berdasarkan informasi yang bersumber dari suatu
sampel
Pendahuluan
Statistika Deskriptif
2. Ukuran statistik
Diagram Batang
Diagram Garis
Diagram Pencar
Diagram Lingkaran
Grafik / Diagram
3500
3000
2500
2000
1500
1000
500
0
17 – 20 21 – 24 25 – 28 29 – 32 33 – 36
3500
3000
2500 12% 3% 14% 17 – 20
2000 21 – 24
1500 25 – 28
1000 34% 29 – 32
37%
33 – 36
500
0
0 2 4 6
Penyajian Data
Penggambaran / penyajian data dapat dilakukan dengan
menggunakan :
2. Ukuran statistik
o Tabel Kontingensi
Tabel Kontingensi 2 x 3 ( b x k )
Tabel
Tabel Distribusi Frekuensi
Umur Mahasiswa di Universitas X
Jumlah 8.108
Sumber : fiktif
Ukuran Statistik
Ukuran-ukuran Statistik
Koefisien Variansi
Ukuran Tendensi Pusat
(Ukuran Pemusatan)
Ukuran Pemusatan
n
XG ( X1 X 2 Xn )1/ n
X i
X i 1
n Nilai tengah Nilai yang
Rata-rata
Setelah data Paling sering
ukur
diurutkan muncul
Rata-rata
Hitung
Ukuran Tendensi Pusat
(Ukuran Pemusatan)
X i
X1 X 2 X n
X i 1
n n
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
Mean = 3 Mean = 4
1 2 3 4 5 15 1 2 3 4 10 20
3 4
5 5 5 5
Ukuran Tendensi Pusat
(Ukuran Pemusatan)
Median
Median adalah suatu nilai data yang membagi dua sama
banyak kumpulan data yang sudah diurutkan menurut
nilainya, mulai dari nilai terkcil sampai terbesar.
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
Median = 3 Median = 3
Nilai median :
X ( n 1) / 2 ; jika n ganjil
~
X median
X n / 2 X ( n / 2 ) 1
; jika n genap
2
Ukuran Tendensi Pusat
(Ukuran Pemusatan)
Modus
Salah satu ukuran pemusatan data
Nilai yang sering muncul
Tidak dipengaruhi nilai ekstrim
Selain digunakan untuk data numerik juga digunakan
untuk data kategori
Mungkin saja suatu data tidak punya modus tapi
mungkin juga punya beberapa modus
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6
$2,000 K
Harga rumah:
$2,000,000
500,000 $500 K
300,000
100,000 $300 K
100,000
Sum $3,000,000
$100 K
$100 K
Review:
Summary Statistik
House Prices:
Mean: ($3,000,000/5)
$2,000,000 = $600,000
500,000
300,000
100,000
100,000
Median: = $300,000
Sum $3,000,000
Modus: = $100,000
Ukuran Statistik yang terbaik
Lokasi Data
Quartile / Kuartil
Quartile membagi data yang sudah diurutkan
menjadi empat sama rata
Q1 Q2 Q3
Quartile pertama, Q1= P25 merupakan nilai yang
mencakup 25 % data pertama
Q2 sama dengan median (mencakup setangah data
pertama)
Q3 = P75 mencakup 75% data pertama
Ukuran Lokasi
lokasi/letak kuartil :
i( n 1 )
Qi data ke ; i 1,2 ,3
4
1( 9 1 )
Q1 data ke data ke ( 2.5 )
4
data ke 2 0.5 ( data ke 3 data ke 2 )
12 0.5 ( 13 12 ) 12.5
Contoh:
Data Sampel setelah diurutkan : 11 12 13 16 16 17 18 21 22
2(9 1)
Q2 data ke data ke (5) 16
4
median
3(9 1)
Q3 data ke data ke (7.5)
4
data ke 7 0.5 (data ke 8 data ke 7)
18 0.5 (21 18) 19.5
Ukuran Lokasi
i( n 1 )
Pi data ke ; i 1,2 , ,99
100
Ukuran Keragaman Data
Keragaman
Data
Range
Ukuran keragaman yang sederhana
Selisih antara data terbesar dan data yang terkecil:
Contoh
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Range = 14 - 1 = 13
Kerugian menggunakan Range
7 8 9 10 11 14 7 8 9 10 11 14
Range = 14 - 7 = 7 Range = 14 - 7 = 7
Range = 5 - 1 = 4
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,150
Interquartile range = Q3 – Q1
Ukuran Keragaman Data
Contoh:
Median X
X Q1 Q3
(Q2) maximum
minimum
25% 25% 25% 25%
12 30 45 57 70
Interquartile range
= 57 – 30 = 27
Ukuran Keragaman Data
Variansi
Rata-rata kuadrat penyimpangan data dari mean
Variansi Sampel:
n 2
n
n
2
i
(X X )2
atau n X i2 X i
i 1
S i 1
S 2 i 1
n-1 n(n-1 )
Dimana : X = mean
n = ukuran sampel
Xi = Nilai data ke-i
Ukuran Keragaman Data
Standard Deviasi
Data
Sampel (Xi) : 10 12 14 15 17 18 18 24
n=8 Mean = X = 16
Data
Sampel (Xi) : 10 12 14 15 17 18 18 24
2
n
n
n X i2 X i 2
i 1 8( 2178) (128)
S 2 i 1 18.57143
n(n-1 ) 8(7)
S S 2 18.57143 4.309458
Ukuran Keragaman Data
Data A
Mean = 15.5
11 12 13 14 15 16 17 18 19 20 21
S = 3.338
Data B
Mean = 15.5
11 12 13 14 15 16 17 18 19 20 21 S = 0.926
Data C
Mean = 15.5
11 12 13 14 15 16 17 18 19 20 21
S = 4.567
Koefisien Variasi
S
CV 100%
X
Membandingkan Koefisien Variasi
Stock A:
Average price last year = $50
Standard deviation = $5
S $5
CVA 100% 100% 10%
$50
X Kedua stocks
mempunyai
Stock B:
standard
Average price last year = $100 deviasi yang
Standard deviation = $5 sama, tetapi
stock B
koefisien
S $5 variansi nya
CVB 100% 100% 5% lebih kecil
X $100
Bentuk Distribusi Data
Menggambarkan bagaimana bentuk distribusi data
Ukuran Bentuk distribusi data:
Simetrik atau Miring
61 77 59 33 44 51 11 28
54 40 42 70 42 40 51 46
58 47 42 54 64 54 39 66
25 67 44 17 13 69 13 12
46 63 46 46 53 64 57 48
Stem-Leaf Diagram
4 1 1233
5 1 7
5 2
7 2 58
8 3 3
9 3 9
16 4 0022244
22 4 666678
28 5 113444
31 5 789
35 6 1344
38 6 679
39 7 0
40 7 7
Box Plot
Contoh
Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3
Explorasi Data Analysis
0 2 2 2 3 3 4 5 5 10 27
0
0 2233 55 27
27
Dari plot Box and Whisker di atas terlihat distribusi data
miring ke kanan
Boxplot
Kegunaan lain dari boxplots adalah kita dapat pula
mendeteksi ada atau tidaknya data pencilan (data
ekstrim). Data pencilan dideteksi dengan menggunakan
nialai-nilai Pagar Dalam (PD) dan Pagar Luar (PL). Nilai-
nilai pagar tersebut dihitung menggunakan rumus :
Q1 – 1.5 JAK Q1 – 3 JAK
PD PL
Q3 + 1.5 JAK Q3 + 3 JAK
Nilai data yang terletak antara PD dan PL dikategorikan
sebagai data pencilan dekat (), dan nilai data yang
terletak di luar PL dikategorikan sebagai data pencilan
jauh ().
Boxplot
Contoh :
n = 40
Q1 = 40
Q2 = 46.5
Q3 = 58.75
PL
Q3 + 3 JAK = 115
Boxplot
Q1 Q2 Q3 PD
PL PD PL
*
11