Ukuran Data
Deviasi Standar
Rerata Geometrik
Ukuran Tendensi Pusat
Tendensi Pusat
X i
Rerata Geometrik
X i 1
n X G X 1 X 2 X n
N
X
1/ n
i
i 1
N
Rerata (Rerata Hitung)
Rerata suatu data kuantitatif
Rerata Sampel
n Ukuran Sampel
X i
X1 X 2 X n
X i 1
n n
Rerata Populasi
N Ukuran Populasi
X i
X1 X 2 X N
i 1
N N
Rerata (Rerata Hitung)
(lanjutan)
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Rerata = 5 Rerata= 6
Median
Ukuran tendensi pusat yang tegar
Tidak terpengaruh oleh data ekstrim
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Median = 5 Median = 5
Setelah data diurutkan, median adalah angka yang
terletak “ditengah”
Jika n atau N ganjil, median adalah angka di tengah
Jika n atau N genap, median adalah rerata kedua angka
ditengah
Modus
Adalah suatu ukuran tendensi pusat
Datum yang paling banyak muncul
Tidak terpengaruh oleh harga ekstrim
Dapat ada untuk data numerik atau kategorik
Dapat tidak ada
Dapat tidak tunggal
0 1 2 3 4 5 6
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Tak Ada
Modus = 9
Modus
Rerata Geometrik
Digunakan sebagai ukuran laju perubahan
(rate of change) variabel menurut waktu
X G X 1 X 2 X n
1/ n
RG 1 R1 1 R2 1 Rn
1/ n
1
Contoh
Suatu investasi $100,000 declined to $50,000 pada akhir
tahun pertama dan rebounded to $100,000 pada akhir
tahun kedua:
X 1 $100, 000 X 2 $50, 000 X 3 $100, 000
Average rate of return:
(50%) (100%)
X 25%
2
Geometric rate of return:
RG 1 50% 1 100%
1/ 2
1
0.50 2
1/ 2
1 11/ 2 1 0%
Kuartil
Membagi Data Berurut menjadi 4 Kelompok
K 1 K 2 K 3 in 1
Letak Kuartil ke-i Ki
4
Data setelah diurutkan : 11 12 13 16 16 17 18 21
22 1 9 1 12 13
Position of Q1 2.5 Q1 12.5
dan , bukan4 ukuran Tendensi Pusat
2
Q3 suatu ukuran Tendensi Pusat
Q = Median,
1
Q2
Ukuran Variasi
Variasi
7 8 9 10 11 7 8 9 10 11
12 12
Rentang Interkuartil
Suatu ukuran variasi
Dikenal juga sebagai midspread
Spread dalam 50% ditengah
Perbedaan antara kuartil pertama dan ketiga
Data setelah diurutkan: 11 12 13 16 16 17 17 18 21
X X
2
i
Variansi sampel:
S2 i 1
n 1
N
X
2
Variansi populasi: i
2 i 1
N
Deviasi Standar
Ukuran variasi terpenting
Menunjukkan variasi terhadap rerata
Mempunyai unit yang sama dengan data asli
n
X X
2
i
Deviasi standar sampel: S i 1
n 1
N
X
2
i
Deviasi standar populasi: i 1
N
Membandingkan Deviasi Standar
Data A Rerata=15.5
s = 3.338
11 12 13 14 15 16 17 18 19 20 21
Data B
Rerata=15.5
11 12 13 14 15 16 17 18 19 20 21 s = .9258
Data C
Rerata=15.5
11 12 13 14 15 16 17 18 19 20 21 s = 4.57
Koefisien Variasi
Stock A:
Rerata harga tahun lalu = $50
Deviasi standar = $5
Stock B:
Rerata harga tahun lalu = $100
Deviasi standar = $5
Koefisien Variasi S
$5
Stock A: CV 100% 100% 10%
X $50
S $5
Stock B: CV 100% 100% 5%
X $100
Bentuk suatu Distribusi
Menjelaskan bagaimana data di distribusikan
Ukuran bentuk
Simetrik atau menceng
Median( K 2) Xterbesar
X terkecil K3
K1
4 6 8 10 12
Bentuk Distribusi dan
Box-and-Whisker Plot
K1 K 2K 3 K 1K 2 K 3 K 1K 2 K 3
Hubungan antar variabel metrik
X i X Yi Y
r i 1
n n
X X Y Y
2 2
i i
i 1 i 1
Hal Penting tentang Koefisien Korelasi
Bebas unit
Harganya antara -1 dan 1
Semakin mendekati -1, semakin kuat hubungan linear
negatifnya
Semakin mendekati 1, semakin kuat hubungan linear
positifnya
Semakin mendekati 0, semakin lemah hubungan
linearnya
Scatter Plots Data dengan
berbagai Koefisien Korelasi
Y Y Y
X X X
r = -1 r = -.6 r=0
Y Y
X X
r = .6 r=1
Associations in non-categorical data
What if we are interested in associations but do not observe all data in categories?
i.e., our data are metric Data
$ ad spending* profits**
1. categorize and cross tabulate 1.52 7.67
3.91 11.88
3.11 4.27
Etc… Etc…
Grand
20.00
$ ad spending -10-0 0 -10 10-20 20-30 Total
sales
1 1
0.9 0.9
0.6 0.6
0.5 0.5
0.4 0.4
0.3 0.3
0.2 0.2
0.1 0.1
0 0
0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1
ad spending ad spending
sales
sales
1 1
0.9 0.9
0.6 0.6
0.5 0.5
0.4 0.4
0.3 0.3
0.2 0.2
0.1 0.1
0 0
0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1
ad spending ad spending
Matriks Korelasi
digunakan untuk membuat laporan tentang korelasi antara beberapa variabel
age 1 0.19
income 1
Regression analysis: Analisis Regresi
Analisis Korelasi Hubungan antara dua variabel metrik (skala interval atau rasio)
Analisis Regresi Bentuk hubungan antara dua atau lebih variabel metrik
$47,800.00
Contohnya
sales
$47,600.00
$47,400.00
observed unobserved
1 47878 2.16
$48,400.00
2 48235 2.15
$48,200.00 3 47347 2.38
Y = a + b X = 50,000 – 1,000 X
$48,000.00 4 47848 2.16
… …
(Y)
$47,800.00
ei 99 47986 2.09
sales
$47,600.00
100 47611 2.22
Yi
$47,400.00
$47,200.00
observation
$47,000.00
subject i
Xi
$46,800.00
$1.90 $2.00 $2.10 $2.20 $2.30 $2.40 $2.50 $2.60
price (X)
Kelemahan pengukuran deskriptif numerik
maupun buruk
Harus ditunjukkan secara adil, obyektif dan
netral
Should not use inappropriate summary