DAN
EKSPLORASI DATA
1
Statistik dan Statistika
Statistik
Nilai-nilai ukuran data yang mudah dimengerti dan
diperoleh dari observasi/pengamatan, misal: rataan, modus,
median, simpangan baku.
Statistika
Ilmu yang berkaitan dengan cara pengumpulan, pengolahan,
penyajian, dan analisis data yang selanjutnya melakukan
penarikan kesimpulan atas hasil analisis data.
2
Jenis-jenis Observasi
OBSERVASI / DATA
KUALITATIF KUANTITATIF
Berat badan
Jenis penyakit, jenis Banyaknya (number)
Ukuran baju (S, M, L, mahasiswa (kg), usia
pekerjaan (PNS, Peg. motor yang masuk ke
XL), Ukuran pendapat ITB, banyaknya peserta asuransi (thn),
Swasta, Wirausaha),
(SS, S, KS, TS), dll. ketidakhadiran mhs, dll. besar pendapatan
dll. 3
pegawai ITB, dll
Jenis-jenis Statistika
5
Karakteristik Distribusi
PARAMETER mean, median, modus,
Ukuran Pemusatan kuartil, dll
DISTRIBUSI
Ukuran Jangkauan, simpangan
Penyebaran baku, variansi, dq, dll
Kemencengan skewness
Kelancipan kurtosis
Menceng/skew
mean > median
Positif
Berpuncak Berpuncak Menceng/skew
mean < median
Jamak Tunggal Negatif
6
# modus > 1 # modus = 1
Paramater Distribusi Sampel
SARI NUMERIK
Ukuran Ukuran
Pemusatan Data Penyebaran Data
data harus
Median : M diurutkan !
Range : R
Trirata : TRI
Rataan antar Kuartil : RAK Jangkauan antar kuartil : dq
Variansi : s2
Modus : Mo
Standar Deviasi : s
Rataan : o
data tidak harus
diurutkan !
Kemencengan Kelancipan
Skewness Kurtosis
7
CONTOH KASUS
Berikut adalah data tekanan darah dari 10 wanita
(mm Hg). (n = 10)
115 112 107 119 115 138 126 105 104 115
o1 o2 o6 o10
Data yang diurutkan:
104 105 107 112 115 115 115 119 126 138
q1 = o n +1 q2 = o n +1 q3 = o n +1
3
4 2 4
9
2. Median
Nilai tengah yang membagi dua kelompok data
sama banyak.
med = q2 = o 1
(10 +1)
= o 1
5
= o( 5) +
1
2
( )
o( 6) − o( 5) = 115 + 0 = 115
2 2
3. Modus
Nilai yang paling sering muncul.
mod = 115
10
4. Kuartil
11
Ukuran Penyebaran Data
1. Jangkauan data (Range)
R = omax – omin R = 138 – 104 = 34
2. Variansi
2
n
oi
1 s 2 = 106, 23
n n
1
s2 =
n − 1 i =1
(oi − o ) 2 =
n − 1
oi −
2 i =1
n
i =1
JKXX
3. Simpangan Baku (standard deviation)
s = s2 s = 106, 23 = 10,31
4. Jangkauan antar kuartil
dq = q3 – q1 dq = q3 – q1 = 120,75–106,5 =14,25
12
Data Pencilan
Data yang nilainya berbeda jauh dari kelompok
data yang lain (ekstrem atas atau ekstrem bawah)
Cara mendeteksi pencilan :
1. Hitung dq dq = 14,25
2. Hitung BBP = q1 – 1 ½ dq BBP = 106,5 – (1,5)(14,25)
Pilih nilai k = 3/2 (tidak mutlak) = 85,125
3. Hitung BAP = q3 + k.dq BAP = 120,75+(1,5)(14,25)
= 142,125
4. Pencilan bawah < BBP tidak ada pencilan bawah
5. Pencilan atas > BAP tidak ada pencilan atas
13
SARI NUMERIK
Count (banyak data, n) 10
Sum (jumlah data) 1.156
Average (rataan) 115,60
mean > median
Median (kuartil tengah) 115
Mode (modus) 115
Minimum 104
Maximum 138 Skew positif/
Range (jangkauan) 34 menceng kanan
Standard Deviation 10,309
Variance 106,267
Skewness (kemencengan) 1,137
Kurtosis (kelancipan) 1,458
25th Percentile (persentil ke-25) 106,5 Kurtosis lebih lancip →
50th Percentile (persentil ke-50) 115 data lebih mengumpul
75th Percentile (persentil ke-75) 120,75 di pusatnya
Interquartile Range (dq) 14,25
* Perhitungan dengan SPSS
14
Sari Grafik
❖1. Dot Plot
❖2. Diagram batang (histogram)
❖3. Diagram Batang – Daun (stem - leaf)
❖4. Diagram Kotak – Titik (boxplot)
❖dll…
Skala penggambaran harus diperhatikan dalam penyajian data
dalam bentuk grafik.
15
Diagram Titik (Dot Plot)
5
0
0 20 40 60 80 100 120 140 160
Tekanan Darah
16
Diagram Batang (Histogram)
max
q3
q2
q1
min
21
Transformasi Data
• Transformasi dilakukan untuk mendapatkan bentuk
distribusi yang lebih simetris.
• Transformasi Tangga Tukey
24