Anda di halaman 1dari 24

STATISTIKA

DAN
EKSPLORASI DATA

1
Statistik dan Statistika

Statistik
Nilai-nilai ukuran data yang mudah dimengerti dan
diperoleh dari observasi/pengamatan, misal: rataan, modus,
median, simpangan baku.

Statistika
Ilmu yang berkaitan dengan cara pengumpulan, pengolahan,
penyajian, dan analisis data yang selanjutnya melakukan
penarikan kesimpulan atas hasil analisis data.

2
Jenis-jenis Observasi
OBSERVASI / DATA

KUALITATIF KUANTITATIF

Nominal Ordinal/Rank Diskrit Kontinu

Tidak mengenal Mengenal urutan Berkaitan dgn ‘proses


Elemen dari suatu
menghitung/mencacah’
urutan dan operasi tetapi tidak mengenal dan pengamatan atas
selang/interval sehingga
aritmatika operasi aritmatika meliputi bilangan riil
himpunan terhitung.

Berat badan
Jenis penyakit, jenis Banyaknya (number)
Ukuran baju (S, M, L, mahasiswa (kg), usia
pekerjaan (PNS, Peg. motor yang masuk ke
XL), Ukuran pendapat ITB, banyaknya peserta asuransi (thn),
Swasta, Wirausaha),
(SS, S, KS, TS), dll. ketidakhadiran mhs, dll. besar pendapatan
dll. 3
pegawai ITB, dll
Jenis-jenis Statistika

1. Statistika deskriptif: metode yang berkaitan dengan


pengumpulan dan penyajian data.
Perhitungan-perhitungan hanya didasarkan pada data, tidak
berkaitan dengan asumsi model.
2. Statistika inferensi: metode yang berkaitan dengan
analisis sampel (data) untuk penarikan kesimpulan
tentang karakteristik data yang diolah atau populasi di
mana data diambil.
(umumnya berkaitan dengan estimasi dan uji hipotesa yang
memiliki bbrp asumsi)
4
Statistika Deskriptif
Metode yang berkaitan dengan pengolahan dan
penyajian data sehingga memberikan informasi yang
berguna bagi pengolah data atau praktisi.

Bentuk distribusi data

Pemusatan Penyebaran Kemiringan Kelancipan

5
Karakteristik Distribusi
PARAMETER mean, median, modus,
Ukuran Pemusatan kuartil, dll
DISTRIBUSI
Ukuran Jangkauan, simpangan
Penyebaran baku, variansi, dq, dll

Kemencengan skewness

Kelancipan kurtosis

BENTUK DISTRIBUSI Simetris mean = median

Menceng/skew
mean > median
Positif
Berpuncak Berpuncak Menceng/skew
mean < median
Jamak Tunggal Negatif

6
# modus > 1 # modus = 1
Paramater Distribusi Sampel
SARI NUMERIK
Ukuran Ukuran
Pemusatan Data Penyebaran Data
data harus
Median : M diurutkan !
Range : R
Trirata : TRI
Rataan antar Kuartil : RAK Jangkauan antar kuartil : dq
Variansi : s2
Modus : Mo
Standar Deviasi : s
Rataan : o
data tidak harus
diurutkan !
Kemencengan Kelancipan
Skewness Kurtosis
7
CONTOH KASUS
Berikut adalah data tekanan darah dari 10 wanita
(mm Hg). (n = 10)
115 112 107 119 115 138 126 105 104 115

o1 o2 o6 o10
Data yang diurutkan:
104 105 107 112 115 115 115 119 126 138

o(1) O(2) O(6) O(10)


maksimum
minimum
8
Ukuran Pemusatan Data
n
1
1. Mean (rata-rata): o =  oi
n i =1
Contoh :
o1 + o2 + ... + o10 115 + 112 + ... + 115 1156
o= = = = 115, 6
10 10 10

50 % data (awal) 50% data (akhir)


104 105 107 112 115 115 115 119 126 138

q1 = o n +1  q2 = o n +1  q3 = o n +1 
    3 
 4   2   4 

9
2. Median
Nilai tengah yang membagi dua kelompok data
sama banyak.
med = q2 = o 1 
 (10 +1) 
= o 1
5 
= o( 5) +
1
2
( )
o( 6) − o( 5) = 115 + 0 = 115
2   2

3. Modus
Nilai yang paling sering muncul.
mod = 115

10
4. Kuartil

Kuartil bawah (q1) :


3 3
q1 = o 10+1  = o 3
= o( 2) + (o(3) − o( 2) ) = 105 + (107 − 105) = 106,5
 
 4 
2 
 4
4 4

Kuartil tengah (q2) :


1
q2 = o 10+1  = o 1
= o(5) + (o( 6) − o(5) ) = 115 + 0 = 115
 
 2 
5 
 2
2

Kuartil atas (q3) :


1 1
q3 = o 10 +1 
= o 1
= o(8) + (o(9) − o(8) ) = 119 + (126 − 119) = 120, 75
3
 4 
 8 
 4
4 4

11
Ukuran Penyebaran Data
1. Jangkauan data (Range)
R = omax – omin R = 138 – 104 = 34
2. Variansi
2
 n 
   oi  
1     s 2 = 106, 23
n n
1
s2 = 
n − 1 i =1
(oi − o ) 2 =
n − 1 
 oi −
2 i =1

n 
i =1 
 

JKXX
3. Simpangan Baku (standard deviation)
s = s2 s = 106, 23 = 10,31
4. Jangkauan antar kuartil
dq = q3 – q1 dq = q3 – q1 = 120,75–106,5 =14,25
12
Data Pencilan
Data yang nilainya berbeda jauh dari kelompok
data yang lain (ekstrem atas atau ekstrem bawah)
Cara mendeteksi pencilan :
1. Hitung dq dq = 14,25
2. Hitung BBP = q1 – 1 ½ dq BBP = 106,5 – (1,5)(14,25)
Pilih nilai k = 3/2 (tidak mutlak) = 85,125
3. Hitung BAP = q3 + k.dq BAP = 120,75+(1,5)(14,25)
= 142,125
4. Pencilan bawah < BBP tidak ada pencilan bawah
5. Pencilan atas > BAP tidak ada pencilan atas
13
SARI NUMERIK
Count (banyak data, n) 10
Sum (jumlah data) 1.156
Average (rataan) 115,60
mean > median
Median (kuartil tengah) 115
Mode (modus) 115
Minimum 104
Maximum 138 Skew positif/
Range (jangkauan) 34 menceng kanan
Standard Deviation 10,309
Variance 106,267
Skewness (kemencengan) 1,137
Kurtosis (kelancipan) 1,458
25th Percentile (persentil ke-25) 106,5 Kurtosis lebih lancip →
50th Percentile (persentil ke-50) 115 data lebih mengumpul
75th Percentile (persentil ke-75) 120,75 di pusatnya
Interquartile Range (dq) 14,25
* Perhitungan dengan SPSS
14
Sari Grafik
❖1. Dot Plot
❖2. Diagram batang (histogram)
❖3. Diagram Batang – Daun (stem - leaf)
❖4. Diagram Kotak – Titik (boxplot)
❖dll…
Skala penggambaran harus diperhatikan dalam penyajian data
dalam bentuk grafik.

Penyajian data dalam bentuk grafik dapat dilakukan secara


manual maupun menggunakan software-software statistik seperti
Microsoft Excel, SPSS, S-Plus, Minitab dan lainnya.

15
Diagram Titik (Dot Plot)
5

0
0 20 40 60 80 100 120 140 160
Tekanan Darah

• Cara menggambarkan data dalam bentuk titik, dengan


memperhatikan frekuensi dari data yang bersangkutan
• Titik ditumpuk di atas nilai data yang digambarkan.

16
Diagram Batang (Histogram)

▪ Histogram menggambarkan distribusi frekuensi yang


direpresentasikan oleh suatu segi empat (rectangle).
▪ Daerah setiap batang sebanding dengan frekuensinya.
▪ Nilai setiap batang diwakili oleh nilai tengah variabel
yang diukur. 17
Diagram Batang-Daun
(Stem-Leaf)
10 4
10 5 7 10 4
11 2 10 57
11 5 5 5 9 11 2
12 11 5559
12 6 12
13 12 6
13 8 13
Batang : puluhan (x10) 13 8
Daun : satuan

▪ Stem atau batang, mirip dengan grup data pada histogram,


sedangkan leaf atau daun, mirip dengan frekuensi.
▪ Stem atau batang adalah digit pertama yang terpenting yang ada
dalam bilangan yang membentuk harga data, sedangkan digit di
belakangnya akan merupakan leaf atau daun.
▪ Melalui stem-Leaf masih dapat dilihat nilai data mentahnya.
18
Diagram Kotak-Titik
(Box-Plot)
Pencilan atas

max
q3
q2
q1
min

▪ Box Plot digunakan untuk menyelidiki distribusi tanpa


menggunakan grup data seperti pada histogram dan stem leaf.
▪ Box Plot terdiri dari: datamin , q1 , q2 (median), q3 , dan datamax
yang disusun secara terurut dengan membentuk kotak.
19
Kelemahan dan Keunggulan
KELEMAHAN KEUNGGULAN

Tidak efektif untuk ukuran Cepat


DOT PLOT
data yang besar Nilai data asli dapat diperkirakan

Lama Histogram peluang dapat memberi


gambaran tentang distribusi populasi
HISTOGRAM Banyak perhitungan
Tidak menuntut ketelitian dalam
Nilai data tidak nampak mencatat setiap nilai data
Cepat
Tidak memerlukan perhitungan
Menuntut ketelitian mencatat
BATANG-DAUN Nilai data asli dapat dilihat
daun
Memudahkan perhitungan berbagai
parameter
Membutuhkan perhitungan Box plot dapat memberi gambaran
yang panjang tentang bentuk distribusi populasi
BOX PLOT Terdiri dari parameter- Efektif untuk membandingkan bentuk
parameter dari data yang distribusi beberapa kelompok data
sudah diurutkan sekaligus
20
Bentuk Distribusi Ideal/Normal
Memiliki bentuk distribusi yang
simetris, yaitu :
❑ Skewness = 0
❑ Kurtosis = 3 (dalam
software tertentu kurtosis
mean = median
normal = 0)

21
Transformasi Data
• Transformasi dilakukan untuk mendapatkan bentuk
distribusi yang lebih simetris.
• Transformasi Tangga Tukey

-1/x2 -1/x √x log (x) x x2 x3 10x

untuk bentuk distribusi : data awal untuk bentuk distribusi :


skewness positif skewness negatif

Data contoh kasus : skewness = 1,137 (positif) (menceng


kanan), maka transformasi yang mungkin adalah -1/x2,
-1/x, dan Vx.
22
Transformasi Data
Contoh Kasus
x y = -1/x2
Lebih mendekati simetris (skew = 0)
-9,2E-05 dibanding sebelum transformasi
104
(skew = 1,137)
105 -9,1E-05
107 -8,7E-05
112 -8,0E-05
115 -7,6E-05 skew = 0,549
115 -7,6E-05
115 -7,6E-05
119 -7,1E-05 y = x y = log(x) y = -1/x
skew = 1,038 skew =0,939 skew =0,742
126 -6,3E-05
138 -5,3E-05 ** Ketika data ditransformasi, maka satuan
transformasi
dari data juga akan berubah
23
Referensi

1. Djauhari, M.A., 2001, Catatan Kuliah Analisis Data.


2. Devore, J.L. and Peck, R., Statistics – The Exploration and
Analysis of Data, USA: Duxbury Press, 1997.
3. Walpole, Ronald E. dan Myers, Raymond H., Ilmu Peluang
dan Statistika untuk Insinyur dan Ilmuwan, Edisi 4, Bandung:
Penerbit ITB, 1995.
4. Wild, C.J. and Seber, G.A.F., Chance Encounters – A first
Course in Data Analysis and Inference, USA: John
Wiley&Sons,Inc., 2000.
5. Pasaribu, U.S., 2007, Catatan Kuliah Biostatistika.

24

Anda mungkin juga menyukai