Anda di halaman 1dari 41

Statistika Deskriptif

SV Analisis Data 1
SV Analisis Data 2
DATUM?
SV Analisis Data 3
SV Analisis Data 4
Berikut adalah data ukuran diameter 20
bongkahan batuan yang ditemukan :
44.24 60.00 89.54 85.64
24.00 54.12 64.52 27.14
42.13 43.04 45.75 111.27
41.49 47.70 83.00 14.32
32.35 41.60 77.96 14.37

 Informasi apa yang ingin diperoleh dari data ini ?


1. Rata-rata ukuran diameter 20 bongkahan batuan STATISTIKA
2. Penyebaran ukuran diameter 20 bongkahan batuan DESKRIPTIF
tersebut.
3. Bongkahan batuan dengan ukuran diameter yang ekstrim.

4. Signifikansi rata-rata ukuran diameter 20 bongkahan batuan


SV Analisis Data 5
tersebut.
STATISTIKA INFERENSI
Statistik?
Hmm....
Statistika?
Statistik :
nilai-nilai ukuran data yang mudah dimengerti.

Contoh :
o statistik (mis. rata-rata)
nilai elevasi pasang surut air laut di selat Makassar (m),
o statistik (mis. variansi)
hasil pengukuran tinggi gelombang (cm) menggunakan AWLR
(Automatic Water Level Recorder)
o Statisitik (mis. range)
antara nilai tinggi pasang maksimum dan surut minimum (m)

Statistika :
ilmu yang berkaitan dengan cara pengumpulan, pengolahan,
analisis dan penarikan kesimpulan atas data. SV Analisis Data 6
Belajar Statistika dasar...

1. Statistika deskriptif:
metode yang berkaitan dengan pengumpulan
dan penyajian data.

2. Statistika inferensi:
metode yang berkaitan dengan analisis
sampel untuk penarikan kesimpulan tentang
karakteristik populasi.
SV Analisis Data 7
Populasi dan Sampel
Populasi

Sampel

setiap obyek populasi memiliki


kemungkinan/kesempatan yang Sampel Acak
sama untuk terpilih

hasil pengukuran atau pengamatan Data

SV Analisis Data 8
 Akan dilakukan pengamatan tentang rata-
rata produksi bahan tambang di
Indonesia.

Populasi
Kendala:
Seluruh titik - sangat banyak, -menghabiskan waktu, -
di wilayah menghabiskan biaya
Indonesia
Kaidah Pengambilan
Keterwakilan sampel
?
atas populasi ??
Sampel (Teknik
Sampling)

Sampel
Contoh:
setiap propinsi diambil beberapa titik pengamatan
SV Analisis Data
9
Jenis-jenis Observasi
OBSERVASI / DATA

KUALITATIF KUANTITATIF

Nominal Ordinal/Rank Diskrit Kontinu

Tidak mengenal Mengenal urutan Berhubungan dengan Didasarkan pada suatu


‘proses menghitung’, selang/interval
urutan dan dan atau operasi dan pengamatan atas sehingga meliputi
operasi aritmatika aritmatika himpunan terhitung. semua bilangan riil

Jenis bencana yang Jenjang pendidikan (SD, Banyaknya gempa Intensitas gempa yang
terjadi di suatu SMP, SMA,...), tingkatan
yang terjadi di suatu terjadi setiap hari di
daerah dalam 1 hari,
daerah (banjir, daerah (Kelurahan, banyaknya hari hujan suatu wilayah, tingkat
longsor, gempa, dll), Kecamatan Kab./Kota, dalam satu bulan di curah hujan harian di
jenis batuan, dll Provinsi, Negara), dll suatu daerah,SVdll
Analisis Data
suatu daerah, dll
10
Statistika Deskriptif

Metode Tujuan :
Informasi berupa:
pengolahan dan memberikan
bentuk distribusi
penyajian suatu informasi yang
data
gugus data berguna.

SV Analisis Data 11
Karakteristik Distribusi
mean, median, modus,
1. PARAMETER Ukuran kuartil atas, kuartil
DISTRIBUSI Pemusatan bawah, dll
Ukuran Range, simpangan baku,
variansi, jangkauan antar
Penyebaran kuartil, dll

Kemencengan skewness

Kelancipan kurtosis

2. BENTUK mean =
Simetris
DISTRIBUSI median
Menceng/ mean >
skew Positif median
Berpuncak Berpuncak Menceng/ mean <
Jamak Tunggal skew Negatif median

# modus > # modus = SV Analisis Data 12

1 1
CONTOH 1
Data rata-rata curah hujan bulanan yang
diamati dari Stasiun Padaherang pada tahun
2001 (n = 12)
278.59 279.78 355.29 241.34 115.9 176.9 55.32 29.08 43.82 313.68 508.49 267.82

x1 x2 x7 x10 x12
Data yang diurutkan:
29.08 43.82 55.32 115.9 176.9 241.34 267.82 278.59 279.78 313.68 355.29 508.49

x(1) x(2) X(7) x(10) x(12)


minimum maksimum
SV Analisis Data 13

Adakah perbedaan dari penyajian kedua data di atas?


 Ukuran pemusatan data
statistik yang memberikan informasi dimana data
terkumpul dengan ukuran/jumlah tertentu.
Contoh : Mean (rataan), kuartil bawah, kuartil
tengah (median), kuartil atas, modus, persentil,
...

 Ukuran penyebaran data


statistik yang memberikan informasi bagaimana
data menyebar di sekitar pusat data.
Contoh : range (jangkauan data), IQR
(jangkauan antar kuartil), variansi, standar
deviasi (simpangan baku), ...

SV Analisis Data 14
Ukuran Pemusatan Data
1. Mean (rata-rata)
1 n
x   xi
n i 1
Contoh :
x1  x2  ...  x12
x
12
278.59  279.78  ...  267.82
  222.17
12
SV Analisis Data 15
50 % data (awal) 50% data (akhir)
29.08 43.82 55.32 115.9 176.9 241.34 267.82 278.59 279.78 313.68 355.29 508.49

X(6.5)

2. Median
Nilai tengah yang membagi dua kelompok
data sama banyak.

med = x(6.5) = x(6) + 0.5 (x(7) - x(6) )= 254.58


3. Modus
Nilai yang paling sering muncul.
modus tidak ada SV Analisis Data 16
4. Kuartil
29.0825 %55.32 115.925
43.82 %241.34 267.8225
176.9 %279.78 313.6825
278.59 %508.49
355.29

q1
q2 = med q3
 Kuartil bawah (q1) : q1  x n 1 
 
 4 
q1  x 121   x
  3
 
1
1
4

 x3  x 4  x3  70.47 
 4   4

Kuartil tengah (q2) : q2  x 2( n 1)   x n 1 


   
 4   2 
q2  x 121   x(6.5)  254.58
 
 2 
Kuartil atas (q3) : q3  x 3( n 1) 
 
 4 
3
 
17

q3  x 3(121)   x 3
 x9  x10  x9  305.21
SV Analisis Data


 4


9 
 4
4
5. Persentil

29.08 43.82 55.32 115.9 176.9 241.34 267.82 278.59 279.78 313.68 355.29 508.49

p25 p50 = med p75


• Persentil ke-i :  x i ( n 1) 
 
 100 

• Persentil ke-50 :  x 50( n 1)  x n 1


   
   
 100   2 
median

• Persentil ke-25 dan Persentil ke-75?

kuartil bawah kuartil atasSV Analisis Data 18


Ukuran Penyebaran Data
Data : x1, x2, x3, ..., xn
Rataan : x
Ukuran penyebaran data yang
melihat bagaimana SETIAP
(keseluruhan) observasi terpisah
dari pusat data.
n
Tidak memberikan informasi apa-  (x  x ) i
apa, karena : i 1
n n

 ( x  x )   x  nx  nx  nx  0
i i
Jumlah Kuadrat (JK)
n
i 1 i 1
 i
( x 
SV Analisis Data
i 1
x ) 2
19
Ukuran Penyebaran Data
1. Jangkauan data (Range)
R = datamax – datamin R = 508.49 – 29.08 = 479.41

2. Variansi 2
 n 
1 n
? 1 
 n   xi  
 i 1  
s 
2

n  1 i 1
( xi  x ) 
2

n  1 
 xi
2

n  s 2  20663.8
i 1 
 

JKXX
3. Simpangan Baku (standard deviation)
s = √s2 s  20663.8  143.75
4. Jangkauan antar kuartil
dq = q3 – q1
SV Analisis Data 20
dq = q3 – q1 = 234.74
Data Pencilan
Data yang nilainya berbeda jauh dari kelompok
data yang lain.
Bagaimana mendeteksi data pencilan ??
1. Hitung dq dq = 234.74
2. Hitung BBP = q1 – k.dq BBP = 70.47–(1.5)(234.74 ) = -281.65

Pilih nilai k = 3/2 (optional)


3. Hitung BAP = q3 + k.dq BAP = 305.21 + (1,5)(234.74) = 657.32

4. Pencilan bawah < BBP tidak ada pencilan bawah


5. Pencilan atas > BAP tidak ada pencilan atas
SV Analisis Data 21
SARI NUMERIK
Count (banyak data, n) 12
Sum (jumlah data) 2666.01
Average (rata-rata) 222.17
Median (kuartil tengah) 254.58 mean <
Mode (modus) - median
Minimum 29.08
Maximum 508.49
Range 479.41
Standard Deviation 143.75
Variance 20663.8 Menceng
Skewness 0.303* kiri/negatif ???
Kurtosis -0.181*
25th Percentile
(persentil-25) 70.465
50th Percentile
(persentil-50) 254.58
75th Percentile
(persentil-75) 305.205 SV Analisis Data 22
Interquartile Range (dk) 234.74
KULIAH SELESAI 

SV Analisis Data 23
Statistika Deskriptif
-Sari grafik-

SV Analisis Data 24
Penyajian Data
1. Tabel Distribusi Frekuensi
2. Pie Chart
3. Dot Plot
4. Histogram
5. Diagram Batang – Daun (stem - leaf)
6. Diagram Kotak – Titik (box plot)
7. dll…

Skala penggambaran harus diperhatikan dalam penyajian data


dalam bentuk grafik.
Penyajian data dalam bentuk grafik dapat dilakukan secara
manual maupun menggunakan software-software statistik seperti
Microsoft Excel, SPSS, SAS, S-Plus, Minitab dan lainnya.
SV Analisis Data 25
Tabel Distribusi Frekuensi
 Data banyaknya pelanggan yang datang ke sebuah
mini market di 15 hari tertentu pada bulan Juli 2011.
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
Kelas Titik Frekuensi Frekuensi
Interval Tengah (f) Kumulatif
Kelas
21-35 28 1 1
36-50 43 4 5
51-65 58 1 6
66-80 73 2 8
PRINSIP
81-95 88 7 15 DASAR
PELUANG
Bagaimana bentuk histogramnya? SV Analisis Data 26
Pie Chart 10%
9%

23% 58%

 Pie chart merupakan grafik yang berbentuk lingkaran yang


mana setiap potongannya mewakili proporsi atau persentase
suatu komponen dari sebuah kelompok data (100%).
 Pemakaian pie chart hanya cocok ketika menyatakan data
dalam bentuk proporsi dari satu kelompok data.

SV Analisis Data 27
Dot Plot
3,5

2,5

frekuensi
2

1,5

0,5

0
0 20 40 60 80 100

nilai

 Cara menggambarkan data dalam bentuk


titik, dengan memperhatikan frekuensi dari
data yang bersangkutan
 Titik ditumpuk diatas nilai data yang
digambarkan.
SV Analisis Data 28
Histogram

 Histogram adalah gambar berdasarkan distribusi


frekuensi
 Setiap frekuensi dipresentasikan oleh suatu segi empat
(rectangle).
 Daerah setiap rectangle sebanding dengan frekuensinya.

SV Analisis Data 29
30

Diagram Batang-Daun (Stem-Leaf)


26 37 39 46 49 59 69 76 83 83 83 87 87 95 95

 Stem atau batang, mirip dengan grup data pada histogram, sedangkan
leaf atau daun, mirip dengan frekuensi.
 Stem atau batang adalah digit pertama yang terpenting yang ada
dalam bilangan yang membentuk harga data, sedangkan digit di
belakangnya akan merupakan leaf atau daun.
 Melalui stem-Leaf masih dapat dilihat nilai data mentahnya.
SV Analisis Data
Diagram Kotak-Titik (Box-
Plot)
100
95 max
90
85 q3
80
76 q2
70 mean
60
50
47,5 q1
40

min
30
26
20
10
0

 Box Plot digunakan untuk menyelidiki distribusi tanpa


menggunakan grup data seperti pada histogram dan
diagram batang daun.
 Box Plot terdiri dari: datamin , q1 , q2 (median), q3 , dan
datamax yang disusun secara terurut dengan membentuk
kotak. SV Analisis Data 31
Pencilan pada Box Plot

* pencilan atas
BAP (pagar atas)

upper whisker maksimum


q3
q2
mean

q1

lower whisker minimum


BBP (pagar
* pencilan bawah bawah)
*

SV Analisis Data 32
Kelemahan dan Keunggulan
KELEMAHAN KEUNGGULAN

Tidak efektif untuk Cepat


DOT PLOT
ukuran data yang besar Nilai data asli dapat diperkirakan
Histogram peluang dapat memberi
Lama gambaran tentang distribusi
HISTOGRAM Banyak perhitungan populasi
Nilai data tidak nampak Tidak menuntut ketelitian dalam
mencatat setiap nilai data
Cepat
Tidak memerlukan perhitungan
BATANG- Menuntut ketelitian
DAUN mencatat daun Nilai data asli dapat dilihat
Memudahkan perhitungan
berbagai parameter
Membutuhkan
Box plot dapat memberi gambaran
perhitungan yang
tentang bentuk distribusi populasi
panjang
BOX PLOT Efektif untuk membandingkan
SV Analisis Data 33
Terdiri dari parameter-
bentuk distribusi beberapa
parameter dari data yang
kelompok data sekaligus
Latihan 1
 Suatu jenis polimer digunakan dalam sistem evakuasi
pesawat terbang. Penting diperhatikan bahwa polimer
tersebut harus mampu melawan proses penuaan.
Diambil dua puluh sampel polimer yang kemudian
dibagi atas dua percobaan. Percobaan pertama (batch
1) yang melibatkan 10 sampel dikenakan proses
percepatan penuaan dengan temperatur tinggi selama
10 hari. Sedangkan 10 sampel lainnya (batch 2) tidak
dikenakan proses apa-apa. Kekuatan daya rentang
(dalam psi) sampel-sampel tersebut diukur dan
dicatat sebagai berikut.

Batch 1 227 222 218 217 225 218 216 229 228 221
Batch 2 219 214 215 211 209 218 203 204 201 205

Q: Apakah percobaan proses penuaan memberikan


dampak pada kekuatan daya rentang polimer?

SV Analisis Data 34
Sumber: Walpole (2006), hal.13
Contoh 2
 Apa yang dapat kita lakukan untuk
menjawab pertanyaan tersebut???

- Keluarkan sari numerik yang mungkin


Ukuran pemusatan data : MEAN, MEDIAN, KUARTIL BAWAH-
ATAS
Ukuran penyebaran data : RANGE, JANGKAUAN KUARTIL,
VARIANSI,SIMPANGAN BAKU
Lain-lain : SKEWNESS dan Apakah
KURTOSIS diperlukan???

- Plot data
Pilih plot yang informatif untuk menjawab pertanyaan
tersebut
Misal: BOXPLOT
SV Analisis Data 35
Batch.1 Batch.II
Mean 222,10 209,90
23,655 42,100
Variansi 6 0
Simp.Bak
u 4,86 6,49
Min. 216 201
Max. 229 219
Q1 218 204,25
Median 221,5 210
230
229
230
Q3 226,5 214,75
226.5
225 225
221.5
220 220
219
218
215 216 215 214.75

210 210 210

205 205 204.25

SARI NUMERIK
200 200 201
Batch 1
195 195 Batch 2

SV Analisis Data 36
APA YANG DAPAT DISIMPULKAN?? KESIMPULAN DESKRIPTIF
Bentuk Distribusi Ideal
Normal

mean = median

Memiliki bentuk distribusi yang simetris, yaitu :


Skewness = 0
Kurtosis = 3, (dalam software tertentu kurtosis normal = 0
SV Analisis Data 37
Transformasi Data (pengayaan)
 Transformasi dilakukan untuk mendapatkan
bentuk distribusi yang lebih simetris.
 Transformasi Tangga Tukey

-1/x2 - √x log x x2 x3 10x


1/x (x)

untuk bentuk distribusi data awal untuk bentuk distribusi :


: skewness positif skewness negatif

Merenggangkan data-data yang berharga kecil Merapatkan data-data yang berharga kecil dan
dan merapatkan data-data yang berharga besar merenggangkan data-data yang berharga besar

Data contoh kasus : skewness = -0,5 (skew negatif),


SV Analisis Data 38

maka transformasi yang mungkin adalah x2, x3, dan 10x.


Transformasi Data (pengayaan)
Contoh Kasus
x y = x2
Lebih mendekati simetris (skew = 0)
87 7569 dibanding sebelum transformasi
37 1369 (skew = -0,5)
59 3481
49 2401
69 4761
95 9025
83 6889
87 7569
skew = -0,18
39 1521
95 9025
83 6889
76 5776
83 6889
26 676 ** Ketika data ditransformasi, maka satuan
46 2116 dari data juga akanSVberubah
Analisis Data 39
transformasi
TUGAS INDIVIDU

Berikut adalah data ukuran diameter 25


bongkahan batu yang ditemukan:

77.71 44.24 60.00 89.54 85.64


60.00 24.00 54.12 64.52 27.14
87.46 42.13 43.04 45.75 111.27
27.79 41.49 47.70 83.00 14.32
70.00 32.35 41.60 77.96 14.37
Q:
1. Keluarkan sari numerik data di atas.
2. Buat box plot.
SV Analisis Data 40
 Djauhari, M.A., 2001, Catatan Kuliah Analisis Data.
 Walpole, Ronald E., et.al, Statistics for Scientist and
Engineering, 8th Ed., 2007.

Referensi
SV Analisis Data 41

Anda mungkin juga menyukai