Anda di halaman 1dari 39

Pengantar & Statistika Deskriptif

MA 2081 Statistika Dasar


28 Agustus 2012
Utriweni Mukhaiyar

Ilustrasi
Berikut adalah data produksi panas bumi di
25 titik pengeboran (ton/jam):
77.71
60.00
87 46
87.46
27.79
70.00

44.24
24.00
42 13
42.13
41.49
32.35

60.00
54.12
43 04
43.04
47.70
41.60

89.54
64.52
45 75
45.75
83.00
77.96

85.64
27.14
111 27
111.27
14.32
14.37

Informasi apa yang ingin diperoleh dari data ini ?


1. Rata-rata produksi panas bumi di 25 lokasi tersebut.
y
nilai p
produksi p
panas bumi di area
2. Penyebaran
STATISTIKA
wilayah pengeboran tersebut.
DESKRIPTIF
3. Lokasi pengeboran dengan nilai produksi yang ekstrim.
4. Signifikansi rata-rata produksi panas bumi di area pengeboran
4
tersebut.
INFERENSI
STATISTIKA

Statistik dan Statistika


Statistik : nilai-nilai ukuran data yang mudah dimengerti.
Contoh :
o statistik (mis. rata-rata) nilai elevasi pasang surut air laut di
selat Makassar (m),
o statistik (mis. variansi) hasil pengukuran tinggi gelombang
((cm)) menggunakan
gg
AWLR ((Automatic Water Level Recorder))
o Statisitik (mis. range) antara nilai tinggi pasang maksimum dan
surut minimum (m)

St ti tik : ilmu
Statistika
il
yang berkaitan
b k it dengan
d
cara pengumpulan,
l
pengolahan, analisis dan pernarikan kesimpulan atas data.

Jenis-jenis
j
Statistika
1. Statistika deskriptif: metode yang berkaitan
dengan pengumpulan dan penyajian data.
2. Statistika
k inferensi:
f
metode
d yang berkaitan
b k
dengan analisis sampel untuk penarikan
kesimpulan tentang karakteristik populasi.
populasi

Populasi dan Sampel


Populasi
Sampel
setiap
p obyek
y p
populasi
p
memiliki
m
m
kemungkinan/kesempatan yang
sama untuk terpilih
hasil pengukuran atau pengamatan

Sampel Acak
Data

Contoh Populasi
p
dan Sampel
p
Akan dilakukan pengamatan tentang rata-rata
produksi minyak bumi di Indonesia.
Indonesia
Populasi
Seluruh
S
l
h titik
di wilayah
Indonesia
?

Kendala: - sangat banyak, -menghabiskan


waktu, -menghabiskan biaya

Keterwakilan sampel
atas p
populasi
p
??

Kaidah Pengambilan
Sampel
p ((Teknik
Sampling)

Sampel
p
6

Contoh: setiap propinsi diambil beberapa titik


pengamatan

Jenis-jenis Observasi
OBSERVASI / DATA
KUALITATIF

Nominal

Ordinal/Rank

KUANTITATIF

Diskrit

Kontinu

Tidak mengenal
urutan dan operasi
aritmatika

Mengenal urutan
dan operasi
aritmatika

Berhubungan dengan
proses menghitung,
dan pengamatan atas
himpunan terhitung.

Didasarkan pada
suatu selang/interval
sehingga meliputi
semua bilangan riil

Jenis bencana yang


terjadi di suatu daerah
(banjir,
(b ji longsor,
l
gempa, dll), jenis
batuan, dll

Jenjang pendidikan
(SD, SMP, SMA,...),
g
tingkatan
daerah
(Kelurahan, Kecamatan
Kab./Kota, Provinsi,
Negara), dll

Banyaknya gempa yang


terjadi di suatu daerah
y
y
dalam 1 hari,, banyaknya
hari hujan dalam satu
bulan di suatu daerah,
dll

Intensitas gempa yang


terjadi setiap hari di
suatu
t wilayah,
il h tingkat
ti k t
curah hujan harian di
suatu daerah, dll

2012 by UM

Statistika Deskriptif

Metode
pengolahan dan
penyajian suatu
gugus data

Tujuan :
memberikan
informasi yang
berguna.

Informasi berupa
: bentuk
distribusi data

Ukuran
Pemusatan

PARAMETER
DISTRIBUSI

Ukuran
Penyebaran
(Variabilitas)
Kemencengan
Kelancipan

Karakteristik
Distribusi
Kesimetrisan

BENTUK
DISTRIBUSI
Puncak
(Modal)

Mean, median,
modus,
kuartil,
@ UM
desil, persentil, dll
Variansi, simpangan
baku, range,
jangkauan kuartil, dll
Skewness
Kurtosis
Simetris

Mean =
Median

Skew Positif

Mean >
Median

Skew Negatif

Mean <
Median

Puncak
t
tunggal
l

1 modus

Puncak
jamak

Modus
banyak

10

Karakteristik Distribusi
1. PARAMETER
DISTRIBUSI

Ukuran
Pemusatan
Ukuran
Penyebaran
y

2. BENTUK
DISTRIBUSI

Kemencengan

skewness

Kelancipan

kurtosis

Simetris

Berpuncak
Jamak

Berpuncak
gg
Tunggal

# modus > 1

# modus = 1

mean, median, modus,


kuartil atas, kuartil
bawah dll
bawah,
Range, simpangan baku,
variansi, jangkauan
antar kuartil, dll

Menceng/skew
Positif
Menceng/skew
g
Negatif

mean = median
mean > median
mean < median

11

CONTOH 1
Data rata-rata curah hujan bulanan yang diamati
dari Stasiun Padaherang pada tahun 2001 (n = 12)
278.59

279.78

x1

355.29

241.34

115.9 176.9 55.32 29.08 43.82

x2

x7

313.68

508.49 267.82

x10

x12

Data yang diurutkan:


29.08 43.82 55.32 115.9 176.9 241.34 267.82 278.59 279.78 313.68 355.29 508.49

x(1) x(2)
minimum

X(7)

x(10)

x(12)
maksimum

Adakah perbedaan dari penyajian kedua data di atas?

12

Ukuran Pemusatan & Penyebaran Data


Ukuran pemusatan data
statistik yang memberikan informasi dimana data
terkumpul dengan ukuran/jumlah tertentu.
Contoh : Mean (rataan), kuartil bawah, kuartil
tengah (median)
(median), kuartil
k artil atas,
atas modus,
mod s persentil,
persentil ...
Ukuran penyebaran data
statistik yyang
g memberikan informasi bagaimana
g
data menyebar di sekitar pusat data.
Contoh : range (jangkauan data), IQR (jangkauan
antar kuartil),
kuartil) variansi,
variansi standar deviasi (simpangan
baku), ...

13

Ukuran Pemusatan Data


1. Mean (rata-rata)
(
)
1 n
x xi
n i 1

Contoh :
x1 x2 ... x12
x
12
278.59 279.78 ... 267.82

222.17
12

14

29.08 50
43.82%55.32
176.9) 241.34 267.82278.59
data115.9
(awal
(awal)
50%279.78
data313.68355.29
(akhir
(akhir))508.49

X(6.5)
2. Median
Nil i tengah
Nilai
t
h yang membagi
b i dua
d kelompok
k l
k data
d t
sama banyak.

med = x(6.5) = x(6) + 0.5 (x(7) - x(6) )= 254.58


3 M
3.
Modus
d
Nilai yang paling sering muncul.
modus tidak ada

4. Kuartil
29.08 25
43.82
176.9
% 55.32 115.9 25
%241.34 267.82278.59
25 %279.78 313.68355.29
25 %508.49

q1

q3

q2 = med
d
Kuartil bawah (q1) : q1 x n 1
q1 x 121 x

1
3

4

1
x3 x 4 x 3 70.47
4

Kuartil tengah (q2) : q2 x 2( n 1) x n 1

q2 x 121 x(6.5)
(6 5) 254.58

Kuartil atas (q3) : q3 x 3( n 1)


15

q3 x 3(12 1) x

3
9
4

x9

3
x10 x9 305.21
4

16

5. Persentil
29.08 43.82 55.32 115.9 176.9 241.34 267.82278.59 279.78 313.68355.29 508.49

p25
Persentil ke-i :

p75

p50 = med

x i ( n 1)

100

Persentil ke-50 : x 50( n 1) x n 1

100

median

Persentil ke-25 dan Persentil ke-75?


kuartil bawah

kuartil atas

17

Ukuran Penyebaran
y
Data

Data : x1, x2, x3, ..., xn


D
Rataan : x

Ukuran penyebaran data yang


melihat bagaimana SETIAP
(keseluruhan) observasi terpisah
dari pusat data.
data
n

Tidak memberikan informasi apap


apa, karena :
n

( x x ) x nx nx nx 0
i 1

i 1

(x x )
i

i1

Jumlah Kuadrat (JK)


n

2
(
x

x
)
i
i 1

18

Ukuran Penyebaran
y
Data
1. Jangkauan data (Range)
R = datamax datamin
2. Variansi

1
1
2
2
s
( xi x )

n 1 i 1
n 1

R = 508.49 29.08 = 479.41

n
xi
n
i 1
2

i
n
i 1

s2 20663.8

JKXX

3 Si
3.
Simpangan Baku
B k ((standard
d d ddeviation)
i i )
s 20663.8 143.75
s = s2
4. Jangkauan
k
antar k
kuartill
dq = q3 q1
dq = q3 q1 = 234.74

19

Data Pencilan
Data yang nilainya berbeda jauh dari kelompok
data yang lain.
Bagaimana mendeteksi data pencilan ??
1. Hitung dq

dq = 234.74

2 Hitung BBP = q1 k.dq


2.
k dq

BBP = 70.47(1.5)(234.74
( )(
) = -281.65

Pilih nilai k = 3/2 (optional)


3 Hitung BAP = q3 + k.dq
3.
k dq

BAP = 305.21
305 21 + (1,5)(234.74)
(1 5)(234 74) = 657.32
657 32

4. Pencilan bawah < BBP

tidak ada pencilan bawah

5. Pencilan atas > BAP

tidak ada pencilan atas

20

SARI NUMERIK
Count (banyak data, n)
Sum (jumlah data)
Average (rata-rata)
Median (kuartil tengah)
Mode (modus)
Minimum
Maximum
Range
Standard Deviation
Variance
Skewness
Kurtosis
25th Percentile (persentil-25)
50th Percentile (persentil-50)
75th Percentile (persentil-75)
Interquartile Range (dk)
* Perhitungan dengan Mic. Excel

12
2666.01
222.17
254.58
29.08
508.49
479.41
143.75
20663.8
0.303*
-0.181*
70.465
254.58
305.205
234.74

mean < median

Menceng
kiri/negatif ???

21

Penyajian
y j
Data
1.
2.
3.
4.
5
5.
6.

Tabel Distribusi Frekuensi


Pie Chart
D Pl
Dot
Plot
Histogram
Diagram Batang Daun (stem - leaf)
Diagram Kotak Titik (box plot)

7.

dll
Skala penggambaran harus diperhatikan dalam penyajian data
dalam bentuk grafik.
Penyajian data dalam bentuk grafik dapat dilakukan secara
manual maupun menggunakan software-software statistik seperti
Microsoft Excel, SPSS, SAS, S-Plus, Minitab dan lainnya.

22

T b l Distribusi
Tabel
Di t ib i F
Frekuensi
k
i
Data banyaknya
y
y p
pelanggan
gg y
yang
g datang
g ke sebuah
mini market
k d
di 15 hari
h tertentu pada
d bulan
b l Juli
l 2011.

26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
Kelas
Interval

Titik
Tengah
Kelas

Frekuensi
(f)

Frekuensi
Kumulatif

21-35

28

36-50

43

51-65
6

58
8

66-80

73

81-95

88

15

Bagaimana bentuk histogramnya?

PRINSIP
DASAR
PELUANG

23

Pie Chart
9%
10%

23%

58%

Pie chart merupakan grafik yang berbentuk lingkaran yang

mana setiap
ti potongannya
t
mewakili
kili proporsii atau
t persentase
t
suatu komponen dari sebuah kelompok data (100%).
Pemakaian pie chart hanya
y cocok ketika menyatakan
y
data
dalam bentuk proporsi dari satu kelompok data.

24

Dot Plot
3.5
3

frekuens
si

2.5
2
1.5
1
0.5
0
0

20

40

60

80

100

nilai

Cara menggambarkan data dalam bentuk titik,


titik
dengan memperhatikan frekuensi dari data yang
bersangkutan
g
Titik ditumpuk diatas nilai data yang digambarkan.

25

Histogram
g

Histogram
g
adalah g
gambar berdasarkan distribusi
frekuensi
Setiap frekuensi dipresentasikan oleh suatu segi empat
(rectangle).
(rectangle)
Daerah setiap rectangle sebanding dengan frekuensinya.

26

Diagram
g
Batang-Daun
g
((Stem-Leaf)
f)
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95

Stem atau batang,


g mirip
p dengan
g g
grup
p data p
pada histogram,
g
sedangkan
g
leaf atau daun, mirip dengan frekuensi.
Stem atau batang adalah digit pertama yang terpenting yang ada
g y
yang
g membentuk harga
g data, sedangkan
g
digit
g di
dalam bilangan
belakangnya akan merupakan leaf atau daun.
Melalui stem-Leaf masih dapat dilihat nilai data mentahnya.

27

Diagram
g
Kotak-Titik
(Box-Plot)
100
90

95

max
85

80

76

70

q2

q3
mean

60
50

47.5

40
30
20

26

q1

min

10
0

Box Plot digunakan untuk menyelidiki distribusi tanpa


menggunakan
k grup d
data seperti pada
d histogram
h
dan
d
diagram batang daun.
Box Plot terdiri dari: datamin , q1 , q2 (median), q3 , dan
datamax yang disusun secara terurut dengan membentuk
kotak.

28

Pencilan pada Box Plot


*

pencilan atas
BAP (pagar atas)
upper whisker
q3
q2

maksimum
mean

q1
lower whisker
*
*

minimum

BBP (pagar bawah)


pencilan bawah

29

Kelemahan dan Keunggulan


KELEMAHAN
DOT PLOT

HISTOGRAM

KEUNGGULAN

Tidak efektif untuk ukuran


data yang besar

C
Cepat

Lama

Histogram peluang dapat memberi


gambaran tentang distribusi populasi

Banyak perhitungan
Nilai data tidak nampak

Nilai data asli dapat diperkirakan

Tidak menuntut ketelitian dalam


mencatat setiap nilai data
Cepat
p

BATANGDAUN

Menuntut ketelitian
mencatat daun

Tidak memerlukan perhitungan


Nilai data asli dapat dilihat
Memudahkan p
perhitungan
g berbagai
g
parameter

BOX PLOT

Membutuhkan perhitungan
yang panjang

Box plot dapat memberi gambaran


tentang bentuk distribusi populasi

Terdiri
T
di i dari
d i parametert
parameter dari data yang
sudah diurutkan

Efektif
Ef
ktif untuk
t k membandingkan
b di k bentuk
b t k
distribusi beberapa kelompok data
sekaligus

30

Bentuk Distribusi Ideal


Normal

mean = median

Memiliki bentuk distribusi yang simetris, yaitu :


Skewness = 0
K t i = 3,
Kurtosis
3 (d
(dalam
l
software
ft
tertentu
t t t kurtosis
k t i normall = 0

31

L ih 1
Latihan
Suatu jenis polimer digunakan dalam sistem evakuasi
pesawat terbang. Penting diperhatikan bahwa polimer
tersebut harus mampu melawan proses penuaan. Diambil
dua puluh sampel polimer yang kemudian dibagi atas dua
percobaan.
b
Percobaan
b
pertama (batch
(b h 1)) yang melibatkan
lib k
10 sampel dikenakan proses percepatan penuaan dengan
temperatur tinggi selama 10 hari. Sedangkan 10 sampel
lainnya (batch 2) tidak dikenakan proses apa-apa.
apa apa
Kekuatan daya rentang (dalam psi) sampel-sampel
tersebut diukur dan dicatat sebagai berikut.
Batch
h1

227 222

218 217

225

218 216 229

228

221

Batch 2

219

215

209

218

201

205

214

211

203 204

Q Apakah
Q:
p
p
percobaan p
proses p
penuaan memberikan
dampak pada kekuatan daya rentang polimer?
Sumber: Walpole (2006), hal.13

32

Contoh 2
Apa
p yyang
g dapat
p kita lakukan untuk menjawab
j
b
pertanyaan tersebut???
- Keluarkan sari numerik yang
ang mungkin
Ukuran pemusatan data : MEAN, MEDIAN, KUARTIL BAWAHATAS
Ukuran penyebaran data : RANGE, JANGKAUAN KUARTIL,
VARIANSI,SIMPANGAN BAKU
Lain-lain : SKEWNESS dan
KURTOSIS

Apakah diperlukan???

- Plot data
Pilih plot yang informatif untuk menjawab pertanyaan tersebut
Misal: BOXPLOT

33

Batch.1
Mean
222,10
,
Variansi 23,6556
Simp.Baku 4,86
Min.
216
Max.
229
Q1
218
Median
221,5
Q3
226,5
@ UM

SARI NUMERIK

230

230

229
226.5
65

225

221.5

220
216

Batch.II
209,90
9,9
42,1000
6,49
201
219
204,25
210
214,75

218

225
220

219

215

214.75

210

210

210

205

205

204.25

200

200

215

201

Batch 1
195

APA YANG DAPAT DISIMPULKAN??

195

Batch 2

KESIMPULAN DESKRIPTIF

34

TUGAS 1
Berikut adalah data produksi panas bumi di
25 titik pengeboran (ton/jam):
77.71
60.00
87.46
27.79
70 00
70.00

44.24
24.00
42.13
41.49
32 35
32.35

60.00
54.12
43.04
47.70
41 60
41.60

89.54 85.64
64.52 27.14
45.75 111.27
83.00 14.32
77 96 14.37
77.96
14 37

Q:
1. Keluarkan sari numerik data di atas.
2. Hitung variansi dengan 2 cara, bandingkan.
3. Buat box plot.
4 Ceritakan hasil olahan data Anda.
4.
Anda

35

Transformasi Data (pengayaan)


(p g y
)
Transformasi dilakukan untuk mendapatkan
bentuk distribusi yang lebih simetris.
Transformasi Tangga Tukey
-1/x2 -1/x
untuk bentuk distribusi :
skewness positif

log (x)

x2

data awal

Merenggangkan datadatayangberharga kecil


dan merapatkan datadatayangberharga besar

x3

10x

untuk bentuk distribusi :


skewness negatif

Merapatkan datadatayangberharga kecil dan


merenggangkan datadatayangberharga besar

Data contoh kasus : skewness = -0,5


0 5 (menceng kiri),
kiri)
maka transformasi yang mungkin adalah x2, x3, dan 10x.

Transformasi Data (pengayaan)


Contoh Kasus
x

y = x2

87
37
59
49
69
95
83
87
39
95
83
76
83
26
6
46

7569
1369
3481
2401
4761
9025
6889
7569
1521
9025
6889
5776
6889
6 6
676
2116

transformasi

36

Lebih mendekati simetris (skew = 0)


dibanding sebelum transformasi
(skew = -0,5)

skew
k
= -0,18
0 18

** Ketika data ditransformasi, maka satuan


dari data juga akan berubah

37

TUGAS A
Tujuanumum:
j
Mencari,mengumpulkan,mengolah,menganalisisdan
menarikkesimpulanatasdataAndasendiri.
Tujuankhusus:menerapkanStatistika
Tujuan khusus : menerapkan Statistika Deskriptifterhadap
Deskriptif terhadap
datasendiri.
Tipe
TipeTugas:diskusidalamkelompok,1kelompok
Tugas : diskusi dalam kelompok, kelompok 3
3orang.
orang.
Sumberdata:bukuteks,TA,datapraktikum,koran,majalah,
internet,dll(sebaiknyadisesuaikandenganpermasalahanyang
mungkin dihadapi di prodi masingmasing)
mungkindihadapidiprodimasing
masing).
Ceritakantentangdatatersebut(historidata).
TugasAdiketik(Mic.WordatauMic.Excel)dengannamafile:Statdas.I.12
g
(
)
g
13.A.Kelompok<nomorkelompok>dikirimkeutriweni@math.itb.ac.id
Paling lambat Senin, 10 September 2012

38

Contoh Tugas
g A
by Aulia R.M. Fikri (10107096)

Statistika Deskriptif Data Temperatur O-ring pada


Kecelakaan Pesawat Ulang-alik
Ulang alik Challenger
Suatu O-ring merupakan suatu gasket mekanik yang berbentuk torus, terbuat dari
elastomer yang melingkar, didesain untuk ditempatkan di suatu lekukan dan
dikompres di antara dua bagian selama perakitan sehingga terbentuk segel atau
perekat pada permukaan (interface) kedua bagian tersebut.
tersebut
Salah satu hal yang patut diperhatikan pada penggunaan O-ring adalah kaitannnya
dengan temperaturnya.
...
Berikut adalah data observasi temperature dari O
O-ring
ring dalam derajat Fahrenheit ,
untuk setiap uji peluncuran mesin roket pesawat ulang alik Challenger tersebut
(Sumber: Presedential Commision on the Space Shuttle Challenger Accident, Vol.
1, 1986: 129-131).

84
49
61
40
83
67

45
66
70
69
80
58

68
60
67
72
73
70

57
63
70
78
52
67

53
67
75
61
70
81

76
79
75
76
58
31

Contoh ini lebih lengkap dapat dilihat di:


http://personal.fmipa.itb.ac.id/utriweni/files/2012/08/Statdas.I.12-13.A.CONTOH.pdf

Referensi
Djauhari,M.A.,2001,CatatanKuliahAnalisisData.
Walpole,RonaldE.,et.al,Statistitic
Walpole Ronald E et al Statistitic forScientistand
for Scientist and

Engineering,8thEd.,2007.

39