Anda di halaman 1dari 39

Pengantar & Statistika Deskriptif

MA 2081 Statistika Dasar


28 Agustus 2012
Utriweni Mukhaiyar
2

Ilustrasi
• Berikut adalah data produksi panas bumi di
25 titik pengeboran (ton/jam):
77.71 44.24 60.00 89.54 85.64
60.00 24.00 54.12 64.52 27.14
87 46
87.46 42 13
42.13 43 04
43.04 45 75
45.75 111 27
111.27
27.79 41.49 47.70 83.00 14.32
70.00 32.35 41.60 77.96 14.37

 Informasi apa yang ingin diperoleh dari data ini ?


1. Rata-rata produksi panas bumi di 25 lokasi tersebut.
y
2. Penyebaran nilai p
produksi p
panas bumi di area STATISTIKA
wilayah pengeboran tersebut. DESKRIPTIF
3. Lokasi pengeboran dengan nilai produksi yang ekstrim.
4. Signifikansi rata-rata produksi panas bumi di area pengeboran
4
tersebut. INFERENSI
STATISTIKA
3

Statistik dan Statistika

Statistik : nilai-nilai ukuran data yang mudah dimengerti.


Contoh :
o statistik (mis. rata-rata) nilai elevasi pasang surut air laut di
selat Makassar (m),
o statistik (mis. variansi) hasil pengukuran tinggi gelombang
((cm)) menggunakan
gg AWLR ((Automatic Water Level Recorder))
o Statisitik (mis. range) antara nilai tinggi pasang maksimum dan
surut minimum (m)

St ti tik : ilmu
Statistika il yang berkaitan
b k it dengan
d cara pengumpulan,
l
pengolahan, analisis dan pernarikan kesimpulan atas data.
4

Jenis-jenis
j Statistika
1. Statistika deskriptif: metode yang berkaitan
dengan pengumpulan dan penyajian data.

2. Statistika
k inferensi:
f metode
d yang berkaitan
b k
dengan analisis sampel untuk penarikan
kesimpulan tentang karakteristik populasi.
populasi
5

Populasi dan Sampel


Populasi

Sampel

setiap
p obyek
y p populasi
p memiliki
m m
kemungkinan/kesempatan yang Sampel Acak
sama untuk terpilih

hasil pengukuran atau pengamatan Data


Contoh Populasi
p dan Sampel
p
• Akan dilakukan pengamatan tentang rata-rata
produksi minyak bumi di Indonesia.
Indonesia
Populasi
Kendala: - sangat banyak, -menghabiskan
Seluruh
S l h titik waktu, -menghabiskan biaya
di wilayah
Indonesia Kaidah Pengambilan
Keterwakilan sampel
? atas p
populasi
p ?? Sampel
p ((Teknik
Sampling)

Sampel
p
Contoh: setiap propinsi diambil beberapa titik
pengamatan
6
7

Jenis-jenis Observasi
OBSERVASI / DATA

KUALITATIF KUANTITATIF

Nominal Ordinal/Rank Diskrit Kontinu

Berhubungan dengan Didasarkan pada


Tidak mengenal Mengenal urutan
‘proses menghitung’, suatu selang/interval
urutan dan operasi dan operasi dan pengamatan atas sehingga meliputi
aritmatika aritmatika himpunan terhitung. semua bilangan riil
Jenjang pendidikan Banyaknya gempa yang
Jenis bencana yang Intensitas gempa yang
(SD, SMP, SMA,...), terjadi di suatu daerah
terjadi di suatu daerah terjadi setiap hari di
g
tingkatan daerah dalam 1 hari,, banyaknya
y y
(banjir,
(b ji longsor,
l hari hujan dalam satu suatut wilayah,
il h tingkat
ti k t
(Kelurahan, Kecamatan
gempa, dll), jenis bulan di suatu daerah, curah hujan harian di
Kab./Kota, Provinsi, dll
batuan, dll suatu daerah, dll
Negara), dll
© 2012 by UM
8

Statistika Deskriptif

Metode Tujuan :
Informasi berupa
pengolahan dan memberikan
: bentuk
penyajian suatu informasi yang
distribusi data
gugus data berguna.
9
Mean, median,
Ukuran
modus, kuartil,
Pemusatan @ UM
desil, persentil, dll

Ukuran Variansi, simpangan


Penyebaran baku, range,
PARAMETER (Variabilitas) jangkauan kuartil, dll
DISTRIBUSI
Kemencengan Skewness

Kelancipan Kurtosis

Karakteristik
Mean =
Distribusi Simetris
Median

Mean >
Kesimetrisan Skew Positif
Median

Mean <
BENTUK Skew Negatif
Median
DISTRIBUSI
Puncak
1 modus
t
tunggal
l
Puncak
(Modal)
Puncak Modus
jamak banyak
10

Karakteristik Distribusi
mean, median, modus,
1. PARAMETER Ukuran kuartil atas, kuartil
DISTRIBUSI Pemusatan bawah dll
bawah,
Ukuran Range, simpangan baku,
variansi, jangkauan
Penyebaran
y
antar kuartil, dll
Kemencengan skewness

Kelancipan kurtosis

2. BENTUK
Simetris mean = median
DISTRIBUSI
Menceng/skew
mean > median
Positif
Berpuncak Berpuncak Menceng/skew
mean < median
Jamak gg
Tunggal g
Negatif

# modus > 1 # modus = 1


11

CONTOH 1
Data rata-rata curah hujan bulanan yang diamati
dari Stasiun Padaherang pada tahun 2001 (n = 12)
278.59 279.78 355.29 241.34 115.9 176.9 55.32 29.08 43.82 313.68 508.49 267.82

x1 x2 x7 x10 x12
Data yang diurutkan:
29.08 43.82 55.32 115.9 176.9 241.34 267.82 278.59 279.78 313.68 355.29 508.49

x(1) x(2) X(7) x(10) x(12)


minimum maksimum
Adakah perbedaan dari penyajian kedua data di atas?
12

Ukuran Pemusatan & Penyebaran Data


• Ukuran pemusatan data
statistik yang memberikan informasi dimana data
terkumpul dengan ukuran/jumlah tertentu.
Contoh : Mean (rataan), kuartil bawah, kuartil
tengah (median)
(median), kuartil
k artil atas,
atas modus,
mod s persentil,
persentil ...
• Ukuran penyebaran data
statistik yyang
g memberikan informasi bagaimana
g
data menyebar di sekitar pusat data.
Contoh : range (jangkauan data), IQR (jangkauan
antar kuartil),
kuartil) variansi,
variansi standar deviasi (simpangan
baku), ...
13

Ukuran Pemusatan Data


1. Mean (rata-rata)
( )
1 n
x   xi
n i 1
Contoh :
x1  x2  ...  x12
x
12
278.59  279.78  ...  267.82
  222.17
12
14

29.08 50
43.82%55.32
data115.9
(awal
(awal)
176.9) 241.34 267.82278.59
50%279.78
data313.68355.29
(akhir
(akhir))508.49

X(6.5)
2. Median
Nil i tengah
Nilai t h yang membagi
b i dua
d kelompok
k l k data
d t
sama banyak.

med = x(6.5) = x(6) + 0.5 (x(7) - x(6) )= 254.58


3 M
3. Modus
d
Nilai yang paling sering muncul.
modus tidak ada
4. Kuartil
29.08 25 % 55.32 115.9 25
43.82 %241.34 267.82278.59
176.9 25 %279.78 313.68355.29
25 %508.49
q1
q2 = med d q3
Kuartil bawah (q1) : q1  x  n 1 
 
 4 
q1  x 121   x
   
3
1
1
4

 x3  x 4   x 3  70.47 
 4   4

Kuartil tengah (q2) : q2  x 2( n 1)   x n 1 


   
 4   2 
q2  x 121   x(6.5)
(6 5)  254.58
 
 2 
Kuartil atas (q3) : q3  x 3( n 1) 
 
15  4 
q3  x 3(12 1)   x
 
3
9 
 x9  
3
4
x10   x9   305.21
 4   4
16
5. Persentil

29.08 43.82 55.32 115.9 176.9 241.34 267.82278.59 279.78 313.68355.29 508.49

p25 p50 = med p75


• Persentil ke-i :  x i ( n 1) 
 
 100 

• Persentil ke-50 :  x 50( n 1)   x n 1 


   
 100   2 
median

• Persentil ke-25 dan Persentil ke-75?

kuartil bawah kuartil atas


17

Ukuran Penyebaran
y Data
Data : x1, x2, x3, ..., xn
D
Rataan : x
Ukuran penyebaran data yang
melihat bagaimana SETIAP
(keseluruhan) observasi terpisah
dari pusat data.
data
n
Tidak memberikan informasi apa-
p  (x  x )
i
apa, karena : i1
n n

 ( x  x )   x  nx  nx  nx  0
i i
Jumlah Kuadrat (JK)
n

 i
i 1 i 1
( x  x ) 2

i 1
18

Ukuran Penyebaran
y Data
1. Jangkauan data (Range)
R = datamax – datamin R = 508.49 – 29.08 = 479.41

2. Variansi 2
 n 
? 1 
   xi  
 i 1  
n n
1
s 
2

n  1 i 1
( xi  x ) 
2

n  1 
 xi
2

n  s2  20663.8
i 1 
 

JKXX
3 Si
3. Simpangan Baku B k ((standard
d d ddeviation)
i i )
s = √s2 s  20663.8  143.75
4. Jangkauan
k antar k
kuartill
dq = q3 – q1 dq = q3 – q1 = 234.74
19

Data Pencilan
Data yang nilainya berbeda jauh dari kelompok
data yang lain.
Bagaimana mendeteksi data pencilan ??
1. Hitung dq dq = 234.74
2 Hitung BBP = q1 – k.dq
2. k dq BBP = 70.47–(1.5)(234.74
( )( ) = -281.65

Pilih nilai k = 3/2 (optional)


3 Hitung BAP = q3 + k.dq
3. k dq BAP = 305.21
305 21 + (1,5)(234.74)
(1 5)(234 74) = 657.32
657 32

4. Pencilan bawah < BBP tidak ada pencilan bawah


5. Pencilan atas > BAP tidak ada pencilan atas
20

SARI NUMERIK
Count (banyak data, n) 12
Sum (jumlah data) 2666.01
Average (rata-rata) 222.17
Median (kuartil tengah) 254.58 mean < median
Mode (modus) -
Minimum 29.08
Maximum 508.49
Range 479.41
Menceng
Standard Deviation 143.75
kiri/negatif ???
Variance 20663.8
Skewness 0.303*
Kurtosis -0.181*
25th Percentile (persentil-25) 70.465
50th Percentile (persentil-50) 254.58
75th Percentile (persentil-75) 305.205
Interquartile Range (dk) 234.74
* Perhitungan dengan Mic. Excel
21

Penyajian
y j Data
1. Tabel Distribusi Frekuensi
2. Pie Chart
3. D Pl
Dot Plot
4. Histogram
5
5. Diagram Batang – Daun (stem - leaf)
6. Diagram Kotak – Titik (box plot)
7. dll…
Skala penggambaran harus diperhatikan dalam penyajian data
dalam bentuk grafik.
Penyajian data dalam bentuk grafik dapat dilakukan secara
manual maupun menggunakan software-software statistik seperti
Microsoft Excel, SPSS, SAS, S-Plus, Minitab dan lainnya.
22

T b l Distribusi
Tabel Di t ib i FFrekuensi
k i
• Data banyaknya
y y ppelanggan
gg y
yang
g datang
g ke sebuah
mini market
k d di 15 hari
h tertentu pada
d bulan
b l Julil 2011.
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
Kelas Titik Frekuensi Frekuensi
Interval Tengah (f) Kumulatif
Kelas
21-35 28 1 1
36-50 43 4 5
51-65
6 58
8 1 6
66-80 73 2 8
PRINSIP
81-95 88 7 15 DASAR
PELUANG
Bagaimana bentuk histogramnya?
23

Pie Chart
9%
10%

23% 58%

 Pie chart merupakan grafik yang berbentuk lingkaran yang


mana setiap
ti potongannya
t mewakili
kili proporsii atau
t persentase
t
suatu komponen dari sebuah kelompok data (100%).
 Pemakaian pie chart hanya
y cocok ketika menyatakan
y data
dalam bentuk proporsi dari satu kelompok data.
24

Dot Plot
3.5

2.5
si
frekuens

1.5

0.5

0
0 20 40 60 80 100
nilai

• Cara menggambarkan data dalam bentuk titik,


titik
dengan memperhatikan frekuensi dari data yang
bersangkutan
g
• Titik ditumpuk diatas nilai data yang digambarkan.
25

Histogram
g

• Histogram
g adalah g
gambar berdasarkan distribusi
frekuensi
• Setiap frekuensi dipresentasikan oleh suatu segi empat
(rectangle).
(rectangle)
• Daerah setiap rectangle sebanding dengan frekuensinya.
26

Diagram
g Batang-Daun
g ((Stem-Leaf)
f)
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95

• Stem atau batang,


g miripp dengan
g g grup
p data ppada histogram,
g sedangkan
g
leaf atau daun, mirip dengan frekuensi.
• Stem atau batang adalah digit pertama yang terpenting yang ada
g y
dalam bilangan yangg membentuk harga
g data, sedangkan
g digit
g di
belakangnya akan merupakan leaf atau daun.
• Melalui stem-Leaf masih dapat dilihat nilai data mentahnya.
27

Diagram
g Kotak-Titik
(Box-Plot)
100
95 max
90
85 q3
80
76 q2
70 mean
60
50 47.5 q1
40

min
30
26
20
10
0

• Box Plot digunakan untuk menyelidiki distribusi tanpa


menggunakank grup d data seperti pada d histogram
h dan
d
diagram batang daun.
• Box Plot terdiri dari: datamin , q1 , q2 (median), q3 , dan
datamax yang disusun secara terurut dengan membentuk
kotak.
28

Pencilan pada Box Plot

* pencilan atas
BAP (pagar atas)

upper whisker maksimum


q3
q2
mean

q1

lower whisker minimum

BBP (pagar bawah)


* pencilan bawah
*
29

Kelemahan dan Keunggulan


KELEMAHAN KEUNGGULAN

Tidak efektif untuk ukuran C


Cepat
DOT PLOT
data yang besar Nilai data asli dapat diperkirakan

Lama Histogram peluang dapat memberi


gambaran tentang distribusi populasi
HISTOGRAM Banyak perhitungan
Tidak menuntut ketelitian dalam
Nilai data tidak nampak mencatat setiap nilai data
Cepat
p
Tidak memerlukan perhitungan
BATANG- Menuntut ketelitian
DAUN mencatat daun Nilai data asli dapat dilihat
Memudahkan p
perhitungan
g berbagai
g
parameter
Membutuhkan perhitungan Box plot dapat memberi gambaran
yang panjang tentang bentuk distribusi populasi
BOX PLOT Terdiri
T di i dari
d i parameter-
t Efektif
Ef ktif untuk
t k membandingkan
b di k bentuk
b t k
parameter dari data yang distribusi beberapa kelompok data
sudah diurutkan sekaligus
30

Bentuk Distribusi Ideal


Normal

mean = median

Memiliki bentuk distribusi yang simetris, yaitu :


Skewness = 0
K t i = 3,
Kurtosis 3 (d
(dalam
l software
ft tertentu
t t t kurtosis
k t i normall = 0
31

L ih 1
Latihan
• Suatu jenis polimer digunakan dalam sistem evakuasi
pesawat terbang. Penting diperhatikan bahwa polimer
tersebut harus mampu melawan proses penuaan. Diambil
dua puluh sampel polimer yang kemudian dibagi atas dua
percobaan.
b Percobaan
b pertama (batch
(b h 1)) yang melibatkan
lib k
10 sampel dikenakan proses percepatan penuaan dengan
temperatur tinggi selama 10 hari. Sedangkan 10 sampel
lainnya (batch 2) tidak dikenakan proses apa-apa.
apa apa
Kekuatan daya rentang (dalam psi) sampel-sampel
tersebut diukur dan dicatat sebagai berikut.
Batch
h1 227 222 218 217 225 218 216 229 228 221
Batch 2 219 214 215 211 209 218 203 204 201 205

Q Apakah
Q: p p
percobaan p
proses p
penuaan memberikan
dampak pada kekuatan daya rentang polimer?

Sumber: Walpole (2006), hal.13


32

Contoh 2
• Apa
p yyang
g dapat
p kita lakukan untuk menjawab
j b
pertanyaan tersebut???

- Keluarkan sari numerik yang


ang mungkin
Ukuran pemusatan data : MEAN, MEDIAN, KUARTIL BAWAH-
ATAS
Ukuran penyebaran data : RANGE, JANGKAUAN KUARTIL,
VARIANSI,SIMPANGAN BAKU
Lain-lain : SKEWNESS dan Apakah diperlukan???
KURTOSIS

- Plot data
Pilih plot yang informatif untuk menjawab pertanyaan tersebut
Misal: BOXPLOT
33
Batch.1 @ UM
Batch.II
Mean 222,10
, 209,90
9,9
Variansi 23,6556 42,1000
Simp.Baku 4,86 6,49
SARI NUMERIK Min. 216 201
Max. 229 219
Q1 218 204,25
Median 221,5 210
Q3 226,5 214,75

230 230
229
226.5
65
225 225
221.5
220 220
219
218
215 216 215 214.75

210 210 210

205 205 204.25

200 200 201


Batch 1
195 195 Batch 2

APA YANG DAPAT DISIMPULKAN?? KESIMPULAN DESKRIPTIF


34

TUGAS 1
• Berikut adalah data produksi panas bumi di
25 titik pengeboran (ton/jam):
77.71 44.24 60.00 89.54 85.64
60.00 24.00 54.12 64.52 27.14
87.46 42.13 43.04 45.75 111.27
27.79 41.49 47.70 83.00 14.32
70 00
70.00 32 35
32.35 41 60
41.60 77 96 14.37
77.96 14 37
Q:
1. Keluarkan sari numerik data di atas.
2. Hitung variansi dengan 2 cara, bandingkan.
3. Buat box plot.
4 Ceritakan hasil olahan data Anda.
4. Anda
35

Transformasi Data (pengayaan)


(p g y )
• Transformasi dilakukan untuk mendapatkan
bentuk distribusi yang lebih simetris.
• Transformasi Tangga Tukey
-1/x2 -1/x √x log (x) x x2 x3 10x

untuk bentuk distribusi : data awal untuk bentuk distribusi :


skewness positif skewness negatif
Merenggangkan data‐data yang berharga kecil Merapatkan data‐data yang berharga kecil dan
dan merapatkan data‐data yang berharga besar merenggangkan data‐data yang berharga besar

Data contoh kasus : skewness = -0,5


0 5 (menceng kiri),
kiri)
maka transformasi yang mungkin adalah x2, x3, dan 10x.
36
Transformasi Data (pengayaan)
Contoh Kasus
x y = x2
Lebih mendekati simetris (skew = 0)
87 7569 dibanding sebelum transformasi
37 1369 (skew = -0,5)
59 3481
49 2401
69 4761
95 9025
83 6889
87 7569
skew
k = -0,18
0 18
39 1521
95 9025
83 6889
76 5776
83 6889
26
6 6 6
676 ** Ketika data ditransformasi, maka satuan
46 2116 dari data juga akan berubah
transformasi
37

TUGAS A
• Tujuan umum : 
j
Mencari, mengumpulkan, mengolah, menganalisis dan 
menarik kesimpulan atas data Anda sendiri.
• Tujuan khusus : menerapkan Statistika
Tujuan khusus : menerapkan Statistika Deskriptif terhadap 
Deskriptif terhadap
data sendiri.
• Tipe
Tipe Tugas : diskusi dalam kelompok, 1 kelompok 
Tugas : diskusi dalam kelompok, kelompok 3 3 orang.
orang.
Sumber data: buku teks, TA, data praktikum, koran, majalah, 
internet, dll (sebaiknya disesuaikan dengan permasalahan yang 
mungkin dihadapi di prodi masing‐masing)
mungkin dihadapi di prodi masing masing).
Ceritakan tentang data tersebut (histori data).

Tugas A diketik (Mic.Word atau Mic.Excel) dengan nama file: “Statdas.I.12‐
g ( ) g
13.A.Kelompok <nomor kelompok>” dikirim ke utriweni@math.itb.ac.id
Paling lambat Senin, 10 September 2012
38

Contoh Tugas
g A
by Aulia R.M. Fikri (10107096)
• Statistika Deskriptif Data Temperatur O-ring pada
Kecelakaan Pesawat Ulang-alik
Ulang alik Challenger
Suatu O-ring merupakan suatu gasket mekanik yang berbentuk torus, terbuat dari
elastomer yang melingkar, didesain untuk ditempatkan di suatu lekukan dan
dikompres di antara dua bagian selama perakitan sehingga terbentuk segel atau
perekat pada permukaan (interface) kedua bagian tersebut.
tersebut
Salah satu hal yang patut diperhatikan pada penggunaan O-ring adalah kaitannnya
dengan temperaturnya.
...
Berikut adalah data observasi temperature dari OO-ring
ring dalam derajat Fahrenheit ,
untuk setiap uji peluncuran mesin roket pesawat ulang alik Challenger tersebut
(Sumber: Presedential Commision on the Space Shuttle Challenger Accident, Vol.
1, 1986: 129-131).
84 45 68 57 53 76
49 66 60 63 67 79
61 70 67 70 75 75
40 69 72 78 61 76
83 80 73 52 70 58
67 58 70 67 81 31
Contoh ini lebih lengkap dapat dilihat di:
http://personal.fmipa.itb.ac.id/utriweni/files/2012/08/Statdas.I.12-13.A.CONTOH.pdf
Referensi
 Djauhari, M.A., 2001, Catatan Kuliah Analisis Data. 
 Walpole, Ronald E., et.al, Statistitic
Walpole Ronald E et al Statistitic for Scientist and 
for Scientist and
Engineering, 8th Ed., 2007.

39

Anda mungkin juga menyukai