Anda di halaman 1dari 38

Pengantar & Statistika

Deskriptif

UTRIWENI MUKHAIYAR
Ilustrasi
Berikut adalah data produksi panas bumi di 25 titik pengeboran (ton/jam):
77.71 44.24 60.00 89.54 85.64
60.00 24.00 54.12 64.52 27.14
87.46 42.13 43.04 45.75 111.27
27.79 41.49 47.70 83.00 14.32
70.00 32.35 41.60 77.96 14.37

 Informasi apa yang ingin diperoleh dari data ini ?


1. Rata-rata produksi panas bumi di 25 lokasi tersebut.
2. Penyebaran nilai produksi panas bumi di area STATISTIKA
wilayah pengeboran tersebut. DESKRIPTIF
3. Lokasi pengeboran dengan nilai produksi yang ekstrim.
4. Signifikansi rata-rata produksi panas bumi di area pengeboran tersebut.
INFERENSI
STATISTIKA 2
Statistik dan Statistika
Statistik : nilai-nilai ukuran data yang mudah dimengerti.
Contoh :
o statistik (mis. rata-rata) nilai elevasi pasang surut air laut di selat Makassar
(m),
o statistik (mis. variansi) hasil pengukuran tinggi gelombang (cm)
menggunakan AWLR (Automatic Water Level Recorder)
o Statisitik (mis. range) antara nilai tinggi pasang maksimum dan surut
minimum (m)

Statistika : ilmu yang berkaitan dengan cara pengumpulan,


pengolahan, analisis dan pernarikan kesimpulan atas data.

3
Jenis-jenis Statistika
1. Statistika deskriptif: metode yang berkaitan dengan
pengumpulan dan penyajian data.

2. Statistika inferensi: metode yang berkaitan dengan analisis


sampel untuk penarikan kesimpulan tentang karakteristik
populasi.

4
Populasi dan Sampel
Populasi

Sampel

setiap obyek populasi memiliki


kemungkinan/kesempatan yang Sampel Acak
sama untuk terpilih

hasil pengukuran atau pengamatan Data

5
Contoh Populasi dan Sampel
Akan dilakukan pengamatan tentang rata-rata produksi minyak bumi di
Indonesia.

Populasi
Kendala: - sangat banyak, -menghabiskan
Seluruh titik waktu, -menghabiskan biaya
di wilayah
Indonesia Keterwakilan sampel Kaidah Pengambilan
? atas populasi ?? Sampel (Teknik
Sampling)

Sampel
Contoh: setiap propinsi diambil beberapa titik
6 pengamatan
Jenis-jenis Observasi
OBSERVASI / DATA

KUALITATIF KUANTITATIF

Nominal Ordinal/Rank Diskrit Kontinu

Berhubungan dengan Didasarkan pada


Tidak mengenal Mengenal urutan
‘proses menghitung’, suatu selang/interval
urutan dan operasi dan operasi sehingga meliputi
dan pengamatan atas
aritmatika aritmatika himpunan terhitung. semua bilangan riil

Jenjang pendidikan (SD, Banyaknya gempa yang Intensitas gempa yang


Jenis bencana yang
SMP, SMA,...), tingkatan terjadi di suatu daerah terjadi setiap hari di
terjadi di suatu daerah
daerah (Kelurahan, dalam 1 hari, banyaknya suatu wilayah, tingkat
(banjir, longsor, gempa, hari hujan dalam satu
Kecamatan Kab./Kota, curah hujan harian di
dll), jenis batuan, dll bulan di suatu daerah, dll
Provinsi, Negara), dll suatu daerah, dll
7
© 2012 by UM
Statistika Deskriptif

Metode Tujuan :
Informasi berupa:
pengolahan dan memberikan
bentuk distribusi
penyajian suatu informasi yang
data
gugus data berguna.

8
Karakteristik Distribusi
mean, median, modus,
kuartil atas, kuartil
1. PARAMETER DISTRIBUSI Ukuran Pemusatan
bawah, dll
Range, simpangan baku,
Ukuran Penyebaran variansi, jangkauan antar
kuartil, dll
Kemencengan skewness

Kelancipan kurtosis

2. BENTUK DISTRIBUSI Simetris mean = median

Menceng/skew
mean > median
Positif
Berpuncak Berpuncak Menceng/skew
mean < median
Jamak Tunggal Negatif

# modus > 1 # modus = 1


9
CONTOH 1
Data rata-rata curah hujan bulanan yang diamati dari Stasiun
Padaherang pada tahun 2001 (n = 12)

278.59 279.78 355.29 241.34 115.9 176.9 55.32 29.08 43.82 313.68 508.49 267.82

x1 x2 x7 x10 x12
Data yang diurutkan:
29.08 43.82 55.32 115.9 176.9 241.34 267.82 278.59 279.78 313.68 355.29 508.49

x(1) x(2) X(7) x(10) x(12)


minimum maksimum
Adakah perbedaan dari penyajian kedua data di atas? 10
Ukuran Pemusatan &
Penyebaran Data
Ukuran pemusatan data
statistik yang memberikan informasi dimana data terkumpul dengan
ukuran/jumlah tertentu.
Contoh : Mean (rataan), kuartil bawah, kuartil tengah (median), kuartil
atas, modus, persentil, ...
Ukuran penyebaran data
statistik yang memberikan informasi bagaimana data menyebar di
sekitar pusat data.
Contoh : range (jangkauan data), IQR (jangkauan antar kuartil), variansi,
standar deviasi (simpangan baku), ...

11
Ukuran Pemusatan Data
1. Mean (rata-rata)

1 n
x   xi
n i 1
Contoh :
x1  x2  ...  x12
x
12
278.59  279.78  ...  267.82
  222.17
12

12
50 %55.32
29.08 43.82 data115.9
(awal) 50% data (akhir)
176.9 241.34267.82278.59279.78313.68355.29508.49

X(6.5)
2. Median
Nilai tengah yang membagi dua kelompok data sama banyak.

med = x(6.5) = x(6) + 0.5 (x(7) - x(6) )= 254.58


3. Modus
Nilai yang paling sering muncul.
modus tidak ada
13
4. Kuartil
29.08 25 % 55.32 115.9 25
43.82 %241.34267.82278.59279.78313.68355.29508.49
176.9 25 % 25 %

q1
q2 = med q3
Kuartil bawah (q1) : q1  x n 1 
 
 4 
q1  x 121   x
   
3
1
1
4

 x3  x 4  x3  70.47 
 4   4

Kuartil tengah (q2) : q2  x 2( n 1)   x n 1 


   
 4   2 
q2  x 121   x(6.5)  254.58
 
 2 
Kuartil atas (q3) : q3  x 3( n 1) 
 
14  4 
q3  x 3(121)   x
 
3
9 
 x9 
3
4
x10  x9  305.21 
 4   4
5. Persentil
29.08 43.82 55.32 115.9 176.9 241.34267.82278.59279.78313.68355.29508.49

p25 p50 = med p75


• Persentil ke-i :  x i ( n 1) 
 
 100 

• Persentil ke-50 :  x 50( n 1)   x n 1 


   
 100   2 
median

• Persentil ke-25 dan Persentil ke-75?

kuartil bawah kuartil atas


15
Ukuran Penyebaran Data
Data : x1, x2, x3, ..., xn
Rataan : x
Ukuran penyebaran data yang
melihat bagaimana SETIAP
(keseluruhan) observasi terpisah
dari pusat data.
n
Tidak memberikan informasi apa-  (x  x )
i
apa, karena : i 1
n n

 ( x  x )   x  nx  nx  nx  0
i i
Jumlah Kuadrat (JK)
n

 i
i 1 i 1
( x  x ) 2

i 1 16
Ukuran Penyebaran Data
1. Jangkauan data (Range)
R = datamax – datamin R = 508.49 – 29.08 = 479.41

2. Variansi 2
 n 
? 1 
   xi  
 i 1  
n n
1
s 
2

n  1 i 1
( xi  x ) 
2

n  1 
 xi
2

n  s 2  20663.8
i 1 
 

JKXX
3. Simpangan Baku (standard deviation)
s = √s2 s  20663.8  143.75
4. Jangkauan antar kuartil
dq = q3 – q1 dq = q3 – q1 = 234.74 17
Data Pencilan
Data yang nilainya berbeda jauh dari kelompok
data yang lain.
Bagaimana mendeteksi data pencilan ??
1. Hitung dq dq = 234.74
2. Hitung BBP = q1 – k.dq BBP = 70.47–(1.5)(234.74 ) = -281.65

Pilih nilai k = 3/2 (optional)

3. Hitung BAP = q3 + k.dq BAP = 305.21 + (1,5)(234.74) = 657.32

4. Pencilan bawah < BBP tidak ada pencilan bawah


5. Pencilan atas > BAP tidak ada pencilan atas
18
SARI NUMERIK
Count (banyak data, n) 12
Sum (jumlah data) 2666.01
Average (rata-rata) 222.17
Median (kuartil tengah) 254.58 mean < median
Mode (modus) -
Minimum 29.08
Maximum 508.49
Range 479.41
Menceng
Standard Deviation 143.75
kiri/negatif ???
Variance 20663.8
Skewness 0.303*
Kurtosis -0.181*
25th Percentile (persentil-25) 70.465
50th Percentile (persentil-50) 254.58
75th Percentile (persentil-75) 305.205
Interquartile Range (dk) 234.74
* Perhitungan dengan Mic. Excel
19
Penyajian Data
1. Tabel Distribusi Frekuensi
2. Pie Chart
3. Dot Plot
4. Histogram
5. Diagram Batang – Daun (stem - leaf)
6. Diagram Kotak – Titik (box plot)
7. dll…
Skala penggambaran harus diperhatikan dalam penyajian data
dalam bentuk grafik.
Penyajian data dalam bentuk grafik dapat dilakukan secara
manual maupun menggunakan software-software statistik seperti
Microsoft Excel, SPSS, SAS, S-Plus, Minitab dan lainnya.
20
Tabel Distribusi Frekuensi
Data banyaknya pelanggan yang datang ke sebuah mini
market di 15 hari tertentu pada bulan Juli 2011.
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
Kelas Interval Titik Tengah Frekuensi (f) Frekuensi
Kelas Kumulatif
21-35 28 1 1
36-50 43 4 5
51-65 58 1 6
66-80 73 2 8
81-95 88 7 15
PRINSIP DASAR
PELUANG
Bagaimana bentuk histogramnya?
21
Pie Chart
9%
10%

23% 58%

 Pie chart merupakan grafik yang berbentuk lingkaran yang


mana setiap potongannya mewakili proporsi atau persentase
suatu komponen dari sebuah kelompok data (100%).
 Pemakaian pie chart hanya cocok ketika menyatakan data
dalam bentuk proporsi dari satu kelompok data.

22
Dot Plot
3.5

2.5
frekuensi

1.5

0.5

0
0 20 40 60 80 100
nilai

Cara menggambarkan data dalam bentuk titik, dengan


memperhatikan frekuensi dari data yang bersangkutan
Titik ditumpuk diatas nilai data yang digambarkan.

23
Histogram

Histogram adalah gambar berdasarkan distribusi frekuensi


Setiap frekuensi dipresentasikan oleh suatu segi empat
(rectangle).
Daerah setiap rectangle sebanding dengan frekuensinya.
24
25

Diagram Batang-Daun
(Stem-Leaf)
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95

Stem atau batang, mirip dengan grup data pada histogram, sedangkan leaf
atau daun, mirip dengan frekuensi.
Stem atau batang adalah digit pertama yang terpenting yang ada dalam
bilangan yang membentuk harga data, sedangkan digit di belakangnya
akan merupakan leaf atau daun.
Melalui stem-Leaf masih dapat dilihat nilai data mentahnya.
Diagram Kotak-Titik
(Box-Plot) 100
90
95 max
85 q3
80
76 q2
70 mean
60
50 47.5 q1
40
30
26 min
20
10
0

Box Plot digunakan untuk menyelidiki distribusi tanpa


menggunakan grup data seperti pada histogram dan
diagram batang daun.
Box Plot terdiri dari: datamin , q1 , q2 (median), q3 , dan
datamax yang disusun secara terurut dengan membentuk
kotak.
26
Pencilan pada Box Plot
* pencilan atas
BAP (pagar atas)

upper whisker maksimum


q3
q2
mean

q1

lower whisker minimum

BBP (pagar bawah)


* pencilan bawah
*

27
Kelemahan dan Keunggulan
KELEMAHAN KEUNGGULAN

Tidak efektif untuk ukuran data Cepat


DOT PLOT
yang besar Nilai data asli dapat diperkirakan

Lama Histogram peluang dapat memberi


gambaran tentang distribusi populasi
HISTOGRAM Banyak perhitungan
Tidak menuntut ketelitian dalam mencatat
Nilai data tidak nampak setiap nilai data
Cepat
Tidak memerlukan perhitungan
Menuntut ketelitian mencatat
BATANG-DAUN Nilai data asli dapat dilihat
daun
Memudahkan perhitungan berbagai
parameter
Membutuhkan perhitungan Box plot dapat memberi gambaran tentang
yang panjang bentuk distribusi populasi
BOX PLOT Terdiri dari parameter- Efektif untuk membandingkan bentuk
parameter dari data yang sudah distribusi beberapa kelompok data
diurutkan sekaligus
28
Bentuk Distribusi Ideal
Normal

mean = median

Memiliki bentuk distribusi yang simetris, yaitu :


Skewness = 0
Kurtosis = 3, (dalam software tertentu kurtosis normal = 0

29
Latihan 1
Suatu jenis polimer digunakan dalam sistem evakuasi pesawat
terbang. Penting diperhatikan bahwa polimer tersebut harus mampu
melawan proses penuaan. Diambil dua puluh sampel polimer yang
kemudian dibagi atas dua percobaan. Percobaan pertama (batch 1)
yang melibatkan 10 sampel dikenakan proses percepatan penuaan
dengan temperatur tinggi selama 10 hari. Sedangkan 10 sampel
lainnya (batch 2) tidak dikenakan proses apa-apa. Kekuatan daya
rentang (dalam psi) sampel-sampel tersebut diukur dan dicatat
sebagai berikut.

Batch 1 227 222 218 217 225 218 216 229 228 221
Batch 2 219 214 215 211 209 218 203 204 201 205

Q: Apakah percobaan proses penuaan memberikan


dampak pada kekuatan daya rentang polimer?

Sumber: Walpole (2006), hal.13 30


Contoh 2
Apa yang dapat kita lakukan untuk menjawab pertanyaan
tersebut???

- Keluarkan sari numerik yang mungkin


Ukuran pemusatan data : MEAN, MEDIAN, KUARTIL BAWAH-ATAS
Ukuran penyebaran data : RANGE, JANGKAUAN KUARTIL,
VARIANSI,SIMPANGAN BAKU
Lain-lain : SKEWNESS dan KURTOSIS Apakah diperlukan???

- Plot data
Pilih plot yang informatif untuk menjawab pertanyaan tersebut
Misal: BOXPLOT

31
Batch.1 Batch.II
Mean 222,10 209,90
Variansi 23,6556 42,1000
SARI NUMERIK Simp.Baku 4,86 6,49
Min. 216 201
Max. 229 219
Q1 218 204,25
Median 221,5 210
Q3 226,5 214,75

230 230
229
226.5
225 225
221.5
220 220
219
218
215 216 215 214.75

210 210 210

205 205 204.25

200 200 201


Batch 1
195 195 Batch 2

APA YANG DAPAT DISIMPULKAN?? KESIMPULAN DESKRIPTIF


@ UM 32
TUGAS 1
Berikut adalah data produksi panas bumi di 25 titik pengeboran (ton/jam):

77.71 44.24 60.00 89.54 85.64


60.00 24.00 54.12 64.52 27.14
87.46 42.13 43.04 45.75 111.27
27.79 41.49 47.70 83.00 14.32
70.00 32.35 41.60 77.96 14.37
Q:
1. Keluarkan sari numerik data di atas.
2. Hitung variansi dengan 2 cara, bandingkan.
3. Buat box plot.
4. Ceritakan hasil olahan data Anda.

33
Transformasi Data (pengayaan)
Transformasi dilakukan untuk mendapatkan bentuk distribusi yang lebih
simetris.
Transformasi Tangga Tukey

-1/x2 -1/x √x log (x) x x2 x3 10x

untuk bentuk distribusi : data awal untuk bentuk distribusi :


skewness positif skewness negatif
Merenggangkan data-data yang berharga kecil Merapatkan data-data yang berharga kecil dan
dan merapatkan data-data yang berharga besar merenggangkan data-data yang berharga besar

Data contoh kasus : skewness = -0,5 (menceng kiri),


maka transformasi yang mungkin adalah x2, x3, dan 10x.
34
Transformasi Data (pengayaan)
Contoh Kasus
x y = x2
Lebih mendekati simetris (skew = 0)
87 7569 dibanding sebelum transformasi
37 1369 (skew = -0,5)
59 3481
49 2401
69 4761
95 9025
83 6889
87 7569
skew = -0,18
39 1521
95 9025
83 6889
76 5776
83 6889
26 676 ** Ketika data ditransformasi, maka satuan
46 2116 dari data juga akan berubah
transformasi 35
TUGAS A
Tujuan umum : Mencari, mengumpulkan, mengolah,
menganalisis dan menarik kesimpulan atas data Anda sendiri.

• Tujuan khusus : menerapkan Statistika Deskriptif terhadap


data sendiri.
• Tipe Tugas : diskusi dalam kelompok, 1 kelompok  3 orang.
Sumber data: buku teks, TA, data praktikum, koran, majalah,
internet, dll (sebaiknya disesuaikan dengan permasalahan yang
mungkin dihadapi di prodi masing-masing).
Ceritakan tentang data tersebut (histori data).

Tugas A diketik (Mic.Word atau Mic.Excel) dengan nama file: “Statdas.I.12-


13.A.Kelompok <nomor kelompok>” dikirim ke utriweni@math.itb.ac.id
Paling lambat Senin, 10 September 2012
36
Contoh Tugas A
by Aulia R.M. Fikri (10107096)
Statistika Deskriptif Data Temperatur O-ring pada Kecelakaan Pesawat
Ulang-alik Challenger
Suatu O-ring merupakan suatu gasket mekanik yang berbentuk torus, terbuat dari
elastomer yang melingkar, didesain untuk ditempatkan di suatu lekukan dan
dikompres di antara dua bagian selama perakitan sehingga terbentuk segel atau
perekat pada permukaan (interface) kedua bagian tersebut.
Salah satu hal yang patut diperhatikan pada penggunaan O-ring adalah kaitannnya
dengan temperaturnya.
...
Berikut adalah data observasi temperature dari O-ring dalam derajat Fahrenheit ,
untuk setiap uji peluncuran mesin roket pesawat ulang alik Challenger tersebut
(Sumber: Presedential Commision on the Space Shuttle Challenger Accident, Vol.
1, 1986: 129-131).
84 45 68 57 53 76
49 66 60 63 67 79
61 70 67 70 75 75
40 69 72 78 61 76
83 80 73 52 70 58
67 58 70 67 81 31
Contoh ini lebih lengkap dapat dilihat di:
http://personal.fmipa.itb.ac.id/utriweni/files/2012/08/Statdas.I.12-13.A.CONTOH.pdf
37
Referensi
 Djauhari, M.A., 2001, Catatan Kuliah Analisis Data.
 Walpole, Ronald E., et.al, Statistitic for Scientist and
Engineering, 8th Ed., 2007.

38

Anda mungkin juga menyukai