Anda di halaman 1dari 39

Pengantar & Statistika Deskriptif

MA 2081 Statistika Dasar


26 Januari
J i 2012
Utriweni Mukhaiyar
Ilustrasi
 Berikut adalah data rata-rata curah hujan bulanan yang
diamati dari Stasiun Padaherang pada tahun 2001 – 2004.
Sumber : Modul 3 Praktikum Mekanika Medium Kontinu “ Medan Gravitasi”
Tahun
a u Ja
Jan Feb
eb Mar
a Apr
p Meie Ju
Jun Jul Agust
Ju gust Sep O Oktt Nopop Des es
2001 278.59 279.78 355.29 241.34 115.9 176.9 55.32 29.08 43.82 313.68 508.49 267.82
2002 299.78 245.88 266.64 185.27 122.22 133.1 76.78 32.4 26.09 169.05 461.62 415.73
2003 425.21 370.8 300.23 157.43 184.96 69.93 23.28 14.39 17.86 275.23 433.23 456.02
2004 547.8 308.2 388 93 297 128 47 5 87 105 389 371.6

 Informasi apa yang ingin diperoleh dari data ini ?


1. Rata-rata curah hujan setiap tahun. STATISTIKA
2. Penyebaran tingkat curah hujan setiap bulan pada tahun tertentu. DESKRIPTIF
3. Bulan tertentu yang memiliki tingkat curah hujan yang khusus.
4. Signifikansi perbedaan tingkat curah hujan antara tahun-tahun yang diamati.
2 INFERENSI STATISTIKA
St ti tik dan
Statistik d Statistika
St ti tik

Statistik : nilai-nilai ukuran data yang mudah dimengerti.


Contoh :
o statistik (mis. rata
rata-rata)
rata) nilai elevasi pasang surut air laut di
selat Makassar (m),
o statistik (mis. variansi) hasil pengukuran tinggi gelombang
(cm) menggunakan AWLR (Automatic Water Level Recorder)
o Statisitik
S i i ik ((mis.
i range)) nilai
il i tinggi
i i pasang maksimum
k i d
dan surut
minimum (m)

Statistika : ilmu
il yang berkaitan
b k it dengan
d cara pengumpulan,
l
pengolahan, analisis dan pernarikan kesimpulan atas data.

3
Jenis jenis Statistika
Jenis-jenis
1. Statistika
i ik deskriptif:
d k i if metode
d yang berkaitan
b k
dengan pengumpulan dan penyajian data.

2. Statistika inferensi: metode yang berkaitan


dengan analisis sampel untuk penarikan
kesimpulan tentang karakteristik populasi.

4
Populasi
p dan Sampel
p
Populasi

Sampel

setiap
p obyek
y p populasi
p memiliki
m m
kemungkinan/kesempatan yang Sampel Acak
sama untuk terpilih

hasil pengukuran atau pengamatan Data

5
Contoh Populasi dan Sampel
 Akan dilakukan p
pengamatan
g tentangg rata-rata curah hujan
j
di Jawa Barat.

Populasi
Kendala: - sangat banyak, -menghabiskan
Seluruh titik waktu, -menghabiskan biaya
di wilayah
Jawa Barat Keterwakilan sampel atas K id h Pengambilan
Kaidah P n mbil n
? populasi ?? Sampel (Teknik
Sampling)

Sampel
Contoh: setiap Kabupaten/Kotamadya di Jawa Barat
diambil beberapa titik pengamatan

6
Jenis-jenis
Jenis jenis Observasi
OBSERVASI / DATA

KUALITATIF KUANTITATIF

Nominal Ordinal/Rank Diskrit Kontinu

Berhubungan dengan Didasarkan pada


Tidak mengenal urutan Mengenal urutan dan ‘proses menghitung’, dan suatu selang/interval
dan operasi aritmatika operasi aritmatika pengamatan atas sehingga meliputi
himpunan terhitung. semua bilangan riil

Jenjang pendidikan (SD, Banyaknya gempa yang Intensitas gempa yang


Jenis bencana yang
SMP, SMA,...), tingkatan terjadi di suatu daerah terjadi setiap hari di
j di suatu daerah
terjadi
daerah
d h (Kelurahan,
(K l h dalam 1 hari,
hari banyaknya suatut wilayah,
il h tingkat
ti k t
(banjir, longsor, gempa, hari hujan dalam satu
Kecamatan Kab./Kota, curah hujan harian di
dll), jenis batuan, dll bulan di suatu daerah, dll
7 Provinsi, Negara), dll suatu daerah, dll
© 2012 by UM
St ti tik D
Statistika Deskriptif
k i tif

Metode Tujuan :
Informasi berupa
pengolahan dan memberikan
: bentuk
penyajian suatu informasi yang
distribusi data
gugus data berguna.

8
Karakteristik Distribusi
mean, median, modus,
1. PARAMETER kuartil atas, kuartil
Ukuran Pemusatan
DISTRIBUSI bawah dll
bawah,
Range, simpangan baku,
Ukuran Penyebaran variansi, jangkauan antar
kuartil, dll
Kemencengan skewness

Kelancipan kurtosis

2. BENTUK DISTRIBUSI Simetris mean = median

Menceng/skew
mean > median
Positif
Berpuncak Berpuncak Menceng/skew
mean < median
JJamak gg
Tunggal g
Negatif

9 # modus > 1 # modus = 1


CONTOH KASUS
Data rata-rata curah hujan bulanan yang diamati dari Stasiun
Padaherang pada tahun 2001 (n = 12)
278.59 279.78 355.29 241.34 115.9 176.9 55.32 29.08 43.82 313.68 508.49 267.82

x1 x2 x7 x10 x12
Data yang diurutkan:
29.08 43.82 55.32 115.9 176.9 241.34 267.82 278.59 279.78 313.68 355.29 508.49

x(1) x(2) X(7) x(10) x(12)


minimum maksimum
10 Adakah perbedaan dari penyajian kedua data di atas?
Uk
Ukuran P
Pemusatan
t & Penyebaran
P b D t
Data
 Ukuran pemusatan data
statistik yang memberikan informasi dimana data terkumpul
dengan ukuran/jumlah tertentu.
C
Contoh h : Mean
M (rataan),
( ) kuartil
k l bbawah,
h kkuartill tengahh
(median), kuartil atas, modus, persentil, ...
 Ukuran penyebaran data
statistik yang memberikan informasi bagaimana data
menyebar
y di sekitar pusat
p data.
Contoh : range (jangkauan data), IQR (jangkauan antar
kuartil), variansi, standar deviasi (simpangan baku), ...

11
Uk
Ukuran P
Pemusatan
t Data
D t
1. Mean (rata-rata)
( )

1 n
x   xi
n i 1
Contoh :
x1  x2  ...  x12
x
12
278.59  279.78  ...  267.82
  222.17
12

12
50 %
29.08 43.82 data115.9
55.32 (awal
(awal)) 241.34 267.82278.59
176.9 50%279.78
data313.68355.29
((akhir
akhir)) 508.49

X(6.5)
2. Median
Nil i tengah
Nilai t h yang membagi
b i dua
d kelompok
k l k data
d t
sama banyak.

med = x(6.5) = x(6) + 0.5 (x(7) - x(6) )= 254.58


3 M
3. Modus
d
Nilai yang paling sering muncul.
modus tidak ada
13
4. Kuartil
29.08 25 % 55.32 115.9 25
43.82 %241.34 267.82278.59
176.9 25 %279.78 313.68355.29
25 %508.49

q1
q2 = med d q3
Kuartil bawah (q1) : q1  x  n 1 
 
 4 
q1  x 121   x
   
3
1
1
4

 x3  x 4   x 3  70.47 
 4   4

Kuartil tengah (q2) : q2  x 2( n 1)   x n 1 


   
 4   2 
q2  x 121   x(6.5)
(6 5)  254.58
 
 2 
Kuartil atas (q3) : q3  x 3( n 1) 
 
14  4 
q3  x 3(12 1)   x
 
3
9 
 x9  
3
4
x10   x9   305.21
 4   4
5. Persentil

29.08 43.82 55.32 115.9 176.9 241.34 267.82278.59 279.78 313.68355.29 508.49

p25 p50 = med p75


• Persentil ke-i :  x i ( n 1) 
 
 100 

• Persentil ke-50 :  x 50( n 1)   x n 1 


   
 100   2 
median

• Persentil ke-25 dan Persentil ke-75?

15 kuartil bawah kuartil atas


Ukuran Penyebaran Data
Data : x1, x2, x3, ..., xn
Rataan : x
Ukuran penyebaran data yang
melihat bagaimana SETIAP
(keseluruhan) observasi terpisah
dari pusat data.
data
n
Tidak memberikan informasi apa-
p  (x  x )
i
apa, karena : i1
n n

 ( x  x )   x  nx  nx  nx  0
i i
Jumlah Kuadrat (JK)
n

 i
i 1 i 1
( x  x ) 2
16
i 1
Ukuran Penyebaran Data
1. Jangkauan data (Range)
R = datamax – datamin R = 508.49 – 29.08 = 479.41

2. Variansi 2
 n 
? 1 
   xi  
 i 1  
n n
1
s 
2

n  1 i 1
( xi  x ) 
2

n  1 
 xi
2

n  s2  20663.8
i 1 
 

JKXX
3 Si
3. Simpangan Baku B k ((standard
d d ddeviation)
i i )
s = √s2 s  20663.8  143.75
4. Jangkauan
k antar k
kuartill
17
dq = q3 – q1 dq = q3 – q1 = 234.74
Data Pencilan
Data yang nilainya berbeda jauh dari kelompok
data yang lain.
Bagaimana mendeteksi data pencilan ??
1. Hitung dq dq = 234.74
2 Hitung BBP = q1 – k.dq
2. k dq BBP = 70.47–(1.5)(234.74
( )( ) = -281.65

Pilih nilai k = 3/2 (optional)


3 Hitung BAP = q3 + k.dq
3. k dq BAP = 305.21
305 21 + (1,5)(234.74)
(1 5)(234 74) = 657.32
657 32

4. Pencilan bawah < BBP tidak ada pencilan bawah


5. Pencilan atas > BAP tidak ada pencilan atas
18
SARI NUMERIK
Count (banyak data, n) 12
Sum (jumlah data) 2666.01
Average (rata-rata) 222.17
Median (kuartil tengah) 254.58 mean < median
Mode (modus) -
Minimum 29.08
Maximum 508.49
Range 479.41
Menceng
Standard Deviation 143.75
kiri/negatif ???
Variance 20663.8
Skewness 0.303*
Kurtosis -0.181*
25th Percentile (persentil-25) 70.465
50th Percentile (persentil-50) 254.58
75th Percentile (persentil-75) 305.205
Interquartile Range (dk) 234.74
* Perhitungan dengan Mic. Excel
19
Penyajian Data

1. Tabel Distribusi Frekuensi


2. Pie Chart
3. Dot Plot
4. Histogram
5
5. Diagram Batang – Daun (stem - leaf)
6. Diagram Kotak – Titik (box plot)
7. dll…
Skala penggambaran harus diperhatikan dalam penyajian data
dalam bentuk grafik.
Penyajian data dalam bentuk grafik dapat dilakukan secara
manual maupun menggunakan software-software statistik seperti
20 Microsoft Excel, SPSS, SAS, S-Plus, Minitab dan lainnya.
Tabel Distribusi Frekuensi
 Data banyaknya
y y ppelanggan
gg y yang
g datang
g ke sebuah
mini market
k d di 15 hari
h tertentu pada
d bulan
b l Juli
l 20
2011.
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
Kelas Titik Tengah Frekuensi (f) Frekuensi
Interval Kelas Kumulatif
21 35
21-35 28 1 1
36-50 43 4 5
51-65 58 1 6
66-80 73 2 8
81-95 88 7 15
PRINSIP DASAR
PELUANG
Bagaimana bentuk histogramnya?
21
Pie Chart

9%
10%

23% 58%

 Pie chart merupakan grafik yang berbentuk lingkaran yang


mana setiap
ti potongannya
t mewakili
kili proporsii atau
t persentase
t
suatu komponen dari sebuah kelompok data (100%).
 Pemakaian pie chart hanya
y cocok ketika menyatakan
y data
dalam bentuk proporsi dari satu kelompok data.
22
Dot Plot

3,5

2,5
si
frekuens

1,5

0,5

0
0 20 40 60 80 100
nilai

 Cara menggambarkan data dalam bentuk titik,


titik dengan
memperhatikan frekuensi dari data yang bersangkutan
 Titik ditumpuk
p diatas nilai data yyangg digambarkan.
g
23
Histogram

 Histogram
g adalah g
gambar berdasarkan distribusi
frekuensi
 Setiap frekuensi dipresentasikan oleh suatu segi empat
(rectangle)
(rectangle).
24  Daerah setiap rectangle sebanding dengan frekuensinya.
Diagram Batang-Daun
(St
(Stem-Leaf)
L f)
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95

 Stem atau batang, mirip dengan grup data pada


histogram,
hi t sedangkan
d k leaf
l f atau
t daun,
d mirip
i i dengan
d f k
frekuensi.
i
 Stem atau batang adalah digit pertama yang terpenting yang ada
g y
dalam bilangan yang
g membentuk harga g data, sedangkan
g digit
g di
belakangnya akan merupakan leaf atau daun.
25 Melalui stem-Leaf masih dapat dilihat nilai data mentahnya.
Diagram Kotak
Kotak-Titik
Titik
(Box-Plot)
100
95 max
90
85 q3
80
76 q2
70 mean
60
50 47,5 q1
40
30
26 min
20
10
0

 Box Plot digunakan untuk menyelidiki distribusi tanpa


menggunakank grup d data seperti pada d histogram
h dan
d
diagram batang daun.
 Box Plot terdiri dari: datamin
i , q1 , q2 (median),
(median) q3 , dan
datamax yang disusun secara terurut dengan membentuk
26
kotak.
Pencilan pada Box Plot
* pencilan atas
BAP (pagar atas)

upper whisker maksimum


q3
q2
mean

q1

lower whisker minimum

BBP (pagar bawah)


* pencilan bawah
*

27
Kelemahan dan Keunggulan
KELEMAHAN KEUNGGULAN
Tidak efektif untuk ukuran data C
Cepat
DOT PLOT
yang besar Nilai data asli dapat diperkirakan

Lama Histogram peluang dapat memberi gambaran


tentang distribusi populasi
HISTOGRAM Banyak perhitungan
Tidak menuntut ketelitian dalam mencatat setiap
Nilai data tidak nampak nilai data
Cepat
Tidak memerlukan perhitungan
BATANG-DAUN Menuntut ketelitian mencatat daun
Nilai data asli dapat dilihat
Memudahkan pperhitungan
g berbagai
g pparameter
Membutuhkan perhitungan yang Box plot dapat memberi gambaran tentang
panjang bentuk distribusi populasi
BOX PLOT
Terdiri dari pparameter-parameter
p Efektif untuk membandingkan
g bentuk distribusi
dari data yang sudah diurutkan beberapa kelompok data sekaligus

28
Bentuk Distribusi Ideal
N
Normall

mean = median

Memiliki bentuk distribusi yang simetris, yaitu :


Skewness = 0
K t i = 3,
Kurtosis 3 (d
(dalam
l software
ft tertentu
t t t kurtosis
k t i normall = 0
29
Latihan 1
 Suatu jenis polimer digunakan dalam sistem evakuasi pesawat terbang.
Penting diperhatikan bahwa polimer tersebut harus mampu melawan
proses penuaan. Diambil dua puluh sampel polimer yang kemudian dibagi
atas dua percobaan. Percobaan pertama (batch 1) yang melibatkan 10
sampell dikenakan
d k k proses percepatan penuaan dengand temperatur tinggi
selama 10 hari. Sedangkan 10 sampel lainnya (batch 2) tidak dikenakan
proses apa-apa. Kekuatan daya rentang (dalam psi) sampel-sampel tersebut
diukur dan dicatat sebagai berikut.
berikut

Batch 1 227 222 218 217 225 218 216 229 228 221
Batch 2 219 214 215 211 209 218 203 204 201 205

Q: Apakah percobaan proses penuaan memberikan


dampak pada kekuatan daya rentang polimer?
30
Sumber: Walpole (2006), hal.13
Latihan 1

- Keluarkan
K l k sarii numerik
ik yang mungkin
ki
Ukuran pemusatan data : MEAN, MEDIAN, KUARTIL BAWAH-ATAS
Ukuran penyebaran data : RANGE, JANGKAUAN KUARTIL,
VARIANSI,SIMPANGAN BAKU
Lain-lain : SKEWNESS dan KURTOSIS Apakah diperlukan???

Pilih plot yang informatif untuk menjawab pertanyaan tersebut


Misal: BOXPLOT
31
Batch.1 Batch.II
Mean 222,10 209,90
SARI NUMERIK Variansi 23,6556 42,1000
Simp.Baku 4,86 6,49
Min. 216 201
Max. 229 219
Q1 218 204,25
Median 221,5 210
Q3 226,5 214,75

230 230
229
226.5
225 225
221.5
220 220
219
218
215 216 215 214.75

210 210 210

205 205 204.25

200 200 201


Batch 1
195 195 Batch 2

@ UM
32APA YANG DAPAT DISIMPULKAN??
Latihan 2
 Berikut adalah data rata-rata curah hujan bulanan yang
diamati dari Stasiun Padaherang pada tahun 2002 – 2004.
Sumber : Modul 3 Praktikum Mekanika Medium Kontinu “ Medan Gravitasi”
a u
Tahun Ja
Jan eb
Feb a
Mar p
Apr e
Mei Ju
Jun Ju gust Sep O
Jul Agust Oktt Nopop Des es
2002 299.78 245.88 266.64 185.27 122.22 133.1 76.78 32.4 26.09 169.05 461.62 415.73
2003 425.21 370.8 300.23 157.43 184.96 69.93 23.28 14.39 17.86 275.23 433.23 456.02
2004 547.8 308.2 388 93 297 128 47 5 87 105 389 371.6

Q: Untuk tiap-tiap tahun


1. Keluarkan sari numerik data di atas.
2. Hitung variansi dengan 2 cara, bandingkan.
3. Buat box plot.
4. Ceritakan hasil olahan data Anda.

Dikumpul Senin, 6 Februari 2012


33 Sumber: Walpole (2006), hal.29, NO.1.24
Transformasi Data (pengayaan)

 Transformasi dilakukan untuk mendapatkan bentuk distribusi


yang lebih simetris.
 Transformasi
T f T
Tangga Tk
Tukey

-1/x2 -1/x √x log (x) x x2 x3 10x

untuk bentuk distribusi : data awal untuk bentuk distribusi :


skewness positif skewness negatif
Merenggangkan data‐data yang berharga kecil Merapatkan data‐data yang berharga kecil dan
dan merapatkan data‐data yang berharga besar merenggangkan data‐data yang berharga besar

Data contoh kasus : skewness = -0,5


0 5 (menceng kiri),
kiri)
maka transformasi yang mungkin adalah x2, x3, dan 10x.
34
Transformasi Data (pengayaan)
Contoh Kasus
x y = x2
Lebih mendekati simetris (skew = 0)
87 7569 dibanding sebelum transformasi
37 1369 (skew = -0,5)
59 3481
49 2401
69 4761
95 9025
83 6889
87 7569
skew
k = -0,18
0 18
39 1521
95 9025
83 6889
76 5776
83 6889
26
6 6 6
676 ** Ketika data ditransformasi, maka satuan
46 2116 dari data juga akan berubah
35
transformasi
Latihan 3

 Mencari, mengumpulkan, mengolah, menganalisis 
dan menarik kesimpulan atas data Anda sendiri.

Sumber data: buku teks, TA, data praktikum, koran, majalah, 
i
internet, dll (sebaiknya disesuaikan dengan permasalahan yang 
dll ( b ik di ik d l h
mungkin dihadapi di prodi masing‐masing).
Ceritakan tentang data tersebut (histori data).
Tugas A diketik (Mic.Word atau Mic.Excel) dikumpul (online) 
Rabu, 8 Februari 2012

36
Contoh Tugas A
 Berikut adalah nilai UTS 1 dari 55 mahasiswa MA2181 Analisis Data Tahun
2010.
70,5 75,5 68 85,5 84,5 78,5 58,5 82 75,5 84 64,5
53 69,5
, 92,5
, 62 68,5
, 74,5
, 59,5
, 83 79,5
, 89,5
, 79
53 54 84 66 79 78,5 84 80,5 74,5 74,5 64
74,5 73 75 82 73 67,5 70 68 75 70,5 74,5
70,5 62 61,5 81 58,5 43,5 74,5 39 77 87 71

Histori data:
 Nilai UTS 1 ini diambil dari kelas 02 tahun 2010 yang mahasiswanya adalah terdiri dari 54 mahasiswa
angkatan 2009 dan 1 orang mahasiswa angkatan 2008 prodi Matematika ITB
 UTS 1 dilaksanakan pada hari Rabu, 13 Oktober 2010.
 Pelaksanaan ujian adalah paralel dengan kelas 01.
 Soal ujian terdiri dari dua bagian, dimana Bagian I terdiri dari 4 soal Pilihan Ganda dan 2 soal Pilihan
Benar-Salah, dan Bagian
g II terdiri dari 3 soal ESEI. Nilai maksimum adalah 100 (Soal UTS 1 dilampirkan).
 Sumber: Nilai UTS 1 MA 2181 Analisis Data, Kelas: 02, Pengajar: Utriweni Mukhaiyar

37
Lampiran Tugas A

38 @ UM
Referensi
 Djauhari, M.A., 2001, Catatan Kuliah Analisis Data. 
h l h l
 Walpole, Ronald E., et.al, Statistitic for Scientist and 
Engineering, 8th Ed., 2007.
Engineering, 8th Ed., 2007.

39

Anda mungkin juga menyukai