Anda di halaman 1dari 39

PENGANTAR STATISIK

DAN ANALISIS DATA


1.
2.
3.
4.

Statistik dan Statistika


P
Populasi
l i dan
d Sampel
S
l
Jenis-jenis Observasi
STATISTIKA DESKRIPTIF
Sari

Numerik
Penyajian Data

MA 2181 Analisis Data


8 Agustus 2011
Utriweni Mukhaiyar

Ilustrasi
2

Data banyaknya pelanggan yang datang ke


sebuah mini market di 15 hari tertentu pada bulan
Juli
l 2011.
26 337 76 49 95 69
9 833 87 39 95 59 83 833 87 4
46
Q1: Berapa rata-rata
banyak
y p
pelanggan
gg
yang datang di 15
hari tsb?

Q2 : Seberapa
menyebarnya banyak
pelanggan yang datang
dalm 15 hari tsb?

Q4 : Apakah rata-rata pelanggan


yang
ya
g datang
data g di
d mini market
a et tsb
lebih besar dibanding mini
market lainnya

Q3 : Adakah hari
yang perlu
perhatian khusus?

St ti tik dan
Statistik
d
Statistika
St ti tik
3

Statistik : nilai
nilai-nilai
nilai ukuran data yang mudah
dimengerti.
Contoh : statistik IP mahasiswa ITB semester II
2010-2011
Statistika : ilmu yang berkaitan dengan cara
pengumpulan pengolahan,
pengumpulan,
pengolahan analisis dan
pernarikan kesimpulan atas data.

Jenis-jenis
Jenis
jenis Statistika
4

1.

2.

Statistika deskriptif: metode yang


berkaitan dengan pengumpulan dan
penyajian data.
St ti tik inferensi:
Statistika
i f
i metode
t d yang
berkaitan dengan analisis sampel untuk
penarikan
ik kesimpulan
k i
l tentang
karakteristik populasi.

Populasi
p
dan Sampel
p
5

Populasi
Sampel

setiap obyek populasi memiliki


kemungkinan/kesempatan yang
sama untuk terpilih
hasil pengukuran atau pengamatan

Sampel
p Acak
Data

Contoh Populasi dan Sampel


6

Akan dilakukan
Ak
dil k k penelitian
li i apakah
k h tahun
h
pertama di ITB (TPB) memberikan pengaruh
terhadap perubahan berat badan mahasiswa.
mahasiswa
Untuk itu dilakukan pengambilan data pada
hari terakhir ujian TPB.
Populasi
Se u u
Seluruh
mahasiswa
TPB ITB
?

Kendala: - sangat banyak, -menghabiskan


waktu -menghabiskan
waktu,
menghabiskan biaya

Keterwakilan sampel
atas p
populasi
p
??

Kaidah Pengambilan
p ((Teknik
Sampel
Sampling)

Sampel
Contoh: tiap-tiap kelas TPB diambil secara
acak 10 orang mahasiswa.

Jenis-jenis
Jenis
jenis Observasi
7

OBSERVASI / DATA

KUALITATIF

Nominal

Ordinal/Rank

KUANTITATIF

Diskrit

Kontinu

Tidak mengenal
urutan dan operasi
aritmatika

Mengenal urutan
dan operasi
aritmatika

Berhubungan dengan
proses menghitung,
dan pengamatan atas
himpunan
p
terhitung.
g

Didasarkan pada suatu


selang/interval
sehingga meliputi
semua bilangan
g riil

Jnis bidang datar


(persegi,
(persegi lingkaran,
lingkaran
jajaran genjang, dll),
jenis kelamin , dll

Kapasitas hard disk


((80GB, 160GB,
320GB, ...), kelas
penumpang pesawat
(ekonomi, bisnis), dll

Banyaknya
B
k
peserta
OSKM 2011 dari
fakultas
MIPA, banyaknya
yang antri di depan
bioskop,
p dll

Waktu tercepat mobil


p
F1 di setiap
pertandingan, luas
daerah hijau di kota
Bandung,
g dll

2008 by UM

Statistika Deskriptif
8

Metode yang berkaitan


dengan
g p
pengolahan
g
dan p
penyajian
y j
suatu gugus data sehingga
memberikan informasi yang
berguna.
b

bentuk distribusi
data

Karakteristik
Karakter
st k D
Distribusi
str bus
9

1. PARAMETER
1
DISTRIBUSI

2. BENTUK
2
DISTRIBUSI

Ukuran
Pemusatan

mean, median, modus,


kuartil atas,
atas kuartil
bawah, dll

Ukuran
Penyebaran
y

Range, simpangan baku,


variansi,, jjangkauan
g
antar
kuartil, dll

Kemencengan

skewness

Kelancipan

kurtosis

Simetris

Berpuncak
Jamak

Berpuncak
Tunggal
gg

# modus > 1

# modus = 1

Menceng/skew
P itif
Positif
Menceng/skew
Negatif
g

mean = median
mean > median
mean < median

CONTOH KASUS
10

Data banyaknya
b
k
pelanggan
l
yang datang
d
ke
k sebuah
b h mini
market di 15 hari tertentu pada bulan Juli 2011. (n = 15)

26 37 76 49 95 69 83 87 39 95 59 83 83 87 46
x1 x2

x9

x12

x15

Data yang diurutkan:

26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
x(1) x(2)
minimum

x(9)

x(12)

Adakah perbedaan dari penyajian kedua data di atas?

x(15)
maksimum

11

Ukuran Pemusatan &


P
Penyebaran
b
D
Data

Ukuran pemusatan d
Uk
data
statistik yang memberikan informasi dimana data
terkumpul dengan ukuran/jumlah tertentu.
tertentu
Contoh : Mean (rataan), kuartil bawah, kuartil
tengah (median),
(median) kuartil atas,
atas modus,
modus persentil,
persentil ...
Ukuran penyebaran data
statistik yang memberikan informasi bagaimana
data menyebar di sekitar pusat data.
Contoh : range
g (j
(jangkauan
g
data),
), IQR
Q (j
(jangkauan
g
antar kuartil), variansi, standar deviasi
(simpangan baku), ...

Ukuran Pemusatan Data


12

1.

M
Mean
(rata-rata)
(
)
1 n
x xi
n i 1

Contoh :
x1 x2 ... x15
x
15
87 37 ... 46

67, 60
15

13

26 50
37 %
39data
46 49
59 )69 76 8350%
83 data
83 87((akhir
87 95) 95
(awal)
(awal
akhir)
x(8)

3x

2x

2x

2 Median
2.
Nilai tengah yang membagi dua kelompok
data sama banyak.
banyak

med = x(8) = 76
3. Modus
Nilai yang paling sering muncul.
mod
d = 83

4. Kuartil
14

26 25
37 %
39 46 49 25
59%69 76 832583% 83 87 87
25 95
% 95
q1

q3

q2 = med

Kuartil bawah (q1) : q1 x n 1

q1 x 151 x(4) 46

K til ttengah
Kuartil
h ((q2) : q2 x 2( n 1) x n 1

q2 x 151 x(8) 766

Kuartil atas (q3) : q3 x 3( n 1)

q3 x 3(151) x(12) 87

5. Persentil
15

26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
p25
Persentil ke-i :

p75

p50 = med

x i ( n 1)

100

Persentil ke-50 : x 50( n 1) x n 1

100

median

Persentil ke-25 dan Persentil ke-75?


kuartil bawah

kuartil atas

Ukuran Penyebaran Data


16

Data : x1, x2, x3, ..., xn


Rataan : x
Ukuran penyebaran data yang
melihat bagaimana SETIAP
(keseluruhan) observasi terpisah
dari pusat data.
n

Tidak memberikan informasi apaapa karena :


apa,
n

( x x ) x nx nx nx 0
i 1

i 1

(x x )
i 1
i

Jumlah Kuadrat (JK)


n

2
(
x

x
)
i
i 1

Ukuran Penyebaran Data


17

1 Jangkauan data (Range)


1.
R = 95 26 = 69
R = datamax datamin
2. Variansi

1
1
2
s2
(
x

x
)

i
n 1 i 1
n 1

n
xi
n
i 1
2
x

i
n
i 1

s2 529,2571
529 2571

JKXX

3. Simpangan
p g Baku ((standard deviation))
s 529, 2571 23, 01
s = s2
4 Jangkauan antar kuartil
4.
dq = q3 q1
dq = q3 q1 = 87 46 = 41

Data Pencilan
18

Data yang nilainya berbeda jauh dari kelompok


data yang lain.
Bagaimana mendeteksi data pencilan ??
g dqq
1. Hitung

dqq = 41

2. Hitung BBP = q1 k.dq

BBP = 46 (1,5)(41) = -15,5

Pilih nilai
nil i k = 3/2 (tidak
(tid k mutlak)
mutl k)
3. Hitung BAP = q3 + k.dq

BAP = 87 + (1,5)(41) = 148,5

4. Pencilan bawah < BBP

tidak ada pencilan bawah

5. Pencilan atas > BAP

tidak ada pencilan atas

SARI NUMERIK
Count (banyak data, n)
15
19
Sum (jumlah data)
1014
A
Average
((rata-rata)
t
t )
67 6
67.6
Median (kuartil tengah)
76
Mode (modus)
83
Minimum
26
Maximum
95
Range
69
Standard Deviation
23.01
Variance
529.2571
Sk
Skewness
-0.50**
Kurtosis
-1.23*
(persentil-25))
46
25th Percentile (p
50th Percentile (persentil-50)
76
75th Percentile (persentil-75)
87
Interquartile Range (dk)
41
* Perhitungan dengan Mic. Excel

mean < median

Menceng kiri

Penyajian Data
20

6.

Tabel Distribusi Frekuensi


Pi Chart
Pie
Ch t
Dot Plot
Hi
Histogram
Diagram Batang Daun (stem - leaf)
Diagram Kotak Titik (box plot)

7.

dll

1.
2.
3.
4.
5.

Skala penggambaran harus diperhatikan dalam penyajian data


dalam bentuk grafik.
Penyajian data dalam bentuk grafik dapat dilakukan secara
manual maupun menggunakan software-software statistik seperti
Microsoft Excel, SPSS, SAS, S-Plus, Minitab dan lainnya.

Tabel Distribusi Frekuensi


21

Data
D
t banyaknya
b
k
pelanggan
l
yang d
datang
t
k
ke sebuah
b h
mini market di 15 hari tertentu pada bulan Juli 2011.

26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
Kelas
Interval

Titik
Tengah
Kelas

Frekuensi
(f)

Frekuensi
Kumulatif

21-35
21
35

28

36-50

43

51-65

58

66-80

73

81-95

88

15

Bagaimana bentuk histogramnya?

PRINSIP
DASAR
PELUANG

Pie Chart
22

9%
10%

23%

58%

Pie chart merupakan grafik yang berbentuk lingkaran yang

mana setiap potongannya mewakili proporsi atau persentase


suatu komponen dari sebuah kelompok data (100%).
Pemakaian pie chart hanya cocok ketika menyatakan data
d l
dalam
b t k proporsii dari
bentuk
d i satu
t kelompok
k l
k data.
d t

Dot Plot
23

3,5
3

f
frekuensi

2,5
2
1,5
1
0,5
0
0

20

40

60

80

100

nilai

Cara menggambarkan data dalam bentuk


titik dengan
titik,
d
memperhatikan
h tik frekuensi
f k
i dari
d i
data yang bersangkutan
Titik ditumpuk
dit
k diatas
di t nilai
il i data
d t yang
digambarkan.

Histogram
24

Histogram adalah gambar berdasarkan distribusi


frekuensi
Setiap frekuensi dipresentasikan oleh suatu segi empat
(rectangle).
Daerah setiap rectangle sebanding dengan frekuensinya.

Diagram Batang-Daun
(S
(Stem-Leaf)
L f)

25

26 37 39 46 49 59 69 76 83 83 83 87 87 95 95

Stem atau batang, mirip dengan grup data pada


histogram, sedangkan leaf atau daun, mirip dengan frekuensi.
Stem atau batang adalah digit pertama yang terpenting yang ada
dalam bilangan yang membentuk harga data, sedangkan digit di
b l k
belakangnya
akan
k merupakan
k leaf
l f atau
t daun.
d
Melalui stem-Leaf masih dapat dilihat nilai data mentahnya.

26

Diagram Kotak
Kotak-Titik
Titik
((Box-Plot))
100
90

95

max
85

80

76

70

q2

q3
mean

60
50

47,5

40
30
20

26

q1

min

10
0

Box Plot digunakan untuk menyelidiki distribusi tanpa


menggunakan grup data seperti pada histogram dan
diagram batang daun.
Box Plot terdiri dari: datamin , q1 , q2 (median), q3 , dan
datamax yang disusun secara terurut dengan membentuk
kotak.

Pencilan pada Box Plot


27

pencilan atas
BAP (pagar atas)
upper whisker
q3
q2

maksimum
mean

q1
lower whisker
*
*

minimum

BBP (pagar bawah)


pencilan bawah

Kelemahan dan Keunggulan


28

KELEMAHAN
DOT PLOT

HISTOGRAM

KEUNGGULAN

Tidak efektif untuk ukuran


data yang besar

Cepat

Lama

Histogram peluang dapat memberi


gambaran tentang distribusi populasi

Banyak perhitungan
Nilai data tidak nampak

Nilai data asli dapat diperkirakan

Tidak menuntut ketelitian dalam


mencatat
t t setiap
ti nilai
il i data
d t
Cepat

BATANGBATANG
DAUN

Menuntut ketelitian
mencatat daun

Tidak memerlukan perhitungan


Nilai data asli dapat dilihat
Memudahkan perhitungan berbagai
parameter

Membutuhkan perhitungan Box plot dapat memberi gambaran


yang panjang
tentang bentuk distribusi populasi
BOX PLOT

Terdiri
e d da
dari parameterpa a ete
parameter dari data yang
sudah diurutkan

Efektif
e t u
untuk
tu membandingkan
e ba d g a
bentuk distribusi beberapa kelompok
data sekaligus

29

Bentuk Distribusi Ideal


N
Normal
l

mean = median

Memiliki bentuk distribusi y


yang
g simetris,, yaitu
y
:
Skewness = 0
Kurtosis = 3, (dalam software tertentu kurtosis normal = 0

Latihan 1
30

Suatu
S
t jenis
j i polimer
li
di
digunakan
k
d l
dalam
sistem
i t
evakuasi
k
i
pesawat terbang. Penting diperhatikan bahwa polimer
tersebut harus mampu melawan proses penuaan.
Di bil dua
Diambil
d
puluh
l h sampell polimer
li
yang kemudian
k
di
dibagi atas dua percobaan. Percobaan pertama (batch 1)
yang melibatkan 10 sampel dikenakan proses
percepatan penuaan dengan temperatur tinggi selama
10 hari. Sedangkan 10 sampel lainnya (batch 2) tidak
dikenakan proses apa-apa. Kekuatan daya rentang
(dalam psi) sampel-sampel tersebut diukur dan dicatat
sebagai berikut.
Batch 1

227

222

218

217

225

218

216

229

228

221

Batch 2

219

214

215

211

209

218

203

204

201

205

Q Apakah
Q:
p
p
percobaan p
proses p
penuaan memberikan
dampak pada kekuatan daya rentang polimer?
Sumber: Walpole (2006), hal.13

Latihan 1
31

- Keluarkan sari numerik yang mungkin


Ukuran pemusatan data : MEAN,
MEAN MEDIAN,
MEDIAN KUARTIL BAWAH
BAWAHATAS
Ukuran penyebaran data : RANGE, JANGKAUAN KUARTIL,
VARIANSI,SIMPANGAN BAKU
Lain-lain : SKEWNESS dan
KURTOSIS

Apakah diperlukan???

Pilih plot yang informatif untuk menjawab pertanyaan tersebut


Misal:
Mi l BOXPLOT

Batch.1
Mean
222 10
222,10
Variansi 23,6556
Simp.Baku 4,86
Min.
Mi
216
Max.
229
Q1
218
Median
221,5
Q3
226,5

SARI NUMERIK
32

230

226,5
221,5

220
215

230

229

225

216

Batch.II
209 90
209,90
42,1000
6,49
201
219
204,25
210
214,75

218

225
220

219

215

214,75

210

210

210

205

205

204,25

200

200

195

Batch 1

195

APA YANG DAPAT DISIMPULKAN??

201
Batch 2

@ UM

Latihan 2
33

Berikut adalah data historis gaji pegawai (dollar per


siswa pada 30 sampel sekolah di US bagian timur
awal tahun 1970).
1970)
3,79

2,99

2,77

2,91

3,10

1,84

2,52

3,22

2,45

2,14

2 67
2,67

2 52
2,52

2 71
2,71

2 75
2,75

3 57
3,57

3 85
3,85

3 36
3,36

2 05
2,05

2 89
2,89

2 83
2,83

23,13

2,44

2,10

3,71

3,14

3,54

2,37

2,68

3,51

3,37

Q:
1. Keluarkan sari numerik data di atas.
2. Hitung
g variansi dengan
g 2 cara, bandingkan.
g
3. Buat box plot.
4. Ceritakan hasil olahan data Anda.
Dikumpul Senin, 15 Agustus 2011
Sumber: Walpole (2006), hal.29

Transformasi Data (pengayaan)


34

Transformasi dilakukan untuk mendapatkan


bentuk distribusi yang
ang lebih simetris.
simetris
Transformasi Tangga Tukey
-1/x2 -1/x

untuk bentuk distribusi :


skewness positif

log (x)

x2

data awal

Merenggangkan
M
k datadatayangberharga
d
d
b h
k il
kecil
dan merapatkan datadatayangberharga besar

x3

10x

untuk bentuk distribusi :


skewness negatif

Merapatkan
M
k datadatayangberharga
d
d
b h
k il dan
kecil
d
merenggangkan datadatayangberharga besar

Data contoh kasus : skewness = -0,5


, ((menceng
g kiri),
),
maka transformasi yang mungkin adalah x2, x3, dan 10x.

Transformasi Data (pengayaan)


C t h Kasus
Contoh
K
35

y = x2

87
337
59
49
69
95
83
87
39
95
83
76
83
26
46

7569
1369
369
3481
2401
4761
9025
6889
7569
1521
9025
6889
5776
6889
676
2116

transformasi

Lebih mendekati simetris (skew = 0)


dibanding sebelum transformasi
(skew = -0,5)
0,5)

skew = -0,18

** Ketika data ditransformasi,


ditransformasi maka satuan
dari data juga akan berubah

Latihan 3
36

Mencari,mengumpulkan,mengolah,menga
nalisisdanmenarikkesimpulanatasdata
Andasendiri.
Sumberdata:bukuteks,TA,datapraktikum,koran,majalah,
internet,dll(sebaiknyadisesuaikandenganpermasalahanyang
mungkin dihadapi di prodi masing masing)
mungkindihadapidiprodimasingmasing).
Ceritakantentangdatatersebut(historidata).
TugasAdiketik(Mic.WordatauMic.Excel)dikumpul(online)Senin,
Tugas
A diketik (Mic.Word atau Mic.Excel) dikumpul (online) Senin,
22Agustus2011

Contoh Tugas A
37

Berikut adalah nilai UTS 1 dari 55 mahasiswa MA2181


Analisis Data Tahun 2010.
70,5
70
5
53
53
74 5
74,5
70,5

75,5
75
5
69,5
54
73
62

68
92,5
84
75
61,5

85,5
85
5
62
66
82
81

84,5
84
5
68,5
79
73
58,5

78,5
78
5
74,5
78,5
67 5
67,5
43,5

58,5
58
5
59,5
84
70
74,5

82
83
80,5
68
39

75,5
75
5
79,5
74,5
75
77

84
89,5
74,5
70 5
70,5
87

64,5
64
5
79
64
74 5
74,5
71

Histori data:

Nilai UTS 1 ini diambil dari kelas 02 tahun 2010 yang mahasiswanya adalah
terdiri dari 54 mahasiswa angkatan 2009 dan 1 orang mahasiswa angkatan 2008
prodi Matematika ITB

UTS 1 dilaksanakan
dil k
k pada
d hari
h i Rabu,
R b 13
3 Oktober
Ok b 2010.
20 0

Pelaksanaan ujian adalah paralel dengan kelas 01.

Soal ujian terdiri dari dua bagian, dimana Bagian I terdiri dari 4 soal Pilihan
Ganda dan 2 soal Pilihan Benar-Salah,
Benar Salah dan Bagian II terdiri dari 3 soal ESEI.
ESEI
Nilai maksimum adalah 100 (Soal UTS 1 dilampirkan).
Sumber: Nilai UTS 1 MA 2181 Analisis Data, Kelas: 02, Pengajar: Utriweni
Mukhaiyar

Lampiran Tugas A
38

@ UM

Referensi
Djauhari,M.A.,2001,CatatanKuliahAnalisisData.
Walpole,RonaldE.,et.al,Statistitic
Walpole, Ronald E., et.al, Statistitic forScientistand
for Scientist and

Engineering,8thEd.,2007.

39

Anda mungkin juga menyukai