Anda di halaman 1dari 16

Modul 1

Analisis Data

Orientasi
Statistika: suatu ilmu dan seni mengumpulkan dan
menyajikan dan menginterpretasikan data untuk
menguji teori dan membuat simpulan tentang seluruh
fenomena.
Ilmuan dan perekayasa menggunakan statistika untuk
meringkaskan dan menginterpretasikan data sehingga
dapat menarik simpulan. Kemasan perangkat lunak
(software) statistika seperti MINITAB, SPSS, dan SAS
dapat menghasilkan grafik dan diagram yang sangat
berguna menggambarkan dan membuat interpretasi
tentang data statistik. Hasil perhitungan atau grafik
yang dihasilkan sebagai hasil olahan harus dimengerti
dan dipahami oleh pemakai.
Peranan dan Jangkauan Statistika
Statistika digunakan para ilmuan dan perekayasa
untuk membuat simpulan dari suatu teori melalui
suatu eksperimen, pengamatan dan pencatatan nilai
satu atau lebih variabel yang menjadi pokok
perhatiannya.
Contoh 1:
Einstein (1905) membuat percobaan untuk membuktikan teori relativitas yang menyatakan bahwa
kecepatan cahaya mempunyai nilai konstan, posisi
bebas.
Miller (1924) membuat percobaan untuk menentukan
kecepatan cahaya dan memperoleh hasil yang
berbeda.
1

Contoh 2:
Ahli pemuliaan tanaman Mandel membuat percobaan
pada kacang dan membuat simpulan melalui sebaran
frekuensi bahwa turunan kedua mempunyai sifat yang
terdiri dari 4 kelompok dengan perbandingan 9 :3 :3 :1
Bulat

Bulat
hijau
3

Bulat
kuning
9

Mengkerut

Mengkerut
hijau
1

Mengkerut
kuning
3

Hijau

Kuning

Data Populasi
Populasi adalah himpunan yang biasa dilambangkan
dengan S dan mempunyai anggota yang berbeda
yang dilambangkan dengan s.
Sampel adalah subhimpunan dari S dengan lambang
A misalnya, A S
A s1, s2 ,..., sn

variabel populasi =X(s) dimana X adalah fungsi dari


sampel s1, s2,..., sn sebagai domain (daerah asal).

Contoh data sampel seperti pada Tabel 1 dan Tabel 2


berikut.
Tabel 1. Data radiasi yang dikeluarkan oleh kompor Mikrowave
0.15
0.05
0.10
0.05
0.08
0.20

0.09
0.08
0.10
0.03
0.18
0.20

0.18
0.10
0.01
0.05
0.10
0.30

0.10
0.07
0.10
0.15
0.20
0.30

0.05
0.02
0.01
0.10
0.11
0.40

0.12
0.01
0.40
0.15
0.30
0.30

0.08
0.10
0.10
0.09
0.02
0.05

Tabel 2. Lama hidup dua jenis Boltlamp A dan B


A
1293
1380
1614
1497
1340

B
1061
1065
1092
1017
1021

A
1643
1466
1627
1383
1711

B
1138
1143
1094
1270
1028

Data yang nilai variabelnya merupakan nilai yang


bukan bilangan disebut data kategorik misalnya
tingkat pendidikan, jenis kelamin, dsb.
Sebaran Frekuensi
Sebaran frekuensi adalah bentuk ringkasan data
untuk keperluan penyajian data dalam tabel. Bentuk
penyajian lain adalah gambar dan diagram seperti:
Diagram balok (bar charts)
Diagram titik (dot plots)
Diagram dahan-daun (stem-and leaf display)
Histogram
Diagram kotak-garis (box plots)

Untuk membuat gambar ini gunakan saja aplikasi


program statistika (MINITAB, SPSS, SAS, dan lainlain)
Pengorganisasian atau meringkas data:
Urutkan nilai pengamatan: x1, x 2 ,..., xn
x(1) x(2) ... x(n) misalnya Tabel 3 berikut:

menjadi

Tabel 3. Data dari Tabel 1 diurutkan


0.01
0.05
0.08
0.10
0.15
0.20

0.01
0.05
0.09
0.10
0.15
0.30

0.02
0.05
0.09
0.10
0.15
0.30

0.02
0.05
0.10
0.10
0.18
0.30

0.02
0.07
0.10
0.10
0.18
0.30

0.03
0.08
0.10
0.11
0.20
0.40

0.05
0.08
0.10
0.12
0.20
0.40

X(1) min x1, x 2 ,..., x n


X(n ) maks x1, x 2 ,..., x n
f ( x ) sebaran frekuensi
F( x ) sebaran frekuansi kumulatif

Fn (x) fungsi sebaran empiris

Perhatikan Tabel 3
x 0.01 f(0,01) 2, F(0,01) 2 f(0,01)
x 0.02 f(0,02) 3, F(0,02) 5 f(0,01) f(0,02)
x 0.03 f(0,03) 1, F(0,03) 6 f(0,01) f(0,02) f(0,03)

Cum.
Freq.

Freq.

Cum.
Pct.
4.76
11.90
14.29
26.19
28.57

0.01
0.02
0.03
0.05
0.07

2
3
1
5
1

2
5
6
11
12

Pct.
4.76
7.14
2.38
11.90
2.38

0.08
0.09
0.10
0.11

3
2
9
1

15
17
26
27

7.14
4.76
21.43
2.38

35.71
40.48
61.90
64.29

0.12
0.15
0.18
0.20
0.30
0.40

1
3
2
3
4
2

28
31
33
36
40
42

2.38
7.14
4.76
7.14
9.52
4.76

66.67
73.81
78.57
85.71
95.24
100.00

4
Frequency

10

Gambar 1. Tabel 3 disajikan dalam bentuk grafik


(histogram) tabel frekuensi

Fn (x) fungsi sebaran empiris


Himpunan data x1, x 2 ,..., x n

Fn (x)

# x i : x i x
artinya
n

Fn (x) proporsi banyaknya nilai yang sama atau lebih kecil dari x

100 Fn (x) persentase nilai yang kurang atau sama dengan x

f (x)

f (x)
sebaran frekuensi empiris
n

Perhatikan tabel 3

Fn (0.25) 36 0,857 f (0,01) f (0,02) ... f (0,18) f (0,20)


42
0,0476 0,0714 ... 0,0476 0,0714 0,856

Fn (x) 1
f ( y)
n yx

Diagram Dahan dan Daun


Salah satu cara cepat untuk menggambarkan
(menvisualisasikan) sebaran data adalah dengan
diagram dahan dan daun. Anggaplah setiap nilai data
Xi terdiri dari dua angka dimana sebagai dahan dan
angka berikutnya sebagai daun. Sebagai contoh data
pada Tabel 3, angka sebelum koma diabaikan dan
hanya sdigunakan angka dibelakang koma, jadi

Nilai Data
0.15
0.09
0.10

Dipisah Dahan Daun


1|5
1
5
0|9
0
9
1|0
1
0

Secara
hasilnya sebagai berikut:
Dahan
0
1
2
3
4

lengkap

Daun
11222355555788899
0000000001255588
000
000
000

Diagram Titik dan Diagram Pencar


Diagram titik menggambarkan nilai data sepanjang
sumbu horizontal (datar) sedangkan pada sumbu
6

tegak adalah frekuensi kemunculan nilai itu. Sebagai


contoh diagram titik data dari Tabel 3.

0,00

0,08

0,16

0,24

0,32

0,40

Gambar 2. Diagram Titik, Data Tabel 3

Diagram Pencar (Scarter Diagram)


Diagram pencar berguna untuk mempelajari
hubungan antara dua variabel X dan Y. Titik (Xi,Yi)
digambarkan dengan sumbu mendatar X dan sumbu
tegak Y.
Gambarkan Diagram
pengamatan (X,Y)
No.
1
2
3
4
5
6
7
8
9
10
11
12

X
85
74
64
87
87
83
81
74
72
64
72
87

Y
34
34
25
43
40
37
33
37
21
31
29
38

No.
13
14
15
16
17
18
19
20
21
22
23
24

Pencar

dari

X
72
78
77
73
71
60
79
63
80
66
65
69

No.
25
26
27
28
28
30
31
32
33
34
35
36

Y
19
27
35
29
25
20
36
32
42
28
38
15

36
X
63
70
51
80
75
96
94
82
82
74
90
64

pasang
Y
24
14
40
45
29
38
25
34
39
35
35
32

Histogram
Histogram merupakan bentuk khusus dari diagram
batang yang digunakan untuk memvisualisasikan

sebaran data. Gambar histogram berikut adalah


histogram data Tabel 3 dengan nilai kelas :
0,03 0,09 0,15 0,21 0,27 0,33 0,39
dengan interval (selang) kelas [0,00;0,06], [0,06;0,12],
[0,12;0,18],...[0,36;0,42]
Tanda selang [a;b]= x a x b
16
14
12
10
8
6
4
2
0

0.03 0.09 0.15 0.21 0.27 0.33 0.39


Gambar 3. Histogram dari data Tabel 3

Untuk menggambarkan histogram secara manual


harus dibuat tabel frekuensi terlebih dahulu dengan
banyak kelas = k, dengan pedoman 2k 1 n 2k atau
k=1+3,3log n
8

Tugas 1
Soal-soal buku 2 (Rosenkranz) 1.1; 1.3; 1.5; 1.7; 1.13
(tugas) dan soal-soal 1.2; 1.4; 1.6; 1.8; 1.10; 1.12;
1.14 (latihan)
Kuantil Suatu Sebaran
Kuantil p sebaran dengan 0<p<1 mempunyai
hubungan dengan persentil 100p sebaran itu. Kuantil
berguna untuk membandingkan dua sebaran melalui
plot kuantil-kuantil atau Q-Q plots (plot peluang).
Seperti diketahui bahwa persentil 50 = median.
Median merupakan ukuran sebaran yang terletak
pada pusat sebaran.
x 1 ( X n X n ), jika n genap
( 1)
2 (2)
2
xX

, jika n ganjil

( n 1)
2

~
x

median

urutan ke

n
2

urutan ke

n
1
2

n
( )
2

n
( 1)
2

banyaknya data

Contoh:

Ada data dengan n=10 maka median X 2 ( X X ) .


Jadi median adalah setengah dari jumlah nilai data
urutan ke 5 dan data urutan ke 6.
( 5)

(6)

Kuantil Fungsi Sebaran Empiris = Q(p)


Sifat-sifat Q(p):
Sekurang-kurangnya 100p persen dari nilai data
lebih kecil atau sama dengan Q(p) dan
Sekurang-kurangnya 100(1-p) persen dari nilai data
lebih besar atau sama dengan Q(p)

Fn (x)

Contoh:
Carilah median data radiasi Tabel 3 dari data fungsi
sebaran empirisnya.
Jawab:
Fungsi sebaran empiris data tersebut digambarkan
sebagai berikut:
1,0
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,0

0,00 0,10 0,20 0,30 0,40


0,05 0,15 0,25 0,35 0,45

Perhatikan gambar diatas: koordinat (Q(0,5);0,5)=


(0,10;0,5) sehingga mediam= ~x = 0,10
10

Q1 = kuartil bawah
Q3 = kuartil atas
Q1 = Q(0,25) dan Q3 = Q(0,75)
Rumus menghitung Q(p) :
hitung np
1
1. jika np bulat Q(p) = 2 [ X(np ) X( np 1) ]
2. jika np tidak bulat dan r<np<r+1 maka Q(p)=X(r+1)
dimana r dan r+1 ada dua urutan bulat
Contoh penggunaan rumus Q(p):
Diketahui n=10 dan hitung Q(0,1)
Jawab:
n=10, p=0,1, maka np=10(0,1)=1 (bulat)
Q(0,1) 1 ( X(np ) X(np 1) ) 1 ( X(1) X( 2 ) )
2
2

x(1) = nilai urutan pertama


x(2) = nilai urutan kedua
Contoh lain:
Diketahui n=39 dan p=0,25. Hitung Q(0,25)
Jawab:
np = 39(0,25) = 9,97 (tidak bulat)
r = 9 dan r+1 = 10 atau 9 < np = 9,97 < 10 maka
Q(0,25) = X(r+1) = X(10) nilai data urutan ke 10.
Cobalah sendiri menentukan Q3 = Q(0,75)
Statistik Urutan dan Kuantil
i 0,5
X(i) Q

; X(i) = nilai data urutan ke i


11

Range Sampel dan Range Antar Kuartil


Range Sampel = X(n) - X(i)
Range Antar Kuartil = IQR = Q3 - Q1
Range 50% Tengahan = [Q3 - Q1]
Pagar dalam bawah = Q1 1,5 IQR
Pagar dalam atas = Q3 + 1,5 IQR
Data Pencilan atas > Q3 + 1,5 IQR atau
Data Pencilan bawah < Q1 - 1,5 IQR
Data Pencilan adalah nilai data disebelah luar pagar
dalam
Contoh:
Tentukan Q1, Q3, IQR, pagar dalam bawah, pagar
dalam atas dan pencilan nilai ujian dari 36 mahasiswa
berikut
25
60
65
72
74
75

Dahan
2
3
4
5
6
7
8
9

30
73
80
85
76
85

58
64
71
79
82
61

69
76
78
73
81
86

Daun
5
0
5
8
03457899
1223334566889
001235566
89

80
63
67
69
83
99

98
68
78
72
86
45

Jawab:

12

Q1 Q(0,25) 1 ( X( 9 ) X(10 ) ) 1 (66 67) 66,5


2
2
Q3 Q(0,75 ) 1 ( X( 27 ) X( 28 ) ) 1 (80 81) 80,5
2
2

IQR = Q3 Q1 = 80,5 66,5 = 14


Pagar dalam bawah= Q11,5 IQR = 66,51,5(14) = 45,5
Pagar dalam atas= Q3+1,5 IQR = 80,5+1,5(14) = 101,5
Data pencilan adalah 25, 30 dan 45

Diagram Kotak Garis (Box Plot)


cambang (whisker)

cambang (whisker)
data pencilan

Q1
0,000 0,080

Q3
0,160

0,240

0,320

0,400

Gambar Diagram Kotak-Garis (Box Plot) data Tabel 3

Keterangan
Q1 = 0,05
, Q3 = 0,18 , ~x =0,10
Whisker sebelah kanan = mulai dari Q3 sampai
dengan min (X(n), Q3 + 1,5IQR = 0,375)=0,375
Q3=0,18

0,375

Whisker sebelah kiri = mulai dari Q1 sampai dengan


maks (X(i), Q1 - 1,5IQR)
0,01

Q1=0,05
13

Diagram kotak-garis: grafik yang menunjukkan


median, kuartil, jangkauan antar kuanrtil (IQR),
jangkauan contoh (sample range). Diagram kotak
garis digunakan untuk menunjukkan data pencilan
(outliens) dan membandingkan dua populasi secara
deskriptif.
Ukuran Pemusatan dan Variabilitas (Simpangan)
Ukuran Pemusatan
x = rata-rata hitung contoh (sample)
x1, x2, ..., xn = nilai pengamatan contoh
n

x x 2 ... x n
Rumus : x 1

Xi
i 1

Median dan Modus juga termasuk ukuran pemusatan


Ukuran Variabilitas/Simpangan
S2 = ragam (variant) contoh
S = simpangan baku contoh
1 n
(Xi - x ) 2 dan

n 1 i 1
Rumus pintasannya
Rumus : S2

1
S

n 1

Xi -

i 1

Xi

S2

atau

n Xi 2
i 1

i 1

Xi

i 1
n(n 1)

Data dengan frekuensi


xj x1 x2 ... xk
fj f1 f2 ... fk
14

f1x1 f 2 x 2 ..... f k x k

f1 f 2 ..... f k

fj

f
j 1

xj

1
n

f
j 1

xj

j 1

dengan
Ragam

n f1 f 2 ..... f k
S2

1 k
(x j x ) 2 f j atau
n - 1 j 1

S
n -1
2

xj

Rata - rata dan Ragam Populasi


Rata - rata populasi
j 1

fj x j

j 1

Ragam populasi
Nilai - nilai populasi
x1 , x 2 , ..... , x N

Rumus :

x 1 x 2 ..... x N 1 N
xi
N
N i 1

1 N
x i
N i 1

N x i x i
2

i 1

i 1

Transformasi linear data


Y = {y1, y2, .. , yn}
Y = Data hasil transformasi
Yi = g(xi) , I = 1, 2, .. , n
Misal :
Y = g(x) = ax + b
y ax b

y rata - rata y
x rata - rata x

15

Sy2 = a2 Sx2
Sy = IaI Sx
Contoh soal :
x1 = 2 , x2 = 5 , x3 = 6 , x4 = 3 , x5 = 4
Y = 2x + 10 , maka x 4 , Sx2 = 2,5
Y1 = 14 , Y2 = 20 , Y3 = 22 , Y4 = 16 , Y5 = 18
SY2 = 4 Sx2 = 4(2,5) = 10
Y 2x 10 2(4) 10 18

16

Anda mungkin juga menyukai