Anda di halaman 1dari 121

KULIAH

PROBABILITAS DAN STATISTIK


Dosen
NAEMAH MUBARAKAH, ST, MT

Departemen Teknik Elektro, Fakultas Teknik


Universitas Sumatera Utara
Medan, Indonesia
Semester Ganjil
TA 2015/2016

Silabus
1.
2.
3.
4.
5.
6.
7.
8.

Pengantar statistik
Distribusi Frekuensi
Ukuran kecenderungan tengah
Ukuran dispersi
Distribusi probabilitas
Teori sampling
Estimasi dan inferensia statistik
Regresi dan korelasi

Referensi

Ronald E Walpole, 1992, Pengantar Statistika,


Gramedia, Jakarta
Murray R Spiegel, 1994, Statistika, Erlangga,
Jakarta
Richard Lungan, 2006, Aplikasi Statistika dan
Hitung Peluang, Graha Ilmu, Yogyakarta
Supranto, JMA, 1986, Pengantar Probabilitas
dan Statistik, Jilid II, Surabaya

Penilaian
Tugas

30%
Quiz 10%
UTS 30%
UAS 30%

1. Pengantar Statistika
Statisitik : merupakan kumpulan fakta,
pada umumnya dinyatakan dalam bentuk
angka dan dapat digambarkan dalam
bentuk tabel/grafik yang menggambarkan
sesuatu masalah.
Statistika : bidang ilmu pengetahuan yang
membahas bagaimana data diperoleh,
data disajikan, data dianalisis, serta
digunakan untuk pengambilan keputusan

1.2 Statistika deskriptif dan inferensi


Statistika deskriptif digunakan apabila
peneliti hanya bertujuan mendapatkan
ringkasan data yang dimilikinya.
Ringkasan ini meliputi lokasi pemusatan
data, variabilitas data, dan karakteristik
umum distribusi data.
Statistika inferensi digunakan apabila
peneliti ingin membuat suatu
kesimpulan tertentu atas
karakteristik/hubungan antar beberapa
variabel dalam populasi, diberikan ia
hanya memiliki data sampel.

1.3 Populasi dan Sampel


Populasi merupakan kumpulan semua
individu dari jenis objek yang menjadi
perhatian penelitian.
Sampel adalah bagian dari populasi yang
datanya dikumpulkanPopulasi
dalam penelitian.

Dikarakterisisir Parameter:
- rata-rata
- standar deviasi
- proporsi (persentase)

Sampel
Dikarakterisir statistik
- Rata-rata x
- Standar Deviasi s
- Proprsi (Persentase) p

1.4 Pengambilan Sampel


Pada statistika inferensi, pengambilan
sampel menentukan hasil inferensi.
Idealnya sampel diambil secara random.
Pengambilan sampel yang tidak tepat
dapat menyebabkan bias systematic
error

1.5 Ukuran Pemusatan


Mean sensitif terhadap nilai ekstrim
Median
Modus

1.6 Ukuran Penyebaran


Variansi
Deviasi Standar
Range
Inter-kuartil Range

1.7 Peran Teori Probabilitas dan Statistika


1.
2.
3.
4.

10

Sebagai alat bantu dalam pengambilan


keputusan
Menjelaskan hubungan antar variabel
Membuat rencana dan peramalan
Mengatasi perubahan-perubahan

2. Distribusi Frekuensi
Pengertian :
Penyajian data untuk mendapatkan gambaran
umum tentang suatu kejadian.
Tujuan :
- Untuk mengetahui kejadian (data) yang sering
muncul
- kejadian (data) yang jarang muncul
Contoh :
Berikut ini diberikan data hasil ujian statistik 50
orang mahasiswa di sebuah perguruan tinggi.

11

2. Distribusi Frekuensi
Tabel 2.1 Hasil ujian statistik 50 mahasiswa di
suatu perguruan tinggi
60

33

85

52

65

77

84

65

57

74

71

81

35

50

35

54

74

47

68

54

80

41

61

91

55

73

59

53

45

77

41

78

55

48

69

85

67

39

76

60

94

66

98

66

73

42

65

94

89

88

Informasi apa yang bisa diambil dari data tabel


2.1 diatas ?
12

2.1 Menyusun distribusi frekuensi

Tabel 2.1 kurang informatif untuk memberikan


gambaran umum tentang prestasi mahasiswa
dalam mata kuliah statistik.
Solusinya :
- hasil ujian perlu dikelompokkan
- disusun dalam bentuk distribusi frekuensi
Pengelompokkan dapat dilakukan dengan cara
tally (tabel 2.2)
Hasil ujian disajikan dalam tabel distribusi
frekuensi (tabel 2.3)

13

2.1 Menyusun distribusi frekuensi


Tabel 2.2 Lembar tally hasil ujian statistik
Kelas
30-39
40-49
50-59
60-69
70-79
80-89
90-99

14

Tally
IIII
IIII
IIII
IIII
IIII
IIII
IIII

I
III
IIII II
IIII
II

Frekuensi
4
6
8
12
9
7
4

2.1 Menyusun distribusi frekuensi


Tabel 2.3 Distribusi frekuensi hasil ujian statistik
Kelas
30-39
40-49
50-59
60-69
70-79
80-89
90-99

15

Frekuen
si
4
6
8
12
9
7
4

2.2 Kelas interval dan batas kelas

Pengelompokkan data pada tabel 2.3 (30-39, 4049, dst) disebut kelas interval
Sedangkan 30, 40, dst disebut batas bawah
kelas
Dan 39, 49, dst. merupakan batas atas kelas
Hal-hal
yang
perlu
diperhatikan
dalam
penyusunan distribusi frekuensi adalah :
1. Kelas interval tidak perlu terlalu banyak, sekitar
7-15 interval (tergantung kebutuhan).
2. kelas interval tidak harus sama
3.
data nilai mahasiswa pada tabel 2.1
merupakan data diskrit
16

2.2 Kelas interval dan batas kelas


4. jika data kontinyus, maka nilainya bersambung
dalam hal ini perbedaan kecil sangat mempengaruhi.
Contoh : 40,00-44,99 ; 45-54,99 dst.
5. dari interval kelas dapat ditentukan titik tengah,
misal untuk interval 30-39, titik tengahnya adalah :

30 39
34.5
2

6. dalam kelas interval 30-39 terdapat 10 titik bukan 9


titik,
karena
dimulai
dari
30,31,32,33,34,35,36,37,38,dan 39.
7. Perbedaan antara batas atas kelas dengan batas
bawah kelas disebut sebagai lebar kelas, misal untuk
interval 30-39, lebar kelasnya adalah 9.
17

2.3 Histogram dan Poligon

Distribusi frekuensi dapat dinyatakan dalam


bentuk histogram dan poligon.
Histogram
berupa balok-balok segi empat yang dasarnya
terletak pada sumbu x (horizontal), dimana
titik tengah merupakan centre dan kelas
interval merupakan lebarnya.
Jika kelas interval sama besar, maka tinggi
balok menggambarkan frekuensi kelas.
Jika kelas interval tidak sama besar maka
tinggi balok harus disesuaikan .

18

2.3 Histogram dan Poligon

Poligon
merupakan grafik yang menghubungkan titik
tengah pada puncak histogram.
tabel 2.4 Distribusi frekuensi berat badan
mahasiswa di suatu Peguruan Tinggi
Berat badan
(kg)
60-62
63-65
66-68
69-71
72-74

19

Frekuensi
(jumlah)
5
18
42
27
8

2.3 Histogram dan Poligon


45
40
35
30
25

frekuensi

20

Frekuensi (jumlah)
frekuensi relatif (%)

15
10
5
0
60-62

63-65

66-68

69-71

72-74

kelas

Gambar 2.1. Histogram dan poligon berat badan mahasiswa

20

2.3 Histogram dan Poligon

Distribusi komulatif
Terdiri dari dua bagian yaitu distribusi komulatif
lebih kecil dan distribusi komulatif lebih besar.
Distribusi komulatif lebih kecil :
merupakan total frekuensi semua nilai yang
lebih kecil dari batas bawah kelas interval.
Distribusi komulatif lebih besar :
merupakan total frekuensi semua nilai yang
lebih besar dari batas atas kelas interval.
Distribusi komulatif lebih kecil atau distribusi
komulatif lebih besar disebut sebagai Ogives

21

2.3 Histogram dan Poligon


Tabel 2.5 Frekuensi komulatif berat
mahasiswa di suatu PT (lebih kecil dari)

22

Berat badan

Frekuensi

59.50

62.50

65.50

23

68.50

65

71.50

92

74.50

100

badan

2.3 Histogram dan Poligon


120
100
80
frekuensi

60
40
20
0
59.50 62.50 65.50 68.50 71.50 74.50
Berat badan

Gambar 2.2 Distribusi komulatif (lebih kecil dari)


23

2.3 Histogram dan Poligon


Tabel 2.6 Frekuensi komulatif berat
mahasiswa di suatu PT (lebih besar dari)
Berat badan
59.50
65.50
62.50
68.50
71.50
74.50

24

Frekuensi
100
92
77
35
8
0

badan

2.3 Histogram dan Poligon


120
100
80
60
Frekuensi

40
20
0

Berat badan

Gambar 2.3 Distribusi komulatif (lebih besar dari)


25

2.4 Tipe Distribusi Frekuensi

26

27

Grafik atau Diagram

Diagram Batang

90
80
70
60
50
40
30
20
10
0

28

Diagram Garis

800
Sepeda motor
Sedan

600

Bus/Truk

400
200
0
Senin

Selasa

Rabu

Kamis

4%

4,5 %

5%

5,5 %

6%

Diagram Lambang
atau Diagram
Simbul

Diagram Lingkaran
atau Pastel

420
360
270

Pos D

300

Pos A
13%

13%

Pos B
17%

57%
1987

1989

1991

1993

Pos C

29

Diagram peta atau


kartogram

100%

Diagram Pencar
atau Diagram Titik

120
26 - 30 %

80%
60%

21 - 25 %

100
80
60

40%

16 - 20 %

20%
0%
1995

30

10 - 15 %
1996

1997

1998

1999

40
20
0
0

Latihan

Susunlah distribusi frekuensi data tinggi


badan
mahasiswa
kelas
mata
kuliah
probabilitas dan statistik dalam histogram,
poligon dan ogives, masing-masing dalam
frekuensi absolut dan relatif.

31

3. UKURAN KECENDERUNGAN TENGAH


Ukuran kecenderungan tengah dapat berupa :
1. Mean (arithmatic, geometric, harmonic)
2. Median
3. Mode
3.1 Mean
adalah nilai rata-rata
3.1.1 Arithmatic Mean
a. Nilai-nilai X tanpa frekuensi
Dari nilai-nilai X tanpa frekuensi : X 1, X2, ., XN
dapat dicari arithmatic mean sebagai berikut :
32

3.1.1 Arithmatic Mean

X 1 X 2 ... X N
X

1
N

Contoh :

X 8, 3, 5,12,10
8 3 5 12 10
X
7.6
5

33

X
j 1

3.1.1 Arithmatic Mean


b. Nilai-nilai X dengan frekuensi
Dari nilai-nilai x yang terjadi f kali : (X 1,f1),
(X2,f2), (XN, fN) , dapat dicari arithmatic mean
sebagai berikut :

f1 X 1 f 2 X 2 ... f k X k
X
f1 f 2 .... f k

f
j 1
k

Xj

f
j 1

34

fX fX

N
f

3.1.1 Arithmatic Mean


Contoh : Perhatikan data pada tabel 3.1
x
5
8
6
2

f
3
2
4
1

(3 x5) (2 x8) (4 x6) (1x 2)


X
3 2 4 1
57

5.7
10
35

3.1.1 Arithmatic Mean


c. Nilai-nilai X dengan bobot
Dari nilai-nilai X yang masing-masing dengan
bobot w : (w1,X1), (w2,X2),..(wk, Xk), dapat
dicari arithmatic mean sebagai berikut :

w1 X 1 w2 X 2 ... wk X k
X
w1 w2 .... wk

wX

w
36

3.1.1 Arithmatic Mean


Contoh :
Tabel 3.2
Ujian
Quiz-1
Quiz-2
Final

bobot
1
1
3

nilai
70
90
85

(1x70) (1x90) (3 x85)


X
11 3
415

83
5
37

3.1.2 Geometric Mean


Dari nilai-nilai X : X1, X2, ., XN dapat dicari
geometric mean sebagai berikut :

G N X 1 X 2 .... X N
Contoh :
X = 2, 4, 8
N=3

38

2 48

64 4

3.1.3 Harmonic Mean


Dari nilai-nilai X : X1, X2, ., XN dapat dicari
harmonic mean sebagai berikut :
1
1 N

N j 1
1

1 X

H
N

Contoh :
X = 2, 4, 8
N=3
39

1
Xj

N
1
X
j

1
N

1
X

3.1.3 Harmonic Mean


Jawab :

40

3
3.43
1 1 1

2 4 8

3.1.4 Root Mean Square (RMS)


Dari nilai-nilai X : X1, X2, ., XN dapat dicari
RMS sebagai berikut :
N

RMS

Contoh :
X = 1,3,4,5,7
N=5
RMS

41

X
j 1

2
j

2
X

32 4 2 5 2 7 2
4.47
5

3.1.5 Sifat-sifat tertentu


a. Jumlah deviasi
d 0

X : 8,3,5,12,10 X 7.6
d : 8 7.6 , 3 7.6 , 5 7.6 , 12 7.6 , 10 7.6

d 0.4 (4.6) (2.6) 4.4 2.4 0


X a terkecil bila a X
2

b.
c. Bila f1, f2,.,fk berturut-turut mempunyai
mean m1, m2, ., mk
f1m1 f 2 m2 ... f k mk
X
f1 f 2 ... f k
42

3.1.5 Sifat-sifat tertentu


d. Bila A adalah nilai yang diduga sebagai mean
dan dj=Xj-A, maka :
k

X A

fd
j 1
k

j 1

fd

fj

X G
e. Hubungan
sbb
: X
H G

dan H dapat dirumuskan

H G X , jika X 1 X 2 ... X N

43

3.1.5 Sifat-sifat tertentu


Contoh :

X 2,4,8
N 3
2 48
X
4.67
3
G 2 4 8 4
3
H
3.43
1 / 2 1 / 4 1 / 8

44

3.1.5 Sifat-sifat tertentu


f. Jika :
- A : nilai yang diduga sebagai mean
- u : peringkat
- c : lebar kelas interval
Maka hubungan X dan A adalah :

fu

X A

j 1

c A

45

fu c
N

3.1.5 Sifat-sifat tertentu


Tabel 3.3
X
55
65
75
85
95
105
115
X =
595

fX
440
650
1200
1190
950
525
230

u
-2
-1
0
1
2
3
4

f = 65 fX = 5185 u = 7

fX

X A

46

f
8
10
16
14
10
5
2

5185
79.77
65
fu c 75 31 10 79.77
N
65

fu
-16
-10
0
14
20
15
8
fu =
31

3.2 Median (nilai tengah)


Jika data disusun menurut nilainya dari besar
ke kecil maka median adalah :
a. nilai tengah
b. arithmatic mean dari dua nilai tengah
Misal X adalah nilai-nilai : 3,4,4,5,6,8,8,8, dan
10, maka median adalah 6 .
Jika X adalah nilai-nilai : 5,5,7,9,11,12,15 dan
18, maka median adalah :

9 11
10
2
47

3.2 Median (nilai tengah)


Untuk data yang dikelompokkan , median dapat dirumuskan
sebagai berikut :
N


f 1
2
c
Median L1

f median

Keterangan :
L1 = batas bawah kelas dari kelas median
N
= jumlah frekuensi
f 1 = jml. frekuensi dari semua kls. di bawah kls. median
fmedian = frekuensi kelas median
c = interval kelas median

48

3.2 Median (nilai tengah)


Contoh :
Dari data pada tabel 3.4 dapat disusun
distribusi frekuensi pada tabel 3.5 dan gambar
3.1,
selanjutnya
dapat
median
dapat
ditentukan.
Tabel 3.4

49

138

164

150

132

144

125

149

157

146

158

140

147

136

148

152

144

168

126

138

176

163

119

154

165

146

173

142

147

135

153

140

135

161

145

135

142

150

156

145

128

3.2 Median (nilai tengah)


Tabel 3.5
Kelas Frekuensi
118-126
3
127-135
5
136-144
9
145-153
12
154-162
5
163-171
4
172-180
2

14
12
10
8
frekuensi

6
4
2
0

40

17

9 146.8
Median 144.5 2
12

50

118-126 127-135 136-144 145-153 154-162 163-171 172-180


kelas

Gambar 3.1

3.2 Median (nilai tengah)


Dari distribusi frekuensi pada tabel 3.4 dapat
disusun distribusi kumulatif (tabel 3.6 dan Gambar
3.2)
Tabel 3.6
120
Interval
117.5
126.5
135.5
144.5
153.5
162.5
171.5
180.5

frekuensi
persen
kumulatif kumulatif
0
0
3
7.5
8
20
17
42.5
29
72.5
34
85
38
95
40
100

100
80
60
frekuensi (%)

40
20
0

interval

Gambar 2

51

3.2 Median (nilai tengah)


Dari kurva kumulatif dapat dihitung median
sebagai berikut :

RQ PQ

RS ST

50% 42.5%
RQ
9 2.25
72.5% 42.5%
Median 144.5 2.25 146.5

52

3.3 Mode atau modus


Mode adalah nilai yang frekuensinya tertinggi.
Suatu data yang memiliki satu nilai frekuensi
tertinggi disebut unimodal. Jika ada dua nilai
frekuensi tertinggi disebut bimodal.
Contoh :
X = 2,2,5,7,9,9,9,10,11,12,18
Mode = 9 (unimodal)
X = 3,5,8,10,12,15,16
Mode = tidak ada
X= 2,3,4,4,4,5,5,7,7,7,9
Mode = 4 dan 7 (bimodal)
53

3.3 Mode atau modus


Mode dapat dirumuskan sebagai berikut :

1
c
Mode L1
1 2
Keterangan :
L1 batas bawah kelas dari kelas modal
1 excess frekuensi modal terhadap frekuensi kelas yang lebih rendah
2 excess frekuensi modal terhadap frekuensi kelas yang lebih tinggi
c interval kelas modal

54

3.3 Mode atau modus


Contoh :
Tabel 3.7
Upah
50 - 59.99
60 - 69.99
70 - 79.99
80 -89.99
90 - 99.99
100 109.99
110 119.99

55

Jumlah
Buruh
8
10
16
14
10
5
2

Diketahui :
L1 69.99
1 16 - 10 6
2 16 14 2
c 10

1
c
1 2
6
69.99
10
62
77.5

Mode L1

3.4 Quartiles, Deciles dan Percentiles

Quartiles : nilai yang membatasi bagian yang satu


dengan bagian yang lainnya pada data yang telah
diurutkan menurut besarnya yang dikelompokkan
kedalam 4 bagian kelompok yang sama jumlahnya. Q1,
Q2 dan Q3
Deciles : nilai yang membatasi bagian yang satu dengan
bagian yang lainnya pada data yang telah diurutkan
menurut besarnya yang dikelompokkan kedalam 10
bagian kelompok yang sama jumlahnya. D1, D2,,D9.
Percentiles : nilai yang membatasi bagian yang satu
dengan bagian yang lainnya pada data yang telah
diurutkan menurut besarnya yang dikelompokkan
kedalam 100 bagian kelompok yang sama jumlahnya. P1,
P2,,P99.
56

3.4 Quartiles, Deciles dan Percentiles


Contoh : Dari data pada tabel 3.8 dapat ditentukan
Quartiles sebagai berikut :
Tabel 3.8
Q1 terdiri atas
Upah
Jumlah Buruh
N/4=65/4=16.25
50 - 59.99
8
60 - 69.99
10
Karena interval kelas 1
70 - 79.99
16
memiliki
80 -89.99
14
kasus maka10
ada kekurangan
908- 99.99
100 sebanyak
16.25-8=8.25 kasus.
109.99
5
Kekurangan
diambil dari interval
110 119.99
2 dari 10 kasus.
kelas 2 yg terdiri
N

65

Q1 = 59.995+(8.25/10)(10)=68.25
57

3.4 Quartiles, Deciles dan Percentiles

Q2 terdiri atas 2N/4=65/2=32.5 kasus. Interval kelas


1 dan 2 memiliki 18 kasus (8+10=18), sehingga
masih ada kekurangan 32.5-18=14.5 kasus.
Kekurangan ini diambilkan dari interval kelas ke 3
yang terdiri dari 16 kasus. Q2 dapat dihitung :
Q2 = 69.995+(14.5/16)(10)=79.06

Q3 terdiri atas 3N/4=(3/4)65=48.75 kasus. Interval


kelas 1,2,3 dan 4 memiliki 48 kasus. Sehingga
masih ada kekurangan 48.75-48=0.75 kasus.
Kekurangan ini diambilkan dari interval kelas ke 5
yang terdiri dari 10 kasus. Q3 dapat dihitung :
Q3 = 89.995+(0.75/10)(10)=90.75
58

3.4 Quartiles, Deciles dan Percentiles

Interpretasi dari hasil pengelompokkan data


menurut quartiles adalah :
a. 25% buruh menerima upah 68.25 atau
kurang
b. 50% meneriman upah 79.06 atau kurang
c. 75% menerima upah 90.75 atau kurang

59

3.5 Hubungan mean, median dan mode

Hubungan antara tiga ukuran kecenderungan


tengah dapat dirumuskan sebagai berikut :
Mean Mode =3 (Mean Median)
Secara grafis dapat dilihat pada gambar 3.4-3.6
berikut :

60

3.5 Hubungan mean, median dan mode

61

Tugas

Tentukanlah mean, median dan mode dari


data tinggi badan mahasiswa kelas mata
kuliah probabilitas dan statistik menggunakan
aplikasi MExcel

62

4. UKURAN DISPERSI/VARIASI

Dispersi
/
variasi
adalah
tingkat
penyimpangan data terhadap rata-ratanya.
Ukuran dispersi dapat berupa :
1. Range
2. Mean deviation
3. semi-interquartile range
4. 10-90 percentile range
5. deviasi standar
6. skewness
7. kurtosis

63

4.1 Range

Range dari suatu bilangan merupakan


perbedaan antara bilangan terbesar dengan
bilangan terkecil.
Contoh :
X : 2,3,3,5,5,8,10,12
Range =12-2=10
Atau dapat dituliskan bahwa range 2 12

64

4.2 Mean Deviation


Mean
deviation
adalah
rata-rata
penyimpangan
data
terhadap
meannya
(arithmatic mean).
Mean Deviation (MD) dibedakan menjadi :
1. MD dari data tanpa frekuensi
2. MD dari data dengan frekuensi
4.2.1. DataN tanpa frekuensi

MD

65

X
j 1

4.2 Mean Deviation


Contoh :
X = 2,3,6,8,11

X 6
MD

2 6 3 6 6 6 8 6 11 6
5

4.2.2 Data dengan frekuensi


N

MD
66

f
j 1

Xj X
N

2.8

4.2 Mean Deviation


Contoh :
Berikut adalah data berat badan 100
mahasiswa dengan mean sebesar 67 kg yang
telah disusun dalam sutau distribusi.
Tabel 4.1
Interval
Titik Devias Frekuen Frekuensi x
MD = 223.8/100
Kelas tengah
i
si
Deviasi
60-62
61
6.45
5 = 2.238
32.25kg
63-65
64
3.45
18
62.1
66-68
67
0.45
42
18.9
69-71
70
2.45
27
66.15
72-74
73
5.55
8
44.4
Jumlah
100
223.8

67

4.3 Semi-interquartile range

Semi-interquartile range disebut juga dengan


quartile deviation.
Q3 Q1
2
Q1 quartile 1
Q

Q3 quartile 3

Contoh :
Q1=68.25

90.75 68.25
Q
11.25
Q3=90.75
2
X 11.25

Artinya : 50% data berada pada interval :


68

4.4 10-90 Percentile Range

69

5. DISTRIBUSI PROBABILITAS
5.1 Pengertian distribusi porbabilitas
5.2 Distribusi Binomial

70

5.1 Pengertian distribusi porbabilitas

71

5.3 Distribusi Normal


Jika X adalah variabel random (acak) yang
kontinyu, maka distribusi normal ditentukan
oleh persamaan sebagai berikut :
1

x 2
1
Y
e 2
2

Keterangan :
= standar deviasi
= mean
= 3.14
e = 2.718
72

5.3 Distribusi Normal


Luasan yang dibatasi oleh X=a dan X=b (a<X<b)
menunjukkan probabilitas bahwa X terletak pada
interval tersebut. Jika variabel X dinyatakan dalam
unit standar,

x
z

persamaan distribusi normal dapat dituliskan menjadi :


1
z2
1
Y
e 2
2

Dalam persamaan ini z mengikuti distribusi normal


dengan
73

5.3 Distribusi Normal


mean sama dengan nol dan variansi sama
dengan satu.

74

5.3 Distribusi Normal


Gambar 5.4 menyatakan tingginya Y pada
berbagai nilai z. Tinggi Y pada berbagai nilai z
dapat dilihat pada tabel ordinates (Y) of The
Standard Normal Curve at z. Luasan di bawah
kurva Y menyatakan probabilitas bahwa z
terletak pada interval tertentu. Luasan pada
berbagai nilai z dapat dilihat pada tabel Areas
under the standard normal curve from 0 to z
(wilayah luas dibawah kurva normal).

75

5.3 Distribusi Normal


Tabel 5.3 Wilayah luas dibawah kurva normal (50%)

z
0
1
2
..
9

0.0
0.0000 0.0040 0.0080
..
0.0359

0.1
0.0398 0.0438 0.0478
..
0.0754

Tabel0.2dibaca
dari 0.0832
kiri-kanan,
atas ..
bawah0.1141
ex. 0.0,
0.0793
0.0871
0.01, 0.2..,0.9

..
..
0.20,
0.21, 0.220.29

Tabel3.9untuk
wilayah
luas0.5000
dibawah
normal
0.5000
0.5000
..kurva
0.5000

(luas 100%) dapat dilihat pada tabel A.4 hal. 470


buku Ronald E Wapole
76

5.4 Distribusi Poisson


Distribusi poisson adalah ditribusi binomial dimana N besa
tetapi p kecil mendekati 0 atau q=(1-p) besar mendekati 1.
Secara praktis suatu random variabel mengikuti distribusi
poisson bila N50 sedangkan NP<5.

X e
p X
X!

X 0,1,2,....

Keterangan :
e=2.71828
= konstan
Dari random variabel yang mengikuti distribusi poisson
dapat dirumuskan ukuran-ukuran sebagai berikut :

77

5.4 Distribusi Poisson


mean
=
variance
2 =
standar deviation
= 2
Momen koefisien of skewness 3 = 1/
Momen koefisien of kurtosis

78

4 = 3+1/

5.5 Distribusi Multinomial


Bila kejadian E1, E2,,Ek masing-masing
muncul dengan probabilitas bahwa p 1, p2,.,pk
, maka probabilitas bahwa E1, E2,,Ek
masing-masing muncul X1, X2,, Xk kali
dapat dirumuskan sebagai,

N!
X1
X2
Xk
p1 p2 .... pk
X 1! X 2 !....X k !

X 1 X 2 ... X k N

79

5.5 Distribusi Multinomial


Contoh :
Dadu yang dilempar 12 kali, probabilitas
mendapatkan 1,2,3,5, dan 6 masing-masing 2
kali dapat dirumuskan sebagai :

2
2
2
2
2
12!
1
1
1
1
1
1

6
6
6
6
6
6
2!2!2!2!2!2!
12 x11x10 x9 x8 x7 x6 x5 x 4 x3x 2 x1 1 6

6
26
479001600
1

64
46656
479001600

2985984
160

80

6. Teori Sampling
6.1 Pengertian Sampling
6.2 Distribusi Sampling
6.1 Pengertian Sampling
Teori sampling mempelajari hubungan antara
populasi dan sampel yang diambil dari populasi
tersebut.
Dari hubungan ini parameter populasi (mean dan
variance populasi) dapat diperkirakan dengan
statistik sampel (mean dan variance sampel).
Teori sampling juga mempelajari perbedaan antara
dua sampel atau lebih, nyata atau hanya kebetulan.
81

6.1 Pengertian Sampling


Secara umum teori sampling berhubungan
dengan
estimasi
parameter
(populasi)
berdasarkan statistik (sampel) serta uji akurasi
atau inferensi.
Untuk melakukan inferensi , sampel harus diambil
sedemikian
rupa
sehingga
mencerminkan
populasinya atau representatif.
Salah satu cara untuk mendapatkan sampel yang
representatif adalah pengambilan sampel secara
acak atau random. Cara ini dapat digunakan bila
anggota populasi mempunyai kesempatan yang
sama untuk diambil sebagai sampel.
82

6.1 Pengertian Sampling

Cara ini dilaksanakan dengan memberi nomor pada setiap


anggota populasi kemudian dilotre untuk mendapatkan
sampel. Pengambilan sampel dengan cara random juga
dapat dilakukan dengan nomor random.
Populasi jumlahnya dapat terbatas (finite) atau tak terbatas
(infinite).
Misal :
mengambil 10 bola lampu dari keranjang yang berisi 100
bola lampu tanpa pengembalian dikatakan mengambil
sampel dari populasi yang terbatas.

83

6.1 Pengertian Sampling

Namum
bila
pengambilan
bola
dilakukan
dengan
pengembalian dikatakan mengambil sampel dari populasi
yang tak terbatas.

Contoh :

Melempar uang logam atau dadu sebanyak 50 kali


dikatakan mengambil sampel dari populasi yang tak
terbatas.

Secara praktis, bila sampel diambil dari populasi yang


anggotanya sangat besar dapat dikatakan bahwa sampel
diambil dari populasi yang tak terbatas.

84

6.2 Distribusi Sampling

Terdapat berbagai kemungkinan sampel


sebesar N yang dapat diambil dari suatu
populasi yang jumlahnya Np.

Dari setiap kemungkinan sampel yang diambil


dapat dicari statistiknya (mean, median,
mode, variance, deviasi standar dsb.) atau
distribusi statistik / distribusi sampling.

85

6.2.1 Distribusi sampling mean

Untuk populasi yang terbatas (pengambilan


sampel tanpa pengembalian) :
Hubungan mean sampel (x) dengan mean
populasi (), serta deviasi standar sampel (x)
dengan deviasi standar populasi () dapat
dirumuskan sbb. :

x
N
86

N p N
N p 1

6.2.1 Distribusi sampling mean

Populasi yang tak terbatas (pengambilan


sampel dengan pengembalian) :
x

x
N

Contoh :
Sebuah populasi mempunyai 5 anggota
dengan nilai 2,3,6,8 dan 11. Bila jumlah
sampel sama dengan 2, dapat dibandingkan
mean dan variance populasi dengan mean
dan variance sampel.

87

6.2.1 Distribusi sampling mean

Penyelesaian :
jumlah populasi = 2+3+6+8+11=30
probabilitas=1/5
Mean populasi = =30/5=6
Variance populasi =
2
2
2
2
2

11

6
2

10.8 3.29

88

10.8

6.2.1 Distribusi sampling mean

Pengambilan sampel dengan pengembalian


sampel sebesar 2 untuk populasi sebesar 5 akan memiliki 5(5)
kemungkinan, (lihat tabel 6.1)
Tabel 6.1 Probabilitas

89

(2,2)

(2,3)

(2,6)

(2,8)

(2,11)

(3,2)

(3,3)

(3,6)

(3,8)

(3,11)

(6,2)

(6,3)

(6,6)

(6,8)

(6,11)

(8,2)

(8,3)

(8,6)

(8,8)

(8,11)

(11,2)

(11,3)

(11,6)

(11,8)

(11,11)

6.2.1 Distribusi sampling mean

Mean untuk masing-masing sampel (lihat


tabel 6.2)
Tabel 6.2 Mean masing-masing sampel
(2+2)/2
=2
2.5
4
5
6.5

90

2.5

6.5

3
4.5
5.5
7

4.5
6
7
8.5

5.5
7
8
9.5

7
8.5
9.5
11

6.2.1 Distribusi sampling mean

Maka mean sampel dan standar deviasi sampel :


2 2.5 ..... 9.5 11 150
x

6
25
25

2 6 2 2.5 6 2 .... 9.5 6 2 11 6 2


25

2.32

Pengambilan sampel tanpa pengembalian ;


jika sampel diambil tanpa pengembalian, maka
akan ada 5C2 =10 kemungkinan sampel (lihat
tabel 6.3)
Tabel 6.3
(2,3)
(2,6)
(2,8)
(2,11)
(3,6)
(3,8)

91

(3,11)

(6,8)

(6,11)

(8,11)

6.2.1 Distribusi sampling mean

Dari 10 kemungkinan sampel dapat dihitung


mean masing-masing sampel (lihat tabel 6.4).
Tabel 6.4
2.5

6.5

4.5

Mean sampel
sampel
5.5dan 7variance
7
8.5 9.5:

92

2.5 ..... 9.5 60


x

6
10
10
2
2

2
.
5

....

9
.
5

6
2
x
4.05
10
x 4.05 2.01

6.2.1 Distribusi sampling mean

Kesimpulan :
Dari contoh diatas dapat diambil kesimpulan
bahwa untuk sampel dengan pengembalian
dan sampel tanpa pengembalian diperoleh :
1. Mean sampel = mean populasi
2. Standar deviasi sampel standar deviasi
populasi
3. Sesuai dengan rumus :

93

6.2.1 Distribusi sampling mean

Rumus:
Rumus

Dengan
pengembalian

Ratarata
sampling
Standar
deviasi
sampling

94

x
N

Tanpa
Pengembalian

x
N

Np N

N p 1

6.2.1 Distribusi sampling mean


Latihan:
Diketahui lama menyala 1000 bola lampu yang
diproduksi sebuah perusahaan terdistribusi
normal dengan rata-rata menyala setiap lampu
adalah 100 hari dengan deviasi standar
selama 4 hari. Jika diambil sampel yang terdiri
dari 15 bola lampu, berapakah nilai rata-rata
dan deviasi standar dari distribusi sampling
rata-rata yang diperoleh jika sampling diambil:
a. tanpa pengembalian
b. dengan pengembalian
95

6.2.2 Distribusi sampling proporsi (P)


Jika populasi tak terbatas :
Contoh : kejadian munculnya Gambar (G) atau Angka (A)
dalam melempar uang logam, dimana probabilitas
munculnya G(p) sama dengan dan probabilitas
munculnya
A(q) adalah q=1-p =1/2, maka distribusi
sampling proporsi (P) melempar uang logam sebanyak N
kali adalah :

p p
p

96

pq

p 1 p
N

6.2.2 Distribusi sampling proporsi (P)

Jika N cukup besar


mendekati normal.

(30),

Jika populasi terbatas (pengambilan sampel tanpa


pengembalian), maka mean dan deviasi standar sbb. :

p p
p pq

97

maka

distribusi

binomial

6.2.2 Distribusi sampling proporsi (P)

Rumus:
Rumus

Dengan
pengembalian

Tanpa Pengembalian

Rata-rata
sampling

p p

p p

Standar
deviasi
sampling

98

pq

p 1 p
N

p pq

6.2.2 Distribusi sampling proporsi (P)


Contoh:

Dari melempar uang logam sebanyak 120 kali, tentukanlah


probabilitas munculnya gambar (G)
a. 40-60%
b. 5/8 atau lebih
Penyelesaian:
a.

Cara 1:
Pr G 40-60%
40% G = 0.4 x 120 =48
60% G= 0.6 x 120 =72

99

6.2.2 Distribusi sampling proporsi (P)

Penyelesaian
1
p
2
1
Np 120 60
2
Npq 120 0.5 0.5 30 5.48

Munculnya H 40-60%
47,5 dalam normal standar
72,5 dalam normal standar

100

47,5

72,5

47,5 60
2,28
5,48
72,5 60

2,28
5,48

6.2.2 Distribusi sampling proporsi (P)


Area di bawah kurva normal untuk -2,28<z<2,28= 0,98870,0113=0,9774
Jadi, probabilitas munculnya G 40-60% adalah 0,9774
Latihan:
Pada suatu pengiriman paket yang terdiri dari 20 jam
tangan diketahui 6 jam tangan tidak memenuhi kualitas
standar. Apabila sampel acak sebanyak 500 jam tangan
dipilih dari populasi diatas dengan pengembalian, tentukan
probabilitas proporsi jam tangan yang tidak memenuhi
kualitas: a. kurang dari 30%, b. lebih dari 32,8%

101

6.2.3
Distribusi
penjumlahan

sampling

perbedaan

dan

Distribusi sampling ini berkaitan dengan dua populasi yaitu


populasi 1 dan populasi 2.

Dari dua populasi tsb. diambil masing-masing sampel yaitu


N1 dan N2 dan dihitung statistiknya S1 dan S2

Dua populasi tsb memiliki distribusi samplling S 1 dan


distribusi sampling S2

Mean dan deviasi standar untuk masing-masing sampling


adalah :
populasi 1 : s1 dan s1
populasi 2 : s2 dan s2

102

6.2.3 Distribusi sampling perbedaan dan


penjumlahan

Distribusi sampling perbedaan S 1-S2 dan distribusi


sampling penjumlahan S1+S2 dengan mean dan
deviasi standar sebagai berikut :

Mean S1 S 2 S1 S 2

deviasi standar S1 S 2 S1 S 2

Jika S1 dan S2 adalah mean sampel dari dua


populasi yang disimbolkan dengan X1 dan X2,
maka distribusi sampling perbedaan mean dari
populasi tak terbatas dengan mean dan deviasi
standar masing-masing (1, 1) dan (2, 2)
103

6.2.3 Distribusi sampling perbedaan dan


penjumlahan
adalah :

Mean X 1 X 2 X 1 X 2 1 2

deviasi standar X 1 X 2 X 1 X 2

104

1 2

N1 N 2
2

7. Estimasi dan Inferensi Statistik


7.1 Unbiased dan Efficient Estimator
Jika statistik distribusi sampling sama dengan
populasinya maka statistik tsb adalah
unbiased estimator dan
kebalikannya jika
statistik distribusi sampling tidak sama
dengan populasinya maka disbt. biased
estimator
Mean atau nilai X rata-rata untuk unbiased

i
X efisien adalah :
estimator dan
N
1
X X 1 X 2 .... X n
N
105

7.1 Unbiased dan Efficient Estimator

Variance untuk unbiased estimator dan efisien


adalah :
1
2
2
Xi X
S

N 1
1
2
2
2
2
X 1 X X 2 X ...... X n X
S
N 1

Contoh :
Diketahui X : 6,33;6,37;6,36;6,32;6,37
Mean
unbiased
efisien
adalah
Xi
6,33dan
6,37
6,36
6,32 6:,37
X

106

6,35

7.1 Unbiased dan Efficient Estimator

Variance yg unbiased dan efisien :

1
2

X
i
N 1
2
2
2

6
,
33

6
,
35

6
,
37

6
,
35

......

6
,
37

6
,
35
S2
0,00055
5 1
S2

107

7.2 Confidence Interval (selang kepercayaan)

Mean (s), deviasi standar (s) dan distribusi


sampling statistik (S).
Jika S mengikuti distribusi normal maka S akan
terletak pada s s , s 2s , dan s 3s
(confidence interval/ selang kepercayaan) dengan
nilai2 masing2nya Sz cs merupakan confidence
limit (batas kepercayaan).
Contoh :
Szcs = S1.96 s
Szcs = S2.58 s
Nilai-nilai 1.96 dan 2.58 merupakan nilai kritis
(critical value) atau koefisien kepercayaan
108

7.2 Confidence Interval (selang kepercayaan)

Nilai zc dapat dilihat pada tabel berikut :


Tingkat kepercayaan

109

Zc

99.73

99.00

2,58

98.00

2,33

96.00

2,05

95.45

95.00

1,96

90.00

1,645

9. REGRESI DAN KORELASI


9.1
9.2
9.3
9.4

Bentuk Persamaan Regresi


Estimasi Persamaan Regresi
Uji Statistik Persamaan Regresi
Korelasi

Hubungan antara variabel dapat dinyatakan


dengan regresi dan korelasi
Regresi menyatakan hubungan antar variabel
dengan hubungan sebab akibat
Korelasi menyatakan hubungan antar variabel
tanpa sebab akibat
110

9.1 Bentuk Persamaan Regresi

Persamaan
regresi
menggambarkan
hubungan sebab akibat antar variabel
Variabel yang menyebabkan disebut variabel
bebas (independen)
Variabel yang disebabkan disebut variabel
tidak bebas (dependen)
Berikut adalah persamaan regresi yang
menyatakan hubungan sebab akibat :

1. Y a0 a1 X

111

Persamaan Garis Lurus

9.1 Bentuk Persamaan Regresi


2. Y a0 a1 X a2 X 2

Kuadratik

3. Y a0 a1 X a2 X 2 a3 X 3

Kubik

4. Y a0 a1 X a2 X 2 a3 X 3 ... ak X k Polinomial berderajat k


5. Y
dst.

112

1
1
atau a0 a1 X
a0 a1 X
Y

Hiperbola

9.2 Estimasi Persamaan Regresi


Estimasi

persamaan regresi dari satu


unit data dapat dilakukan dengan
cara :
1. Free hand
2. Straight line
3. Least square (yang paling banyak
dipakai)

113

9.2 Estimasi Persamaan Regresi

Penentuan kurva dengan metode least square


dapat dijelaskan dari gambar 9.1

114

9.2 Estimasi Persamaan Regresi

Parameter a0 dan a1 dapat ditentukan dengan


cara meminimumkan D1 2

D1 merupakan deviasi data terhadap garis


Y=a0+a1X

Disebut juga residual yang nilainya dapat


positif, negatif atau nol
Dengan meminimumkan D1 2
maka
diperoleh satu set persamaan yang disebut
a1 Xsebagai berikut :
dengan persamaan
Y a0 Nnormal

2
XY

a
X

a
X

0
1

115

9.2 Estimasi Persamaan Regresi

Nilai a0 dan a1 dapat dihitung menggunakan


persamaan berikut :

Y X X XY

N X X
N XY X Y

N X X
2

a0
a1

116

9.2 Estimasi Persamaan Regresi

Atau
juga
dapat
dihitung
menggunakan persamaan berikut :

a0 Y a1 X
a1

XY

dimana :
x X- X
y Y-Y
117

dengan

9.2 Estimasi Persamaan Regresi

Contoh :
Tentukan regresi Y=a0+a1X dari data (X,Y)
berikut
No. :
X
Y
X2
Y2
XY
1
2
3
4
5
6
7
8
Avarag
e
Total
()

118

1
3
4
6
8
9
11
14

1
2
4
4
5
7
8
9

1
9
16
36
64
81
121
196

1
4
16
16
25
49
64
81

1
6
16
24
40
63
88
126

65.5

32

45.5

56

40

524

256

364

9.2 Estimasi Persamaan Regresi

Nilai a0 dan a1 adalah :

Y X X XY

N X X
2

a0

a0
a1
a1

40 524 56 364 0.545


8 524 56 2

N XY X Y
N X 2 X

8 364 56 40 0.636
8 524 56 2

jadi :
Y 0.545 0.636 X
119

9.2 Estimasi Persamaan Regresi

Dengan cara lain :


No.
1
2
3
4
5
6
7
8
Avarag
e
Total
()

120

X
1
3
4
6
8
9
11
14

Y
1
2
4
4
5
7
8
9

x X- X
-6
-4
-3
-1
1
2
4
7

56

40

y Y-Y

-4
-3
-1
-1
0
2
3
4

xy
24
12
3
1
0
4
12
28

x2
36
16
9
1
1
4
16
49

10.5

16.5

84

132

9.2 Estimasi Persamaan Regresi

Nilai a0 dan a1 adalah :

a1

XY 84

0.636
X 132
2

a0 Y a1 X 5 0.636 7 0.545
Y 0.545 0.636 X

121