Statistika 1 - 1
Purnomo
B AB
PE N DAH U LUAN
1.1
Agus
Statistika 1 - 2
Purnomo
START
PENGUMPULAN DATA
KUANTITATIF
PENGOLAHAN,
PENYEDERHANAAN
DAN PENATAAN
DATA KUANTITATIF
S
T
A
T
I
S
T
I
K
PENYAJIAN DATA
YANG TELAH
DISEDERHANAKAN
D
E
S
K
R
I
P
T
I
F
Data Sample ?
Ya
PERGUNAKAN DATA
SAMPLE UNTUK :
- MENAKSIR
PARAMETER
- MENGUJI ASUMSI
MENGENAI PARAMETER
Bukan
PENGGUNAAN DATA
SENSUS (POPULASI)
UNTUK ANALISA
KARAKTERISTIK
(PARAMETER)
POPULASI YANG
TENGAH DISELIDIKI
PENARIKAN KESIMPULAN
TENTANG
KARAKTERISTIK
POPULASI (PARAMETER)
YANG TENGAH DISELIDIKI
S
T
A
T
I
S
T
I
K
I
N
F
E
R
E
N
S
STOP
Purnomo
Oleh karena itu, untuk memperoleh penelitian yang baik, maka proses perhitungan statistika
deskriptif dan statistika inferensia harus dilakukan dengan baik dan benar.
1.2 PERANAN STATISTIK DALAM KEHIDUPAN MANUSIA MODERN
Perkembangan statistik sebagai metode ilmiah telah mempengaruhi hampir setiap aspek
kehidupan manusia moderen. Peranan metode statistik dalam pengambilan keputusan secara
ekonomis di perusahaan-perusahaan maupun penelitian yang sifatnya non ekonomis makin besar.
1.2.1
Purnomo
Variasi : statistika bekerja dengan keadaan yang berubah-ubah (variasi). Misalnya keadaan
penduduk, keuangan, kelahiran, GNP, KB, dan lain-lain.
Reduksi : statistika bekerja secara reduksi, artinya tidak seluruh informasi yang harus
diolah. Tidak seluruh orang harus diteliti (populasi), melainkan cukup dengan sampel yang
mewakilinya atau sampel yang bersifat representatif.
Generalisasi : statistika induktif bekerja untuk menarik kesimpulan umum (generalisasi)
yang berlaku untuk anggota-anggota populasinya berdasarkan sampel-sampel yang
Agus
Statistika 1 - 5
Purnomo
4)
representatif tadi. Misalnya kita tidak mungkin meneliti 10.000 buah jeruk mengenai
kekuatannya terhadap sinar matahari, tetapi cukup dengan sampelnya misalnya 100 buah
saja untuk setiap 10.000 buah.
Spesialisasi : statistika selalu bekerja dengan angka-angka (kuantitatif). Istilah-istilah
seperti pada umumnya, kira-kira, sekitar, kurang lebih dll harus dibobot terlebih dahulu
agar dapat dikerjakan dengan metode-metode statistika.
1.5 DATA
A. DATA AND INFORMATION
Data bersifat jamak, sedangkan datum berbentuk tunggal. Jadi data adalah sekumpulan datumdatum. Data adalah suatu bahan mentah yang jika diolah dengan baik melalui berbagai
analisis dapat melahirkan berbagai informasi. Dengan informasi tersebut, kita dapat
mengambil suatu keputusan. Dalam statistika dikenal istilah-istilah jenis data, tingkatan data,
sumber data, penyajian data dan analisis data. Data dianalisis sesuai dengan jenis dan
tingkatannya, karean itu masing-masing tingkatan data mempunyai analisis sendiri khususnya
dalam analisis korelasi.
Data yang baik harus mutakhir, relevan dengan masalah yang diteliti dan berasal dari sumber
yang dapat dipertanggungjawabkan, lengkap, akurat, obyektif dan konsisten. Bagaimanapun
canggihnya suatu analisis jika tidak ditunjang oleh data yang baik, maka hasilnya kurang dapat
bisa dipertanggungjawabkan.
B. TIPE DAN TINGKATAN DATA
Dalam kegiatan statistika, kita akan selalu berhubungan dengan data. Secara garis besar, data
dibagi atas dua jenis yaitu :
1. Data dikotomi : disebut juga data diskrit, data kategorik atau data nominal adalah data yang
satuannya selalu bulat dalam bilangan asli dan tidak berbentuk pecahan yang diperoleh dari
hasil menghitung. Contoh : jumlah manusia, baju, mobil pohon dan lain sebagainya.
2. Data kontinum : data yang diperoleh dari hasil pengukuran menurut tingkatan yang
bervariasi, sehingga satuan datanya memungkinkan dalam bentuk pecahan. Data ini terdiri
atas 3 jenis, yaitu :
a. Data ordinal : data yang berbentuk rangking atau peringkat, misalnya juara I, II dan
III dinyatakan dalam skala, maka jarak antara satu data dengan lainnya tidak sama.
98
85
73
62
I
II
III
IV dst
b. Data interval : data yang jaraknya sama tapi tidak mempunyai nilai nol absolut ,
misalnya skala termometer, walaupun ada nilai 00 C, tetapi tetap ada nilainya.
-2
-1
0
1
2
3
4
c. Data ratio : data yang jaraknya sama dan mempunyai nilai nol mutlak, misalnya luas
area, tinggi dan berat dll. Panjang 0 meter berarti tidak mempunyai panjang. Data
ratio ini adalah data yang paling teliti.
Sedangkan tingkatan data jika diurutkan adalah dari urutan yang tertinggi ke yang terendah
adalah 1. Data ratio; 2. Data interval; 3. Data ordinal; dan 4. Data nominal. Dalam analisis
statistika, jiak diperlukan data yang tinggi dapat diturunkan ke tingkatan yang lebih rendah,
namun tidak bisa untuk sebaliknya.
Agus
Statistika 1 - 6
Purnomo
D. METODE SAMPLING
Sebelum memilih sampel, maka tahap awal adalah menentukan populasinya, kemudain
menentukan metode pengambilan sampel yang terdiri dari dua cara :
1. Sampel non probabilitas : disebut juga incidental yaitu pengambilan sample yang dilakukan
dengan cara tidak acak. Cara ini terdiri dari 3 jenis :
a. Convenience sampling : sampel yang diambil berdasarkan kesukaan peneliti, misalnya
dengan cara menghadang pengunjung super market kemudian mewawancarainya,
b. Judgement sampling : pemilihan elemen sampel sangat tergantung pada peneliti dengan
mempertimbangkan dasar-dasar tertentu, misalnya untuk meneliti peraturan lalu lintas,
maka sampel yang dipilih adalah mereka yang memiliki dan tidak memiliki SIM saja.
c. Quota sampling : pemilihan sampel pada suatu tingkat diambil dengan jumlah tertentu
(kuota) dengan ciri-ciri tertentu, misalnya peneliti mengendalikan karakteristik usia
responden dengan cara menentukan 50% dari respondennya berusia 30 tahun ke atas.
2. Sampel Probabilitas : sampel yang diambil secara acak (random). Cara ini terdiri dari 3
jenis :
a. Simple random sampling : pengambilan sampel yang dilakukan secara acak, dimana
setiap anggota populasi mempunyai kesempatan yang sama untuk menjadi sample.
Agus
Statistika 1 - 7
Purnomo
Agus
Statistika 1 - 8
Purnomo
BAB II
DISTRIBUSI FREKUENSI
Data yang telah dikumpulkan harus dikelola dan diorganisir sebaik mungkin dan sistematis
sehingga dapat menjadi sebuah informasi yang dapat digunakan untuk mengambil keputusan.
Penyajian data bisa berbentuk tabel-tabel, diagram, grafik maupun gambar-gambar. Dengan cara
demikian maka data dapat menjadi lebih komunikatif dan mudah dimengerti. Secara garis besar
data dapat diorganisir menjadi dua bagian :
2.1 Data yang tidak dikelompokkan.
Data yang jumlahnya tidak terlalu banyak seringkali tidak perlu dikelompokkan. Untuk data
yang demikian penyajiannya tidak terlalu sulit. Biasanya data disajikan dalam bentuk tabel
atau dengan urut yaitu dari nilai terkecil sampai yang terbesar atau sebaliknya. Contoh :
Tabel 1 Data Penjualan Produk X di Wilayah Bandung Bulan Januari 2010
No. urut
1
2
2
4
5
6
7
8
9
10
Wilayah/Cabang
Penjualan
(ribuan rupiah)
70
60
80
30
30
50
70
40
25
40
495
Cicaheum
Cicadas
Cisokan
Ciumbuleuit
Sukajadi
Setra Sari
Padasuka
Ujung Berung
Kepatihan
Cibeunying
JUMLAH
32
61
Agus
Statistika 1 - 9
33
76
73
65
47
56
45
54
79
58
40
54
70
76
38
85
Purnomo
52
54
56
25
74
62
88
63
40
77
57
64
68
45
58
28
42
67
59
52
75
66
55
54
43
65
56
23
48
66
47
33
44
46
61
48
82
35
69
36
Data di atas masih merupakan data mentah (raw data) atau data kasar (crude data). Data
tersebut belum diolah secara statistika, sehingga belum komunikatif. Data tersebut perlu
disusun atau ditabuklasi dalam bentuk tabel frekuensi. Ada beberapa tahapan atau langkah
dalam menyusun tabel frekuensi, yaitu :
1. Tentukan nilai maksimum (terbesar) dan nilai minimum (terkecil) dari data mentah,
kemudian tentukan range atau jangkauannya dengan menggunakan rumus :
r = nilai maks nilai min
Untuk sekedar diingat bahwa penentuan lebar kelas dengan cara ini hanya bersifat pendugaan
atau perkiraan saja. Lebar kelas pada seriap kelas biasanya dibuat sama dan diusahakan
merupakan bilangan asli.
c = r/k = 65/7 = 9,3 dibulatkan selalu ke atas menjadi 10 (agar semua data
bisa masuk range dari interval kelas.
4. Buatlah tabulasi frekuensi dengan cara memasukkan semua data dalam satu tabel. Cara
memasukkan data biasanya menggunakan model stik
Interval Kelas
Frekuensi
Frekuensi
20 29
III
3
30 39
IIIII II
7
40 49
IIIII IIIII II
12
50 59
IIIII IIIII IIIII
15
60 69
IIIII IIIII II
12
70 79
IIIII III
8
80 89
III
3
5. Tentukan batas kelas, yang terdiri dari :
batas kelas bawah (nilai terendah dalam interval kelas)
batas kelas atas (nilai tertinggi dalam interval kelas).
Dari data diatas maka dapat ditentukan :
Agus
Statistika 1 - 10
Purnomo
Tepi Kelas
19,5 29,5
29,5 39,5
39,5 49,5
49,5 59,5
59,5 69,5
69,5 79,5
79,5 89,5
Frekuensi
3
7
12
15
12
8
3
7. Tentukan nilai tengah (yaitu nilai yang terletak ditengah pada setiap kelas interval) dengan
cara dari jumlah batas kelas bawah dan batas kelas atas dari suatu kelas.
- nilai tengah I = (20 + 29) = 24,5
- nilai tengah II = (30 + 39) = 34,5 ; dst
Interval Kelas
20 29
30 39
40 49
50 59
60 69
70 79
Agus
Statistika 1 - 11
Nilai Tengah
24,5
34,5
44,5
54,5
64,5
74,5
Frekuensi
3
7
12
15
12
8
Purnomo
80 89
84,5
Frekuensi
3
7
12
15
12
8
3
60
Frekuensi kumulatif
kumulatif lebih dari
Interval
Kelas
20 29
30 39
40 49
50 59
60 69
70 79
80 89
Frekuensi
3
7
12
15
12
8
3
Frekuensi kumulatif
kurang dari
0
3
10
22
37
49
57
60
Frekuensi kumulatif
lebih dari
60
57
50
38
23
11
3
0
Nilai Tengah
24,5
34,5
44,5
54,5
64,5
74,5
84,5
Frekuensi
3
7
12
15
12
8
3
Purnomo
2. Histogram : diagram balok yang menunjukkan jumlah frekuensi dari setia kelas dengan
menggunakan tepi kelas untuk setiap batasan kelasnya. Sumbu vertikal dari grafik (tinggi
balok menunjukkan jumlah frekuensi setiap kelasnya dan sumbu horisontal menunjukkan
tepi kelas.
Interval Kelas
20 29
30 39
40 49
50 59
60 69
70 79
80 89
Agus
Statistika 1 - 13
Tepi Kelas
19,5 29,5
29,5 39,5
39,5 49,5
49,5 59,5
59,5 69,5
69,5 79,5
79,5 89,5
Frekuensi
3
7
12
15
12
9
3
Purnomo
3. Kurva Ogive : adalah grafik yang menunjukkan frekuensi kumulatif dari setiap kelas. Sumbu
vertikas menunjukkan frekuensi kumulatif dan sumbu horisontal menunjukkan tepi kelas.
Interval
Kelas
20 29
30 39
40 49
50 59
60 69
70 79
80 89
Frekuensi
3
6
12
15
12
9
3
Frekuensi kumulatif
kurang dari
0
3
9
21
36
48
57
60
Ogivelebih dari
Frekuensi kumulatif
lebih dari
60
57
51
39
24
12
3
0
Ogive kurang dari
60
45
30
15
19.5
Agus
Statistika 1 - 14
29.5
39.5
49.5
59.5
69.5
79.5
89.5
Purnomo
BAB III
PENGUKURAN CENTRAL TENDENCY,
LOCATION AND DISPERSION
3.1 PENDAHULUAN
Penyajian data dapat dilakukan dengan cara memakai ukuran pemusatan data (measures of
central tendency) dan ukuran letak data (measures of location).
Both of measures of central tendency and measures of location consist of a data typicals.
Both of them are a part of descriptive statistics. A measure of central tendency which we learn
consist of :
- Arithmethic Mean (Rata-Rata Hitung)
- Median (Median)
- Mode (Modus)
- Geometric Mean (Rata-Rata Ukur)
- Harmonic Mean (Rata-Rata Harmonis)
Sedangkan ukuran letak data (a measure of location) terdiri atas :
- Quartile (kuartil)
- Decil (desil)
- Percentile (persentil)
Ukuran pemusatan disebut juga sebagai rata-rata (average) menunjukkan di mana suatu data
memusat atau suatu kumpulan pengamatan memusat (mengelompok). Bila suatu kelompok data
diurutkan (secara membesar atau mengecil) maka ada kecenderungan data itu akan memusat
pada bagian tengah.
Thus, measure of central tendency is a single value which representatives set of data or
set of observation, wherein that value shows the data centralized.
3.2 ARITHMETIC MEAN (Rata-Rata Hitung)
1. Data yang tidak dikelompokkan :
Jika nilai data adalah X1 , X2 , X3 , Xi , dimana n adalah banyaknya data (sampel),
maka rata-rata hitung ( x , baca x bar) dirumuskan :
n
X =
+ X
+ X
, + X
atau
Xi
X =
i =1
n
70 80 60 30 30 40 40 60 40 50
50
10
Purnomo
fi Xi
X =
i =1
n
n
fi Xi
Contoh : Misalkan penjualan
toko A disajikan dalam tabel frekuensi di bawah ini. Berapakah
i =1
X =?
rata-rata penjualannya
n
Penjualan
20 29
30 39
40 49
50 59
60 69
70 79
80 89
Nilai Tengah
24,5
34,5
44,5
54,5
64,5
74,5
84,5
Frekuensi
3
6
12
15
12
9
3
(3x24,5)+6(34,5)+12(44,5)+ .dst
3 + 6 + 12 + 15 + 12 + 9 + 3
3.330
60
= 55,5
Hasil ini bisa dibaca bahwa penjualan rata-rata toko A adalah Rp.55.500,- per hari.
A. RATA-RATA HITUNG MEMAKAI KODE (U)
Cara lain untuk menghitung arithmetic mean menggunakan cara transformasi linier, di
mana cara ini lebih sederhana dibandingkan dengan cara sebelumnya. Ketentuannya
adalah :
Digunakan untuk data berkelompok
Kode pengganti adalah U yang mempunyai nilai : 0, 1, 2, 3, 4, .dst.
Caranya dengan membuat titik 0 baru (0*) dari titik 0 lama
Tentukan nilai tengah (X0) dari kelas tengah, kemudian himpitkan nilai tsb dengan titik 0* ,
sehingga X0 = 0* = 0
Rumus yang digunakan adalah :
fU
X = X0 + c
f
di mana : X0 = Nilai tengah kelas dari kelas yang paling tengah
c = Lebar kelas
U = Kode
Contoh : hitunglah mean dari data di bawah ini :
Penjualan
Nilai Tengah
Frekuensi
20 29
24,5
3
30 39
34,5
6
40 49
44,5
12
50 59
54,5
15
60 69
64,5
12
70 79
74,5
9
Agus
Statistika 1 - 16
Purnomo
80 89
84,5
Jawab :
Tabel diubah dulu menjadi
Penjualan
Nilai Tengah
20 29
24,5
30 39
34,5
40 49
44,5
50 59
54,5
60 69
64,5
70 79
74,5
80 89
84,5
U
-3
-2
-1
0
1
2
3
f
3
6
12
15
12
9
3
f = 60
fU
-9
-12
-12
0
12
18
9
fU = 6
Med = L0 + c
n/2 - F
f
Di mana :
Med = Median
L0 = Batas bawah kelas median
c
= Lebar Kelas (interval)
n/2 = median dari data yang dikelompokkan
F
= jumlah frekuensi semua kelas sebelum
kelas yang mengandung median
f
= frekuensi kelas median
Agus
Statistika 1 - 17
Purnomo
Modal
112 120
121 129
130 138
139 147
148 156
157 165
166 174
frekuensi
4
5
8
12
5
4
2
Med =
138,5 + 9
20 - 17
= 140,75
12
Mod =
L0 + c
b1
b1 + b2
Di mana :
Mod = Modus
L0 = Batas bawah kelas modus
c
= Lebar Kelas (interval)
b1 = selisih antara frekuensi kelas modus
dengan frekuensi tepat satu kelas sebelum
kelas modus
b2 = selisih antara frekuensi kelas modus
dengan frekuensi tepat satu kelas sesudah
kelas modus
Agus
Statistika 1 - 18
40,5 + 10
5+ 8
= 44,35
Purnomo
mod = med = x
1
2
3
Dalam hal distribusi data asimetri ke kanan atau ke kiri, maka terdapat hubungan empirik antara
rata-rata hitung dengan median dan modus, yaitu :
X Mod = 3(X Med)
Example :
An asymmetry distribution data set has arithmetic mean 75 and Median 70. Find the mode of the
data !.
X Mod = 3 (X Med)
75 Mod = 3 (75 70)
Mod = 75 15 = 60
3.5 GEOMETRIC MEAN (Rata-Rata Ukur)
Dipakai untuk menggambarkan keseluruhan data, khususnya bila data mempunyai ciri
khusus seperti antara beberapa data mempunyai kelipatan yang sama, sehingga perbandingan 2
data yang berurutan hampir tetap.
Rumus yang digunakan pada rata-rata ukur adalah :
Untuk data yang jumlahnya kecil :
G=
. X2 . X3 .. Xn
Agus
Statistika 1 - 19
Purnomo
RH = n/(1/ x)
RH = f/(f/ x)
3.7
1. Quartiles is a measurement which divide a data set distribution into four same portions.
Below are the quartiles formulas :
Qi = i(n + 1)/4 ; dimana i = 1,2,3
Untuk data yang dikelompokkan dalam tabel distribusi frekuensi, quartil dihitung dengan
memakai rumus :
Qi
= L0 + c
in/4 - F
f
Di mana :
Qi = Quartil ke i
L0 = Batas bawah kelas quartil
c
= Lebar Kelas (interval)
in/4 = quartil dari data yang dikelompokkan
F
= jumlah frekuensi semua kelas sebelum
kelas yang mengandung quartil
f
= frekuensi kelas Quartil Qi
Problem :
1. Find the quartil Q1 , Q2 , Q3 of a data set of 13 workers who have monthly income, as
follow : 40, 30, 50, 65, 45, 55, 70, 60, 80, 35, 85, 95, 100
Solutions :
Arrange the data in ascending order as follow:
30, 35, 40, 45, 50, 55, 60, 65, 75, 80, 85, 95, 100
Use the formula Qi = i(n + 1)/4 to solve the problem :
Q1 = 1(13 + 1)/4 = 14/4 = 3 nilai ke-3
= antara nilai ke-3 dan nilai ke-4
= nilai ke 3 + (nilai ke-4 nilai ke-3)
= 40 + (45 40) = 42,5
Q2 = 2(13 + 1)/4 = 28/4 = 7 nilai ke-7 = 60
Q3 = 3(13 + 1)/4 = 42/4 = 10 nilai ke-10
= nilai ke-10 + (nilai ke-11 nilai ke-10)
= 80 + (85 80) = 82,5
2. Find the quartil Q1 , Q2 , Q3 of a data set as follow :
Modal
112 120
121 129
Agus
Statistika 1 - 20
X
116
125
frekuensi
4
5
Purnomo
130 138
139 147
148 156
157 165
166 174
134
143
152
161
170
8
12
5
4
2
Solution :
Determine class interval Q1 , Q2 , Q3 :
Q1 , is the point at or below which lie 25% and at or above which lie 75% of the data points
Q2 , is the point at or below which lie 50% and at or above which lie 50% of the data points
Q3 , is the point at or below which lie 75% and at or above which lie 25% of the data points
Because of n = 40, then Q1 lies at class 130 138; Q2 lies at class 139 147 and Q 3 lies at class
148 156.
Use the formula :
Qi
L0 + c
in/4 - F
f
Di
= L0 + c
in/10 - F
f
Di mana :
= Desil ke i
Di
L0 = Batas bawah kelas desil
c
= Lebar Kelas (interval)
in/10 = desil dari data yang dikelompokkan
F
= jumlah frekuensi semua kelas sebelum
kelas yang mengandung desil
f
= frekuensi kelas desil Di
Contoh :
1. Tentukan desil D3 dan D7 dari data :
30, 35, 40, 45, 50, 55, 60, 65, 75, 80, 85, 95, 100
Jawab :
Data diurutkan sebagai berikut:
30, 35, 40, 45, 50, 55, 60, 65, 75, 80, 85, 95, 100
Gunakan rumus Di = i(n + 1)/10 :
D3 = 3(13 + 1)/10 = 42/10 = 4 1/5 nilai ke-4 1/5
= antara nilai ke-4 dan nilai ke-5
= nilai ke-4 + 1/5(nilai ke-5 nilai ke-4)
Agus
Statistika 1 - 21
Purnomo
=
D7 =
=
=
45 + 1/5(50 45) = 46
7(13 + 1)/10 = 42/4 = 98/10 nilai ke-9 8/10
nilai ke-9 + 8/10(nilai ke-10 nilai ke-9)
70 + 8/10(80 70) = 78
X
116
125
134
143
152
161
170
f
4
5
8
12
5
4
2
Di
= L0 + c
in/10 - F
f
= L0 + c
in/100 - F
Di mana :
= Persentil ke i
Pi
L0 = Batas bawah kelas persentil
c
= Lebar Kelas (interval)
in/100 = persentil dari data yang dikelompokkan
F
= jumlah frekuensi semua kelas sebelum
kelas yang mengandung persentil
f
= frekuensi kelas Persentil Di
Purnomo
nilai terkecil 30 dan terbesar 70, sedangkan kelompok 3 mempunyai nilai terkecil 20 dan terbesar
80.
Jenis-jenis ukuran dispersi data :
1. Jangkauan (Range)
2. Simpangan Rata-rata (Mean Deviation)
3. Variansi (Variance)
disebut dispersi mutlak
4. Standar Deviasi (Standard Deviation)
5. Simpangan Kuartil (Quartile Deviation)
6. Koefisien Variasi (Coeficient of Variation) disebut dispersi relatif
1. Jangkauan (Range) : selisih antara nilai maksimum dengan nilai minimum suatu
kelompok data. Dirumuskan :
Data tidak berkelompok :
Data berkelompok :
Makin kecil jangkauan suatu data, maka makin baik kualitas data itu; sebaliknya semakin
besar jangkauannya, maka semakin buruk kualitasnya.
2. Simpangan Rata-Rata (SR = Mean Deviation) : jumlah nilai mutlak dari selisih semua
nilai dengan nilai rata-rata dibagi jumlah data.
Data tidak berkelompok :
SR = X - X / n
Data berkelompok :
SR = f X - X / n ; di mana n = f
Contoh :
1. Tentukan simpangan rata-rata kelompok data: 20, 30, 50, 70, 80.
Jawab :
Rata-rata hitung = X = 50 dan n = 5, maka :
|20 50| + |30 50| + |50 50| + |70 50| + |80 50|
SR =
5
SR = (30 + 20 + 0 + 20 + 30)/5 = 100/5 = 20
2. Tentukan simpangan rata-rata data modal 40 perusahaan pada tabel berikut :
Modal
112 120
121 129
130 138
139 147
148 156
157 165
166 174
Agus
Statistika 1 - 23
frekuensi
4
5
8
12
5
4
2
Purnomo
Jawab :
Tentukan rata-rata hitungnya (X) = fX/f = 5.621/40 = 140,525
Kemudian, buat tabel penolong sbb :
Modal
112 120
121 129
130 138
139 147
148 156
157 165
166 174
X
116
125
134
143
152
161
170
frekuensi
4
5
8
12
5
4
2
40
|X - X|
24,525
15,525
6,525
2,475
11,475
20,475
29,475
f|X - X|
98,100
77,625
52.200
29,700
57,375
81,900
58,950
455,850
data berkelompok :
S2 = (X X )2 / (n 1)
S2 = f (X X )2 / (n 1) ; dimana f = n
Hasil perhitungan variansi akan menghasilkan dispersi data jauh lebih besar dibandingkan
dengan perhitungan simpangan rata-rata, sehingga variansi bukan merupakan ukuran dispersi
yang baik untuk menggambarkan penyebaran data. Kelemahannya adalah bahwa variansi
menggunakan bentuk kuadrat dalam perhitungannya, sedangkan dispersi data sesungguhnya
adalah merupakan ukuran linier. Kelebihannya variansi melibatkan selisih dari semua nilai data.
4. Standard Deviation : is the positive square root of the variance. Thus the variance and the
standard deviation are closely related. The symbol for the standard deviation of a population
is ; and for the standard deviation of a sample is S.
Rumusnya adalah :
data tidak berkelompok :
S = (X X )2 / (n 1)
data berkelompok :
Agus
Statistika 1 - 24
S =
f (X X )
/ (n 1) ; dimana f = n
Purnomo
Rumus untuk varians dan standar deviasi sering disajikan dalam bentuk lain
(yang ini sering dipakai) :
Data tidak berkelompok
Data berkelompok
Variansi
S2 = {nX2 ( X )2 } / n(n 1)
Standar
Deviasi
Selain menggunakan cara tersebut di atas, maka perhitungan variansi dan standar deviasi
juga dapatdigunakan cara koding atau trasformasi dari variabel X ke variabel U, khususnya hal
ini digunakan untuk data yang disajikan dalam bentuk tabel distribusi frekuensi. Dengan cara ini,
maka nila data X yang besar akan berubah menjadi nilai data U yang kecil, yaitu U = 0 ; 1 ; 2
; 3 ; 4 ; dst sehingga akan mempermudah perhitungan dan hasil yang diperoleh juga akan
menjadi lebih teliti dan resiko salah hitung bisa diminimalisir. Rumusnya adalah :
Variansi :
Standar Deviasi :
Purnomo
5. Quartile Deviation and Pecentile Deviation are other method to describe data dispersion.
This method is better than range method.
Their formulas are :
Qd = (Q3 - Q1 )
Quartile Deviation :
Purnomo
Agus
Statistika 1 - 27
Purnomo
BAB IV
METODE ANALISIS KORELASI
4.1 Analisis Hubungan.
Manusia adalah makhluk sosial, artinya manusia tidak dapat hidup sendiri. Dia
memerlukan hubungan dengan yang lainnya, apakah itu di rumah (dengan tetangga), di kantor
(dengan rekan sekerja), di sekolah (dengan teman sekolah), dan lain sebagainya. Dalam
melakukan hubungan ini, ada berbagai maksud atau kepentingan, namun pada dasarnya adalah
untuk memenuhi kebutuhan sosialnya.
Dalam bidang bisnispun demikian adanya, adanya suatu kejadian pasti berhubungan
dengan kejadian lainnya. Kejadian A disebabkan oleh kejadian B. Misalnya turunnya harga beras
lokal disebabkan karena impor beras yang melimpah; menurunnya penjualan disebabkan karena
biaya promosi yang kurang, menurunnya penerimaan devisa mungkin disebabkan mutu komoditi
ekspor yang kurang baik; naiknya harga produk hasil bumi mungkin disebabkan kenaikan harga
bbm dan masih banyak lagi kejadian lainnya.
Those examples above describe that there is a relation or correlation between one
phenomenon and another. It might be declared by the fluctuation of variable value. For
example, if X is a variable of price then the fluctuation of price might be declared by the
fluctuation of X value. If Y is a variable of selling then the fluctuation of selling might be
declared by the fluctuation of Y value. It means those phenomena might be declared in 2
variables relation form. It called a correlation of variable. There are 2 kinds of correlation :
linier correlation and non-linier correlation. (Contoh-contoh kejadian di atas mencoba
menggambarkan bahwa ada suatu hubungan (korelasi) antara peristiwa atau gejala yang satu
dengan peristiwa atau gejala yang lainnya. Peristiwa itu dapat dinyatakan dengan perubahan nilai
variabel. Misalnya jika X adalah variabel harga, maka naik turunnya harga dapat dinyatakan
dengan perubahan nilai X. Jika Y adalah variabel hasil penjualan, maka naik turunnya hasil
penjualan dapat dinyatakan dengan perubahan nilai Y. Artinya hubungan dua kejadian atau
peristiwa dapat dinyatakan dalam bentuk hubungan dua variabel. Jenis hubungan variabel ini
terdiri dari hubungan linier dan hubungan non-linier).
Dalam perencanaan bisnis, selain data masa lampau dan masa sekarang, juga dibutuhkan
data hasil peramalan yang menggambarkan kemampuan untuk masa yang akan datang. Misalnya
perencanaan impor beras, pemerintah memerlukan ramalan produksi beras lokal. Suatu
perusahaan dalam merencanakan produksi memerlukan ramalan hasil penjualan (kemampuan
menjual di masa mendatang). Hal ini dimaksudkan untuk mencegah terjadinya over produksi
atau under produksi.
If variable of X and Y have a correlation then the value of X variable might be used
to forecast or to estimate Y variable. In fact, the forecasting is an appraisal about the occur
of a case (value of a variable) in the future, such as production forecasting for 2 years later,
price forecasting for next month, the forcasting of citizen rate for 10 years later, etc. Jika
variabel X dan Y mempunyai hubungan , maka nilai variabel X yang sudah diketahui dapat
dipergunakan untuk menaksir atau meramalkan Y. Ramalan pada dasarnya merupakan
perkiraan/taksiran mengenai terjadinya suatu kejadian (nilai suatu variabel) untuk waktu yang
akan datang, seperti misalnya ramalan produksi 2 tahun yang akan datang, ramalan harga bulan
depan, ramalan jumlah penduduk 10 tahun ke depan dan lain sebagainya.
Variabel Y yang nilainya akan diramalkan itu disebut sebagai variabel terikat (dependent
variable) sedangkan variabel X yang nilainya digunakan untuk meramalkan nilai Y disebut
variabel bebas (independent variable) atau variabel peramal (predictor variable). Jadi analisis
korelasi memungkinkan kita untuk mengetahui terjadinya kejadian secara kualitatif ( akan terjadi
perang, akan turun hujan, akan lulus ujian, dan lain-lain) serta secara kuantitatif ( indeks harga
sembako naik 7%, penerimaan devisa turun 16%, penjualan naik 23%, dan lainnya). Cara
Agus
Statistika 1 - 28
Purnomo
meramalkan ini digunakan metode analisis regresi). Jadi jika analisis korelasi digunakan untuk
melihat adanya hubungan antara dua atau lebih kejadian, maka analisis regresi digunakan untuk
melihat signifikansi antara dua kejadian dengan peramalannya tersebut.
4.2 Diagram Pencar (Scatter Diagram).
Hubungan antara 2 variabel ada yang positif dan ada yang negatif serta tidak mempunyai
hubungan sama sekali atau kecil sekali. Hubungan X dan Y disebut positif, jika kenaikan atau
penurunan X juga diikuti oleh kenaikan atau penurunan Y. dan dikatakan mempunyai hubungan
negatif, jika jika kenaikan atau penurunan X akan diikuti oleh penurunan atau kenaikan Y.
Sedangkan jika kenaikan atau penurunan tidak diikuti oleh kenaikan dan atau penurunan Y, maka
dikatakan X dan Y tidak berkorelasi.
Untuk menganalisis hubungan tersebut digunakan alat yang disebut diagram pencar (scatter
diagram), yaitu suatu diagram yang menunjukkan ada atau tidaknya korelasi antara vriabel X dan
Y. Diagram pencar menggunakan sistem koordinat kartesius, di mana sumbu x diletakkan nilanilai variabel bebas (X) dan pada sumbu Y diletakkan nilai variabel terikat (Y). Kemudian pada
diagram tersebut ditarik sebuah garis yang membagi titik-titik koordinat, sehingga dari garis
tersebut dapat diketahui korelasi anatara kedua variabel. Tujuan menggunakan diagram pencar
adalah untuk mengetahui apakah titik-titik koordinat membentuk suatu pola tertentu.
Y
Y
KORELASI NEGATIF
KORELASI POSITIF
X
X
Y
KORELASI SEMPURNA
Explanations :
The diagram (left above) shows a trend line move form left below to
right above (increasing) through the middle of scatter dots so that X
and Y have a correlation (positive correlation). Grafik kiri atas menunjukkan
garis trend bergerak dari kiri bawah ke kanan atas (bergerak naik) melintasi tengah-tengah
diagram pencar sehignga X & Y mempunyai korelasi (korelasi positif).
The diagram (right above) shows a trend line move form left above
to right below (decreasing) through the middle of scatter dots so
that X and Y have a correlation (negative correlation). Grafik kanan atas
menunjukkan grs trend bergerak dari kiri atas ke kanan bawah (bergerak turun) melintasi
tengah-tengah diagram pencar sehingga X & Y mempunyai korelasi (korelasi negatif).
The diagram (left below) shows a trend line move parallely through
the middle of scatter dots so that Xs fluctuation does not affect to Y
value, so that X and Y have not a correlation. Grafik kiri bawah menunjukkan
garis trend bergerak sejajar sumbu X, sehingga variasi nilai X tidak berpengaruh terhadap
nilai Y, maka X dan Y tidak ada korelasi.
Agus
Statistika 1 - 29
Purnomo
Variabel Y
Penjualan
Konsumsi
Harga makanan
Pendapatan Nasional
Produksi Beras
Tekanan darah
Kejahatan ekonomi
Jumlah kelahiran
Permintaan barang
C. Koefisien Korelasi.
Kuat dan tidaknya hubungan antara X dan Y, jika hubungan X dan Y dapat dinyatakan
dengan fungsi linier (paling tidak mendekati), diukur dengan suatu nilai yang disebut Koefisien
Korelasi. Nilai koefisien korelasi ini berkisar dari 1 hingga +1. Jika r (simbol koefisien
korelasi). Secara matematis ditulis - 1 r 1; di mana :
r = -1 , artinya : kedua kejadian (variabel X dan Y) mempunyai hubungan negatif
r = +1, artinya : kedua kejadian (variabel X dan Y) mempunyai hubungan positif
r = 0 , artinya : kedua kejadian (variabel X dan Y) tidak ada hubungan.
Interpretasi dari nilai r dapat disajikan dalam tabel berikut :
r
0
(0,01 0,20)
(0,21 0,40)
(0,41 0,60)
(0,61 0,80)
(0,81 0,99)
1
Interpretasi Korelasi
Tidak ada korelasi
Sangat rendah/sangat lemah
Rendah/lemah
Agak Rendah/agak lemah
Cukup
Tinggi/kuat
Sangat tinggi/sangat kuat/sempurna
Purnomo
xy
x2 y2
atau
r =
di mana :
x = X - X dan y = Y - Y
n XY X Y
Rumus pertama di atas disebut Koefisien korelasi Pearson metode Product Moment sedangkan
rumus kedua Koefisien korelasi Pearson metode least square.
Contoh pemakaian rumus koefisien korelasi Pearson:
Diketahui X adalah biaya promosi dan Y adalah tingkat penjualan, maka dari tabel berikut ini
hitunglah koefisien korelasinya dan koefisien determinannya serta simpulkan dari perhitungan
tersebut !.
X
Y
1
2
2
4
4
5
5
7
7
8
9
10
10
12
12
14
y2
33,0625
14,0625
7,5625
0,5625
0,0625
5,0625
18,0625
xy
30,1875
15,9375
6,1875
0,9375
0,1875
6,1875
15,9375
Purnomo
12
50
6,25
Mean
14
62
7,75
xy
r =
5,75
6,25
111,5
=
x2 y2
33,0625
107,5
39,0625
117,5
35,9375
111,5
111,5
=
107,5 . 117,5
= 0,99
(10,368) (10,840)
r =
Y
2
4
5
7
8
10
12
14
62
X2
1
4
16
25
49
81
100
144
420
n XY X Y
{nX2 (X)2}
{nY2 (Y)2}
Y2
4
16
25
49
64
100
144
196
598
XY
2
8
20
35
56
90
120
168
499
8 (499) (50) (62)
{8 (420) (50)2}
{8(598) (62)2}
= 0,99
Kedua rumus memberikan hasil yang sama, namun secara teknis, metode least square lebih
mudah digunakan dibandingkan dengan metode produk momen.
2. Korelasi Rank Spearman
Koefisien korelasi rank Spearman adalah indeks atau angka yang digunakan untuk mengukur
keeratan antara 2 variabel, di mana datanya merupakan data ordinal (data bertingkat/ranking).
Simbolnya adalah (baca rho) dan rumusnya adalah :
6 d2
=
n (n2 1)
di mana :
= koefisien korelasi Spearman
d = selisih dalam ranking
n = banyaknya pasangan ranking
Agus
Statistika 1 - 32
Cara perhitungan :
Nilai dari kedua variabel diranking, dari besar ke
kecil atau sebaliknya, jika ada nilai sama maka
rankingnya diambil rata-rata.
Setiap pasang ranking dihitung selisihnya.
Selisih ranking tersebut dikuadratkan kemudian
dijumlahkan.
Purnomo
Contoh : Diketahui nilai matakuliah Manajemen dan Bisnis dari 10 mahasiswa seperti tabel di
bawah ini
Manajemen
Bisnis
82
79
75
80
85
89
70
65
77
67
60
62
63
61
66
68
80
81
89
84
Y
79
80
89
70
77
60
63
66
80
89
65
67
62
61
68
81
84
Ranking X
8
5
9
Ranking Y
6
7
10
d
2
-2
-1
d2
4
4
1
3
4
2
1
5
8
9
1
2
-1
1
-2
-1
1
1
4
1
1
4
1
1
22
4
6
1
2
3
7
10
Jumlah
Masukkan dalam rumus Spearman :
6 d2
= 1
6 (22)
=1
n (n2 1)
= 0,867
10 (102 1)
Korelasinya adalah korelasi positif dan kuat, berarti jika nilai manajemen tinggi maka nilai bisnis
juga tinggi.
3. Korelasi Rank Kendall
Korelasi Rank Kendall merupakan pengembangan dari koefisien Spearman. Simbolnya
adalah (baca tau). Koefisien ini digunakan untuk pasangan variabel atau pasangan data X dan
Y dalam hal ketidaksesuaian rank, yaitu untuk mengukur ketidakteraturan. Rumusnya adalah :
=
di
S
C
D
N
CD
=
1/2N (N 1)
1/2N (N 1)
mana :
= koefisien korelasi Kendall
= Jumlah Konkordansi dan Diskordansi
= konkordansi
= Diskordansi
= banyaknya pasangan X dan Y
Agus
Statistika 1 - 33
Cara perhitungan :
Nilai dari kedua variabel diranking, dari besar ke
kecil atau sebaliknya, jika ada nilai sama maka
rankingnya diambil rata-rata.
Tentukan nilai patokan berurut dengan menyusun salah satu dari nilai ranking tsb secara berurutan, dari pertama, kedua dan seterusnya.
Tentukan nilai konkordansi (+1) dan nilai diskordansi (-1) dari nilai ranking yang bukan patokan.
Purnomo
Tentukan nilai S dengan menjumlahkan
nilainilai konrkordansi dan diskordansi
N(N 1) - Tx
N(N 1) - Uy
Contoh : Tabel berikut ini adalah nilai statistika dan matematika dari 5 orang mahasiswa
poltekpos setelah mengikuti UTS
Nama Mahasiswa
Matakuliah
Ali (A)
Badu (B)
Cipluk (C)
Dudi (D)
Edi (E)
Matematika
9
8
7
5
3
Statistika
6
8
5
7
4
Tentukan nilai koefisien korelasi rank Kendall dan simpulkan artinya !.
Penyelesaian :
a. Susunlah ulang tabel dengan cara memberi ranking
Nama Mahasiswa
Matakuliah
Ali (A)
Badu (B) Cipluk (C)
Dudi (D)
Edi (E)
Matematika
9
8
7
5
3
Rank
1
2
3
4
5
Matematika
Statistika
6
8
5
7
4
Rank Statistika
3
1
4
2
5
b. Tentukan patokan berurut, yaitu Matematika.
c. Untuk menentukan nilai konkordansi dan diskordansi hanya dilihat satu mata kuliah saja.
Karena nilai patokan berurut sudah ditentukan yaitu nilai matematika, maka nilai
konkordansi dan diskordansi dihitung dari nilai statistika.
Dilihat dari
A
d/k
B
d/k
C
d/k
D
d/k
(A ; B)
-1
(B ; C)
+1
(C ; D)
-1
(D ; E)
+1
Kombinasi pasangan
(A ; C)
(A ; D)
+1
-1
(B ; D)
(B ; E)
+1
+1
(C ; E)
+1
-
(A ; E)
+1
-
Catatan :
(A ; B) = -1 diskordansi (nilai B < A)
(A ; C) = +1 konkordansi (nilai C > A)
Agus
Statistika 1 - 34
Purnomo
2
15
4
14
5
12
6
10
8
9
10
8
11
6
13
4
14
3
15
2
2. Dari hasil penilaian terhadap 10 distributor produk unilever untuk wilayah jawa diduga
bahwa hasil pelatihan manajemen distribusi terhadap para distributor tersebut berpengaruh
terhadap hasil penjualan produk-produk unilever. Misalkan X adalah nilai para distributor
setelah mengikuti pelatihan dan Y adalah hasil penjualan produk tahun pertama setelah
pelatihan, maka buktikan bahwa pelatihan tsb berpengaruh terhadap kinerja penjualan para
distributor tersebut dengan menggunakan data pada tabel di berikut ini !. (Gunakan Metode
Spearman).
Distributor
CV. Lima Jaya
UD. Patra
UD. Kinerja
CV. Prima
CV. Hexama
PT. Adi Putra
CV. Andika Jaya
PT. Tiga Pilar
UD. Untung Jaya
PT. Sampurna
Nilai Pelatihan
48
32
40
34
30
50
26
50
22
43
Kinerja Penjualan
(ratusan juta rupiah)
312
164
280
196
200
288
146
361
149
252
3. Tabel di bawah ini menunjukkan perbandingan indeks harga (X) dengan hasil penjualan (Y)
selama 7 tahun :
Indeks Harga
74,3
82,8
90,4
108,7
119,5
135,0
150,5
Hasil Penjualan
81,2
75,5
59,6
48,8
37,5
25,0
15,5
Hitunglah :
Agus
Statistika 1 - 35
Purnomo
BAB V
ANALISIS REGRESI LINIER
Regresi merupakan alat ukur yang digunakan untuk mengukur hubungan fungsional antara dua
kejadian atau dalam bahasa matematis adalah untuk merepresentasikan bagaimana hubungan
fungsional antara variabel yang berhubungan dalam suatu bentuk persamaan matematis.
Istilah regresi berari ramalan, perkiraan atau taksiran. Regresi pertama kali diintrodusir oleh Sir
Francis Galton pada tahun 1877, dimana berhubungan dengan penelitian tentang tinggi manusia
(yaitu hubungan antara tinggi anak dengan tinggi orang tua). Galton menemukan dalam
penelitiannya, bahwa anak yang tinggi dari orang tua yang tinggi cenderung meningkat atau
menurun dari berat rata-rata populasi. Garis yang menunjukkan hubungan itu, atau juga seperti
garis lurus yang terdapat pada diagram pencar (scatter diagram) dikenal dengan garis regresi.
Regression Analysis lebih akurat dalam melakukan correlation analysis karena pada analisa itu,
kesulitan dalam menunjukkan slope/kemiringan (tingkat perubahan suatu variabel terhadap
variabel lainnya dapat ditentukan). Lebih jelasnya, bahwa peramalan atau perkiraan nilai variabel
terikat (dependent variable) pada nilai variabel bebas (independent Variable) dengan
menggunakan regression analysis akan lebih akurat.
Regresi linear adalah regresi yang independent variable (variabel x) berpangkat paling tinggi
satu. Untuk simple regression linear, persamaan garis regresinya dapat ditulis dalam dua bentuk,
yaitu sebagai berikut.
5.1 Persamaan Regresi Linear dari Y terhadap X
Persamaan regresi linear dari y terhadap x dapat ditulis
Y= a + bX
Keterangan :
Y = variabel terikat
X = variabel bebas
a = intersep
b = koefisien regresi (slope)
Persamaan regresi di atas dapat pula ditulis dalam bentuk
Y = ( xy / x2) x
Persamaan-persamaan garis regresi linear tersebut adalah identik jika semua titik pada diagram
pencarnya berada pada sebuah garis. Artinya terdapat korelasi yang sempurna antara X dan Y.
Sekali lagi diingat, bahwa persamaan yang digunakan untuk mendapatkan garis regresi pada data
Agus
Statistika 1 - 36
Purnomo
diagram pencar (scatter diagram) disebut persamaan regresi, persamaan perkiraan atau
persamaan ramalan.
Persamaan garis regresi haruslah dapat dinyatakan oleh suatu persamaan yang dapat mewakili
sebaran data yang ada. Berarti dalam hal ini diperlukan suatu kriteria bahwa persamaan regresi
yang paling baik adalah regresi yang mempunyai total kuadrat selisih atau atau total kuadrat eror
(Y ) yang paling minimum. Karenanya, metode kuadrat terkecil (method of least
squares) sekali lagi akan digunakan untuk menempatkan garis pada data yang diamati, sehingga
bentuk persamaan regresi adalah :
= a + b X.
Keterangan :
a = Y pintasan, (nilai bila X= 0)
b = kemiringan garis regresi (kenaikan atau penurunan untuk setiap perubahan X) atau
koefisien regresi yang mengukur besarnya pengaruh X terhadap Y kalau X naik satu
unit.
X = nilai tertentu dari variabel bebas
= Nilai yang diukur/dihitung pada variabel tidak bebas
Dengan metode kuadrat terkecil ini, maka persamaan regresi linier akan mempunyai total
kuadrat eror minimum jika koefisien regresi a dan b dihitung dengn rumus :
a = (Y.X2 X. XY) / n. X2 (X)2
b = (n. XY X. Y) / n. X2 (X)2
b = (n. XY X. Y) / n. X2 (X)2
atau
a = (Y/n) b(X/n )
atau
S.x = (2 aY bXY) / n
Contoh :
Tabel berikut ini menunjukkan tinggi badanb (inch) dan berat badan (lb) dari 12 mahasiswa
Tinggi
badan
(X)
70 63 72 60
Berat badan (Y) 155 150 180 135
66 70
156 168
74 65
178 160
62 67 65
132 145 139
68
152
Purnomo
Penyelesaian :
Buat tabel perhitungan sebagai berikut :
X
Y
X2
Y2
70
155
4,900
24,025
63
150
3,969
22,500
72
180
5,184
32,400
60
135
3,600
18,225
66
156
4,356
24,336
70
168
4,900
28,224
74
178
5,476
31,684
65
160
4,225
25,600
62
132
3,844
17,424
67
145
4,489
21,025
65
139
4,225
19,321
68
152
4,624
23,104
= 802 = 1,850 = 53,792 = 287,868
XY
10,850
9,450
12,960
8,100
10,296
11,760
13,172
10,400
8,184
9,715
9,035
10,336
= 124,258
Coba Anda Masukkan angka-angka tsb ke dalam rumus-rumus yang ada sehingga didapat harga
a dan b !
Agus
Statistika 1 - 38
Purnomo
B A B VI
PR O B AB I LI TY ( PE LUAN G )
6.1 RUANG SAMPEL (SAMPLE SPACE)
Statistikawan biasanya berurusan dengan cacah atau pengukuran yang berbentuk bilangan.
Bilangan seperti itu biasanya disebut suatu pengamatan (observation).
Definisi :
Informasi yang dicatat dan dikumpulkan dalam bentuk aslinya, baik dalam bentuk hitungan
maupun pengukuran, disebut data mentah.
Dalam statistika digunakan istilah percobaan (experiment) untuk menyatakan tiap proses yang
menghasilkan data mentah. Suatu contoh yang sederhana dari suatu percobaan dalam statistika
berupa lantunan suatu mata uang logam. Dalam percobaan ini hanya ada dua data yang mungkin,
muka (head) atau belakang (tail).
Definisi :
Gugus semua hasil yang mungkin dari suatu percobaan statistika disebut Ruang Sampel
(Sample Space) dan dinyatakan dengan lambang S.
Tiap hasil dalam ruang sampel disebut unsur (elemen) atau anggota ruang sampel tersebut atau
dengan singkat disebut titik sampel (sample point). Bila ruang sample mempunyai unsur yang
hingga banyaknya (finite number), maka anggotanya dapat didaftar dengan menuliskan diantara
dua akolade, masing-masing unsur dipisah oleh koma.
Contoh 1:
Perhatikan suatu percobaan melantunkan sebuah dadu. Bila yang diselidiki ialah nomor yang
muncul di muka sebelah atas, maka ruang sampelnya :
S1 = {1,2,3,4,5,6}
Bila yang ingin diselidiki, apakah nomor genap atau ganjil yang muncul, maka ruang
sampelnya :
S2 = {ganjil,genap}
Contoh 2:
Ruang sampel yang besar atau yang anggotanya takhingga (infinite) banyaknya lebih mudah
ditulis dengan suatu pernyataan atau aturan. Misalnya S menyatakan kumpulan semua titik (x,y)
pada batas atau bagian dalam suatu lingkaran berjari-jari 2, dengan pusat di titik asal, maka dapat
ditulis :
S = { (x,y) | x2 + y2 4}
Garis tegak dibaca bila dan jika.
6.2 KEJADIAN (EVENT)
Dalam tiap percobaan mungkin yang ingin diketahui munculnya kejadian tertentu dan
bukan hasil unsur tertentu dalam ruang sampel.
Misalnya ingin diketahui kejadian A bahwa hasil lantuanan suatu dadu dapat dibagi 3, maka A =
{ 3,6} dari ruang sampel S1 contoh 1.
Definisi :
Kejadian (event) adalah himpunan bagian (subset) dari ruang sampel
Contoh 3 :
Agus
Statistika 1 - 39
Purnomo
A B = { x | x A dan x B }
berarti anggota atau termasuk dalam.
Contoh 5 :
Misalkan A = {1,2,3,4,5} dan B= { 2,4,6,8 };
maka A B = {2,4}
Definisi :
Dua kejadian A dan B saling terpisah bila A B =
S
Contoh 6 :
Misalkan A = {a,e,i,o,u} dan B = {r,s,t} ;
maka A B = . Yaitu A dan B tidak mempunyai
unsur persekutuan.
Definisi :
Gabungan dua kejadian A dan B, dinyatakan dengan lambang A B, ialah kejadian yang
mengandung semua unsur yang termasuk A atau B atau keduanya.
Agus
Statistika 1 - 40
Purnomo
A B = { x | x A dan x B }
Contoh 7 :
A = { x | 3 < x < 9 } dan B = { y | 5 < y < 12 };
maka A B = { z | 3 < z < 12 }
Definisi :
Komplemen suatu kejadian A terhadap S, ialah himpunan semua unsur
termasuk A, dinyatakan dengan lambang A.
S
S yang tidak
A = { x | x S dan x A }
Contoh 8 :
Misalkan ruang sampel
S={buku,pulpen,pinsil, penggaris,penghapus,spidol} dan A=
{buku,pulpen}
Maka A = {pinsil,penggaris,penghapus,spidol}
Purnomo
n r
n!
( n r )!
Teorema :
Banyaknya permutasi yang berlainan dari n benda bila n1 diantaranya berjenis pertama, n2
berjenis kedua, ., nk berjenis ke k adalah :
n!
n 1 ! n 2 !........n k !
Teorema :
Banyaknya cara menyekat n benda dalam r sel, masing-masing bersisi n1 elemen dalam sel
pertama, n2 dalam sel kedua, dst. adalah :
(
n
n 1 , n 2 ,..., n 1
n!
n 1 ! n 2 !........n k !
Teorema :
Jumlah kombinasi dari n benda yang berlainan bila diambil sebanyak r adalah
n
(r )
n!
r! ( n r )!
Purnomo
Teori probabilitas merupakan cabang ilmu matematika terapan (applied mathemattics) dan yang
menelaah perilaku faktor untung-untungan (chance factor). Faktor untung-untungan tersebut
umumnya dihubungkan dengan pengertian tentang peluang atau kemungkinan (probability or
likelihood). Sebab, jika hasilnya tidak pasti karena hasil tersebut merupakan akibat faktor
untung-untungan, maka kita hanya dapat menyatakan peluang atau tingkat kepastian (degree of
certainty) timbulnya suatu kejadian. Pcluang atau tingkat kepastian sedemikian itu tidak dapat
diduga dengan pasti tetapi dapat dianalisa atas dasar logika ilmiah.
Teori probabilitas sebetulnya memberikan cara pengukuran kuantitatif tentang peluang atau
tingkat kepastian tentang terjadinya suatu peristiwa. Pada hakekatnya, dasar perumusan tentang
probabilitas atau penentuan besaran yang dapat mengukur tingkat kepastian timbulnya suatu
peristiwa dapat dibedakan dalam 3 cara.
a. Perumusan Klasik
Probabilitas diinterprestasikan atas dasar pengertian tentang rangkaian peristiwa yang bersifat
saling lepas dan yang memiliki kesempatan yang sama untuk terwujud (mutually exclusive and
equally likely sets of events). Tetapi apakah patokan mengenai kesempatan yang sama (equally
likely) bagi timbulnya serangkaian kejadian? Dari Ars Conjectandi, dapat disimpulkan bahwa 2
kejadian yang mungkin timbul dianggap memiliki kesempatan yang sama untuk timbul jika
sesudah mempertimbangkan segala bukti yang relevan, timbulnya salah satu kejadian tersebut
tidak dapat lebih diharapkan dari pada yang lain.
Sebagai penjelasan yang sederhana, sebuah contoh tentang suatu percobaan pclemparan sebutir
dadu yang memiliki sisi enarn. Apakah kesempatan terwujudnya tiap mata X = 1, 2, ... , 6 itu
sama? Jika dadu tersebut setimbang (misalnya berbentuk kubus umum, bahannya serba sama
(homogen) dan sebagainya), maka atas dasar perumusan di atas, tiap mata dadu akan memiliki
kesempatan untuk timbul yang sama sebesar 1/6 dari hasil keseluruhan. Hal yang sama akan
berlaku bagi hasil pelemparan sekeping mata uang logam katakanlah 50 rupiah. Jika mata uang
logam tersebut setimbang, maka sisi 1 (Head) dan sisi 0 (Tail) mata uang yang bersangkutan
akan memiliki kesempatan untuk timbul yang sama sebesar 1/2.
Definisi :
Pada kondisi-kondisi yang diketahui, jika terdapat sejumlah n kejadian yang mungkin
timbul dan jika kejadian tersebut lengkap terbatas jumlahnya (exhaustive), saling lepas dan
memiliki kesempatan yang sama untuk timbul, maka jika sejumlah m dari kejadian di atas
merupakan peristiwa E, probabilitas peristiwa E tersebut dapat dirumuskan sebagai suatu
rasio m/n atau secara umum dinyatakan sebagai :
P(E) = m/n
Contoh 12 :
Dalam soal percobaan pclemparan sebutir dadu, kejadian yang mungkin timbul ialah mata dadu
X = 1, 2,..., 6. Jika E merupakan peristiwa munculnya mata dadu 3 dan karena mata dadu 3
mcrupakan satu dari ke enam kemungkinan kejadian, maka probabilita peristiwa menjadi P(E) =
m/n = 1/6.
b. Perumusan atas dasar konsep Frekuensi Relatif
Perumusan secara klasik memiliki beberapa keterbatasan, karena dalam kenyataan banyak
peristiwa atau kejadian sukar sekali diteliti apakah rangkaian peristiwa tersebut memiliki
kesempatan yang sama untuk timbul. Dalam hal demikian, perumusan probabilitas atas dasar
peristiwa frekuensi relatif akan lebih bermanfaat.
Definisi :
Jika m merupakan jumlah perwujudan kejadian yang khusus, katakanlah peristiwa E dalam
serangkaian n percobaan dalam jumlah yang tidak terhingga, maka probabilitas peristiwa E
Agus
Statistika 1 - 43
Purnomo
X
m/n
6
164/1000
Frekuensi relatif tiap X mungkin berbeda. Tetapi jelas sekali frekuensi f tiap X berkisar sekitar
1/6. Jika percobaan random di atas dilakukan berkali-kali dalam jumlah besar sekali, katakanlah
dalam jumlah tidak terhingga, maka m/n dari X akan memiliki tendensi untuk berkonvergensi ke
suatu nilai konstanta yang kita anggap sebagai probabilita E atau yaitu sebesar 1/6.
c. Perumusan atas dasar Subyektivitas
Tidak semua kejadian dapat timbul secara berulang-ulang seperti hasil serangkaian percobaan
atau pemilihan sampel. Ada kalanya suatu kejadian atau peristiwa hanya timbul sekali saja.
Misalnya, berapakah probabilitas menteri X diganti dengan Y ? Berapakah probabilitas manajer
perusahaan X mau kompromi dengan serikat pekerja perusahaannya yang menuntut kenaikan
gaji sebesar 20 persen dari gaji asal? Probabilita yang dirumuskan sebagai pengukuran
keyakinan pribadi terhadap suatu hipotesis yang tertentu atau terjadinya suatu peristiwa tertentu,
dinarnakan probabilita subyektif (subjective probability).
Misalnya, jika peristiwa A dan B terjadi dalam suatu kondisi yang sama jika kita dua kali lebih
yakin akan terjadinya peristiwa A jika dibanding dengan terjadinya peristiwa B, maka
probabilitas A atau p(A) seharusnya menjadi 2/3 dan p(B) menjadi sebesar 1/3.
Dari ketiga perumusan di atas, kita dapat menarik suatu kesan bahwa probabilitas dirumuskan
sebagai rasio atau proporsi.
6.6 AZAS-AZAS MENGHITUNG PROBABILITAS PERISTIWA
Definisi : Peristiwa yang saling lepas (mutually exclusive)
Dua peristiwa merupakan peristiwa yang saling lepas bila kedua peristiwa tersebut tidak dapat
terjadi pada waktu yang bersamaan. Secara matematis, himpunan A dan B dikatakan
saling lepas atau terpisah (disjoint) bila dan hanya bila mereka tidak memiliki unsur yang
sama dan A B =
A1
A2
A3
Agus
Statistika 1 - 44
P (A B) = P(A) + P(B)
AB=
Purnomo
A4
P(A B) = P() = 0
A5
Peristiwa yang saling lepas
Contoh 14 :
Bila sebutir dadu dilempar sekali, berapakan probabilitas timbulnya mata dadu 1 atau mata dadu
5?
A = peristiwa timbulnya mata dadu 1, B = peristiwa timbulnya mata dadu 5
P (A B) = P(A) + P(B) = 1/6 + 1/6 = 1/3
Teorema :
Bila terdapat beberapa peristiwa yang saling lepas A1, A2, , Am dalam sebuah ruang sampel,
maka :
P (A1A2 Am) = P (A1) + P(A2) + + P(Am)
Definisi :
Dua persitiwa dikatakan tidak saling lepas bila kedua peristiwa tersebut tidak terpisah (joint)
A B
Teorema :
Peristiwa A dan B merupakan gabungan (union)
dan tidak saling lepas, maka :
P (A B) = P(A) + P(B) P(A B)
AB
AC ABC
B
BC
C
Peristiwa A, B dan C yang tidak Saling Lepas
P(ABCD) = P(A) + P(B) + P(C) + P(D) P(AB) P(AC) P(AD) P(BC)
P(BD) P(CD) + P(ABC) + P(ABD) + P(ACD) +
P(BCD) P(ABCD)
S=U
Agus
Statistika 1 - 45
A1
A2
A5
A4
A3
Soal-soal :
1. Tiga buah koin dilantunkan sekaligus, berapa probabilitas mendapatkan :
a. Dua H satu T?
b. Dua T satu H?
c. Tidak satupun T?
2. Kantong A berisi 5 bola Merah dan 4 bola Putih, sedangkan Kantong B berisi 6 bola Merah
dan 3 bola Hitam. Tanpa melihat 1 buah bola diambil secara random dari Kantong A,
kemudian dimasukkan ke Kantong B. Selanjutnya 1 buah bola diambil secara random dari
Kantong B. Hitunglah probabilitas :
a.
Di Kantong A mendapatkan bola Putih dan di Kantong B mendapatkan bola Hitam!
b.
Di kedua kantong mendapatkan bola yang berwarna sama!
3. Jika kita melemparkan dua buah dadu, ditanyakan :
a. Probabilitas jumlah angka yang dimunculkan oleh kedua buah dadu itu = 8 ?
b. Probabilitas jumlah angka yang dimunculkan, antara 7 dan 11 ?
c. Probabilitas angka yang dimunculkan oleh dadu yang kedua lebih besar dari dadu yang
pertama ?
d. Probabilitas sedikitnya sebuah dadu memunculkan angka = 6 ?
e. Probabilitas kedua dadu memunculkan angka 5 ?
f. Probabilitas setidaknya sebuah dadu memunculkan angka 5 ?
g. Probabilitas tidak sebuah dadupun memunculkan angka > 4 ?
h. Probabilitas kedua memunculkan angka genap ?
i. Probabilitas paling tidak sebuah dadu memunculkan angka ganjil ?
4. Dua orang A dan B berjanji akan bertemu di suatu tempat antara jam 07.00 08.00, dengan
ketentuan bahwa yang datang terlebih dahulu harus menunggu selama 10 menit. Berpa
probabilitas A dan B akan bertemu ?
5. C dan D berjanji ingin bertemu di suatu tempat dengan ketentuan yang datang terlebih
dahulu harus menunggu yang lainnya selama 10 menit. C memastikan bahwa dia akan berada
di tempat itu sekitar jam 13.00 14.00. D mengatakan akan berada disitu sekitar jam 13.30
14.00. Berpa probabilitas A dan B bakal bertemu ?
6. Tiap mahasiswa baru harus mengambil matakuliah fisika, kimia, dan matematika. Bila
seorang mahasiswa dapat memilih satu dari 6 kuliah fisika, satu dari 4 kuliah kimia, dan satu
dari 4 kuliah matematika, berapa banyak cara dia dapat menyusun programnya?
7. Suatu perusahaan perumahan menawarkan rumah dalam 4 pilihan model, 3 macam sistem
pendingin, dengan atau tanpa garasi, dan dengan atau tanpa beranda. Berapa macam pilihan
yang berbeda tersedia bagi seorang pembeli?
8. Dalam penelitian bahan bakar yang lebih murah, masing-masing dari ke 3 mobil balap diuji
menggunakan 5 jenis bensin yang berlainan pada 7 tempat percobaan di daerah yang
berlainan. Bila 2 pengemudi digunakan dalam penelitian tersebut, dan uji coba dikerjakan
sekali pada setiap persyaratan, berapa banyak uji coba yang diperlukan?
Agus
Statistika 1 - 46
Purnomo
9. Sembilan orang pergi ke gunung dengan tiga mobil, masing-masing dapat membawa 2, 4 dan
5 penumpang. Berapa carakah dapat dibuat untuk membawa kesembilan orang tersebut ke
gunung?
10. Suatu kotak berisi 500 amplop, 75 diantaranya berisi uang Rp 100, 150 berisi Rp 25, dan 275
berisi . Tuliskanlah Rp 10. Sebuah amplop dijual seharga Rp 25 ruang sampel untuk ketiga
macam jumlah uang dan berilah peluang pada tiap titik sampel, kemudian hitunglah peluang
bahwa amplop pertama berisi uang kurang dari Rp 100.
9. Suatu dadu dibuat sedemikian rupa schingga angka 1 atau 2 muncul dua kali lebih sering
daripada 5, angka 1 atau 2 yang muncul tigakali lebih sering daripada 3, 4, atau 6. Bila dadu
digulirkan sekali, cari peluang bahwa yang muncul :
a. angka genap;
b. angka yang merupakan kuadrat murni;
c. angka yang lebih besar dari 4.
10. Peluang suatu lndustri akan membangun pabriknya di Bekasi 0,7, peluang membangun
pabriknya di Bandung 0,4, dan peluang membangun di Bekasi atau di Bandung atau keduaduanya 0,8. Berapa peluang pabrik itu dibangun :
a. di kedua kota?
b. tidak di salah satupun dari keduanya?
Agus
Statistika 1 - 47
Purnomo
PROBABILITAS BERSYARAT
Probabilitas terjadinya suatu kejadian B bila diketahui bahwa kejadian A telah
terjadi disebut probabilitas bersyarat dan dinyatakan dengan P(B\A). Lambang
P(B\A) dibaca probabilitas B, bila A diketahui.
Perhatikan ilustrasi berikut ini :
S = 500
A
20
465
B
10 5
= 30
N(A)
P(A)
= 30/500
N(B)
= 15
P(B)
= 15/500 =
0,03
Nilai probabilitas tergantung dari sample space-nya
N ( AB)
P(B\A)
= 10
= 10\30
P ( AB )
=
1/3
= 10/500
0,06
0,02
20
D I
10
N(D I)
N(I)
N(D I) / N(S) P(D I)
P(D \ I)
P(I)
N(I) / N(S)
P(D \ I)
Agus
Statistika 1 - 48
Purnomo
Definisi :
Apabila A dan B sembarangan event di dalam S dan P(B) 0 , maka
probabilitas bersyarat A bila B diketahui (probabilitas bersyarat A terhadap
kondisi B):
P(A B)
P(A \ B)
P(B)
Teorema :
Teorema :
0,95
0,80
0,65
0,60
0,30
0,10
Agus
Statistika 1 - 49
Purnomo
A B1
A A B3
A B2
B
=
A [B1 B2 B3]
=(A B1) (A B2) (A B3) dan :
P (A B1) + P (A B2) + P (A B3)
=
0,6 ;
P (B2)
=
0,3
P(A) =
P (B1)
;
P (B3)
=
0,10
P (A\B1)
=
0,95 ;
P (A\B2)
=
0,80 ;P (A\B3) =
0,65
A
= Travo yang tidak berfungsi dengan baik
P ( A \B1) =
0,05 ;
P ( A \B2) =
0,80 ;
P ( A \B3) =
0,35
P(A) =
P (A B1) + P (A B2) + P (A B3)
=
P (B1) . P (A\B1) + P (B2) . P (A\B2) + P (B3) . P (A\B3)
=
(0,60) . (0,95) + (0,30) . (0,80) + (0,10) . (0,05)
=
0,875
Teorema :
n
P(A) P(Bi) P(A \ Bi)
i 1
P(B
P(B
B1
P(A\B
) B2
P(A\B
Bn
P(A\Bn)
A
A
P(Bn
)
Berapa probabilitas sebuah travo yang berfungsi dengan baik berasal dari B3 ?
Agus
Statistika 1 - 50
Purnomo
0,074
(0,60) (0,95) + (0,30) (0,80) + (0,10) (0,65)
P(B3 / A)
P(B2 / A)
P(A B2)
0,06
0,125
P(A)
Teorema :
r = 1, 2, ... , n
B1
A
B2
AB1
B3
AB2
AB3
0,24
A B2
0,065
A B3
0,06
0,035
0,
57
A B1
03
0,60
0,
0,30
0,10
0,875
0,125
1,000
Contoh soal:
Berdasarkan data masa lalu seorang supervisor dari sebuah perusahaan elektronik
mengetahui bahwa program training pada saat diterjunkan dilapangan 82 %
diantaranya akan memenuhi target produksi, sedangkan para pegawai baru yang
tidak mengikuti program training pada saat diterjunkan dilapangan hanya 33 %
yang memenuhi target produksi jika 80% pegwaia baru mengikuti program
training maka:
a) Berapa probabilitas seorang pegawai baru pada saat diterjunkan dilapangan
Agus
Statistika 1 - 51
Purnomo
0,1440
0,0660
0,1340
7
0,6
\
P(A
0
P(A ,33
\B
A
)
0,20
2
8
0,1
P(B
\
P(A
0,80
P(B
0,6560
0
P(A ,82
\B
B
)
a)
b)
P (A)
=
0,6560 + 0,0660 =
0,7220
P (AB1)
=
0,6560
c) P (AB2)
=
0,0660
Soal-soal :
1. Seorang pegawai mempunyai dua mobil, satu sedan & satu lagi Toyota Kijang.
Untuk pergi bekerja dia menggunakan sedan 75 % & Kijang 25 %. Bila dia
menggunakan sedan biasanya dia tiba kembali di rumah pukul 17.30 sebanyak
75 % (75 dari 100 kali) sedangkan bila menggunakan Kijang dia tiba pukul
17.30 kira-kira 60 %. Bila suatu hari dia tiba di rumah pukul 17.30, berapakah
probabilitas dia memakai sedan ?
2. Suatu serum kejujuran yang diberikan kepada tertuduh diketahui 90 %
terandalkan bila orang tersebut bersalah, dan 99 % terandalkan bila ia tidak
bersalah. Dengan kata lain, 10 % dari yang bersalah diketemukan tidak bersalah
oleh serum dan 1 % dari yang tidak bersalah ditemukan bersalah. Bila si
tertuduh dipilih dari sekelompok tertuduh yang hanya 5 % yang pernah
melakukan kejahatan dan serum menyatakan bahwa dia bersalah, berpakah
probabilitas orang itu tidak bersalah ?
3. Polisi merencanakan memantau batas kecepatan dengan menggunakan
perangkap radar di 4 tempat yang berlainan di suatu kota. Radar di setiap
tempat T1, T2, T3, & T4 di pasang 40 %, 30 %, 20 %, & 10 % dari waktu sehari,
bila seseorang yang ngebut ke kantor berpeluang masing-masing 0.2, 0.1, 0.5,
Agus
Statistika 1 - 52
Purnomo
dan 0.2 melalui tiap tempat, (a) berapa probabilitas dia akan kena tilang?
(b)berapa probabilitas dia melewati perangkap radar di tempat T2?
4. Dari suatu daerah diketahui berdasarkan pengalaman masa lalu bahwa
probabilitas memilih seorang dewasa di atas 40 tahun yang kena kanker 0.02.
Bila probabilitas seorang dokter dengan tepat mendiagnosa seseorang yang
kena kanker sebagai terserang kanker 0.78 dan probabilitas keliru mendiagnosa
seseorang yang tdk. kena kanker sebagai terserang kanker 0.06
(a) Berapa probabilitas seseorang didiagnosa sbg. terserang kanker ?
(b) Berapa probabilitas seseorang yang didiagnosa terserang kanker memang
kena kanker ?
EKSPEKTASI MATEMATIK VARIABEL RANDOM DISKRIT
Ekspektasi (harapan) dari suatu variabel random dilakukan untuk memperoleh
suatu pengukuran pusat dari distribusi probabilitas.
Definisi :
Nilai Ekspektasi, E(X), dari suatu variabel random X, didefenisikan :
E(X) x P x( x )
x
x E(X) x P x(x)
x
0.4
0
Agus
Statistika 1 - 53
x
Purnomo
Contoh 2 :
Misalkan X suatu variabel random dengan distribusi probabilitas sbb :
x
0
1
2
3
PX(x)
1/3
1/2
0
1/6
Hitunglah ekspektasi : Y = ( X 1 )2
Jawab :
3
E [( X 1 )2] = ( X 1)
Px( X )
X 0
Contoh 3 :
Dari Contoh 1 diperoleh X = 0.21. Untuk memperoleh variansi, maka pertama
dicari dahulu :
E (X2) =
x2 PX(x) = (0)2 (0.8) + (1)2 (0.17) + (2)2 (0.02) = 0.25
x
Variansinya :
x2 = E (X2) - x2 = 0.25 (0.21)2 = 0.2059
Standar deviasi :
X = x2 = 2059 = 0.4538
Agus
Statistika 1 - 54
Purnomo
Teorema :
Misalkan X variabel random dengan mean X dan variansi x2 , dan misalkan
a dan b merupakan konstanta. Didefenisikan variabel random Z = a + b X .
Maka mean dan variansi dari Z adalah :
Z = E (a + b X ) = a + b x
2Z = Var (a + b X ) = b2 x2
dan :
Z = b
X
standar deviasi Z :
Contoh 4 :
Sebuah kontraktor tertarik pada ongkos total suatu proyek yang akan dikerjakan.
Diestimasi ongkos material $ 25,000 dan ongkos pekerja $ 900 per hari. Jika
proyek dikerjakan selama X hari, total ongkos pekerja adalah 900 X dollar dan
total ongkos proyek ($) akan menjadi : C = 25,000 + 900 X
Perkiraan (estimasi) kontraktor tentang probabilitas waktu penyelesaian proyek
Waktu penyelesaian
X (hari)
10
11
12
13
14
Probabilitas
0.1
0.3
0.3
0.2
0.1
Hitunglah Mean & Variansi waktu penyelesaian X !
x E(X) x P x(x)
x
= E [( X - X)2] =
( x - X)2 PX(x)
x
= (10-11.9)2 (0.1) + (11-11.9)2 (0.3) + . + (14-11.9)2 (0.1) = 1.29
Mean dan Variansi ongkos total C adalah :
C = E(25,000 + 900 X) = 25,000 + 900 X
= 25,000 + 900 (11.9) = $ 35,710
2
C = Var (25,000 + 900 X) = (900)2 x2
= 810,000 (1.29) = 1,044,900
standar deviasinya :
C = C2 = $ 1,022.20
x2
Soal-soal :
1. Dalam suatu permainan seseorang mendapat Rp. 5 bila muncul semua muka
atau semua belakang jika tiga uang logam dilantunkan dan membayar Rp. 3 bila
muncul muka satu atau dua, berapakah harapan kemenangannya ?
2. Sebuah distribusi akan menerima keuntungan $20 /unit jika produk yang
dikirim baik $12 /unit jika ada produk yang rusak. dari data masa lalu diperoleh
bahwa 80% barang yang dikirim berada dalam keadaan baik. Berapa ekspektasi
Agus
Statistika 1 - 55
Purnomo
4. Suatu pengiriman pesawat televisi berisi dua yang rusak. Sebuah hotel membeli
tiga pesawat secara random (acak) dari kelompok tadi. Bila X menyatakan
banyaknya pesawat yang rusak yang dibeli hotel tersebut, hitunglah nilai
ekspektasi variabel random X.
5. Dengan membeli sejenis saham tertentu seseorang dapat memperoleh
keuntungan setahun sebesar Rp. 3000,- dengan probabilitas 0.3 atau rugi
Rp.1000,- dengan probabilitas 0.7. Berapa ekspektasi keuntungannya ?
6. Seorang pembalap ingin mengasuransikan mobilnya selama musim balapan
mendatang sebesar $ 10,000. Perusahaan asuransi mengestimasi terjadinya
kerugian total $ 10,000 dengan probabilitas 0.002, kerugian 50 % dengan
probabilitas 0.01, kerugian 25 % dengan probabilitas 0.1. Jika kerugian
lainnya diabaikan, berapa besar premi yang seharusnya ditagih oleh perusahaan
asuransi tiap musim balapan agar mendapat keuntungan $100 ?
7. Seorang manager pabrik mempertimbangkan untuk menggantian mesin
tempanya. Dari data masa lalu menunjukkan distribusi probabilitas untuk
jumlah breakdown (keruskan) mesin ini dalam seminggu :
Jumlah Kerusakan
0
1
2
3
4
Probabilitas
0.10
0.26
0.42
0.16
0.06
a. Berapa mean & standar deviasi jumlah kerusakan ?
b. Jika estimasi biaya setiap kerusakan $ 1,500 berapa mean & standar deviasi
biaya kerusakan mingguan dari mesin ini ?
8. Anak panah diarahkan pada lingkaran yang beradius 8 inchi. Jika mengenai
pusat sampai garis lingkaran berjari-jari 1 inchi, menang $ 10. Jika mengenai
daerah antara 1 dan 3 inchi dari pusat, menang $ 5. Jika tidak mengenai salah
satu daerah di atas, maka membayar $ 4. Berapa nilai ekspektasi
kemenangannya?
EKSPEKTASI MATEMATIK VARIABEL RANDOM KONTINU
Agus
Statistika 1 - 56
Purnomo
fX(x) dx
Jika g(x) merupakan fungsi lain dari variabel random kontinyu X, maka
ekspektasi dari fungsi ini merupakan rata-rata nilai dari fungsi dalam
pengulangan percobaan independent dari jumlah percobaan yang sangat besar.
Ekspektasinya adalah :
E[g(X)] =
g(x) fX(x) dx
Contoh 1:
Misalkan X variabel acak yang menyatakan umur dalam jam sejenis bola lampu.
Fungsi padat peluangnya :
2000
f(x)
;
x > 100
x3
= 0
untuk x lainnya
Berapa ekspektasi umur bola lampu tersebut ?
20.000
Jawab:
E(X) x
dx
3
x
100
x 20.000 dx
100 x2
= 200
Jadi bola lampu tersebut dapat diharapkan berumur 200 jam.
Contoh 2 :
Misalkan suatu variabel random dengan fungsi padat :
f(x) = 1/3 x2 ; -1 < x < 2
= 0
; untuk x lainnya
Hitunglah nilai ekspektasi g(x) = 2x - 1
Jawab :
E(2x-1) =
1/3 (2x-1) x2 dx
= 1/3
( 2x3 x2 ) dx
= 3/2
Definisi :
Misalkan X merupakan variabel random kontinyu :
(i) Mean dari X ; X ; merupakan ekspektasi nilai X :
X = E(X)
(ii) Variansi dari X ; x2 ; merupakan ekspektasi dari penyimpangan kuadrat,
( X - X )2 :
x2 = E[ ( X - X )2 ]
atau
Agus
Statistika 1 - 57
Purnomo
= E(X2) - x2
(iii) Standar deviasi dari X, X ;
X = x2
x2
X X
X
Contoh 3:
Seorang pemilik rumah ingin mengestimasi dengan menggunakan temperatur dari
tagihan rekening listrik terhadap penggunaan AC pada bulan Juni. Persamaan
tagihan rekening listriknya ($) : Y = 290 - 5 T
Dengan T merupakan rata-rata temperatur ( derajat Celcius) bulan Juni. Jika ratarata temperatur pada bulan Juni bisa dinyatakan sebagai variabel random dengan
mean 32 OC dan standar deviasi 4 OC, berapa mean & standar deviasi tagihan
rekening listrik pemilik rumah tersebut pada bulan Juni ?
Jawab :
Variabel random T mempunyai mean dan standar deviasi : T = 32 dan T = 4
Ekspektasi mean tagihan listrik adalah :
Y = 250 - 5 T
= 290 5 (32) = $ 130
Ekspektasi standar deviasi tagihan listrik : Y = -5 T = (5) (4) = $ 20
Soal-soal :
1. Fungsi padat variabel random kontinu X, jumlah jam, dalam satuan 100 jam,
mesin pengisap debu digunakan setahun oleh keluarga berbetuk :
x
0<x<1
f(x) =
2x
1 x<2
0
untuk x yang lainnya
Carilah rata-rata jumlah jam setahun keluarga tadi menggunakan mesin !
2. Misalkan X menyatakan hasil yang muncul bila suatu dadu yang setangkup
dilantunkan. Hitunglah :
Agus
Statistika 1 - 58
Purnomo
Agus
Statistika 1 - 59
Purnomo
BAB VII
DISTRIBUSI PROBABILITAS DISKRET
Sering lebih mudah bila semua peluang suatu variabel random X dinyatakan dalam suatu rumus.
Rumus seperti itu tentunya merupakan fungsi nilai numerik x yang akan dinyatakan dengan f(x),
g(x), r(x), dst. Jadi ditulis f(x) = P(X = x); yaitu f(3) = P(X = 3). Himpunan pasang terurut
(x,f(x)) disebut fungsi peluang (probabilitas) atau distribusi probabilitas variabel random diskret
X.
Definisi :
2. f ( x ) 1
x
3. P(X = x) = f(x)
Contoh :
Hitunglah distribusi probabilitas banyaknya head yang muncul bila suatu mata uang yang
setangkup dilantunkan 2 kali.!
P(X = 0)
P(X = 1)
P(X = 2)
HH
HT
TH
TT
=
=
=
P(TT)
P(HTTH)
P(HH)
f(x)
1/4
1/2
1/4
Agus
Statistika 1 - 60
=
1/4
=
P(HT) + P(TH) = 1/4 + 1/4 = 1/2
= 1/4
Purnomo
f(x)
f(x)
1/2
1/2
1/4
F( x) P(X x ) f(t)
tx
Contoh :
Hitunglah distribusi kumulatif variabel random (acak) X pada contoh 1:
F(0)
f(0)
F(1)
f(0) + f(1)
F(2)
Agus
Statistika 1 - 61
= 1/4
=
Purnomo
F(x)
1
1/4
3/4
1/2
1/2
1/4
1/4
0
suatu fungsi bernilai real harganya ditentukan oleh tiap anggota dalam
ruang sampel disebut variabel acak.
Yang menarik perhatian bukan titik sampel melainkan gambaran numerik dari hasil.
Suatu variabel acak dinyatakan dengan huruf besar, misalnya X, sedangkan harganya
dinyatakan dengan huruf kecil yang berpadanan misalnya: x
Contoh 1 :
Dua bola diambil satu demi satu dikembalikan dari suatu kantong berisi empat bola merah
dan bola hitam bila Y menyatakan jumlah bola merah yang diambil maka nilai y yang
mungkin dari variabel Y adalah :
Kejadian yang mungkin
MM
MH
HM
HH
Contoh 2 :
Pak Ali , Badu dan Cokro menitipkan pecinya di pagi hari pada seorang anak. soreharinya si
anak mengembalikan peci tersebut secara acak pada ketiga petani bila pak Ali , Badu dan
Cokro dalam urutan seperti itu menerima peci dari si anak maka tuliskan titik sampel untuk
semua urutan yang mungkin mengdapatkan peci tersebut dan kemudian cari nilai m dari
variabel acak M yang menyatakan jumlah urutan yang cocok !
Bila A, B, C menyatakan masing-masing peci yang dibagikan berturut-turut pada pak Ali,
Agus
Statistika 1 - 62
Purnomo
ABC
ACB
BAC
BCA
CAB
CBA
k
xi
i1
k
k
( xi )2
dan
2 i 1
k
Contoh l :
Bila sebuah bola lampu dipilih secara acak dari sekotak bola lampu yang berisi 1 yang 40-watt, 1
yang 60 watt, 1 yang 75-watt, dan 1 yang 100-watt, maka tiap unsur ruang sampel T={40, 60,
75, 100} muncul dengan peluang . Jadi distribusinya seragam dengan
f(x;4) = ;
x = 40, 60, 75, 100
Contoh 2 :
Seorang dipilih secara random dari 10 karyawan untuk mengawasi suatu proyek. Tiap karyawan
berpeluang sama untuk terpilih , yaitu 1/ 10. Misalnya karyawan tersebut telah dinomori dari 1
Agus
Statistika 1 - 63
Purnomo
Pandanglah suatu kelompok usaha Bernoulli yang berupa pengambilan 4 (empat) unit hasil
produksi suatu pabrik, dan kemudian unit yang cacat dipisahkan dari yang baik. Produk yang
cacat akan disebut (didefinisikan) sebagai sukses(S). Produk yang baik didefinisikan sebagai
gagal (F).
Definisikan : P (sukses) =
p
;
P (gagal)
=
1-p
Contoh salah satu outcome yang muncul dari percobaan di atas yaitu :
P(SSFS)
=
P(S) . P(S) . P(F) . P(S)
independent trial
=
p . p . (1-p). p
=
p3 ( 1 - p )
Hasil lengkap dari seluruh outcome yang mungkin dari percobaan di atas disajikan pada tabel
berikut ini :
Outcome
Observasi
Proba-bilitas
Outcome
Observasi
Proba-bilitas
x
x
SSSS
4
p4
FSFS
2
p2 (1-p) 2
SSSF
3
p3 (1-p)
FFSS
2
p2 (1-p) 2
3
SSFS
3
p (1-p)
FSSF
2
p2 (1-p) 2
SFSS
3
p3 (1-p)
SFFF
1
p(1-p) 3
3
FSSS
3
p (1-p)
FSFF
1
p(1-p) 3
2
2
SSFF
2
p (1-p)
FFSF
1
p(1-p) 3
SFSF
2
p2 (1-p) 2
FFFS
1
p(1-p) 3
2
2
SFFS
2
p (1-p)
FFFF
0
(1-p) 4
P(SSSF)
b (x ; 4 , p)
b (3 ; 4 , p)
=
P(FSSS)
b (x ; 4 , p)
x = 0, 1, 2, 3, 4
P(SSFS)
+
P(SFSS)
=
4p3 ( 1 - p )
Jumlah outcome dengan x = 3
Probabilitas dari setiap outcome dengan x 3
n
Agus S S S . . . . S F F F . . . F
Statistika 1 - 64
Purnomo
(n - x)
P (Sukses)=
px
P (Gagal)=
(1 - p) n - x
A-1
A-1
...
.....
x ; objek
n(n - 1)
(n - 2)
...
x (n - 1)
. . . (n - x + 2)
(n - x + 1)
x!
misal :
10 !
10 . 9 . 8 . 7 . 6 . 5 (4 . 3 . 2 . 1)
6 . 5 . 4 . 3 . 2 . 1 (4 . 3 . 2 . 1)
6!
6!
6!
(10 - 6) !
x!
n!
(n - x) !
(10 - 6) !
Sehingga :
b ( x ; n , p) =
n!
p x (1 p) n x
x! (n x)!
x = 0, 1, .... , n
b(x:n,p)
b (x ; n , p)
b (x ; n , p)
B (x ; n , p)
b (x ; n , p)
n!
p x (1 p) n x ;
x!(n x)!
=
=
=
=
x = 0, 1, ..... ,n
B (x ; n , p) B (x - 1 ; n , p)
b {(n - x ; n , ( 1 - p)}
1 - B {(n - x - 1) ; n , (1 -p)}
B (n - x ; n , 1 - p) - B (n - x - 1 ; n , 1 - p)
Mean
Variance
Standard Deviation
Coefficient of Skewness
Coeffisient of Kurtosis
Agus
Statistika 1 - 65
= np
2 npq
npq
q p
npq
1 6 pq
4 3
npq
Purnomo
M (t ) (q pet )n
( w) (q pei )n
Soal-soal :
1. Sebuah perusahaan industri yang memproduksi alat-alat plastik mengetahui secara teknis
bahwa 20 % dari alat-alat plastik yang diproduksi dengan mesin tertentu akan tidak
memenuhi kualitas standar dan dianggap rusak. jika 20 buah alat-alat plastik yang dihasilkan
dengan mesin diatas dipilih secara random dari seluruh hasil produksi, berapakah
probabilitas :
a. Tepat 5 yang rusak ? = tepat 15 yang baik?
b. Tidak lebih dari 4 yang rusak ? tidak kurang 15 yang baik ?
c. Lebih besar dari 7 yang rusak ? kurang dari 13 yang baik ?
d. Tidak kurang dari 10 yang rusak ? tidak lebih dari 10 yang baik?
e. Semua yang diperiksa baik ? semua yang diperiksa rusak ?
Tidak lebih dari x / sebanyak-banyaknya
x
Lebih kecil dari x / kurang dari x
<x
Lebih besar dari x
>x
Tidak kurang dari x / sekurang-kurang x
x
Tepat pada x
=x
2. Dalam pengujian sejenis ban truk melalui jalan yang kasar ditemukan 25 % truk mengalami
kegagalan karena ban pecah . Berapakah peluang 5 sampai 10 truk dari 15 yang diuji akan
mengalami pecah ban ?
3. Seorang petani jeruk mengeluh karena 60% dari panen jeruknya terserang sejenis virus. Cari
peluangnya bahwa di antara 4 buah jeruk yang diperiksa dari hasil panen ini
a. semuanya terserang virus tersebut;
b. antara 1 sampai 3 yang terserang virus tersebut.
4. Menurut suatu survey, 0.3 dari perusahaan di AS memberi karyawannya cuti 4 minggu
setelah bekerja di perusahaannya selama 15 tahun. Cari peluangnya bahwa di antara 6
perusahaan yang disurvey secara acak, banyaknya perusahaan yang memberi karyawannya
cuti 4 minggu setelah 15 tahun kerja
a. antara 2 sampai 5;
b. kurang dari 3.
5. Menurut suatu penelitian yang dilakukan oleh sekelompok sosiolog dari Universitas
Massachusetts, sekitar 60 % pengguna Valium di negara bagian Massachusetts mula-mula
menggunakan Valium karena persoalan psikologi. Cari peluangnya bahwa diantara 8
pengguna yang diwawancarai selanjutnya dari negara bagian tersebut :
a. tepat 3 mula-mula menggunakan Valium karena persoalan psikologi.
b. paling sedikit 5 mula-mula menggunakan Valium karena persoalan yang bukan psikologi.
6. Suatu survey nasional di AS pada mahasiswa tingkat empat yang dilakukan oleh Universitas
Michigan menunjukkan bahwa hampir 70 % dari mereka yang tidak menyetujui merokok
ganja tiap hari menurut laporan Parade, 14 September 1980. Bila 12 mahasiswa tingkat
empat dipilih secara acak dan ditanya pendapatnya, cari peluangnya bahwa banyaknya yang
tidak setuju merokok ganja tiap hari
a. dari 7 sampai 9 orang;
b. paling banyak 5 orang;
c. tidak kurang dari 8 orang.
7. Seorang lnsiyur pengawas lalu lintas melaporkan bahwa 75 % kendaraan yang melintasi
suatu daerah pemeriksaan berasal dari DKI. Berapakah peluang bahwa kurang dari 4 dari 9
kendaraan mendatang yang melalui pemeriksaan tersebut berasal dari luar DKI ?
Agus
Statistika 1 - 66
Purnomo
8. Suatu penelitian yang dilakukan di Universitas George Washington dan Institut Kesehatan
Nasional di AS meneliti sikap masyarakat terhadap obat penenang. Penelitian itu
menunjukkan bahwa sekitar 70 % penduduk percaya obat penenang tidaklah mengobati
apapun, obat itu hanyalah menutupi penyakit sesungguhnya. Menurut penelitian ini, berapa
peluangnya bahwa paling sedikit 3 dari 5 penderita yang dipilih secara acak berpendapat
sepert! itu ?
9. Suatu survey penduduk di suatu kota di AS menunjukkan bahwa 20% lebih menyenangi
telepon berwarna putih dari pada warna lainnya. Berapakah peluang bahwa lebih dari
setengah dari 20 pesawat yang akan dipasang di kota tersebut akan berwarna putih ?
10. Diketahul bahwa 40% dari tikus yang disuntik dengan sejenis serum terlindung dari serangan
sejenis penyakit. Bila 5 tikus disuntik, berapakah peluang bahwa
a. tidak ada yang terserang penyakit tersebut;
b. kurang dari 2 yang terserang;
c. lebih dari 3 yang terserang.
11. Misalkan bahwa mesin pesawat terbang bekerja bebas satu dari yang lain dalam penerbangan
dan rusak dengan peluang 0,4. Bila dimisalkan bahwa sebuah pesawat terbang melakukan
penerbangan dengan selamat jika paling sedikit, setengah mesinnya bekerja, tentukan apakah
pesawat bermesin empat atau bermesin dua yang lebih tinggi keselamatan penerbangannya ?
7.2.3 DISTRIBUSI HIPERGEOMETRIK
Cara paling mudah melihat perbedaan antara distribusi binomial dan distribusi hipergeometrik
terletak pada cara pengambilan sampelnya. Macam penggunaan distribusi hipergeometrik amat
mirip dengan binomial. Untuk kasus binomial, diperlukan kebebasan antara usaha. Akibatnya,
bila binomial diterapkan, misalnya, pada pengambilan dari sejumlah barang (sekotak kartu,
sejumlah barang produksi), sampel harus dikerjakan dengan pengembalian setiap barang setelah
diamati. Dipihak lain, distribusi hipergeometrik tidak memerlukan kebebasan dan didasarkan
pada sampel tanpa pengembalian.
Penggunaan distribusi hipergeometrik terdapat di banyak bidang, terbanyak pada penerimaan
sampel (acceptance sampling), pengujian elektronik, dan pengendalian mutu. Tentunya, dalam
banyak bidang ini pengujian dilakukan terhadap barang yang diuji yang mengakibatkan, pada
akhirnya, barang yang diuji tersebut menjadi rusak, jadi tidak dapat dikembalikan. Penyampelan
harus dikerjakan tanpa pengembalian.
Sifat Percobaan Hipergeometrik :
Populasi
=
Jumlah sukses
=
Jumlah sampel size =
Tidak terjadi replacement
Sifat dichotomous
n n!
x x!(n x)!
Agus
Statistika 1 - 67
N terbatas
a
n
N N !
n n ! (N n ) !
Purnomo
N
a
sukses
x
sukses
(N - a)
gagal
(n - x)
gagal
n
h ( x ; n ; a ; N) =
a N a
x nx
N
x = 0, 1, .... , n
Teorema :
Rataan dan variansi distribusi hipergeometrik h (x; n; a; N) adalah :
na
N
Nn
a
a
n 1
n
N
N 1
Contoh soal :
Suatu pabrik menggunakan rencana penerimaan dalam produksi barangnya sebelum pengiriman.
Suatu kotak (dus) berisi 40 suku cadang dikatakan dapat diterima bila dari sampel acak (random)
ukuran 5 suku cadang mengandung paling banyak 1 yang cacat. Berapa probabilitas mendapat
Agus
Statistika 1 - 68
Purnomo
tepat satu yang cacat dalam sampel bila kotak tersebut mengandung 3 suku cadang yang cacat ?
n = 5 ; x = 1 ; N = 40 ; a = 3
h ( x ; n ; a ; N) =
Agus
Statistika 1 - 69
a N a
x nx
N
Purnomo
h ( 1 ; 5 ; 3 ; 40 ) =
3 403
1 51
40
= 0,3011
Soal-soal :
1. Sebuah perusahaan ingin menilai cara pemeriksaan yang sekarang dimana setiap lot berisi 50
barang. cara ini mengambil sampel sebesar 5 dan lolos pemeriksaan bila berisi tidak lebih
dari dua yang cacat berapakah probabilitas lot yang mengandung 20 % cacat akan lolos
pemeriksaan ?
2. Suatu lot berisi 50 unit barang yang 10 % diantaranya cacat untuk dapat dipasarkan maka lot
harus menjalani pemeriksaan dengan cara pengambilan sampel sebagai berikut:
sampel 1 : Berukuran 10 jika dari sampel ini dijumpai 4 unit atau lebih yang cacat maka lot
ditolak jika ditemui cacat kurang dari 2 unit, lot diterima jika ditemui cacat dari 2
sampai 3 unit maka pemeriksaan dilanjutkan dengan sampel kedua.
sampel 2 : berukuran 5 unit, jika tidak dijumpai barang cacat maka lot diterima.
a. Berapa probabilitas lot ditolak di sampel kedua ?
b. Berapa Probabilitas lot diterima disampel ke satu ?
3. Suatu pabrik menggunakan rencana pengiriman bertahap dua dari barang produksinya,
sebelum dikirim sejumlah kotak masing-masing berisi 25 butir disiapkan untuk dikirim dan
sampel berukuran 3 butir barang dari setiap kotak diperiksa. Bila ada yang cacat dari ketiga
butir barang tersebut maka kotak dikembalikan dan seluruh isinya diperiksa. bila dari
ketiganya tidak ada yang cacat maka kotak dikirimkan.
a. Berapa probabilitas sebuah kotak yang berisi 5 butir barang yang cacat akan dikirm ?
b. Berapa probabilitas kotak yang berisi 1 butir barang yang cacat akan dikembalikan dan
seluruh isinya diperiksa ?
4. Untuk mengelabui petugas pabean, seorang pelancong menaruh 6 tablet narkotik dalam
sebuah botol yang berisi 9 pil vitamin yang sama bentuk dan warnanya. Bila petugas pabean
Agus
Statistika 1 - 70
Purnomo
memeriksa 3 tablet secara acak untuk dianalisis, berapakah peluang pelancong tersebut akan
ditahan karena membawa narkotik ?
5. Seseorang menanam 6 bibit di pekarangannya, yang diambil secara acak dari sebuah kotak
berisi 5 bibit gladiol dan 4 daffodil. Berapakah peluang dia menanam 2 bibit daffodil dan 4
gladiol ?
6. Dari kotak berisi 10 peluru, diambil 4 secara acak dan kemudian ditembakkan. Bila kotak itu
mengandung 3 peluru yang cacat yang tidak akan meledak, berapakah peluang bahwa
a. keempatnya meledak ?; b. paling banyak 2 yang tidak akan meledak?
7. Berapakah peluangnya sebuah bar menolak menjual minuman beralkohol pada 2 siswa bila
pelayan secara acak memeriksa KTP 5 siswa dari 9 siswa, yang 4 di antaranya di bawah
umur ?
8. Misalkan perusahaan di soal 3 memutuskan mengganti rencana penerimaannya. Menurut
rencana baru ini seorang pemeriksa mengambil secara acak 1 barang, memeriksanya,
kemudian mengembalikannya ke dalam kotak; pemeriksa kedua juga bekerja dengan cara
yang sama. Akhirnya, pemeriksa ketiga juga mengikuti cara yang sama. Suatu kotak tidak
akan dikirim bila salah satu dari ketiga pemeriksa menemukan 1 yang cacat. Jawablah
pertanyaan a dan b pada soal 3 menurut rencana baru.
9. Disuatu kampung diperkirakan 4.000 dari 10.000 penduduknya yang berhak memilih Pak Ali
sebagai lurah. Bila 15 penduduk yang berhak memilih diambil secara acak dan pilihannya
untuk lurah ditanya, berapakah peluang paling banyak 7 diantaranya yang ingin memilih Pak
Ali sebagai lurah ?
10. Suatu kampung terdiri atas 1200 keluarga. Bila setengah dari seluruh keluarga di kampung
itu memiliki pesawat televisi, berapakah peluang bahwa suatu sampel sebesar 10 keluarga
paling sedikit 3 diantaranya memiliki televisi ?
Pendekatan Distribusi Binomial terhadap Distribusi Hipergeometrik :
Bila n kecil dibandingkan dengan N maka peluang tiap penarikan akan berubah sedikit. Jadi
pada dasarnya percobaan adalah binomial dan dapat menghampiri distribusi hipergeometrik;
dengan menggunakan distribusi binomial dengan
p = a / N.
adalah :
np
na
N
Contoh soal :
Dalam suatu lot terdapat 100 travo dimana yang cacat ada 25 bila diperiksa 10 berapa
probabilitas tepat 2 travo yang cacat ?
Solusi :
Agus
Statistika 1 - 71
Purnomo
x = 2 ; n = 10 ; a = 25 ; N = 100
257
2 8
0,29
10
10
10 2 8
(0,25) (10,25) 0,28
2
Soal-soal :
1. Dari 150 petugas pajak disuatu kota hanya 30 wanita. Bila 10 daripadanya yang dipilih
secara acak untuk ditugaskan memeriksa pajak sebuah perusahaan, gunakan pendekatan
(hampiran) binomial untuk menghitung peluangnya bahwa paling sedikit 3 wanita yang
terpilih ?
2. Suatu survey nasional di AS pada 17.000 mahasiswa tingkat empat yang dilakukan oleh
Universitas Michigan menunjukkan bahwa hampir 70% mereka tidak menyetujui merokok
ganja tiap hari menurut laporan di Parade, 14 September 1990. Bila 18 dari mahasiswa ini
diambil secara acak dan ditanya pendapatannya, berapakah peluangnya bahwa lebih dari 9
tapi kurang dari 14 yang tidak menyetujui merokok ganja ?
7.2.4 DISTRIBUSI POISSON
Percobaan yang menghasilkan variabel acak X yang bernilai numerik, yaitu banyaknya hasil
selama selang waktu tertentu atau dalam daerah tertentu, disebut percobaan Poisson. Panjang
selang waktu tersebut boleh berapa saja, semenit, sehari, seminggu, sebulan, atau malah setahun.
Agus
Statistika 1 - 72
Purnomo
Jadi percobaan Poisson dapat menghasilkan pengamatan untuk variabel acak X yang menyatakan
banyaknya hubungan telepon per jam yang diterima suatu kantor, banyaknya hari sekolah ditutup
karena banjir, banyaknya pertandingan sepakbola yang terpaksa diundurkan karena hujan selama
musim hujan. Daerah yang dimaksud dapat berupa sepotong garis, suatu luas daerah, suatu isi
benda, atau pun barangkali sepotong benda. Dalam hal seperti ini X mungkin menyatakan
banyaknya tikus sawah per hektar, banyaknya bakteri dalam suatu kultur, ataupun banyaknya
salah tik per halaman.
Syarat Percobaan Poisson :
1. Banyaknya hasil yang terjadi dalam suatu selang waktu atau daerah tertentu tidak
terpengaruh oleh (bebas dari) apa yang terjadi pada selang waktu atau daerah lain yang
terpisah. Dalam hubungan ini proses Poisson dikatakan tak punya ingatan.
2. Peluang terjadinya suatu hasil (tunggal) dalam selang waktu yang amat pendek atau dalam
daerah yang kecil sebanding dengan panjang selang waktu atau besarnya daerah dan tidak
tergantung pada banyaknya hasil yang terjadi di luar selang waktu atau daerah tersebut.
3. Peluang terjadinya lebih dari satu hasil dalam selang waktu yang pendek atau daerah yang
sempit tersebut dapat diabaikan.
Banyaknya hasil X dalam suatu percobaan Poisson dlsebut suatu peubah acak Poisson dan
distribusi peluangnya disebut distribusi Poisson. Rataan banyaknya hasil dihitung dari = t ,
bila t menyatakan 'waktu' atau 'daerah' khas yang menjadi perhatian. Karena peluangnya
tergantung pada , laju terjadinya hasil akan kita nyatakan dengan lambang p(x; t).
= rata-rata banyaknya sukses yang terjadi dalam suatu selang waktu atau daerah tertentu
Definisi Distribusi Poisson :
Distribusi peluang peubah acak Poisson X, yang menyatakan banyaknya sukses yang terjadi
dalam suatu selang waktu atau daerah tertentu dinyatakan dengan t, diberikan oleh
x e
f ( x, )
x = 0, 1, 2, ....
; e = 2,7183
x!
Teorema :
Rataan dan variansi distribusi Poisson :
=
dan
2 =
0.7
0.6
0.5
, )
f(x
Px
x!
t 0,5
0.4
t 1
0.3
0.2
t 2
0.1
0
Agus
Statistika 1 - 73
Purnomo
1,0
t) 1 e t
P(T
P(T
t)
O t
P(T
t ) prob. waktu antar kedatangan
T suatu waktu t tertentu
Ekspektasi waktu antar kedatangan
(kelahiran) :
E(T)
1 /
Sifat Memoryless:
Kejadian suatu even tidak dipengaruhi oleh even sebelumnya.
Sifat Memoryless dimiliki :
Distribusi Diskrit : Poisson
Pdf Poisson = Pdf Eksponensial
Distribusi Kontinu : Eksponensial
Jika jumlah kedatangan berdistribusi poisson maka waktu antar kedatangan berdistribusi
eksponensial.
Contoh soal :
1. Pemeriksaan lempengan timah dari suatu proses elektrolit yang kontinu, diperoleh cacat
yang berupa bintik-bintik rata-rata permenit 0,2. Berapa probabilitas cacat tersebut :
a) Tepat 1 yang cacat dalam 3 menit ?
b) Sekurang-kurangnya 2 yang cacat dalam 5 menit?
c) Paling banyak 1 yang cacat dalam 15 menit ?
Solusi :
rata-rata permenit = 0,2 rata-rata jl. bintik/menit
a) 3 menit
= n . p = 3 x 0,2 = 0,6
f ( 1; 0, 6 ) = F (1; 0, 6) - F(0; 0, 6)
= 0,878 - 0,549 = 0.329
b) 5
menit
= 1,0
f (x 2 ; 1,0 ) =
1 - F (1; 1,0) = 1 - 0.7358 = 0.2642
c) 15 menitn =
15
x 0,2 = 3,0
f ( x 1 ; 3, 0 )
=
F (1; 3,0 )
= 0,1991
f (4 x 9; 3, 0)
=
F (9 ; 3, 0) - F( 3 ; 3,0)
Agus
Statistika 1 - 74
Purnomo
2. Rata-rata banyaknya tanker minyak yang tiba tiap hari di suatu pelabuhan adalah 10.
Pelabuhan tersebut hanya mampu menerima paling banyak 15 tanker sehari. Berapakah
peluang pada suatu hari tertentu tanker terpaksa ditolak karena pelabuhan tak mampu
melayaninya ?
Misalkan X menyatakan banyaknya tanker yang tiba tiap hari dan = 10 tanker/hari (ratarata jl tanker datang/hari)
f ( X > 15 ) = f ( X 16 ) = 1 f (X 15)
15
= 1
x 0
Seperti distribusi Binomial, distribusi Poisson banyak digunakan dalam pengendalian mutu,
pertanggungan mutu, dan penerimaan sampel. Disamping itu, beberapa distribusi kontinu
yang penting yang digunakan dalam teori kehandalan dan teori antrian bergantung pada
proses poisson.
PENDEKATAN POISSON TERHADAP BINOMIAL :
Bila n besar p dekat dengan nol, distribusi Poisson dapat digunakan dengan =np, untuk
menghampiri peluang binomial. Bila p dekat dengan 1, distribusi Poisson masih dapat
dipakai untuk menghampiri peluang Binomial dengan mempertukarkan apa yang telah
dinamai dengan sukses dan gagl, jadi dengan mengganti p dengan suatu nilai yang dekat
dengan 0.
Teorema :
Misalkan X variabel acak Binomial dengan distribusi probabilitas b(x; n;p).
Bila n , p 0, dan = np tetap sama, maka :
b(x; n;p) f(x; )
Pendekatan ini akan baik jika n 20 dan p 0,05 ; jika n 100 maka np 10
Contoh soal :
1. Diketahui 5 % dari hasil penjilidan suatu buku mengandung cacat. Berapa probabilitas 2 dari
100 buku yang dijilid akan mengandung cacat, pergunakan :
a) formulasi distribusi Binomial !
b) pendekatan Poisson untuk Binomial !
Solusi :
Probabilitas sukses : p=0,05 ;
n = 100 dan sukses x = 2
a)
b(x;n,p)
b ( 2 ; 100 ; 0,05 )
10 2 98
(0, 5) (0,95)
2
n!
p x (1 p) n x
x! (n x)
= 0,081
=n . p =(0,05) (100) = 5
x
f ( x ; ) = e
x!
b) x = 2 ;
Agus
Statistika 1 - 75
Purnomo
52 e5
0,084
2!
dg. tabel = F(2:5) F(1;5) = 0.1247 - 0.0404 = 0.0843b
f(2;5)=
2. Dalam suatu proses produksi yang menghasilkan barang dari gelas, terjadi gelembung atau
cacat yang kadang-kadang menyebabkan barang tersebut sulit dipasarkan. Diketahui bahwa
rata-rata 1 dari 1000 barang yang dihasilkan mempunyai 1 atau lebih gelembung. Berapakah
probabilitas bahwa sampel sebesar 8000 barang akan berisi kurang dari 7 yang bergelembung
?
Solusi : Probabilitas sukses p = 1/1000 = 0.001 ; n = 8000 ; = n p = 8
B (6; 8000; 0.001) = F (6; 8) = 0.3134
Soal-soal :
1. Pada suatu pompa bensin rata-rata datang 2 kendaraan dalam 10 menit.
a) Berapa kemungkinan di dalam waktu 1 jam akan datang tepat 10 kendaraan ?
b) Berapa kemungkinan di dalam waktu 1 jam akan datang paling sedikit 10 kendaraan ?
c) Berapa kemungkinan di dalam waktu 1 jam akan datang paling banyak 10 kendaraan ?
2. Di suatu simpang jalan rata-rata terjadi 3 kecelakaan seminggu. Berapakah peluang pada
suatu minggu tertentu
a. tepat 5 kecelakaan akan terjadi ?
b. kurang dari 3 kecelakaan akan terjadi ?
c. paling sedikit 2 kecelakaan akan terjadi ?
3. Seorang tukang tik rata-rata melakukan 2 kesalahan per halaman. Berapakah peluang dia
melakukan
a. 4 atau lebih kesalahan pada halaman berikut yang dia ketik ?
b. tidak ada kesalahan ?
4. Suatu daerah di bagian timur Amerika Serikat, ratarata ditimpa 6 angin topan setahun.
Carilah peluang di suatu tahun tertentu
a. tidak sampai 4 angin topan yang akan menimpa daerah tersebut;
b. antara 6 sampai 8 angin topan akan menimpa daerah tersebut.
5. Dalam suatu penelitian inventors (persediaan barang) diketahui bahwa permintaan rata-rata
dari gudang terhadap suatu bahan tertentu 5 kall sehari. Berapakah.peluang pada suatu hari
tertentu bahan tersebut
a. diminta lebih dari 5 kali ? b. tidak diminta sama,sekali ?
6. Peluang seseorang meninggal karena suatu infeksi pernafasan adalah 0,002. Carilah peluang
bila 2000 orang yang terserang infeksi tersebut, kurang dari 5 orang yang akan meninggal.
7. Misalkan rata-rata l dari tiap 1000 orang melakukan salah perhitungan dalam menghitung
pajaknya. Bila 10.000 isian pajak diambil secara acak dan diperiksa, hitunglah peluangnya
bahwa 6, 7, atau 8 isian tersebut akan salah hitung.
b(6) =
b(7)=
b(8)=
8. Peluang seorang murid gagal dalam pemeriksaan scoliosis (lengkungan tulang belakang)
yang diadakan oleh sekolah diketahui sebesar 0,004. Dari sebanyak 1875 murid yang
diperiksa, carilah peluangnya bahwa
a. kurang dari 5 yang gagal dalam pemeriksaan;
b. 8, 9, atau 10 yang gagal.
kecuali usaha
Purnomo
b(x;k;p)
x 1 k x k
p q
k 1
x = k, k + 1, k + 2, ....
Contoh soal :
Carilah probabilitas bahwa seseorang yang melantunkan tiga uang logam sekaligus akan
mendapat semuanya muka (H) atau semuanya belakang (T) untuk kedua kalinya pada lantunan
kelima !
Solusi : x = 5 ; k = 2 ; dan p = 1/4
b (5; 2 ;1/4 )
4 1 2 3 3
1 4 4
= 0.1051
Soal-soal:
1. Probabilitas pembelian suatu tv berwarna di suatu toko tv adalah 0,3 Hitunglah probabilitas
bahwa pembelian tv yang kesepuluh di toko tersebut akan merupakan pembelian tv berwarna
yang ke lima ? b ( x=10;k=5; p=0,3) = 0,0515
2. Seorang peneliti menyuntik beberapa ekor tikus, satu demi satu dengan sejenis bibit penyakit
sampai dia menemukan dua ekor yang telah terserang penyakit itu, bila probabilitas terserang
penyakit itu 1/6. Berapakah Probabilitas bahwa delapan ekor tikus yang perlu disuntik ?
3. Misalkan peluangnya 0,8 bahwa setiap orang akan percaya tentang desas-desus mengenai
hubungan gelap seorang bintang terkenal. Berapakah peluangnya bahwa :
a. orang keenam yang mendengar desas-desus ini merupakan orang keempat yang
mempercayainya ?
b. orang ketiga yang mendengar desas-desus ini merupakan orang pertama yang
mempercayainya ?
4. Carilah peluang seseorang yang melantunkan suatu uang logam mendapat
a. muka yang ketiga pada lantunan ketujuh;
b. muka yang pertama pada lantunan keempat.
Agus
Statistika 1 - 77
Purnomo
3 (x-1)
x+1 .
gagal
( 1 p )X-1
Purnomo
i 1
Pi = 1
n!
x1 x2
xk
P P
...P
1
2
k
x1! x2! ... xk!
dengan xi = 0, 1 , 2 , ....., n
k
xi n
i 1
dan
k
pi 1
i 1
Contoh Soal :
1. Ada 3 merk kendaraan Niaga yang sering dipergunakan masyarakat Bandung :
Merk
Yang beredar di pasaran
x1 = Daihatsu
40 %
x2 = Suzuki
45 %
x3 = Mitsubishi
15 %
Jika kita mengamati 10 mobil niaga yang sedang parkir di Alun-alun Bandung, maka berapa
probabilitas terdapat Daihatsu 3 , Suzuki 4 dan Mitsubishi 3 ?
Solusi : f ( 3, 4, 3 )
10!
(0,4)3 (0,45)4 (0,15)3
3! 4! 3!
= 0,037
2. Terdapat sebuah kotak yang berisi 100 buah bola : 25 H , 50 P, 5 B , 20 K. Bila dilakukan 5
kali pengambilan bola dengan pengembalian, dan diperoleh 1P, 1K ,2H , 1B, berapa
besarnya probabilitasnya ?
P (H) = 1/4
; P(P) = 1/2
; P(B) = 1/20
; p(KP) = 1/5
Agus
Statistika 1 - 79
Purnomo
P ( 2H , 1P , 1K , 1B )
2
1
1
= 5 ! (1/ 4) (1/ 2) (1/ 20) (1/ 5)1
2! 1! 1! 1!
Soal-soal :
1. Suatu papan sasaran anak panah berbentuk lingkaran mempunyai pusat berbentuk lingkaran
kecil disebut lesan dan 20 daerah berbentuk kue tar bernomor 1 sampai 20. Tiap daerah
yang berbentuk tar terbagi lagi atas tiga bagj.an sehingga bila seseorang melempar anak
panah dan mengenai nomor tertentu maka ia mendapat nilai sama dengan nomor tersebut,
dua kali nomor tersebut, atau tiga kali nomor tersebut, tergantung pada bagian mana dari
ketiga daerah yang kena. Bila peluang seseorang mengenal lesan 0,01, peluang mengenai
nilai ganda adalah 0,10, peluang mengenai nilai ganda tiga adalah 0,05, peluang tidak
mengenai papan adalah 0,02, berapakah peluangnya dalam 7 lemparan menghasilkan: tidak
mengenai lesan, tidak mendapat nilai ganda tiga, mendapat nilai ganda dua kall, dan tidak
mengenai papan satu kali ?
2. Menurut teori genetika, persilangan tertentusejenis marmut akan menghasilkan keturunan
berwarna merah, hitam, dan putih dalam perbandingan 8 : 4 : 4. Carilah peluang bahwa 5
dari 8 turunan akan berwarna merah, 2 hitam, dan 1 putih.
3. Delegasi ke suatu konferensi akan tiba dengan pesawat terbang, bus, mobil sendiri, atau
kereta api masing-masing dengan peluang 0,4, 0,2, 0,3, dan 0,1. Berapa peluangnya bahwa
diantara 9 delegasi yang dipilih secara acak, 3 tiba dengan pesawat terbang, 3 tiba dengan
bus, 1 tiba dengan mobil sendiri, dan 2 tiba dengan kereta api ? 0,0077
Agus
Statistika 1 - 80
Purnomo
BAB VIII
DISTRIBUSI PROBABILITAS KONTINU
8.1 FUNGSI PADAT PELUANG (PROBABILITY DENSITY FUNCTION)
Suatu variabel acak kontinu mempunyai peluang nol pada setiap titik x. Karena itu,
distribusi peluangnya tak mungkin disajikan dalam bentuk tabel. Hal ini mungkin mengejutkan
pada permulaan, tetapi akan mudah dipahami dengan contoh berikut. Pandanglah suatu variabel
acak yang nilainya menyatakan tinggi badan semua orang di atas 21 tahun. Di antara dua
sembarang nilai, misalnya 163,5 dan 164,5 cm, ataupun antara 163,99 dan 164,0l cm terdapat
tinggi yang takberhingga banyaknya, salah satu diantaranya ialah 164 cm. Peluang memilih
secara acak seseorang yang tingginya tepat 164 cm tidak kurang atau lebih sedikit pun juga,
tentunya sangatlah kecil dan karena ltu peluang kejadian tersebut diberi nilai nol. Namun lain
halnya, bila yang ditanya ialah peluang memilih seseorang yang tingginya paling sedikit 163 cm
tetapi tidak lebih dari 165 cm. Sekarang yang dipandang ialah nilai suatu selang dan bukan nilai
suatu titik dari peubah acak.
Selanjutnya akan dijelaskan perhitungan peluang untuk berbagai selang dari variabel acak
kontinu seperti P(a < X < b), P(W > c), dan seterusnya. Perhatikan bahwa bila X kontinu :
P (a < X b) = P (a < X < b) + P (X = b) - P(a < X < b).
Yaitu, tidaklah menjadi soal apakah titik ujung selang diikutsertakan atau tidak. Hal ini tidak
benar, tentunya, bila X diskret.
Kendati distribusi peluang variabel acak kontinu tidak dapat disajikan dalam bentuk tabel,
mungkin dapat disajikan dalam bentuk rumus. Rumus seperti itu tentunya merupakan fungsi
dari nilai yang berbentuk bilangan (numerik) dari variabel kontinu X dan karena itu akan
dinyatakan dengan lambang fungsi f(x). Jika menyangkut variabel yang kontinu, f(x) dinamakan
fungsi padat peluang, atau disingkat fungsi padat dari X. Karena X didefinisikan pada ruang
sampel yang kontinu, mungkin saja f(x) tidak kontinu pada beberapa titik yang terhingga
banyaknya. Akan tetapi, kebanyakan fungsi padat yang mempunyai penggunaan praktis dalam
analisis data statistika bersifat kontinu dan grafiknya, beberapa di antaranya, dapat berbentuk
salah satu dari bentuk pada gambar berikut ini. Karena peluang akan dinyatakan sebagai luas
dan peluang merupakan bilangan positif maka fungsi padat haruslah seluruhnya terletak di atas
sumbu X.
f(x)
f(x)
f(x)
f(x)
Purnomo
Fungsi padat peluang dituliskan sedemikian rupa sehingga luas daerah, di antara kurva dan
sumbu x yang dihitung atas semua rentangan harga X pada daerah f(x) terdefinisi, adalah 1.
Kalau seluruh nilai X terletak pada selang berhingga, selalu mungkin memperluas selang
tersebut sehingga mencakup seluruh himpunan bilangan real dengan mendefinisikan f(x) sama
dengan nol pada semua titik pada selang perluasan tadi.
Peluang X mempunyai nilai antara a dan b = Luas daerah yang diarsir yaitu :
P( a< X < b)=
b
f (x) dx
a
2. f (x) dx 1
3. P ( a < X < b ) =
f (x) dx
f(x)
Contoh Soal :
x2 / 3 untuk -1 < x < 2
f (x) =
0
Apakah itu PDF ? dan kontinu ?
Jawab :
f (x) 0
PDF
2
2 x
x3 2 8 1
f
(x)
dx
dx
] 1
9 1 9 9
1 3
1/4 x
f (x)
untuk
CDF
0 x 4
Agus
Statistika 1 - 82
Purnomo
untuk
x lain
f (x) 0
41
1 24
bukan kontinu (PDF)
4 xdx 8 x | 2
0
0
1/4 x
untuk
0 x a
f (x)
=
0
untuk
x lain
Agar PDF berapa harga a ?
f (x) 0
a1
1 2a
x
dx
x | 1
4
8
0
0
1
= a2 1
8
2
kx
f (x)
2 x 4
=
0
Berapa k agar PDF ?
f (x) 0
a2 = 8 a =
untuk
untuk
x lain
4
2
k x dx 1
2
4
1
k x3 | 1
3
2
64k 8k
1
3
3
56k
1
3
3
k
56
Saya pergi bekerja dengan menggunakan bus dan setiap 5 menit bus tiba pada tempat
pemberhentian karena waktu meninggalkan rumah waktunya bervariasi maka saya tidak
selalu tiba pada pemberhentian pada waktu yang sama, berarti waktu menunggu x untuk
bus berikutnya berupa variabel random kontinu dikatakan sekumpulan nilai x yang mungkin
pada interval [ 0 , 5 ] dengan pdf-nya :
1/5
untuk
0 x 5
f(x) =
0
untuk
x yang lainnya
f(x)
1/5
Agus
Statistika 1 - 83
Purnomo
31
15
P (1 x 3) = f(x) dx
dx
x3 2
|
51 5
1
= dx
45
P(x 4)
51
5 dx 0 dx
4
5
=
=
x5
|
54
1
5
Soal-soal :
3/4 (1 - x2)
1. Diket :
2.
a)
b)
c)
d)
f (x)
untuk
-1 x 1
0
untuk
x lain
a) Apakah pdf dan cdf ?
b) Buat grafik f (x) ?
c) Hitung P (x > 0) !
d) Hitung P ( - 0,5 < x < 0,5 ) ?
Seorang profesor suatu Universitas tidak pernah menghentikan kuliahnya sebelum bel
berbunyi dan selalu mengakhiri kuliahnya diantara satu menit sesudah bel bel berbunyi. Jika
x = waktu antara bel dan kuliah berakhir dan Pdf-nya :
k x2
untuk
0 x 1
f (x) =
0
untuk
x lain
Tentukan nilai K ?
Berapakah prob. bahwa kuliah selesai 1/2 menit setelah bel berbunyi ?
Berapakah probabilitas bahwa kuliah berlanjut antara 15 sampai dengan 30 detik setelah bel
berbunyi ?
Berapakah probabilitas kuliah berlanjut paling sedikit 40 detik setelah bel berbunyi ?
Definisi :
Distribusi kumulatif F (x) suatu variabel random kontinu X dengan fungsi padat f(x) :
x
F (x) = P ( X x ) = f(t) dt
untuk
-<x <
f (x) =
d F (x)
dx
Contoh Soal :
Carilah F (x) dari fungsi padat peluang :
Agus
Statistika 1 - 84
Purnomo
2
f (x) = x
3
Solusi :
F(x) =
jadi
x
x t2
t 3 x x3 1
f(t)
dt
dt
9 1
9
1 3
1
e
2
)
1 (x
= 3,14159
; - < x <
dan
= 2,71828
Mempunyai 2 parameter :
= menunjukkan letak titik tengah.
= menunjukkan seberapa jauh sebaran.
Begitu diketahui maka seluruh kurva normal diketahui.
Distribusi probabilitas normal dengan mean yang sama dan standar deviasi berbeda ;
Agus
Statistika 1 - 85
Purnomo
1 1
1 < 2 < 3
2 5
3 10
100
Distribusi probabilitas normal dengan mean berbeda dan standar deviasi sama ;
5
20
40
60
Distribusi probabilitas normal dengan mean berbeda dan standar deviasi yang berbeda ;
10
20
30
50
100
150
Agus
Statistika 1 - 86
Purnomo
x1
x2
1 (x )
x 2 2
1
e
2 x1
2
dx
II
x1
x2
x
2
1 Z2
1
2
e
2
Agus
Statistika 1 - 87
Purnomo
DITRANSFORMASI
KE BENTUK STANDAR
X1
X2
1 ( x ) 2
x
2
1
2
e
2 x1
Z2
1 Z 2 z2 / 2
e
dz
=
f (Z, 0, 1) dz
2 Z1
Z1
=
=
P ( z1 < Z < z2 )
Perbandingan area dibawah kurva normal untuk satu, dua dan tiga standar deviasi dari mean.
16 % dari Area
16 % dari Area
68 %
AREA
95,4 % AREA
Agus
Statistika 1 - 88
Purnomo
Contoh Soal :
Diketahui suatu distribusi normal dengan
mendapatkan harga antara - 8 dan 4
4
2
4 1
(1/ 2) ( x )/
P(-8 < X < 4) =
e
dx
8 2
-8
x 2 22
Z 0
4 4
-2,5
x1 8
4
x2 4
4
0,5
8 2
Z 25,
4
42
Z 05,
4
Jadi ; P( -8 < X < 4 ) = P( -2,5 < Z < 0,5 )
Soal-soal
1. Bila diketahui distribusi normal dengan = 40 dan = 6 maka rubahlah (tranformasikan )
kebentuk distribusi normal standar untuk ;
a. Luas lebih kecil dari 32
b. Luas lebih besar dari 27
c. luas antara 42 dan 51
2. Bila diketahui distribusi normal dengan = 200 dan 2 = 100 maka rubahlah kebentuk
distribusi normal standar untuk :
a. Luas dibawah 214
b. Luas diatas 179
c. Luas antara 188 dan 206
3. Tinggi rata-rata mahasiswa UNPAS adalah 165 cm dan simpangan bakunya 10 cm
a.) Berapa kemungkinan mahasiswa
UNPAS yang
tingginya lebih besar atau sama
dengan 170 cm.
b). Berapa kemungkinan
mahasiswa UNPAS yang tingginya antara 155 cm - 170
cm ?
4. Sebuah pabrik memproduksi poros kendaraan bermotor dengan batas spesifikasi diameter :
Agus
Statistika 1 - 89
Purnomo
40 0,20 mm
spesifikasi
atau (39,80 40,20) mm
3998, mm
hasil proses
= 0,02 mm
Berapa persenkah produk yg. memenuhi syarat (spesifikasi) dari proes produksi tsb. ?
5. Didalam proses pengantongan semen diperoleh berat satu sak semen = 40 kg, dengan
simpangan baku = 0,2 kg. Berapa kemungkinan didalam satu sak semen terdapat lebih kecil
atau sama dengan 39,5 kg ?
6. Suatu mesin minuman diatur sedemikian rupa sehingga mengeluarkan rata-rata 207 mililiter
per cangkir bila banykanya minuman berdisttribusi normal dengan simpangan baku 15
mililiter ;
a. Berapa probabilitas cangkir akan berisi lebih besar dari 231 ml ?
b. Berapa peluang suatu cangkir berisi antara 198 dan 216 ml ?
c. Berapa cangkir yang akan kepenuhan (sehingga tumpah) bila digunakan 1000 cangkir
berukuran 237 ml ?
d. Dibawah nilai berapakah terdapat 25 % dari jumlah cangkir dengan isi terkecil ?
7. Diameter sebelah dalam suatu cincin torak berdistribusi normal dengan rata-rata 10 cm dan
simpangan baku 0,03 cm
a. Berapa proporsi cincin yang mempunyai diameter dalam melebihi 10,075 cm?
b. Berapa peluang suatu cincin torak berdiameter dalam antara 9,97 dan 10,03 cm ?
c. Jika spesifikasi ( 10 d ) cm , tentukanlah harga d sehingga spesifikasi tersebut
mencakup 90 % dari hasil produksi ?
8. Umur rata-rata sejenis mesin 10 tahun dengan simpangan baku 2 tahun, pabriknya akan
mengganti dengan gratis semua mesin yang rusak selama masa garansi. Bila pabrik tersebut
bersedia hanya mengganti 3 % dari mesin rusak, berapa lamakah masa garansi yang
seharusnya ditawarkan bila umur mesin berdistribusi normal ?
9. Bila nilai ujian statistik suatu kelas berdistribusi normal dengan rata-rata 74 dan simpangan
baku 7,9 hitunglah :
a. Nilai lulus terendah bila mahasiswa dengan nilai 10 % terendah mendapatkan E ( gagal)
b. Nilai B tertinggi bila mahasiswa dg. nilai 5 % tertinggi mendapat A ?
c. Nilai B terendah bila mahasiswa dengan nilai 10 % tertinggi mendapat A dan 25 %
berikutnya mendapat B ?
10. IQ 600 pelamar ke suatu perguruan tinggi berdistribusi hampiran normal dengan rataan 115
dan simpangan baku 12. Bila perguruan tinggi itu hanya menerima yang mempunyai IQ
paling rendah 95, berapa banyakkah pelamar yang akan ditolak jika hanya didasarkan atas
ketentuan ini tanpa memandang kemampuan yang lain ?
Purnomo
X np
npq
29.5 40
2.14
4.899
Soal-soal :
1. Peluang seseorang sembuh dari suatu operasi jantung adalah 0,9 berapakah peluang antara
dan termasuk 84 dan 95 dari 100 orang yang dioperasi akan sembuh ?
2. Suatu perusahaan farmasi menyatakan bahwa suatu jenis obat dapat menyembuhkan rata-rata
80% penderita suatu penyakit darah. Untuk memeriksa kebenarannya badan pengujian
pemerintah mencoba obat tersebut pada sampel 100 penderita dan akan memutuskan obat itu
baik bila 75 penderita atau lebih sembuh.
a. Berapakah probabilitas bahwa obat itu akan ditolak padahal probabilitas sembuh
sesungguhnya benar 0,8 ?
b. Berapakah peluang bahwa obat itu akan diterima badan pemerintah padahal peluang
sembuh serendah 0,7 ?
3. Suatu proses produksi menghasilkan 10% barang yang cacat. Bila 100 barang diambil secara
acak dari proses tersebut, berapa peluang banyaknya yang cacat : a. melebihi 13 ? b.
kurang dari 8?
4. Peneliti di George Washington University dan National Institute of Health menyatakan kirakira 75% orang percaya bahwa 'obat penenang amat membantu membuat orang menjadi
lebih tenang dan santai'. Dari 80 orang yang diwawancarai, berapa peluangnya bahwa
a. paling sedikit 50 yang berpendapat demikian ?
b. paling banyak 56 yang berpendapat demikian ?
5. Seperenam dari mahasiswa pria tahun pertama yang masuk ke suatu perguruan tinggi negeri
di suatu propinsi berasal dari luar propinsi itu. Bila para mahasiswa dimasukkan secara acak
ke asrama (semua harus masuk asrama) 180 orang dalam satu gedung, berapakah peluang
bahwa dalam suatu gedung tertentu, seperlima mahasiswa berasal dari luar propinsi itu ?
6. Suatu perusahaan farmasi mengetahui bahwa rata-rata 5% dari sejenis pil mempunyai
campuran di bawah kekuatan minimum, sehingga tak memenuhi persyaratan. Berapakah
peluang bahwa kurang dari 10 dalam contoh 200 pil tak memenuhi persyaratan?
7. Menurut statistik yang dikeluarkan National Highway Traffic Safety Administration dan
National Safety Council di AS.pada malam Minggu rata-rata 1 dari setiap 10 pengemudi di
jalan dalam keadaan mabuk. Bila 400 pengemudi diperiksa secara acak pada Sabtu malam,
berapa peluangnya bahwa banyaknya pengemudi yang mabuk
a. kurang dari 32 ?
b. lebih dari 49 ?
c. paling sedikit 35 tapi kurang dari 47 ?
Agus
Statistika 1 - 91
Purnomo
( ) X 1 e x dx
0
; untuk > 0
Variansi
( 2 ) =
2
Untuk setiap integer positif n :
(n) (n 1) !
1
2
(1) = 1
Agus
Statistika 1 - 92
Purnomo
f(x)
1,0
1, 1
0,5
2, 1
4, 1
x
0
Distribusi Gamma
Distribusi Gamma yang khas :
Distribusi Gamma yang khusus dengan = 1, distribusi gamma berubah menjadi Distribusi
Eksponensial.
Distribusi Eksponensial, Variabel acak kontinu X berdistribusi Eksponensial dengan parameter
, bila fungsi padatnya berbentuk :
1
11 x /
f(x)
x
e
untuk x > 0
1
(1)
= 0
untuk yang lainnya
sehingga :
1 x/
untuk x 0
f ( x)
0
dengan > 0
untuk x lainnya
;
2
Variansi ( ) =
2
Purnomo
distribusi eksponensial adalah parameter , kebalikan dari parameter pada distribusi Poisson.
Parameter yang penting adalah rataan waktu antara kejadian. Teori keandalan (reliabilitas)
yang menyangkut kegagalan peralatan sering memenuhi proses Poisson ini, di sini disebut
rataan waktu antara kegagalan. Banyak kerusakan peralatan memenuhi proses Poisson, dan
karena itu distribusi eksponenisal dapat diterapkan di situ.
Pada contoh berikut diberikan suatu penerapan sederhana distribusi eksponensial pada soal
dalam keandalan. Distribusi binomial juga berperan dalam penyelesaiannya.
Contoh soal eksponensial:
1. Misalkan suatu sistem mengandung sejenis komponen yang daya tahannya dalam tahun
dinyatakan oleh variabel acak T yang berdistribusi eksponensial dengan parameter waktu
rataan sampai gagal = 5. Bila sebanyak 5 komponen tersebut dipasang dalam sistem yang
berlainan, berapakah peluang bahwa paling sedikit 2 masih akan berfungsi pada akhir tahun
kedelapan ?
Jawab
Peluang bahwa suatu komponen tertentu masih akan berfungsi setelah 8 tahun adalah :
P(T > 8)
t
1 5
e
dt
5 8
8
=
e 5
0.2
Misalkan X menyatakan banyaknya komponen yang masih berfungsi setelah 8 tahun. Dengan
menggunakan distribusi binomial diperoleh :
b ( x 2 ; 5 , 0.2 ) = 1 B(1; 5; 0.2)
= 0.2627
2. Rata - rata 3 truk yang datang perjam untuk membongkar muatan pada suatu gudang. Berapa
probabilitas waktu antar kedatangan truk-truk berikutnya :
a) Lebih kecil dari 5 menit ?
= 1/3
;
5 menit
=
1/12 jam
1
1/12 3x
dx 1 e 4 0,221
3e
0
9
3x
4 0,105
3
e
dx
3/ 4
Pentingnya distribusi gamma terletak pada kenyataan bahwa distribusi ini merupakan suatu
keluarga distribusi yang distribusi lainnya merupakan hal khusus. Tetapi gamma sendiri
mempunyai terapan penting dalam waktu menunggu dan teori keandalan. Jika distribusi
eksponensial memberikan waktu sampai terjadinya kejadian Poisson (atau waktu antara kejadian
Poisson) maka waktu (atau ruang) terjadinya sampai sejumlah tertentu kejadian Poisson terjadi
merupakan variabel acak yang fungsi padatnya diperikan oleh distribusi gamma. Jumlah tertentu
kejadian ini ialah parameter dalam fungsi padat gamma. Karena itu mudah dipahami bahwa
bila = 1 hal khusus distribusi eksponensial berlaku. Fungsi padat gamma dapat diperoleh dari
hubungannya dengan proses Poisson mirip dengan cara memperoleh fungsi padat eksponensial.
Berikut adalah contoh numerik penggunaan distribusi gamma dalam penerapan waktu
menunggu.
Contoh soal :
Agus
Statistika 1 - 94
Purnomo
Misalkanlah bahwa hubungan telepon tiba di suatu gardu (sentral) memenuhi proses Poisson
dengan rata-rata 5 hubungan masuk per menit. Berapakah peluangnya bahwa setelah semenit
berlalu baru 2 sambungan masuk ke gardu tadi?
Solusi : = 1/ = 1/5
dan = 2
Misalkan variabel acak X menyatakan waktu dalam menit yang berlalu sebelum 2 hubungan
masuk.
x 1
x /
xe
dx
P (X x) =
2
0
1
5x
P (X 1) = 25 x e
dx
0
= [ 1 e 5(1) (1+5) ] = 0.96
/2
2 ( / 2)
x /21e x/2
x0
f(x)
untuk x lainnya
Purnomo
( ) 1 1
x (1 x) untuk 0 x 1, 0, 0
f(x) ( )()
0
Mean
Variansi
( )2 ( 1)
( 2 ) =
f(x)
2
x
0
0,2
0,4
0,6
0,8
1,0
0,60 60 %
3 2
Purnomo
sehingga :
1/2
2
3
4 1/2
12 x (1 x) dx 4x 3x |
0
0
5
0,3125
16
1 x
untuk x 0, 0, 0
f(x) x e
0
untuk x lainnya
Distribusi Weibull ( = 1)
0,5
Jika
Agus
Statistika 1 - 97
1,0
1,5
Distribusi Eksponensial
Purnomo
Jika
Mean
Variansi
>
1
()
( 2)
1
1/ 1
=
2 / 3 1
2
1
1
=
1/ (1 1 / )
=
(0,1)-2 (3) =
200
jam
b. Probabilitas masa hidup battery akan lebih besar dari 300 jam ?
0,5
0,5
f(t) (0,05) t 0,5e0,1 t dt e0,1(300) 0,177
300
Soal-soal :
1. Bila peubah acak X berdistribusi gamma dengan =2 dan =1, hitunglah P(1,8 < X < 2,4).
2. Di suatu kota, pemakaian air sehari (dalam jutaan liter) berdistribusi hampiran gamma
dengan =2 dan =3. Bila kemampuan menyediakan air 9 juta liter sehari, berapakah
peluang pada suatu hari tertentu persediaan air tidak mencukupi ?
3. Misalkan waktu, dalam jam, yang diperlukan untuk memperbaiki pompa panas berbentuk
peubah acak X berdistribusi gamma dengan parameter =2 dan =1/2. Berapa peluangnya
bahwa perbaikan berikutnya akan memerlukan
a. paling lama 1 jam?
b. paling sedikit 2 jam?
4. Di suatu kota, pemakaian tenaga listrik harian, dalam jutaan kilowatt-jam, berbentuk variabel
acak X yang berdistribusi gamma dengan rataan = 6 dan variansi 2 = 12.
a. Cari nilai dan .
b. Cari peluangnya bahwa pada suatu hari tertentu pemakaian harian tenaga listrik akan
melebihi 12 juta kilowatt-jam.
5. Lamanya waktu untuk melayani seseorang di suatu kafetaria merupakan suatu variabel acak
berdistribusi eksponensial dengan rataan 4 menit. Berapakah peluang seseorang akan
dilayani dalam waktu kurang dari 3 menit pada paling sedikit 4 dari 6 hari berikut?
6. Umur dalam tahun suatu jenis tombol listrik berdistribusi eksponensial dengan tingkat
kegagalan = 2. Bila 100 alat semacam ini dipasang dalam sistem yang berlaianan,
berapakah peluang paling banyak 30 akan gagal selama tahun pertama ?
7. Para insinyur pabrik busi merk STN untuk kendaraan roda empat menyatakan bahwa
umur pakai busi buatan (dalam jam ) memiliki random variabel yang mengikuti distribusi
weibull, dengan = 0,2 dan = 0,4 kita sebagai konsumen busi tersebut ingin mengetahui
berapa ekspektasi umur pakai dan standar deviasinya serta probabilitas busi tersebut akan
berumur lebih dari 700 jam ?
Agus
Statistika 1 - 98
Purnomo
8. Misalkan bahwa panjang umur, dalam tahun, baterai alat bantu pendengaran berbentuk
variabel acak yang berdistribusi Weibull dengan =1/2 dan =2.
a. Berapa lama baterai tersebut dapat diharapkan tahan ?
b. Berapa peluangnya baterai tersebut masih dapat dipakai setelah 2 tahun ?
9. Variabel acak kontinu X berdistribusi beta dengan parameter dan bila fungsi padatnya
( ) 1 1
x (1 x) untuk 0 x 1, 0, 0
f(x) ( )()
0
Bila proporsi suatu televisi merk tertentu membutuhkan perbaikan selama tahun pertama
pemakaiannya merupakan suatu peubah acak berdistribusi beta dengan =3 dan = 2,
berapakah peluang paling sedikit 80 % televisi baru merk tersebut yang terjual memerlukan
perbaikan dalam tahun pertama pemakaiannya ?
10. Menurut suatu penelitian yang diterbitkan oleh sekelompok sosiolog di University of
Massachusetts, sekitar 49 % pengguna Vallum di negara bagian Massachusetts adalah
karyawan berkerah putlh. Berapakah peluangnya bahwa sebanyak 482 sampal 510 dari 1000
pengguna Valium yang dipilih secara acak adalah karyawan berkerah putih ?
11. Distribusi eksponensial sering digunakan pada waktu menunggu antara keberhasilan dalam
proses Poisson. Bila banyaknya sambungan telepon per jam yang diterima oleh suatu sentral
telepon berbentuk variabel acak Poisson dengan parameter = 6, dan kita tahu bahwa waktu,
dalam jam, antara sambungan yang berhasil berdistribusi eksponensial dengan parameter =
1/6. Berapa peluangnya menunggu lebih dari 15 menit antara sembarang 2 sambungan yang
berturutan ?
12. Suatu Pabrik mesin besar ingin membeli paku keling dari satu di antara dua pabrik yang ada.
Diinginkan daya tahan tiap keling melebihi 10.000 psi. Dua pabrik (A dan B) memasukkan
penawaran. Keduanya mempunyai keling yang daya tahannya berdistribusi normal. Rataan
daya tahan dari masing-masing A dan B 14.000 psi dan 13.000 psi dengan simpangan baku
2000 psi dan 1000 psi. Pabrik yang mana yang menghasilkan, pada rata-ratanya, paling
sedikit jumlah keling yang cacat ?
13. Menurut Consumers Digest terbitan Mei/Juni 1981, hsl. sensus menunjukkan bahwa di tahun
1978 hampir 53 % dari semua rumah tangga di AS hanya terdiri atas 1 atau 2 orang.
Misalkanlah bahwa persentasi ini masih berlaku sekarang, berapakah peluangnya sebanyak
490 sampai 515 dari 1000 rumah tangga di AS yang dipilih secara acak akan terdiri atas 1
atau 2 orang ?
14. Umur sejenis alat menurut iklannya mempunyai tingkat kegagalan 0,01 per jam. Tingkat
kegagalannya tdk. berubah & mengikuti dist. eksponensial.
a. Berapa rataan waktunya sampai gagal ?
b. Berapa peluangnya bahwa 200 jam berlalu sebelum suatu kegagalan diamati?
15. Dalam pabrik pemrosesan kimia penting dijaga agar kualitas dari gugusan hasil jenis tertentu
berada di atas 80 %. Bila kualitasnya di bawah 80 % untuk jangka waktu yang agak panjang
maka perusahaan akan merugi. Gugus hasil yang cacat yang muncul sekali~sekali tidak
menimbulkan persoalan, jadi tidak perlu dirisaukan. Tetapi bila beberapa gugus yang cacat
dihasilkan sehari maka pabrik diberhentikan dan perbaikan dilakukan. Diketahui bahwa
hasilnya berdistribusi normal dengan simpangan baku 4 %.
Agus
Statistika 1 - 99
Purnomo
a. Berapakah peluangnya 'lampu merah palsu menyala' (hasil di bawah 80%) padahal rataan
hasilnya 85 % ?
b. Berapa peluangnya bahwa iugus hasil berada di atas 80% padahal rataan hasil 79 % ?
16. Pandanglah tingkat kegagalan suatu komponen listrik sekali setiap 5 jam. Ingin diselidiki
waktu yang diperlukah agar 2 komponen gagal.
a. Andaikan di sini distribusi gamma berlaku, berapakah rataan waktu yang diperlukan
untuk kegagalan 2 komponen ?
b. Berapakah peluangnya 12 jam telah berlalu sebelum 2 komponen gagal ?
17. Pemuaian suatu batang baja bila diberi beban tertentu telah diketahui berdistribusi normal
dengan rataan 0,05 cm dan = 0,01 cm. Carilah peluangnya bahwa pemuaian
a. lebih dari 0,1 cm; b. kurang dari 0,04 cm; c. antara 0,025 dan 0,065 cm.
18. Suatu satelit terkendali diketahui mempunyai error (jarak dari sasaran) yang berdistribusi
normal dengan rataan nol dan simpangan baku 4 m. Pembuat satelit tersebut menetapkan
'keberhasilan' bila peluncuran menempatkan satelit dalam jarak 10 m dari sasaran. Hitunglah
peluangnya satelit gagal.
19. Seorang tukang merencanakan menguji sejenis damar yang dikembangkan di laboratorium
untuk menentukan waktu yang diperlukan sebelum perekatan terjadi. Diketahui bahwa
rataan waktu untuk merekat adalah 3 jam dan simpangan baku 0,5 jam. Hasil dianggap tidak
memuaskan bila waktu merekatnya kurang dari 1 jam ataupuh lebih dari 4 jam. Beri
komentar tentang kegunaan damar tadi. Berapa seringkah hasilnya dianggap tidak
memuaskan ?
Agus
Statistika 1 - 100
Purnomo
Negatif
Binomial
p,k
k=1
Geometrik
Hypergeometrik
N,n,k
np
n
Poisson
k
N
0,5
Binomial
n.p
np
npq
Bernoulli
Normal
Normal
Standar
Gamma
1
Chi - squared
Exponential
1
Weibull
Purnomo
geometrik, yaitu :
Parameter Lokasi , menunjukkan suatu titik lokasi pada absscissa ( x axis) dari nilai range
distribusi. Biasanya merupakan titik tengah (seperti, mean distribusi normal) atau titik
terendah dari range distribusi. Pada beberapa kasus, parameter lokasi kadang-kadang disebut
parameter geser (shift parameters), karena bila berubah, maka distribusi akan berubah ke kiri
atau ke kanan tanpa ada perubahan yang lain.
Parameter Skala , menentukan skala (atau unit) dari pengukuran nilai dalam suatu range
distribusi. Perubahan nilai menyebabkan mengecil (compresses) atau membesar (expands)
distribusi yang berhubungan tanpa merubah bentuk dasarnya.
Parameter Bentuk , menentukan jarak dari lokasi dan skala, bentuk dasar dari suatu distribusi
dalam famili umum atau distribusi yang bersangkutan. Perubahan menyebabkan perubahan
padaaproperti distribusi (seperti skewness), perubahan ini lebih fundamental dari pada perubahan
lokasi atau skala. Beberapa distribusi, seperti Exponensial dan Normal, tidak mempunyai
parameter bentuk, sementara distribusi yang lain seperti Beta mempunyai dua parameter bentuk.
Agus
Statistika 1 - 102
Purnomo