I. PENDAHULUAN
Probabilitas dan statistik digunakan dibanyak bidang disiplin ilmu, termasuk juga dibidang
keteknikan (engineering). Sebagai controh, dibidang teknik elektro, sinyal dan derau (signal
and noise) sering dianalisa dengan menggunakan teori probabilitas dan statistik. Insinyur-
insinyur sipil menggunakan statistik dan probabilitas untuk menguji dan memperhitungkan
adanya variasi-variasi pada material yang dipakai. Probabilitas dan statistik juga telah
digunakan dibidang teknik kimia untuk menganalisa data eksperimental dan untuk
mengendalikan dan meningkatkan proses-proses kimia.
Pendekatan klasik dari probabilitas telah dikenal secara luas sejak abad ke 12. Ide atau
interpretasi dari pendekatan ini sangat sesuai dengan intuisi normal kita, dan juga biasanya
tidak sulit untuk divisualisasikan sehingga memudahkan pemahaman tentang probabilitas.
Untuk membahas pendekatan ini, mari kita lihat illustrasi berikut. Misalkan pada setumpuk
kartu terdapat 52 buah kartu dimana 13 diantaranya adalah kartu sekop. Jika kita ambil
(secara acak) sebuah kartu dari tumpukan kartu tersebut, berapakah peluang atau probabilitas
untuk mendapatkan kartu sekop? Implikasi dari kata-kata “secara acak” adalah bahwa setiap
kartu berpeluang sama untuk dipilih (simetris), dan proporsi atau perbandingan dari kartu
yang mengandung sekop adalah 13/52 = ¼. Intuisi kita mengenai simetri menyarankan
bahwa probabilitas untuk mendapatkan sebuah kartu sekop adalah sebanding dengan proporsi
tersebut.
Interpretasi intuitif yang sama juga berlaku untuk setiap prosedur random yang memiliki
simetri seperti illustrasi diatas. Secara umum, ekspresi dari intuisi ini menuntun kita pada
definisi dari probabilitas sebagai berikut:
Jika suatu peristiwa dapat terjadi dalam h cara dari total n cara yang mungkin, dan n cara ini
memiliki probabilitas yang sama (simetris), maka probabilitas dari peristiwa tersebut adalah
h/n.
Contoh 1.1: Berapakah probabilitas dari munculnya ‘angka rupiah’ pada satu kali pelemparan
uang logam? Uang logam dapat muncul secara dua cara yaitu ‘angka rupiah’ dan
‘lambang’. Jika uang logam tersebut seimbang dan tidak berat sebelah (unbiased),
kita dapat menganggap bahwa kedua cara tersebut memiliki probabilitas yang
sama untuk terjadi. Karena munculnya ‘angka rupiah’ dapat terjadi hanya dalam
satu cara dari dua cara tersebut, maka probabilitas dari munculnya ‘angka rupiah’
adalah ½.
Contoh 1.2: Berapakah probabilitas dari munculnya angka 3 pada satu kali pelemparan
sebuah dadu? Dadu dapat jatuh secara enam cara dan menghasilkan angka-angka
1, 2, 3, 4, 5 atau 6. Jika dadu tersebut seimbang (tidak berat sebelah), kita dapat
menganggap bahwa keenam cara tersebut memiliki probabilitas yang sama untuk
terjadi. Karena munculnya angka 3 dapat terjadi hanya dalam satu cara dari enam
cara tersebut, maka probabilitas dari munculnya angka 3 adalah 1/6.
Contoh 1.3: Berapakah probabilitas dari munculnya angka 3 atau 4 pada satu kali pelemparan
sebuah dadu? Karena munculnya angka 3 atau 4 dapat terjadi dalam dua cara dari
enam cara, maka probabilitas dari munculnya angka 3 dan 4 adalah 2/6 atau 1/3
(disini kembali kita menganggap bahwa dadu tersebut seimbang).
Pendekatan klasik mensyaratkan adanya simetri untuk menentukan probabilitas. Jika suatu
prosedur random tidak memiliki simetri (atau kita tidak tahu mengenai kesimetriannya),
bagaimana kita mendefinisikan probabilitas? Contohnya pada kasus pelemparan dadu. Jika
dicurigai bahwa dadu tersebut tidak sempurna (tidak seimbang), sehingga peluang untuk
munculnya angka 1, 2, 3, 4, 5 dan 6 adalah tidak sama (tidak simetri), bagaimana sekarang
probabilitas dari munculnya angka 3?
Untuk keperluan penentuan probabilitas pada kasus pelemparan dadu diatas, kita dapat
memperkenalkan kesimetrian melalui cara lain. Misalkan bahwa pelemparan dadu tersebut
dilakukan berulang-ulang sebanyak n kali (dimana n adalah bilangan yang cukup besar), dan
misalkan juga h adalah banyaknya kemunculan angka 3. Maka (anggap bahwa setiap
pelemparan dilakukan pada kondisi yang sama) simetri diantara setiap pelemparan tersebut
menyarankan bahwa probabilitas dari munculnya angka 3 adalah h/n.
Pengulangan pengamatan seperti contoh diatas berlaku juga untuk prosedur-prosedur random
lainnya. Dengan demikian, secara umum, definisi dari probabilitas melalui pendekatan
frekwensi relatif adalah sebagai berikut:
Jika setelah n pengamatan, dimana n adalah bilangan yang sangat besar, kejadian dari suatu
peristiwa adalah h kali, maka probabilitas dari peristiwa tersebut adalah h/n. Disini,
probabilitas adalah limit dari frekwensi relatif dengan banyaknya pengamatan yang
bertambah besar secara tak berhingga.
Walaupun kita tidak dapat membuat pengamatan sebanyak tak berhingga, dalam prakteknya,
kita dapat membuat pengamatan yang jumlahnya cukup besar sehingga frekwensi relatif dari
suatu peristiwa akan memberikan perkiraan untuk probabilitas dari peristiwa tersebut.
Semakin banyak jumlah pengamatan, perkiraan untuk probabilitas dari suatu peristiwa akan
semakin andal.
Contoh 1.4: Jika pada 1000 kali pelemparan sebuah uang logam menghasilkan, misalnya, 529
kali ‘angka rupiah’, maka frekwensi relatif dari munculnya ‘angka rupiah’ dalam
1000 kali pelemparan adalah 0.529.
Contoh 1.5: Jika pada 300 kali pelemparan sebuah dadu menghasilkan, misalnya, 51 kali
angka 4, maka frekwensi relatif dari munculnya angka 4 dalam 300 kali pelemparan
adalah 51/300 = 0.170.
Pada contoh pelemparan uang logam diatas (Contoh 1.4), jika pelemparan dilakukan
sebanyak n kali (dimana n adalah bilangan yang sangat besar), maka frekwensi relatif dari
munculnya ‘angka rupiah’ akan sangat mungkin mendekati 0,5 atau ½. Dengan demikian
probabilitas dari munculnya ‘angka rupiah’ akan diberikan oleh frekwensi relatif dari
peristiwa tersebut, yaitu ½ (perhatikan bahwa hasil ini sesuai dengan intuisi normal kita).
Demikian juga pada contoh pelemparan dadu (Contoh 1.5), jika pelemparan dilakukan
sebanyak n kali (dimana n adalah bilangan yang sangat besar), maka frekwensi relatif dari
munculnya angka 4 juga akan sangat mungkin mendekati 0.1667 atau 1/6, yang juga adalah
sesuai sesuai dengan intuisi kita.
Pendekatan klasik dan pendekatan frekwensi relatif dari probabilitas yang telah diuraikan
diatas memiliki kekurangan, karena pada kenyataanya banyak prosedur random yang tidak
memiliki simetri atau pengamatannya tidak bisa diulangi (nonrepeatable). Contoh klasik
untuk hal ini adalah: pacuan kuda, pertandingan sepak bola, dll.
Lebih lanjut, pada pendekatan klasik, adanya perkataan “probabilitas yang sama” dalam
definisinya membuat definisi probabilitas menjadi melingkar, atau kita telah menggunakan
konsep probabilitas untuk mendefinisikan probabilitas itu sendiri. Demikian juga pada
CATATAN KULIAH – PROBABILITAS DAN STATISTIK (TKE 203) Hal. 3
BAB I PENDAHULUAN
Statistik deskriptif merupakan tahapan statistik yang membahas tentang penyajian dan
analisis suatu data tanpa diikuti oleh penarikan kesimpulan. Pada tahap ini dilakukan
penyusunan dan pengaturan data agar ia mudah dibaca dan dipahami. Untuk keperluan ini,
kita dapat menyajikan data dalam bentuk tampilan tabel atau grafik untuk melukiskan data
tersebut. Lebih lanjut, agar data mudah dibaca dan dipahami, kita juga dapat meringkasnya
dalam bentuk angka-angka seperti nilai rata-rata, nilai tengah, median, simpangan baku,
varians, dll. Uraian tentang statistik deskriptif akan dibahas lebih lanjut pada Bab II.
Didalam statistik, kita biasanya tertarik untuk memperoleh informasi mengenai suatu
populasi. Oleh karena populasi biasanya berukuran sangat besar, sering tidak mungkin atau
tidak praktis untuk mengamati seluruh populasi tersebut. Pada kasus-kasus seperti ini,
informasi mengenai populasi dapat diperoleh dengan cara menyelidiki sebagian kecil dari
populasi yang biasa kita sebut dengan sampel. Agar sampel dapat memberikan informasi
tentang populasi, ia haruslah representatif atau mewakili keseluruhan populasi tersebut.
Sample yang representatif dapat diperoleh dengan cara memilih sampel secara acak
(random), yang artinya bahwa setiap sampel memiliki peluang atau probabilitas yang sama
untuk dipilih sebagai sampel.
Jika sampel merupakan perwakilan dari populasi, kesimpulan penting tentang populasi
seringkali dapat diperoleh dari pengamatan sampel tersebut. Tahapan statistik ini, yang
berhubungan dengan penarikan kesimpulan tentang populasi melalui analisis sampelnya,
biasa disebut statistik inferensi. Oleh karena inferensi yang demikian tidaklah sepenuhnya
pasti, konsep probabilitas sering digunakan untuk menyatakan kesimpulan mengenai suatu
populasi. Statistik inferensi akan dijelaskan lebih lanjut di Bab V.
Seperti yang telah disinggung sebelumnya di Bab I, statistik deskriptif membahas masalah
penyajian data sehingga ia menjadi lebih mudah dipahami. Untuk keperluan ini kita dapat
menyajikan data dalam bentuk tabel dan grafik ataupun meringkasnya dalam bentuk angka-
angka seperti nilai rata-rata, median, simpangan baku, varians, dll.
Untuk data yang ukurannya besar, sering sangat berguna untuk membaginya kedalam kelas
atau kelompok dan menetapkan banyaknya jumlah data yang termasuk dalam setiap kelas
yang biasa disebut frekwensi kelas (class frequency). Pengaturan data seperti ini (yaitu
dengan menggunakan kelas-kelas dan frekwensi kelasnya) dan disusun dalam bentuk tabel
biasa disebut tabel frekwensi (frequency table).
Tabel 2.1 menunjukkan data untuk usia dari 200 lampu pijar. Data pada tabel tersebut terlihat
agak sulit untuk dipahami karena jumlahnya yang cukup banyak. Untuk membuat data
tersebut menjadi lebih mudah untuk dimengerti, kita dapat mengaturnya kedalam bentuk
tabel frekwensi. Tabel frekwensi untuk data dari Tabel 2.1 diperlihatkan pada Tabel 2.2.
Kolom kedua dari Tabel 2.2 menunjukkan interval-interval kelas, sedangkan kolom ketiga
menunjukkan frekwensinya. Kelas atau kelompok pertama, misalnya, terdiri atas lampu-
lampu dengan usia dari 500 sampai 610 jam. Oleh karena terdapat 2 lampu pijar yang
usianya termasuk kedalam kelas ini, maka frekwensi kelas yang bersesuaian adalah 2.
Nilai-nilai ujung dari suatu interval kelas (class interval) disebut batas-batas kelas (class
boundaries). Sebagai contoh, 500 dan 610 berturut-turut adalah batas kelas bawah dan atas
dari interval kelas pertama pada Tabel 2.2. Pada penentuan batas-batas kelas, kita
mengadopsi konvensi pencakupan ujung-kiri (left-end inclusion convention), yang
mengatakan bahwa suatu interval kelas mengandung nilai batas bawah tetapi tidak nilai batas
atasnya. Sebagai contoh, interval kelas 500 – 610 akan mengandung semua nilai yang lebih
besar atau sama dengan 500 dan kurang dari 610.
Ukuran atau lebar dari suatu interval kelas merupakan selisih antara batas kelas bawah dan
atas, dan biasa disebut sebagai lebar kelas (class width) atau ukuran kelas (class size). Lebar
dari setiap kelas haruslah konstan dari satu kelas ke kelas lainnya. Sebagai contoh, untuk data
pada Tabel 2.2, ukuran atau lebar kelas adalah 110.
1067 919 1196 785 1126 936 918 1156 920 948
855 1092 1162 1170 929 950 905 972 1035 1045
1157 1195 1195 1340 1122 938 970 1237 956 1102
1022 978 832 1009 1157 1151 1009 765 958 902
923 1333 811 1217 1085 896 958 1311 1037 702
521 933 928 1153 946 858 1071 1069 830 1063
930 807 954 1063 1002 909 1077 1021 1062 1157
999 932 1035 944 1049 940 1122 1115 833 1320
901 1324 818 1250 1203 1078 890 1303 1011 1102
996 780 900 1106 704 621 854 1178 1138 951
1187 1067 1118 1037 958 760 1101 949 992 966
824 653 980 935 878 934 910 1058 730 980
844 814 1103 1000 788 1143 935 1069 1170 1067
1037 1151 863 990 1035 1112 931 970 932 904
1026 1147 883 867 990 1258 1192 922 1150 1091
1039 1083 1040 1289 699 1083 880 1029 658 912
1023 984 856 924 801 1122 1292 1116 880 1173
1134 932 938 1078 1180 1106 1184 954 824 529
998 996 1133 765 775 1105 1081 1171 705 1425
610 916 1001 895 709 860 1110 1149 972 1002
1. Tentukan bilangan terbesar dan terkecil dari data, dan tentukan rentangnya (selisih antara
bilangan terbesar dan terkecil).
2. Tentukan banyaknya interval kelas. Banyaknya interval kelas ini biasanya antara 5 sampai
20 tergantung pada ukuran dari data. Berikut adalah formula empiris (aturan Sturges’)
untuk memperkiraan jumlah dari interval kelas:
3. Perkirakan ukuran atau lebar kelas dengan membagi rentang data dengan jumlah interval
kelas. Besarnya ukuran atau lebar kelas ini dapat diperoleh dengan membulatkan hasil
pembagian tersebut (gunakan aturan pembulatan keatas).
1 500 – 610 2
2 610 – 720 9
3 720 – 830 15
4 830 – 940 47
5 940 – 1050 48
6 1050 – 1160 52
7 1160 – 1270 18
8 1270 – 1380 8
9 1380 – 1490 1
Jumlah 200
Contoh 2.1
1. Rentang data
4. Interval-interval kelas
Jawab:
1. Pada Tabel 2.1, data dengan nilai terkecil adalah 521, sedangkan data dengan nilai
terbesar adalah 1425. Dengan demikian rentang data adalah 1425 – 521 = 904.
2. Karena jumlah data ada 200, maka banyaknya interval kelas (menurut aturan Sturges’)
adalah:
(Keterangan: Untuk keperluan pembuatan tabel frekwensi, ambil jumlah interval kelas
sebanyak 9).
4. Untuk interval kelas yang pertama, ambil batas kelas bawah 500. Oleh karena lebar kelas
adalah sebesar 110, maka batas kelas atas 500 + 110 = 610. Dengan demikian interval
kelas yang pertama adalah 500 – 610. Batas kelas bawah untuk interval kelas yang kedua
adalah 610 (yang merupakan batas kelas atas dari interval kelas yang pertama). Maka
batas kelas atas untuk interval kelas yang kedua adalah 610 + 110 = 720. Dengan
demikian interval kelas yang kedua adalah 610 – 720. Interval-interval kelas yang
berikutnya dapat ditentukan dengan cara yang sama, dan hasilnya diperlihatkan pada
Tabel 2.2 (kolom kedua).
5. Untuk interval kelas yang pertama, oleh karena terdapat 2 lampu pijar yang usianya
termasuk kedalam kelas ini, maka frekwensi kelas yang bersesuaian adalah 2. Sedangkan
untuk interval kelas yang kedua, frekwensi kelasnya adalah 9 karena terdapat 9 lampu
pijar yang usianya termasuk kedalam kelas ini. Frekwensi-frekwensi untuk interval kelas
berikutnya diperlihatkan pada kolom ketiga dari Tabel 2.2.
Histogram merupakan gambaran grafis dari tabel frekwensi. Histogram adalah suatu grafik
batang dimana frekwensi kelas diplot terhadap nilai-nilai dari kuantitas yang sedang
diselidiki. Pada histogram, tinggi dari batang akan menunjukkan frekwensi kelas dan lebar
batang menunjukkan ukuran atau lebar kelasnya.
Jenis grafik lain yang dapat digunakan untuk menggambarkan tabel frekwensi adalah poligon
frekwensi. Pada poligon frekwensi, frekwensi kelas diplot (dengan menggunakan grafik
garis) terhadap nilai titik tengah (midpoint) dari interval kelas. Gambar 2.1 dan 2.2 berturut-
turut menunjukkan histogram dan poligon frekwensi untuk data dari Tabel 2.2.
60
52
50 47 48
40
30
18
20 15
9 8
10
2 1
0
500 610 720 830 940 1050 1160 1270 1380 1490
60
50
40
30
20
10
0
555 665 775 885 995 1105 1215 1325 1435
Frekwensi relatif dari suatu kelas merupakan frekwensi dari kelas tersebut dibagi dengan total
frekwensi dari seluruh kelas (atau banyaknya data). Sebagai contoh, frekwensi relatif dari
kelas 940 – 1050 pada Tabel 2.2 adalah 48/200 = 0.24 = 24%. Jumlah dari frekwensi relatif
dari seluruh kelas akan selalu 1 atau 100%. Jika frekwensi pada Tabel 2.2 diganti dengan
frekwensi relatifnya, maka hasilnya adalah seperti yang diperlihatkan pada Tabel 2.3. Tabel
2.3 ini biasa disebut sebagai tabel frekwensi-relatif (relative-frequency table).
Tabel 2.3 Tabel Frekwensi Relatif Untuk Data Dari Tabel 2.2
Jumlah 1
Frekwensi kumulatif (sampai pada dan termasuk suatu interval kelas tertentu) diperoleh
dengan menjumlahkan semua frekwensi dari kelas-kelas dengan nilai yang lebih kecil dari
batas kelas atas interval kelas tersebut. Sebagai contoh, frekwensi kumulatif sampai pada dan
termasuk interval kelas 720 – 830 adalah 2 + 9 + 15 = 26. Frekwensi kumulatif sampai pada
dan termasuk interval kelas yang terakhir haruslah sama dengan frekwensi total. Tabel yang
menyajikan frekwensi kumulatif demikian biasa disebut dengan tabel frekwensi kumulatif
(cumulative-frequency table). Tabel 2.4 memperlihatkan contoh dari tabel frekwensi
kumulatif untuk data dari Tabel 2.2.
Jika frekwensi kumulatif pada Tabel 2.4 diganti dengan frekwensi kumulatif relatifnya, maka
hasilnya adalah seperti yang diperlihatkan pada Tabel 2.5. Tabel 2.5 ini biasa disebut sebagai
tabel frekwensi-kumulatif relatif (relative cumulative-frequency table).
Tabel 2.4 Tabel Frekwensi Kumulatif Untuk Data Dari Tabel 2.2
1 500 – 610 2
2 610 – 720 11
3 720 – 830 26
4 830 – 940 73
5 940 – 1050 121
6 1050 – 1160 173
7 1160 – 1270 191
8 1270 – 1380 199
9 1380 – 1490 200
Tabel 2.5 Tabel Frekwensi-Kumulatif Relatif Untuk Data Dari Tabel 2.2
Representasi grafis dari tabel frekwensi relatif dapat diperoleh dari histogram dan poligon
frekwensi dengan hanya mengganti skala pada sumbu vertikal dari frekwensi menjadi
frekwensi relatif. Dengan demikian kita akan mendapatkan grafik yang persis sama seperti
histogram dan poligon frekwensi. Grafik ini biasa disebut sebagai histogram frekwensi relatif
(relative-frequency histogram) dan poligon frekwensi relatif (relative-frequency polygon).
Pada statistik deskriptif, kita kadang-kadang juga tertarik untuk mengetahui gambaran grafis
dari tabel frekwensi kumulatif. Gambaran grafis ini pada umumnya berupa plot dari
frekwensi kumulatif terhadap batas kelas atas dan biasa disebut dengan poligon frekwensi
kumulatif (cumulative-frequency polygon) atau ogive. Contoh dari poligon frekwensi
kumulatif diperlihatkan pada Gambar 2.3, yang merupakan poligon frekwensi kumulatif dari
dari data pada Tabel 2.4.
250
200
150
100
50
Dengan cara mengganti skala pada sumbu vertikal dengan frekwensi kumulatif relatifnya,
poligon frekwensi kumulatif seperti pada Gambar 2.3 dapat diubah menjadi apa yang disebut
sebagai poligon frekwensi kumulatif relatif (relative cumulative-frequency polygon) atau
ogive persentase (percentage ogive). Contoh dari poligon frekwensi kumulatif relatif
diperlihatkan pada Gambar 2.4, yang merupakan gambaran grafis untuk tabel frekwensi
kumulatif relatif dari Tabel 2.5. Dari Gambar 2.4 terlihat bahwa frekwensi kumulatif relatif
dari lampu yang berusia dibawah 1050 jam adalah 60.5%, yang menunjukkan bahwa 60.5%
dari seluruh lampu pijar memiliki usia dibawah 1050 jam.
1.2
0.8
0.6
0.4
0.2
Mean
Nilai rata-rata (mean) merupakan kuantitas yang dapat digunakan untuk menggambarkan
pusat (center) dari sekumpulan data.
Misalkan nilai-nilai dari sekumpulan data adalah X1, X2, ..., XN, maka nilai rata-rata dari data
tersebut adalah:
X1 + X 2 + L + X N 1 N
X=
N
=
N
∑X
i =1
i (2)
Contoh 2.2
8 + 3 + 5 + 12 + 10 38
X= = = 7,6
5 5
Jika X1, X2, ..., XK muncul lebih dari satu kali, atau muncul dengan frekwensi berturut-turut
f1, f2, ..., fK, maka nilai rata-rata adalah:
f1 X 1 + f 2 X 2 + L + f K X K 1 K
X=
f1 + f 2 + L + f K
=
N
∑fX
i =1
i i (3)
K
dimana N = ∑ f i merupakan frekwensi total atau banyaknya data.
i =1
Contoh 2.3
Nilai rata-rata dari 5, 8, 6 dan 2 yang muncul dengan frekwensi berturut-turut 3, 2, 4 dan 1
adalah:
Median
Nilai tengah (median) juga merupakan kuantitas yang dapat digunakan untuk menunjukkan
pusat dari data. Median merupakan nilai pertengahan dari data yang diatur menurut urutan
besarnya, yaitu dari nilai terkecil ke nilai terbesar. Jika jumlah data adalah genap, maka nilai
tengah diberikan oleh nilai rata-rata dari kedua data yang terletak ditengah.
Contoh 2.4
Contoh 2.5
Modus
Kuantitas lain yang dapat digunakan untuk menggambarkan pusat dari data adalah modus
(mode). Modus didefinisikan sebagai nilai data yang paling sering muncul (frekwensinya
terbesar).
Contoh 2.6
Contoh 2.7
Modus dari 3, 5, 8, 10, 12, 15 dan 18 adalah tidak ada (tidak memiliki modus).
Contoh 2.8
Modus dari 2, 3, 4, 4, 4, 5, 5, 7, 7, 7 dan 9 adalah 4 dan 7. Pada contoh ini, terdapat dua
modus dan biasa disebut dengan bimodal.
Mean
Untuk data yang dikelompokkan (kedalam tabel frekwensi), nilai rata-rata dapat ditentukan
melalui persamaan (3) dengan Xi adalah nilai tengah (midpoint) dari interval kelas dan fi
adalah frekwensi kelasnya.
Contoh 2.9
Median
Median untuk data yang dikelompokkan dapat ditentukan dengan mengamati histogram dari
data tersebut. Median adalah nilai dari sumbu-x yang berhubungan dengan garis vertikal yang
membagi histogram menjadi dua bagian yang luasnya sama (lihat Gambar 2.5).
Δ1 Δ2
L1 L2
Median
Median = L1 + Δ1 (4)
atau melalui:
Median = L 2 − Δ 2 (5)
dimana L1 dan L2 berturut-turut adalah batas kelas bawah dan atas dari kelas yang
mengandung median.
( N / 2) − f1
Δ1 = c (6)
fm
( N / 2) − f 2
Δ2 = c (7)
fm
dimana:
f1 = jumlah frekwensi semua kelas yang lebih rendah dari kelas yang mengandung median
f2 = jumlah frekwensi semua kelas yang lebih tinggi dari kelas yang mengandung median
c = lebar kelas
Contoh 2.10
Tentukan median untuk data pada Tabel 2.2. Berdasarkan Tabel 2.2 dan histogramnya
(Gambar 2.1), dapat diperkirakan bahwa kelas yang mengandung median adalah kelas
940 − 1050 , maka f1 = 2 + 9 + 15 + 47 = 73 , f 2 = 52 + 18 + 8 + 1 = 79 , f m = 48 , c = 110 . Dengan
menggunakan (6) dan (7), dapat kita hitung:
(200 / 2) − 73
Δ1 = 110 = 61,875
48
(200 / 2) − 79
Δ2 = 110 = 48,125
48
Oleh karena batas kelas bawah (L1) dan batas kelas atas (L2) dari kelas yang mengandung
median berturut-turut adalah 940 dan 1050, maka dengan menggunakan (4), dapat kita hitung
median:
Modus
Pada data yang dikelompokkan, modus dapat dianggap sebagai nilai tengah (midpoint) dari
kelas dengan frekwensi terbesar. Dengan menggunakan anggapan ini, modus sedikit banyak
akan dipengaruhi oleh besarnya lebar kelas (class width).
Contoh 2.11
Tentukan modus untuk data pada Tabel 2.2. Oleh karena interval kelas dengan frekwensi
terbesar adalah 1050 – 1160, maka modus adalah 1105 (nilai tengah dari interval kelas
tersebut).
Rentang
Selain kuantitas-kuantitas yang menggambarkan pusat (center) dari data, kita biasanya juga
tertarik untuk mengetahui kuantitas-kuantitas yang menggambarkan seberapa jauh sebaran
(dispersion) atau variasi (variation) dari nilai-nilai data pada sekumpulan data. Rentang
(range) merupakan ukuran yang paling sederhana yang dapat digunakan untuk
menggambarkan variasi dari nilai-nilai data. Rentang merupakan selisih antara nilai data
terbesar dan terkecil.
Contoh 2.12
Rentang untuk data pada Tabel 2.1 adalah 1425 – 521 = 904.
Varians
Varians (variance) merupakan salah satu kuantitas penting yang menggambarkan variasi dari
nilai-nilai data. Varians dari populasi didefinisikan sebagai:
1 N
∑ (X i − μ )
2
σ2 = (8)
N i =1
dimana:
Persamaan (8) mengatakan bahwa varians adalah nilai rata-rata dari kuadrat dari
penyimpangan setiap nilai data terhadap nilai rata-rata populasi. Varians akan selalu bernilai
positif karena kuadrat dari bilangan nyata positif atau negative akan selalu berharga positif.
Simpangan Baku
1 N
∑ (X i − μ )
2
σ= (9)
N i =1
Oleh karena varians adalah rata-rata kuadrat (mean square) dari penyimpangan-
penyimpangan dari rata-rata populasi, maka simpangan baku merupakan akar rata-rata
kuadrat (root mean square) penyimpangan dari rata-rata populasinya.
Persamaan-persamaan (8) dan (9) dapat digunakan secara langsung untuk menentukan
varians dan simpangan baku jika kita memiliki data lengkap untuk seluruh populasi. Akan
tetapi kita biasanya hanya memiliki data dari sampel yang diambil dari populasi (bukan data
seluruh populasi). Dengan demikian kita hanya dapat menentukan atau mengetahui rata-rata
sampel X (bukan rata-rata populasi μ ).
Untuk sampel yang berukuran besar, rata-rata sampel merupakan aproksimasi yang baik
untuk rata-rata populasi. Dengan perkataan lain, untuk sampel yang berukuran besar, rata-rata
sampel merupakan perkiraan untuk rata-rata populasi.
Namun demikian, untuk menghindari kesalahan, (8) harus dikoreksi dengan faktor N/(N-1)
(yang biasa disebut sebagai koreksi Bessel) apabila rata-rata sampel digunakan untuk
memperkirakan varians. Perkiraan dari σ2 ini disimbolkan dengan s2 dan disebut dengan
varians yang diestimasi dari sampel, atau singkatnya varians sampel (sample variance).
Dengan menggunakan koreksi Bessel pada (8), maka varians sampel:
s2 =
1 N
∑ (X i − X )2 (10)
N − 1 i =1
Simpangan baku selalu merupakan akar dari variansnya. Dengan demikian simpangan baku
dari s2 adalah s, dan biasa disebut dengan simpangan baku sampel (sample standard
deviation). Simpangan baku yang diestimasi dari sampel ini merupakan perkiraan untuk
simpangan baku dari populasi. Simpangan baku sampel diberikan oleh:
s=
1 N
∑ (X i − X )2 (11)
N − 1 i =1
Persamaan-persamaan (10) dan (11) harus selalu digunakan untuk menghitung varians dan
simpangan baku dari suatu sampel apabila rata-rata populasi tidak diketahui. Perhatikan
bahwa bila N sangat besar, koreksi Bessel akan mendekati 1, dan oleh karenanya ia dapat
diabaikan.
Contoh 2.13
Tentukan varians dan simpangan baku dari 12, 6, 7, 3, 15, 10, 18, 5.
Jawab
12 + 6 + 7 + 3 + 15 + 10 + 18 + 5
X= = 9,5
8
s= 27,14 = 5,2
Berdasarkan (10) dan (11), varians dan simpangan baku untuk data yang dikelompokkan
(kedalam tabel frekwensi) dapat dirumuskan sebagai:
f i (X i − X )
1 N
∑
2
s2 = (12)
N − 1 i =1
dan:
f i (X i − X )
1 N
∑
2
s= (13)
N − 1 i =1
Dimana Xi adalah nilai tengah (midpoint) dari interval kelas dan fi adalah frekwensi kelasnya.
Contoh 2.13
Tentukan varians dan simpangan baku dari data pada Tabel 2.2.
Jawab
Dari Contoh 2.9, nilai rata-rata dari data pada Tabel 2.2 adalah 997,2. Dengan demikian
varians:
1 ⎡ 2 2 2 2
s2 = ( 2)(555 − 997 , 2) + (9)(665 − 997 , 2) + (15)(775 − 997 , 2) + ( 47 )(885 − 997, 2)
200 − 1 ⎢⎣
+ ( 48)(995 − 997, 2) + (52)(1105 − 997 , 2) + (18)(1215 − 997, 2) + (8)(1325 − 997 , 2) + (1)(1435 − 997 , 2) ⎤
2 2 2 2 2
⎥⎦
= 26262
s= 26262 = 162
3.1. Pendahuluan
Teori probabilitas memungkinkan kita untuk membentuk dan menganalisa model matematis
dari fenomena acak (random). Pada pengamatan suatu fenomena acak, kita berhadapan
dengan suatu eksperimen yang hasilnya (outcome) tidak dapat diramalkan. Namun demikian,
kita mengetahui dan dapat membuat daftar tentang hasil-hasil yang mungkin dari eksperimen
tersebut. Sebagai contoh, pada eksperimen pelemparan koin, kita tidak dapat meramal
hasilnya. Akan tetapi kita mengetahui hasil yang mungkin yaitu ‘angka rupiah’ atau ‘lambang
garuda’. Contoh lain, pada eksperimen pelemparan dadu, kita juga tidak dapat meramal
hasilnya. Namun demikian, kita juga dapat mengetahui hasil-hasil yang mungkin yaitu angka
1, 2, 3, 4, 5 atau 6.
Fenomena acak dapat dikelompokkan kedalam dua kelompok besar. Kelompok pertama
berhubungan dengan fenomena alamiah yang melibatkan ketidak-pastian (uncertainty).
Ketidak-pastian ini timbul akibat kerumitan, kurangnya pemahaman dan informasi tentang
fenomena tersebut. Sebagai contoh, misalnya pada kasus peramalan cuaca, informasi yang
diperoleh dari satelit dan informasi meterologis lainnya tidak akan cukup untuk meramal
kondisi cuaca pada hari-hari berikutnya. Oleh karenanya, dapat dipahami bahwa laporan
cuaca di radio dan televisi biasanya dinyatakan dalam istilah probabilistik (misalnya:
probabilitas bahwa besok akan hujan adalah 30%).
Ruang sampel (sample space) adalah kumpulan atau set dari semua hasil yang mungkin dari
suatu eksperimen acak. Ruang sampel ini biasanya dinotasikan melalui S. Sebagai contoh,
ruang sampel dari eksperimen pelemparan koin adalah ‘angka rupiah’ dan ‘lambang garuda’.
Contoh lainnya, ruang sampel dari eksperimen pelemparan dadu adalah angka 1, 2, 3, 4, 5
dan 6.
Kejadian (event) merupakan kumpulan atau set dari hasil-hasil yang mungkin dari suatu
eksperimen acak. Dengan demikian kejadian merupakan bagian atau subset dari ruang sampel
dan biasa dinotasikan dengan E. Jika hasil dari suatu eksperimen terkandung dalam E, maka
dapat kita katakan bahwa kejadian E telah terjadi. Sebagai contoh, pada eksperimen
pelemparan dadu, misalkan kejadian E adalah kumpulan hasil dari munculnya angka ganjil
yaitu 1, 3 dan 5. Dengan demikian, jika hasil suatu pelemparan memunculkan angka 3, maka
kita katakan bahwa kejadian E telah terjadi karena hasil dari eksperimen tersebut (yaitu angka
3) terkandung dalam E.
Hubungan antara kejadian-kejadian dan ruang sampelnya dapat diillustrasikan secara grafis
melalui diagram Venn. Pada diagram Venn, ruang sampel S direpresentasikan sebagai
mengandung semua titik dalam suatu persegi panjang, dan kejadian E direpresentasikan
sebagai mengandung semua titik dalam suatu lingkaran yang berada dalam persegi panjang
tersebut. Gambar 3.1 dan 3.2 memperlihatkan contoh-contoh dari suatu diagram Venn.
S •ω
S
E F
Pada Gambar 3.1, interior dari persegi panjang menggambarkan ruang sampel S, dan interior
dari lingkaran menggambarkan kejadian E. Titik ω menggambarkan hasil dalam kejadian E.
Pada Gambar 3.2, diperlihatkan dua kejadian E dan F didalam ruang sampel S. Terlihat
bahwa kedua kejadian tersebut merupakan bagian dari ruang sampelnya dan hasil-hasil dari
kedua kejadian tersebut tidak ada yang sama (tidak dapat terjadi secara bersamaan).
Kejadian (event) dan kombinasi dari kejadian memainkan peranan penting dalam teori
probabilitas. Matematika dari kejadian berhubungan erat dengan teori set, oleh karenanya,
subbab ini akan membahas konsep dasar dan operasi-operasi aljabar dari teori set.
Set adalah kumpulan dari objek-objek yang memiliki sifat-sifat yang sama. Objek-objek ini
biasa disebut elemen-elemen dari set tersebut. Huruf-huruf besar A, B, C, Φ, Ω, ... akan
digunakan sebagai notasi untuk set-set, dan huruf-huruf kecil a, b, c, φ, ω, ... sebagai notasi
untuk elemen-elemennya. Dengan demikian, suatu set akan dinyatakan oleh elemen-
elemennya. Sebagai contoh, secara notasi dapat kita tulis: A = {1,2,3,4,5,6 } , yang berarti
bahwa set A memiliki elemen-elemen bilangan integer dari 1 sampai 6. Jika set B
mengandung dua elemen, berhasil dan gagal, ia dapat dinyatakan melalui: B = {b, g } , dimana
b dan g berturut-turut dipilih untuk menyatakan berhasil dan gagal.
Untuk set yang mengandung semua bilangan real positif, deskripsi yang biasa digunakan
adalah: C = {x : x ≥ 0}. Contoh lain, set D = {x : x adalah bilangan ganjil, x < 10} adalah set
yang elemen-elemennya adalah bilangan ganjil yang lebih kecil dari 10, atau dapat juga
ditulis sebagai: D = {1,3,5,7 ,9}. Sedangkan set E = {x : x adalah bilangan prima, x < 15}
adalah set yang elemen-elemennya adalah bilangan prima yang lebih kecil dari 15, atau dapat
juga ditulis sebagai: D = {2,3,5,7 ,11,13} .
Kita juga akan menggunakan konvensi a ∈ A yang berarti ‘a adalah elemen dari set A’. Suatu
set yang tidak mengandung elemen disebut dengan set kosong dan dinotasikan melalui ∅.
Jika setiap elemen dari set A juga merupakan elemen dari set B, kita katakan bahwa set A
adalah subset dari B dan secara simbolis dinyatakan melalui: A ⊂ B atau B ⊃ A . Jika A ⊂ B
dan B ⊂ A , maka set A adalah sama dengan B, dan kita tulis: A = B .
Contoh 3.1
Misalkan A = {2,4} dan B = {1,2,3,4}. Maka A ⊂ B , karena setiap elemen dari A juga
merupakan elemen dari B. Hubungan ini juga dapat dinyatakan secara grafis dengan
menggunakan digram Venn, seperti yang diperlihatkan pada Gambar 3.3.
S B
Kita juga biasanya tertarik untuk menyelidiki kejadian yang merupakan hasil kombinasi dari
kejadian-kejadian yang ada. Oleh karena kejadian-kejadian tersebut merupakan subset-subset
(dari ruang sampelnya), maka kita dapat menggunakan operasi-operasi set dasar seperti
gabungan (union), irisan (intersection) dan komplemen (complement) untuk membentuk
kejadian-kejadian yang kita minati.
Berikut akan dibahas beberapa operasi aljabar dari set-set A, B, C, ... yang merupakan subset-
subset dari S. Gabungan (union) dari A dan B, yang dinotasikan melalui A ∪ B , adalah set
dari semua elemen dari A dan B digabung. Irisan (intersection) dari A dan B, yang
dinotasikan melalui A ∩ B , adalah set dari semua elemen dimana set tersebut merupakan
bagian dari A dan B. Jika A ∩ B = ∅ , maka berarti bahwa elemen dari set A dan B tidak ada
yang sama, dan kita sebut A dan B sebagai disjoint. Dalam bentuk diagram Venn, hasil dari
operasi gabungan dan irisan tersebut diperlihatkan pada Gambar 3.4 dan 3.5 sebagai set
dengan daerah yang diarsir.
A B
S
A B
S
Contoh 3.2
Gabungan dari A, B dan C, yang dinotasikan melalui A ∪ B ∪ C , adalah set dari semua
elemen dari A, B dan C digabung. Sedangkan irisan dari A, B dan C, yang dinotasikan melalui
A ∩ B ∩ C , adalah set dari semua elemen dimana set tersebut merupakan bagian dari A, B
dan C. Definisi dari gabungan dan irisan diatas dapat digeneralisir untuk kasus-kasus yang
melibatkan set-set yang jumlahnya lebih dari dua (A1, A2, ..., An) sebagai berikut:
n
A1 ∪ A2 K ∪ An = U A j (3.1)
j =1
n
A1 ∩ A2 K ∩ An = I A j (3.2)
j =1
Contoh 3.3
Contoh 3.4
Contoh 3.5
Komplemen
Misalkan bahwa suatu set A terkandung dalam S. Set dari semua elemen dalam S yang bukan
merupakan elemen dari A disebut komplemen (complement) dari A dan dinotasikan sebagai
A . Diagram Venn yang menunjukkan A dan A diperlihatkan pada Gambar 3.6, dimana A
dinyatakan melalui daerah yang diarsir.
S
A A
S = ∅;∅ = S (3.4)
Contoh 3.6
Operasi-operasi dari gabungan dan irisan yang telah dibahas sebelumnya memenuhi sifat-
sifat komutatif, asosiatif dan distributif sebagai berikut:
Komutatif: A ∪ B = B ∪ A ; A ∩ B = B ∩ A
Asosiatif: ( A ∪ B ) ∪ C = A ∪ ( B ∪ C ) ; ( A ∩ B ) ∩ C = A ∩ ( B ∩ C )
Distributif: ( A ∪ B) ∩ C = ( A ∩ C ) ∪ ( B ∩ C ) ; ( A ∩ B) ∪ C = ( A ∪ C ) ∩ ( B ∪ C )
Pembuktian bahwa operasi-operasi gabungan dan irisan memenuhi sifat-sifat diatas dapat
dilakukan dengan mudah dengan menggunakan diagram Venn. Sebagai contoh, Gambar 3.7
memperlihatkan diagram Venn dari pembuktian sifat distributif.
Berikut adalah hubungan-hubungan antara ketiga operasi dasar set (yaitu: gabungan, irisan
dan komplemen) yang nantinya berguna dalam perhitungan probabilitas:
( A ∪ B) = A ∩ B
(3.5)
( A ∩ B) = A ∪ B
Deskripsi dari ruang sampel dan kejadian-kejadian menunjukkan bahwa ia sangat cocok
dimasukkan kedalam kerangka dari teori set (suatu kerangka dimana analisis hasil dari suatu
eksperimen acak dapat dilakukan). Semua hubungan antara hasil (outcome) atau kejadian
(event) dalam teori probabilitas dapat dijelaskan melalui set dan operasi set. Beberapa hal dari
set dan operasinya serta arti probabilitasnya diberikan dalam Tabel 3.1.
Set A, B, … Kejadian A, B, ….
A Kejadian A terjadi
Soal-Soal Latihan
a) A e) A ∪ B
b) B f) A ∩ B
c) A ∪ B g) A ∩ B
d) A ∩ B h) A ∪ B
Seperti yang telah disinggung sebelumnya di Bab I, salah satu cara dalam mendefinisikan
probabilitas dari suatu kejadian adalah dengan menggunakan frekwensi relatifnya. Definisi
ini dapat dijelaskan sebagai berikut: Misalkan suatu eksperimen (dengan ruang sampel S)
dilakukan berulang-ulang (misalkan sebanyak n kali) pada kondisi-kondisi yang persis sama.
Untuk setiap kejadian E dari ruang sampel S, kita definisikan n(E) sebagai jumlah dari
munculnya kejadian E. Maka P(E), probabilitas dari kejadian E, didefinisikan melalui:
n( E )
P ( E ) = lim (3.6)
n →∞ n
Dengan demikian, P(E) didefinisikan sebagai proporsi dari kemunculan E, dan diharapkan
bahwa proporsi ini akan mendekati suatu nilai yang konstan untuk n yang semakin besar.
mengharapkan bahwa nilai konstan tersebut ada, akan tetapi kelihatannya tidak ada bukti
sama sekali mengenai hal ini.
Sebenarnya, bukankah akan lebih masuk akal untuk mengasumsikan suatu aksioma yang
lebih sederhana dan lebih dapat dibuktikan tentang probabilitas dan kemudian mencoba untuk
membuktikan bahwa nilai konstan tersebut ada? Pendekatan ini merupakan pendekatan
aksiomatik modern terhadap teori probabilitas yang akan kita bahas di subbab ini. Secara
khusus, kita akan asumsikan bahwa untuk setiap kejadian E didalam ruang sampel S akan
terdapat suatu nilai P(E), yang biasa disebut sebagai probabilitas dari E. Kemudian kita akan
asumsikan juga bahwa probabilitas tersebut memenuhi aksioma-aksioma tertentu yang sesuai
atau yang konsisten dengan intuisi normal kita.
Misalkan terdapat suatu eksperimen yang ruang sampelnya adalah S. Untuk setiap kejadian E
dari ruang sampel S, kita asumsikan terdapat suatu nilai P(E) yang memenuhi tiga aksioma
berikut:
Aksioma 1: 0 ≤ P( E ) ≤ 1
Aksioma 2: P ( S ) = 1
Aksioma 3: Untuk dua kejadian E dan F dimana E ∩ F = ∅ (atau E dan F tidak dapat
terjadi secara bersamaan): P( E ∪ F ) = P( E ) + P( F ) .
Aksioma 1 menyatakan bahwa probabilitas dari hasil dari suatu eksperimen yang terkandung
dalam E adalah bilangan antara 0 dan 1. Aksioma 2 merupakan konsekwensi dari fakta
bahwa hasil yang terkandung dalam ruang sampel akan selalu muncul pada setiap percobaan
dari suatu eksperimen, yang berimplikasi bahwa P ( S ) = 1 . Sebagai contoh, angka 1, 2, 3, 4, 5
atau 6 dapat dipastikan akan muncul pada suatu eksperimen pelemparan dadu. Oleh karena
kepastian tersebut, dan angka 1, 2, 3, 4, 5 dan 6 merupakan ruang sampel dari eksperimen
pelemparan dadu maka probabilitas dari hasil-hasil dalam S adalah 1 atau P( S ) = 1 .
⎛ n ⎞ n
P⎜⎜ U Ei ⎟⎟ = ∑ P(Ei ) (3.7)
⎝ i =1 ⎠ i − =1
Contoh 3.7
Misalkan pada suatu eksperimen pelemparan dadu dimana setiap hasil-hasil eksperimen
tersebut memiliki peluang yang sama untuk muncul. Misalkan juga bahwa A menunjukkan
kejadian untuk munculnya angka genap, dan B menunjukkan kejadian untuk munculnya
angka ganjil.
Tentukan: P(A), P(B) dan P( A ∪ B) .
Jawab:
Diketahui bahwa S = {1,2,3,4,5,6 }, A = {2,4,6 } dan B = {1,3,5} . Oleh karena peluang untuk
muncul dari hasil-hasil eksperimen adalah sama, maka probabilitas dari kejadian A adalah
P(A)=3/6=0,5 dan probabilitas dari kejadian B adalah P(B)=3/6=0,5. Oleh karena pada
contoh ini A ∩ B = ∅ , maka sesuai Aksioma 3 kita peroleh:
3 3
P ( A ∪ B) = P ( A) + P ( B ) = + =1
6 6
Berdasarkan ketiga aksioma yang telah diuraikan diatas, kita dapat membuktikan teorema-
teorema berikut. Teorema-teorema ini nantinya akan sangat berguna dalam pembahasan
tentang probabilitas selanjutnya.
Teorema 1: P( E ) = 1 − P( E )
Teorema 1 menyatakan bahwa probabilitas bahwa suatu kejadian tidak terjadi adalah 1
dikurang probabilitas bahwa kejadian tersebut terjadi. Contohnya, jika probabilitas untuk
mendapatkan angka 1 pada pelemparan dadu adalah 1/6, maka probabilitas untuk tidak
mendapatkan angka 1 haruslah 1-1/6=5/6.
Bukti:
Perlu dicatat bahwa kejadian E dan E selalu tidak dapat terjadi secara bersamaan (mutually
exclusive), dan oleh karena E ∪ E = S , maka dengan menggunakan Aksioma 2 dan 3 akan
kita peroleh:
1 = P( S ) = P( E ∪ E ) = P( E ) + P( E ) (3.8)
Teorema 2: P (∅) = 0
Teorema 2 menyatakan bahwa probabilitas bahwa suatu kejadian tidak mungkin terjadi
(impossible event) adalah 0.
Bukti:
Kejadian S dan ∅ juga selalu tidak dapat terjadi secara bersamaan. Oleh karena S ∪ ∅ = S ,
maka dengan menggunakan Aksioma 3 akan kita peroleh:
P( S ) = P( S ∪ ∅) = P( S ) + P(∅) (3.9)
1 = 1 + P(∅) (3.10)
atau:
P(∅) = 0 (3.11)
Bukti:
Oleh karena E ⊂ F , maka F dapat kita nyatakan sebagai:
F = E ∪ (E ∩ F ) (3.12)
Oleh karena kejadian E dan E ∩ F tidak dapat terjadi secara bersamaan, maka berdasarkan
Aksioma 3:
P( F ) = P( E ) + P( E ∩ F ) (3.13)
Teorema 4: P ( E ∪ F ) = P( E ) + P ( F ) − P ( E ∩ F )
Teorema ini memberikan hubungan antara probabilitas-probabilitas individual dan
probabilitas dari irisan. Perlu juga dicatat bahwa, oleh karena P( E ∪ F ) merupakan
probabilitas dari gabungan antara dua kejadian E dan F, maka ia sering juga disebut sebagai
probabilitas gabungan (union probability). Bahasa yang sering diasosiasikan dengan
gabungan adalah perkataan “atau”, sehingga P( E ∪ F ) berarti probabilitas dari kejadian “E
atau F”. Lebih lanjut, oleh karena P ( E ∩ F ) merupakan probabilitas dari irisan antara dua
kejadian E dan F, maka ia sering juga disebut sebagai probabilitas irisan (intersection
probability). Bahasa yang sering diasosiasikan dengan irisan adalah perkataan “dan”,
sehingga P( E ∩ F ) berarti probabilitas dari kejadian “E dan F”.
Bukti:
Untuk menurunkan rumus bagi P ( E ∪ F ) , pertama-tama E ∪ F kita tulis sebagai gabungan
dari dua kejadian E dan E ∩ F dimana kejadian-kejadian tersebut tidak dapat terjadi secara
bersamaan. Sehingga dengan menggunakan Aksioma 3 kita peroleh:
P ( E ∪ F ) = P (E ∪ ( E ∩ F ) ) = P ( E ) + P( E ∩ F ) (3.14)
P( F ) = P( E ∩ F ) + P( E ∩ F ) (3.15)
atau:
P( E ∩ F ) = P( F ) − P( E ∩ F ) (3.16)
Teorema 4 juga dapat dibuktikan dengan menggunakan diagram Venn seperti yang
diperlihatkan pada Gambar 3.8. Oleh karena E ∪ F = I ∪ II ∪ III , E = I ∪ II , F = II ∪ III
dan kejadian-kejadian I, II dan III tidak dapat terjadi bersamaan, maka sesuai Aksioma 3:
P( E ∪ F ) = P( I ) + P( II ) + P( III ) (3.17)
P( E ) = P( I ) + P( II ) (3.18)
P ( F ) = P( II ) + P( III ) (3.19)
P( E ∪ F ) = P( E ) + P( F ) − P( II ) (3.21)
P ( II ) = P( E ∩ F ) (3.22)
E
S
I II III
Teorema 4 dapat digeneralisir untuk kasus-kasus penggabungan tiga atau lebih kejadian-
kejadian. Dengan menggunakan prosedur yang sama seperti diatas, dapat ditunjukkan bahwa
untuk kejadian-kejadian E1, E2 dan E3:
P ( E1 ∪ E2 ∪ E3 ) = P ( E1 ) + P ( E2 ) + P( E3 ) − P( E1 ∩ E2 ) − P ( E1 ∩ E3 )
(3.23)
− P( E2 ∩ E3 ) + P ( E1 ∩ E2 ∩ E3 )
P ( E1 ∪ E2 ∪ E3 ∪ E4 ) = P( E1 ) + P ( E2 ) + P( E3 ) + P( E4 ) − P( E1 ∩ E2 ) − P ( E1 ∩ E3 )
− P( E1 ∩ E4 ) − P( E2 ∩ E3 ) − P ( E2 ∩ E4 ) − P( E3 ∩ E4 ) + P ( E1 ∩ E2 ∩ E3 )
+ P( E1 ∩ E2 ∩ E4 ) + P ( E1 ∩ E3 ∩ E4 ) + P ( E2 ∩ E3 ∩ E4 )
− P( E1 ∩ E2 ∩ E3 ∩ E4 )
…….(3.24)
⎛ n ⎞ n
( )
P⎜⎜ U E j ⎟⎟ = ∑ P E j − ∑ P( Ei1 ∩ Ei2 ) + ∑ P( Ei1 ∩ Ei2 ∩ Ei 3 )
⎝ j =1 ⎠ j =1 i1 < i2 i1 < i2 < i3
(3.25)
⎛ r ⎞ ⎛ n ⎞
+ L + (−1) r +1 ∑ P⎜ I Eik ⎟ + L + (−1) n +1 P⎜ I Ei ⎟
i1 < i2 <L< ir ⎝ k =1 ⎠ ⎝ i =1 ⎠
Formula seperti yang diberikan oleh (3.25) biasa disebut juga sebagai aturan penjumlahan
(addition rule) dari probabilitas.
Contoh 3.8
Suatu eksperimen acak dapat memunculkan satu dari hasil-hasil {a, b, c, d } dengan
probabilitas berturut-turut 0,1; 0,3; 0,5 dan 0,1. Misalkan A adalah kejadian {a, b}, B adalah
kejadian {b, c, d } dan C adalah kejadian {d }. Tentukan:
Jawab:
2. Mengingat A = {a, b}, B = {b, c, d } dan C = {d } maka A = {c, d }, B = {a} dan C = {a, b, c},
sehingga:
P ( A ) = 1 − P( A) = 1 − 0,4 = 0,6
P ( B ) = 1 − P( B) = 1 − 0,9 = 0,1
P (C ) = 1 − P (C ) = 1 − 0,1 = 0,9
P ( A ∩ B) = 0,3
P( A ∩ C ) = 0
P ( B ∩ C ) = 0,1
Soal-Soal Latihan
1. Ruang sampel dari suatu eksperimen acak adalah {a,b,c,d,e}. Probabilitas dari munculnya
hasil-hasil tersebut berturut-turut adalah 0,1;0,1;0,2;0,4 dan 0,2. Misalkan A adalah
kejadian {a,b,c}, dan B adalah kejadian {c,d,e}, hitung:
a) P( A) c) P (B) e) P( A ∩ B)
b) P ( A ) d) P (B ) f) P ( A ∪ B)
2. Ruang sampel dari suatu eksperimen acak adalah {a,b,c,d,e}. Probabilitas dari munculnya
hasil-hasil tersebut adalah sama yaitu 0,2. Misalkan A adalah kejadian {a,b}, dan B adalah
kejadian {c,d,e}, hitung:
a) P ( A) c) P (B ) e) P ( A ∩ B)
b) P ( A ) d) P (B ) f) P( A ∪ B)
3. Ruang sampel dari suatu eksperimen acak adalah {a,b,c,d,e,f,g,h,i,j}. Probabilitas dari
munculnya hasil-hasil tersebut adalah sama yaitu 0,1. Misalkan A adalah kejadian
{a,b,c,d,e,f,g}, B adalah kejadian {c,d,e,f,g,h,i} dan C adalah kejadian {a,d,f,g,i}, hitung:
a) P ( A) d) P( A ∩ B) g) P ( A ∩ B ∩ C )
b) P (B ) e) P( A ∩ C ) h) P ( A ∪ B ∪ C )
c) P (C ) f) P ( B ∩ C )
4. Produk dari suatu pabrik pembuat disket akan diuji, dimana yang akan diuji adalah
ketahanan dari produk disket tersebut terhadap goresan dan goncangan. Tabel 3.2
memperlihatkan hasil pengujian terhadap sampel yang terdiri dari 100 buah disket.
Misalkan A adalah kejadian bahwa suatu disket tahan terhadap goncangan, dan B adalah
kejadian bahwa suatu disket tahan terhadap goresan, hitung:
a) P ( A) c) P (B ) e) P ( A ∩ B)
b) P ( A ) d) P (B ) f) P ( A ∪ B)
Tahan Gores 70 9
5. Produk dari suatu pabrik pembuat keramik akan dites, dimana yang akan dites adalah
apakah ukurannya dan ketebalannya telah sesuai standar atau tidak. Tabel 3.3
memperlihatkan hasil pengujian terhadap sampel yang terdiri dari 100 buah keramik.
Misalkan A adalah kejadian bahwa suatu keramik ukurannya telah sesuai standar, dan B
adalah kejadian bahwa suatu keramik ketebalannya telah sesuai standar, hitung:
a) P ( A) c) P (B ) e) P ( A ∩ B)
b) P ( A ) d) P (B ) f) P( A ∪ B)
Hal ini dapat dilakukan dengan mengasumsikan bahwa suatu eksperimen acak dilakukan
sebanyak, katakanlah, n kali, dimana n adalah bilangan yang cukup besar. Kemudian dengan
memisalkan juga bahwa untuk setiap kejadian A, nA adalah banyaknya kemunculan kejadian
A dari n eksperimen tersebut, dan akhirnya kita definisikan bahwa rasio nA/n sebagai
frekwensi relatif dari kejadian A tersebut. Diharapkan bahwa rasio ini akan mendekati suatu
nilai unik tertentu dengan membesarnya n. Nilai ini jelas memiliki sifat-sifat yang diinginkan
untuk suatu ukuran probabilitas dan merupakan kandidat alamiah untuk probabilitas dari
kejadian A.
Perlu juga dicatat disini bahwa pendekatan frekwensi relatif dalam penentuan probabilitas
adalah objektif dan konsisten dengan aksioma-aksioma yang telah dibahas sebelumnya dan
sering diadopsi didalam ilmu-ilmu sains dan keteknikan.
Gambar 3.9. Plot Dari Frekwensi Relatif Terhadap Jumlah Eksperimen ( n ≤ 200 ).
Gambar 3.10. Plot Dari Frekwensi Relatif Terhadap Jumlah Eksperimen ( n ≤ 1000 ).
Gambar 3.11. Plot Dari Frekwensi Relatif Terhadap Jumlah Eksperimen ( n ≤ 10000 ).
Seringkali kali kita diharuskan untuk menghitung probabilitas dari suatu kejadian (misalkan
B) dibawah syarat bahwa kejadian lain (misalkan A) telah terjadi. Probabilitas ini dinamakan
probabilitas bersyarat (conditional probability) dari kejadian B jika kejadian A telah terjadi,
dan dinotasikan sebagai P ( B | A) .
Berikut adalah illustrasi dari probabilitas bersyarat. Misalkan diketahui bahwa hasil
pelemparan sebuah dadu menghasilkan angka ganjil. Berapakah probabilitas bahwa
pelemparan tersebut menghasilkan angka 5? Dalam notasi probabilitas, ini berarti bahwa kita
ingin menghitung P (munculnya angka 5 | munculnya angka ganjil) , atau P ( B | A) , dimana A
adalah kejadian munculnya angka ganjil dan B adalah kejadian munculnya angka 5. Setelah
kita mengetahui bahwa pelemparan menghasilkan angka ganjil, kita hanya memiliki tiga
kemungkinan yaitu: 1, 3 atau 5. Sehingga, dapat kita katakan bahwa
P (munculnya angka 5 | munculnya angka ganjil) adalah 1/3.
P(A ∩ B)
P(B|A) = (3.26)
P(A)
Numerator dari (3.26) adalah probabilitas irisan karena kita menginginkan hasil dari A juga
muncul dalam B. Kemudian kita membaginya dengan probabilitas dari A karena A
merupakan ruang sampel kita yang baru.
Kita dapat menggunakan (3.26) untuk mencari jawaban dari masalah pelemparan dadu seperti
yang telah dilustrasikan sebelumnya, dimana pada kasus ini B = {5} dan A = {1,3,5} . Kita
tahu bahwa P( A ∩ B) adalah 1/6 karena A ∩ B menghasilkan {5} , dan P( A) adalah 3/6.
Dengan membagi kedua hasil ini, kita peroleh: P( B | A) = (1 / 6 ) /(3 / 6 ) = 1 / 3 , yang adalah
sama dengan hasil yang diperoleh sebelumnya.
Contoh 3.9
Pada eksperimen pelemparan sepasang dadu, jika diketahui bahwa jumlah kedua dadu
tersebut sama dengan 8, berapakah probabilitas bahwa dadu pertama memunculkan angka 3?
Jawab:
Ruang sampel dari pelemparan sepasang dadu adalah seperti yang diperlihatkan pada Tabel
3.4. Setelah kita mengetahui bahwa pelemparan sepasang dadu tersebut menghasilkan jumlah
sama dengan 8, kita memiliki lima kemungkinan yaitu: (2,6), (3,5), (4,4), (5,3) dan (6,2).
Sehingga, dapat kita katakan probabilitas bahwa dadu pertama memunculkan angka 3, atau
P( B | A) adalah 1/5, dimana B adalah kejadian bahwa dadu pertama memunculkan angka 3
dan A adalah kejadian bahwa jumlah kedua dadu sama dengan 8.
Berikut adalah uraian bila perhitungan probabilitas menggunakan (3.26). Misalkan B adalah
kejadian bahwa dadu pertama memunculkan angka 3 dan A adalah kejadian bahwa jumlah
kedua dadu sama dengan 8, maka:
dan:
1 1 1 1 1 1 1
P( B) = + + + + + =
36 36 36 36 36 36 6
1 1 1 1 1 5
P ( A) = + + + + =
36 36 36 36 36 36
1
P( A ∩ B) =
36
Dengan demikian, sesuai (3.26), probabilitas bersyarat dari B dengan telah terjadinya A
adalah:
P(A ∩ B) 1 / 36
P(B|A) = = = 1/ 5
P(A) 5 / 36
Persamaan (3.27) adalah probabilitas irisan untuk dua kejadian A dan B. Berdasarkan hasil
ini, untuk tiga kejadian A1, A2 dan A3, probabilitas irisannya adalah:
Sedangkan untuk empat kejadian A1, A2, A3 dan A4, probabilitas irisannya adalah:
Formula seperti yang dirumuskan oleh (3.30) biasa juga disebut sebagai aturan perkalian
(multiplication rule) dari probabilitas.
P(A ∩ B) = P(A)P(B)
P(B ∩ C) = P(B)P(C )
(3.32)
P(C ∩ A) = P(C)P(A)
P(A ∩ B ∩ C) = P(A)P(B) P(C )
Sudah barang tentu bahwa kita juga dapat menggeneralisir hasil-hasil diatas untuk kejadian-
kejadian yang jumlahnya lebih dari tiga.
Contoh 3.10
Pada kasus pelemparan sebuah dadu diketahui bahwa hasilnya adalah angka-angka ganjil.
Misalkan hasil-hasil ini kita sebut sebagai kejadian A. Misalkan juga kejadian B adalah
kejadian bahwa dadu tersebut memunculkan angka 5. Tentukan apakah A dan B merupakan
dua kejadian bebas?
Jawab:
A = {1,3,5}
B = {5}
A ∩ B = {5}
dan:
1 1 1 1
P ( A) = + + =
6 6 6 2
1
P( B) =
6
1
P( A ∩ B) =
6
Oleh karena: P(A ∩ B) ≠ P(A)P(B) , maka A dan B adalah dua kejadian tak bebas, atau A dan
B bukan merupakan kejadian-kejadian bebas. Penting juga untuk dicatat disini bahwa
probabilitas dari kejadian B jika A terjadi adalah P( B | A) = 1 / 3 (lihat uraian di Subbab 3.4).
Hal ini menunjukkan bahwa probabilitas B, yang tadinya 1/6, telah berubah menjadi 1/3
dengan terjadinya A. Atau, dengan perkataan lain, probabilitas terjadinya B tergantung pada
terjadinya A.
Contoh 3.11
Pada kasus pelemparan sepasang koin diketahui bahwa A adalah kejadian munculnya gambar
pada koin pertama, dan B adalah kejadian munculnya gambar pada koin kedua. Tentukan
apakah A dan B merupakan dua kejadian bebas?
Jawab:
S = {( g , g ), ( g , a ), (a, g ), (a, a )}
A = {( g , g ), ( g , a )}
B = {( g , g ), (a, g )}
A ∩ B = {( g , g )}
dan:
1 1 1
P ( A) = + =
4 4 2
1 1 1
P( B) = + =
4 4 2
1
P( A ∩ B) =
4
Oleh karena: P(A ∩ B) = P(A)P(B) , maka A dan B adalah dua kejadian bebas. Menarik juga
untuk diamati bahwa, untuk kasus diatas, probabilitas dari kejadian B jika A terjadi adalah:
P(A ∩ B) 1 / 4
P(B|A) = = = 1/ 2
P(A) 1/ 2
Hasil diatas menunjukkan bahwa probabilitas B tidak berubah (atau tetap sebesar ½) dengan
terjadinya A. Atau, dengan perkataan lain, probabilitas terjadinya B tidak tergantung pada
terjadinya A.
Soal-Soal Latihan
1. Pada eksperimen pelemparan sepasang dadu, jika diketahui bahwa jumlah kedua dadu
tersebut sama dengan 6, berapakah probabilitas bahwa dadu pertama memunculkan angka
2?
2. Pada eksperimen pelemparan sepasang dadu, jika diketahui bahwa jumlah kedua dadu
tersebut sama dengan 7:
3. Suatu keluarga memiliki dua orang anak. Misalkan A adalah kejadian bahwa keluarga
tersebut memiliki anak lelaki dan perempuan, dan B adalah kejadian bahwa keluarga
tersebut memiliki paling tidak satu anak lelaki. Tentukan apakah A dan B merupakan dua
kejadian bebas?
4. Suatu keluarga memiliki tiga orang anak. Misalkan A adalah kejadian bahwa keluarga
tersebut memiliki anak lelaki dan perempuan, dan B adalah kejadian bahwa keluarga
tersebut memiliki paling tidak satu anak lelaki. Tentukan apakah A dan B merupakan dua
kejadian bebas?
5. Pada suatu universitas diketahui bahwa 25% dari mahasiswa gagal di matematik, 15%
gagal di fisika dan 10% gagal di matematik dan fisika. Misalkan seorang mahasiswa
diambil secara acak:
a. Jika diketahui mahasiswa tersebut gagal di fisika, berapakan probabilitas bahwa ia gagal
di matematik?
b. Jika diketahui mahasiswa tersebut gagal di matematik, berapakan probabilitas bahwa ia
gagal di fisika?
c. Berapakah probabilitas bahwa ia gagal di matematik atau fisika?
Seperti yang telah dibahas sebelumnya di Bab III, hasil dari suatu eksperimen acak adalah
berupa angka-angka atau dapat memiliki hubungan dengan angka-angka. Contohnya, bila
hasil-hasil yang mungkin dari suatu eksperimen acak terdiri dari sukses dan gagal, maka kita
dapat menetapkan angka satu untuk kejadian ‘sukses’ dan angka nol untuk kejadian ‘gagal’.
Dengan demikian, ruang sampel dari eksperimen acak tersebut sekarang adalah {1,0} sebagai
pengganti {sukses,gagal}, dan pernyatan bahwa ‘hasilnya adalah 1’ berarti bahwa ‘hasilnya
adalah sukses’.
Kuantitas-kuantitas numerik yang ditentukan oleh suatu hasil eksperimen acak seperti diatas
dikenal sebagai variabel-variabel acak. Oleh karena nilai dari variabel acak ini ditentukan
oleh hasil dari suatu eksperimen, kita dapat menetapkan probabilitas untuk nilai dari variabel
acak tersebut. Penetapan probabilitas-probabilitas terhadap variabel-variabel acak ini kita
sebut sebagai distribusi probabilitas dari suatu variabel acak.
Bab ini akan dimulai dengan pembahasan tentang variabel acak dan distribusi probabilitas
nya. Kita juga akan meninjau ide tentang ekspektasi matematis (atau rata-rata dari suatu
distribusi probabilitas), varians dan simpangan baku dari suatu distribusi probabilitas. Setelah
itu kita juga akan membahas mengenai tiga distribusi probabilitas penting, yaitu: distribusi
probabilitas uniform, distribusi probabilitas binomial, dan distribusi probabilitas normal.
Sebagai contoh, misalkan pada kasus pelemparan dua uang logam, maka ruang sampelnya
adalah S = {GG, GA, AG , AA} (Keterangan: G = Gambar, A = Angka). Kita misalkan X
menyatakan jumlah gambar yang mungkin muncul dari pelemparan dua uang logam tersebut.
Bila untuk setiap titik sampel kita asosiasikan suatu angka untuk X seperti yang diperlihatkan
pada Tabel 4.1. Maka, untuk kasus GG (2 gambar), X = 2, sedangkan untuk GA (1 gambar),
X = 1. Terlihat bahwa X merupakan suatu bilangan acak.
Hasil GG GA AG AA
X 2 1 1 0
Contoh lain, misalkan pada kasus pelemparan dua buah dadu. Pada kasus ini, ruang
sampelnya akan terdiri dari 36 hasil, yaitu: {(1,1), (1,2), (1,3),K, (6 ,4 ), (6 ,5), (6 ,6 )}. Misalkan
kita tertarik dengan suatu variabel acak (yaitu X) yang menyatakan jumlah dari hasil
pelemparan kedua dadu. Tabel 4.2 memperlihatkan hasil-hasil dari pelemparan dan nilai-nilai
dari variabel acak X yang bersesuaian.
Variabel acak terdiri dari dua jenis, yaitu: diskrit dan kontinu. Suatu variabel acak X disebut
sebagai variabel acak diskrit (discrete random variable) jika ia didefinisikan pada suatu
ruang sampel dengan titik-titik sampel yang jumlahnya berhingga atau jumlahnya tak
berhingga tapi semua nilainya dapat disebutkan (countably infinite number). Dengan
demikian, set dari nilai-nilai yang mungkin untuk variabel acak diskrit ini dapat ditulis
sebagai urutan berhingga x1, x2,…, xn (contohnya set dari semua bilangan-bilangan integer
non-negatif yang lebih kecil dari 5: 0, 1, 2, 3, 4), atau sebagai urutan tak berhingga x1, x2,…
(contohnya set dari semua bilangan-bilangan integer non-negatif: 0, 1, 2,…). Contoh dari
variabel acak diskrit adalah jumlah hari hujan pada suatu daerah selama bulan Maret. Jika X
merupakan jumlah hari hujan, maka nilai-nilai yang mungkin untuk X adalah
x = 0,1,2,3,K,31 .
Untuk ruang sampel dengan titik-titik sampel yang jumlahnya tak berhingga dan semua
nilainya tak dapat disebutkan (uncountably infinite number), variabel acak yang bersesuaian
biasa disebut variabel acak kontinu (continuous random variable). Nilai dari variabel acak
ini biasanya terdistribusi pada satu atau lebih interval kontinu. Salah satu contoh adalah
variabel acak yang menunjukkan masa hidup atau usia dari suatu lampu pijar, bila nilai dari
usia lampu pijar tersebut diasumsikan berada pada suatu interval tertentu, misalnya (0, 1000)
jam. Contoh lain dari variabel acak kontinu adalah besarnya curah hujan pada suatu daerah
selama bulan Maret. Jika X adalah besarnya curah hujan tersebut, maka nilai-nilai yang
mungkin untuk X dapat berada pada interval, misalnya, (0, 300) mm. Tulisan ini akan
membahas lebih banyak mengenai variabel acak diskrit.
Untuk kasus pelemparan dua uang logam, nilai-nilai yang mungkin untuk X (dimana X
merupakan jumlah gambar), adalah 0, 1, 2 (atau x = 0,1,2 ). Probabilitas-probabilitas dari xi
dapat ditentukan dengan melihat ruang sampelnya dan hasil-hasil dari eksperimen
pelemparan tersebut (lihat Tabel 4.1). Untuk X = 0 (jumlah gambar nol), satu-satunya hasil
adalah AA. Sehingga probabilitas untuk X = 0 adalah ¼, atau dalam notasi probabilitas, kita
tuliskan P ( X = 0 ) = 1 / 4 (dibaca: P dari X sama dengan 0 adalah seperempat). Cara lain
untuk menuliskan probabilitas ini adalah P (0 ) = 1 / 4 (dibaca: P dari 0 adalah seperempat).
Dengan cara yang sama, probabilitas untuk X = 1 adalah ½. Sehingga kita dapatkan
P( X = 1) = 1 / 2 atau P(1) = 1 / 2 . Lebih lanjut, probabilitas untuk X = 2 adalah ¼, yang
dapat dituliskan sebagai P( X = 2) = 1 / 4 atau P(2) = 1 / 4 . Hasil-hasil diatas (yaitu nilai-nilai
dari variabel acak dan probabilitasnya) dapat diatur dalam bentuk tabel seperti yang
diperlihatkan pada Tabel 4.3. Tabel 4.3 ini merupakan distribusi probabilitas untuk variabel
acak X dari contoh kasus pelemparan dua uang logam yang sebelumnya telah dibahas.
Untuk kasus pelemparan dua buah dadu (Tabel 4.2), nilai-nilai yang mungkin untuk X
(dimana X merupakan jumlah hasil pelemparan kedua dadu), adalah 2, 3, … 12 (atau
x = 2,3,K,12 ). Untuk X = 2 (jumlah hasil kedua dadu sama dengan 2), satu-satunya hasil
adalah (1,1), maka P ( X = 2) = 1 / 36 atau P (2) = 1 / 36 . Untuk X = 3 (jumlah hasil kedua
dadu sama dengan 3), akan terdapat dua hasil yaitu (1,2) dan (2,1), maka akan diperoleh
P( X = 3) = 2 / 36 = 1 / 18 atau P(3) = 2 / 36 = 1 / 18 . Dengan demikian, peluang untuk
mendapatkan jumlah kedua dadu sama dengan 3 adalah lebih besar dari peluang untuk
mendapatkan jumlah kedua dadu sama dengan 2, karena jumlah cara untuk memperoleh
jumlah 3 adalah lebih banyak dibandingkan jumlah 2. Tabel yang menunjukkan distribusi
probabilitas untuk variabel acak X dari contoh kasus pelemparan dua buah dadu yang dibahas
diatas diperlihatkan pada Tabel 4.4.
x P( X = x)
0 ¼
1 ½
2 ¼
ΣP(x) 1
x P( X = x)
2 1/36
3 2/36
4 3/36
5 4/36
6 5/36
7 6/36
8 5/36
9 4/36
10 3/36
11 2/36
12 1/36
ΣP(x) 1
Setelah distribusi probabilitas dari suatu variabel acak diskrit ditentukan, kita dapat
memeriksa hasilnya dengan melihat apakah jumlah dari probabilitas-probabilitas telah sama
dengan satu. Jika ya, maka distribusi probabilitas tersebut adalah benar. Akan tetapi, jika
jumlah dari probabilitas-probabilitas tersebut tidak sama dengan satu, maka telah terjadi suatu
kesalahan. Perhatikan bahwa distribusi probabilitas pada Tabel 4.3 dan 4.4 adalah benar
karena jumlah dari probabilitas-probabilitas telah sama dengan satu.
Berikut adalah sifat-sifat dari distribusi probabilitas untuk suatu variabel acak diskrit X:
1. Nilai dari setiap probabilitas harus berada diantara 0 dan 1. Secara simbolik, hal ini dapat
kita nyatakan sebagai 0 ≤ P( X = x) ≤ 1 atau 0 ≤ P( x) ≤ 1 , untuk semua nilai x.
2. Jumlah dari semua probabilitas harus sama dengan 1. Secara simbolik, hal ini dapat kita
nyatakan sebagai ΣP ( x) = 1 , dimana penjumlahan dilakukan pada semua nilai x.
Kita dapat menggambarkan distribusi probabilitas pada suatu grafik histogram. Gambar 4.1
dan 4.2 memperlihatkan representasi grafis dari distribusi probabilitas untuk pelemparan dua
uang logam dan pelemparan dua buah dadu. Pada Gambar 4.1 dan 4.2, tinggi dari setiap
batang menunjukkan probabilitas untuk setiap nilai individual dari x.
0.60
0.50
0.50
0.40
0.20
0.10
0.00
0 1 2
0.18
0.16
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
2 3 4 5 6 7 8 9 10 11 12
Menarik juga untuk diperhatikan bahwa terdapat kemiripan antara distribusi probabilitas dan
distribusi frekwensi (tabel frekwensi dan grafiknya di Bab II). Kemiripan ini dapat terjadi
karena, seperti yang telah diuraikan sebelumnya di Bab I, kita dapat memandang probabilitas
dari dua sisi: (i) probabilitas adalah peluang bahwa suatu hasil akan terjadi, dan (ii)
probabilitas dapat juga dipandang sebagai banyaknya (frekwensi) kejadian dari sejumlah
eksperimen.
Soal-soal Latihan
a. Bila X merupakan selisih dari hasil pelemparan kedua dadu, tentukan distribusi
probabilitas untuk variabel acak X tersebut.
Ekspektasi (expectation) dari suatu variabel acak X adalah nilai rata-rata (mean) dari
variabel acak tersebut. Ekspektasi ini biasanya dinotasikan dengan E(X), dan didefinisikan
sebagai:
E ( X ) = ∑ xP( x) (4.1)
Untuk kasus pelemparan dua uang logam, dimana distribusi probabilitasnya diperlihatkan
pada Tabel 4.3, ekspektasi dari X adalah:
Oleh karenanya, jika pelemparan dua uang logam tersebut dilakukan sebanyak n kali (dimana
n adalah bilangan yang sangat besar) dan hasilnya (yaitu jumlah gambar yang muncul) kita
catat, maka nilai rata-rata dari hasil-hasil pelemparan tersebut akan bernilai 1.
Sedangkan, untuk kasus pelemparan dua buah dadu, dimana distribusi probabilitasnya
diperlihatkan pada Tabel 4.4, ekspektasi dari X adalah:
E( X ) = 2 × 1 + 3× 2 + 4× 3
+ 5× 4 + 6 × 5 +7 ×6
36 36
36 36 36 36
(4.3)
8 × 5 + 9 × 4 + 10 × 3 + 11 × 2 + 12 × 1 = 7
36 36 36 36 36
Dengan demikian, jika pelemparan dua buah dadu tersebut dilakukan sebanyak n kali
(dimana n adalah bilangan yang sangat besar) dan hasilnya (yaitu jumlah hasil kedua dadu)
dicatat, maka nilai rata-rata dari hasil-hasil pelemparan tersebut akan 7.
Varians (variance) untuk suatu variabel acak X merupakan ukuran penyebaran dari variabel
acak tersebut terhadap nilai ekspektasinya (nilai rata-ratanya). Dengan perkataan lain, varians
adalah ukuran dari seberapa besar rata-rata variasi dari suatu variabel acak terhadap nilai
ekspektasinya. Formula untuk varians adalah:
[
V ( X ) = E ( x − E ( X )) 2 ] (4.4)
atau:
[
V ( X ) = ∑ ( x − E ( X )) 2 P( x) ] (4.5)
Disamping formula seperti yang dinyatakan oleh (4.5), terdapat formula alternatif untuk
menghitung varians yaitu:
V ( X ) = ∑ x 2 P ( x) − E ( X ) 2 (4.6)
Misalkan kita ingin menghitung varians dari variabel acak untuk kasus pelemparan dua uang
logam yang distribusi probabilitasnya diperlihatkan pada Tabel 4.3. Dengan menggunakan
(4.5), kita peroleh varians:
V ( X ) = (0 − 1) 2 (1 / 4 ) + (1 − 1) 2 (1 / 2) + (2 − 1) 2 (1 / 4 ) = 1 / 2 (4.7)
[ ]
V ( X ) = 0 2 (1 / 4 ) + 12 (1 / 2) + 2 2 (1 / 4 ) − 1 = 1 / 2 (4.8)
Simpangan baku (standard deviation) dari suatu variabel acak merupakan estimasi untuk
jarak rata-rata dari nilai-nilai variabel acak terhadap nilai ekspektasinya. Simpangan baku
untuk variabel acak X didefinisikan sebagai akar dari varians dan dirumuskan melalui:
SD( X ) = V ( X ) (4.9)
Sebagai contoh, simpangan baku dari variabel acak untuk kasus pelemparan dua uang logam
pada Tabel 4.1 adalah:
SD ( X ) = 1 / 2 = 0,7071 (4.10)
Soal-soal Latihan
1. Hitung varians dan simpangan baku dari variabel acak untuk kasus pelemparan dua buah
dadu yang distribusi probabilitasnya diperlihatkan pada Tabel 4.4.
x 1 2 3 4 5 6 7
3. Tentukan ekspektasi, varians dan simpangan baku dari variabel acak X yang distribusi
probabilitas sebagai berikut:
x 0 1 2 3 4
4. Seorang dosen statistik membuat distribusi probabilitas dari nilai-nilai mahasiswa untuk
mata kuliah yang diasuhnya. Distribusi probabilitas tersebut diperlihatkan pada tabel
berikut:
Nilai F D C B A
x 0 1 2 3 4
Distribusi probabilitas untuk jenis tertentu dari variabel acak dapat dimodelkan melalui
formula matematik. Subbab ini membahas tentang distribusi probabilitas uniform yaitu
formula matematik untuk distribusi probabilitas dari variabel acak uniform. Sedangkan
distribusi probabilitas penting lainnya (yaitu: distribusi binomial dan distribusi normal) akan
dibahas pada subbab-subbab selanjutnya.
1
P( x) = (4.11)
n
Ilustrasi dari distribusi probabilitas uniform untuk suatu variabel acak diperlihatkan pada
Contoh 4.1 dan 4.2 berikut ini.
Contoh 4.1
Suatu kotak mengandung empat buah lampu dengan ukuran 40, 60, 75 dan 100 Watt. Jika X
adalah ukuran dari lampu, maka nilai-nilai yang mungkin untuk X adalah 40, 60, 75 dan 100.
Oleh karena setiap lampu dari kotak tersebut memiliki probabilitas yang sama (untuk dipilih
dari total empat lampu) yaitu ¼, maka X adalah variabel acak uniform dengan distribusi
probabilitas:
1
P ( x) = = 0,25
4
Contoh 4.2
Jika X adalah angka yang mungkin muncul pada kasus pelemparan sebuah dadu, maka nilai-
nilai yang mungkin untuk X adalah 1, 2, 3, 4, 5 dan 6. Setiap angka tersebut memiliki
probabilitas yang sama untuk muncul yaitu 1/6. Pada kasus ini X juga merupakan variabel
acak uniform dengan distribusi probabilitas:
1
P ( x) =
6
Histogram dari distribusi probabilitas uniform untuk kasus pada Contoh 4.2 diperlihatkan
pada Gambar 4.3.
0.18
0.16
0.14
0.12
0.10
0.08
0.06
0.04
0.02
0.00
1 2 3 4 5 6
Gambar 4.3. Histogram Dari Distribusi Probabilitas Untuk Kasus Pada Contoh 4.2.
4.4.2. Ekspektasi, Varians dan Simpangan Baku dari Variabel Acak Uniform
Rumusan umum untuk ekspektasi dari variabel acak diskrit adalah seperti yang dinyatakan
oleh (1). Ekspektasi dari variabel acak uniform dapat diperoleh dengan mensubstitusi (4.11)
pada (4.1):
1 1
E( X ) = ∑ x = ∑x (4.12)
n n
Sedangkan variansnya didapat dengan mensubstitusi (4.1) dan (4.12) pada (4.6):
2
1 ⎛1 ⎞
∑ x − ⎜⎝ n ∑ x ⎟⎠
2
V (X ) = (4.13)
n
Kemudian, dengan menggunakan (4.9), simpangan baku dari variabel acak uniform:
2
1 ⎛1 ⎞
∑ x − ⎜ ∑ x⎟
2
SD ( X ) = V ( X ) = (4.14)
n ⎝n ⎠
Contoh 4.3
Ekspektasi, varians dan simpangan baku untuk variabel acak uniform pada Contoh 4.2
berturut-turut adalah:
1
E( X ) = (1 + 2 + 3 + 4 + 5 + 6 ) = 3,5
6
(1 + 2 2 + 32 + 4 2 + 5 2 + 6 2 ) − (3,5 )2 = 2,92
1 2
V (X ) =
6
SD ( X ) = 2,92 = 1,71
Suatu variabel acak diskrit X dikatakan memiliki distribusi binomial jika memenuhi syarat-
syarat berikut:
• Ukuran sampel adalah tetap yaitu sebanyak n.
• Setiap item dalam sampel hanya ada dua jenis: sukses atau gagal.
• Untuk setiap item dalam sampel, probabilitas untuk sukses (misalkan p) adalah sama.
• Setiap item dalam sampel tidak saling tergantung, atau dengan perkataan lain, setiap item
adalah independen.
Secara umum, bila X adalah variabel random binomial, maka formulasi matematis untuk
distribusi probabilitasnya adalah:
n!
P( x) = p x (1 − p ) n − x (4.15)
(n − x)! x!
dimana: n adalah jumlah total item dalam sampel, x adalah jumlah item yang baik (sukses),
dan p adalah probabilitas untuk mendapatkan item yang baik (sukses).
Ilustrasi dari distribusi probabilitas binomial untuk suatu variabel acak diperlihatkan pada
Contoh 4.4 sampai 4.6 berikut ini.
Contoh 4.4
Setiap barang yang dihasilkan oleh suatu proses produksi (pabrik) mengalami proses testing
untuk mengetahui apakah barang tersebut baik atau buruk. Setelah pengetesan, barang
tersebut akan dklasifikasikan baik (G = Good) atau buruk (D = Defective). Bila dimisalkan
bahwa probabilitas-probabilitas untuk mendapatkan barang yang baik adalah sama yaitu 0,9:
a. Tentukan probabilitas-probabilitas untuk mendapatkan barang yang buruk.
b. Misalkan kita tertarik pada hasil-hasil yang mungkin terjadi bila kita mengambil sampel
yang mengandung tiga barang. Dapatkan distribusi probabilitas dari semua hasil ini.
c. Jelaskan bahwa kasus ini memenuhi syarat-syarat distribusi binomial.
Jawab:
c. Kasus tersebut memenuhi syarat-syarat distribusi binomial karena: (i) Ukuran sampel
adalah tetap yaitu n = 3, (ii) Hasil pengetesan hanya ada dua jenis yaitu G dan D, (ii)
Untuk setiap pengetesan, probabilitas untuk mendapatkan barang yang baik adalah sama
yaitu p = 0,9, dan (iii) Setiap pengetesan adalah independen.
Contoh 4.5
Untuk kasus pada Contoh 4.4. Jika X adalah jumlah barang yang baik dari sampel yang
mengandung tiga barang, tentukan:
a. Probabilitas untuk mendapatkan 3 barang yang baik.
b. Probabilitas untuk mendapatkan 2 barang yang baik.
c. Probabilitas untuk mendapatkan 1 barang yang baik.
d. Probabilitas untuk mendapatkan 0 barang yang baik.
e. Distribusi probabilitas dari X.
Jawab:
a. Berdasarkan Tabel 4.5, probabilitas untuk mendapatkan 3 barang yang baik (GGG) adalah
0,729.
b. Probabilitas untuk mendapatkan 2 barang yang baik (DGG, GDG, GGD) adalah
0,081+0,081+0,081=0,243. (Ket: Gunakan Pers, (3.7)).
c. Probabilitas untuk mendapatkan 1 barang yang baik (DDG, GDD, DGD) adalah
0,009+0,009+0,009=0,027. (Ket: Gunakan Pers, (3.7)).
d. Probabilitas untuk mendapatkan 0 barang yang baik (DDD) adalah 0,001.
e. Tabel 4.6 memperlihatkan distribusi probabilitas dari X.
x P( X = x)
0 0,001
1 0,027
2 0,243
3 0,729
ΣP(x) 1
Contoh 4.6
Jawab:
3!
P (3) = 0,9 30,10 = 0,729
0!3!
3!
P ( 2) = 0,9 20,11 = 0,243
1!2!
3!
P (1) = 0,910,12 = 0,027
2!1!
Probabilitas untuk mendapatkan 0 barang yang baik ( x = 0):
3!
P (0 ) = 0,900,13 = 0,001
3!0!
4.5.2. Ekspektasi, Varians dan Simpangan Baku dari Variabel Acak Binomial
Untuk variabel acak binomial, nilai ekspektasinya dapat diperoleh dengan mensubstitusi
(4.15) pada (4.1):
n!
E( X ) = ∑ x p x (1 − p ) n − x = np (4.16)
(n − x)! x!
Hasil diatas diperoleh setelah melakukan manipulasi aljabar dimana pembahasannya tidak
akan diuraikan disini.
Substitusi (4.15) ke (4.17) dan setelah melakukan manipulasi aljabar, kita dapatkan rumusan
varians untuk variabel acak binomial:
V ( X ) = np(1 − p ) (4.18)
SD( X ) = V ( X ) = np (1 − p ) (4.19)
Contoh 4.7
Hitung ekspektasi, varians dan simpangan baku dari variabel acak binomial X pada Contoh
4.5.
Jawab:
E ( X ) = np = (3)(0,9 ) = 2,7
V ( X ) = np (1 − p ) = (3)(0,9 )(1 − 0,9 ) = 0,27
SD ( X ) = V ( X ) = 0,27 = 0,5196
Soal-soal Latihan
2. Suatu perusahaan pengeboran berniat akan mengebor empat sumur minyak. Untuk setiap
sumur hanya akan terdapat dua kemungkinan yaitu: sumur tersebut mengandung minyak
(S=Sukses) atau sumur tersebut tidak mengandung minyak (G=Gagal). Probabilitas untuk
sukses dari setiap sumur adalah sama yaitu 0,4.
a. Dapatkan distribusi probabilitas untuk semua hasil yang mungkin dari keempat sumur
tersebut (Petunjuk: Ingat bahwa setiap sumur mungkin saja sukses atau gagal, sehingga
total ada 16 kombinasi hasil yang mungkin).
b. Jika X adalah jumlah sumur yang sukses dari total empat sumur, dapatkan distribusi
probabilitas dari X (Gunakan prinsip-prinsip perhitungan probabilitas di Bab III).
c. Dengan menggunakan (4.15), selesaikan pertanyaan pada point b.
d. Hitung ekspektasi, varians dan simpangan baku dari variabel acak binomial X tersebut.
CATATAN KULIAH – PROBABILITAS DAN STATISTIK Hal. 16
Oleh: DR. IR. Rudy Gianto, MT
BAB IV VARIABEL ACAK DAN DISTRIBUSI PROBABILITAS
3. Lima item barang dipilih secara acak dari hasil suatu proses produksi. Jika probabilitas
untuk mendapatkan setiap barang yang baik adalah 0,95, tentukan probabilitas untuk
mendapatkan tiga barang yang baik dari sampel yang mengandung lima barang tersebut.
4. Seorang pelajar menebak secara acak 10 buah pertanyaan pilihan ganda. Setiap pertanyaan
memiliki empat pilihan jawaban dengan hanya satu jawaban yang benar, dan setiap
pertanyaan tidak tergantung pada pertanyaan yang lain (independen).
a. Bila X adalah jumlah tebakan yang benar, dapatkan distribusi probabilitas untuk X.
b. Probabilitas untuk menebak dengan benar lebih dari delapan pertanyaan.
Persamaan untuk distribusi probabilitas normal seperti pada Gambar 4.4 diberikan oleh:
( x −μ) 2
−
1 2σ2
f ( x) = e (4.20)
σ 2π
dimana μ dan σ berturut-turut adalah nilai rata-rata dan simpangan baku dari distribusi
probabilitas. Nilai σ akan menentukan bentuk dari distribusi, sedangkan μ menentukan
lokasinya. Hal ini diillustrasikan pada Gambar 4.5, 4.6 dan 4.7. Gambar 4.5 memperlihatkan
dua distribusi normal dengan σ yang sama tapi μ yang berbeda; Gambar 4.6 memperlihatkan
tiga distribusi normal dengan μ yang sama tapi σ yang berbeda (σ1<σ2<σ3); dan Gambar 4.7
memperlihatkan dua distribusi normal dengan σ dan μ yang berbeda
Pada kasus variabel acak kontinu, probabilitas ditentukan dengan menghitung luas daerah
dibawah kurva antara dua titik dimana probabilitas itu akan dicari. Sebagai contoh, pada
Gambar 4.8, luas daerah yang diarsir (agak gelap) merupakan probabilitas dari suatu variabel
acak X untuk berada diantara x1 dan x2 (atau dalam notasi probabilitas dituliskan sebagai:
P(x1<X<x2)). Luas daerah ini diperoleh dengan mengintegrasi (4.20) pada batas-batas integral
dari x1 ke x2. Akan tetapi, oleh karena fungsi (4.20) cukup kompleks, integrasinya tidak dapat
diselesaikan secara matematis/analitis dan harus diselesaikan secara numerik dengan bantuan
komputer.
Untungnya, kita tidak perlu melakukan perhitungan integral tersebut, karena pada banyak
buku-buku statistika, perhitungan ini telah dilakukan dan hasilnya biasanya telah disusun
dalam bentuk tabel yang biasa disebut dengan tabel Z. Contoh dari tabel Z diperlihatkan pada
Lampiran B. Hasil-hasil pada tabel tersebut diperoleh berdasarkan satu distribusi normal
khusus yang biasa disebut sebagai distribusi normal standar (standard normal
distribution). Distribusi normal standar merupakan distribusi normal dengan μ = 0 dan σ = 1
(lihat Gambar 4.9). Uraian mengenai distribusi normal standar dapat dilihat pada Lampiran
A. Dengan demikian, untuk menghitung probabilitas, yang kita perlukan hanyalah satu
formula untuk mengubah distribusi normal (X) menjadi distribusi normal standar (Z), dan
selanjutnya kita gunakan tabel untuk mendapatkan probabilitas yang diinginkan. Berikut
adalah langkah-langkah dalam penentuan probabilitas untuk variabel acak kontinu:
Tabel Z seperti yang diperlihatkan pada Lampiran B akan memberikan luas-luas daerah
dibawah kurva untuk berbagai batas nilai z (P(0<Z<z)). Pada tabel tersebut, batas bawah dari
z selalu 0, sedangkan batas atasnya dapat bervariasi mulai dari 0 sampai 3,99. Untuk nilai-
nilai batas atas z diatas 3,99 (atau 3,99<z<∞), luas daerah dibawah kurva dapat diaproksimasi
sama dengan 0,5. Dengan demikian, probabilitas bahwa Z berada diantara 0 dan tak-
berhingga adalah 0,5 atau P (0 < Z < ∞) = 0,5 (lihat Gambar 4.10). Penting juga untuk dicatat
bahwa oleh karena kurva adalah simetris, maka:
• Luas total daerah dibawah kurva adalah 1 atau P(−∞ < Z < ∞) = 1 , lihat Gambar 4.11.
• P(-z<Z<0) adalah sama dengan P(0<Z<z), lihat Gambar 4.12.
Tabel Z pada Lampiran B terdiri dari baris-baris dan kolom-kolom yang nantinya akan kita
gunakan untuk mengidentifikasi nilai z yang mana yang akan kita cari. Setiap nilai z pada
tabel memiliki tiga angka (satu angka sebelum koma desimal dan dua angka setelah koma
desimal). Baris-baris dari tabel Z menyatakan angka sebelum koma desimal dan angka
pertama setelah koma desimal, sedangkan kolom-kolomnya menyatakan angka kedua setelah
koma desimal. Untuk mendapatkan probabilitas bahwa Z berada diantara 0 dan z (P(0<Z<z)),
dengan menggunakan tabel tersebut, kita dapat melakukan hal-hal berikut:
• Cari baris yang menyatakan angka pertama dari z dan angka pertama setelah koma
desimal.
• Cari kolom yang menyatakan angka kedua setelah koma desimal dari z.
• Perpotongan baris dan kolom tersebut merupakan P(0<Z<z) yang kita cari.
Sebagai contoh, misalkan kita ingin mencari P(0<Z<2,53). Pertama-tama kita cari baris untuk
2,5 dan kolom untuk 3. Kemudian kita cari perpotongan baris dan kolom tersebut (terlihat
bahwa perpotongan tersebut terjadi pada angka 0,4943). Dengan demikian, P(0<Z<2,53)
adalah 0,4943.
Contoh 4.8
Jawab:
Pada kasus ini, yang kita inginkan adalah probabilitas bahwa X berada diantara 40 dan 60
cm, atau dinotasikan sebagai: P(40<X<60). Nilai probabilitas ini adalah ekivalen dengan luas
daerah yang berwarna hitam pada distribusi normal Gambar 4.13. Luas ini yang akan kita cari
dengan menggunakan tabel Z.
Untuk dapat menggunakan tabel Z, kita harus terlebih dahulu mengubah satuan-satuan pada
distribusi normal (satuan-satuan X) menjadi satuan-satuan pada distribusi normal standar
(satuan-satuan Z). Untuk keperluan ini kita gunakan rumus-Z (formulanya dapat dilihat pada
Lampiran A). Untuk masalah pada Contoh 4.8, pengubahan nilai-nilai x (x1 = 40 dan x2 = 60)
menjadi nilai-nilai z (z1 dan z2) adalah sebagai berikut:
x1 − μ 40 − 40
z1 = = =0
σ 10
x2 − μ 60 − 40
z2 = = =2
σ 10
Dengan demikian, kita telah mengubah masalah penentuan probabilitas P(40<X<60) menjadi
masalah penentuan probabilitas P(0<Z<2). Nilai probabilitas P(0<Z<2) ini adalah ekivalen
dengan luas daerah yang berwarna hitam pada distribusi normal standar Gambar 4.14. Tabel
Z pada Lampiran B sekarang dapat digunakan untuk menentukan luas daerah tersebut. Untuk
menghitung P(40<X<60) = P(0<Z<2) melalui tabel Z, kita cari baris untuk 2,0 dan kolom
untuk 0. Perpotongan baris dan kolom tersebut terjadi pada angka 0,4772. Angka ini
merupakan probabilitas bahwa Z berada antara 0 dan 2, dan probabilitas bahwa kita akan
menangkap seekor ikan berukuran 40 sampai 60 cm.
Gambar 4.18, 4.19 dan 4.20 berturut-turut menjelaskan cara penentuan P(z1<Z<z2), P(Z>z)
dan P(Z<z). Berdasarkan Gambar 4.18, 4.19 dan 4.20 tersebut diperoleh:
Oleh karena suku-suku pada sisi kanan (4.21) – (4.23) dapat dicari dengan tabel Z, maka
P(z1<Z<z2), P(Z>z) dan P(Z<z) dapat dihitung.
Contoh 4.9
Jawab:
a. Pada kasus ini, yang kita inginkan adalah probabilitas bahwa X berada diantara 30 dan 50
cm, atau dinotasikan sebagai: P(30<X<50). Pengubahan nilai-nilai x (x1 = 30 dan x2 = 50)
menjadi nilai-nilai z (z1 dan z2) menghasilkan:
x1 − μ 30 − 40
z1 = = = −1
σ 10
x2 − μ 50 − 40
z2 = = =1
σ 10
Berdasarkan tabel Z pada Lampiran B, kita dapatkan P(0 < Z < 1) = 0,3413 , maka:
Dengan demikian, probabilitas bahwa kita akan menangkap seekor ikan berukuran 30
sampai 50 cm adalah 0,6826.
b. Pada kasus ini, yang kita inginkan adalah probabilitas bahwa X lebih besar dari 60 cm, atau
dinotasikan sebagai: P(X>60). Pengubahan nilai x = 60 menjadi nilai z menghasilkan:
x − μ 60 − 40
z= = =2
σ 10
Berdasarkan tabel Z pada Lampiran B, kita dapatkan P(0 < Z < 2) = 0,4772 , maka:
Dengan demikian, probabilitas bahwa kita akan menangkap seekor ikan dengan ukuran
yang lebih besar dari 60 cm adalah 0,0228.
c. Pada kasus ini, yang kita inginkan adalah probabilitas bahwa X lebih kecil dari 20 cm, atau
dinotasikan sebagai: P(X<20). Pengubahan nilai x = 20 menjadi nilai z menghasilkan:
x − μ 20 − 40
z= = = −2
σ 10
Berdasarkan tabel Z pada Lampiran B, kita dapatkan P(0 < Z < 2) = 0,4772 , maka:
Dengan demikian, probabilitas bahwa kita akan menangkap seekor ikan dengan ukuran
yang lebih kecil dari 20 cm adalah 0,0228.
Soal-Soal Latihan
1. Hitung:
a. P(0,81<Z<1,94)
b. P(Z>-1,28)
c. P(-1,20<Z<2,40)
d. P(1,23<Z<1,87)
e. P(-2,35<Z<-0,5)
f. P(-0,76<Z<0,76)
2. Hitung:
a. P(Z<-1,78)
b. P(Z<0,56)
c. P(Z>1,45)
d. P(Z>2,16)
e. P(-0,80<Z<1,53)
f. P(Z>-1,64)
g. P(-1,96<Z<1,96)
h. P(Z>1)
3. Pada suatu daerah, tinggi badan pria-pria dewasa terdistribusi secara normal dengan nilai
rata-rata 175 cm dan simpangan baku 7,5 cm.
a. Berapa persentase pria dewasa yang tingginya kurang dari 162,5 cm.
b. Berapa persentase pria dewasa yang tingginya lebih tinggi dari 180 cm.
c. Berapa persentase pria dewasa yang tingginya diantara 170 dan 182,5 cm.
d. Berapa persentase pria dewasa yang tingginya persis 170 cm.
4. Suatu kota baru saja memasang 2000 buah lampu penerangan jalan. Lampu-lampu
tersebut memiliki usia hidup dengan nilai rata-rata 1000 jam dan simpangan baku 200 jam.
Usia hidup lampu-lampu ini diasumsikan terdistribusi secara normal. Hitung:
a. Probabilitas bahwa sebuah lampu memiliki usia dibawah 700 jam.
b. Probabilitas bahwa sebuah lampu memiliki usia diatas 1300 jam.
c. Probabilitas bahwa sebuah lampu memiliki usia diantara 900 dan 1300 jam.
d. Probabilitas bahwa sebuah lampu memiliki usia persis 900 jam.
Salah satu hal penting yang dapat diamati dari distribusi normal standar seperti yang
diperlihatkan pada Gambar 4.9 adalah luas-luas daerah dalam 1, 2 dan 3 simpangan baku dari
rata-rata. Ketiga luas daerah ini, dalam notasi probabilitas, berturut-turut dituliskan sebagai
P(-1<Z<1), P(-2<Z<2), dan P(-3<Z<3). Sedangkan gambaran grafisnya berturut-turut
diperlihatkan pada Gambar 4.24, 4.25 dan 4.26.
Dapat dibuktikan bahwa luas-luas daerah dalam 1, 2 dan 3 simpangan baku dari rata-rata
tersebut berturut-turut adalah P (−1 < Z < 1) = 0,6826 , P (−2 < Z < 2) = 0,9544 dan
P (−3 < Z < 3) = 0,9974 , atau berturut-turut sama dengan 68,26%, 95,44% dan 99,74% dari
luas total yang besarnya satu.
Oleh karena μ = 0 dan σ = 1, distribusi normal standar seperti yang diperlihatkan pada
Gambar 4.9 dapat dinyatakan melalui cara lain seperti yang diperlihatkan pada Gambar 4.27.
Dengan membandingkan Gambar 4.24 – 4.26 dan 4.27, kita peroleh:
Aturan empiris memberikan beberapa pernyataan umum yang menghubungkan nilai rata-rata
dan simpangan baku dari suatu distribusi normal. Ia menghubungkan nilai rata-rata dengan
satu simpangan baku, dua simpangan baku dan tiga simpangan baku.
Aturan Satu-Sigma (One-Sigma Rule): Kurang lebih 68% dari data harus berada dalam satu
simpangan baku dari rata-rata. Gambar 4.24 mengilustrasikan hal ini.
Aturan Dua-Sigma (Two-Sigma Rule): Kurang lebih 95% dari data harus berada dalam dua
simpangan baku dari rata-rata. Gambar 4.25 mengilustrasikan hal ini.
Aturan Tiga-Sigma (Three-Sigma Rule): Kurang lebih 99,7% dari data harus berada dalam
tiga simpangan baku dari rata-rata. Gambar 4.26 mengilustrasikan hal ini.
Contoh 4.10
Untuk masalah perlombaan memancing ikan pada Contoh 4.8, tentukan interval dari ukuran
ikan yang mengandung kurang lebih 95% dari seluruh ikan yang ada di kolam.
Jawab:
Dengan menggunakan aturan dua-sigma, 95% dari data akan terkandung pada interval 40 ±
2×10 cm. Sehingga, batas bawah dari interval adalah 20 cm dan batas atasnya adalah 60 cm.
Dengan demikian, 95% dari ikan-ikan yang ada dikolam akan berukuran 20 sampai 60 cm.
V. STATISTIK INFERENSIAL
5.1. Pendahuluan
Seperti yang telah diuraikan sebelumnya, statistik membahas masalah pengumpulan dan
penyajian data serta analisisnya, yang pada gilirannya sering diakhiri dengan penarikan suatu
kesimpulan mengenai data tersebut. Statistik terdiri dari dua tahapan atau dapat
dikelompokkan kedalam dua cabang yaitu: statistik deskriptif dan statistik inferensial.
Statistik inferensial dapat dibagi kedalam dua kelompok besar yaitu: estimasi parameter dan
pengujian hipotesis. Estimasi parameter (parameter estimation) merupakan salah satu
aspek penting dalam statistik inferensial dimana pada proses ini dilakukan perkiraan atau
estimasi parameter-parameter populasi (misalnya: nilai rata-rata dan varians dari populasi)
berdasarkan statistik sampelnya (misalnya: nilai rata-rata dan varians dari sampel).
Pengujian hipotesis (hypotheses testing) adalah pengujian atau pengetesan suatu pernyataan
atau klaim yang sengaja dibuat mengenai parameter-parameter populasi berdasarkan
parameter-parameter sampelnya. Bab ini hanya akan membahas mengenai aspek estimasi
parameter dari statistik inferensial.
Populasi adalah keseluruhan anggota dari suatu grup yang ingin kita amati atau darinya kita
ingin memperoleh informasi dan menarik kesimpulan, sedangkan sampel merupakan bagian
dari populasi yang sengaja diambil untuk analisis. Oleh karena populasi biasanya berukuran
sangat besar, sering tidak mungkin atau tidak praktis untuk mengamati seluruh populasi
tersebut. Pada kasus-kasus seperti ini, informasi mengenai populasi dapat diperoleh dengan
cara menyelidiki sebagian kecil dari populasi tersebut yaitu sampel. Secara grafis hal ini
diperlihatkan pada Gambar 5.1.
1. Kita ingin menarik kesimpulan mengenai tinggi (atau berat) badan dari 12000 mahasiswa
(populasi) dengan menyelidiki hanya 100 mahasiswa (sampel) yang diambil dari populasi.
Catatan: Kesimpulan yang ingin ditarik mungkin saja berupa nilai rata-rata tinggi (atau
berat) badan dari populasi (12000 mahasiswa).
2. Dengan mengambil sampel sebanyak 1000 penduduk, misalkan kita ingin memperkirakan
persentase dari rakyat Indonesia yang setuju dengan keputusan Presiden mengenai
rencana kenaikkan harga BBM. Dalam hal ini populasi adalah seluruh rakyat Indonesia,
sedangkan sampelnya adalah 1000 penduduk.
Karena sampel merupakan bagian dari populasi, maka akan terdapat lebih dari satu
kombinasi sampel yang bisa diambil dari populasi tersebut. Misalkan kita ingin mengambil
sampel yang berukuran N dari suatu populasi yang berukuran Np, maka banyaknya kombinasi
sampel berukuran N yang dapat diambil dari populasi berukuran Np tersebut adalah:
⎛Np ⎞ N p!
⎜⎜ ⎟⎟ = (5.1)
⎝ N ⎠ ( N p − N )!× N !
Contoh 5.1
Jawab:
a. Pada kasus ini: Np = 5 dan N = 2, maka banyaknya kombinasi sampel yang mungkin
adalah:
⎛5⎞ 5!
⎜⎜ ⎟⎟ = = 10
⎝ 2 ⎠ (5 − 2)!×2!
Tabel 5.1 memperlihatkan kombinasi-kombinasi sampel yang mungkin untuk kasus ini.
1 S1 = {a, b}
2 S 2 = {a, c}
3 S3 = {a, d }
4 S4 = {a, e}
5 S5 = {b, c}
6 S6 = {b, d }
7 S7 = {b, e}
8 S8 = {c, d }
9 S9 = {c, e}
10 S10 = {d , e}
b. Pada kasus ini: Np = 5 dan N = 4, maka banyaknya kombinasi sampel yang mungkin
adalah:
⎛5⎞ 5!
⎜⎜ ⎟⎟ = =5
⎝ 4 ⎠ (5 − 4 )!×4!
Tabel 5.2 memperlihatkan kombinasi-kombinasi sampel yang mungkin untuk kasus ini.
1 S1 = {a, b, c, d }
2 S 2 = {a, b, c, e}
3 S3 = {a, b, d , e}
4 S4 = {a, c, d , e}
5 S5 = {b, c, d , e}
Seperti yang telah diuraikan sebelumnya, informasi mengenai suatu populasi dapat diperoleh
dengan cara menyelidiki sampel yang diambil dari populasi tersebut. Agar sampel dapat
memberikan informasi yang benar tentang populasi, ia haruslah representatif atau mewakili
keseluruhan populasi tersebut. Sampel yang representatif dapat diperoleh dengan cara
memilih sampel secara acak (random), yang artinya bahwa setiap sampel memiliki peluang
atau probabilitas yang sama untuk dipilih sebagai sampel. Pengambilan sampel secara acak
dimaksudkan agar sampel yang diambil tersebut tidak bias, artinya kita tidak mengambil
sampel dengan kecenderungan tertentu. Sebagai contoh, jika kita ingin mengambil
kesimpulan mengenai tinggi badan mahasiswa, kita tidak boleh memilih sampel yang semua
anggotanya terdiri dari mahasiswa-mahasiswa yang berbadan tinggi (atau pendek).
1. Undian (lotere).
2. Penggunaan tabel bilangan acak (lihat Lampiran C).
3. Pembangkit bilangan acak (random number generator), misalnya: komputer atau
kalkulator.
Untuk populasi yang berukuran besar, cara-cara diatas akan tidak praktis lagi, dan
pengambilan sampel secara acak dengan bantuan komputer mungkin diperlukan. Contoh 5.2
mengilustrasikan pengambilan sampel secara acak dengan menggunakan tabel bilangan acak
pada Lampiran C.
Contoh 5.2
Berikut adalah data nilai akhir untuk Mata Kuliah Probabilitas dan Statistik dari 80
mahasiswa suatu Universitas:
68,6 84,8 75,2 82,6 68,2 90,2 62,8 88,2 76,2 93,2
73,2 79,8 88,2 73,6 60,2 93,2 71,6 59,8 85,4 75,6
61,8 65,8 75,2 87,2 74,2 62,8 95,6 78,2 63,4 72,6
66,2 78,6 82,4 75,2 94,2 77,6 69,6 74,2 68,4 60,6
96,2 78,6 89,4 61,2 75,8 95,4 60,6 79,4 83,4 71,8
79,4 62,2 67,8 97,2 78,8 85,4 76,4 65,4 71,2 75,4
65,4 80,4 73,8 57,8 88,6 78,4 62,2 76,2 53,8 74,4
86,4 67,4 73,6 81,4 72,2 63,8 76,2 75,2 85,2 77,6
Dengan menggunakan tabel bilangan acak, dapatkan satu sampel yang berukuran 10 untuk
data diatas.
Jawab:
Pertama-tama kita nomori setiap anggota populasi dengan nomor-nomor 00, 01, 02, ….., 79.
Hasil penomoran ini diperlihatkan pada Tabel 5.3. Untuk memilih nomor acak, misalkan kita
mulai dari baris 15 dan kolom 6 pada tabel bilangan acak. Dari tabel tersebut kita dapatkan
nomor-nomor 13, 64, 75, 05, 69, 77, 35, 72, 74 dan 46. Maka sampel yang dipilih adalah
mahasiswa-mahasiswa dengan nilai ujian 62,2; 76,2; 60,6; 79,4; 71,2; 75,4; 94,2; 93,2; 72,6
dan 78,4.
No. Nilai No. Nilai No. Nilai No. Nilai No. Nilai
Sebelumnya telah diuraikan bahwa, oleh karena sampel merupakan bagian dari populasi,
maka akan terdapat lebih dari satu kombinasi sampel yang bisa diambil dari populasi
tersebut. Setiap sampel yang diambil tersebut akan memiliki parameter statistik (misalnya:
mean atau varians) yang berbeda-beda atau bervariasi. Untuk menyelidiki seberapa besar
parameter statistik tersebut bervariasi dari satu sampel ke sampel lainnya, kita biasanya
menggunakan distribusi sampling (sampling distribution) atau distribusi dari parameter-
parameter sampel. Sama seperti pada distribusi probabilitas, untuk suatu distribusi sampling,
kita juga bisa menghitung nilai rata-rata, varians dan simpangan baku dari distribusi sampling
tersebut.
Dengan demikian, distribusi sampling dari nilai rata-rata (sampling distribution of mean)
atau distribusi dari nilai rata-rata sampel merupakan distribusi/penyebaran nilai rata-rata dari
sampel-sampel yang diambil dari suatu populasi. Sedangkan distribusi sampling dari
varians (sampling distribution of variance) atau distribusi dari nilai varians sampel
merupakan distribusi/penyebaran nilai varians dari sampel-sampel yang diambil dari suatu
populasi.
Tabel 5.4 akan digunakan sebagai contoh untuk mengilustrasikan mengenai distribusi
sampling ini. Tabel 5.4 memperlihatkan hasil-hasil dari pengambilan 20 sampel (masing-
masing berukuran N = 15) yang diambil dari populasi dengan ukuran Np = 200. Populasi
tersebut memiliki nilai rata-rata μ = 69,637 dan simpangan baku σ = 10,411. Distribusi atau
penyebaran dari nilai rata-rata sampel dalam bentuk tabel frekwensi, atau distribusi frekwensi
dari nilai rata-rata sampel, diperlihatkan pada Tabel 5.5. Sedangkan distribusi atau
penyebaran dari nilai rata-rata sampel tersebut dalam bentuk histogram dan polygon
frekwensi diperlihatkan pada Gambar 5.2.
Berdasarkan Tabel 5.4 dan 5.5, ada beberapa hal yang dapat kita amati:
a. Nilai-nilai parameter sampel akan berbeda dari satu sampel ke sampel lainnya. Untuk
contoh pada Tabel 5.4, nilai rata-rata sampel bervariasi dari 64,65 sampai 75,80, dan
simpangan baku bervariasi dari 7,62 sampai 14,42.
b. Beberapa dari nilai rata-rata sampel lebih besar dari nilai rata-rata populasi (69,637), dan
beberapa dari nilai rata-rata sampel lebih kecil dari nilai rata-rata populasi.
c. Beberapa dari nilai simpangan baku sampel lebih besar dari nilai simpangan baku
populasi (10,411), dan beberapa dari nilai simpangan baku sampel lebih kecil dari nilai
simpangan baku populasi.
d. Nilai rata-rata dari sampel-sampel akan lebih banyak terdistribusi pada nilai-nilai yang
berada disekitar nilai rata-rata populasi (69,637). Hal yang sama juga akan terjadi pada
nilai varians dari sampel-sampel.
1 62,5 – 65,0 1
2 65,0 – 67,5 3
3 67,5 – 70,0 11
4 70,0 – 72,5 3
5 72,5 – 75,0 1
6 75,0 – 77,5 1
Jumlah 20
Gambar 5.2. Histogram Dan Poligon Frekwensi Dari Contoh Distribusi Sampling.
Penting juga untuk dicatat disini bahwa parameter-parameter sampel akan selalu bervariasi
dari satu sampel ke sampel lainnya. Variasi ini biasa disebut sebagai kesalahan sampling
(sampling error). Sampel-sampel yang berukuran lebih besar akan memiliki kesalahan
sampling yang lebih kecil, akan tetapi sampel-sampel yang berukuran lebih besar biasanya
dalam pengambilannya akan memakan biaya, waktu dan tenaga yang juga lebih besar. Dalam
praktek, kita biasanya hanya menggunakan satu sampel sebagai dasar untuk memperkirakan
parameter populasi. Untuk mengatasi adanya perbedaan antara satu sampel dengan sampel
yang lainnya, ahli-ahli statistik telah mengembangkan konsep estimasi interval. Konsep
estimasi interval ini akan dibahas pada Subbab 5.5 dan 5.6.
Nilai rata-rata (mean) merupakan besaran yang paling sering digunakan dalam statistik. Oleh
karenanya, subbab ini secara khusus akan membahas mengenai distribusi sampling dari mean
atau distribusi dari nilai rata-rata sampel. Seperti yang telah dibahas sebelumnya, distribusi
dari nilai rata-rata sampel merupakan distribusi atau penyebaran nilai rata-rata dari sampel-
sampel yang diambil dari suatu populasi. Contoh dari distribusi ini adalah seperti yang
diperlihatkan pada Tabel 5.4.
Seperti yang telah dibahas pada Bab II, nilai rata-rata adalah jumlah dari semua nilai data
dibagi dengan banyaknya data. Misalkan dari suatu populasi (berukuran Np) kita ambil semua
sampel (berukuran N) yang mungkin dari populasi tersebut. Banyaknya kombinasi sampel
yang mungkin ini, yang akan kita notasikan dengan n, dapat dihitung dengan menggunakan
(5.1). Kemudian, untuk setiap sampel yang mungkin tersebut kita hitung nilai rata-ratanya,
dan setiap nilai rata-rata dari sampel ini kita notasikan sebagai mi (i = 1,2,..., n) .
Bila hal-hal diatas kita lakukan, kita akan memiliki distribusi dari nilai rata-rata sampel M ,
dimana nilai-nilai yang mungkin untuk M adalah m1 , m2 ,K, mn . Dengan mengasumsikan
bahwa populasi yang sedang diselidiki tersebut memiliki nilai rata-rata μ dan varians σ2,
dapat dibuktikan bahwa untuk distribusi dari nilai rata-rata sampel akan berlaku hal-hal
berikut:
E (M ) = μM = μ (5.2)
σ 2 Np − N
V ( M ) = σ M2 = (5.3)
N Np −1
Oleh karena ukuran populasi biasanya jauh lebih besar dari ukuran sampel (Np>>N),
maka akan diperoleh:
Np − N
≈1 (5.4)
Np −1
Dengan menggunakan (5.4) pada (5.3), maka varians untuk distribusi sampling dari mean
menjadi:
σ2
V ( M ) = σ M2 = (5.5)
N
Sedangkan simpangan baku untuk distribusi sampling dari mean tersebut adalah:
σ
SD ( M ) = σ M = (5.6)
N
Contoh 5.3
Sebuah populasi terdiri dari lima bilangan yaitu: 2, 3, 6, 8, 11. Misalkan kita ambil sampel
berukuran dua dari populasi tersebut.
Jawab:
2 + 3 + 6 + 8 + 11
μ= =6
5
Varians dari populasi:
(2 − 6 ) 2 + (3 − 6 ) 2 + (6 − 6 ) 2 + (8 − 6 ) 2 + (11 − 6 ) 2 +
σ2 = = 10,8
5
b. Jumlah semua kombinasi sampel berukuran dua yang mungkin diambil dari populasi
tersebut adalah:
⎛5⎞ 5!
n = ⎜⎜ ⎟⎟ = = 10
⎝ 2 ⎠ (5 − 2)!×2!
Tabel 5.6 memperlihatkan semua kombinasi sampel berukuran dua yang mungkin diambil
dari populasi.
1 2 dan 3 6 3 dan 8
2 2 dan 6 7 3 dan 11
3 2 dan 8 8 6 dan 8
4 2 dan 11 9 6 dan 11
5 3 dan 6 10 8 dan 11
c. Distribusi sampling dari mean untuk populasi diperlihatkan pada Tabel 5.7.
2 2 dan 6 4 7 3 dan 11 7
3 2 dan 8 5 8 6 dan 8 7
d. Berdasarkan Tabel 5.7, nilai rata-rata untuk distribusi sampling dari mean adalah:
10,8 5 − 2
V ( M ) = σ2M = = 4,05
2 5−1
Pers. (5.2) dan (5.5) memperlihatkan bahwa nilai rata-rata untuk distribusi sampling dari
mean adalah nilai rata-rata populasi μ, sedangkan variansnya adalah 1/N dikali varians
populasi σ2. Hal ini menunjukkan bahwa distribusi M juga akan terpusat disekitar nilai rata-
rata populasi μ, akan tetapi penyebarannya akan semakin berkurang dengan membesarnya
ukuran sampel. Gambar 5.3 memperlihatkan plot dari distribusi sampling dari mean untuk
berbagai ukuran sampel.
Gambar 5.3 menunjukkan bahwa semakin besar ukuran sampel, variasi nilai rata-rata dari
satu sampel ke sampel lainnya akan semakin kecil. Hasil ini memperlihatkan bahwa, untuk
sampel yang berukuran cukup besar, nilai rata-rata dari satu sampel tidak akan jauh berbeda
dengan nilai rata-rata dari sampel yang lain. Hal inilah yang menjadi salah satu alasan bahwa,
dalam praktek, kita biasanya hanya menggunakan satu sampel sebagai dasar untuk
memperkirakan parameter populasi. Karena, bila ukuran sampel tersebut cukup besar,
sampel-sampel yang lain juga akan memiliki parameter yang tidak jauh berbeda.
Contoh 5.4
Sebuah populasi terdiri dari lima bilangan yaitu: 2, 3, 6, 8, 11. Misalkan kita ambil sampel
berukuran empat dari populasi tersebut.
a. Dapatkan semua kombinasi sampel yang mungkin diambil dari populasi tersebut.
CATATAN KULIAH – PROBABILITAS DAN STATISTIK Hal. 12
Oleh: DR. IR. Rudy Gianto, MT
BAB V STATISTIK INFERENSIAL
Jawab:
a. Jumlah semua kombinasi sampel berukuran empat yang mungkin diambil dari populasi
tersebut adalah:
⎛5⎞ 5!
n = ⎜⎜ ⎟⎟ = =5
⎝ 4 ⎠ (5 − 4)!×4!
Tabel 5.8 memperlihatkan semua kombinasi sampel berukuran dua yang mungkin diambil
dari populasi.
1 2, 3, 6 dan 8
2 2, 3, 6 dan 11
3 2, 3, 8 dan 11
4 2, 6, 8 dan 11
5 3, 6, 8 dan 11
b. Distribusi sampling dari mean untuk populasi diperlihatkan pada Tabel 5.9.
1 2, 3, 6 dan 8 4,75
2 2, 3, 6 dan 11 5,5
3 2, 3, 8 dan 11 6
4 2, 6, 8 dan 11 6,75
5 3, 6, 8 dan 11 7
c. Berdasarkan Tabel 5.9, nilai rata-rata untuk distribusi sampling dari mean adalah:
10,8 5 − 4
V ( M ) = σ2M = = 0,675
4 5 −1
e. Tabel 5.10 memperlihatkan perbandingan dari variasi nilai rata-rata sampel untuk
distribusi sampel pada Contoh 5.3 dan 5.4.
Tabel 5.10. Perbandingan Dari Variasi Nilai Rata-Rata Sampel Pada Contoh 5.3 dan 5.4.
Contoh 5.3 (N = 2) Contoh 5.4 (N = 4)
Tabel 5.10 memperlihatkan bahwa untuk sampel yang berukuran lebih besar, variasi dari
nilai rata-ratanya dari satu sampel ke sampel yang lain akan lebih kecil. Hasil ini juga
diverifikasi oleh nilai varians dari distribusi sampling dari nilai rata-rata, dimana nilainya
juga lebih kecil untuk sampel yang berukuran lebih besar.
Soal-Soal Latihan
1. Sebuah populasi terdiri dari lima bilangan yaitu: 2, 3, 6, 8, 11. Misalkan kita ambil sampel
berukuran tiga dari populasi tersebut.
2. Sebuah populasi terdiri dari empat bilangan yaitu: 3, 7, 11, 15. Misalkan kita ambil sampel
berukuran dua dari populasi tersebut.
Contoh untuk estimasi titik adalah seperti yang diperlihatkan pada Tabel 5.4. Pada tabel
tersebut kita memberikan estimasi-estimasi titik dari nilai rata-rata dan simpangan baku untuk
suatu populasi. Estimasi-estimasi titik dari nilai rata-rata dan simpangan baku tersebut dapat
diperoleh berdasarkan formula-formula yang telah diuraikan di Bab II yaitu:
1 N
μ≈ X = ∑ Xi (5.7)
N i =1
∑ (X i − X )
1 N 2
σ≈s= (5.8)
N − 1 i =1
Seperti yang telah diuraikan sebelumnya, estimasi interval merupakan perkiraan atau estimasi
dari parameter populasi melalui dua bilangan dimana parameter yang diestimasi mungkin
berada diantara kedua bilangan tersebut. Estimasi interval diperlukan karena dalam praktek,
kita biasanya hanya menggunakan satu sampel sebagai dasar untuk memperkirakan parameter
populasi. Adanya kesalahan sampling, yaitu kesalahan akibat perbedaan antara satu sampel
dengan sampel yang lainnya, akan dikompensasi dengan menggunakan estimasi interval ini.
Didalam teori estimasi interval, para ahli statistik telah mengembangkan suatu konsep yang
disebut sebagai interval kepercayaan (confidence interval). Pada konsep ini, parameter
populasi dinyatakan melalui suatu interval yang memiliki batas bawah dan batas atas dengan
tingkat kepercayaan atau kepastian tertentu bahwa parameter populasi tersebut akan berada
didalam batas-batas interval. Sebagai contoh, jika dikatakan bahwa nilai rata-rata dari suatu
populasi berada diantara 7,69 dan 10,31 dengan tingkat kepercayaan 95%, maka hal ini
berarti bahwa kita bisa yakin 95% bahwa nilai rata-rata populasi tersebut akan berada
diantara nilai-nilai 7,69 dan 10,31.
Berikut adalah penurunan formula untuk interval kepercayaan dari nilai rata-rata suatu
populasi. Misalkan μ M dan σ M berturut-turut adalah nilai rata-rata dan simpangan baku
untuk distribusi sampling dari nilai rata-rata M , maka, berdasarkan aturan empiris di Subbab
4.6.3, kita dapat mengharapkan bahwa nilai rata-rata sebenarnya dari sampel akan berada
pada interval μ M ± σ M , μ M ± 2σ M dan μ M ± 3σ M dengan tingkat kepercayaan berturut-
turut 68%, 95,44% dan 99,7%. Atau, secara umum, nilai rata-rata aktual sampel tersebut akan
berada pada interval:
μ M ± zc σ M (5.9)
dengan tingkat kepercayaan yang ditentukan oleh nilai zc. Tabel 5.11 memperlihatkan nilai-
nilai tingkat kepercayaan untuk berbagai nilai zc, dimana nilai-nilai zc ini ditentukan
berdasarkan tabel Z pada Lampiran B.
TK 99,7% 99% 98% 96% 95,44% 95% 90% 80% 68% 50%
Substitusi (5.2) dan (5.6) pada (5.9) dan dengan mengaproksimasi rata-rata populasi μ dengan
rata-rata sampel X , maka interval kepercayaan untuk rata-rata populasi akan diberikan oleh:
σ
X ± zc (5.10)
N
σ σ
X − zc < μ < X + zc (5.11)
N N
Contoh 5.5
Misalkan suatu populasi diketahui memiliki simpangan baku σ = 10,411. Asumsikan juga
bahwa sampel (dengan N = 15) yang diambil dari populasi tersebut memiliki nilai rata-rata
X = 66 ,12 . Untuk mengestimasi nilai rata-rata dari populasi tersebut, dapatkan interval
kepercayaan dengan tingkat kepercayaan 80% dan 95%.
Jawab:
Untuk tingkat kepercayaan 80%, estimasi interval dari nilai rata-rata populasi adalah:
10,411 10,411
66 ,12 − 1,28 < μ < 66 ,12 + 1,28
15 15
atau:
Untuk tingkat kepercayaan 95%, estimasi interval dari nilai rata-rata populasi adalah:
10,411 10,411
66 ,12 − 1,96 < μ < 66 ,12 + 1,96
15 15
atau:
Pada estimasi interval untuk nilai rata-rata populasi melalui (5.11), kita telah mengasumsikan
bahwa nilai simpangan baku populasi σ diketahui. Namun demikian, pada umumnya,
simpangan baku populasi ini tidak diketahui. Untuk sampel yang berukuran cukup besar,
simpangan baku populasi σ dapat diaproksimasi melalui simpangan baku sampel s. Atau,
dengan perkataan lain, untuk N yang cukup besar kita dapat menganggap bahwa: σ ≈ s .
Pertanyaan yang muncul adalah: seberapa besarkah ukuran sampel sehingga aproksimasi
tersebut ( σ ≈ s ) cukup akurat? Mengenai hal ini, banyak ahli statistik berpendapat bahwa
ukuran sampel sebanyak 30 atau lebih ( N ≥ 30 ) dapat dianggap cukup besar, dan
aproksimasi σ ≈ s adalah cukup akurat.
Pertanyaan selanjutnya adalah: bagaimanakah jika ukuran sampel lebih kecil dari 30
( N < 30 )? Untuk sampel yang berukuran kecil seperti ini, aproksimasi σ melalui s tidak akan
cukup akurat, dan (5.11) tidak dapat lagi digunakan untuk estimasi interval dari nilai rata-rata
populasi. Agar dapat melakukan estimasi interval dari nilai rata-rata populasi pada kasus
sampel yang berukuran kecil, kita harus memodifikasi (5.11) dan menggunakan distribusi t
pada proses estimasinya. Hal ini akan dibahas lebih lanjut pada subbab berikutnya.
Distribusi t adalah distribusi sampling yang mengijinkan kita untuk menentukan estimasi
interval dari nilai rata-rata populasi pada kasus-kasus sampel yang berukuran kecil ( N < 30 ).
Rumusan estimasi interval dari nilai rata-rata populasi melalui distribusi t adalah mirip
dengan (5.11). Kita hanya mengganti simpangan baku populasi σ dengan simpangan baku
sampel s, dan menukar zc dengan t1-f;N-1. Sehingga, dengan menggunakan distribusi t, estimasi
interval untuk rata-rata populasi adalah:
s s
X − t1− f ; N −1 < μ < X + t1− f ; N −1 (5.12)
N N
dengan tingkat kepercayaan sebesar 100(1-2f) persen. Pada (5.12), nilai t yang merupakan
fungsi dari 1-f dan N-1 dapat ditentukan melalui tabel pada Lampiran D. Contoh 5.6
mengilustrasikan cara penentuan estimasi interval dari rata-rata populasi dengan
menggunakan distribusi t.
Contoh 5.6
Misalkan sampel (dengan N = 15) yang diambil dari suatu populasi memiliki nilai rata-rata
X = 66 ,12 dan simpangan baku s = 9,21 . Dapatkan estimasi interval untuk nilai rata-rata
dari populasi tersebut dengan tingkat kepercayaan:
a) 80%
b) 95%.
Jawab:
1 − 2 f = 0,8 ⇒ f = 0,1
Maka, estimasi interval untuk nilai rata-rata dari populasi dengan tingkat kepercayaan
80%:
9,21 9,21
66 ,12 − 1,345 < μ < 66 ,12 + 1,345
15 15
atau:
1 − 2 f = 0,95 ⇒ f = 0,025
Maka, estimasi interval untuk nilai rata-rata dari populasi dengan tingkat kepercayaan
95%:
9,21 9,21
66 ,12 − 2,145 < μ < 66 ,12 + 2,145
15 15
atau:
Dengan cara yang hampir sama seperti pada estimasi interval dari nilai rata-rata populasi
dengan menggunakan distribusi t, kita juga bisa mendapatkan estimasi interval untuk varians
dari suatu populasi. Pada perhitungan estimasi interval dari varians populasi ini, distribusi
yang digunakan adalah distribusi chi-kuadrat seperti yang diperlihatkan pada Lampiran E.
Dengan menggunakan distribusi chi-kuadrat, estimasi interval dari varians populasi akan
berada diantara nilai-nilai:
s 2 ( N − 1) s 2 ( N − 1)
< σ 2
< (5.13)
χ12− f ; N −1 χ 2f ; N −1
dengan tingkat kepercayaan sebesar 100(1-2f) persen. Pada (5.13), nilai χ2 dapat ditentukan
melalui tabel distribusi pada Lampiran E. Contoh 5.7 mengilustrasikan cara penentuan
estimasi interval dari varians populasi dengan menggunakan distribusi chi-kuadrat.
Contoh 5.7
Misalkan sampel (dengan N = 15) yang diambil dari suatu populasi memiliki simpangan
baku s = 9,21 . Dapatkan estimasi interval untuk varians dari populasi tersebut dengan tingkat
kepercayaan 80% dan 95%. Dapatkan juga estimasi interval untuk simpangan baku dari
populasi tersebut.
Jawab:
1 − 2 f = 0,8 ⇒ f = 0,1
dan:
atau:
Sedangkan estimasi interval untuk simpangan baku dapat diperoleh dengan mengambil
akar dari hasil diatas:
1 − 2 f = 0,95 ⇒ f = 0,025
dan:
atau:
Sedangkan estimasi interval untuk simpangan baku dapat diperoleh dengan mengambil
akar dari hasil diatas:
Soal-Soal Latihan
1. Sampel yang berukuran N = 9 diambil dari suatu populasi. Sampel tersebut memiliki nilai
rata-rata X = 9 dan simpangan baku s = 3,082 . Untuk tingkat kepercayaan 95%,
dapatkan:
a) Estimasi interval untuk nilai rata-rata dari populasi.
b) Estimasi interval untuk varians dari populasi.
c) Estimasi interval untuk simpangan baku dari populasi
2. Sampel yang berukuran N = 15 diambil dari suatu populasi. Sampel tersebut memiliki
nilai rata-rata X = 68,67 dan simpangan baku s = 10,78 . Untuk tingkat kepercayaan
90%, dapatkan:
a) Estimasi interval untuk nilai rata-rata dari populasi.
b) Estimasi interval untuk varians dari populasi.
c) Estimasi interval untuk simpangan baku dari populasi
Seperti yang telah diuraikan sebelumnya di Bab IV, pada kasus variabel acak kontinu,
probabilitas ditentukan dengan menghitung luas daerah dibawah kurva antara dua titik
dimana probabilitas itu akan dicari. Dengan demikian, probabilitas tersebut diperoleh dengan
mengintegrasi fungsi yang dirumuskan oleh (4.20). Oleh karenanya, pada distribusi normal,
probabilitas bahwa suatu variabel random X akan berada diantara x1 dan x2 diberikan oleh:
x = x2 ( x−μ )2
1 −
P ( x1 < X < x2 ) = ∫ σ 2π
e 2σ 2 dx (A.1)
x = x1
Representasi grafis dari (A.1) diperlihatkan pada Gambar 4.8. Bentuk yang lebih sederhana
dari (A.1) dapat diperoleh dengan menggunakan transformasi variabel sebagai berikut:
x−μ
z= (A.2)
σ
dz 1
= ⇒ dx = σdz (A.3)
dx σ
x1 − μ
x = x1 ⇒ z = z1 = (A.4)
σ
x2 − μ
x = x2 ⇒ z = z2 = (A.5)
σ
z2 1
1 − z2
P ( z1 < Z < z2 ) = ∫ e 2 σdz (A.6)
z
σ 2π 1
atau:
z2 1
1 − 2 z2
P ( z1 < Z < z2 ) = ∫ 2π
e dz (A.7)
z1
Oleh karena setiap distribusi normal memiliki nilai rata-rata (μ) dan simpangan baku (σ)
yang berbeda-beda, maka berdasarkan (A.7) terlihat bahwa kita akan memiliki sejumlah tak-
hingga nilai-nilai P(z1<Z<z2). Hal ini bisa terjadi karena, berdasarkan (A.4) dan (A.5), nilai z1
dan z2 tergantung pada μ dan σ. Disamping itu juga akan sangat tidak praktis untuk membuat
tabel yang berisi hasil perhitungan (A.7) untuk setiap nilai μ dan σ. Oleh karenanya, untuk
menyederhanakan situasi ini, kita biasanya menggunakan distribusi normal spesial yang biasa
disebut dengan distribusi normal standar.
Distribusi normal standar merupakan distribusi normal dengan nilai rata-rata 0 dan
simpangan baku 1. Setiap variabel acak normal dapat dikonversi menjadi variabel acak
standar dengan menghitung nilai-z yang bersesuaian. Nilai-z ini dihitung dengan
menggunakan (A.2). Pada (A.2), x adalah nilai dari variabel acak normal X yang memiliki
rata-rata μ dan simpangan baku σ.
Kita dapat membuat tabel untuk variabel acak normal standar untuk membantu dalam
menghitung luas daerah (probabilitas) dibawah kurva normal standar. Biasanya, tabel normal
standar memberikan luas daerah antara 0 dan suatu nilai z tertentu. Tabel ini yang biasa juga
disebut dengan tabel Z diperlihatkan pada Lampiran B. Nilai-nilai pada tabel tersebut
diperoleh dengan menyelesaikan:
z 1
1 − 2 z2
P (0 < Z < z ) = ∫ e dz (A.8)
0
2π
dimana nilai z bervariasi antara 0 sampai 3,99. Untuk z diatas 3,99 nilai probabilitas dapat
dianggap 0,5.
LAMPIRAN B: TABEL Z
Langkah-langkah pemilihan sampel dengan menggunakan tabel bilangan acak adalah sebagai
berikut:
1. Nomori setiap anggota dari populasi. Misalkan populasinya berukuran 100, maka nomor-
nomor dari anggota populasi adalah 00, 01, 02, ….., 99. Jika populasinya berukuran 1000,
maka nomor-nomor dari anggota populasi adalah 000, 001, 002, ….., 999.
2. Untuk memilih nomor acak, kita dapat memulai dari baris dan kolom mana saja pada
tabel bilangan acak. Mungkin ada baiknya kita menutup mata dan menunjuk baris dan
kolom tertentu untuk memulai pemilihan nomor secara acak.
3. Setiap nomor yang dipilih dari tabel bersesuaian dengan nomor dari anggota populasi, dan
anggota populasi ini kita ambil sebagai anggota sampel.
4. Apabila nomor yang dipilih dari tabel tersebut berulang atau nomor yang dipilih tersebut
tidak ada nomor populasinya, abaikan nomor tersebut. Proses ini terus dilakukan sampai
kita mendapatkan sampel dengan ukuran yang diinginkan.
LAMPIRAN D: DISTRIBUSI t