Distribusi Probabilitas
Dalam kehidupan sehari-hari kerap kali ditemui macam model peluang. Faktor
ketidakpastian banyak memiliki model peluang yang menggambarkan suatu akibat
yang mungkin terjadi bila kondisi tertentu terjadi. Distribusi probabilitas merupakan
suatu model peluang yang memungkinkan untuk mempelajari hasil eksperimen
random yang nyata dan menduga hasil yang akan terjadi. Dengan pengertian lain
peristiwa nyata tersebut menyerupaiperistiwa dalam model dan kondisi dari model
distribusi dapat dipenuhi sebagai kondisi eksperimen.
Distribusi peluang tersebut merupakan distribusi populasi karena berhubungan
dengansemua nilai yang mungkin terjadi dan populasinya merupakan variable
random. Distribusiterbagi menjadi dua berdasarkan jenis variablenya, yakni distribusi
peluang diskrit dandistribusi peluang kontinyu. Distribusi probabilitas adalah sebaran
data dari nilai–nilai peluang yang terjadi pada variable random. Suatu variable yang
nilainya ditentukan oleh terjadinya hasilsuatu percobaan disebut sebagai variable
random. Dalam sampel random, populasi mempunyai kesempatan yang sama untuk
dijadikan sampel. Variable random terdiri dari distribusi diskrit dan distribusi
kontinyu.
Distribusi probabilitas merupakan suatu daftar yang disusun berdasarkan
peluang dari peristiwa yang terjadi melalui perhitungan-perhitungan. Distribusi
probabilitas memiliki beberapa karakterisik, diantaranya yaitu: 1) Probabilitas dari
sebuah hasil berkisar antara 0 sampai dengan 1; 2) Hasil-hasilnya ialah kejadian
yang tidak terikat satu sama lain; 3) Daftar hasilnya lengkap. Jadi jumlah probabilitas
dari berbagai kejadian ialah 1.
Distribusi probabilitas adalah konsep fundamental dalam statistik. Konsep ini
digunakan baik pada tingkat teoretis maupun praktis. Beberapa penggunaan praktis
dari distribusi probabilitas adalah:
1. Untuk menghitung interval kepercayaan pada suatu parameter dan untuk
menghitung daerah kritis pada suatu uji hipotesis.
2. Untuk data univariat, distribusi probabilitas seringkali berguna untuk menentukan
model distribusi yang wajar untuk data tersebut.
3. Interval statistik dan uji hipotesis sering kali didasarkan pada asumsi distribusi
tertentu. Sebelum menghitung interval atau pengujian berdasarkan asumsi
Modul 5 – Distribusi Frekuensi 3
DISTRIBUSI BINOMIAL
n 30
np dan n(1 – p) 5
Contoh:
Anggota suatu dewan juri berisikan 55% wanita. Berapa peluang terpilihnya 50
anggota juri yang dipilih secara acak akan berisikan anggota wanita sebanyak 30
orang atau lebih. Pemilihan ini jelas merupakan proses binomial dengan n = 50, p =
0,55 dan x 30. Tabel binomial tidak mempunyai nilai untuk n = 50. Pendekatan
Poisson juga tidak dapat dilakukan karena np = 27,5.Demikian pula tehnik
menggunakan 1 – p untuk p tidak dapat dilakukan juga karena n(1 – p) = 23,5. Akan
tetapi kriteria untuk pendekatan normal sudah dipenuhi dimana parameter binomial
untuk mendekati distribusi normal adalah:
B np 27,5
B np(1 p) 3,52
Sebelum menghitung peluang distribusi normal, terlebih dahulu perlu dihitung suatu
koreksi yang memperkenankan kita melakukan pendekatan dari distribusi diskrit ke
distribusi kontinu. Dalam distribusi kontinu, nilai 29 didefinisikan mengambil nilai
antara “28,5 sampai 29,5”, nilai 30 di antara nilai 29,5 sampai 30,5 dan seterusnya.
Dengan demikian, nilai-nilai diskrit yang sama atau lebih besar dari 30. Akhirnya
persoalan di atas dapat diselesaikan sebagaimana persoalan distribusi normal biasa
yaitu:
29,5 27,5
z 0,57
3,52
Artinya peluang (pendekatan) terpilihnya anggota juri wanita lebih dari 30 orang
adalah 0,2843. (Jika dihitung dengan distribusi binomial diperoleh 0,2862).
z = 0,57
0,2157
0,2843
DISTRIBUSI POISSON
Apabila rata-rata distribusi Poisson lebih dari 10, maka mustahil untuk
menggunakan tabel peluang Poisson (meskipun sebenarnya dapat dilakukan
dengan komputer). Olehkarenanya pendekatan normal kepada binomial dapat
diperluas kepada distribusi Poisson (dalam hal ini l > 10).
Contoh:
Rata-rata jumlah kendaraan yang mengunjungi bengkel pada jam 16.00 – 17.00
di akhir pekan adalah 16. Berapa peluang bahwa kurang dari 20 kendaraan akan
mengunjungi bengkel pada jam yang sama di hari Selasa mendatang.
Rata-rata distribusi Poisson l lebih dari 10, sehingga pendekatan normal dapat
dilakukan. Parameter Poisson yang ekivalen dengan distribusi normal adalah:
P 16
P 4
Koreksi dari distribusi diskrit ke kontinu perlu dilakukan seperti yang dicontohkan
sebelumnya. Jadi dalam hal ini peluang “kurang dari 20” dapat kita didefinsikan
sebagai “kurang atau sama dengan 19,5”. Luas area di bawah kurva normal lihat
Gambar 7.4) dapat dihitung dengan :
19,5 16
z 0,88
4
Dengan menggunakan tabel diperoleh luas areanya adalah 0,3106. Karena nilai z
positif, maka luas area yang dicari adalah mulai dari z = 0,88 ke arah kiri atau:
P ( X 19,5) 0,5 0,3106 0,8106
Jadi peluang (pendekatan) kendaraan yang mengunjungi bengkel di hari Selasa
kurang dari 20 buah adalah 0,8106 (perhitungan secara eksak dengan
menggunakan distribusi Poisson adalah 0,8122).
Modul 5 – Distribusi Frekuensi 7
z = 0,88
0,3106
0,5000
DISTRIBUSI NORMAL
8.1 Pendahuluan
Ada dua alasan mengapa distribusi normal sering digunakan dalam analisa
statistik, yaitu :
1. Distribusi normal memiliki kemampuan yang dapat diterapkan pada banyak
situasi, terutama untuk membuat kesimpulan dari sampel yang digunakan.
2. Distribusi normal sangat baik digunakan dalam analisis tentang fenomena yang
menggunakan data kontinu, seperti ukuran berat, tinggi rendahnya skor IQ,
panjang, jumlah curah hujan, banyaknya botol dalam satu kerat dan lain
sebagainya.
Gambar 8.1
Modul 5 – Distribusi Frekuensi 9
Gambar 8.1 menunjukkan distribusi data miring ke kiri, dimana nilai rata-rata
hitung lebih kecil dari median dan median lebih kecil dari modus. Kurva tidak
simetris sebab puncaknya ada di bagian kanan, tetapi ada sedikit data yang
menyebar ke kiri.
Gambar 8.2
Gambar 8.2, dimana nilai rata-rata sama atau mendekati median dan modus.
Kurvanya simetris dengan puncak distribusi ada dibagian tengah. Distribusi ini
disebut dengan distribusi normal.
Gambar 8.3
Gambar 8.3 menunjukkan keadaan terbalik dari gambar 8.1, yaitu distribusi data
miring ke kanan, dimana nilai modus lebih kecil dari median dan median lebih
kecil dari nilai rata-rata hitung. Kurva juga tidak simetris sebab puncaknya ada
dibagian kiri, sementara ada sedikit data yang menyebar ke kanan.
Modul 5 – Distribusi Frekuensi 10
Distribusi normal disebut juga distribusi Gauss, lihat kembali kurva distribusi
normal berikut :
Rata-rata populasi membagi dua data sama banyaknya sehingga luas daerah di
sebelah kiri rata-rata adalah 0.5 dan di sebelah kanan rata-rata juga 0.5.
karakteristik kurva normal yang dihubungkan dengan nilai rata-rata dan nilai standar
deviasi data adalah sebagai berikut :
Modul 5 – Distribusi Frekuensi 11
1. Sekitar 68% nilai data observasi yang terdistribusi secara normal berada di dalam
interval µ ± 1 standar deviasi
2. Sekitar 95% nilai data observasi yang terdistribusi secara normal berada di dalam
interval µ ± 2 standar deviasi
Rumus 8.1
Keterangan :
µ = rata-rata populasi
δ = simpangan baku populasi
π = konstanta yang nilainya mendekati 3.14159
e = konstanta yang nilainya mendekati 2,7182
x = setiap nilai variabel acak kontinu yang besarnya -∞ sampai dengan +∞
Distribusi normal f(x) didefinisikan pada internal terbuka -∞ < x < +∞. Distribusi
normal dengan parameter µ dan δ2 biasanya ditulis N (µ,δ2). Dengan memperhatikan
persamaan umum dan grafik distribusi normal f(x), tampak bahwa bentuk kurva
normal ditentukan oleh dua parameter, yaitu rata-rata (µ) dan simpangan baku (δ).
Bila nilai δ mengecil, bentuk kurva akan lebih rapat dan semakin runcing, dan
sebagian besar nilai x akan berkumpul atau mendekati nilai rata-rata µ. Sebaliknya,
jika nilai δ semakin besar, bentuk kurva akan lebih renggang dan tumpul, dimana
sebagian besar nilai x akan menjauhi nilai rata-rata µ. Perhatikan gambar 8.5 yang
menunjukkan uraian tiga distribusi data yang mempunyai simpangan baku serta
rata-rata.
Modul 5 – Distribusi Frekuensi 12
δ1 < δ2 < δ3
µ1 = µ2 = µ3
f(x)
x
a µ b
Gambar 8.6 Luas daerah di bawah kurva
Modul 5 – Distribusi Frekuensi 13
Pada gambar 8.6 probabilitas P(a<x<b) ditunjukkan oleh luas daerah yang diarsir,
yang dibatasi oleh kurva f(x), sumbu x, garis tegak x=a dan x=b. Oleh karena f(x)
merupakan fungsi kontinu, probabilitas P(a<x<b) dihitung dengan menggunakan
integral dari fungsi f(x) yang dibatasi oleh x=a dan x=b, yaitu :
Rumus 8.2
P(a<x<b) = ∫ f(x) dx = ∫ 1 e -1/2 (x - µ)2 dx
δ
δ√2π
Rumus integral tersebut sangat berguna untuk menghitung daerah di bawah kurva
distribusi normal standar. Akan tetapi, secara matematis bentuk integral dari fungsi
f(x) tersebut sulit dipecahkan secara langsung dengan teknik integral. Oleh karena
itu, penyelesaiannya dilakukan dengan memakai transformasi nilai-nilai X menjadi
nilai-nilai baku Z, yaitu :
Rumus 8.3
Z=x-µ
δ
Rumus 8.4
f(z) = 1 e – ½ Z2
√2π
Selanjutnya probabilitas P(z1 < Z < z2) dihitung dengan rumus berikut :
Rumus 8.5
P(z1 < Z < z2) = ∫ f(z) dz = ∫ 1 e – ½ Z2 dz
√2π
Modul 5 – Distribusi Frekuensi 14
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0763
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
Gunakan transformasi Z :
X 3,0 2,5
z 0,625
0,8
Yang akan kita cari dari persoalan di atas adalah peluang ayam potong yang
beratnya kurang dari 3,0 kg (daerah yang di arsir dalam gambar berikut). Berarti
yang kita cari adalah luas area mulai dari bagian sebelah kiri kurva (0,5) hingga z =
0,63 (dibulatkan hingga dua desimal untuk mengakomodasikan tabel z).
z = 0,63
0,5 0,2357
3,0
Luas area mulai dari titik 0 hingga nilai z = 0,63 adalah 0,2357. Dengan demikian,
peluang berat ayam yang kurang dari 3,0 kg adalah 0,5 + 0,2357 = 0.7357 atau
secara notasi :
Artinya peluang terambilnya ayam potong dengan berat kurang dari 3,0 kg adalah
73,57%.
3,5 2,5
z 1,25
0,8
Modul 5 – Distribusi Frekuensi 16
Luas area yang akan dicari adalah daerah yang diarsir hitam dalam gambar berikut.
Dari tabel kita dapatkan bahwa luas area untuk z = 1,25 adalah 0,3944. Jadi luas
area yang di arsir hitam adalah 0,5 – 0,3944 = 0,1056 atau secara notasi:
z = 1,25
0,5 0,3944
3,5
c. Peluang berat ayam antara 2,0 hingga 2,7 kg atau P ( 2,0 X 2,7)
0,2357 0,0987
d. Peluang berat ayam antara 2,7 hingga 3,0 atau P ( 2,7 X 3,0)
Peluang yang dicari adalah luas yang di arsir dari gambar di bawah ini. Perhitungan
sama dengan soal c) yaitu mencari dua nilai z.
2,7 2,5
z1 0,25 ; luas area dari 0 sampai z1 = 0,0987
0,8
3,0 2,5
z2 0,63 ; luas area dari 0 sampai z2 = 0,2357
0,8
z1=0,25
z2 = 0,63
Contoh 2:
Tentukan probabilitas dari nilai Z berikut (gunakan tabel distribusi normal standar)
1) P(0 < Z ≤ 1.54) = 0.4382
2) P(- 2.53 ≤ Z < 0)
Karena fungsi distribusi normal standar simetri terhadap Z = 0, maka probabilitas
P(- 2.53 ≤ Z < 0) = P(0 < Z < 2.53) = 0.4943
Perhatikan bahwa grafik F(z) tidak memotong sumbu Z dan juga tidak
memotong garis F9z) = 1. Oleh karena itu, sumbu Z dan garis F9z) merupakan garis
batas dari grafik F(z). Dengan memakai fungsi distribusi kumulatif F(z), probabilitas
P(z1 < Z < z2) dihitung dengan menggunakan rumus berikut :
Rumus 8.7
P(z1 < Z < z2) = P(Z < z2) – P(Z < z1) = F(z2) – F(z1)
LATIHAN
1. Pengukuran tinggi yang dilakukan oleh lembaga pendidikan tentara terhadap
sejumlah besar calon prajurit ternyata berdistribusi normal. Anggaplah rata-rata
tinggi yang diperoleh adalah 168 cm dengan simpangan baku 4 cm. Berapakah
peluang seseorang yang diambil secara acak tingginya:
a. Kurang dari 165 cm
b. Lebih dari 170 cm
2. Jika rata-rata daya tahan lampu pijar adalah 3 tahun dengan simpangan baku
satu tahun. Gunakanlah metode kurva normal untuk menghitung peluang satu
bola lampu yang dipilih secara acak memiliki daya tahan 4 tahun atau lebih.
4. Diketahui peluang balita menderita gizi buruk di Depok 2% (0.02). Bila diambil
sampel 150 balita. Hitung peluang:
a. Ada 3 balita menderita gizi buruk
b. Ada < 6 balita menderita gizi buruk
c. Ada > 4 balita menderita gizi buruk
d. Paling banyak 5 balita menderita gizi buruk